★key, value , items() , sorted(key =), loc로 행추가!★확률분포★기초통계학-[Chapter05

★key, value , items() , sorted(key =), loc로 행추가!★확률분포★기초통계학-[Chapter05 - 이산확률분포-01]

2022. 12. 14. 11:41

728x90

1. 확률 분포

==> 확률을 구하기 위한 어떤 실험이 시행되었을 때, 모든 실험 결과의 구성이 아닌 수치적인 양에 주목

==> 확률 실험에서 나타날 수 있는 개개의 결과에 관련된 수

EX)

1. 몇 번째 주사위를 던졌을때 특정 숫자의 눈이 나올때까지 던진 횟수

2. 동전 3번 던져서 앞면이 나온 횟수

==> X 를 앞면이 나온 횟수라고 지정

HHH -> X =3

THH HTH HHT -> X =2

HTT THT TTH -> X= 1

TTT -> X= 0

==> 상태공간(State Space) : X {0 , 1 , 2 ,3} ==> X가 취할 수 있는 모든 수들의 집합

==> X의 상태공간의 원소는 4개

==> X가 취할 수 있는 값을 셈 할 수 있다 ==> 이 확률 변수를 이산확률 변수

2. 이산확률 변수(Discrete Random Variable)

==> 상태공간이 유한개의 수로 구성되거나 무수히 많더라도 셈을 할 수 있는 개수의 확률변수

EX) 이산확률변수 여부 판단

1> X는 주사위를 2번 던져서 나온 두 눈의 합이다.

==> 이산확률 변수

2> X는 10번의 룰렛게임에서 숫자 36이 나온 횟수이다.

==> 이산확률 변수

3> X는 교체된 형광등이 수명을 다할 때까지 걸리는 시간이다.

==> 이산확률 변수 X ==> 셈할 수 없다? ==> [0, 무한대]

4> X는 아이가 셋인 가정에서의 남자아이의 수

==> 이산확률변수 ==> 애기들 0,1,2,3

5> X는 500원 짜리 동전 5개와 100원짜리 동전 3개 들어있는 주머니에서 임의로 꺼낸 동전 3개에 포함된 100원짜리 동전의 개수

==> 이산확률변수

6>X는 52장의 카드에서 비복원추출에 5장 뽑을 때, 뽑은 카드안에 있는 그림 카드의 수

==> 이산확률변수

7>X는 52장의 카드에서 복원추출에 의해 5장 뽑을 때, 뽑은 카드안에 있는 그림 카드의 수

==> 이산확률변수 ==> X가 1,2,3 되므로

8>X는 게임 프로그램을 완성할 때까지 걸린시간

==> 이산확률변수 X

3. 확률분포(Probability Distribution)

==> X가 취하는 개개의 값에 대응하는 확률을 나타내는 표나 함수 또는 그래프를 의미한다.

coin = itertools.product(np.arange(2) , repeat=3)
# 확률변수 x는 앞면(1)
b = []
for i in coin:
    a = sorted(collections.Counter(i).most_common() , reverse=True)

    if a[0][0] !=1:
        b.append(0)
    else:
        b.append(a[0][1])
d = collections.Counter(b)
d = dict(sorted(d.items()))
print(d)
ky , val = [] , []
ky = list(d.keys())
val = list(d.values())
for k,v in d.items():
    print(k)
    print(v)

A = pd.DataFrame([val] , columns = ky , index = ['P(X = x)'])
A.columns.names = ['X']
A = A.T
A['P(X = x)']  = A['P(X = x)'] / 8
A.loc['합계'] = A[:].sum(axis=0) #행 추가
A = A.T
A

==> keys() , values() , items() , sorted( key = ) , 행추가시 loc[] 로 추가!

p(x) = 1/8 , x= 0 , 3

3/8 , x= 1 , 2

==> p(x)를 확률변수 X의 확률함수(Probability function)이라 한다.

EX) 주사위 2번 던져서 나온 두 눈의 합을 확률 변수 X라 할때 , X의 확률분포를 확률표와 확률 함수로 나타내기

a = np.arange(1,7).tolist()
print(a)

ratio = list(itertools.product(a, repeat = 2))
ratio2 = list(map(lambda x : x[0]+x[1] , ratio)) # lambda 할 때 map, filter, reduce ,apply 생각!
ratio2 = collections.Counter(ratio2)
ratio2 = dict(sorted(ratio2.items()))
for k, v in ratio2.items():
    v = v/8
    ratio2[k] = v
ratio2

==>lambda 할 때 map, filter, reduce ,apply 생각!

{2: 0.125, 3: 0.250, 4: 0.375, 5: 0.500, 6: 0.625 , 7: 0.750, 8: 0.625, 9: 0.500, 10: 0.375, 11: 0.250, 12: 0.125}

val = ratio2.values()
ky = ratio2.keys()

A = pd.DataFrame(val , index = ky )
A= A.T
A.index = ['P(X = x)']
A.columns.names = ['X']
A

p(x) =

1/36 , x = 2 ,12

2/36 , x = 3 ,11

3/36 , x = 4,10

4/36 , x = 5 , 9

5/36 , x = 6 , 8

6/36 , x = 7

==> 확률 함수

4. 확률질량함수(Probability Mass Function)

EX) 신혼부부가 아이 3명을 갖고자 한다. 확률변수 X는 여자아이의 수

1> 상태공간 Sx를 구하시오.

child = ['여자' ,'남자']
#0이 여자 1이 남자

S_x = list(itertools.product(child , repeat = 3))
S_x

S_x =

[('여자', '여자', '여자'),
('여자', '여자', '남자'),
('여자', '남자', '여자'),
('여자', '남자', '남자'),
('남자', '여자', '여자'),
('남자', '여자', '남자'),
('남자', '남자', '여자'),
('남자', '남자', '남자')]

2> X의 확률변수 p(x)를 구하라.

#확률 변수 X는 여자
res = []
for girls in S_x:

    girl = sorted(list(collections.Counter(girls).most_common()) , reverse=True)
    if girl[0][0] != '여자':
        res.append(0)
    else:
        res.append(girl[0][1])
    # girl =list(map(lambda x : x if sorted(collections.Counter(girls).most_common(), reverse=True)[0][0]=='여자' else 0 , girls))

print(res)

res2 = collections.Counter(res)

res2 = dict(sorted(res2.items()))

==> sorted(res2.items()) 주목!

ky = res2.keys()
val = res2.values()

A = pd.DataFrame([val] , columns = ky)
A.index = ['P(X = x)']
A.columns.names = ['X']
A

A.loc['P(X = x)'] = A.loc['P(X = x)'] /8
A

p(0) = 0.125 = 1/8

p(1) = 0.375 = 3/8

p(2) = 0.375 = 3/8

p(3) = 0.125 = 1/8

p(x) =

1/ 8 , x= 0,3

3/ 8 , x= 1 ,2

==> 확률함수

3> X의 확률질량함수 f(x)를 구하라.

f(x) =

1/8 , x = 0 ,3

3/8 , x = 1 , 2

0 , 다른곳에서

4> 적어도 2명 이상의 여자아이를 낳을 확률

P(X>=2) = 0.375 +0.125 = 0.5

출처 : [쉽게 배우는 생활속의 통계학] [북스힐 , 이재원]

※혼자 공부 정리용

728x90

'기초통계 > 이산확률변수' 카테고리의 다른 글

★초기하분포★기하분포★이산균등분포★기초통계학-[Chapter05 - 이산확률분포-06] (0)	2022.12.15
★Seaborn에서의 Subplots★이항확률의 근사 확률★푸아송분포★기초통계학-[Chapter05 - 이산확률분포-05] (0)	2022.12.15
푸아송분포★기초통계학-[Chapter05 - 이산확률분포-04] (0)	2022.12.14
이항분포식★이항실험★이항분포의 평균,분산★베르누이시행★기초통계학-[Chapter05 - 이산확률분포-03] (1)	2022.12.14
표본,모표본★평균과 분산★기초통계학-[Chapter05 - 이산확률분포-02] (0)	2022.12.14

뭐든지 다 알아보자

Menu

Category

Notice

Recent comments

Links