★표본비율의 차에 대한 표본분포★기초통계학-[모집단 분포와 표본분포 -12]

2023. 1. 7. 17:46

728x90

1. 두 표본비율의 차에 대한 표본분포

==> 서로 독립이고 모비율이 각각 p_1 , p_2인 두 모집단에서 각각 크기 n,m인 표본 선정

==> 표본의 크기가 충분히 크다면

https://knowallworld.tistory.com/301

★모비율★표본비율★기초통계학-[모집단 분포와 표본분포 -02]

1. 모비율(Population Proportion) ==> 모집단을 형성하고 있는 모든 대상에 대한 특정한 성질을 갖고 있는 대상의 비율(p)를 나타낸다. 2. 표본비율(Sample Proportion) ==> 확률분포를 이루는 대상에 대한 특정

knowallworld.tistory.com

https://knowallworld.tistory.com/306

이항분포에 따른 정규분포의 표준정규분포화★표본비율의 표본분포★기초통계학-[모집단 분포

1.표본비율의 표본분포 EX) 이항 확률변수의 실질적인 응용 ==> 여론조사 생각 ==> 모집단을 구성하는 사람들의 어느 특정 사건을 선호하는 비율(p)를 알기 위하여 n명으로 구성된 표본을 임의 선정

knowallworld.tistory.com

==> 표본비율의 표본분포의 정규분포 근사

EX-01) 무죄를 주장하는 피고인이 교도소로 보내지는 비율은 84.7% , 유죄를 인정하는 피고인 중에 교도소로 보내지는 비율은 52.1%. 무죄를 주장하는 피고인 150명과 유죄를 인정하는 피고인 120명 선정. 무죄를 주장하는 피고인 중에 교도소로 보내지는 비율을 ^p , 유죄를 인정하는 피고인 중에 교도소로 보내지는 비율을 ^p_2 라 할때 ^p_1 - ^p_2가 30%를 초과할 확률

무죄 주장 ==> 교도소 갈 확률 ==> ^p_1 = 0.847

유죄 주장 ==> 교도소 갈 확률 ==> ^p_2 = 0.521

n = 150

m= 120

^p_1 - ^p_2 = 0.847 - 0.521 = 0.326

표본비율의 차에 대한 분산 = [0.847 * (1-0.847) / 150 ] + [0.521 * (1-0.521) / 120] = 0.0029

print(0.847 * (1-0.847) / 150  + 0.521 * (1-0.521) / 120)

표본비율의 차에 대한 정규분포

==> N ( 0.326 , 0.0029)

P(^p_1 - ^p_2 > 0.3) = P(Z> 0.3 - 0.326 / 루트(0.0029) ) = P(Z>= -0.48) = 0.6844

matplotlib.rc("font" , family = "Times New Roman" , weight = "bold")

X = np.arange(-5,5,.001)

fig = plt.figure(figsize=(15,8))

ax = sns.lineplot(X , scipy.stats.norm.pdf(X)) #18.31 , 3.94 어케?

X_r = round((0.3 - 0.326) / math.sqrt(0.0029),2)
area = 1- scipy.stats.norm.cdf(X_r)

ax.fill_between(X, scipy.stats.norm.pdf(X) , where = (X>=X_r) , facecolor = 'skyblue') # x값 , y값 , 0 , x조건 인곳 , 색깔

ax.text(-2 , .22, 'P(Z >=' + f'{X_r})'+f"\n= {round(area,4)}",fontsize=15)
plt.annotate('' , xy=(0, .2), xytext=(-2 , .2)  , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= X_r, ymin= 0 , ymax= scipy.stats.norm.pdf(X_r) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))

# b = [r'$\chi^2(\eta$ = {})'.format(dof)]
# print(b)
# plt.legend(b , fontsize = 15)

EX-02) 남성 미혼 54% , 여성 미혼 36%이 K리그를 지지한다. 각각 500명씩 조사할 경우 , 지지율의 차가 10%이하일 확률

^p_1 = 0.54

^p_2 = 0.36

n = m = 500

P(^p1 - ^p2 <= 0.1)

^p_1 - ^p_2 = 0.54 - 0.36 = 0.18

두 표본비율의 차에대한 분산 = [0.54 * (1 - 0.54) / 500] + [0.36 * ( 1- 0.36) / 500]

print( 0.54 * (1 - 0.54) / 500 + 0.36 * ( 1- 0.36) / 500)

N(0.18 , 0.0009)

P(^p1 - ^p2 <= 0.1) = P(Z<= [0.1 - 0.18 / 루트(0.0009)] ) = P(Z<= -2.67) = 0.0038

matplotlib.rc("font" , family = "Times New Roman" , weight = "bold")

X = np.arange(-5,5,.001)

fig = plt.figure(figsize=(15,8))

ax = sns.lineplot(X , scipy.stats.norm.pdf(X)) #18.31 , 3.94 어케?

X_r = round((0.1 - 0.18) / math.sqrt(0.0009),2)
area = scipy.stats.norm.cdf(X_r)

ax.fill_between(X, scipy.stats.norm.pdf(X) , where = (X<=X_r) , facecolor = 'skyblue') # x값 , y값 , 0 , x조건 인곳 , 색깔

ax.text(-4 , .06, 'P(Z <=' + f'{X_r})'+f"\n= {round(area,4)}",fontsize=15)
plt.annotate('' , xy=(-3, .001), xytext=(-3 , .05)  , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= X_r, ymin= 0 , ymax= scipy.stats.norm.pdf(X_r) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))

# b = [r'$\chi^2(\eta$ = {})'.format(dof)]
# print(b)
# plt.legend(b , fontsize = 15)

출처 : [쉽게 배우는 생활속의 통계학] [북스힐 , 이재원]

※혼자 공부 정리용

728x90

'기초통계 > 표본분포' 카테고리의 다른 글

★표본평균의 정규분포(표본평균 = 모평균 , 표본분산 = 모분산/크기)★모분산 모를때 정규표본 추출★기초통계학-[연습문제02 -14] (0)	2023.01.09
★확률질량함수의 평균 분산★그룹화자료의 평균과 분산이 아닌 확률질량함수이다!!!★이산균등분포★기초통계학-[연습문제01 -13] (0)	2023.01.07
★F-분포★두 표본분산의 비에 대한 표본분포★기초통계학-[모집단 분포와 표본분포 -11] (1)	2023.01.07
★서로독립인 정규집단의 표본분산(모분산은 알때) 추론★카이제곱분포★합동표본분산에 대한 표본분포★기초통계학-[모집단 분포와 표본분포 -10] (0)	2023.01.07
★두 표본평균의 차에 대한 표본분포(모분산 모를때)★중심극한정리 활용★이표본의 표본분포★기초통계학-[모집단 분포와 표본분포 -09] (0)	2023.01.06

뭐든지 다 알아보자

Menu

Category

Notice

Recent comments

Links