★표본평균의 차에 대한 절대값 처리★두 표본평균의 차에 따른 표준정규분포★기초통계학-[연습문제02 -19]
25. 모평균과 모분산이 각각 뮤_1 = 178 , 뮤_2 = 166 , 모분산_1 = 16, 모분산_2 = 9이고 독립인 두 정규모집단에서 각각 크기 n=m = 16인 표본을 임의로 추출
https://knowallworld.tistory.com/307
★두 표본평균의 차에 대한 표본분포(모분산 알때 , 동일할때)★중심극한정리 활용★이표본의
1. 이표본의 표본분포 ==>지금까지는 단일 모집단의 표본에 대한 통계량의 표본분포 EX) 수능에서 남학생, 여학생 집단의 평균이 동일한지 여부 비교 ==> 비교위해서는 각각 표본을 추출하여야 한
knowallworld.tistory.com
1> 두 표본평균 차에 대한 확률 분포
|X - |Y ~ N(178-166 , 1+ 9/16)
2> 두 표본평균의 차가 10 이상일 확률
P(|X-|Y >= 10) = P(Z>= (10-12) / 루트(16+81/16) ) = P(-1.41<=Z) = 0.9207
x = np.arange(-5,5 , .001)
fig = plt.figure(figsize=(15,8))
ax = sns.lineplot(x , stats.norm.pdf(x, loc=0 , scale =1)) #정의역 범위 , 평균 = 0 , 표준편차 =1 인 정규분포 플롯
z_1 = round((10 - 12) / math.sqrt(1 + 9/16) ,2)
# # z_2 = round((34.5 - 35) / math.sqrt(5.5**2 / 25) , 2)
# z_1 = round(scipy.stats.norm.ppf(1- 0.025) ,2 )
ax.fill_between(x, stats.norm.pdf(x, loc=0 , scale =1) , 0 , where = (x>=z_1) , facecolor = 'skyblue') # x값 , y값 , 0 , x<=0 인곳 , 색깔
area = 1- scipy.stats.norm.cdf(z_1)
ax.text(2 , .12, f'P({z_1}<=Z) : {round(area,4)}',fontsize=15)
plt.annotate('' , xy=(2.3, .012), xytext=(3 , .1) , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
26. 여자 평균 79점, 표준편차 15점, 남학생은 77점, 표준편차 10점 , 여학생 40명 , 남학생 50명 임의 선정
뮤_|x = 79
s_|x = 15
n = 40
뮤_|y = 77
s_|y = 10
m = 50
1> 표본으로 선정된 여학생과 남학생의 평균점수의 차에 대한 확률분포
|X-|Y ~ N(79-77 , 15**2 /40 + 10**2/50)
2> 여학생의 평균이 남학생의 평균보다 1점 이상일 확률
P(|X-|Y >= 1) = P(Z >= 1-2 / 루트(15**2 /40 + 10**2/50) ) = P(-0.36<=Z) = 0.6406
x = np.arange(-5,5 , .001)
fig = plt.figure(figsize=(15,8))
ax = sns.lineplot(x , stats.norm.pdf(x, loc=0 , scale =1)) #정의역 범위 , 평균 = 0 , 표준편차 =1 인 정규분포 플롯
z_1 = round((1 - 2) / math.sqrt(15**2 / 40 + 10**2 / 50) ,2)
# # z_2 = round((34.5 - 35) / math.sqrt(5.5**2 / 25) , 2)
# z_1 = round(scipy.stats.norm.ppf(1- 0.025) ,2 )
ax.fill_between(x, stats.norm.pdf(x, loc=0 , scale =1) , 0 , where = (x>=z_1) , facecolor = 'skyblue') # x값 , y값 , 0 , x<=0 인곳 , 색깔
area = 1- scipy.stats.norm.cdf(z_1)
ax.text(2 , .12, f'P({z_1}<=Z) : {round(area,4)}',fontsize=15)
plt.annotate('' , xy=(2.3, .012), xytext=(3 , .1) , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
27. 평균 근속연수 남녀간 차이 6년 , 두 그룹의 표준편차가 동일하게 3년 , 남자 직원 250명, 여자 직원 200명 임의 선정
1> 표본으로 선정된 남녀 직원의 평균 근속 연수의 차에 대한 확률분포
| |X-|Y | ~ N(6 , 9/250 + 9/200)
2> 남자와 여자의 평균 근속 연수의 차가 +- 5년 사이일 확률( 다시 풀자)
P( | |X - |Y | <5 ) = P( |Z| < 5-6 / 루트(9/250 + 9/200) ) = P( |Z| < 3.51) = [ P(Z<3.51) - P(Z<0) ] *2 =
x = np.arange(-5,5 , .001)
fig = plt.figure(figsize=(15,8))
ax = sns.lineplot(x , stats.norm.pdf(x, loc=0 , scale =1)) #정의역 범위 , 평균 = 0 , 표준편차 =1 인 정규분포 플롯
# z_1 = round((-5-6) / math.sqrt(9/250 + 9/200 ) ,2)
z_1 = round((5-6) / math.sqrt(9/250 + 9/200) , 2)
print(z_1)
ax.fill_between(x, stats.norm.pdf(x, loc=0 , scale =1) , 0 , where = (x>=z_1) & (x<=-z_1) , facecolor = 'skyblue') # x값 , y값 , 0 , x<=0 인곳 , 색깔
area = (stats.norm.cdf((-z_1)) - scipy.stats.norm.cdf(0)) *2
ax.text(1.71 , .17, f'P({z_1}<=Z<={-z_1}) : {round(area,4)}',fontsize=15)
plt.annotate('' , xy=(0, .17), xytext=(1.7 , .17) , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= -z_1, ymin= 0 , ymax= stats.norm.pdf(-z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
28. 남자 평균 연봉 8600만원 , 여자 평균 연봉 5800만원 , 표준편차가 동일하게 1000만원 , 남 직원 25명 , 여자 직원 20명
1> 표본으로 선정된 남자 직원과 여자 직원의 평균연봉의 차에 대한 학률분포
|X-|Y ~ N(2800 , 1000**2 / 25 + 1000**2 / 20)
2> 남자 직원의 평균 연봉이 여자 직원의 평균 연봉보다 3400만원 이상 높을 확률
P(|X-|Y >= 3400) = P(Z>= (3400-2800) / 루트(1000**2 / 25 + 1000**2 / 20) ) = 1 - P(Z<= (3400-2800) / 루트(1000**2 / 25 + 1000**2 / 20) ) = P(2<=Z) = 0.0228
x = np.arange(-5,5 , .001)
fig = plt.figure(figsize=(15,8))
ax = sns.lineplot(x , stats.norm.pdf(x, loc=0 , scale =1)) #정의역 범위 , 평균 = 0 , 표준편차 =1 인 정규분포 플롯
z_1 = round((3400 - 2800) / math.sqrt(1000**2 / 25 + 1000**2 / 20) ,2)
# # z_2 = round((34.5 - 35) / math.sqrt(5.5**2 / 25) , 2)
# z_1 = round(scipy.stats.norm.ppf(1- 0.025) ,2 )
ax.fill_between(x, stats.norm.pdf(x, loc=0 , scale =1) , 0 , where = (x>=z_1) , facecolor = 'skyblue') # x값 , y값 , 0 , x<=0 인곳 , 색깔
area = 1- scipy.stats.norm.cdf(z_1)
ax.text(2 , .12, f'P({z_1}<=Z) : {round(area,4)}',fontsize=15)
plt.annotate('' , xy=(2.3, .012), xytext=(3 , .1) , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
출처 : [쉽게 배우는 생활속의 통계학] [북스힐 , 이재원]
※혼자 공부 정리용
'기초통계 > 표본분포' 카테고리의 다른 글
★표본비율차이에 따른 표준정규분포★기초통계학-[연습문제02 -21] (0) | 2023.01.11 |
---|---|
★종합선물세트★F-분포(표본분산의 비 이용!)★표본평균의 차에 따른 확률분포!★합동표본분산 구하는 법!★모분산을 모를땐 t-분포★모분산을 알때는 카이제곱분포★기초통계학-[연습문제.. (0) | 2023.01.11 |
★표본비율의 표본분포에 대한 정규분포 근사★표본비율★N(모평균 , 모평균*(1-모평균) / 전체표본개수★기초통계학-[연습문제02 -18] (1) | 2023.01.11 |
★모평균을 알때는 카이제곱★중심극한정리(표본평균의 표준정규분포)★이항분포의 평균,분산★기초통계학-[연습문제02 -17] (1) | 2023.01.10 |
★모분산을 모를때는 t-분포★기초통계학-[연습문제02 -16] (0) | 2023.01.09 |