3. 뮤 = 50이고 모표준편차가 다음과 같은 모집단으로부터 크기 25인 확률표본을 선정할 때, 표본평균이 49와 52사이일 확률
https://knowallworld.tistory.com/302
★모분산을 모를땐 t-분포!★stats.norm.cdf()★모분산을 알때/모를때 표본평균의 표본분포★일표본
1. 표본평균의 표본분포(모분산을 아는 경우) ==> 표본평균에 대한 표본분포는 정규분포를 따른다. EX-01) 모평균 100 , 모분산 9인 정규모집단으로부터 크기 25인 표본을 임의로 추출 1> 표본평균 |X
knowallworld.tistory.com
1> 모표준편차 = 4
n = 25
|X ~ N(50 , 4**2/25)
P(49<=|X<=52) = P(|X<= 52) - P(|X<=49) = P(Z<= (52-50) / 루트(16/25) ) - P(Z<= (49-50) / 루트(16/25) ) = P(-1.25 <=Z <=2.5) = 0.8881
x = np.arange(-5,5 , .001)
fig = plt.figure(figsize=(15,8))
ax = sns.lineplot(x , stats.norm.pdf(x, loc=0 , scale =1)) #정의역 범위 , 평균 = 0 , 표준편차 =1 인 정규분포 플롯
z_1 = round((52-50) / math.sqrt(16/25) ,2)
z_2 = round((49-50) / math.sqrt(16/25) ,2)
ax.fill_between(x, stats.norm.pdf(x, loc=0 , scale =1) , 0 , where = (x<=z_1) & (x>=z_2) , facecolor = 'skyblue') # x값 , y값 , 0 , x<=0 인곳 , 색깔
area_1 = ( stats.norm.cdf(z_1) - stats.norm.cdf(z_2) )
ax.text(2.71 , .17, f'P({z_2}<=Z<={z_1}) : {round(area_1,4)}',fontsize=15)
plt.annotate('' , xy=(0, .17), xytext=(2.5 , .17) , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
ax.vlines(x= z_2, ymin= 0 , ymax= stats.norm.pdf(z_2, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
2> 모표준편차 = 9
n = 25
|X ~ N(50 , 9**2/25)
P(49<=|X<=52) = P(|X<= 52) - P(|X<=49) = P(Z<= (52-50) / 루트(81/25) ) - P(Z<= (49-50) / 루트(81/25) ) = P(-0.56 <=Z <=1.11) = 0.5788
3> 모표준편차 = 12
n = 25
|X ~ N(50 , 12**2/25)
P(49<=|X<=52) = P(|X<= 52) - P(|X<=49) = P(Z<= (52-50) / 루트(144/25) ) - P(Z<= (49-50) / 루트(144/25) ) = P(-0.42 <=Z <=08.83) = 0.4595
4. 뮤 = 50이고 모표준편차가 5인 정규모집단으로 부터 크기 n인 확률표본을 선정할때 , 표본평균이 49와 51사이일 확률
1> n = 16
|X ~ N(50 , 5**2/16)
P(49<=|X<51) = P( ( (49-50) / 루트(5**2/16) ) <= Z <= ( (51-50) / 루트(5**2)/16 ) = [P(1/루트(5**2/16) <= Z) - P(Z<=0)] * 2 = P(-0.8 <= Z <= 0.8) = 0.5763
x = np.arange(-5,5 , .001)
fig = plt.figure(figsize=(15,8))
ax = sns.lineplot(x , stats.norm.pdf(x, loc=0 , scale =1)) #정의역 범위 , 평균 = 0 , 표준편차 =1 인 정규분포 플롯
z_1 = round((51-50) / math.sqrt(25/16) ,2)
# z_2 = round((52-50) / math.sqrt(144/25) , 2)
ax.fill_between(x, stats.norm.pdf(x, loc=0 , scale =1) , 0 , where = (x<=z_1) & (x>= -z_1) , facecolor = 'skyblue') # x값 , y값 , 0 , x<=0 인곳 , 색깔
area = (stats.norm.cdf((z_1)) - stats.norm.cdf(0)) * 2
ax.text(1.71 , .17, f'P({-z_1}<=Z<={z_1}) : {round(area,4)}',fontsize=15)
plt.annotate('' , xy=(0, .17), xytext=(1.7 , .17) , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= -z_1, ymin= 0 , ymax= stats.norm.pdf(-z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
2> n = 49
P(-1.4 <= Z <= 1.4) = 0.8385
3> n = 64
P(-1.6<=Z<=1.6) = 0.8904
5. 뮤 = 45이고 모분산이 9인 정규모집단으로 부터 크기 64인 표본을 추출할때 , 표본평균이 어떤 상수 K보다 작을 확률이 0.95일때, 상수 k를 구하라.
|X ~ N(45 , 9/64)
P(|X<K) = 0.95
P(Z< K-45 / 루트(9/64) ) = 0.95
K-45/루트(9/64) = 1.645
k = Symbol('k')
a = solve( (k-45) / math.sqrt(9/64) - 1.645)
print(a)
k = 45.616
6. 모분산이 36인 정규모집단에서 크기 16인 표본을 임의로 추출할때 , P(| |X- 뮤| >= 3)을 구하라.
1- P( -3 <= |X -뮤 <= 3) = 1- P(-3+뮤 <= |X <= 3+ 뮤) = 1- P( -3 / 루트(36/16) <= Z <= 3 / 루트(36/16) ) = 1- P(-2 <= Z <= 2) = 1- 0.9545 = 0.0455
x = np.arange(-5,5 , .001)
fig = plt.figure(figsize=(15,8))
ax = sns.lineplot(x , stats.norm.pdf(x, loc=0 , scale =1)) #정의역 범위 , 평균 = 0 , 표준편차 =1 인 정규분포 플롯
z_1 = round((3) / math.sqrt(36/16) ,2)
# z_2 = round((52-50) / math.sqrt(144/25) , 2)
ax.fill_between(x, stats.norm.pdf(x, loc=0 , scale =1) , 0 , where = (x>=z_1) | (x<= -z_1) , facecolor = 'skyblue') # x값 , y값 , 0 , x<=0 인곳 , 색깔
area = 0.5 - ((stats.norm.cdf((z_1)) - stats.norm.cdf(0)))
ax.text(2.61 , .05, f'P({z_1}>=Z) : {round(area,4)}',fontsize=15)
plt.annotate('' , xy=(2.3, .017), xytext=(2.5 , .05) , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
ax.text(-3.71 , .055, f'P(Z<={-z_1}) : {round(area,4)}',fontsize=15)
plt.annotate('' , xy=(-2.3, .017), xytext=(-2.5 , .05) , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= -z_1, ymin= 0 , ymax= stats.norm.pdf(-z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
plt.annotate('' , xy=(0, .2), xytext=(-2.5 , .08) , arrowprops = dict(facecolor = 'black'))
plt.annotate('' , xy=(0, .2), xytext=(2.5 , .08) , arrowprops = dict(facecolor = 'black'))
ax.text(-1 , .21, f'P({-z_1}<=Z<={z_1}) : {round(area*2,4)}',fontsize=15)
ax.vlines(x= -z_1, ymin= 0 , ymax= stats.norm.pdf(-z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
7. 모평균이 20 , 모표준편차가 6인 정규모집단에서 크기 n인 표본을 임의로 추출할때, 표본표준편차가 1.5라 한다. 표본의 크기 n을 구하라.
X ~ N(20 , 6**2 )
|X ~ N(20 , 36/n)
n = Symbol('n')
a = solve(36/n - 1.5**2)
print(a)
루트(36/n) = 1.5
n = 16
출처 : [쉽게 배우는 생활속의 통계학] [북스힐 , 이재원]
※혼자 공부 정리용
'기초통계 > 표본분포' 카테고리의 다른 글
★모분산을 모를때는 t-분포★기초통계학-[연습문제02 -16] (0) | 2023.01.09 |
---|---|
★Solve()이후 float로의 변환★크기를 알때/모를때의 표본평균의 표준분포★기초통계학-[연습문제02 -15] (0) | 2023.01.09 |
★확률질량함수의 평균 분산★그룹화자료의 평균과 분산이 아닌 확률질량함수이다!!!★이산균등분포★기초통계학-[연습문제01 -13] (0) | 2023.01.07 |
★표본비율의 차에 대한 표본분포★기초통계학-[모집단 분포와 표본분포 -12] (0) | 2023.01.07 |
★F-분포★두 표본분산의 비에 대한 표본분포★기초통계학-[모집단 분포와 표본분포 -11] (1) | 2023.01.07 |