728x90
반응형

3. 뮤 = 50이고 모표준편차가 다음과 같은 모집단으로부터 크기 25인 확률표본을 선정할 때, 표본평균이 49와 52사이일 확률

https://knowallworld.tistory.com/302

 

★모분산을 모를땐 t-분포!★stats.norm.cdf()★모분산을 알때/모를때 표본평균의 표본분포★일표본

1. 표본평균의 표본분포(모분산을 아는 경우) ==> 표본평균에 대한 표본분포는 정규분포를 따른다. EX-01) 모평균 100 , 모분산 9인 정규모집단으로부터 크기 25인 표본을 임의로 추출 1> 표본평균 |X

knowallworld.tistory.com

모분산 알때의 표본평균의 표본분포

 

1> 모표준편차 = 4

 

n = 25

 

|X ~ N(50 , 4**2/25)

 

P(49<=|X<=52) = P(|X<= 52) - P(|X<=49) = P(Z<=  (52-50) / 루트(16/25) ) - P(Z<=  (49-50) / 루트(16/25) ) =  P(-1.25 <=Z <=2.5) = 0.8881

 

x = np.arange(-5,5 , .001)

fig = plt.figure(figsize=(15,8))

ax = sns.lineplot(x , stats.norm.pdf(x, loc=0 , scale =1)) #정의역 범위 , 평균 = 0 , 표준편차 =1 인 정규분포 플롯

z_1 = round((52-50) / math.sqrt(16/25) ,2)
z_2 = round((49-50) / math.sqrt(16/25) ,2)

ax.fill_between(x, stats.norm.pdf(x, loc=0 , scale =1) , 0 , where = (x<=z_1) & (x>=z_2) , facecolor = 'skyblue') # x값 , y값 , 0 , x<=0 인곳 , 색깔



area_1 = ( stats.norm.cdf(z_1) - stats.norm.cdf(z_2) )

ax.text(2.71 , .17, f'P({z_2}<=Z<={z_1}) : {round(area_1,4)}',fontsize=15)
plt.annotate('' , xy=(0, .17), xytext=(2.5 , .17)  , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))


ax.vlines(x= z_2, ymin= 0 , ymax= stats.norm.pdf(z_2, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))

 

모분산 모를때 정규분포 추론

2> 모표준편차 = 9

 

n = 25

 

|X ~ N(50 , 9**2/25)

 

P(49<=|X<=52) = P(|X<= 52) - P(|X<=49) = P(Z<=  (52-50) / 루트(81/25) ) - P(Z<=  (49-50) / 루트(81/25) ) =  P(-0.56 <=Z <=1.11) = 0.5788

 

모분산 모를때 정규분포 추론

3> 모표준편차 = 12

 

n = 25

 

|X ~ N(50 , 12**2/25)

 

P(49<=|X<=52) = P(|X<= 52) - P(|X<=49) = P(Z<=  (52-50) / 루트(144/25) ) - P(Z<=  (49-50) / 루트(144/25) ) =  P(-0.42 <=Z <=08.83) = 0.4595

 

모분산 모를때 정규분포 추론

4. 뮤 = 50이고 모표준편차가 5인 정규모집단으로 부터 크기 n인 확률표본을 선정할때 , 표본평균이 49와 51사이일 확률

 

1> n = 16

 

|X ~ N(50 , 5**2/16)

 

P(49<=|X<51) = P( ( (49-50) / 루트(5**2/16) ) <= Z <=  ( (51-50) / 루트(5**2)/16 ) = [P(1/루트(5**2/16) <= Z) - P(Z<=0)] * 2 = P(-0.8 <= Z <= 0.8) = 0.5763

 

x = np.arange(-5,5 , .001)

fig = plt.figure(figsize=(15,8))

ax = sns.lineplot(x , stats.norm.pdf(x, loc=0 , scale =1)) #정의역 범위 , 평균 = 0 , 표준편차 =1 인 정규분포 플롯

z_1 = round((51-50) / math.sqrt(25/16) ,2)
# z_2 = round((52-50) / math.sqrt(144/25) , 2)

ax.fill_between(x, stats.norm.pdf(x, loc=0 , scale =1) , 0 , where = (x<=z_1) & (x>= -z_1) , facecolor = 'skyblue') # x값 , y값 , 0 , x<=0 인곳 , 색깔



area =  (stats.norm.cdf((z_1)) - stats.norm.cdf(0)) * 2
ax.text(1.71 , .17, f'P({-z_1}<=Z<={z_1}) : {round(area,4)}',fontsize=15)
plt.annotate('' , xy=(0, .17), xytext=(1.7 , .17)  , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= -z_1, ymin= 0 , ymax= stats.norm.pdf(-z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))

크기 n의 변화에 따른 표본평균의 정규분포

2> n = 49

 

P(-1.4 <= Z <= 1.4) = 0.8385

 

크기 n의 변화에 따른 표본평균의 정규분포2

3> n = 64

 

P(-1.6<=Z<=1.6) = 0.8904

5. 뮤 = 45이고 모분산이 9인 정규모집단으로 부터 크기 64인 표본을 추출할때 , 표본평균이 어떤 상수 K보다 작을 확률이 0.95일때, 상수 k를 구하라.

 

|X ~ N(45 , 9/64)

 

P(|X<K) = 0.95

 

P(Z< K-45 / 루트(9/64) ) = 0.95

 

K-45/루트(9/64) = 1.645

k = Symbol('k')

a = solve( (k-45) / math.sqrt(9/64) - 1.645)

print(a)

k = 45.616

 

 

 

6. 모분산이 36인 정규모집단에서 크기 16인 표본을 임의로 추출할때 , P(| |X- 뮤| >= 3)을 구하라.

 

1- P( -3 <= |X -뮤 <= 3) = 1- P(-3+뮤 <= |X <= 3+ 뮤) = 1- P( -3 / 루트(36/16) <= Z <= 3 / 루트(36/16) ) = 1- P(-2 <= Z <= 2) = 1- 0.9545 = 0.0455

x = np.arange(-5,5 , .001)

fig = plt.figure(figsize=(15,8))

ax = sns.lineplot(x , stats.norm.pdf(x, loc=0 , scale =1)) #정의역 범위 , 평균 = 0 , 표준편차 =1 인 정규분포 플롯

z_1 = round((3) / math.sqrt(36/16) ,2)
# z_2 = round((52-50) / math.sqrt(144/25) , 2)

ax.fill_between(x, stats.norm.pdf(x, loc=0 , scale =1) , 0 , where = (x>=z_1) | (x<= -z_1) , facecolor = 'skyblue') # x값 , y값 , 0 , x<=0 인곳 , 색깔



area =  0.5 - ((stats.norm.cdf((z_1)) - stats.norm.cdf(0)))


ax.text(2.61 , .05, f'P({z_1}>=Z) : {round(area,4)}',fontsize=15)
plt.annotate('' , xy=(2.3, .017), xytext=(2.5 , .05)  , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))





ax.text(-3.71 , .055, f'P(Z<={-z_1}) : {round(area,4)}',fontsize=15)
plt.annotate('' , xy=(-2.3, .017), xytext=(-2.5 , .05)  , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= -z_1, ymin= 0 , ymax= stats.norm.pdf(-z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))



plt.annotate('' , xy=(0, .2), xytext=(-2.5 , .08)  , arrowprops = dict(facecolor = 'black'))
plt.annotate('' , xy=(0, .2), xytext=(2.5 , .08)  , arrowprops = dict(facecolor = 'black'))
ax.text(-1 , .21, f'P({-z_1}<=Z<={z_1}) : {round(area*2,4)}',fontsize=15)







ax.vlines(x= -z_1, ymin= 0 , ymax= stats.norm.pdf(-z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))
ax.vlines(x= z_1, ymin= 0 , ymax= stats.norm.pdf(z_1, loc=0 , scale =1) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))

모평균 모를때의 정규분포 구하기

7. 모평균이 20 , 모표준편차가 6인 정규모집단에서 크기 n인 표본을 임의로 추출할때, 표본표준편차가 1.5라 한다. 표본의 크기 n을 구하라.

 

X ~ N(20 , 6**2 )

 

|X ~ N(20 , 36/n) 

n = Symbol('n')

a = solve(36/n - 1.5**2)

print(a)

루트(36/n) = 1.5

 

n = 16

 

출처 :  [쉽게 배우는 생활속의 통계학]  [북스힐 , 이재원] 

※혼자 공부 정리용

728x90
반응형

+ Recent posts