★표본분산 S**2 , 관찰 표본분산 s_0**2★카이제곱분포표★모분산의 표본분포★기초통계학-[모집단 분포와 표본분포 -06]

★표본분산 S2 , 관찰 표본분산 s_02★카이제곱분포표★모분산의 표본분포★기초통계학-[모집단 분포와 표본분포 -06]

2023. 1. 6. 13:09

728x90

1. 모분산의 표본분포

정규모집단 N(뮤 , 모분산) 으로부터 크기 n인 표본을 선정할 때 표본분산

==> 표본분산 S**2에 대한 표본분포는 X**2-통계량 V에 대하여 자유도가 n-1인 카이제곱분포이다.

https://knowallworld.tistory.com/258

★scipy.stats.chi2().ppf()★matplotlib 수학식표현★카이제곱분포★정규분포★기초통계학-[Chapter06 - 연

1. 카이제곱분포 ==> 카이제곱분포는 정규모집단의 모분산에 대한 통계적 추론에 사용 ==> n개의 서로 독립인 표준정규확률변수 Z_1 ,Z_2 ,···· Z_n 에 대하여 확률변수의 확률분포를 자유도(degree of

knowallworld.tistory.com

==> 카이제곱분포

==> 정규모집단 N(뮤 , 모분산)에서 모분산을 추정하거나 검정하기 위하여 표본분산 S**2을 이용한다.

==> 확률분포는 카이제곱분포를 활용한다!!!

EX-01) 감기약의 무게는 분산이 0.000756g인 정규분포를 따른다. 감기약 16개를 수거하여 무게 측정

1> 표본분산과 관련된 x**2 - 통계량 V의 분포를 구하라.

모분산 = 0.000756g , 확률분포(n) = 16

==> 표본분산과 관련한 표본분포는 자유도 15인 카이제곱분포이다.

V = (16-1)* (S**2) / 0.000756 ~ X**2(15)

2> 표본조사 결과 [4.23 , 4.26 , 4.26 , 4.24 , 4.27 , 4.23 , 4.19 , 4.27 , 4.21 , 4.25 , 4.23 , 4.29 , 4.30 , 4.24 , 4.20 , 4.24]

관찰된 표본분산의 값 s**2를 구하라.

표본평균 = 4.244

표본분산(s_0**2) = 0.00092

3> 이 표본을 이용하여 통계량의 관찰값 X**2_0 = (n-1)* s_0**2 / 모분산 을 구하라.

n-1 = 16 -1 = 15

s_0**2 = 0.00092

모분산 = 0.000756

sik = (15*(0.00092)) / 0.000756

X**2_0 = 18.25

4> 표본분산 S**2 이 관찰값 s_0**2보다 클 확률

P(S**2 > s_0**2) = P(S**2 > 0.00092 ) = P(15*S**2 / 0.000756 > 15*s_0**2 / 0.000756 ) = P(V > 15*(0.0009**2) / 0.000756) = P(V>= 18.25) = 0.249

matplotlib.rc("font" , family = "Times New Roman" , weight = "bold")

X = np.arange(0,30,.01)

fig = plt.figure(figsize=(15,8))
dof = 15 #자유도

ax = sns.lineplot(X , scipy.stats.chi2(dof).pdf(X))

X_r = 18.25
print(X_r)

chai = scipy.stats.chi2(dof).pdf(18.25)
print(chai)



ax.fill_between(X, scipy.stats.chi2(dof).pdf(X) , where = (X>=X_r) , facecolor = 'skyblue') # x값 , y값 , 0 , x조건 인곳 , 색깔
area = 1- scipy.stats.chi2(dof).cdf(X_r) #넓이 구하기!!!!!
print(area)
ax.text(25 , .015, 'P(X >' + r'$\chi^2_{0.05})$'  + f"= {round(area,4)}",fontsize=15)
plt.annotate('' , xy=(22, .002), xytext=(24 , .014)  , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= X_r, ymin= 0 , ymax= scipy.stats.chi2(dof).pdf(X_r) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))


ax.text(X_r - 3.5, .018,  r'$\chi^2_R= {}$'.format(round(X_r,2)) ,fontsize=15)
plt.annotate('' , xy=(17.5, .002), xytext=(15 , .014)  , arrowprops = dict(facecolor = 'black'))


b = [r'$\chi^2(\eta$ = {})'.format(15)]
print(b)
plt.legend(b , fontsize = 15)

EX-02) 제주도 펜션 사용료 분산 8.03, [12.5 , 11.5 , 6.0, 5.5 , 15.5 , 11.5 , 10.5 , 17.5 , 10.0 , 9.5 , 13.5 , 8.5 , 11.5 , 15.5 , 10.5]

1> x**2 ~ 통계량 V의 분포를 구하고, 관찰된 표본분산의 값 s_0**2 을 구하라.

모분산 = 8.03

표본평균 = 11.3

표본분산 = 11.1357

n = 15

V = (15-1)* (S**2) / 8.03 ~ X**2(14)

2> 통계량의 관찰값 X_0**2 = (n-1)*s_0**2 / 분산 을 구하라

print(14 * 11.1357 / 8.03)

X_0**2 = 14* 11.1357 / 8.03 = 19.414

3> 표본분산 S**2 이 s_0**2보다 클확률

P(S**2 > s_0**2) = P(14 * S**2 / 8.03 > 14* 11.1357 / 8.03) = P (V > 19.414) = 0.1497

matplotlib.rc("font" , family = "Times New Roman" , weight = "bold")

X = np.arange(0,30,.01)

fig = plt.figure(figsize=(15,8))
dof = 14 #자유도

ax = sns.lineplot(X , scipy.stats.chi2(dof).pdf(X))

X_r = 19.414
print(X_r)

chai = scipy.stats.chi2(dof).pdf(18.25)
print(chai)



ax.fill_between(X, scipy.stats.chi2(dof).pdf(X) , where = (X>=X_r) , facecolor = 'skyblue') # x값 , y값 , 0 , x조건 인곳 , 색깔
area = 1- scipy.stats.chi2(dof).cdf(X_r) #넓이 구하기!!!!!
print(area)
ax.text(25 , .015, 'P(X >' + r'$\chi^2_{0.04})$'  + f"= {round(area,4)}",fontsize=15)
plt.annotate('' , xy=(22, .002), xytext=(24 , .014)  , arrowprops = dict(facecolor = 'black'))
ax.vlines(x= X_r, ymin= 0 , ymax= scipy.stats.chi2(dof).pdf(X_r) , color = 'black' , linestyle ='solid' , label ='{}'.format(2))


ax.text(X_r - 3.5, .018,  r'$\chi^2_R= {}$'.format(round(X_r,2)) ,fontsize=15)
plt.annotate('' , xy=(19.41, .002), xytext=(18 , .014)  , arrowprops = dict(facecolor = 'black'))


b = [r'$\chi^2(\eta$ = {})'.format(14)]
print(b)
plt.legend(b , fontsize = 15)

출처 : [쉽게 배우는 생활속의 통계학] [북스힐 , 이재원]

※혼자 공부 정리용

728x90

'기초통계 > 표본분포' 카테고리의 다른 글

★두 표본평균의 차에 대한 표본분포(모분산 알때 , 동일할때)★중심극한정리 활용★이표본의 표본분포★기초통계학-[모집단 분포와 표본분포 -08] (0)	2023.01.06
이항분포에 따른 정규분포의 표준정규분포화★표본비율의 표본분포★기초통계학-[모집단 분포와 표본분포 -07] (0)	2023.01.06
★중심극한정리★기초통계학-[모집단 분포와 표본분포 -05] (0)	2023.01.06
★lineplot★중심극한정리★기초통계학-[모집단 분포와 표본분포 -04] (0)	2023.01.05
★모분산을 모를땐 t-분포!★stats.norm.cdf()★모분산을 알때/모를때 표본평균의 표본분포★일표본★표본비율★기초통계학-[모집단 분포와 표본분포 -03] (0)	2023.01.05

뭐든지 다 알아보자

Menu

Category

Notice

Recent comments

Links