경험적규칙★체비쇼프 정리★기초통계학-[Chapter03 - 06]

100개의 자료에서
구간 1 : [x-s , x+s] 안에 69개의 자료가 들어있다. ==> 3 + 5 + 6 + 4 + 9 + 1 + 6 + 4 + 7 + 8 + 4 + 9 + 3 = 69
구간 2: [x-2s , x+2s] ==> 69 + (1+1+2+4+1+5 + 2 + 4 +0 + 2 + 2 +2 +1) = 96
구간 3 : [x-3s , x+3s] ==> 96+ 2 +2 =100
===> 경험적 규칙(Empirical rule)에 의하여 자료의 68%가 [x-s , x+s] 안에있고,95%가 [x-2s , x+2s] , 99.7%가 [x-3s , x+3s]안에들어있다.
==> 이를 체비쇼프 정리라 한다.
==> k>1 에 대하여 전체 자료 중에서 적어도 100*(1- (1/k**2))%의 비율이 구간안에 존재한다.
EX-01 ) 자료의 수가 100인 자료 집단에 대하여 평균은 x = 30.138 , 표준편차 s= 1.991 이다.
구간 [x-2.5s , x+2.5s]안에 최소한 몇 개의 자료 값이 놓이는지 체비쇼프 정리를 이용하여 구하고, 실제 자료집단을 이용하여 그 개수를 구하기
print(100*(1- 1/(2.5)**2))
==> 84% ==> 적어도 84개의 자료 값이 이 구간 안에 놓인다.
==> 표본평균의 경우 30.138 표본표준편차 s= 1.991이므로, x-2.5s = 25.1605 || x+2.5s = 35.1155 이다.
==> 위의 그래프에서 보면 전체 자료를 크기순으로 나열하면 [x-2.5s , x+2.5s] = ( 25.1605 , 35.1155) 안에 100개의 자료가 있다.
EX-02 ) 자료의 수가 100인 자료 집단에 대하여 평균은 x = 30.138 , 표준편차 s= 1.991 이다.
구간 [x-1.5s , x+1.5s]안에 자료 값의 개수와 그 비율 구하기
print(100*(1- 1/(1.5)**2))
==> 55.55% ==> 적어도 55.55%의 자료 값이 기 구간 안에 놓인다. ==> 적어도 55개
==> 표본평균의 경우 30.138 표본표준편차 s= 1.991이므로, x-1.5s = 27.1515 || x+1.5s = 33.1245 이다.
출처 : [쉽게 배우는 생활속의 통계학] [북스힐 , 이재원]
※혼자 공부 정리용
'기초통계 > 평균,표준편차,분산' 카테고리의 다른 글
| 변동계수★기초통계학-[Chapter03 - 08] (0) | 2022.12.07 |
|---|---|
| insert() , index★그룹화 자료의 분산과 표준편차★기초통계학-[Chapter03 - 07] (0) | 2022.12.07 |
| ★distplot , histplot , twinx(), ticker , axvline()★정규분포 그래프★기초통계학-[Chapter03 - 05] (0) | 2022.12.06 |
| ★DDOF = 1★모/표본분산 , 모/표본표준편차★평균편차★기초통계학-[Chapter03 - 04] (0) | 2022.12.02 |
| np.median★절사평균, 중위수★기초통계학-[Chapter03 - 03] (0) | 2022.12.02 |