728x90
반응형

100개의 자료에서

구간 1 : [x-s , x+s] 안에 69개의 자료가 들어있다. ==> 3 + 5 + 6 + 4 + 9 + 1 + 6 + 4 + 7 + 8 + 4 + 9 + 3 = 69

구간 2: [x-2s , x+2s] ==> 69 + (1+1+2+4+1+5      + 2 + 4 +0 + 2 + 2 +2 +1) = 96

구간 3 : [x-3s , x+3s] ==> 96+ 2 +2 =100

 

 

===> 경험적 규칙(Empirical rule)에 의하여 자료의 68%가  [x-s , x+s] 안에있고,95%가  [x-2s , x+2s] , 99.7%가  [x-3s , x+3s]안에들어있다.

 

 

==> 이를 체비쇼프 정리라 한다.

 

==> k>1 에 대하여 전체 자료 중에서 적어도 100*(1- (1/k**2))%의 비율이 구간안에 존재한다.

 

EX-01 ) 자료의 수가 100인 자료 집단에 대하여 평균은 x = 30.138 , 표준편차 s= 1.991 이다. 

구간 [x-2.5s , x+2.5s]안에 최소한 몇 개의 자료 값이 놓이는지 체비쇼프 정리를 이용하여 구하고, 실제 자료집단을 이용하여 그 개수를 구하기

print(100*(1- 1/(2.5)**2))

 

==> 84% ==> 적어도 84개의 자료 값이 이 구간 안에 놓인다.

 

==> 표본평균의 경우 30.138 표본표준편차 s= 1.991이므로,  x-2.5s = 25.1605 || x+2.5s = 35.1155 이다.

 

==> 위의 그래프에서 보면 전체 자료를 크기순으로 나열하면  [x-2.5s , x+2.5s] = ( 25.1605 , 35.1155) 안에  100개의 자료가 있다.

 

 

EX-02 ) 자료의 수가 100인 자료 집단에 대하여 평균은 x = 30.138 , 표준편차 s= 1.991 이다. 

구간 [x-1.5s , x+1.5s]안에 자료 값의 개수와 그 비율 구하기

 

print(100*(1- 1/(1.5)**2))

==> 55.55% ==> 적어도 55.55%의 자료 값이 기 구간 안에 놓인다. ==> 적어도 55개

 

==> 표본평균의 경우 30.138 표본표준편차 s= 1.991이므로,  x-1.5s = 27.1515 || x+1.5s = 33.1245 이다.

 

출처 :  [쉽게 배우는 생활속의 통계학]  [북스힐 , 이재원] 

※혼자 공부 정리용

 

 

728x90
반응형

+ Recent posts