728x90
반응형

1. 그룹화 자료의 분산과 표준편차

 

A  ='29 30 49 21 39 38 15 39 48 41 50 38 33 40 51 29 31 42 29 69 37 20 49 40 10 49 49 49 35 45 22 45 20 45 30 41 40 38 10 31 47 19 31 21 41 46 28 29 18 28'

A = list(map(int, A.split(' ')))
A

A = [29, 30, 49, 21, ············]

B = pd.DataFrame({'계급간격' : interval ,'도수(f_i)' : hist , '계급값(x_i)' : Steps} )
B= B.set_index('계급간격')
B
B['f_i_x_i'] = B['도수(f_i)'] * B['계급값(x_i)']
B['x_i - |x'] = B['도수(f_i)'] - round(float(A.mean()),2)
B['(x_i - |x)**2'] = B['x_i - |x']**2
B['(x_i - |x)**2 * f_i'] =B['(x_i - |x)**2'] *B['도수(f_i)']
B
a =  pd.DataFrame(B[:].sum(axis=0))
# a.transpose()
a = a.transpose()
a[['계급값(x_i)', 'x_i - |x' , '(x_i - |x)**2', 'f_i_x_i'] ] = '-'
a
a.index = ['합계']
a

==> INDEX 값 재설정 

 

B = pd.concat([B , a])
B

==> 밑에 집어넣기

 

C = pd.DataFrame({'계급간격' : ['0.5~4.5' , '4.5~8.5' , '8.5~12.5' , '12.5~16.5' , '16.5~20.5' , '20.5~24.5', '24.5~28.5', '28.5~32.5'] ,'도수(f_i)' : [25,55,60,90,115,85,50,20] , '계급값(x_i)' : [2.5,6.5,10.5,14.5,18.5,22.5,26.5,30.5]} )
C= C.set_index('계급간격')
C
C['f_i_x_i'] = C['도수(f_i)'] * C['계급값(x_i)']
print(sum(C['f_i_x_i']))
C['x_i - |x'] = C['계급값(x_i)'] - (sum(C['f_i_x_i'])/sum(C['도수(f_i)']))
C['(x_i - |x)**2'] = (C['x_i - |x']**2)
C['(x_i - |x)**2 * f_i'] = (C['(x_i - |x)**2'] *C['도수(f_i)'])
C

그룹화 자료형 DF

var = (C.iloc[-1,-1] / C.iloc[-1,0])
std = math.sqrt(var)

print("분산 : {} 표본표준편차 : {}".format( var ,  std))

분산 : 50.694399999999995 표본표준편차 : 7.119999999999999

 

표본평균 |X : sum(f_i_x_i) / sum(도수 합)

 

표본평균 구하기

 

표본표준편차 s**2 : sum((x_i - |x)**2) / (sum(도수 합) -1)

그룹화 자료의 분산

f_i :.

qf_i , x_i

 

 

https://knowallworld.tistory.com/214

 

★DDOF = 1★모/표본분산 , 모/표본표준편차★평균편차★기초통계학-[Chapter03 - 04]

산포의 척도 ==> 평균깊이가 1.2M인 강을 키가 1.7M인 사람이 걸어서 무사히 건널 수 있는지에 대해 생각 ==> 강의 평균 깊이가 1.2M 라는 뜻은 1.2M보다 작은 부분도 있지만 1.2M보다 깊은 곳도 있을 수

knowallworld.tistory.com

==>그룹화 자료의 분산은  표본 분산 구하는 공식에 도수를 곱한 값이다. 

 

EX)

그룹화 자료형의 분산(s**2) = 60/(30-1) = 2.0689

 

표본분산(s) = 1.4383

 

출처 :  [쉽게 배우는 생활속의 통계학]  [북스힐 , 이재원] 

※혼자 공부 정리용

728x90
반응형

+ Recent posts