★연속성 수정 근사확률★추측통계의 X+Y의 평균과 분산★정규분포★기초통계학-[Chapter06 - 연습문제-13]
19. 집에서 학교까지 평균 10분 , 표준편차 1.5분인 정규분포 ==> N (10 , 1.5**2)
1>집에서 학교까지 가는데 12분이상 걸릴 확률
P(X>=12) = P(Z>= (12 -10) / 1.5) = 1 - P(Z<=(12-10)/1.5)
b = scipy.stats.norm.cdf( (12-10) / 1.5)
b
b = scipy.stats.norm.cdf( (12-10) / 1.5)
print(1-b)
P(X>=12) = 0.091
2>집에서 학교까지 가는데 9분안에 도착할 확률
P(0<=X<=9) = P((0-10) / 1.5 <=Z<= (9 -10) / 1.5) = P(Z<= (9 -10) / 1.5)) - P(Z<=(0-10) / 1.5) =
b = scipy.stats.norm.cdf( -1 / 1.5)
print(b)
P(X<=9) = 0.2524
3>집에서 학교까지 가는데 7분이상 11분 안에 도착할 확률
P(7<=X<=11) = P((7-10) / 1.5 <=Z<= (11 -10) / 1.5) ) = P(Z<= (11 -10) / 1.5)) - P(Z<=(7-10) / 1.5) = 0.7247
b = scipy.stats.norm.cdf( 1 / 1.5) - scipy.stats.norm.cdf( (7-10) / 1.5)
print(b)
20. 성적이 X ~ N(70,16)인 정규분포, A,B,C,D,F를 15% , 30% , 30% , 15% , 10% 비율로 준다. A,B,C,D의 하한점수
A등급 : P(X>=x_A) = 1- P(X<=x_A) = 0.15
P(Z<= (x_A - 70) /4) = 0.85
b = scipy.stats.norm.ppf(0.85)
print(b)
x_A = 4* 1.036 + 70
= 74.144
b = 1- scipy.stats.norm.cdf(0.15)
print(b)
B등급 : P(X>=x_B) = 1 -P(X<=x_B) = 0.45
P(Z<= (x_B - 70) /4) = 0.55
b = scipy.stats.norm.ppf(0.55)
print(b)
x_B = 4* (0.1256) + 70
x = sympy.Symbol('x')
equation = (x -70) - (0.1256) *4
b = sympy.solve( equation)
print(b)
x_B 70.5024
C등급 : P(X>=x_C) = 1 -P(X<=x_C) = 0.75
P(Z<= (x_B - 70) /4) = 0.25
b = scipy.stats.norm.ppf(0.25)
print(b)
x_B = 4*(-0.6744) + 70
x = sympy.Symbol('x')
equation = (x -70) - (-0.6744) *4
b = sympy.solve( equation)
print(b)
x_C = 67.3024
D등급 : P(X>=x_D) = 1 -P(X<=x_D) = 0.9
P(Z<= (x_B - 70) /4) = 0.1
b = scipy.stats.norm.ppf(0.1)
print(b)
x_D = 4* (-1.28155) + 70
x = sympy.Symbol('x')
equation = (x -70) - (-1.28155) *4
b = sympy.solve( equation)
print(b)
x_D = 64.873
21. 고교 3학년 학생 1000명에게 실시한 모의고사에서 국어 X와 수학 Y는 각각 X ~ N(75 ,9) , Y ~ N(68,16) 인 정규분포를 따르고 , 두 성적은 독립
1> 국어점수 X가 82점 이상일 확률
b = 1- scipy.stats.norm.cdf(7/3)
print(b)
P(X>=82) = P (Z>= (82-75) / 3) = 1 - P(Z<=(7/3)) = 0.0098
2> 두과목의 점수의 합이 130점이상 , 150점 이하에 해당하는 학생수
X+Y ~ N (75+68 , 9+16) = N(143 , 25)
X-Y ~ N(75-68 , 9 +16)
https://knowallworld.tistory.com/255
==> 추측통계 기법 기억하자!!
P(130<= X+Y <=150) = P( (130-143) / 5 <= Z <= (150-143) /5 ) = P(-13/5 <=Z<= 7/5) = P(Z<= 7/5) - P(Z<= -13/5) = 0.9145
b = scipy.stats.norm.cdf(7/5) - scipy.stats.norm.cdf(-13/5)
print(b)
1000* 0.9145 = 914.5명
3> 각 과목에서 상위 5%안에 들기 위한 최소점수
P(X>=x_a) = 0.05
P(Z>= (x_a - 75) / 3) = 1- P( Z<= (x_a - 75) / 3) = 0.05
P( Z<= (x_a - 75) / 3) = 0.95
b = scipy.stats.norm.ppf(0.95)
print(b)
x_a = 3* 1.644 + 75
x = sympy.Symbol('x')
equation = (x -75) - (1.644) *3
b = sympy.solve( equation)
print(b)
x_a = 79.932
=================
P(Y>=y_a) = 0.05
P(Z>= (y_a - 68) / 4) = 1- P( Z<= (y_a - 68) / 4) = 0.05
P( Z<= (y_a - 68) / 4) = 0.95
b = scipy.stats.norm.ppf(0.95)
print(b)
y_a = 4* 1.644 + 68
x = sympy.Symbol('x')
equation = (x -68) - (1.644) *4
b = sympy.solve( equation)
print(b)
y_a = 74.576
22. X ~ B(20, 0.4)에 대하여 연속성을 수정한 근사확률 구하기. ==> 베르누이 시행
==>연속성 수정 +- 0.5
https://knowallworld.tistory.com/257
==> 연속성 수정 참고!
==> P(a<=X <= b) = P(a-0.5 <= X <= b +0.5)
X ~ N(20*0.4 , 20*0.4*0.6) = N(8 , 4.8)
1> P(X<= 10+0.5) = P(Z<= (10+0.5-8)/ 루트(4.8)) = 0.873
b = scipy.stats.norm.cdf((10-8+0.5)/math.sqrt(4.8))
print(b)
2> P(7<=X<= 11)
b = scipy.stats.norm.cdf((11-8+0.5)/math.sqrt(4.8)) - scipy.stats.norm.cdf((6-8+0.5)/math.sqrt(4.8))
print(b)
= P(6.5 <= X <= 11.5) = P(Z<= (11.5 -8)/루트(4.8)) - P(Z<= (6.5 - 8)/루트(4.8)) = 0.6981
3> P(X>= 15)
b = 1- scipy.stats.norm.cdf((14-8+0.5)/math.sqrt(4.8))
print(b)
= 1 - P(X<=14.5) = 1 - P(Z<= (14.5-8)/루트(4.8) ) = 0.0015
23.5지선다 문제 ==> 100문항
X ~ B(100 , 1/5)
==> X ~ N (20 , 16)
1> 선택한 평균 정답 수
20
2> 정답을 정확히 15개 선택할 근사확률
b = scipy.stats.norm.cdf((15-20+0.5)/4)-scipy.stats.norm.cdf((14-20+0.5)/4)
print(b)
P(X=15) = P(14.5 <= X<= 15.5) = P(X<=15.5) - P(X<=14.5) = P(Z <=(15.5 -20 / 4) ) - P(Z <=(14.5 -20 / 4) ) = 0.0457
3>25개 이하로 정답을 선택할 근사확률
b = scipy.stats.norm.cdf((5+0.5)/4)
print(b)
P(X<=25) = P(X<=25.5) = P(Z<= (25.5 -20) / 4 ) = 0.9154
출처 : [쉽게 배우는 생활속의 통계학] [북스힐 , 이재원]
※혼자 공부 정리용