하루에 10분씩 공부하는 AP Statistics - #36 표준정규분포(Standard Normal Distribution)
하루에 10분씩 공부하는 AP Statistics - #36 표준정규분포(Standard Normal Distribution)
▶ 표준정규분포(Standard Normal Distribution)
표준정규분포(standard normal distribution)은 정규분포(normal distribution)에서 정규확률변수의 평균이 0이고, 표준편차가 1인 특별한 경우이다.
표준정규분포의 정규확률변수는 표준점수(standard score) 또는 z-점수(z-score)라고 부른다.
모든 정규확률변수 X는 다음 식을 이용해 z-점수로 변환할 수 있다.
z = (X - μ) / σ
X는 정규확률변수, μ는 X의 평균, σ는 X의 표준편차이다.
▶ 표준정규분포표(Standard Normal Distribution Table)
표준정규분포표(standard distribution table)은 특정 z-점수에 대한 누적확률을 나타낸 것이다. 표의 왼쪽 열에는 z-점수를 소수점 첫째자리까지 나타나 있고, 표의 첫 행에는 소수 둘째자리가 나타나 있다. 표의 각 값은 누적확률(-∞에서 z-점수까지)을 나타낸다.
아래 표준정규분포표 일부에서 z-점수가 -1.31일 때의 누적확률을 구해보자. 먼저, 왼쪽 열에서 -1.3 을 포함한 행을 찾고, 첫 행에서 0.01을 포함한 열을 찾아 두 행과 열이 만나는 곳의 값을 읽는다. 따라서, 표준정규확률변수가 -1.31보다 작을 확률은 0.0951 즉, P(Z < -1.31) = 0.0951 이다.
z | 0.00 | 0.01 | 0.02 | 0.03 | 0.04 | 0.05 | 0.06 | 0.07 | 0.08 | 0.09 |
-3.0 | 0.0013 | 0.0013 | 0.0013 | 0.0012 | 0.0012 | 0.0011 | 0.0011 | 0.0011 | 0.0010 | 0.0010 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
-1.4 | 0.0808 | 0.0793 | 0.0778 | 0.0764 | 0.0749 | 0.0735 | 0.0722 | 0.0708 | 0.0694 | 0.0681 |
-1.3 | 0.0968 | 0.0951 | 0.0934 | 0.0918 | 0.0901 | 0.0885 | 0.0869 | 0.0853 | 0.0838 | 0.0823 |
-1.2 | 0.1151 | 0.1131 | 0.1112 | 0.1093 | 0.1075 | 0.1056 | 0.1038 | 0.1020 | 0.1003 | 0.0985 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
3.0 | 0.9987 | 0.9987 | 0.9987 | 0.9988 | 0.9988 | 0.9989 | 0.9989 | 0.9989 | 0.9990 | 0.9990 |
물론, 표준정규확률변수가 -∞에서 특정값까지의 범위에 포함될 확률이 아니라, 특정값부터 +∞ 범위에 포함될 확률을 구할 수도 있다. 또, 표준정규확률변수가 특정한 두 값 사이에 포함될 확률도 구할 수 있다. 이것은 모두 위의 표준정규분포표를 활용하여 다음과 같이 구한다.
- P(Z > a) = 1 - P(Z < a).
예를 들어, z-점수가 3.00보다 클 확률을 구해보자. 위의 표에서 P(Z < 3.00) = 0.9987 이므로,
P(Z > 3.00) = 1 - P(Z < 3.00) = 1 - 0.9987 = 0.0013.
- P(a < Z < b) = P(Z < b) - P(Z < a).
예를 들어 z-점수가 -1.40보다 크고 -1.20보다 작을 확률을 구해보자.
위의 표에서 P(Z < -1.20) = 0.1151 이고, P(Z < -1.40) = 0.0808이므로,
P(-1.40 < Z < -1.20) = P(Z < -1.20) - P(Z < -1.40) = 0.1151 - 0.0808 = 0.0343.
AP Statistics 시험에서 문제를 풀기 위해 정규확률분포표를 읽고 값을 구해야 하는 경우가 있을 수 있다. 표준정규분포표는 대부분의 통계책에 부록으로 수록되어 있다.
▶ 측정 모형으로서의 정규분포(The Normal Distribution as a Model for Measurements)
실제 세상의 현상들은 종종 정규(혹은 이에 가까운)분포를 따른다. 이 사실은 실제 현상에 대한 확률을 구하기 위한 모형으로 정규분포를 사용할 수 있다는 것을 의미한다. 이 경우 다음 두 절차를 따르도록 한다.
- 원자료(raw data)의 변환
대부분의 원자료는 표준정규분포의 형태가 아니므로 표준정규분포로 변환하도록 한다.
변환방법은 앞서 설명한 식을 이용한다. z = (X - μ) / σ.
- 확률 계산
자료를 표준정규분포로 변환하면 표준정규분포표, 계산기 등을 이용해 z-점수에 해당하는 확률을 구한다.
확인하고 넘어가기
Problem1
Molly earned a score of 940 on a national achievement test. The mean test score was 850 with a standard deviation of 100. What proportion of students had a higher score than Molly? (Assume that test scores are normally distributed.)
(A) 0.10
(B) 0.18
(C) 0.50
(D) 0.82
(E) 0.90