하루에 10분씩 공부하는 AP Statistics - #48 모집단 평균 추정(Estimating the Population Mean)
여기서는 표본 평균 x 에 대한 신뢰구간을 어떻게 정하는지 알아보자.
▶ 추정 조건(Estimation Requirements)
모집단 평균을 추정하기 위해서는 다음 조건이 만족되어야 한다.
- 표본 추출 방법은 단순임의표집(simple random sampling)
- 표집분포는 근사적으로 정규분포
일반적으로 표집분포는 다음 조건 중 하나가 만족되면 근사적으로 정규분포임이 알려져 있다.
- 모집단이 정규 분포인 경우
- 대칭(symmetric)이고, 이상치(outlier)가 없는 일봉분포(unimodal)이며, 표본크기가 15이내인 표집분포
- 한 쪽으로 약간 치우쳤지만(skewed), 이상치가 없는 일봉분포이며, 표본크기가 16~40인 표집분포
- 이상치가 없고, 표본크기가 40보다 큰 표집분포
▶ 표본 평균의 변동성(The Variability of the Sample Mean)
표본 평균의 신뢰구간을 정하기 위해서 표본 평균의 변동성을 알아야 한다. 즉, 표집분포의 표준편차나 표준오차를 알아야 한다.
- 모집단에서 크기가 n인 표본 k개를 추출했다고 하자. 표집분포의 표준편차는 모집단 평균의 참값 μ와 k개 표본 평균간에 "평균" 편차이다. 표본 평균의 표준편차 σx 는 다음식으로 구한다.
σx = σ * sqrt{ ( 1/n ) * ( 1 - n/N ) * [ N / ( N - 1 ) ] }
여기서 σ 는 모집단 표준편차, N은 모집단 크기, n은 표본의 크기이다. 모집단의 크기가 표본의 크기보다 훨씬 크다면 (적어도 10배 이상) 표준편차는 다음 식에 의해 근사된다.σx = σ / sqrt( n )
- 모집단 표준편차 σ가 알려져 있지 않다면 표집분포의 표준편차를 계산할 수 없다. 이런 경우에는 표준오차를 사용한다. 표준오차(SE)는 표준편차의 불편추정량(unbiased estimate)이고, 다음 식에 의해 계산한다.
SEx = s * sqrt{ ( 1/n ) * ( 1 - n/N ) * [ N / ( N - 1 ) ] }
여기서 s는 표본 표준편차, N은 모집단의 크기, n은 표본의 크기이다. 모집단의 크기가 표본의 크기보다 훨씬 크다면 (적어도 10배 이상) 표준오차는 다음 식에 의해 근사된다.SEx = s / sqrt( n )
주) 현실적으로 모집단의 표준편차가 알려진 경우는 거의 없다. 따라서, 표준오차가 표준편차보다 더 자주 사용된다.
▶ 평균의 신뢰구간 설정(How to Find the Confidence Interval for a Mean)
앞서 신뢰구간을 정하는 법을 살펴보았다. 다시 한 번 요약하면 아래와 같다.
- 표본 통계량을 구한다.
표본 평균을 모집단 평균을 추정하기 위해 사용한다.
- 신뢰수준을 정한다.
신뢰수준은 표집방법의 불확실성을 나타낸다. 보통 90%, 95%, 99% 신뢰수준을 많이 사용하고, 다른 신뢰수준도 사용할 수 있다.
- 오차한계를 구한다.
앞서 오차한계를 계산하는 법을 살펴보았다.
- 신뢰구간을 정한다.
신뢰구간은 표본통계량 + 오차한계(sample statistic + margin of error)로 구하고, 불확실성은 신뢰수준으로 나타낸다.
다음 문제를 통해 평균에 대한 신뢰구간을 어떻게 구하는지 살펴보도록 하자.
확인하고 넘어가기
Problem 1
Suppose a simple random sample of 150 students is drawn from a population of 3000 college students. Among sampled students, the average IQ score is 115 with a standard deviation of 10. What is the 99% confidence interval for the students' IQ score?
(A) 115 + 0.01
(B) 115 + 0.82
(C) 115 + 2.1
(D) 115 + 2.6
(E) None of the above