하루에 10분씩 공부하는 AP Statistics - #48 모집단 평균 추정(Estimating the Population Mean)

하루에 10분씩 공부하는 AP Statistics - #48 모집단 평균 추정(Estimating the Population Mean)

여기서는 표본 평균 x 에 대한 신뢰구간을 어떻게 정하는지 알아보자.

▶ 추정 조건(Estimation Requirements)

모집단 평균을 추정하기 위해서는 다음 조건이 만족되어야 한다.

표본 추출 방법은 단순임의표집(simple random sampling)
표집분포는 근사적으로 정규분포

일반적으로 표집분포는 다음 조건 중 하나가 만족되면 근사적으로 정규분포임이 알려져 있다.

모집단이 정규 분포인 경우
대칭(symmetric)이고, 이상치(outlier)가 없는 일봉분포(unimodal)이며, 표본크기가 15이내인 표집분포
한 쪽으로 약간 치우쳤지만(skewed), 이상치가 없는 일봉분포이며, 표본크기가 16~40인 표집분포
이상치가 없고, 표본크기가 40보다 큰 표집분포

▶ 표본 평균의 변동성(The Variability of the Sample Mean)

표본 평균의 신뢰구간을 정하기 위해서 표본 평균의 변동성을 알아야 한다. 즉, 표집분포의 표준편차나 표준오차를 알아야 한다.

모집단에서 크기가 n인 표본 k개를 추출했다고 하자. 표집분포의 표준편차는 모집단 평균의 참값 μ와 k개 표본 평균간에 "평균" 편차이다. 표본 평균의 표준편차 σ_x 는 다음식으로 구한다.
σ_x = σ * sqrt{ ( 1/n ) * ( 1 - n/N ) * [ N / ( N - 1 ) ] }
여기서 σ 는 모집단 표준편차, N은 모집단 크기, n은 표본의 크기이다. 모집단의 크기가 표본의 크기보다 훨씬 크다면 (적어도 10배 이상) 표준편차는 다음 식에 의해 근사된다.
σ_x = σ / sqrt( n )
모집단 표준편차 σ가 알려져 있지 않다면 표집분포의 표준편차를 계산할 수 없다. 이런 경우에는 표준오차를 사용한다. 표준오차(SE)는 표준편차의 불편추정량(unbiased estimate)이고, 다음 식에 의해 계산한다.
SE_x = s * sqrt{ ( 1/n ) * ( 1 - n/N ) * [ N / ( N - 1 ) ] }
여기서 s는 표본 표준편차, N은 모집단의 크기, n은 표본의 크기이다. 모집단의 크기가 표본의 크기보다 훨씬 크다면 (적어도 10배 이상) 표준오차는 다음 식에 의해 근사된다.
SE_x = s / sqrt( n )

주) 현실적으로 모집단의 표준편차가 알려진 경우는 거의 없다. 따라서, 표준오차가 표준편차보다 더 자주 사용된다.

▶ 평균의 신뢰구간 설정(How to Find the Confidence Interval for a Mean)

앞서 신뢰구간을 정하는 법을 살펴보았다. 다시 한 번 요약하면 아래와 같다.

표본 통계량을 구한다.
표본 평균을 모집단 평균을 추정하기 위해 사용한다.
신뢰수준을 정한다.
신뢰수준은 표집방법의 불확실성을 나타낸다. 보통 90%, 95%, 99% 신뢰수준을 많이 사용하고, 다른 신뢰수준도 사용할 수 있다.
오차한계를 구한다.
앞서 오차한계를 계산하는 법을 살펴보았다.
신뢰구간을 정한다.
신뢰구간은 표본통계량 + 오차한계(sample statistic + margin of error)로 구하고, 불확실성은 신뢰수준으로 나타낸다.

다음 문제를 통해 평균에 대한 신뢰구간을 어떻게 구하는지 살펴보도록 하자.

확인하고 넘어가기

Problem 1

Suppose a simple random sample of 150 students is drawn from a population of 3000 college students. Among sampled students, the average IQ score is 115 with a standard deviation of 10. What is the 99% confidence interval for the students' IQ score?

(A) 115 + 0.01
(B) 115 + 0.82
(C) 115 + 2.1
(D) 115 + 2.6
(E) None of the above

정답은 (C).

이 문제를 올바르게 풀기 위해서는 다음 조건이 만족되어야 한다.

표집방법은 단순임의표집(simple random sampling)이어야 한다.
문제에서 단순임의표집 한다고 하였기 때문에 이 조건은 만족되었다.
표집분포가 근사적으로 정규분포여야 한다.
표본크기가 크기 때문에 중심극한정리에서 평균의 표집분포가 정규분포이거나 근사적으로 정규분포임을 알 수 있다. 따라서 이 조건은 만족되었다.

위의 조건들이 만족되므로 다음 4단계에 걸쳐 신뢰구간을 구할 수 있다.

표본통계량을 구한다.
모집단 평균을 추정하기 위해 표본 평균(115)을 표본 통계량으로 정한다.I
신뢰수준을 정한다.
이 문제에서 요구하는 99% 신뢰수준을 사용한다.
오차한계를 구한다.
앞에서 표집분포가 정규분포에 가까운 경우의 오차한계 계산법을 소개했다. 주요 단계는 다음과 같다.
- 표준편차 또는 표준오차를 구한다.
  모집단 표준편차를 알지 못하므로 표본 평균의 표준편차를 계산할 수 없다. 따라서, 표준 오차를 계산하도록 한다. 모집단이 표본보다 10배 이상 크기 때문에 비율의 표준오차(SE)를 구하기 위해 아래 식을 사용할 수 있다.
  SE = s / sqrt( n ) = 10 / sqrt(150) = 10 / 12.25 = 0.82
- 임계값을 구한다.
  임계값은 오차한계를 계산하기 위해 필요하다. 모집단의 표준편차를 모르기 때문에 임계값을 z 점수 대신 t 점수로 나타내도록 한다.
  - 알파를 계산한다. (α): α = 1 - (confidence level / 100) = 1 - (99/100) = 0.01
  - 임계 확률을 구한다. (p*): p* = 1 - α/2 = 1 - 0.01/2 = 0.995
  - 임계값은 자유도가 149이고, 누적확률이 0.995인 t 점수이다. 계산기 또는 t 확률분포표를 이용하면 임계값 2.61을 구할 수 있다.
  주) 표본의 크기가 충분히 크기 때문에 임계값을 z 점수로 나타낼 수도 있다.
  z 점수를 이용해도 비슷한 결과(임계값 2.58)를 얻을 수 있다.
- 오차한계(ME)를 구한다. : ME = critical value * standard error = 2.61 * 0.82 = 2.1
신뢰구간을 정한다.
신뢰구간은 표본통계량 + 오차한계(sample statistic + margin of error)으로 나타내고, 불확실성은 신뢰수준으로 나타낸다.

따라서 99% 신뢰구간은 112.9 이상 117.1 이하 이다. 즉, 모집단 평균의 참값이 115 + 2.1 범위에 포함된다고 99% 신뢰할 수 있다.

'AP Statistics > 하루 10분 AP Stat.' 카테고리의 다른 글

하루에 10분씩 공부하는 AP Statistics - #50 대응짝 자료의 평균 차이(Mean Difference Between Matched Data Pairs) (0)	2011.05.31
하루에 10분씩 공부하는 AP Statistics - #49 평균 차이(Difference Between Means) (0)	2011.05.31
하루에 10분씩 공부하는 AP Statistics - #47 비율 차이(Difference Between Proportions) (0)	2011.05.31
하루에 10분씩 공부하는 AP Statistics - #46 비율의 추정(Estimating a Proportion) (0)	2011.05.31

AP Calculus / AP Statistics / SAT I, II Math

하루에 10분씩 공부하는 AP Statistics - #48 모집단 평균 추정(Estimating the Population Mean)

'AP Statistics > 하루 10분 AP Stat.' 카테고리의 다른 글

티스토리툴바

하루에 10분씩 공부하는 AP Statistics - #48 모집단 평균 추정(Estimating the Population Mean)

'AP Statistics > 하루 10분 AP Stat.' 카테고리의 다른 글

'AP Statistics/하루 10분 AP Stat.' Related Articles

티스토리툴바