본문 바로가기

AP Statistics/하루 10분 AP Stat.

하루에 10분씩 공부하는 AP Statistics - #48 모집단 평균 추정(Estimating the Population Mean)

반응형

하루에 10분씩 공부하는 AP Statistics - #48 모집단 평균 추정(Estimating the Population Mean)


여기서는 표본 평균 x 에 대한 신뢰구간을 어떻게 정하는지 알아보자.



▶ 추정 조건(Estimation Requirements)

모집단 평균을 추정하기 위해서는 다음 조건이 만족되어야 한다.
  • 표본 추출 방법은 단순임의표집(simple random sampling)
  • 표집분포는 근사적으로 정규분포

일반적으로 표집분포는 다음 조건 중 하나가 만족되면 근사적으로 정규분포임이 알려져 있다.

  • 모집단이 정규 분포인 경우
  • 대칭(symmetric)이고, 이상치(outlier)가 없는 일봉분포(unimodal)이며, 표본크기가 15이내인 표집분포
  • 한 쪽으로 약간 치우쳤지만(skewed), 이상치가 없는 일봉분포이며, 표본크기가 16~40인 표집분포
  • 이상치가 없고, 표본크기가 40보다 큰 표집분포




▶ 표본 평균의 변동성(The Variability of the Sample Mean)

표본 평균의 신뢰구간을 정하기 위해서 표본 평균의 변동성을 알아야 한다. 즉, 표집분포의 표준편차나 표준오차를 알아야 한다.

  • 모집단에서 크기가 n인 표본 k개를 추출했다고 하자. 표집분포의 표준편차는 모집단 평균의 참값 μ와 k개 표본 평균간에 "평균" 편차이다. 표본 평균의 표준편차 σx 는 다음식으로 구한다. 

    σx = σ * sqrt{ ( 1/n ) * ( 1 - n/N ) * [ N / ( N - 1 ) ] }

    여기서 σ 는 모집단 표준편차, N은 모집단 크기, n은 표본의 크기이다. 모집단의 크기가 표본의 크기보다 훨씬 크다면 (적어도 10배 이상) 표준편차는 다음 식에 의해 근사된다.  

    σx = σ / sqrt( n )

  • 모집단 표준편차 σ가 알려져 있지 않다면 표집분포의 표준편차를 계산할 수 없다. 이런 경우에는 표준오차를 사용한다. 표준오차(SE)는 표준편차의 불편추정량(unbiased estimate)이고, 다음 식에 의해 계산한다. 

    SEx = s * sqrt{ ( 1/n ) * ( 1 - n/N ) * [ N / ( N - 1 ) ] }

    여기서 s는 표본 표준편차, N은 모집단의 크기, n은 표본의 크기이다. 모집단의 크기가 표본의 크기보다 훨씬 크다면 (적어도 10배 이상) 표준오차는 다음 식에 의해 근사된다.  

    SEx = s / sqrt( n )

주) 현실적으로 모집단의 표준편차가 알려진 경우는 거의 없다. 따라서, 표준오차가 표준편차보다 더 자주 사용된다.



▶ 평균의 신뢰구간 설정(How to Find the Confidence Interval for a Mean)

앞서 신뢰구간을 정하는 법을 살펴보았다. 다시 한 번 요약하면 아래와 같다.

  • 표본 통계량을 구한다.
    표본 평균을 모집단 평균을 추정하기 위해 사용한다.

  • 신뢰수준을 정한다.
    신뢰수준은 표집방법의 불확실성을 나타낸다. 보통 90%, 95%, 99% 신뢰수준을 많이 사용하고, 다른 신뢰수준도 사용할 수 있다.

  • 오차한계를 구한다.
    앞서 오차한계를 계산하는 법을 살펴보았다.

  • 신뢰구간을 정한다.
    신뢰구간은 표본통계량 + 오차한계(sample statistic + margin of error)로 구하고, 불확실성은 신뢰수준으로 나타낸다. 

다음 문제를 통해 평균에 대한 신뢰구간을 어떻게 구하는지 살펴보도록 하자.


확인하고 넘어가기

Problem 1

Suppose a simple random sample of 150 students is drawn from a population of 3000 college students. Among sampled students, the average IQ score is 115 with a standard deviation of 10. What is the 99% confidence interval for the students' IQ score?

(A) 115 + 0.01
(B) 115 + 0.82
(C) 115 + 2.1
(D) 115 + 2.6
(E) None of the above


반응형