AP Statistics/하루 10분 AP Stat.

하루에 10분씩 공부하는 AP Statistics - #44 오차 한계(Margin of Error)

고강사 2011. 5. 31. 18:06
반응형

하루에 10분씩 공부하는 AP Statistics - #44 오차한계(Margin of Error)

신뢰구간에서 통계량보다 많고 적은 값의 범위를 오차한계(margin of error)라고 한다.

예를 들어, 매일 운동하는 성인의 비율을 알아 본다고 하자. 이 경우 전체 경우의 90%(신뢰수준)가 표본 추정량이 모집단 참값과 5%(오차한계) 이상 차이가 발생하지 않도록 표본 설계를 해야한다.



▶ 오차한계의 계산(How to Compute the Margin of Error)

오차한계는 다음 두 식으로 정의된다.

오차한계(Margin of error) = 임계값(Critical value) x 통계량의 표준편차(Standard deviation of the statistic)
오차한계(Margin of error) = 임계값(Critical value) x 통계량의 표준오차(Standard error of the statistic)

만일 통계량의 표준편차를 알 수 있다면 오차한계는 첫번째 식을 이용해 구하고, 표준편차를 알 수 없다면 두번째 식을 이용해 구한다. 표준편차와 표준오차를 구하는 방법은 앞에서 살펴보았다.



▶ 임계값의 계산(How to Find the Critical Value)

임계값(critical value)은 오차한계를 구하는데 필요한 요소이다. 여기서는 통계량의 표집분포가 정규분포 혹은 정규분포에 가까운 분포일 경우에 임계값 계산 방법을 알아보자.

중심극한정리(central limit therorem)에 의해 다음 조건 중 하나가 만족되는 경우 통계량의 표집분포는 정규분포이거나 혹은 정규분포에 가까운 분포가 된다.

  • 모집단이 정규 분포인 경우
  • 대칭(symmetric)이고, 이상치(outlier)가 없는 일봉분포(unimodal)이며, 표본크기가 15이내인 표집분포
  • 한 쪽으로 약간 치우쳤지만(skewed), 이상치가 없는 일봉분포이며, 표본크기가 16~40인 표집분포
  • 이상치가 없고, 표본크기가 40보다 큰 표집분포

위 조건 중 하나가 만족되면, 임계값은 t 점수 또는 z 점수로 나타낼 수 있다. 임계값은 다음 단계에 따라 구한다.

  • 알파(α)의 계산 : α = 1 - (confidence level / 100)
  • 임계확률(critical probability; p*)의 계산 : p* = 1 - α/2
  • 임계값을 z 점수로 나타내는 경우 누적확률이 임계확률 (p*)과 같은 z 점수를 찾는다.
  • 임계값을 t 점수로 나타내는 경우 
    • 자유도(degree of freedom, DF)의 계산
      한 표본의 평균점수 또는 비율을 추정하는 경우 자유도는 '표본크기 - 1' 이다.
      자유도를 다른 방법으로 계산하는 방법은 각 경우에서 살펴보도록 하자.
    • 임계 t 점수(t*)는 주어진 자유도에서 누적확률이 임계확률(p*)과 같은 t 점수이다.


임계값을 언제 t 점수 또는 z 점수로 나타내야 하는가? 이 질문에 대한 답은 여러 가지가 있다. 하지만 실제적으로 표본의 크기가 크면(40이상) t 점수나 z 점수를 이용한 결과에는 별 차이가 없다. 엄밀히 말하자면 모집단 표준편차를 모르거나 표본의 크기가 작은 경우에는 t 점수를 사용해야 한다. 그러나 많은 통계학 입문 교재에서는 z 점수를 사용하기도 한다.

계산기 혹은 대부분 통계책에 부록으로 수록된 정규확률분포표나 t 확률분포표를 이용해 z 점수나 t 점수를 구할 수 있다.


확인하고 넘어가기

Problem 1

Nine hundred (900) high school freshmen were randomly selected for a national survey. Among survey participants, the mean grade-point average (GPA) was 2.7, and the standard deviation was 0.4. What is the margin of error, assuming a 95% confidence level?

(A) 0.013
(B) 0.025
(C) 0.500
(D) 1.960
(E) None of the above.





반응형