하루에 10분씩 공부하는 AP Statistics - #42 추정(Estimation Problem)
추정(estimation)이란 표본에서 얻은 정보에 기초해 모집단에 대한 추론을 하는 과정이다.
▶ 점추정 vs. 구간추정(Point Estimate vs. Interval Estimate)
통계에서는 표본 통계량(sample statistics)을 이용해 모집단 모수(population parameters)를 추정한다. 예를 들어 표본 평균(sample means)은 모집단 평균(population means)을 추정하는데, 표본 비율(sample proportions)은 모집단 비율(population proportions)을 추정하는데 사용된다.
모집단 모수의 추정은 다음 두 가지가 있다.
- 점추정(Point estimate)
모집단 모수에 대한 점추정(point estimate)은 통계량의 한 값이다.
예를 들어 표본 평균 x 은 모집단 평균 μ 에 대한 점추정이다. 이와 유사하게 표본 비율 p 은 모집단 비율 P 에 대한 점추정이다.
- 구간추정(Interval estimate)
구간추정(interval estimate)은 모집단 모수가 존재할 구간의 양 끝값으로 정의된다.
예를 들어 a < x < b 이 모집단 평균 μ에 대한 구간추정이라고 할 때, 이것은 모집단 평균이 a 보다는 크지만, b 보다는 작다는 것을 말한다.
▶ 신뢰구간(Confidence Intervals)
신뢰구간(confidence intervals)은 특정 표집방법(sampling method)과 관련된 정밀도(precision)와 불확실성(uncertainty)을 나타낸다. 신뢰구간은 다음 세 부분으로 나타낸다.
- 신뢰수준(A confidence level)
- 통계량(A statistic)
- 오차한계(A margin of error)
신뢰수준(confidence level)은 표집방법의 불확실성을 나타낸다. 통계량(statistic)과 오차한계(margin of error)는 표집방법의 정밀도를 나타내는 구간추정을 말한다. 신뢰구간은 표본 통계량 + 오차한계 (sample statistic + margin of error) 로 정의한다.
특정 범위에 모집단 평균이 있을 신뢰도가 95% 라면, 이것은 신뢰구간을 의미한다. 즉, 각기 다른 표본을 동일한 표집방법으로 추출하고, 구간추정을 한다면 모집단 평균이 포함될 범위가 표본 통계량 + 오차한계 (sample statistic + margin of error) 로 정의되는 경우가 95% 라는 것이다.
신뢰구간은 (a) 추정의 정밀도 (b) 추정의 불확실성을 나타낸다는 점에서 점추정보다 선호된다.
▶ 신뢰수준(Confidence Level)
신뢰구간의 확률과 관련해 신뢰수준(confidence level)이 있다. 신뢰수준은 특정 표집방법에서 신뢰구간을 정할 때 모집단 모수의 참값을 포함할 확률을 의미한다.
신뢰수준은 다음과 같이 이해할 수 있다. 먼저, 많은 각기 다른 표본을 추출하고 각 표본에서 신뢰구간을 정한다. 어떤 신뢰구간은 모집단 모수 참값을 포함하고, 어떤 신뢰구간은 모집단 모수 참값을 포함하지 않는다. 95% 신뢰수준은 구간들 중 95%가 모집단 모수 참값을 포함한다는 것을 의미한다. 마찬가지로 90% 신뢰수준은 구간들 중 90%가 모집단 모수 참값을 포함한다는 것을 의미한다.
▶ 오차의 한계(Margin of Error)
신뢰구간에서 통계량보다 많고 적은 범위를 오차한계(margin of error)라고 한다.
예를 들어 지역 신문에서 선거 여론조사를 실시하고 한 후보가 30%의 지지율이라고 할 때, 신뢰수준 95%에서 5% 오차한계가 있다고 언급한다. 이 때, 이 신뢰구간은 후보의 지지율이 25%에서 30% 사이일 것으로 95% 확신하는 것이다.
주) 많은 여론 조사는 구간추정 값을 언급하지만 신뢰구간을 다루지는 않는다. 신뢰수준에 대한 언급 없이 오차한계 만을 말한다. 여론 조사 결과를 확실하게 이해하기 위해서는 신뢰수준과 오차한계 모두를 알아야 한다. 신뢰수준이 낮은 경우(50%)보다는 높은 경우(95%)일 때, 조사 결과를 더 쉽게 받아들일 수 있다.
확인하고 넘어가기
Problem1
Which of the following statements is true.
I. When the margin of error is small, the confidence level is high.
II. When the margin of error is small, the confidence level is low.
III. A confidence interval is a type of point estimate.
IV. A population mean is an example of a point estimate.
(A) I only
(B) II only
(C) III only
(D) IV only.
(E) None of the above.
'AP Statistics > 하루 10분 AP Stat.' 카테고리의 다른 글
하루에 10분씩 공부하는 AP Statistics - #44 오차 한계(Margin of Error) (0) | 2011.05.31 |
---|---|
하루에 10분씩 공부하는 AP Statistics - #43 표준오차(Standard Error) (0) | 2011.05.31 |
하루에 10분씩 공부하는 AP Statistics - #41 두 평균의 차(Difference Between Means) (0) | 2011.05.31 |
하루에 10분씩 공부하는 AP Statistics - #40 두 비율의 차(Difference Between Proportions) (0) | 2011.05.31 |