본문 바로가기

AP Statistics/하루 10분 AP Stat.

하루에 10분씩 공부하는 AP Statistics - #21 표본추출 방법(Sampling Methods)

반응형

하루에 10분씩 공부하는 AP Statistics - #21 표본추출 방법(Sampling Methods)

표본추출 방법(sampling method)이란 모집단(population)에서 표본조사(sample survey)를 위해 표본(sample)에 포함되어야 할 관측값을 선택하는 방법이다.



▶ 모집단 모수 vs. 표본 통계량(Population Parameter vs. Sample Statistic)

표본조사를 하는 목적은 모집단의 속성을 추정하기 위해서이다.

   - 모집단 모수(population parameter)
      모집단 모수는 모집단의 참 속성값이다.    

   - 표본 통계량(sample statistic)
       표본 통계량이란 모집단의 모수를 표본 자료에 근거하여 추정한 값이다.

예를 들어, 여론 조사원이 소득세의 일률과세를 찬성하는 유권자의 비율을 조사한다고 하자. 모든 유권자 중 찬성하는 "실제" 비율이 모집단 모수이다. 표본 자료에 근거해 "추정"한 비율은 표본 통계량이다.

표본통계량의 특성(예; 정확도, 정밀도, 대표성)은 표본 관측값이 선택된 방법 즉, 표본추출 방법에 따라 큰 영향을 받는다.



▶  확률 vs. 비확률 표본(Probability vs. Non-Probability Samples)

표본추출 방법은 크게 두 가지로 구분할 수 있다.

   - 확률 표본(Probability samples)
      확률 표본추출 방법은 모집단의 각 원소가 표본으로 선택될 확률이 일정하다(0이 아님).

   - 비확률 표본(Non-probability samples)
      비확률 표본추출 방법은 모집단의 각 원소가 추출될 확률을 알지 못한다.
      또는 모집단의 각 원소가 0이 아닌 확률로 선택될지 여부가 불확실하다.

비확률 표본추출 방법은 편리성과 비용면에서 두 가지 장점이 있다. 비확률 표본추출 방법은 표본 통계량이 모집단 모수와 얼마나 차이가 있을지 추정할 수 없다는 단점이 있다. 오직 확률 표본추출 방법에서만 이와 같은 분석이 가능하다.



▶ 비확률 표본추출 방법(Non-Probability Sampling Methods)

비확률 표본추출 방법의 두 가지 주요한 형태는 자발적 표본과 편의 표본이다.

   - 자발적 표본(Voluntary sample)
      자발적 표본은 조사에 스스로 지원한 사람들로 구성된다.  
      이러한 사람들은 종종 조사의 주요 주제에 대해 강한 흥미를 가지고 있는 경우가 많다.

      예를 들어 뉴스쇼에서 시청자를 대상으로 온라인 투표를 하라고 요청하는 경우를 생각해 보자.
      이 경우, 표본은 조사기관이 아닌 시청자 스스로의 참여로 구성되므로, 자발적 표본이다.


    - 편의 표본(Conveneince sample)
       편의 표본은 쉽게 구할 수 있는 사람들로 구성된다.

       여론 조사원이 어떤 지역의 쇼핑객들을 인터뷰한다고 하는 경우를 가정해 보자.
       만일 조사원의 집이나 회사에서 가깝기 때문에 조사 참가자를 구하기 쉽다는 이유로 쇼핑몰을 선택했다면
       이것은 편의 표본이다.



▶ 확률표본 추출방법(Probability Sampling Methods)

주요 확률표본 추출방법으로는 임의추출(random sampling), 층별표집(stratified sampling), 군집표집(cluster sampling), 다단표집(multistage sampling), 계통표집(systematic sampling) 방법이 있다. 확률표본 추출방법의 중요한 장점은 선택된 표본이 모집단을 대표할 수 있다는 것이다. 이것은 통계적 결론이 올바르다는 것을 보증한다.

   - 단순 임의추출(simple random sampling)
      단순 임의추출 방법은 다음 특성을 가지는 추출 방법을 말한다.

       · 모집단은 N개의 객체(object)로 구성된다.
       · 표본은 n개의 객체로 구성된다.
       · n개 객체의 표본이 선택될 확률은 동일하다

     단순 임의추출 방법은 여러 가지가 있다.
     한 가지 방법은 제비뽑기 방법이다. 모집단의 N개 객체 각각에 고유한 번호를 부여하고, 각 숫자를 상자에
     넣고 잘 섞는다. 그리고 눈가리개를 한 실험자가 n개의 숫자를 뽑고, 뽑힌 숫자에 해당하는 모집단 객체를
     표본에 포함시킨다.


   - 층별표집(Stratified sampling)
      층별표집방법은 모집단을 특성에 따라 각 그룹으로 구분한 후에 각 그룹 내에서
      확률표본(주로 단순 임의추출)을 구한다. 층별표집에서 각 그룹은 층(strata)이라고 한다.

      층별표집 방법의 예를 들어보자. 국가 조사를 한다고 할 때, 지역(동,서,남,북)에 따라 모집단을
      그룹 또는 층으로 구분한다. 그 후에 각 층들에서 조사 응답자를 임의로 선택하는 경우를 들 수 있다.


   - 군집표집(Cluster sampling)
      군집표집에서는 모집단의 각 개체가 단 하나의 그룹에 할당된다. 각 그룹은 군집(cluster)이라고 부른다.
      이 때, 각 군집을 확률표본(주로 단순 임의추출)방법으로 선택하고, 선택된 군집의 객체들만 조사를 한다.

      층별표집에서는 각 층들(stratum)에서 선택된 객체가 표본에 포함되지만,
      군집표집에서는 선택된 군집의 객체만 포함한다는 점에서 차이가 있다.


   - 다단표집(Multistage sampling)
      다단표집에서는 서로 다른 표본추출 방법을 조합하여 표본을 선택한다.
 
      예를 들어, 1단계에서 모집단에서 군집표집방법을 이용해 군집을 선택한다. 2단계로 선택된 각 군집에서
      단순 임의추출 방법을 이용해 객체를 선택해 최종 표본으로 사용한다면 다단표집이다.


   - 계통표집(Systematic sampling)
      계통표집에서는 모집단의 각 객체에 대한 목록을 만든다. 모집단 목록에서 처음 k개의 객체 중
      첫번째 표본을 임의로 선택하고, 이후에는 목록에서 매 k번째 객체를 선택한다.

      이 방법은 표본의 n개 객체가 선택될 확률이 동일하지 않다는 점에서 임의추출방법과 구분된다.



확인하고 넘어가기
Problem1

An auto analyst is conducting a satisfaction survey, sampling from a list of 10,000 new car buyers. The list includes 2,500 Ford buyers, 2,500 GM buyers, 2,500 Honda buyers, and 2,500 Toyota buyers. The analyst selects a sample of 400 car buyers, by randomly sampling 100 buyers of each brand.

Is this an example of a simple random sample?

(A) Yes, because each buyer in the sample was randomly sampled.
(B) Yes, because each buyer in the sample had an equal chance of being sampled.
(C) Yes, because car buyers of every brand were equally represented in the sample.
(D) No, because every possible 400-buyer sample did not have an equal chance of being chosen.
(E) No, because the population consisted of purchasers of four different brands of car.




반응형