본문 바로가기

AP Statistics/하루 10분 AP Stat.

하루에 10분씩 공부하는 AP Statistics - #40 두 비율의 차(Difference Between Proportions)

반응형

하루에 10분씩 공부하는 AP Statistics - #40 두 비율의 차(Difference Between Proportions)


▶ 두 비율의 차(Difference Between Proportions: Theory)

비율이 각각 P1, P2 인 두 모집단에서 크기가 각각 n1, n2 인 표본을 모두 추출하자. 그리고, 다음 가정이 성립한다고 하자.

  • 각 모집단의 크기는 모집단에서 추출한 표본의 크기보다 상대적으로 크다.
    즉, N1은 n1보다 크고, N2는 n2보다 크다.
    (이 경우 모집단의 크기는 표본의 크기보다 적어도 10배 이상인 것으로 간주한다)

  • 각 모집단에서 추출한 표본은 비율 차이를 모형화 하는데 정규분포를 사용할 정도로 크다.
    다음 조건이 만족되면 표본의 크기는 충분히 크다.
    n1P1 > 10 이고 n1(1 -P1) > 10, 또, n2P2 > 10 이고 n2(1 - P2) > 10

  • 표본은 서로 독립이다.
    즉, 모집단 1의 관측값은 모집단 2의 관측값에 영향을 미치지 않으며, 반대 경우도 마찬가지이다.

위의 가정이 성립한다면, 다음과 같은 성질을 갖는다.

  • 중심극한정리(central limit therorm)에 의해 표본 비율 차이는 정규분포를 따른다. 

  • 모든 가능한 표본 비율 차이의 기대값(expected value)은 모집단 비율 차이와 같다.
    즉, E(p1 - p2) = P1 - P2

  • 표본 비율 차이의 표준편차(σd)는 근사적으로 다음과 같다.

σd = sqrt{ [P1(1 - P1) / n1] + [P2(1 - P2) / n2] }


마지막 공식을 증명해 보자. 두 독립 확률변수 차의 분산은 각각의 분산의 합과 같다. 즉,

σ2d = σ2P1 - P2 = σ21 + σ22

모집단의 크기 N1과 N2가 n1과 n2보다 상대적으로 크다면,

σ21 = P1(1 - P1) / n1       이고       σ22 = P2(1 - P2) / n2

따라서,

σ2d = [ P1(1 - P1) / n1 ] + [ P2(1 - P2) / n2 ]  이고  σd = sqrt{ [ P1(1 - P1) / n1 ] + [ P2(1 - P2) / n2 ] }




▶ 두 비율의 차 예제(Difference Between Proportions: Sample Problem)

여기서는 위의 설명한 내용을 어떻게 적용하는지 예제를 통해 살펴보자. 앞에 다룬 내용은 두 독립 표본 비율 차이를 다루는 경우에 적용할 수 있다. 예제에서는 비율 차이를  정규분포를 이용해 모형화 했다.


예제1

In one state, 52% of the voters are Republicans, and 48% are Democrats. In a second state, 47% of the voters are Republicans, and 53% are Democrats. Suppose 100 voters are surveyed from each state. Assume the survey uses simple random sampling.

What is the probability that the survey will show a greater percentage of Republican voters in the second state than in the first state?

(A) 0.04
(B) 0.05
(C) 0.24
(D) 0.71
(E) 0.76






반응형