AP Statistics/하루 10분 AP Stat.

하루에 10분씩 공부하는 AP Statistics - #34 음이항분포와 기하분포(Negative Binomial and Geometric Distributions)

고강사 2011. 5. 31. 18:01
반응형

하루에 10분씩 공부하는 AP Statistics - #34 음이항분포와 기하분포(Negative Binomial and Geometric Distributions)


여기서는 음이항분포(negative binomial distribution)와 음이항분포의 특별한 경우인 기하분포(geometric distribution)에 대해 알아보자.



▶ 음이항실험(Negative Binomial Experiment)

음이항실험이란, 다음과 같은 속성을 가지는 통계 실험을 말한다.
  • x 회의 반복되는 시행으로 구성된 실험이다. 
  • 각 시행은 성공과 실패로 구분되는 두 가지 결과를 갖는다.
  • 성공확률은 P로 나타내고 모든 시행에서 동일하다. 
  • 독립시행이다. 즉, 한 시행의 결과가 다른 시행 결과에 영향을 미치지 않는다. 
  • 실험은 미리 정한 r 번의 성공이 나타날 때까지 계속한다. 

동전을 반복해서 던지고 동전의 앞면이 나온 회수를 세는 통계 실험을 생각해보자. 동전의 앞면이 5회 나올 때까지 동전을 계속 던진다면, 이 실험은 다음과 같은 이유에서 음이항실험이다.

  • 실험은 반복되는 시행으로 구성되어 있다. - 동전의 앞면이 5회 나올 때까지 반복해서 동전을 던짐
  • 각 시행은 두 가지 결과를 갖는다. - 동전의 앞면과 뒷면
  • 성공 확률은 일정하다. - 매 시행마다 0.5
  • 독립시행이다. - 한 시행에서 앞면이 나오는 것은 다른 시행에서 앞면이 나오는 것에 영향을 주지 않는다.
  • 특정한 수의 성공회수가 나올 때까지 실험을 계속한다. - 이 경우 앞면이 5번 나올 때까지



▶ 기호(Notation)

다음은 음이항확률(negative binomial probability)을 말할 때 유용한 기호이다.

  • x : 음이항실험에서 성공회수가 r 이 될 때까지 반복 시행하는 회수
  • r : 음이항실험의 성공회수
  • P : 각 시행의 성공확률
  • Q : 각 시행의 실패 확률 (Q = 1 - P)
  • b*(x; r, P) : 음이항실험에서 각 시행의 성공확률이 P일 때, x번째 시행에서 r번째 성공할 확률
  • nCr : n개에서 r개를 뽑는 경우의 수




▶ 음이항분포(Negative Binomial Distribution)

음이항확률변수(negative binomial random variable)란 음이항실험에서 성공회수가 r이 될 때까지 시행을 반복하는 회수 X를 값으로 가지는 확률변수이다. 음이항분포의 확률분포를 음이항분포(negative binomial distribution) 또는 파스칼분포(pascal distribution)라고 한다.

동전을 반복해서 던지고 앞면(성공)의 수를 센다고 가정하자. 만일 동전을 앞면이 2회 나올 때까지 던진다면 음이항실험을 한 것이고, 음이항확률변수는 동전의 앞면이 2회 나올 때 까지 반복해서 동전을 던진 회수이다. 이 경우 동전을 던진 회수는 2부터 무한대까지의 값을 갖는 확률변수이고, 음이항확률분포는 다음과 같이 나타낼 수 있다.

Number of coin flips Probability
2 0.25
3 0.25
4 0.1875
5 0.125
6 0.078125
7 or more 0.109375




▶ 음이항확률(Negative Binomial Probability)

음이항확률(negative binomial probability)은 x-1번의 실험에서 r-1번의 성공을 하고, x번째 성공을 하는 음이항실험의 확률이다. 예를 들어 위의 표에서 6번째 실험에서 2번째 앞면이 나오는 음이항확률은 0.078125이다.

주어진 x, r, P에 대해 다음 공식을 이용해 음이항확률을 계산할 수 있다.


 음이항공식(Negative Binomial Formula)

 x번째 시행에서 r번째 성공을 하는 음이항실험이 있다고 하자.
 이 때, 각 시행의 성공확률을 P라고 하면 음이항확률은 다음과 같다.

b*(x; r, P) = x-1Cr-1 * Pr * (1 - P)x - r


음이항분포는 다음과 같은 특성을 갖는다.

  • 분포의 평균 μ = rQ / P .
  • 분산 σ2 = rQ / P2 .




▶ 기하분포(Geometric Distribution)

기하분포(geometric distribution)는 음이항분포의 특별한 경우이다. 기하분포는 첫번째 성공을 할 때까지 필요한 시행회수를 나타낸다. 즉, 음이항분포에서 성공회수(r)가 1인 경우이다.

기하분포의 예는 동전의 앞면이 나올 때까지 동전을 던지는 실험을 들 수 있다. 세 번째 시행에서 동전의 앞면이 처음으로 나올 확률은 얼마인가? 이 확률은 g(x; P)로 나타내는 기하확률(geometric probability)로 구할 수 있다.


 기하확률공식(Geometric Probability Formula)

 x번째 시행에서 첫번째 성공을 하는 음이항실험이 있다고 하자.
 이 때, 각 시행의 성공확률을 P라고 하면, 기하확률은 다음과 같다.

g(x; P) = P * Qx - 1



기하분포는 다음과 같은 특성을 갖는다.

  • 분포의 평균 μ = Q / P .
  • 분산 σ2 = Q / P2 .




다음은 음이항분포(예제1)와 기하분포(예제2)에 대한 이해를 돕기 위한 예제이다.

The problems below show how to apply your new-found knowledge of the negative binomial distribution (see Example 1) and the geometric distribution (see Example 2).


예제1

Bob 은 고교 농구선수이다. 그는 자유투 성공률이 70%이다. 농구시함을 하는 동안 Bob이 5번째 자유투에서 3번째로 자유투를 성공할 확률은 얼마인가?

풀이 : 성공확률(P)이 0.70 이고, 시행회수(x)가 5, 성공회수(r)가 3 인 음이항 실험의 예이다.

이 문제를 풀기위해 주어진 값들을 음이항 공식에 넣어 계산해보자.

b*(x; r, P) = x-1Cr-1 * Pr * Qx - r
b*(5; 3, 0.7) = 4C2 * 0.73 * 0.32
b*(5; 3, 0.7) = 6 * 0.343 * 0.09 = 0.18522

즉, Bob이 5번째 자유투에서 3번째로 자유투를 성공할 확률은 0.18522 이다.


예제2

위의 예제1의 상황에서 이번에는 Bob이 5번째 자유투에서 처음으로 자유투를 성공할 확률은 얼마인가?


풀이 : 이 경우는 음이항분포에서 성공회수가 1인 경우에 해당하는 기하분포이다.
         따라서, 음이항공식이나 기하공식에 대입해 확률을 구할 수 있다.

성공확률(P)이 0.70 이고, 시행회수(x)가 5, 성공회수(r)가 1 이므로, 먼저, 음이항공식에 대입해 확률을 구해보자.

b*(x; r, P) = x-1Cr-1 * Pr * Qx - r
b*(5; 1, 0.7) = 4C0 * 0.71 * 0.34
b*(5; 3, 0.7) = 0.00567

이번에는 기하공식에 대입해 확률을 구해보자.

g(x; P) = P * Qx - 1
g(5; 0.7) = 0.7 * 0.34 = 0.00567

두 경우 모두 같은 확률임을 알 수 있다.




반응형