본문 바로가기

AP Statistics/하루 10분 AP Stat.

하루에 10분씩 공부하는 AP Statistics - #33 이항분포(Binomial Distribution)

반응형


하루에 10분씩 공부하는 AP Statistics - #33 이항분포(Binomial Distribution)

이항확률(binomial probability)과 이항분포(binomial distribution)를 다루기에 앞서, 이해를 돕기 위해 이항실험과 이와 관련된 몇 가지 사항을 살펴보자.



▶ 이항실험(Binomial Experiment)

이항실험(binomial experiment 또는 베르누이 시행; Bernoulli trial)은 다음과 같은 특성을 갖는 통계 실험이다.

  • n 회의 반복되는 시행으로 구성된 실험이다.
  • 각 시행은 성공과 실패로 구분되는 두 가지 결과를 갖는다.
  • 성공확률은 P로 나타내고 모든 시행에서 동일하다.
  • 독립시행이다. 즉, 한 시행의 결과가 다른 시행 결과에 영향을 미치지 않는다. 

동전을 2회 던지고 동전의 앞면이 나온 회수를 세는 통계 실험을 생각해보자. 이 실험은 다음과 같은 이유에서 이항실험이다.

  • 실험은 반복되는 시행으로 구성되어 있다. - 동전을 던지는 회수 2회
  • 각 시행은 두 가지 결과를 갖는다. - 동전의 앞면과 뒷면
  • 성공 확률은 일정하다. - 매 시행마다 0.5
  • 독립시행이다. - 한 시행에서 앞면이 나오는 것은 다른 시행에서 앞면이 나오는 것에 영향을 주지 않는다.


▶ 기호(Notation)

다음은 이항확률(binomial probability)을 말할 때 유용한 기호이다.

  • x : 이항실험에서 성공한 회수
  • n : 이항실험의 시행 회수
  • P : 각 시행의 성공 확률
  • Q : 각 시행의 실패 확률 (Q = 1 - P)
  • b(x; n, P) : 이항실험에서 각 시행의 성공확률이 P일 때, n번의 시행에서 x번 성공할 확률 
  • nCr : n개에서 r개를 뽑는 경우의 수



▶ 이항분포(Binomial Distribution)

이항확률변수(binomial random variable)는 이항실험에서 n번의 반복시행 중에 성공 회수 x를 값으로 갖는 확률변수이다. 이항확률변수의 확률분포를 이항분포(binomial distribution 또는 베르누이분포; Bernoulli distribution)라고 한다.

동전을 2번 던지고 앞면(성공)의 수를 센다고 하자. 이항확률변수는 동전의 앞면 수이고, 0, 1, 2의 값을 갖는다. 이 때, 이항분포는 다음과 같다. 

Number of heads Probability
0 0.25
1 0.50
2 0.25

이항분포는 다음과 같은 특성을 갖는다.

  • 분포의 평균(μx)은 n * P  이다.
  • 분포의 분산(σ2x)은 n * P * ( 1 - P ) 이다.
  • 분포의 표준편차는 (σx) sqrt[ n * P * ( 1 - P ) ] 이다.



▶ 이항확률(Binomial Probability)

이항확률(binomial probability)는 이항실험에서 정확하게 x번 성공할 확률을 말한다. 예를 들어 위의 표에서 동전 2개 중에서 앞면이 1개일 이항확률은 0.50 이다.

주어진 x, n, P에 대해 우리는 다음식을 이용해 이항확률을 구할 수 있다.


  이항공식(binomial formula)

  n번 시행하는 이항실험에서 각 시행의 성공확률이 P라면  x번 성공하는 이항확률은 다음과 같다. 

b(x; n, P) = nCx * Px * (1 - P)n - x



예제1

주사위를 5번 던졌을 때, 4가 2번 나올 확률은 얼마인가?

풀이 : 시행회수가 5회이고, 성공회수가 2회, 각 시행의 성공확률은 1/6 즉 0.167인 이항실험이다. 따라서 이항확률을 이용해 확률을 계산할 수 있다.

b(2; 5, 0.167) = 5C2 * (0.167)2 * (0.833)3
b(2; 5, 0.167) = 0.161




▶ 누적이항확률(Cumulative Binomial Probability)

누적이항확률(cumulative binomial probability)은 특정범위(즉, 알려진 하한보다 크거나 같고 상한보다 작거나 같은 범위) 안에 이항확률변수가 포함될 확률을 말한다.

예를 들어, 100번 동전을 던졌을 때, 앞면의 수가 45회 이하인 누적확률분포를 구한다고 하자. 이것은 아래에 나타난 것처럼 각각의 이항확률의 합으로 나타낼 수 있다.

b(x < 45; 100, 0.5) = b(x = 0; 100, 0.5) + b(x = 1; 100, 0.5) + ... + b(x = 44; 100, 0.5) + b(x = 45; 100, 0.5)

예제 1

100번의 동전을 던졌을 때, 앞면이 45회 이하일 확률은 얼마인가? 

풀이 : 이 문제를 풀기 위해서는 이항공식을 이용해 46번의 확률계산을 해야 한다. 각각의 확률을 구해 모두 더해 다음 답을 구할 수 있다.

b(x < 45; 100, 0.5) = b(x = 0; 100, 0.5) + b(x = 1; 100, 0.5) + . . . + b(x = 45; 100, 0.5)
b(x < 45; 100, 0.5) = 0.184


 

예제 2

한 학생이 대학에 합격할 확률은 0.3이다. 만일 5명의 학생이 같은 학교에 지원한다면 이 중에 최대 2명이 합격할 확률은 얼마인가?

풀이 : 이 문제를 풀기 위해서는 이항공식을 이용해 3번의 확률계산을 해야 한다. 각각의 확률을 구해 모두 더해 다음 답을 구할 수 있다.

b(x < 2; 5, 0.3) = b(x = 0; 5, 0.3) + b(x = 1; 5, 0.3) + b(x = 2; 5, 0.3)
b(x < 2; 5, 0.3) = 0.1681 + 0.3601 + 0.3087
b(x < 2; 5, 0.3) = 0.8369



예제 3

월드시리즈가 4차전, 5차전, 6차전, 7차전에서 끝날 확률은 각각 얼마인가? 단, 각 팀이 이길 확률은 같다고 하자.

풀이 : 이 문제는 이항분포를 활용해야 하는 다소 어려운 문제이다. 만일 이 문제를 쉽게 풀 수 있다면 이항분포와 이항확률에 대해 충분한 이해가 되었다고 볼 수 있다.

월드시리즈에서는 두 팀이 경기를 하고, 먼저 4경기를 이기는 팀이 우승한다. 따라서 이 문제에서 성공을 한 팀이 최종적으로 월드시리즈에서 우승하는 것으로 정의하도록 하자.

문제에서 두 팀이 경기에서 승리할 확률은 동일하다고 하였으므로, 한 팀이 어느 경기에서 이길 확률은 0.5이다.

먼저, 가장 간단한 경우를 살펴보자. 월드시리즈가 4차전에서 끝날 확률을 구해보자. 이 경우는 한 팀이 첫 4 경기를 모두 이기는 경우이다. 내셔널리그 팀이 4연승을 할 확률은 다음과 같다.

b(4; 4, 0.5) = 4C4 * (0.5)4 * (0.5)0 = 0.0625

마찬가지로, 아메리칸리그 팀이 4경기를 이길 확률도 0.0625이다. 따라서, 4차전에서 월드시리즈가 끝날 확률은 내셔널리그팀 또는 어메리칸리그 팀이 4경기를 연속으로 이기면 되므로 0.0625 + 0.0625 = 0.125 이다.

이번에는 5차전에서 월드시리즈가 끝나는 확률을 구해보자. 여기서 주의할 점은 5번째 경기에서 월드시리즈가 끝나야 한다는 것이다. 즉, 우승팀은 첫 4경기에서 3경기만 이기고 1경기는 져야 한다. 먼저, 아메리칸리그 팀이 첫 4경기에서 3경기를 이길 확률은 다음과 같다.

b(3; 4, 0.5) = 4C3 * (0.5)3 * (0.5)1 = 0.25

이제, 아메리칸리그팀이 우승할 확률을 구해보자. 아메리칸리그팀이 첫 4경기에서 3승을 했다면, 5차전에서 이기고 우승할 확률은 50/50 이다. 따라서, 아메리칸리그팀의 월드시리즈 우승 확률은 0.25 * 0.50 = 0.125 이다. 내셔널리그팀이 5차전에서 우승할 확률도 같기 때문에 월드시리즈가 5차전에서 끝날 확률은 0.125 + 0.125 = 0.25 이다.

월드시리즈가 6차전, 7차전에서 끝날 확률도 마찬가지 방법으로 구할 수 있다. 월드시리즈가 6차전에서 끝날 확률은 0.3125 이고, 7차전에서 끝날 확률은 0.3125 이다.


반응형