본문 바로가기

AP Statistics/하루 10분 AP Stat.

하루에 10분씩 공부하는 AP Statistics - #32 확률사상의 시뮬레이션(Simulation of Random Events)

반응형

하루에 10분씩 공부하는 AP Statistics - #32 확률사상의 시뮬레이션(Simulation of Random Events)

시뮬레이션(simulation; 모의실험)이란 확률사상(random event)를 모형화하여 실제 결과(real-world outcomes)와 유사한 결과를 내도록 실험하는 것을 말한다. 시뮬레이션 결과를 살펴봄으로써 연구자들은 실제 세상에 대한 통찰을 얻는다.



▶ 왜 시뮬레이션을 하는가?(Why use simulation?)

때때로 주어진 상황은 정확한 수학적 계산이 가능하지 않은 경우도 있다. 설령 수학적 계산이 가능하더라도 계산이 어렵거나, 많은 시간이 소요되거나 또는 분석에 많은 비용이 소모되기도 한다. 이러한 상황에서 시뮬레이션은 다른 방법들에 비해 더 적은 시간과 노력, 비용으로 실제 결과를 근사하기 위해 사용될 수 있다.



▶ 시뮬레이션 방법(How to Conduct a Simulation)

시뮬레이션은 오직 실제 결과와 가까운 결과를 보일 때 유용하다. 다음은 유용한 시뮬레이션을 하기 위한 절차이다.
  1. 가능한 결과를 기술한다.
  2. 각 결과를 하나 또는 그 이상의 난수(random number)에 배정한다.
  3. 난수 발생방법을 선정한다.
  4. 난수를 선택한다.
  5. 난수에 따라 "모의시행"된 결과를 확인한다.
  6. 4, 5 단계를 여러 번 반복한다. 가급적 안정된 형태의 결과를 얻을 때까지 반복한다.
  7. 모의시행 결과를 분석하고 결과를 정리한다.

주) 위에서 3단계에 언급한 난수발생방법 선정 과정에는 많은 선택권이 있다. 동전을 던지거나, 주사위를 던지는 것은 별다른 기술이 필요없지만 효과적이다. 통계책 부록에 많이 수록되는 난수표(table of random numbers)를 이용하거나, 인터넷에서 찾을 수 있는 난수발생기를 이용하는 방법도 있다.



▶ 시뮬레이션 예제(Simulation Example)

여기서는 확률문제에 시뮬레이션을 어떻게 적용하는지 살펴보도록 하자.

문제 정의(Problem Description)

평균적으로 한 야구선수가 타석에서 10번에 한 번 꼴로 홈런을 친다고 하자. 이 선수가 2타석 연속으로 홈런을 칠 확률을 시뮬레이션을 이용해서 추정하여라.

풀이 (Solution)

앞에서 말한 시뮬레이션 절차를 이 문제에 적용해 보도록 하자.

  1. 가능한 결과를 기술한다.
    이 문제에서는 선수가 홈런을 치거나 치지 못하는 두 가지 결과가 있다.
  2. 각 결과를 하나 또는 그 이상의 난수(random number)에 배정한다.
    야구선수가 홈런을 칠 확률이 10% 이므로, 난수의 10%가 홈런을 나타내도록 한다.
    이를 위해 숫자 "2"는 홈런을 나타내고, 다른 숫자는 홈런을 치지 못한 것을 나타낸다고 하자.
  3. 난수발생 방법을 선정한다.
    이 문제에서는 아래의 500개의 두 자리 난수표를 이용하도록 한다. 
  4. 난수를 선택한다.
    아래 난수표의 500개의 난수를 사용한다.
  5. 난수에 따라 "모의시행"된 결과를 확인한다.
    숫자 "2"는 홈런을 나타내므로, "22"는 2타석 연속 홈런을 나타낸다.
    다른 두 자리 숫자는 2타석 연속 홈런을 치지 못한 것을 나타낸다.
  6. 4, 5 단계를 여러 번 반복한다. 가급적 안정된 형태의 결과를 얻을 때까지 반복한다.
    아래 난수표에 500개의 두 자리 숫자가 있으므로, 4, 5 단계를 500번 반복하도록 한다.
  7. 모의시행 결과를 분석하고 결과를 정리한다.
    아래 난수표에서 6개의 "22"(빨간색으로 표시)가 나타난다. 이 시뮬레이션에서 각 "22"라는 숫자는 이 선수가 2타석 연속 홈런을 친 것을 나타낸다.


Random Numbers
42 99 02 65 04 14 30 09 70 88 89 85 95 40 53 67 25 50 48 79 86 92 76 24 53 39 08 73 78 17 72 81 08 01 68 94 43 43 95 12 36 90 28 88 34 69 18 69 91 79 14 82 26 94 15 26 19 41 74 02 17 20 38 84 74 30 34 96 09 46 61 41 02 93 94 90 00 71 84 98 30 82 80 11 92 97 81 29 85 44 40 05 83 22 04 86 13 33 00 99 74 75 27 43 68 22 59 20 66 00 24 01 96 84 19 14 57 26 47 58 51 73 06 08 49 52 70 15 79 35 65 28 40 77 93 73 33 24 25 22 32 03 89 03 62 13 85 16 23 28 12 61 16 75 45 37 15 54 36 18 45 64 31 31 06 80 32 75 99 27 91 25 98 05 55 32 27 16 51 45 89 31 78 90 82 05 11 39 80 83 01 20 10 67 97 33 72 09 98 78 39 56 57 54 63 35 21 35 93 18 17 48 55 60 44 92 21 07 77 42 46 86 41 49 76 96 36 62 38 11 64 07 04 58 23 56 29 37 87 37 59 47 83 77 21 63 10 95 87 10 42 71 12 88 06 52 42 99 02 65 04 14 30 09 70 88 89 85 95 40 53 67 25 50 48 79 86 92 76 24 53 39 08 73 78 17 72 81 08 01 68 94 43 43 95 12 36 90 28 88 34 69 18 69 91 79 14 82 26 94 15 26 19 41 74 02 17 20 38 84 74 30 34 96 09 46 61 41 02 93 94 90 00 71 84 98 30 82 80 11 92 97 81 29 85 44 40 05 83 22 04 86 13 33 00 99 74 75 27 43 68 22 59 20 66 00 24 01 96 84 19 14 57 26 47 58 51 73 06 08 49 52 70 15 79 35 65 28 40 77 93 73 33 24 25 22 32 03 89 03 62 13 85 16 23 28 12 61 16 75 45 37 15 54 36 18 45 64 31 31 06 80 32 75 99 27 91 25 98 05 55 32 27 16 51 45 89 31 78 90 82 05 11 39 80 83 01 20 10 67 97 33 72 09 98 78 39 56 57 54 63 35 21 35 93 18 17 48 55 60 44 92 21 07 77 42 46 86 41 49 76 96 36 62 38 11 64 07 04 58 23 56 29 37 87 37 59 47 83 77

이 시뮬레이션에서 한 선수가 2타석 연속 홈런을 칠 확률은 500번 중 6회로 추정된다. 따라서, 시뮬레이션을 통해 임의로 선택된 2타석이 모두 홈런일 확률은 1.2% 임을 알 수 있다. 실제 2타석 연속 홈런을 칠 확률은 확률의 곱의 법칙을 이용해 구하면 1.0% 이다. 시뮬레이션 결과가 실제 확률이 정확히 같지는 않지만 매우 가까운 결과를 얻을 수 있었다. 만일 더 많은 난수를 이용해 시뮬레이션 했다면 실제와 더 가까운 결과를 얻을 수 있을 것이다.

반응형