반응형
하루에 10분씩 공부하는 AP Statistics - #32 확률사상의 시뮬레이션(Simulation of Random Events)
시뮬레이션(simulation; 모의실험)이란 확률사상(random event)를 모형화하여 실제 결과(real-world outcomes)와 유사한 결과를 내도록 실험하는 것을 말한다. 시뮬레이션 결과를 살펴봄으로써 연구자들은 실제 세상에 대한 통찰을 얻는다.
▶ 왜 시뮬레이션을 하는가?(Why use simulation?)
때때로 주어진 상황은 정확한 수학적 계산이 가능하지 않은 경우도 있다. 설령 수학적 계산이 가능하더라도 계산이 어렵거나, 많은 시간이 소요되거나 또는 분석에 많은 비용이 소모되기도 한다. 이러한 상황에서 시뮬레이션은 다른 방법들에 비해 더 적은 시간과 노력, 비용으로 실제 결과를 근사하기 위해 사용될 수 있다.
▶ 시뮬레이션 방법(How to Conduct a Simulation)
시뮬레이션은 오직 실제 결과와 가까운 결과를 보일 때 유용하다. 다음은 유용한 시뮬레이션을 하기 위한 절차이다.
- 가능한 결과를 기술한다.
- 각 결과를 하나 또는 그 이상의 난수(random number)에 배정한다.
- 난수 발생방법을 선정한다.
- 난수를 선택한다.
- 난수에 따라 "모의시행"된 결과를 확인한다.
- 4, 5 단계를 여러 번 반복한다. 가급적 안정된 형태의 결과를 얻을 때까지 반복한다.
- 모의시행 결과를 분석하고 결과를 정리한다.
주) 위에서 3단계에 언급한 난수발생방법 선정 과정에는 많은 선택권이 있다. 동전을 던지거나, 주사위를 던지는 것은 별다른 기술이 필요없지만 효과적이다. 통계책 부록에 많이 수록되는 난수표(table of random numbers)를 이용하거나, 인터넷에서 찾을 수 있는 난수발생기를 이용하는 방법도 있다.
▶ 시뮬레이션 예제(Simulation Example)
여기서는 확률문제에 시뮬레이션을 어떻게 적용하는지 살펴보도록 하자.
문제 정의(Problem Description)
평균적으로 한 야구선수가 타석에서 10번에 한 번 꼴로 홈런을 친다고 하자. 이 선수가 2타석 연속으로 홈런을 칠 확률을 시뮬레이션을 이용해서 추정하여라.
풀이 (Solution)
앞에서 말한 시뮬레이션 절차를 이 문제에 적용해 보도록 하자.
- 가능한 결과를 기술한다.
이 문제에서는 선수가 홈런을 치거나 치지 못하는 두 가지 결과가 있다. - 각 결과를 하나 또는 그 이상의 난수(random number)에 배정한다.
야구선수가 홈런을 칠 확률이 10% 이므로, 난수의 10%가 홈런을 나타내도록 한다.
이를 위해 숫자 "2"는 홈런을 나타내고, 다른 숫자는 홈런을 치지 못한 것을 나타낸다고 하자. - 난수발생 방법을 선정한다.
이 문제에서는 아래의 500개의 두 자리 난수표를 이용하도록 한다. - 난수를 선택한다.
아래 난수표의 500개의 난수를 사용한다. - 난수에 따라 "모의시행"된 결과를 확인한다.
숫자 "2"는 홈런을 나타내므로, "22"는 2타석 연속 홈런을 나타낸다.
다른 두 자리 숫자는 2타석 연속 홈런을 치지 못한 것을 나타낸다. - 4, 5 단계를 여러 번 반복한다. 가급적 안정된 형태의 결과를 얻을 때까지 반복한다.
아래 난수표에 500개의 두 자리 숫자가 있으므로, 4, 5 단계를 500번 반복하도록 한다. - 모의시행 결과를 분석하고 결과를 정리한다.
아래 난수표에서 6개의 "22"(빨간색으로 표시)가 나타난다. 이 시뮬레이션에서 각 "22"라는 숫자는 이 선수가 2타석 연속 홈런을 친 것을 나타낸다.
Random Numbers |
42 99 02 65 04 14 30 09 70 88 89 85 95 40 53 67 25 50 48 79 86 92 76 24 53 39 08 73 78 17 72 81 08 01 68 94 43 43 95 12 36 90 28 88 34 69 18 69 91 79 14 82 26 94 15 26 19 41 74 02 17 20 38 84 74 30 34 96 09 46 61 41 02 93 94 90 00 71 84 98 30 82 80 11 92 97 81 29 85 44 40 05 83 22 04 86 13 33 00 99 74 75 27 43 68 22 59 20 66 00 24 01 96 84 19 14 57 26 47 58 51 73 06 08 49 52 70 15 79 35 65 28 40 77 93 73 33 24 25 22 32 03 89 03 62 13 85 16 23 28 12 61 16 75 45 37 15 54 36 18 45 64 31 31 06 80 32 75 99 27 91 25 98 05 55 32 27 16 51 45 89 31 78 90 82 05 11 39 80 83 01 20 10 67 97 33 72 09 98 78 39 56 57 54 63 35 21 35 93 18 17 48 55 60 44 92 21 07 77 42 46 86 41 49 76 96 36 62 38 11 64 07 04 58 23 56 29 37 87 37 59 47 83 77 21 63 10 95 87 10 42 71 12 88 06 52 42 99 02 65 04 14 30 09 70 88 89 85 95 40 53 67 25 50 48 79 86 92 76 24 53 39 08 73 78 17 72 81 08 01 68 94 43 43 95 12 36 90 28 88 34 69 18 69 91 79 14 82 26 94 15 26 19 41 74 02 17 20 38 84 74 30 34 96 09 46 61 41 02 93 94 90 00 71 84 98 30 82 80 11 92 97 81 29 85 44 40 05 83 22 04 86 13 33 00 99 74 75 27 43 68 22 59 20 66 00 24 01 96 84 19 14 57 26 47 58 51 73 06 08 49 52 70 15 79 35 65 28 40 77 93 73 33 24 25 22 32 03 89 03 62 13 85 16 23 28 12 61 16 75 45 37 15 54 36 18 45 64 31 31 06 80 32 75 99 27 91 25 98 05 55 32 27 16 51 45 89 31 78 90 82 05 11 39 80 83 01 20 10 67 97 33 72 09 98 78 39 56 57 54 63 35 21 35 93 18 17 48 55 60 44 92 21 07 77 42 46 86 41 49 76 96 36 62 38 11 64 07 04 58 23 56 29 37 87 37 59 47 83 77 |
이 시뮬레이션에서 한 선수가 2타석 연속 홈런을 칠 확률은 500번 중 6회로 추정된다. 따라서, 시뮬레이션을 통해 임의로 선택된 2타석이 모두 홈런일 확률은 1.2% 임을 알 수 있다. 실제 2타석 연속 홈런을 칠 확률은 확률의 곱의 법칙을 이용해 구하면 1.0% 이다. 시뮬레이션 결과가 실제 확률이 정확히 같지는 않지만 매우 가까운 결과를 얻을 수 있었다. 만일 더 많은 난수를 이용해 시뮬레이션 했다면 실제와 더 가까운 결과를 얻을 수 있을 것이다.
반응형