하루에 10분씩 공부하는 AP Statistics - #28 확률분포(Probability Distribution)
확률분포(probability distribution)란 사건발생 확률에 따라 확률변수가 가지는 각각의 값을 나타낸 표(table) 또는 식(equation)을 말한다.
▶ 이산 확률분포(Discrete Probability Distributions)
이산 확률변수(discrete probability distribution)의 확률분포는 표로 나타낼 수 있다.
예를 들어, 동전을 2회 던지는 경우를 가정해보자. 이 시행의 가능한 네 가지 결과는 HH, HT, TH, TT이다.
동전을 2회 던지는 시행에서 동전의 앞면의 개수를 변수 X로 나타내며, X는 0, 1, 2의 값을 갖는다.
이 경우 X는 이산 확률변수discrete random variable)이다.
아래 표 이산확률변수의 확률분포를 나타낸 것이다. P(X)는 X가 가질 수 있는 각 값에 따른 확률을 나타낸 것이다. 앞면이 0개일 확률은 0.25이고, 앞면이 1개일 확률은 0.50, 앞면이 2개일 확률은 0.25이다.
Number of heads, x | Probability, P(x) |
0 | 0.25 |
1 | 0.50 |
2 | 0.25 |
주) 주어진 확률분포에서 누적확률(cumulative probability)을 구할 수 있다. 예를 들어 앞면의 개수가 1 이하일 확률 즉, [ P(X < 1) ] = P(X = 0) + P(X = 1) 로 나타낼 수 있고 그 값은 0.25 + 0.50 = 0.75 이다.
▶ 연속 확률분포(Continuous Probability Distributions)
연속 확률변수(continuous random variable)의 확률분포는 수식으로 나타낸다. 이 수식을 확률밀도함수(probability density function; pdf)라고 한다. 모든 확률밀도함수는 다음 조건을 만족해야 한다.
- 확률변수 Y는 X의 함수이다. 즉, y = f(x).
- y의 값은 모든 x값에 대해 0보다 크다.
- 함수의 그래프와 x축으로 둘러싸인 부분의 넓이은 1 이다 .
아래의 그래프는 두 개의 연속 확률분포를 나타낸 것이다. 왼쪽 그래프는 [0, 1]에서 y = 1 의 식으로 표현되는 확률밀도함수를 나타낸 것이다. 오른쪽 그래프는 [0, 2]에서 y = 1 - 0.5x 의 식으로 표현되는 확률밀도함수를 나타낸 것이다. 두 그래프 모두 함수의 그래프와 x축으로 둘러싸인 부분의 넓이는 1이다.
![]() y = 1 |
![]() y = 1 - 0.5x |
연속 확률변수가 a와 b사이의 구간에 포함될 확률은 a와 b사이에서 확률밀도함수(pdf) 아래 넓이와 같다.
예를 들어 왼쪽 그래프에서 색칠된 부분은 확률변수 X가 0.6과 1.0 사이의 값을 가질 확률을 나타내고, 이 확률은 0.4 이다. 오른쪽 그래프에서 확률변수 X가 1.0과 2.0 사이의 값을 가질 확률은 0.25이다.
주) 연속분포에서 두 점 사이에는 무수히 많은 개수의 값이 존재한다. 따라서 연속확률분포에서 연속확률변수가 특정한 값을 가지는 확률은 0으로 가정한다.
확인하고 넘어가기
Problem1
The number of adults living in homes on a randomly selected city block is described by the following probability distribution.
Number of adults, x | 1 | 2 | 3 | 4 or more |
Probability, P(x) | 0.25 | 0.50 | 0.15 | ??? |
What is the probability that 4 or more adults reside at a randomly selected home?
(A) 0.10
(B) 0.15
(C) 0.25
(D) 0.50
(E) 0.90