본문 바로가기

AP Statistics/하루 10분 AP Stat.

하루에 10분씩 공부하는 AP Statistics - #2 중심경향 척도(measures of central tendency)

반응형

하루에 10분씩 공부하는 AP Statistics - #2 중심경향 척도(measures of central tendency)

통계학에서는 자료의 형태를 기술하기 위해 간단한 척도를 사용한다. 중심경향 척도(Measures of central tendency)는 값들의 집합에서 가장 대표적인 값을 기술하는데 사용되는 척도이다.


▶ 최빈값(Mode)
자료에서 동일한 값의 개수가 가장 많은 관측값을 최빈값이라고 한다.


▶ 평균과 중앙값(Mean and Median)

중심경향 척도로 가장 널리 쓰이는 두 가지는 평균과 중앙값이다.
 
- 평균(mean)
표본(sample) 또는 모집단(population)의 평균은 측정된 값을 모두 합하고, 자료 수로 나눠서 계산한다.

일반적으로 평균은 다음 식을 이용해 구한다.
      모집단 평균(population mean) = μ = ΣX / N
       (ΣX는 모집단의 모든 측정값의 합, N은 모집단의 자료 수)
      표본 평균(sample mean) = x = Σx / n
       (Σx는 표본의 모든 측정값의 합, n은 표본의 자료 수)
통계학에서 모집단의 평균은 그리스문자 μ(Mu), 표본의 평균은 x로 나타낸다.

- 중앙값(median)
중앙값을 구하기 위해서는 먼저 자료를 오름차순으로 정렬한 후
자료의 수가 홀수인 경우 : 중앙값은 자료에서 정가운데에 위치한 값
자료의 수가 짝수인 경우 : 중앙값은 가운데 위치한 두 자료의 값의 평균
을 구한다.

예) 여자 5명의 몸무게를 측정했다고 하자. 여성의 몸무게는 각각 45kg, 45kg, 49kg, 51kg, 55kg 이다.
여성의 몸무게의 평균을 구해보면 (45+45+49+51+55)/5=49kg 이다. 중앙값은 정가운데 값인 49kg이 중앙값이 된다.


▶ 평균과 중앙값의 장단점

중심경향 척도로 평균과 중앙값을 사용할 때의 장단점을 알아보자.

먼저, 이상치(outlier)란 다른 자료와 극단적으로 큰 차이가 있는 자료를 말한다. 만일 자료가 이상치(outlier)를 포함하고 있다면 평균보다는 중앙값이 자료의 특성을 나타내는데 유용하다. 그러나 표본의 수가 크고 이상치를 포함하고 있지 않다면 평균이 중심경향을 나타내는데 더 유용하다.

보다 쉽게 이해할 수 있도록 예를 들어보자. 만일 우리가 10가정의 수입을 조사한다고 할 때, 9가정의 수입이 년 3,000만원에서 1억원 사이이고 10번째 가정의 수입이 100억이라고 하자. 이 때, 10번째 가정은 이상치(outlier)이다. 만일 우리가 10가정의 수입을 평균으로 나타낸다면 (10번째 가정의 이상치로 인해) 부풀려서 나타내게 되는 반면, 중앙값은 그렇지 않다.


▶ 단위 환산의 영향(Effect of Changing Units)

우리는 단위를 바꿔서 사용할 경우가 있다(분→시간 또는 센티미터→미터 등). 이렇게 단위가 바뀌는 경우 평균과 중앙값에 어떤 영향을 미칠까?

만일 각 관측값에 일정한 수를 더한다면 평균과 중앙값은 모두 일정한 수 만큼 증가한다. 예를 들어 평균이 5이고 중앙값이 6인 자료가 있을 때, 자료의 각 관측값에 10을 더한다면 평균은 5+10=15, 중앙값은 6+10=16이 된다.

만일 각 관측값에 일정한 수를 곱한다면 평균과 중앙값은 모두 일정한 수를 곱해서 구할 수 있다. 앞에서 예를 든 평균이 5이고 중앙값이 6인 자료에서, 자료의 각 관측값에 10을 곱한다면 평균은 5×10=50, 중앙값은 6×10=60이 된다.

확인하고 넘어가기

Problem 1
Four friends take an IQ test. Their scores are 96, 100, 106, 114. Which of the following statements is true?

I. The mean is 103.
II. The mean is 104.
III. The median is 100.
IV. The median is 106.

(A) I only
(B) II only
(C) III only
(D) IV only
(E) None is true

Solution





반응형