히스토그램은 그룹 간에 관측값들이 어떻게 분포하는지 보여주지만 각 관측값의 정확한 값을 나타내지는 않는다. 반면에 줄기그림(stemplot) 또는 줄기잎그림(stem and leaf plot)은 각 관측값의 정확한 값을 보여준다.
▶ 줄기그림(Stemplots)
줄기 그림은 정량형 자료(quantitative data)를 나타내는데 사용된다. 일반적으로 적은 수(50 또는 그 이하)의 자료를 표현하는데 사용된다. 다음 줄기그림은 6학년 30명 학생의 IQ를 나타낸 것이다.
Stems 150 140 130 120 110 100 90 80 Key: 110 |
Leaves 1 2 6 4 5 7 9 1 2 2 2 5 7 9 9 0 2 3 4 4 5 7 8 9 9 1 1 4 7 8 7 represents an IQ score of 117 |
줄기그림에서 왼쪽에 있는 항목들을 줄기라고 하고, 오른쪽에 있는 항목들을 잎이라고 한다. 위의 예제에서 줄기는 십단위(80, 90)와 백단위 (100에서 140)을 나타내는데 단위는 달라질 수 있다(백만, 천, 일, 십분의 일 등). 예제에서는 줄기와 잎에 대한 설명이 명확하게 나타나 있지만, 실제에서는 줄기와 잎에 대한 레이블이 명확하게 표시되어 있지 않은 경우가 많다.
어떤 줄기그림은 표현된 자료를 정확하게 해석할 수 있도록 풀이(key)를 표시하기도 한다. 위의 줄기그림에 나온 풀이(key)는 줄기가 110이고 잎이 7인 경우는 IQ가 117임을 나타낸 것이다.
줄기그림을 보면 IQ의 분포를 쉽게 설명할 수 있다. 대부분의 학생의 IQ는 90에서 109 사이에 집중되어 있고 중심은 100 정도 이다. IQ는 최하 81(2명) 에서 최고 151 의 범위에 걸쳐 있고, 151 의 IQ는 이상치(outlier)로 구분할 수 있다.
풀어보고 넘어가기
Problem 1
The stemplot below shows the number of hot dogs eaten by contestants in a recent hot dog eating contest.
80 70 60 50 40 30 20 10 |
1 4 7 2 2 6 0 2 5 7 9 9 5 7 9 7 9 1 |
Which of the following statements are true?
I. The range is 70.
II. The median is 46.
(A) I only
(B) II only
(C) I and II
(D) Neither is true.
(E) There is insufficient information to answer this question.
Solution