반응형
하루에 10분씩 공부하는 AP Statistics - #11 산점도(scatterplots)
산점도(scatterplot)는 두 정량형 변수 간의 관계를 시각적으로 나타내기 위해 사용한다.
▶ 산점도의 해석(how to read a scatterplot)
산점도는 X축과 Y축 그리고 점들로 구성되어 있다. 산포도에 표시되는 각 점들은 자료의 각 관측값을 나타낸다. 산점도에서 각 점의 위치는 각 관측값이 가지는 X축, Y축 변수의 값으로 결정된다.
아래 예를 통해 알아보자. 왼쪽의 표는 고등학교 농구 선발선수 5명의 키와 몸무게를 나타낸 것이고, 오른쪽은 이 표를 이용해 그린 산점도이다.
표에 있는 각 선수들은 산점도에 하나의 점으로 나타나 있다. 예를 들어 첫번째 점은 키가 가장 작고, 몸무게가 가장 가벼운 선수를 나타낸다. 산점도의 X축 값에서 키가 가장 작은 선수의 키는 67인치이고, Y축 값에서 몸무게는 155파운드 인 것을 알 수 있다. 이와 같은 방법으로 산점도에 나타난 다른 4명의 선수의 키와 몸무게도 알 수 있다.
▶ 산점도에 나타난 자료의 형태(Patterns of Data in Scatterplots)
산점도는 이변량자료(bivariate data)의 형태를 분석하는데 사용된다. 이 때, 자료의 형태는 선형성(linearity), 기울기(slope), 상관관계의 세기(strength)를 이용해 기술한다.
- 선형성(Linearity)
자료의 형태를 선형(직선) 또는 비선형(곡선)으로 구분한다.
- 기울기(Slope)
X축 값이 커질 때, Y축 값의 변화 방향(즉, Y증가량/X증가량)을 말한다.
X축 값이 커질 때, Y축 값이 커지면 기울기는 양(+)이고, Y축 값이 작아지면 기울기는 음(-)이다.
- 관계의 세기(Strength)
산점도의 점들이 흩어져(scatter) 있는 정도를 말한다.
점들이 넓게 퍼져 있으면 약한 관계, 점들이 선 주위에 몰려 있으면 강한 관계이다.
산점도에서는 군집(cluster), 갭(gap), 이상치(outlier)과 같은 자료의 특이점을 밝혀낼 수 있다. 다음은 산점도에서 나타나는 대표적인 형태를 나타낸 것이다.
with outlier
Nonlinear, positive slope, weak Nonlinear, negative slope, Nonlinear, zero slope, weak
strong, with gap
마지막 산점도(nonlinear, zero slope, weak)는 두 변수 간에 아무런 상관이 없을 경우 나타나는 형태이다.
확인하고 넘어가기
Problem 1
The scatterplot below shows the relation between two variables.
Which of the following statements are true?
I. The relation is strong.
II. The slope is positive.
III. The slope is negative.
(A) I only
(B) II only
(C) III only
(D) I and II
(E) I and III
Solution
반응형