본문 바로가기

AP Statistics/하루 10분 AP Stat.

하루에 10분씩 공부하는 AP Statistics - #52 유의성 검정(Tests of Significance)

반응형

하루에 10분씩 공부하는 AP Statistics - #52 유의성 검정(Tests of Significance)


통계 가설이란 모집단 모수에 대한 가정이다. 이 가정은 참일 수도 있고, 거짓일 수도 있다.

통계 가설이 참인지 여부를 결정하는 가장 좋은 방법은 전체 모집단을 조사하는 것이다. 하지만 현실적으로 불가능한 경우가 많기 때문에 모집단의 임의표본을 조사하게 된다. 만일 표본자료가 통계 가설과 일치한다면 가설을 채택하고 그렇지 않다면 가설을 기각한다.

통계 가설에는 2가지가 있다.

  • 귀무가설(Null hypothesis)
    귀무가설(null hypothesis)은 H0로 나타내며 순전히 우연에 의해 갖는 표본 관측값이다.

  • 대립가설(Alternative hypothesis)
    대립가설(alternative hypothesis)은 H1 또는 Ha로 나타내며, 비임의 원인(non-random cause)에 의해
    갖는 표본 관측값이다. 

동전이 정상인지 여부를 결정하는 경우를 생각해 보자. 귀무가설은 동전의 앞면, 뒷면이 나오는 회수가 각각 절반이다일 것이다. 대립가설은 동전의 앞면과 뒷면이 나오는 회수가 다르다이다. 이 가설을 간단히 다음과 같이 표현할 수 있다.

H0: P = 0.5
Ha: P ≠ 0.5

동전을 50회 던져서 앞면이 40회, 뒷면이 10회 나왔다고 하자. 이런 결과에서는 귀무가설을 기각하고 대립가설을 채택할 것이다.



▶ 가설검정(Hypothesis Tests)

귀무가설을 채택하거나 기각하기 위해서는 표본 자료를 바탕으로 일련의 과정을 거쳐야 한다. 이 과정을 가설검정(hypothesis testing)이라고 하며, 다음 4단계로 구성되어 있다. 

  • 가설 수립(state the hypothesis)
    귀무가설과 대립가설을 세운다.
    이 때, 가설은 상호 배반적이어야 한다. 즉, 하나가 참이면 다른 것은 반드시 거짓이어야 한다.

  • 분석계획 수립(formulate an analysis plan)
    분석계획은 표본자료를 사용해 가설을 채택하거나 기각할 방법을 정한다.
    채택/기각은 주로 하나의 검정 통계량(test statistic)에 따라 결정된다.

  • 표본 자료 분석(analyze sample data)
    검정 통계량(평균, 비율, t 점수, z 점수 등)의 값을 계산하기 위한 분석 방법을 정하고, 모든 계산을 한다.

  • 결과 해석(Interpret results)
    분석계획에서 기술한 결정 규칙을 적용한다. 만일 검정 통계량이 귀무가설을 지지한다면 귀무가설을 채택한다. 그렇지 않다면 귀무가설을 기각한다.



▶ 판단 오류(Decision Errors)

가설검정에서는 두 가지 종류의 판단 오류가 있다.

  • 제1종 오류(Type I error)
    제1종 오류는 실제로 귀무가설이 실제 참인데도 불구하고 기각할 경우에 발생한다.
    제1종 오류가 발생될 확률을 유의 수준(significance level)이라고 하는데, 이 확률은 알파(α)로 나타내기도 한다.

  • 제2종 오류(Type II error)
    제2종 오류는 귀무가설이 실제로 거짓인데도 불구하고 채택할 경우에 발생한다.
    제2종 오류가 발생될 확률을 베타(β)로 나타내기도 한다. 제2종 오류를 발생하지 않을 확률을 검정력(power of test)이라고 한다.





▶ 판단 규칙(Decision Rules)

분석계획은 귀무가설을 채택 또는 기각할 판단 규칙을 포함한다. 실제로 이러한 규칙은 P 값(P-value) 또는 채택영역 기준(reference to a region of acceptance)이 있다.

  • P 값(P-value)
    귀무가설이 성립할 증거의 세기는 P 값(P-value)으로 측정된다. 검정 통계량이 S라고 가정할 때, P 값은 귀무가설을 참이라고 가정했을 때, 검정 통계량이 최대 S 이내 일 확률이다. 만일 P 값이 유의수준보다 작다면 귀무가설을 기각한다.

  • 채택 영역(Region of acceptance)
    만일 검정 통계량이 채택 영역(region of acceptance)안에 들어온다면, 귀무가설은 채택된다.
    채택영역은 제1종 오류 발생 확률이 유의수준과 같도록 정의된다.  

    채택 영역 밖의 값들을 기각 영역(region of rejection)이라고 한다. 만일 검정 통계량이 기각 영역에 포함된다면 귀무가설은 기각된다. 이러한 경우에 유의수준 α에서 가설이 기각되었다고 한다.

위의 두 가지는 동일한 것이다. 어떤 책은 P 값을 사용하고 다른 책은 채택 영역 기준을 사용한다. AP Statistics 시험에서는 P 값을 사용하기 때문에 앞으로 예제 풀이에서는 P 값을 이용하도록 하겠다.



▶ 한쪽꼬리검정과  양쪽꼬리검정(One-Tailed and Two-Tailed Tests)

통계 가설검정에서 기각 영역이 표집분포의 한쪽에만 있는 경우를 한쪽꼬리검정(one-tailed test)이라고 한다. 귀무가설이 "평균이 10보다 작거나 같다"인 경우를 생각해 보자. 대립가설은 "평균이 10보다 크다"일 것이다. 기각 영역은 표집분포의 오른쪽에 위치한 수의 범위 즉, 10보다 큰 수의 집합이다.

통계 가설검정에서 기각 영ㅇ역이 표집분포의 양 끝에 있는 경우를 양쪽꼬리검정(two-tailed test)이라고 한다. 귀무가설이 "평균이 10이다"인 경우를 생각해 보자. 대립가설은 "평균이 10보다 작거나 10보다 크다"이다. 기각 영역은 표집분포의 양쪽 끝에 위치한 수의 범위 즉, 10보다 작거나 10보다 큰 수의 집합으로 구성된다.



반응형