본문 바로가기

AP Statistics/하루 10분 AP Stat.

하루에 10분씩 공부하는 AP Statistics - #54 가설검정 방법(How to Test Hypotheses)

반응형

하루에 10분씩 공부하는 AP Statistics - #54 가설검정 방법(How to Test Hypotheses)


여기서는 통계 가설검정의 일반적인 절차에 대해 알아보자.



▶ 가설검정의 일반 절차(A General Procedure for Conducting Hypothesis Tests)

모든 가설검정은 동일한 방법으로 수행된다. 검정하고자 하는 가설을 세우고 분석계획을 수립한 후, 계획에 따라 표본 자료를 분석하고 분석결과를 바탕으로 귀무가설을 채택하거나 기각한다.
  • 가설 수립(State the hypotheses)
    검정하고자 가설은 귀무가설과 대립가설의 형태로 명시한다. 귀무가설과 대립가설은 상호 배반적이어야 한다. 즉, 하나가 참이면 다른 하나가 반드시 거짓이어야 하고, 하나가 거짓이면 다른 하나가 반드시 참이어야 한다.

  • 분석계획의 수립(Formulate an analysis plan)
    분석계획은 귀무가설을 채택하거나 기각하기 위해 표본자료를 어떻게 이용할지 명시해야 한다.
    이 과정은 다음 요소를 반드시 포함해야 한다.

    • 유의수준(Significance level)
      보통 유의수준은 0.01, 0.05, 0.10 을 많이 사용한다.
      하지만 0과 1 사이의 어떤 값이라도 사용할 수 있다.

    • 검정 방법(Test method)
      검정 방법은 검정 통계량(test statistic)과 표집분포를 포함한다. 표본 자료에서 계산되는 검정 통계량은 평균, 비율, 평균 차이, 비율 차이, z 점수, t 점수, 카이제곱 등이 될 수 있다. 검정 통계량과 표집분포가 주어지면 검정 통계량과 관련된 확률을 구할 수 있다. 검정 통계량의 확률이 유의수준보다 작으면 귀무가설은 기각된다. 

  • 표본 자료의 분석(Analyze sample data)
    표본 자료를 이용해 분석 계획에서 필요한 계산을 수행한다.

    • 검정 통계량(Test statistic)
      귀무가설이 평균이나 비율을 포함하는 경우 다음 두 식 중 하나를 이용해 검정 통계량을 구한다. 

      검정 통계량 = (통계량 - 모수) / (통계량의 표준편차)
      Test statistic = (Statistic - Parameter) / (Standard deviation of statistic)

      검정 통계량 = (통계량-모수) / (통계량의 표준오차)
      Test statistic = (Statistic - Parameter) / (Standard error of statistic)

      모수는 귀무가설에 명시된 값이고, 통계량은 모수의 점추정량(point estimate)이다. 통계량의 표준편차 또는 표준오차를 구해야 하는데, 표준편차와 표준오차를 구하는 방법은 앞에서 다루었다.

      귀무가설의 모수가 범주형 자료(categorical data)인 경우 검정 통계량으로 카이제곱 통계량(chi-square statistic)을 사용할 수 있다. 카이제곱 통계량을 구하는 방법은 뒤의 카이제곱 적합도 검정에서 소개하도록 하겠다.

    • P 값(P-value)
      P 값(P-value)은 귀무가설이 참이라고 가정할 때, 관측된 표본 통계량이 검정 통계량만큼 극단으로 치우칠 확률이다.

  • 결과 해석(Interpret the results)
    주어진 귀무가설에 해당하는 표본이 아닐 것 같다면 귀무가설을 기각한다. P 값(P-value)과 유의수준(significance leve)을 비교해 P 값이 유의수준보다 작다면 귀무가설을 기각한다.



▶ 예제 문제(Sample Problems)

앞으로 몇 회에 걸쳐 각기 다른 통계량을 갖고 가설검정을 적용하는 절차를 예제를 통해 살펴볼 것이다. 다음 각 경우에 해당하는 가설검정 절차를 확인하려면 링크를 클릭하기 바란다.

Proportions
Difference between proportions
Regression slope
Means
Difference between means
Difference between matched pairs
Goodness of fit Homogeneity
Independence



확인하고 넘어가기

Problem1

In hypothesis testing, which of the following statements are always true?

I. The P-value is greater than the significance level.
II. The P-value is computed from the significance level.
III. The P-value is the parameter in the null hypothesis.
IV. The P-value is a test statistic.
V. The P-value is a probability.

(A) I only
(B) II only
(C) III only
(D) IV only
(E) V only





반응형