본문 바로가기

AP Statistics/하루 10분 AP Stat.

하루에 10분씩 공부하는 AP Statistics - #24 실험설계(Experimental Design)

반응형

하루에 10분씩 공부하는 AP Statistics - #24 실험설계(Experimental Design)


실험 설계(experimental design)란 피실험자(subject)를 처리(treatment) 조건에 배정하는 계획을 말한다. 좋은 실험 설계는 다음 세 가지 목적에 부합한다.


   - 인과관계(Causation)
      실험자로 하여금 독립변수(independent variable)와 종속변수(dependent variable) 간의 인과관계를
      추론할 수 있도록 한다.


   - 제어(Contrl)
      실험자가 관계없는 변수(즉, 독립변수가 아닌 변수)의 교락효과로 인한 설명 대안을 판정할 수 있도록 한다.

   - 변동성(Variability)
      처리 결과의 차이를 쉽게 알아낼 수 있도록 처리조건 내에서의 변동성을 감소시킨다.      



▶ 실험 설계의 예(An Experimental Design Example)

다음 실험을 살펴보자. Acme 제약회사는 사람들이 감기에 걸리지 않도록 하는 새로운 백신에 대한 실험을 수행하고 있다. 백신을 시험하기 위해 Acme 제약회사는 자원한 21~70세 범위의 1000명의 피실험자(남자 500명, 여자 500명)를 대상으로 하였다.

여기서는 완전임의화설계(completely randomized design), 임의화블록설계(randomized block design), 대응짝설계(a matched pairs design)의 세 가지 실험설계 방법을 설명하고자 한다. 그리고, 각 실험설계를 Acme 제약회사 사례에 적용해보고, 어떻게 다른 요인의 교락효과를 구분해내어 백신의 효과를 판별하는지 알아보자.



▶ 완전임의화설계(Completely Randomized Design)

Treatment
Placebo Vaccine
500 500
완전임의화설계(completely randomized design)는 자료분석과 편의성 면에서 가장 간단한 실험설계 방법이다. 이 방법에서는 피실험자를 처리조건에 임의로 배정한다.

오른쪽 표는 Acme 제약회사 경우에 대한 완전임의화설계 방법을 나타낸 것이다. 실험자는 두 처리조건에 피실험자를 임의로 배정한다. 피실험자는 위약(Placebo)이나 백신을 받게된다. 같은 수(500명)의 피실험자가 각 처리조건에 배정된다(반드시 그럴 필요는 없다). 종속변수는 각 처리조건에서 감기에 걸린 사람 수이다. 만일 백신이 효과가 있다면 "vaccine" 그룹에 있는 피실험자가 "Placebo" 조건에 있는 피실험자보다 훨씬 적은 수가 감기에 걸려야 한다.

완점임의화설계는 임의화(randomization)를 통해 무관한 변수의 효과를 제어한다. 실험자는 무관한 요인의 효과가 평균적으로 각 처리조건에 동일 정도로 영향을 미칠 것으로 가정한다. 따라서 조건 간의 유의한 차이는 독립변수에 의한 것으로 볼 수 있다.



▶ 임의화블록설계(Randomized Block Design)
  Treatment
Gender Placebo Vaccine
Male 250 250
Female 250 250

임의화블록설계(randomized block design)에서 실험자는 피실험자를 블록(block)이라고 하는 하위그룹으로 구분한다. 이 때, 블록 내에서의 변동성은 블록 간의 변동성보다 작도록 한다. 그 후에 각 블록 내에서는 피실험자를 각 처리조건에 임의로 배정한다. 임의블록설계 방법은 잠재적인 교락(confouding)과 변동성을 줄이기 때문에 처리 효과를 보다 명확하게 추정할 수 있다.

오른쪽의 표는 Acme 실험방법으로 임의블록설계를 적용한 것이다. 피실험자는 성별에 따른 블록으로 구분하여 배정하였다. 각 블록내에서는 피실험자를 처리조검에 임의로 배정하였다. 남자, 여자 모두 250명의 위약을 주고, 나머지 250명에게는 백신을 제공했다.

남자와 여자는 생리적으로 다르고, 약에 대해 다른 반응한다는 것이 알려져 있다. 임의화블록설계방법은 각 처리조건이 동일한 남자와 여자 비율을 갖도록 한다. 그 결과 처리조건 간의 차이와 성별에 따른 차이를 구분할 수 있도록 한다. 즉, 임의블록설계 방법은 잠재 변동성의 원인 또는 잠재 교락변수가 될 수 있는 성별의 차이를 구분해 제거할 수 있도록 한다.

Acme 사례에서 임의화블록화설계 방법이 완전임의화설계 방법보다 더 유용하다. 두 설계방법 모두 교락을 방지하기 위해 임의화를 사용하지만 임의화블록설계 방법만이 성별의 효과를 제어할 수 있다.

주1 : 어떤 블록설계에서는 각 피실험자가 여러 가지 처리를 받는 경우가 있다. 이것을 피실험자를 자가제어로 사용한다(Using the subject as his own control)고 한다. 피실험자 자가제어는 특정 실험(예를 들어 학습 또는 피로연구)에서 바람직하지만 문제점(예를 들어 한 처리에서 사용된 약이 다른 처리에서 사용된 약과 서로 영향을 끼칠 수 있는 의약 연구)도 가지고 있다.

주2 : 블록은 표집과정에서의 층(strata)과 비슷한 역할을 한다. 블록과 층 모두 관측값을 하위그룹으로 구분하지만 차이점이 있다. 블록은 실험설계와 관련된 것이고 계층화(stratification)은 조사 표본추출과 관련된 것이다.


▶ 대응짝설계(Matched Pairs Design)


  Treatment
Pair Placebo Vaccine
1 1 1
2 1 1
... ... ...
499 1 1
500 1 1

대응짝설계(matched paris design)은 임의화블록설계의 특수한 경우이다. 실험이 단 두 가지 처리조건만 있고, 피실험자를 특정 블록 변수에 따라 대응짝 그룹으로 구분할 수 있는 경우에 각각의 대응짝에서 피실험자를 처리 조건에 임의로 배정한다.

오른쪽 표는 Acme 실험에 대한 대응짝설계 방법을 나타낸 것이다. 1000명의 피실험자를 성별과 나이가 같은 500쌍의 대응짝으로 구분한다. 예를 들어 대응짝 1은 21세의 여성 두 명이고, 대응짝 2는 22세의 여성 두 명 등으로 구성한다.

Acme 사례에서 대응짝설계 방법은 완전임의화설계 또는 임의화블록설계보다 더 유용하다. 대응짝설계 방법도 교락을 제어하기 위해 임의화 방법을 사용하지만, 두 개의 잠복변수(lurking variables)인 성별과 나이의 효과를 제어한다.



확인하고 넘어가기
Problem1

Which of the following statements are true?

I. A completely randomized design offers no control for lurking variables.
II. A randomized block design controls for the placebo effect.
III. In a matched pairs design, subjects within each pair receive the same treatment.

(A) I only
(B) II only
(C) III only
(D) All of the above.
(E) None of the above.


반응형