ANCOVA 분석시 여러개의 covariate 처리 방법

안녕하세요. ANCOVA에 대해 질문드립니다.

나이가 다른 2개의 그룹(그룹1:15명, 그룹2:15명)에 대해서 종속변수인 측정치(Y)의 차이를 분석을 하려 합니다. 그런데, 나이에 따라서 배경지식의 차이가 있습니다. correlation analysis 결과, subject의 배경지식(X1,X2,X3)이 독립변수인 나이뿐만 아니라 종속변수인 Y와도 상관관계가 있습니다.
하지만, 이들 배경지식을 control해서 독립변수로 잡고 실험을 수행하기가 어려워서 covariate로 처리했는데요.

SAS에서 ANCOVA 분석을 하려 하는데, 이렇게 여러개의 변수가 covariate로 존재할 때
covariate 변수 모두를 넣어서 분석한 ANCOVA 결과와 각각의 covariate 변수를 하나씩만 넣어서 비교했을 때의 ANCOVA 결과가 다릅니다.

예를 들어 SAS 에서

1) covariate 변수 3개를 모두 넣었을 때

     Proc glm data= …
     class age
     model y=age x1-x3/solution;

  [결과]
  (TYPE I)
   source      p-value
   __________________
   Age          0.0003
   x1            0.0074
   x2            0.6346
   x3            0.0054

  (TYPE III)
source      p-value
   __________________
   Age          0.6829
   x1            0.6610
   x2            0.5401
   x3            0.0054

2) covariate 변수 1개씩만을 넣어서 비교할 때

    Proc glm data=…
    class age
    model y=age x3/solution;

[결과]
(TYPE I)
   source      p-value
   __________________
   Age          0.0009
   x3            0.0363
  
  (TYPE III)
source      p-value
   __________________
   Age          0.0381
   x1            0.0363

  

과 같이 1), 2)로 달리 했을 때
독립변수 age에 대한 유의성이 달라집니다.  

[질문 1]
Type III에서 p-value를 보면, 1)과 같이 여러개의 covariate를 같이 넣으면 age의 효과가 covariate x3로 인한 것이였음이 나타나서 유의하지 않은데, 2)처럼 x3만 따로 넣으면 age효과가 유의한 것으로 나타납니다. 1)의 방법이 맞다고 생각했는데, 개별적으로 보니까 혼동스럽습니다. (p-value의 유의성 자체가 차이가 나서요) y에 대한 age의 효과 차이와 각각의 covariate가 y에 과연 영향을 어느 정도 주는 지 보려 할 때, 둘 중 어느 방법이 맞는 것인지요?

[질문 2]
1)과 같이 여러 covariate를 넣어서 효과를 함께 볼 때(이 방법이 맞는다는 가정하에), 마지막 x3의 p-value만 Type I, III 에서 모두 같은 게 이상합니다.. x1,x2,x3 모두가 개별적인 covariate로 취급되지 않은게 아닌가 하는 의심이 들고요.. 순서에 따라서 x3만 covariate로 취급됐나 하는 의심.. (SAS 관련 교재에는 1)과 같이 한꺼번에 여러 covariate를 넣어서 유의성을 볼 수 있다고 되어 있는데, 결과를 보니 의문이 생겨서요)

[질문 3]
이 질문은 인자 컨트롤에 대한 질문인데요..
age의 차이를 주요하게 보려고 독립변수로 잡아서 실험시에 컨트롤을 했지만, 실제로 y에 영향을 미치는 요인이 배경지식(x1-x3)이 중요할 수 있어서 covariate로 취급한다는 게 맘에 걸립니다.
어떤 요소(age, 배경지식)를 중요하게 보느냐 하는 관점에 따라서 지금과 같이 covariate로 배경지식을 처리하는 게 무리가 없는 것인지.. 아니면 이렇게 컨트롤 하지 못한(또는 컨트롤이 어려운) covariate 변수가 독립변수와 종속변수 모두와 상관관계가 있을 때는 어떻게 하는 것이 좋을까요? 무리를 해서 컨트롤을 해서라도 모두 주인자로 보고 ANOVA로 분석을 하는게 맞는 것인지, 아니면 지금처럼 ANCOVA나 correlation 결과를 보고 해석시에 주인자뿐만 아니라 covariate로 취급한 변수의 중요성을 언급하는 게 나은 것인지..

질문도 많고 글이 길어져서 죄송합니다.
답변 꼭 부탁드립니다.


Legacy document_srl: 80249 / Legacy URL: http://www.statedu.com/QnA/80249

Similar Posts