로지스틱 회귀분석에 대해서 또다시 질문드립니다.
제가 8가지의 독립변수를 넣어 로지스틱 회귀분석을 했고, 전진선택법을 사용했습니다.
이미 univariate하게 봤을 때는 8가지 독립변수가 모두 종속변수에 유의미한 영향을 주고 있었구요.
전진선택법을 사용해서 multivariate하게 살펴보려고 했는데,
유의미하게 나타난 4개의 변수 중에서 2개의 변수가 종속변수에 미치는 영향력의 방향성이 달라져버렸습니다.
가량 univariate하게 봤을 때는 OR이 >1이었는데 (이렇게 나오는 것이 연구 가설과도 맞습니다) multivariate하게 보니 OR<1로 나타납니다. ㅠ.ㅠ
다중공선성 문제인가해서 살펴보았는데 모두 변수의 VIF<10이었구요...
차라리 유의미하지 않게 나오면 좋을텐데…
무슨 문제인지… 어떻게 해야 좋을 지 몰라서 조언 부탁드립니다. ㅜ.ㅜ
또다른 질문인데요,
전진선택법을 사용했더니 총 4개의 모델이 제시되었습니다. 하지만 변수가 추가될 때마다 분류정확도가 89.1로 동일하게만 나타나는데요
이런 경우, 제가 논문 결과에 임의로 첫번째 모델 (변수의 수가 적은 모델)만을 사용해도 되는 것인지요?
Existing replies
이일현 (2012-02-21 13:30:58)
이건 결과를 봐야 알 듯 하네요.
우선 방향성이 달라졌는데, 유의하지 않다면 상관이 없습니다. Univariate나 Multivariate 에서 모두 유의한데, 방향성이 달라지면 그 원인을 찾아야 합니다.
Legacy document_srl: 107963 / Legacy URL: http://www.statedu.com/QnA/107963
