[re] Logistic 회귀분석 관련
네. 잘 다녀왔습니다.
제 답변이 도움이 됐다니 다행이네요. 요즘 비 때문에 난리던데, 포항은 괜찮겠죠..
Logistic Regression의 경우 Best Subset이나 Stepwise 등의 최적 변수를 찾는 작업을 minitab에서는 지원을 하지않고 있습니다. 그러므로, 직접 모형을 만들어 주어야 합니다.
우선 최용준님께서 하신 작업은 독립변수를 하나씩 집어넣어 로지스틱 회귀를 한 다음 그때의 P값이 0.25보다 작은 변수를 선택하였습니다. 이런식으로 여러 변수에 대해 실행한 다음 P 값이 0.25보다 작은 변수들을 전부 독립변수를 하여 로지스틱 회귀를 하신 경우이죠.
물론 이런 방법도 좋은 방법중의 하나입니다. 그렇지만, 만약 제가 한다면, 여기에서 한가지 작업을 더하도록 하겠습니다. 여러개의 독립변수들의 각각의 P 값이 있을텐데요. 이 값을 보고 가장 큰 P 값을 갖는 변수를 제거하고 다시 logistic 회귀를 하는 것입니다.
이유는 우선, 각 변수들에서 P 값이 크다는 것은 그 변수가 종속변수(특성값)에 영향을 주지 않거나, 또는 영향을 주더라도 아주 미미하다는 것을 의미합니다. 그러므로 굳이 그런 변수들을 모형에 포함시킬 필요가 없는 것이죠.
위와 같은 형태로 반복하면 결국엔 종속변수에 영향력이 좀더 큰 독립변수들만이 남게 되겠죠.
물론 이 과정에서 주의깊게 보아야 하는 것은 모형의 적합도를 나타내는 Goodness-of-Fit의 P 값이 0.05보다 커야하며, Concodant 의 값 역시 클수록 좋습니다. 될수 있다면 80% 이상이어야 합니다. 이 값들과 비교하면서 검토하시면 됩니다.
… 언제나 최선을 다하는 StatEdu가 되길 빌며 …
>휴가는 잘 다녀오셨는지요?
>답변 주신건 감사합니다
>
>제 모델에 선택된 변수가 최적화 되지 않은 것 같다고 말씀 하셨는데
>구체적으로 설명해 주실수 있는지요?
>
>저 같은 경우 Best Subset 이나 Step wise 대신 각 변수에 대하여 각가 Logistcic
>회귀분석을 사용하고 P값이 0.25보다 작은 변수를 최종 선정 다시 Logistic 회귀분석을 사용하였습니다
>
>포항에서 최용준
Legacy document_srl: 11769 / Legacy URL: http://www.statedu.com/QnA/11769
