적합도 검정 관련
안녕하세요.
다중 로지스틱 회귀분석에 대한 적합도 검정 관련한 문의들이 많았던 것 같은데,
논문을 쓰다 궁금한 점이 있어 문의드립니다.
주요 관심변수에 따른 사망 위험을 보고자 관련 보정요인들을 넣고 다중 로지스틱 분석을 시행하였습니다.
결과에서 Hosmer 적합도 검정은 p<0.001 로 나와서 모형이 적합하지 않았습니다.
ROC 커브를 그렸을 때 설명력이 72% 정도로 나오는데, 이러한 결과가 모형의 설명력에 대한 근거가 될까요?
연구 대상이 약 20만명 이상으로 n수가 큰데, 적합도 검정이 <0.05더라도 해당 모형에 대한 결과를 해석하여 논문에 써도 괜찮을지요?
혹시 다른 적합도 검정 방법이 있을까요?
아니면 분석 모형을 다시 검토해봐야하는 것인지 문의드립니다.
Existing replies
장꾸 (2023-03-15 14:52:11)
명쾌하고 빠른 답변 감사드립니다.
추가적인 질문 한가지 더 드리겠습니다.
독립변수가 연속형이 아닌, 범주형 변수이라 cut-point를 제시하기 어려울 것 같은데,
이런 경우에는 모형의 적합도를 어떤걸 제시하면 좋을지요?
이일현 (2023-03-16 16:24:42)
범주형 변수라면 분류정확도와 민감도, 특이도 등만 제시하면 됩니다.
이일현 (2023-03-15 14:39:51)
data가 20만 case 라면 H-L 적합도 검정은 무시하셔도 됩니다.
기본적으로 chi-square 통계량은 n 수에 민감합니다.
그래서 n 이 커지면 p-value 는 작아지게 됩니다.(사실 이것은 모든 통계분석에서 공통적인 사항).
따라서 이 정도 n 에서는 p<.0000001로 나오게 됩니다.
H-L 적합도 검정은 적은 표본 수(특히 n<200)에서 확인하는 것입니다.
오히려 이렇게 표본 수가 크다면 Youden index 를 이용해서 cut-point 를 찾아주고 민간도, 특이도 및 PPV, NPV 등을 제시하는 것이 더 좋습니다.
Legacy document_srl: 289852 / Legacy URL: http://www.statedu.com/QnA/289852
