LMM분석, 반응변수 결측
안녕하세요. 스탯에듀를 보면서 LMM과 GEE비교를 이해하게 되었습니다. 감사합니다
환자의 중증도를 나이, 성별, 의료기관 종별 등 여러변수와 관련하여 시간에 따른 변화를 분석하고자 합니다.
환자의 중증도가 반응변수이고, 분포가 right-skewed라 log를 적용하여 정규성을 개선하였습니다.
(사실 이렇게 해도 정규분포는 따르지 않았고, 개선만 하고자 log를 적용하였습니다. 그리고, 여기에서 LMM과 GLMM을 고민하였는데, “외형적”으로는 분석결과가 동일하기 때문에 LMM을 선택하였습니다)
LMM분석시 궁금한 점이 있어서 질문을 올립니다.
환자A는 재원일수(lengh of stay, LOS)가 3일, B는 LOS 5일, C는 LOS가 7일이라 반응변수의 갯수가 다릅니다.
y11,y12,y13
y21,y22,y23,y24,y25
y31,y32,y34,y35,y36,y37
자료처리시 입원시의 반응변수는 yi1로 생각하면되지만 퇴원시 반응변수는 각각의 재원일수가 다르기때문에 편의상
yi99로 처리하였습니다.
LMM을 분석시에, yi1과 yi99는 반드시 존재하는데,
yij(j=2,….98)까지의 반응변수들은 불규칙하게 존재하게 됩니다(환자의 재원일수가 각각 다르기때문).
반응변수를 완전 반응변수 자료로 봐야 할지, 결측된 반응변수 자료로 봐야할지 고민이 됩니다.
(한 개체만을 볼때는 결측된 자료가 없는데, 전체 데이터를 보면 결측된 반응변수가 있는 것처럼 보이니, 헷갈립니다)
Existing replies
띠네 (2023-02-12 18:22:14)
이일현 (2023-02-14 10:20:44)
LMM이나 GEE 로 분석을 하면 종속변수는
id 일 Y
————–
1 1 y11
1 2 y12
1 3 y13
2 1 y21
:
2 5 y25
3 1 y31
:
3 7 y37
과 같은 형태로 입력해서 분석을 해야 합니다.
결국 지금 말씀하신 거처럼 y199, y299, y399 와 같은 data set 은 사용할 수 없는 것이죠.
이일현 (2023-02-10 14:29:25)
LMM 이나 GEE 에서 반복측정된 종속변수가 결측된 경우(censored data: 중도절단) 고민을 하게 되지만, 사실 두 방법은 중도절단된 자료에서도 볼 수 있는 방법이므로 문제가 되지 않습니다.
두 방법은 모두 중도절단되기 전까지의 자료만 가지고 분석을 하게 됩니다.
첨언하자면 log 변환후에도 right-skew 되어 있다면 LMM보다는 GEE 로 분석하는 것이 더 좋습니다
종속변수가 빈도인지 연속형인지에 따라 Poisson, Negative Binary(음이항), Gamma 모형을 선택해서 분석할 수 있습니다.
Legacy document_srl: 288666 / Legacy URL: http://www.statedu.com/QnA/288666
