LMM분석, 반응변수 결측

안녕하세요. 스탯에듀를 보면서 LMM과 GEE비교를 이해하게 되었습니다. 감사합니다

환자의 중증도를 나이, 성별, 의료기관 종별 등 여러변수와 관련하여 시간에 따른 변화를 분석하고자 합니다.

환자의 중증도가 반응변수이고, 분포가 right-skewed라 log를 적용하여 정규성을 개선하였습니다. 

(사실 이렇게 해도 정규분포는 따르지 않았고, 개선만 하고자 log를 적용하였습니다. 그리고, 여기에서 LMM과 GLMM을 고민하였는데, “외형적”으로는 분석결과가 동일하기 때문에 LMM을 선택하였습니다)

LMM분석시 궁금한 점이 있어서 질문을 올립니다.

환자A는 재원일수(lengh of stay, LOS)가 3일, B는 LOS 5일, C는 LOS가 7일이라  반응변수의 갯수가 다릅니다. 

y11,y12,y13

y21,y22,y23,y24,y25

y31,y32,y34,y35,y36,y37

자료처리시 입원시의 반응변수는 yi1로 생각하면되지만 퇴원시 반응변수는 각각의 재원일수가 다르기때문에 편의상

yi99로 처리하였습니다.

LMM을 분석시에, yi1과 yi99는 반드시 존재하는데, 

yij(j=2,….98)까지의 반응변수들은 불규칙하게 존재하게 됩니다(환자의 재원일수가 각각 다르기때문).

반응변수를 완전 반응변수 자료로 봐야 할지, 결측된 반응변수 자료로 봐야할지 고민이 됩니다.

(한 개체만을 볼때는 결측된 자료가 없는데, 전체 데이터를 보면 결측된 반응변수가 있는 것처럼 보이니, 헷갈립니다)

Existing replies


띠네 (2023-02-12 18:22:14)

답변 감사드립니다. 몇일동안 고민을 하다가 답글을 작성하였습니다.

LMM과 GEE의 경우 censored data의 경우도 분석이 가능하다는 점을 다시 한번 짚어주셔서 감사드립니다.

그렇다면, 

y11,y12,y13

y21,y22,y23,y24,y25

y31,y32,y33,y34,y35,y36,y37
위의 원데이터를 가지고(퇴원일의 반응변수를 y199, y299, y399로 변환하지 않고) 비교하였을 때와 
첫번째 개체: y11,y12,y199

두번째 개체: y21,y22,y23,y24,y299

세번째 개체: y31,y32,y33,y34,y35,y36,y399
퇴원 반응변수를 yi99로 변환하고(입원/퇴원의 변화를 보기 위하여) 
GEE로 분석하였을 때는 어떻게 되나요?
yi1,yi2의 데이터값은 3개, yi3, yi4, yi5 의 데이터값은 2개,…, yi99의 데이터값은 3개가 됩니다. 
첫번째 개체의 y13은 존재하지 않는데, GEE의 경우 이를 어떻게 생각하고 결과가 나오는지 고민이 됩니다.
고민이 많아질수록 분석방법이 명확해지지 않고, 모호해지는게, 고민이 많아 집니다.
긴글 읽어주셔서 감사드립니다.

이일현 (2023-02-14 10:20:44)

LMM이나 GEE 로 분석을 하면 종속변수는

id   일    Y

————–

1    1     y11

1    2     y12

1    3     y13

2    1     y21

:

2    5     y25

3    1     y31

:

3    7     y37

과 같은 형태로 입력해서 분석을 해야 합니다. 

결국 지금 말씀하신 거처럼 y199, y299, y399 와 같은 data set 은 사용할 수 없는 것이죠. 


이일현 (2023-02-10 14:29:25)

LMM 이나 GEE 에서 반복측정된 종속변수가 결측된 경우(censored data: 중도절단) 고민을 하게 되지만, 사실 두 방법은 중도절단된 자료에서도 볼 수 있는 방법이므로 문제가 되지 않습니다. 

두 방법은 모두 중도절단되기 전까지의 자료만 가지고 분석을 하게 됩니다. 

첨언하자면 log 변환후에도 right-skew 되어 있다면 LMM보다는 GEE 로 분석하는 것이 더 좋습니다 

종속변수가 빈도인지 연속형인지에 따라 Poisson, Negative Binary(음이항), Gamma 모형을 선택해서 분석할 수 있습니다. 


Legacy document_srl: 288666 / Legacy URL: http://www.statedu.com/QnA/288666

Similar Posts

  • 조절효과 그래프 문의드립니다.

    먼저, 일전에 매크로 모형과 조절된 매개효과 관련 문의에 대한 답변 진심으로 감사드립니다. 많은 도움이 되었습니다. 이번에 문의 드릴 부분은 조절효과 그래프 관련된 문의입니다. 프로세스 매크로로 조절효과를 보는 그래프를 작성했는데, 경로선의 접점이 나타났습니다. 조절변수의 저. 중, 고 집단에서의 기울기 비교는 가능했습니다. (그래프를 게시글에서 보여드리고 싶었으나, 올릴 방법을 찾지 못하여 올리지는 못하였습니다.) 1. 세개

  • 검정력과 p-value에 관하여..

    case-control study 의 예를 들어 2 group에서 특정 요인의 proportion이 차이가 있는지에 대한 검정을 가정하겠습니다. 1 group의 proportion이 0.032 2 group은 0.014 (임의로 정함) 각 그룹의 n수를 고려하여 power를 구해보면 0.6 정도로 낮은데도 불구하고 p-value가 유의 수준 이하일 경우, power가 0.9 이상이면서 p-value가 유의 수준 이하인 다른 검

  • 요인분석을 이용한 렌즈방향성 test

    아래 text 파일로 된 보고서를 토대로 SAS에서 table을 생성해 봤는데, 잘 안되는 부분이 있어 질문드립니다. 1. 렌즈 방향성의 각도 사이에 서로 연관성이 없습니다. (그래서 저희 생각에는 연속형이 아니기 때문에 그래프나 추세 분석을 하는 것은 의미가 없는 것으로 생각됩니다.) 2. 렌즈 각도는 0, 90, 180, 270 작업 후 45, 135, 225, 315로 진행하게 되는 데 그것을 바탕으로 조합을 하여 상이

  • [re] 같은 그룹에 분류되어 있는 안정도를 알 수 있을까요?

    일단 한가지를 먼저 생각해 주어야 합니다. 군집분석을 해서 3 집단으로 구분을 했을 때, 6개월전(A,B,C)과 6개월후(a,b,c)에 어떤 사람이 6개월 전에는 A 집단에 6개월 후에는 a 집단으로 분류가 되었다고 생각하겠습니다. 이때, A 집단과 a 집단은 같은 집단이라는 보장이 없습니다. 군집분석을 각각 했다면 2 시점에서의 군집,분류함수가 서로 틀리고, 표시 인자도 서로 틀리기 때문입니다. 그리고, 만약 6개월전의 군집

  • [re] 한가지 더요..

    너무 감사드립니다.. 한가지 더 질문을 드릴께요.. sas로 했을 때는 lsmean으로 하고 옵션에 tiff diff를 하면 추정된 두 평균간 검정이 되었었는데요.. spss에서 보정된 값으로 평균비교하는 방법은 어떤건지요..? 말씀하신대로 spss에서 covariates로 age를 두면 사후 검정이 안되네요.. 원래 안되는 건지.. 궁금하구요.. 마지막까지 귀찮게 해드려서 죄송합니다.. ..^^

  • meta 분석 결과에 대한 문의

    메타분석을 했는데 결과를 읽다보니 헤갈려서요. 좀 도와주세요. SPSS로 메타분석을 할수있도록 하는 프로그램을 다운 받아 메타분석을 돌렸습니다. 그룹간의 차이를 보기위하여 ANOVA를 했습니다. 1) QB는 동질성 부분으로만 해석해야 하나요? 2) ANOVA를 해도 나오는데, 저는 3그룹간의 차이가 어쨌든 동질하다고(QB=2.7409, p=.7398) 해석했는데요. 또 각 그룹내 동질성은 Q by Group의 p값을 보고 판단