[re] GLM 예제 관련 문의

일단 Covariate 에 대한 개념을 정확히 이해하지 못해서 발생된 문제입니다. Covariate 에 대한 설명은 용어정리 게시판을 참조하십시오.

우선 Covariate 는 연속형 변수가 들어가야 합니다.
그리고, Factor 는 범주형 변수(문자형 변수, 명목 척도)이어야 합니다.

1차식과 2차식이 나온다는 것은 회귀식과 같은 모형이 나온다는 것이고, 그러기 위해서는 x 에 해당하는 변수는 연속형 변수이어야 합니다. 따라서 Temperature 는 Covariate 이므로(연속형 변수) Ceof(회귀식에서 회귀계수에 해당)가 나오는 것입니다. 하지만 Glass Type 는 유형을 나타내는 범주형 변수이므로 나오지 않는 것입니다.
그럼 범주형 변수에 대한 식은 어떻게 나오는가를 생각하면 회귀분석에서 마치 더미변수(Dummy Variable)외 같은 형태로 출력이 됩니다. 예를 들어 Glass Type 이 1 은 일반유리, 2는 강화유리라고 한다면

   Temperat*GlassTyp      Coef    SE Coef        T      P
   ———————————————————-
                1                   -24.400     4.423    -5.52  0.000  
                2                   -27.867     4.423    -6.30  0.000

위의 식이 의미하는 것은 일반유리, 강화유리의 모형은

         일반유리    y =  -24.4 x
         강화유리    y =  -27.867 x

와 같은 형태의 식이 된다는 것이죠. 즉, 강화유리가 일반유리보다 절편이 3 정도 낮다는 것을 의미하고 그것은 일반유리가 강화유리보다 y 가 더 높다(크다)라는 것을 뜻하는 것입니다.

이 예제는 마치 더미회귀분석을 GLM으로 돌린 것이다라고 생각하면 이해하지 편하실 것입니다.

… 언제나 최선을 다하는 StatEdu가 되길 빌며 …

>Generalized Linear Model 관련하여 문의드리고자 합니다.
>
>Minitab의 GLM 관련 도움말에 나와있는 예제를 읽어보았습니다.
>File 명은 “Exh_aov.mtw”이고 “선형 효과와 이차 효과에 적합하기” 예제입니다.
>이 경우 항목 Model에,Temperature  Temperature * Temperature  GlassType  
>             GlassType * Temperature  GlassType *Temperature *Temperature를 입력
>
>        항목 Covariates에, Temperature를 입력
>
>하더군요, 그리고 세션창의 분석 결과를 보니 분산 분석 결과에는 모델 항목에 있는 인자들에  관련한 내용이 있는데   회귀분석 결과에는 Temperature 관련한 인자에 대한 Coef만 나올뿐 Glasstype에 관한 내용은 하나도 나오지 않습니다. 분산 분석 결과 Glasstype의 P값이 0으로 나왔는데도 불구하고 말입니다. ① 왜 그럴까요?
>제가 궁금해서 Covariate를 이번에는 Glasstype으로 해보니 이번에는 회귀 분석 결과에는 Glasstype관련한 Coef만 나오고 Temperature관련한 값은 없더라구요.
>또 한번 Covariate에 아무것도 넣지 않으니까 문제는 없더라구요.(모든 항목이 분산 분석, 회귀분석값을 나타냄)
>회귀 모델식은 Covariate에 의해서만 결정이 되는 것인가요?
>지난번에 게시판에서 추천하신 풀이 방법(테크윈 문제)에는 모든 인자를 Covariate에 넣고 풀라고 하셨더라구요.
>
>② 회귀분석 결과에서 아래 Glasstype 1과 2는 무슨 의미이고 이를 이용하여 모델식을 세울때 어떻게 적용하는것인가요?
>
> Temperat*GlassTyp                Coef    SE Coef        T      P
>
>                1                   -24.400     4.423    -5.52  0.000  
>                2                   -27.867     4.423    -6.30  0.000
>
>③ Covariate가 유의하다고 결론이 내려졌을 경우 현실 문제로 돌아와서 적용할때 controllable하지
>   않은데(예를 들면 “풍속”이 Covariate 인 경우) 어떻게 결론 지어야 합니까?
>④ GLM을 쉽게 이해할수 있는 예제(Random factor, Covariate, Model 식 등을 이해하기 쉬운)
>   예제를 추천해 주시면 감사하겠습니다.


Legacy document_srl: 12219 / Legacy URL: http://www.statedu.com/QnA/12219

Similar Posts

  • 복수응답 아주 기초적인 질문입니다

    제가 우연한 기회로 오늘 처음으로 이 프로그램을 접하게 되었는데 재밌네요 ^^ 그런데 제가 할려고 하는 것은 엑셀 파일을 읽어들여 분석할려고 합니다 그런데 엑셀에서 문항5에 복수응답을 할 수 있게했습니다 응답의 갯수는 상관없구요 그런데 엑셀에서 기록할 때 한 셀에 2,3 이렇게 기록을 한 것을 그대로 읽어왔습니다 저것을 어떻게 SPSS에서 2와 3에 답한 것이라고 인식시켜줘야할지 잘 모르겠습니다 첨부터 다시 해야하는 것인지 도

  • 모형 적합도지수

    안녕하세요. 경로분석을 하고 있는데 (매개모형) 데이터클리닝방법을 달리하여 경로모형을 따로 분석해봤습니다. 첫번째 방법으로는 RMSEA .65 TLI와 CFI는 .95 이상으로 나오고 두번째 방법으로하느 RMSEA .00 TLI .125, CFI 1.0으로 나오네요. 저는 두번째 방법으로 데이터클리닝을 하는게 더 합당한 것 같은데, 적합도 지수가 흔히 논문에서 보던 수치가 아니라 저널 심사자들한테 공격을 받을 여지가 있는게 아

  • 정규성 검정 문의드립니다.

    총 표본수는 185입니다. 교육 수행 유무 에서 교육을 받지않았다가 8명, 받았다가 177명입니다. 받지않았다가 30이하이므로 중심극한정리에 벗어나고 첨도 값에도 벗어납니다(18.7) 비모수통계(?) 에 대해 아직 잘 모르지만 꼭 비모수통계로 돌려야 하나요. 총 표본이 185라 정규성을 만족한다고 가정하고 t-test, 상관관계분석, 위계적회귀분석을 시행하면 안되나요 미리 답변감사드립니다.

  • [re] Multinomial logistic regression 결과 표에서 궁금한 것이..

    Intercept 는 절편에 해당하는 부분으로 결과에는 큰 영향을 주지 않으므로 빼셔도 무방합니다. 실제로 절편에 대한 부분은 해석을 하지 않습니다. 하지만, 가능하다면 넣어주시는 것이 모양상 더 좋기는 합니다. Wald 값은 회귀분석에서 나오는 T 값과 같은 의미를 가집니다. 그러므로, 이 값은 클 수록 유의해지게 됩니다. 실제 해석을 할 때는 Wald 값 자체를 보지 않고 p 값을 보고 해석을 하면 됩니다. 참고하신 책은

  • spss그래프 질문요^^

    안녕하세요 spss그래프 관련하여 문의드립니다.. 시간과 질병을 회귀분석으로 돌려 시간에 따른 질병의 odd비를 spss를 통해 그래프를 그리려고 합니다. 가로축을 독립변수(시간)으로 하고 세로를 질병의 odds비로 하려고 하는데 이런경우엔 spss에서 어떤식으로 그래프를 그 려야 하는지 모르겠습니다..(첨부된 파일에 있는 그래프처럼 그리려고 합니다..) 95%신뢰구간 포함하여 그리려고 하는데 spss에서 어떻게 그려야 하는지

  • [re] 범주형 자료의 요인분석

    명목 척도와 같은 범주형 자료는 우리가 흔히 알고 있는 요인분석을 할 수 없습니다. 이 경우에 가장 많이 사용하는 방법으로는 대응일치분석과 다차원척도법을 이용한 방법이 가장 일반적이며, 사용하기에 편리합니다. … 언제나 최선을 다하는 StatEdu가 되길 빌며 … >언제나 친절한 답변을 해주시는 선생님께 깊은 감사의 말씀을 올립니다. > >요인분석의 경우 일반적으로 등간척도 이상의 자료에 대해서 사용하는 것이 바람직하지