EDA단계에서의 로그변환 질문드려요ㅠㅠ

 종속변수는 생존여부이고,

독립변수는 총 49개입니다. 이중에 연속형 변수가 23개인데, 연속형 변수의 대부분이 right-screwed 형태를 띄고 있습니다. 지금 EDA만 진행하는 과정인데 EDA과정에서 요인분석이나 PCA같은 분석을 진행할 때에도 right-screwed된 변수들은 로그변환을 취하는게 좋은건가요??

저는 좋다고 생각하는데 제 친구는 EDA단계에서 할 필요가 없는 거 아니냐고 묻네요.

독립변수들이 의학자료이다 보니까 범위가 굉장히 큽니다. 

예를 들면 0~20사이인 관측값들이 80%이고, 특정 질병에 걸린 사람들은 10000~100000의 값을 갖는 변수들이 있어서 질문드립니다.


Legacy document_srl: 248983 / Legacy URL: http://www.statedu.com/QnA/248983

Similar Posts

  • 동질하지 않거나 정규분포가 아닌 집단의 반복측정..

    교수님 안녕하세요 석사 졸업 논문 진행중인 학생입니다. 책도 찾아보고 여기저기 자문을 구하다가 답답한 마음에 여기에 글을 올려봅니다.. 실험군과 대조군(임의표출)에게 세 차례에 걸쳐 세가지 종속변수(연속변수)를 측정했습니다. 그런데 대조군에서 종속변수 일부가 정규분포하지 않았고, 종속변수 세가지 중 한가지가 실험군 vs 대조군 간 동질하지 않았습니다. 1) 정규분포하지 않은 집단을 RM-ANOVA 할 수 있는지요? (박스의 동

  • Amos 소수점 자리수

    안녕하세요. AMOS에서 제가 살펴보려고 하는 상호작용항의 경로계수가 유의한데 비표준화계수가 0으로 나왔습니다(표준화계수는 .10). 아마도 소수점 네 자리 이상의 아주 작은 수여서 그런 것 같습니다. Amos Estimation 표에서는 소수점 세 자리까지 표시가 되는데요, 소수점 자리수를 늘릴 수 있는 방법이 있을까요? 바쁘시겠지만 간단하게라도 답변 주시면 감사하겠습니다. 그럼 부탁드립니다.

  • error term correlation 관련 문의드립니다

    안녕하세요 제가 stata와 amos를 활용해서 구조방정식을 활용하고 있습니다. 통계를 보니 item 사이의 CFI TLI가 낮아서 error term correlation (오차항 상관관계 분석)을 실행해보려 합니다. 혹시 어떠한 방법으로 실행을 해야 되는지에 대해서 문의를 드립니다. 실증적으로 통계프로그램에서 실행할 수 있는 방법에 대해서 문의 드려요 고맙습니다.

  • 분산분석 및 관리도

    안녕하세요..항상 도움 많이 받고 있습니다. 다름이 아니라 4개 업체의 6개월간 성과를 평가하고자 하는데요.. 자료는 아래와 같이 존재하고여.. (점수는 수치형)일원배치 분산분석으로 평균비교를 했을 때 업체간 유의한 차이를 보이지 않았어여.. 업체 점수 A 50 A 60 A … A A B B B B B B C C C C C C D D D D … D 40 D 55 이 자료를 가지고 X bar 관리도를 사용하였더니 관리한계

  • 가중치

    model 6로 논문을 작성하고 있습니다. 매크로에서는 가중치를 인식하지 못해 n수가 가중치를 반영하지 않는 값에 대한 결과가 나오는데, 논문 작성시에 빈도분석과 그외의 모든 값들을 가중치가 적용된 값으로 작성하고 이중매개효과에 대한 결과는(가중치는 적용된 상황) n수가 다른 채로 결과를 작성해도되는것인가요? 하단의 다른 글에(유사한 상황인지는 모르겠으나) , ‘가중치를 적용해서 분석한다면 복합표본분석을 한 후 B, SE 값으

  • 2종의 패널데이터 분석 독립변수 범주 묶기

    연구에 대해 간략히 말씀드리면, A)변수(독립변수)는 패널조사 사업체용 설문데이터 중 기업 교육훈련투자비로, (B)변수 (종속변수)는 패널조사 근로자용 설문데이터 중 숙련도 값을 활용하고자 합니다. 그런데, 변수(설문문항)가 서로 다른 두 가지 데이터를 stata를 통해 활용하다보니 아래와 같은 문제로 고민하고 있습니다. 패널조사의 근로자용 설문은 사업체용 설문에 응한 사업체에서 근무하고 있는 N명의 근로자를 대상으로 합니다.