EDA단계에서의 로그변환 질문드려요ㅠㅠ
종속변수는 생존여부이고,
독립변수는 총 49개입니다. 이중에 연속형 변수가 23개인데, 연속형 변수의 대부분이 right-screwed 형태를 띄고 있습니다. 지금 EDA만 진행하는 과정인데 EDA과정에서 요인분석이나 PCA같은 분석을 진행할 때에도 right-screwed된 변수들은 로그변환을 취하는게 좋은건가요??
저는 좋다고 생각하는데 제 친구는 EDA단계에서 할 필요가 없는 거 아니냐고 묻네요.
독립변수들이 의학자료이다 보니까 범위가 굉장히 큽니다.
예를 들면 0~20사이인 관측값들이 80%이고, 특정 질병에 걸린 사람들은 10000~100000의 값을 갖는 변수들이 있어서 질문드립니다.
Legacy document_srl: 248983 / Legacy URL: http://www.statedu.com/QnA/248983
