[re] 주성분분석과 요인분석

요인분석의 기본가정으로는

1. 변수는 등간척도 이상의 연속형
2. 각 변수는 정규분포
3. 관측값은 서로 독립이고, 등분산

을 들 수 있습니다.
우리가 분석을 할 경우에 항상 문제가 되는 것은 정규성가정입니다. 이것을 만족할 경우에는 별 문제가 없지만 그렇지 않을 경우에는 어떻게 해야 하는가 하는 난관에 부딪히게 됩니다. 그래서 나온 분석기법이 비모수 검정이 있기는 하나 이것은 아직 초급분석의 수준에서 연구가 이루어져 있기 때문에 완전한 대체 방법은 아닙니다.
그래서, 우선적으로 생각할 수 있는 방법은 변수변환입니다. log, sqrt, 1/x  등의 기법을 사용하거나 Box-Cox 의 변환 등을 이용하기도 합니다. 그러나, 이렇게 했을 경우에도 만족하지 못했을 경우에는 연구자는 심각하게 고민을 해야 합니다.

우선, 사용된 변수가 얼마나 중요한가를 생각해야 합니다. 만약, 이 변수의 중요도가 떨어진다면 빼고 분석을 할 수 있습니다. 그러나, 상당히 중요한 변수라면 또다시 문제가 발생됩니다. 이때는 그 변수가 정규성을 어마나 위배하고 있는지를 확인해서 만약 아주 심각하게 문제가 있지 않다라는 판단이 선다면 어느 정도의 오차를 감수하고 분석을 하는 것도 하나의 방법입니다.
물론 통계 전공자의 입장으로 봤을 경우에는 빼야 된다라고 하고 싶지만, 많은 기간 응용쪽에 관심을 가지고, 분석해 본 결과 오차와 분석후의 효과를 서로 비교했을 때 오차를 감수하더라고 분석을 하는 것이 더 효과가 좋은 경우가 많이 있었기 때문입니다.

… 언제나 최선을 다하는 StatEdu가 되길 빌며 …

>대부분의 통계분석은 정규분포에 기반하는 것으로 알고있습니다.
>통계기법중에 principal component anlaysis와 factor analysis도 정규 분포가 이루어져야만 분석 가능한것인지요?
>만약 정규분포를 이루지않아 log를 취하는등 처리를 하였는데요 정규분포를 이루지 않으면 분석에서 항목을 제외해야하나요? 아니 위 두 분석을 하는데 다른 방법이 있나요?
>


Legacy document_srl: 79284 / Legacy URL: http://www.statedu.com/QnA/79284

Similar Posts