[re] 등분산과 정규분포
정규성은 data의 형태가 정규분포이어야 한다는 것입니다. 일반적으로 많이 사용하는 T-test, ANOVA 등에서는 표본의 data가 정규분포이어야 한다는 조건이 있습니다. 그래서, 표본이 정규분포가 아니게 되면, 분석의 결과를 신뢰할 수 없게 됩니다.
예를 들어, A, B 두집단이 있을 경우에 A 집단의 data가 정규분포이어야 하며, B 집단의 data가 정규분포이어야 합니다.
등분산성은 T-test, ANOVA 등에서 역시 기본적으로 성립되는 조건입니다. 이것은 A, B 두 집단의 분포의 모양이 같다는 것입니다. 즉, A, B가 우선 정규분포어야 합니다. 그럴 때, A, B 각각의 그래프 모양이 나오는데, 정규분포라 하더라도 표준편차에 따라서 그래프이 모양이 상당히 차이를 보이게 됩니다. 이렇게 그래프 모양이 상당한 차이가 있게 되면(등분산이 아니면) 역시 분석 결과의 p 값에 오차가 생기게 됩니다.
그래서, 각 집단의 그래프 모양이 같다는(등분산, 표준편차가 심하게 차이가 나지 않는다는) 가정이 필요한 것입니다.
… 언제나 최선을 다하는 StatEdu가 되길 빌며 …
>이 두가지에 대한 확실한 개념이 서질 않습니다.
>등분산은 leven, 정규성은 shapiro…로 하는 것은 알겠습니다만.
>두 가지의 개념에 대해서 자세히 설명해 주세요..
>감사합니다 ..
Legacy document_srl: 83997 / Legacy URL: http://www.statedu.com/QnA/83997
