[re] 이상치(outlier)제거 관련 질문입니다.
지금과 같이 1 표본일 경우에는 사실 마땅한 근거는 없습니다.
지금과 같은 경우에 가장 좋은 방법은 평균보다는 중위수입니다. 중위수는 비교적 이상값에 영향을 적게 받으므로 좋은 방법이라고 할 수 있습니다.
그러나, 반드시 평균을 구해야 한다면, 이 정도 값이라면 근거 없이 제거를 해도 사실 상관은 없습니다.
또 한가지 방법으로는 표준화를 시켜서 표준화 값의 절대값이 3.0 이상으로 나오면 이상값으로 판정하기도 합니다.
>통계적 조언에 늘 감사드리고 있습니다~
>
>오늘 드릴 질문은,
>
>105%, 130%, 170%, 110%, 125%, 140%, 160%, 20000%
>
>8개 업체의 부채비율(에 대한 평균을 구해야하는데, 이상치(20000%)가 있어서 제거를 하려합니다.
>
>헌데 연구자 임의로 제거하는게 아닌, 통계적인 근거(수치)가 필요한데 도무지 찾을 수가
>
>없네요.. 어떤 분석방법 또는 이론적 근거로 대처해야 할까요??
>
>답변 부탁드립니다~
>
>
Legacy document_srl: 80931 / Legacy URL: http://www.statedu.com/QnA/80931
