통계분석을 시작하기 전에 먼저 확인해야 할 것들
통계분석은 프로그램을 실행하는 것에서 시작하지 않습니다. 어떤 연구문제를 가지고 있는지, 어떤 데이터가 수집되었는지, 변수들이 어떤 척도로 측정되었는지를 먼저 확인해야 합니다.
분석방법은 데이터가 아니라 연구문제에서 출발합니다.
같은 데이터라도 알고 싶은 질문이 무엇인지에 따라 분석방법은 달라집니다. 집단 간 차이를 보고 싶은지, 변수 간 관계를 보고 싶은지, 어떤 요인이 결과에 영향을 주는지 알고 싶은지에 따라 t-test, 분산분석, 상관분석, 회귀분석 등이 선택됩니다.
변수의 척도를 확인해야 합니다.
분석방법을 선택할 때 변수의 척도는 매우 중요합니다. 명목척도, 서열척도, 등간척도, 비율척도 중 어디에 해당하는지에 따라 사용할 수 있는 통계분석이 달라집니다. 예를 들어 집단을 구분하는 변수인지, 평균을 계산할 수 있는 변수인지, 연속형 변수인지에 따라 분석의 방향이 달라집니다.
자료의 구조를 확인해야 합니다.
데이터가 독립된 관측값인지, 반복측정 자료인지, 여러 집단으로 나누어진 자료인지도 중요합니다. 같은 사람을 여러 번 측정한 자료와 서로 다른 집단을 비교하는 자료는 분석방법이 다릅니다.
결과 해석은 연구 맥락 안에서 이루어져야 합니다.
p-value나 유의확률만으로 결론을 내리기는 어렵습니다. 분석 결과는 연구문제, 표본 크기, 측정 방법, 변수의 의미와 함께 해석해야 합니다. 통계적으로 유의하다는 것과 실제로 의미 있는 결과라는 것은 항상 같은 말이 아닙니다.
정리
통계분석을 시작하기 전에는 최소한 아래 내용을 먼저 확인하는 것이 좋습니다.
연구문제는 무엇인가?
종속변수와 독립변수는 무엇인가?
각 변수의 척도는 무엇인가?
집단 비교인지, 관계 분석인지, 예측/설명 모형인지?
자료 구조는 독립표본인지 반복측정인지?
분석 결과를 어떤 연구 맥락에서 해석할 것인지?
이 과정을 먼저 정리하면 통계 프로그램을 실행하기 전에 분석 방향을 훨씬 명확하게 잡을 수 있습니다.