상관관계 분석 시 정규성 관련 질문

안녕하세요 교수님!

항상 친절한 답변 감사드립니다. 오늘도 해결하기 힘든 문제가 있어 교수님께 조언을 구합니다.

저는 현재 여러 변수들의 상관 관계를 연구해보고 있습니다.

3주동안 26명의 참가자들 대상으로 수업을 한 뒤 수집한 post data를 가지고 상관 분석을 진행하려 하는데요, 아래처럼 크게는 두 변수가 존재하고, 각 변수의 하위변수들이 존재합니다.

1. Content knowledge score (0-152)

1-1. declarative knowledge (0-52)

1-2. model-based knowledge (0-100)

2. 컴퓨팅 스킬 (0-20)

2-1. 컴퓨팅 practices (0-10)

2-2. 컴퓨팅 concepts (0-10)

정규성 검정을 해보니 위에 나열한 모든 변수의 skewness와 kurtosis는 -2에서 2 사이로 나왔으나 declarative knowledge의 shapiro wilk 결과가 유의하게 나왔습니다. 다른 변수들은 skewness가 다 -1에서 1사이인 반면 이 변수만 skewness가 -1.1로 나오기도 했구요.

1. 위에 나열한 하위 변수 전체적으로 상관 관계를 비교해보고 싶어서 declarative knowledge 데이터도 포함하고 싶은데.. 이 상황에선 정규성 만족하지 않는 declarative knowledge는 제외하고 나머지 변수들만 가지고 pearson 상관분석을 진행해야 하는 걸까요?

2. 비모수 방법인 Spearman이나 Kendall’s tau b 상관관계 분석방법을 선택할 경우, 정규성을 충족하는 데이터에도 사용해도 되는 걸까요..? declarative knowledge 까지 포함한 전체 변수의 상관관계 분석이 가능한 방법이 있는지 조언 구합니다.

또한 declarative understanding의 하위에 두 가지, model-based understanding의 하위에 세 가지 변수들도 존재합니다. 

3. 이 다섯 변수들과 컴퓨팅 스킬과의 상관관계도 같이 보고싶은데, 이번엔 하위 변수들 다섯가지는 skewness와 kurtosis는 -2와 2 사이에 존재하나 shapiro-wilk결과가 모두 유의하고, 컴퓨팅 스킬은 shapiro-wilk 결과 정규성을 만족하는 상황입니다. 이 경우에는 상관분석을 아예 할 수 없는 상황인건지, 아니면 정규분포를 따르는 컴퓨팅 스킬을 포함해서 전체적으로 비모수 상관분석을 해도 되는 상황인지도 궁금합니다.

모든 변수들을 각각 모수, 비모수 방법으로 상관 분석을 했을 때에, 변수 간 상관관계의 유의정도는 정도 차이는 있지만 비슷하게 나오는 상황입니다.

이 상황에서 어떤 방법으로 분석을 해야 가장 적합한 것인지 조언 부탁드립니다. 진심으로 감사드립니다!!

Existing replies


이일현 (2025-12-07 16:11:46)

정규성을 만족하는 두 변수간에는 Pearson

정규성을 하나라도 만족하지 못하면 Spearman 으로 합니다. 

예를 들어

A, B : 정규성 만족

C, D : 정규성 불만족

라면

A-B : Pearson

A-C, A-D, B-C, B-D, C-D : Spearman 

으로 합니다. 


학생22 (2025-12-07 18:59:17)

안녕하세요 교수님! 답변 정말 감사합니다!
교수님께서 말씀해주신 대로 진행하겠습니다.

이와 관련해서 두 질문이 더 있습니다.
1. 이렇게 두 개의 다른 방법으로 상관관계를 구한다면 상관관계 계수 비교는 불가능하게 되는건가요? 예를 들어 A-B (Pearson)과 A-C (Spearman), 이 두 상관계수를 비교해서 A가 B와 더 강한 상관관계를 보인다 등의 도출은 불가능한지 궁금합니다!
2. 두개의 다른 분석을 사용했을 때에 결과를 표로 나타낼 경우 모든 변수를 한 테이블에 넣고 각 계수가 Pearson인지 Spearman 계수인지 note로 표기하면 되는걸까요? 아니면 테이블 자체를 pearson대상, Spearman 대상으로 따로 만들어야할까요?
감사합니다!


이일현 (2025-12-08 09:56:17)

1. 상관계수의 크기만으로는 단순히 비교할 수 없습니다. 

상관계수의 크기간에 유의성 비교는 별도로 해야 합니다. 

2. 주석처리 합니다. 


학생22 (2025-12-08 10:04:17)

네, 알겠습니다!! 답변 정말 감사드립니다 교수님!!


Legacy document_srl: 309049 / Legacy URL: http://www.statedu.com/QnA/309049

Similar Posts

  • [re] spss 10.0 버젼과 spss 11.0 버젼이 많이 다른가요/

    SPSS 10 버젼과 11 버젼은 큰 차이는 없습니다. 메뉴 구성이나 형태도 거의 대부분 일치합니다. 다만, 12 버젼의 경우에는 10 이나 11 보다는 추가된 분석이나 내용들이 있기 때문에 약간의 차이가 있습니다. 그러나, 일반적인 경우에는 그 차이를 알 수 없을 정도로 구분하기가 힘이 듭니다. 각 버젼별 차이는 다음의 링크를 참조하십시오. http://www.spss.co.kr/pro/pro_2sps.asp?spss=11

  • [re] 공분산 분석에 대하여

    공분산분석은 ANCOVA라고 하는 고급 분석기법의 하나입니다. 형태는 ANOVA와 똑같은데, 독립변수에 등비(등간 또는 비율)척도인 변수가 있는 경우이지요. >추운 날씨에 수고많으십니다. > >논문 심사중에 교수님에 다음과 같이 추가하라고 하셨습니다. > >’사전검사를 공변인으로 하는 공분산 분석 결과와 그래프 추가’ > >그래서 실험 비교 집단의 사전 사후 검사를 공분산 분석하였습니다. > >방법은 [통계분석]->[일반선형모

  • 통계 분석 문의드립니다

    안녕하세요 학위논문 작성 중 어려운 점이 있어 문의 드립니다. 현재 2 X 2 X 2 repeated-measures ANOVA로 결과를 산출하였는데 그래프 패턴은 제가 원하는 대로 나왔지만 표준편차가 너무 커서 검정값은 유의하지 않은 수준으로 나왔습니다. 이 경우 종속치를 로그변환이나 d’score 등을 구해서 표준편차를 줄일 수 있다는 것을 본 적이 있는데 정확히 어떠한 방법들을 쓸 수 있는지 궁금합니다. 답변 부탁드립니다

  • [re] 유의도 표시할 때…

    p 아마도 표기를 잘못한거 갔네요. P 값의 최소값은 0 이고 최대값은 1 입니다. 그러므로 0.000 보다 작을 수는 없지요. 통계 패캐지를 이용하여 분석을 하면 종종 출력 결과에 P 값이 0.000 으로 표시되는 경우가 있습니다. 이것을 저렇게 잘못 표기한 것으로 생각되어 지는데, 이것은 직접 0.000 으로 써주거나 아니면 *** : p 참고적으로 패키지에 출력되는 값은 소수점 4째 자리에서 반올림되어 보여지는 값입니다.

  • 안녕하세요? 최훈달입니다.

    죄송합니다. 제가 요번에 학회일 하는라 논문에 신경을 못써서 지금에서야 들어왔네요…. 너무 시간이 지나서 기억 나실까 모르겠습니다. 네 맞습니다. 선생님 말씀대로 1. 방법과 재료에 따른 오차의 차이가 있는가? 2. 부위에 따른 오차의 차이가 있는가? 3. 방법,재료와 부위에 따른 오차의 차이가 있는가? 를 알아 보는 것입니다. 너무 어려워서 도대체 엄두가 나지 않습니다. 거듭 사과의 말씀 올리며 답변 부탁드리겠습니다. 틀

  • [re] 요인분석

    일반적으로 요인분석을 할 경우에는 2 문항 이상이 된 것을 기준으로 합니다. 하지만, 상황에 따라서는 한개의 문항만이 요인으로 나오는 경우가 있습니다. 이때 그 문항이 요인으로서의 가치가 상당히 높다고 한다면 한 문항만으로도 사용이 가능합니다. >varimax를 이용하여 요인분석하였을 때 > >5가지요인으로 분류되었는데 > >5가지 중 한가지 요인에서 >문항이 다빠져나가고 한문항만이 남았습니다. >이 요인도 사용할 수 있는건가