PCA 분석시 시료 형태

안녕하세요

PCA분석을 통해 결과를 도출하는 연구 계획을 하며, 문의 사항이 있어서 글을 남깁니다. 

기존 한 논문에서는 50개 장소에서 실내공기질 시료(연속 변수 20 종, 일부 변수간 상관관계 있음)를 3회 반복 측정한 자료(총 150개 샘플)로 PCA 분석한 경우를 봤습니다. 

문의 1 

3회 반복한 자료는 독립이 아니기 때문에 PCA를 위해서 3회(일) 반복측정한 값의 평균 또는 3개 중 1개 시료를 선택해서 분석하는 게 맞지 않을지요? 

(물론, 한 장소 내 실내공기질의 일일 변이가 약간 있긴 합니다)

문의 2

PCA 분석 목적이라면, 

50개 장소의 3회 반복하여 150개 샘플을 채취하는 것이 적절할지 

아니면 150개 장소에서 1회 측정한 자료를 측정하는 게  적절할지요? 

항상 한줄기의 빛이 되는 도움을 받아 감사드립니다.

Existing replies


이일현 (2022-03-05 19:05:03)

1. 보통은 평균을 내서 분석하는 것이 좋습니다. 

동일 장소에서 3회 측정한 경우, 외적인 영향들에 의해서 그 측정값은 모두 다를 수 밖에 없습니다. 

이걸 평균을 내서 사용을 하면 그러한 외부 변수들의 영향을 어느 정도 통제가 되는 효과가 있기 때문이죠. 

2. 절대적인 답은 없습니다. 

하지만 평균내서 사용하는 것이 좀 더 일반적입니다. 


Legacy document_srl: 280092 / Legacy URL: http://www.statedu.com/QnA/280092

Similar Posts