허용오차, 표본오차, 표준오차, 표준편차
대충은 알겠는데 여전히 개념이 혼동됩니다^^.
다음의 질문을 몇가지 드리오니 부디 답하여 주시면 고맙겠습니다.
1. 표본 A와 표본 B의 평균과 표준편차가 다음과 같았습니다. 이 두 표본이 같은 모집단에 의한 것이 아니라고 할 수 있는가? 하는 문제가 있을 때..
표본 A : 평균 249.4, 표준편차 36.0, 표본수 144
표본 B : 평균 260.1, 표준편차 39.0, 표본수 169
일 때 각각의 모비율의 95% 신뢰구간을 추정하는 식이
‘평균 +/- 1.96 x 표준편차/root(표본수)’
이므로
표본 A의 모집단 : 249.4 +/- 1.96 x 36/ root(144) = (243.5 – 255.3)
표본 B의 모집단 : 260.1 +/- 1.96 x 39/ root(169) = (254.2 – 266.0)
가 되어 범위가 겹치므로 ‘같은 모집단에 의한 것이 아니다’는 기각되는 것이 맞는 것인가요?
2. 1.에서처럼 표준편차를 표본수의 제곱근으로 나눈 값이 ‘표준오차’가 된다는 식이 있습니다.
그런데 이 식이 이해가 잘 안됩니다. 표준오차란 것이 표본을 무수히 추출했을 때 표본의 평균들의 표준편차를 나타내는 값이라면요.. 단 하나의 표본의 표준편차와 표본수만으로 어떻게 무수히 반복된 표본의 평균들의 분포를 알 수가 있는 것인가요? 이 말대로라면 모집단에서 표본을 어떻게 뽑 건 간에 항상 그 표본의 표준편차를 표본수의 제곱근으로 나눈 값은 일정하다는 소리가 되는 것 아닌가요?? 혹시 표준오차를 구하는 식의 표준편차가 모집단의 표준편차라면 1.에서 사용한 식처럼 표본의 표준편차로 모집단의 신뢰구간을 추정할 수가 없는 것이겠고요..
3. 이번에 17대 국회의원 선거가 있었습니다. 여론조사 때 XX% 표본오차 +/- 3.1% 이런 말이 나오는데요… 여기 <통계강좌>를 보면 이 때 쓰인 ‘표본오차’는 ‘허용오차’라고 바로잡아야 하는 것이 맞는지요?
4. 3.의 예를 들어 허용오차가 +/-3.1%라고 할 떄
후보 A : 32.4%
후보 B : 33.5%
는 32.4+/-3,1과 33.5+/-3.1이 서로 겹치므로 통계적으로 차이가 없는 것이지요? (TV에서도 항상 이런 간단한 방식으로 설명으로 하죠^^)
그런데 궁금한 게.. 이 때 각 후보들의 32.4%와 33.5%는 표본의 평균값인가요, 모집단의 평균값인가요?
1> 만일 표본의 평균값이라면, 허용오차란 표준편차와 같은 개념이라 할 수 있는가요? (아마 이건 아닐 것 같습니다. 표본의 범위가 겹친다고 통계적으로 차이가 없다고는 안 하니까요.. 모집단의 신뢰구간을 추정해야 하니까요..)
2> 만일 모집단의 평균값이라면, 허용오차란 모집단의 표준편차와 같은 개념이라 할 수 있는가요? 혹은 1.의 식처럼 ‘1.96x표준오차’와 같은 개념이라 할 수 있는가요?
3> 혹 표본들을 무수히 반복했을 때 얻어진 평균들의 평균값이라면, 허용오차란 표준오차와 같은 개념이라 할 수 있는가요?
여러 경우를 가정해봐도 결국 허용오차는 표준오차나 표준편차로 표현이 될 듯 한데.. 도데체 허용오차의 정체는 무엇입니까?
개념이 없어 혹 바보같은 질문을 했더라도 너그러이 이해해 주십시오^^.
좋은 사이트를 알게 되어 고마워하고 있다는 말씀도 아울러 드립니다.
답변 기대합니다.
Legacy document_srl: 79470 / Legacy URL: http://www.statedu.com/QnA/79470
