[re] Logistic 회귀분석 관련

Bytarra1 2026-04-21

네. 잘 다녀왔습니다.
제 답변이 도움이 됐다니 다행이네요. 요즘 비 때문에 난리던데, 포항은 괜찮겠죠..

Logistic Regression의 경우 Best Subset이나 Stepwise 등의 최적 변수를 찾는 작업을 minitab에서는 지원을 하지않고 있습니다. 그러므로, 직접 모형을 만들어 주어야 합니다.

우선 최용준님께서 하신 작업은 독립변수를 하나씩 집어넣어 로지스틱 회귀를 한 다음 그때의 P값이 0.25보다 작은 변수를 선택하였습니다. 이런식으로 여러 변수에 대해 실행한 다음 P 값이 0.25보다 작은 변수들을 전부 독립변수를 하여 로지스틱 회귀를 하신 경우이죠.
물론 이런 방법도 좋은 방법중의 하나입니다. 그렇지만, 만약 제가 한다면, 여기에서 한가지 작업을 더하도록 하겠습니다. 여러개의 독립변수들의 각각의 P 값이 있을텐데요. 이 값을 보고 가장 큰 P 값을 갖는 변수를 제거하고 다시 logistic 회귀를 하는 것입니다.
이유는 우선, 각 변수들에서 P 값이 크다는 것은 그 변수가 종속변수(특성값)에 영향을 주지 않거나, 또는 영향을 주더라도 아주 미미하다는 것을 의미합니다. 그러므로 굳이 그런 변수들을 모형에 포함시킬 필요가 없는 것이죠.
위와 같은 형태로 반복하면 결국엔 종속변수에 영향력이 좀더 큰 독립변수들만이 남게 되겠죠.
물론 이 과정에서 주의깊게 보아야 하는 것은 모형의 적합도를 나타내는 Goodness-of-Fit의 P 값이 0.05보다 커야하며, Concodant 의 값 역시 클수록 좋습니다. 될수 있다면 80% 이상이어야 합니다. 이 값들과 비교하면서 검토하시면 됩니다.

… 언제나 최선을 다하는 StatEdu가 되길 빌며 …

>휴가는 잘 다녀오셨는지요?
>답변 주신건 감사합니다
>
>제 모델에 선택된 변수가 최적화 되지 않은 것 같다고 말씀 하셨는데
>구체적으로 설명해 주실수 있는지요?
>
>저 같은 경우 Best Subset 이나 Step wise 대신 각 변수에 대하여 각가 Logistcic
>회귀분석을 사용하고 P값이 0.25보다 작은 변수를 최종 선정 다시 Logistic 회귀분석을 사용하였습니다
>
>포항에서 최용준

Legacy document_srl: 11769 / Legacy URL: http://www.statedu.com/QnA/11769

QnA 자료실

통계값이 나온상태에서 남여 차이를 알 수가 있나요?
Bytarra1 2026-04-21

30명의 환자가 캠프전후에 혈당수치나 다른 혈액검사 결과 변화 여부를 Wilcoxon test 로 결과를 얻었습니다. 제가 통계로 얻은 값들은 남녀가 모두 포함되어 있는 data 인데 이 값들은 남과 여 각각의 항목으로 비교할 수도 있을까요? (예를 들어 30명의 모집단에서는 캠프 전후 의미있게 혈당치가 감소하였는데 남자가 여자보다 어떻다더라, 아님 각각의 항목은 어떤지 궁금하네요..남자 여자의 N 수가 18 명, 12명 이렇

Read More 통계값이 나온상태에서 남여 차이를 알 수가 있나요?
QnA 자료실

g*power 에 대해 여쭈어봅니다.
Bymmmh 2026-04-21

교수님 안녕하세요. g*power로 표본 산출하는 것에 대해 여쭈어보고자 합니다. 연구 모형은 단일매개효과 모형이며 Process Macro 모델 4를 사용하여 분석 하고자합니다. 독립변인- 하위요인 2개, 차원척도 매개변인-하위요인 3개, 차원척도 입니다. g*power로 표본 산출시 F TEST – Linear multiple regression : Fixed model, r2 from zero a priori : comp

Read More g*power 에 대해 여쭈어봅니다.
QnA 자료실

독립t검정과 대응t검정의 차이를 질문드립니다.
Bytarra1 2026-04-21

두 품종의 벼 A, B에 대하여 수확량을 비교하려 한다. 토질에 따라 수확량이 차이날 수 있으므로 7군데의 농지를 랜덤추출한 후, 각 농지마다 100평씩의 땅을 두 군데 골라 A 품종과 B 품종의 벼를 심어 수확량을 조사해보니 다음과 같은 결과를 얻었다. 농지 1 2 3 4 5 6 7 품종A 48.2 44.6 49.7 40.5 54.6 47.1 51.4 품종B 41.5 40.1 44.0 41.2 49.8 41.7 46.8 두

Read More 독립t검정과 대응t검정의 차이를 질문드립니다.
QnA 자료실

GEE 결측값 처리 방식 문의
Bynamsukim 2026-04-21

안녕하세요 교수님, GEE에 관하여 궁금한 점이 있어 글을 올립니다. https://www.youtube.com/watch?v=QhIlNu9UO20 위 영상으로 GEE를 공부했는데요, GEE에서 결측값이 있을 경우 즉, Y1에서 Y2에 대한 변화량을 포함하여 분석하는 방법이라고 하셨습니다. 만약 Y1만 값이 있을 경우에는 해당 샘플은 어떻게 처리가 되는지 궁금합니다. 감사합니다.

Read More GEE 결측값 처리 방식 문의
QnA 자료실

비일관적 매개분석 이렇게 돌려도 되나요..?
Bytarra1 2026-04-21

x > y 에는 영향이 없는데, m을 추가할 경우 x > m > y로 이어지는 간접효과가 유의하게 나타납니다. 이 때, 직접효과와 간접효과의 방향이 달라, 총 효과가 유의하게 나타나지 않는다면 이걸 완전매개한다고 해석할 수 있을까요? 예를 들어, 음식 유형은 제품 태도에 영향을 주지 않는데 음식 유형에 따라 죄책감이 증가하여, 제품 태도에 영향을 줄 수 있다는 가설입니다..

Read More 비일관적 매개분석 이렇게 돌려도 되나요..?
QnA 자료실

데이터 정리관련 질문입니다.
Bytarra1 2026-04-21

현재 귀인성향이 매개변인 또는 조절변인입니다. 여기서 매개의 경우 각각 따로 분석을 하면되지만 조절은 문제가 귀인성향이 내부 외부 각각 역채점 없이 점수가 높으면 각각의 하위변인에 해당하는 것이라서, 이 점수들의 방향성을 높고 낮음으로 변환하고 싶은데 좋은 방법이 없을까요.. ??

Read More 데이터 정리관련 질문입니다.

Similar Posts