다중 회귀 분석은 하나의 반응 변수 또는 종속 변수와 둘 이상의 독립 변수 간의 선형 관계를 평가합니다. 그것은 많은 실용적인 응용 프로그램을 가지고 있습니다.
농부들은 다중 회귀 분석을 사용하여 물 가용성, 비료, 토양 속성 등과 같은 하나 이상의 요소를 기반으로 작물 수확량을 결정할 수 있습니다. 여기서 작물 수확량은 다른 독립 변수에 의존하는 반응 변수 또는 종속 변수입니다. 분석을 위해서는 산점도를 구성하고 다중 선형 회귀 방정식을 사용하여 다중 결정 계수 R2를 계산해야 합니다. R2 의 값이 96 %라고 가정합니다. 물과 비료의 다양한 조합이 작물 수확량 변동의 96%를 설명한다고 해석할 수 있습니다.
그러나 R2 의 값은 독립 변수의 수에 따라 증가합니다. 따라서 표본 크기와 변수 수를 모두 고려하는 조정된 결정 계수가 분석 중에 사용됩니다.
Transcript
다중 회귀는 두 개 이상의 변수 간의 관계를 분석하는 데 사용되는 통계 도구입니다.
다중 회귀는 하나 이상의 예측 변수 또는 독립 변수를 사용하여 응답 변수 또는 종속 변수 간의 선형 관계를 추정하는 간단한 방정식으로 모델링할 수 있습니다.
예를 들어, 운동선수의 물 소비량은 온도와 총 연습 시간과 양의 상관관계가 있습니다.
여기서 온도와 총 연습 시간은 독립적으로 설정할 수 있는 예측 변수입니다. 물 소비량은 다른 두 변수에 따라 달라지므로 반응 변수입니다.
다중 회귀 방정식의 수동 계산은 일반적으로 복잡하기 때문에 이를 해결하기 위해 소프트웨어를 사용합니다.
다중 결정 계수는 방정식이 데이터 세트에 얼마나 잘 맞는지 측정하기 위해 계산됩니다. 이는 온도 변화와 총 연습 시간이 물 소비량 변동의 97%를 설명할 수 있음을 의미합니다.
그러나 더 많은 변수가 사용될수록 일반적으로R2 가 증가합니다.
이러한 경우, 조정된 결정 계수가 계산되며, 이는 표본 크기와 예측 변수의 수를 고려합니다.