1900년대 초에 칼 피어슨(Karl Pearson)이 개발한 상관 계수 r은 수치이며 독립 변수 x와 종속 변수 y 사이의 선형 연관성의 강도와 방향을 측정합니다. 따라서 Pearson product-moment correlation coefficient(피어슨 곱-모멘트 상관 계수)라고도 합니다. 다음 방정식을 사용하여 계산할 수 있습니다.
여기서 n = 데이터 포인트의 수입니다.
표본 상관 계수 표의 95% 임계값을 사용하면 계산된 r 값이 유의한지 여부를 잘 파악할 수 있습니다. r을 표의 적절한 임계값과 비교합니다. r이 양수 임계값과 음수 임계값 사이에 있지 않으면 상관 계수가 중요합니다. r이 유의하면 예측에 선을 사용할 수 있습니다.
결정계수(Coefficient of Determination
)
변수 r2 는 결정 계수라고하며 상관 계수의 제곱이지만 일반적으로 십진수 형식이 아닌 백분율로 표시됩니다. 데이터의 맥락에서 해석이 있습니다.
R2는 백분율로 표현될 때 회귀(최적선)를 사용하여 독립(설명) 변수 x의 변동으로 설명할 수 있는 종속(예측) 변수 y의 변동 백분율을 나타냅니다.
1 – r2는 백분율로 표현될 때 회귀선을 사용하여 x의 변동으로 설명되지 않는 y의 변동 백분율을 나타냅니다. 이는 회귀선에 대해 관찰된 데이터 포인트의 산점으로 볼 수 있습니다.