11.3: 선형 상관 계수(Linear Correlation Coefficient)의 계산 및 해석

Calculating and Interpreting the Linear Correlation Coefficient
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Calculating and Interpreting the Linear Correlation Coefficient
Please note that all translations are automatically generated. Click here for the English version.

5,907 Views

01:11 min
April 30, 2023

Overview

1900년대 초에 칼 피어슨(Karl Pearson)이 개발한 상관 계수 r은 수치이며 독립 변수 x와 종속 변수 y 사이의 선형 연관성의 강도와 방향을 측정합니다. 따라서 Pearson product-moment correlation coefficient(피어슨 곱-모멘트 상관 계수)라고도 합니다. 다음 방정식을 사용하여 계산할 수 있습니다.

Equation1

여기서 n = 데이터 포인트의 수입니다.

표본 상관 계수 표의 95% 임계값을 사용하면 계산된 r 값이 유의한지 여부를 잘 파악할 수 있습니다. r을 표의 적절한 임계값과 비교합니다. r이 양수 임계값과 음수 임계값 사이에 있지 않으면 상관 계수가 중요합니다. r이 유의하면 예측에 선을 사용할 수 있습니다.

결정계수(Coefficient of Determination

)

변수 r2 는 결정 계수라고하며 상관 계수의 제곱이지만 일반적으로 십진수 형식이 아닌 백분율로 표시됩니다. 데이터의 맥락에서 해석이 있습니다.

R2는 백분율로 표현될 때 회귀(최적선)를 사용하여 독립(설명) 변수 x의 변동으로 설명할 수 있는 종속(예측) 변수 y의 변동 백분율을 나타냅니다.

1 – r2는 백분율로 표현될 때 회귀선을 사용하여 x의 변동으로 설명되지 않는 y의 변동 백분율을 나타냅니다. 이는 회귀선에 대해 관찰된 데이터 포인트의 산점으로 볼 수 있습니다.

이 텍스트는 Openstax, Introductory Statistics, Section 12.3 The Regression Equation에서 발췌한 것입니다

.

Transcript

특정 기간 동안의 연간 온도와 비교한 이산화탄소 수치의 데이터 세트를 생각해 보십시오. 데이터 점의 산점도는 두 변수 간의 가능한 선형 패턴을 보여줍니다.

직선 패턴을 확인하기 위해 선형 상관 계수 r이 계산됩니다.

먼저 x 제곱, y 제곱, xy의 곱을 결정한 다음 더합니다. 데이터 점의 수는 7입니다.

이 값에서 상관 계수가 계산됩니다.

상관 계수 값의 의미는 임계 값 테이블을 사용하여 해석할 수 있습니다.

0.05의 유의 수준에서 n이 7과 같으면 임계값은 0.754가 됩니다.

r의 계수가 임계값보다 크기 때문에 변수 사이에 선형 상관 관계가 있다는 결론을 뒷받침하는 충분한 증거가 있습니다.

r 제곱 값은 연간 온도 변화의 76.2%가 이산화탄소 수준과 연간 온도 사이의 선형 관계로 설명될 수 있음을 나타냅니다.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for