JoVE Core
Statistics
Chapter 11: Correlation and Regression
11.2:
상관 계수
1900년대 초에 칼 피어슨(Karl Pearson)이 개발한 상관 계수 r은 수치이며 독립 변수 x와 종속 변수 y 사이의 선형 연관성의 강도와 방향을 측정합니다.
x와 y 사이에 선형 관계가 있다고 의심되는 경우 r은 선형 관계가 얼마나 강한지 측정할 수 있습니다.
r 의 VALUE 가 알려주는 것 :
r의 값은 항상 –1에서 +1 사이입니다(–1 ≤ r ≤ 1).
상관 관계 r의 크기는 x와 y 사이의 선형 관계의 강도를 나타냅니다. r의 값이 –1 또는 +1에 가까우면 x와 y 사이에 더 강한 선형 관계가 있음을 나타냅니다.
r = 0이면 선형 상관 관계가 없을 가능성이 높습니다. 곡선 또는 수평 패턴을 나타내는 데이터는 상관 관계가 0일 수 있으므로 산점도를 보는 것이 중요합니다.
r = 1이면 완벽한 양의 상관 관계가 있습니다. r = –1이면 완벽한 음의 상관관계가 있습니다. 이 두 경우 모두 원래 데이터 포인트가 모두 직선에 있습니다. 물론 현실 세계에서는 일반적으로 이런 일이 일어나지 않습니다.
r의 SIGN이 알려주는 것
r의 양수 값은 x가 증가하면 y가 증가하는 경향이 있고 x가 감소하면 y가 감소하는 경향이 있음을 의미합니다(양의 상관 관계).
r의 음수 값은 x가 증가하면 y가 감소하는 경향이 있고 x가 감소하면 y가 증가하는 경향이 있음을 의미합니다(음의 상관 관계).
r의 부호는 최적선의 기울기 b의 부호와 같습니다.
이 텍스트는 Openstax, Introductory Statistics, Section 12.3, The Regression Equation에서 발췌한 것입니다
5명의 운동선수의 키와 몸무게를 생각해 보십시오. 운동선수의 키가 커지면 체중도 증가합니다. 따라서 키와 몸무게는 양의 상관 관계가 있습니다.
선수의 체중 대 신장의 산점도는 선형 패턴을 보여주며, 이는 정량적 측정을 사용하여 확인해야 합니다.
r로 표시되는 선형 상관 계수는 두 변수 간의 선형 상관 관계의 강도에 대한 정량적 측정을 제공합니다.
x 및 y 값이 알려진 n개의 산점도가 있는 이러한 데이터 세트의 경우 r을 계산할 수 있습니다.
r의 값은 항상 -1과 +1 사이에 있습니다. r의 계수가 높을수록 변수 간의 상관 관계가 더 강해집니다.
x 또는 y의 값이 바뀌거나 변수 중 하나가 다른 척도로 변환되는 경우 r의 값은 영향을 받지 않습니다.
상관 계수는 특이치의 영향을 크게 받습니다. 따라서 이러한 데이터 점이 오류로 알려진 경우 r 값의 정확도를 향상시키기 위해 제거할 수 있습니다.
Related Videos
Correlation and Regression
11.7K views
6.1K views
5.9K views
5.7K views
4.0K views
7.3K views
4.6K views
6.8K views
2.2K views
3.0K views