13.12: Spearman의 순위 상관 관계 테스트

Spearman’s Rank Correlation Test
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Spearman’s Rank Correlation Test
Please note that all translations are automatically generated. Click here for the English version.

762 Views

01:20 min
January 09, 2025

Overview

Spearman의 로라고도 하는 Spearman의 순위 상관 검정은 두 변수 간의 연관 강도와 방향을 평가하기 위한 비모수 방법입니다. 이 검정은 데이터 분포를 알 수 없거나 정규성 가정이 성립하지 않는 경우에 특히 유용합니다. 영국의 심리학자이자 통계학자인 찰스 에드워드 스피어먼(Charles Edward Spearman) 박사의 이름을 딴 이 상관 계수는 피어슨의 상관 계수에 대응하는 비모수 함수로 사용됩니다.

Spearman의 테스트는 원시 데이터 값 대신 순위를 사용하여 상관 관계를 계산하므로 Pearson의 테스트보다 더 유연하고 강력합니다. 선형 관계만 측정하고 정규 분포 데이터를 가정하는 Pearson의 상관 관계와 달리 Spearman의 상관 관계는 선형 및 비선형 단조 연관성을 모두 감지할 수 있습니다. 또한 연속 및 이산 순서 데이터 모두에 적합하므로 기존의 파라메트릭 가정이 충족되지 않을 수 있는 광범위한 시나리오에 적용할 수 있습니다.

Spearman의 rho 범위는 -1에서 +1까지이며, 여기서 부호는 관계의 방향을 나타냅니다. 음수 부호는 역 상관 관계를 나타내고 양수 부호는 직접 상관 관계를 나타냅니다. 순위가 뚜렷한 경우 Spearman의 rho는 다음 공식을 사용하여 계산됩니다.

방정식 1

여기서 d는 쌍 내의 두 변수에 대한 순위 간의 차이이고 n은 표본 크기(표본 데이터 쌍의 총 수)입니다. 검정을 수행하기 위해 통계 rs를 특정 유의 수준(일반적으로 α = 0.05)에서 임계값과 비교합니다. 이러한 임계값은 표본 크기가 30(즉, n ≤ 30) 미만인 경우 표준 표에서 구합니다.

Spearman의 순위 상관 관계 테스트는 견고성과 다양성으로 인해 가장 널리 사용되는 상관 관계 방법 중 하나입니다. 모든 파라메트릭 요구 사항이 충족된다고 가정할 때 Pearson의 상관 계수와 비교할 때 효율성 등급은 약 0.91입니다. 이 등급은 Spearman의 rho가 Pearson의 상관과 유사한 결과를 달성한다는 것을 의미합니다. 예를 들어, 100개의 데이터 쌍에 Spearman의 로를 사용하면 91개의 데이터 쌍에 대한 Pearson의 상관 관계와 유사한 결과를 얻을 수 있습니다. 그러나 이 효율성 측정이 Spearman의 테스트가 91%의 정확도만 있거나 91%만 정확하다는 것을 의미하지는 않습니다. 대신, 이는 파라메트릭 테스트와 비교하여 상관 강도를 포착하는 Spearman 테스트의 상대적 효과를 반영합니다.

Transcript

Spearman의 순위 상관 관계는 쌍을 이루는 데이터에서 두 변수 간의 연관성을 찾는 데 사용되는 비모수 검정입니다.

35개의 거북이 알에 대한 알 껍질 두께와 부화 순서 사이의 상관 관계를 찾는 예를 고려하십시오.

여기서 해칭 순서는 파라메트릭으로 측정할 수 없습니다. 대신 순서에 따라서만 순위를 매길 수 있습니다. 마찬가지로, 달걀 껍질 두께는 부화 후 측정된 두께의 오름차순으로 순위를 매길 수 있습니다.

테스트를 수행하기 위해 두 변수 사이에 상관 관계가 없다는 귀무 가설과 두 변수 사이에 상관 관계가 존재한다는 대립 가설로 시작합니다.

수량 Rho-sub-S 또는 Spearman의 순위 상관 계수는 다음 방정식을 사용하여 표본 통계량 R-sub-S에서 추정된 모집단 모수입니다.

표본 크기가 30보다 크므로 임계값은 다음 방정식을 사용하여 계산됩니다.

표본 통계량이 임계값의 임계값을 벗어나 있으며, 이는 달걀 껍질 두께와 부화 순서 사이에 상관 관계가 있음을 시사합니다.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for