13.9: Wilcoxon 순위합 검정

Wilcoxon Rank-Sum Test
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Wilcoxon Rank-Sum Test
Please note that all translations are automatically generated. Click here for the English version.

172 Views

01:21 min
January 09, 2025

Overview

Mann-Whitney U 검정이라고도 하는 Wilcoxon 순위합 검정은 두 독립 표본의 분포 간에 유의한 차이가 있는지 확인하는 데 사용되는 비모수 검정입니다. 이 테스트는 두 개의 독립적인 모집단을 위해 특별히 설계되었으며 다음과 같은 주요 요구 사항이 있습니다.

  1. 표본은 무작위로 추출해야 합니다.
  2. 데이터는 순서형이거나 서수 눈금으로 변환될 수 있어야 값을 정렬하고 순위를 지정할 수 있습니다.

귀무 가설은 두 모집단의 분포 중위수가 동일하다는 것이고, 대립 가설은 두 모집단의 분포가 다르다는 것입니다. 또한 샘플이 정규 분포를 따른다는 가정은 없습니다. 이 테스트에서는 두 개의 동일한 모집단에서 두 개의 표본을 추출하고 하나의 단일 데이터 포인트 풀로 순위를 매기는 경우 더 작거나 더 큰 순위가 주로 표본 중 하나에 속할 경우 중위수가 다를 것으로 예상됩니다.

Mann-Whitney U 테스트라고도 하는 Wilcoxon 순위합 테스트를 수행하기 위해 두 샘플의 데이터를 단일 순위 목록으로 결합하고 각 값에는 가장 작은 것부터 가장 큰 순으로 순위가 할당됩니다. 값이 동률인 경우 해당 위치에 대한 순위의 평균이 제공됩니다. 그런 다음 순위는 해당 그룹으로 다시 분리되고 각 그룹에 대한 순위의 합계가 계산됩니다.

검정 통계량(Mann-Whitney U 버전에서는 U로 표시)은 이러한 순위 합계에서 파생되며, 두 표본 간에 차이가 있는지 확인하기 위해 해당 유의성을 평가합니다. 유의미한 결과는 한 표본의 순위가 체계적으로 더 높거나 낮다는 것을 시사하며, 이는 두 모집단의 기본 분포에 차이가 있음을 나타냅니다. 표본 크기가 작으면(일반적으로 n<20) U에 대한 임계값이 표에서 사용되고, 큰 표본의 경우 정규 분포를 가정하여 z-점수 근사치가 적용됩니다. 이 검정은 순서형 또는 비정규 분포 데이터와 같이 2표본 t-검정에 대한 가정이 충족되지 않는 경우에 특히 유용하며, 두 독립 그룹 간의 차이를 평가할 수 있는 강력한 대안을 제공합니다.

표본 크기가 충분히 큰 경우 이 검정은 일반적으로 파라메트릭 검정보다 효율적이므로 데이터 분석에 더 선호됩니다. Wilcoxon 순위합 검정을 사용하여 검정된 유의성은 데이터에 특이치가 있더라도 일반적으로 신뢰할 수 있습니다. 그러나 이 검정은 데이터가 편향되거나, 이분산성(분산이 다름)이거나, 데이터/표본 분포가 정규 분포에서 매우 멀리 떨어져 있는 경우 I형 오류가 더 높은 경향이 있습니다.

Transcript

Wilcoxon 순위합 또는 Mann-Whitney U는 두 모집단의 중앙값을 비교하여 두 모집단 간의 차이를 확인하는 데 사용되는 비모수 검정입니다.

표본 크기가 같거나 같지 않은 두 개의 독립적인 단순 무작위 표본에 엄격하게 적용됩니다.

두 가지 다른 거미 종의 먹이 포획 응답 시간을 고려하십시오.

여기서 귀무 가설은 두 종의 반응 시간 중앙값이 같다는 것입니다. 대립 가설은 그렇지 않다고 말합니다.

이 두 샘플의 값은 단일 데이터 포인트 풀로 간주되어 순위가 매겨집니다. 그러나 순위 합계는 독립적으로 계산됩니다.

한 표본에서 주로 높거나 낮은 순위가 다른 표본보다 발견되는 경우 두 표본의 중앙값이 다를 수 있습니다.

검정 통계량 z는 가설을 검정하기 위해 다음 방정식을 사용하여 계산됩니다.

Wilcoxon 순위합 검정은 양측입니다. 따라서 검정 통계량은 일반적으로 5%의 양수 및 음수 임계값과 비교해야 합니다.

본 예에서 검정 통계량은 이러한 임계값의 범위를 벗어나기 때문에 두 표본의 중앙값이 크게 다릅니다.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for