13.16: Wald-Wolfowitz 실행 테스트 II

Wald-Wolfowitz Runs Test II
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Wald-Wolfowitz Runs Test II
Please note that all translations are automatically generated. Click here for the English version.

213 Views

01:17 min
January 09, 2025

Overview

일반적으로 런 검정이라고 하는 Wald-Wolfowitz 런 검정은 정렬된 데이터의 랜덤성을 평가하는 데 사용되는 비모수 검정입니다. 이 테스트는 데이터 내에서 유사한 요소의 연속된 시퀀스인 런 수를 평가합니다. 실행 횟수가 예상보다 현저히 높거나 낮으면 데이터가 비무작위로 간주되어 감지 가능한 패턴 또는 구조를 나타냅니다.

이진 데이터의 경우 실행은 + 및 -와 같은 기호 또는 이에 상응하는 1과 0을 사용하여 식별됩니다. 두 개의 범주가 있는 범주형 데이터의 경우 이러한 범주는 이진 선택 항목으로 변환됩니다. 그러나 DNA 염기서열과 같이 A, T, G, C와 같은 범주가 내재되어 있는 경우에는 변환이 필요하지 않으며 검사를 염기서열에 직접 적용할 수 있습니다. 숫자 데이터의 경우 특정 임계값(예: 평균 또는 중앙값)보다 높은 값에는 +(또는 1)를 할당하고 그 이하의 값에는 -(또는 0)을 할당하여 값을 변환하여 런을 식별할 수 있습니다.

테스트의 귀무 가설(H0)은 데이터가 무작위 시퀀스를 따른다는 것을 나타내는 반면, 대립 가설(H1)은 데이터에 기본 패턴 또는 순서가 있음을 시사합니다. G로 표시되는 검정 통계량은 데이터에서 관측된 런 수를 나타냅니다. 그런 다음 이 값을 양측 검정의 임계값과 비교합니다. G가 임계 범위를 벗어나면(즉, 너무 높거나 너무 낮음) 귀무 가설을 기각하고 데이터가 무작위가 아니며 특정 시퀀스를 나타낸다고 결론을 내립니다. 반대로, G가 임계 범위 내에 있으면 귀무 가설을 기각하지 못하며, 이는 데이터가 특정 순서 없이 무작위일 가능성이 있음을 시사합니다.

임계값은 n1로 표시되는 특정 특성(예: 중앙값보다 작은 값)을 갖는 데이터의 요소 수와 n2로 표시되는 다른 특성(예: 중앙값보다 큰 값)을 갖는 데이터의 요소 수가 20 이하이고 유의 수준 α= 0.05 (참고: 이 숫자를 표본 크기 n과 혼동하지 마십시오).

이러한 조건이 충족되지 않는 경우, 즉 n1n2가 20보다 크거나 유의 수준 α이 0.05 이외의 다른 값인 경우 검정 통계량 z가 사용되며 다음 방정식을 사용하여 계산됩니다.

방정식 1

여기서 μ GσG는 다음 방정식으로 계산됩니다.

방정식 2

방정식 3

임계 z 값, 즉 음수(왼쪽 꼬리) 및 양수(오른쪽 꼬리) 임계 z 값은 표준 z 분포 테이블에서 얻습니다. 검정 통계량 z(위 방정식에서 계산됨)가 –z와 +z의 범위를 벗어나면 임의성이 기각되고 데이터에 특정 순서의 증거가 있다는 결론을 내립니다. 검정 통계량이 범위 내에 있으면 데이터의 랜덤성이 기각되지 않습니다.

런 검정은 표본 크기나 모집단 및 표본의 기본 분포에 영향을 받지 않으므로 다양한 유형의 순차 데이터에 유용하게 임의성을 탐지할 수 있습니다. 그러나 시퀀스가 무작위인지 여부는 식별할 수 있지만 데이터 내에서 임의성의 정도나 크기는 측정하지 않습니다.

Transcript

한 과학자가 수원에 접근하는 개코원숭이 30마리의 몸 길이에 대한 데이터를 수집했다.

따라서 Wald-Wolfowitz 테스트는 개코원숭이가 수원에 접근한 순서가 무작위인지 아니면 몸 길이와 관련이 있는지 확인할 수 있습니다.

여기서 귀무 가설은 데이터가 무작위 시퀀스에 있다고 말하는 반면, 대립 가설은 데이터가 무작위 시퀀스에 있지 않다는 것입니다.

이러한 숫자 데이터의 경우 런(G)은 중앙값 74.5보다 크거나 작은 값에 이진 기호를 할당하여 계산됩니다.

여기서 G의 값은 17입니다.

중앙값(n1)보다 작고 중앙값(n2)보다 큰 값의 수는 20보다 작습니다.

따라서 α = 0.05의 임계값은 표준 테이블에서 얻을 수 있습니다.

Wald-Wolfowitz 검정은 양측 검정입니다. 따라서 임의성을 거부하려면 검정 통계량이 임계값 범위를 벗어나야 합니다.

여기서 G는 이 범위 내에 속하며, 귀무 가설을 지지하는 증거를 제공합니다.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for