13.16: Вальд-Вулфовиц проводит второй тест

Wald-Wolfowitz Runs Test II
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Wald-Wolfowitz Runs Test II
Please note that all translations are automatically generated. Click here for the English version.

202 Views

01:17 min
January 09, 2025

Overview

Тест прогонов Вальда-Вулфовица, обычно называемый тестом прогонов, является непараметрическим тестом, используемым для оценки случайности упорядоченных данных. Тест оценивает количество прогонов, которые представляют собой последовательные последовательности похожих элементов в данных. Если количество прогонов значительно выше или ниже ожидаемого, данные считаются неслучайными, что указывает на обнаруживаемый шаблон или структуру.

Для двоичных данных прогоны идентифицируются с помощью таких символов, как + и −, или эквивалентных 1 и 0. В случае категориальных данных с двумя категориями, эти категории преобразуются в бинарные варианты. Однако в таких случаях, как последовательности ДНК, где такие категории, как A, T, G и C, являются врожденными, преобразование не требуется, и тест может быть применен непосредственно к последовательностям. Для числовых данных значения часто преобразуются путем присвоения + (или 1) тем, которые выше определенного порога (например, среднего или медианы) и − (или 0) тем, которые ниже него, что позволяет идентифицировать прогоны.

Нулевая гипотеза теста (H0) утверждает, что данные следуют случайной последовательности, в то время как альтернативная гипотеза (H1) предполагает, что данные имеют лежащий в основе шаблон или порядок. Тестовая статистика, обозначенная как G, представляет собой количество наблюдаемых прогонов в данных. Затем это значение сравнивается с критическими значениями в двустороннем тесте. Если G выходит за пределы критического диапазона (т.е. слишком высок или слишком низок), мы отвергаем нулевую гипотезу, делая вывод, что данные не случайны и демонстрируют определенную последовательность. И наоборот, если G попадает в критический диапазон, мы не можем отвергнуть нулевую гипотезу, предполагая, что данные, скорее всего, случайны без какого-либо определенного порядка.

Критические значения получаются из стандартной таблицы прогонов, когда количество элементов в данных, имеющих определенную характеристику (например, значения меньше медианы), обозначенной n1, и количество элементов в данных, имеющих другую характеристику (например, значения больше медианы), обозначаемой n2, меньше или равно 20 и находится на уровне значимости α= 0,05 (Примечание: не путайте эти числа с размером выборки n).

Когда эти условия не выполняются, т.е. когда n1 и n2 и больше 20 или когда уровень значимости α не равен 0,05, используется тестовая статистика z, которая вычисляется по следующей формуле:

Equation 1

Где μG и σG вычисляются по следующим уравнениям:

Equation 2

Equation 3

Критические значения z, т.е. отрицательные (левохвостые) и положительные (правохвостые) критические z, берутся из стандартной таблицы z-распределения. Когда тестовая статистика z (вычисленная из приведенных выше уравнений) выходит за пределы диапазона –z и +z, случайность отвергается, делая вывод о наличии в данных свидетельств определенной последовательности. Если тестовая статистика находится в пределах диапазона, случайность в данных не отбрасывается.

Тест прогонов не зависит от размера выборки или базового распределения генеральной совокупности и выборки, что делает его универсальным для обнаружения случайности различных типов последовательных данных. Однако, хотя он может определить, является ли последовательность случайной, он не измеряет степень или величину случайности в данных.

Transcript

Ученый собрал данные о длине тела 30 бабуинов, приближающихся к источнику воды.

Таким образом, тест Вальда-Вулфовица может определить, является ли последовательность, в которой бабуины приближались к источнику воды, случайной или связана с длиной их тела.

Здесь нулевая гипотеза утверждает, что данные находятся в случайной последовательности, в то время как альтернативная гипотеза утверждает, что данные не находятся в случайной последовательности.

Для этих числовых данных прогоны — G — вычисляются путем присвоения двоичных знаков значениям, большим и меньшим, чем медиана 74,5.

Здесь значение G равно 17.

Обратите внимание, что число значений меньше медианы (n1) и больше медианы (n2) меньше 20.

Так, критические значения при α = 0,05 можно получить из стандартной таблицы.

Тест Вальда-Вулфовица является двусторонним. Таким образом, чтобы исключить случайность, тестовая статистика должна находиться за пределами диапазона критических значений.

В данном случае G попадает в этот диапазон, что свидетельствует в пользу нулевой гипотезы.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for