13.16:
Вальд-Вулфовиц проводит второй тест
Тест прогонов Вальда-Вулфовица, обычно называемый тестом прогонов, является непараметрическим тестом, используемым для оценки случайности упорядоченных данных. Тест оценивает количество прогонов, которые представляют собой последовательные последовательности похожих элементов в данных. Если количество прогонов значительно выше или ниже ожидаемого, данные считаются неслучайными, что указывает на обнаруживаемый шаблон или структуру.
Для двоичных данных прогоны идентифицируются с помощью таких символов, как + и −, или эквивалентных 1 и 0. В случае категориальных данных с двумя категориями, эти категории преобразуются в бинарные варианты. Однако в таких случаях, как последовательности ДНК, где такие категории, как A, T, G и C, являются врожденными, преобразование не требуется, и тест может быть применен непосредственно к последовательностям. Для числовых данных значения часто преобразуются путем присвоения + (или 1) тем, которые выше определенного порога (например, среднего или медианы) и − (или 0) тем, которые ниже него, что позволяет идентифицировать прогоны.
Нулевая гипотеза теста (H0) утверждает, что данные следуют случайной последовательности, в то время как альтернативная гипотеза (H1) предполагает, что данные имеют лежащий в основе шаблон или порядок. Тестовая статистика, обозначенная как G, представляет собой количество наблюдаемых прогонов в данных. Затем это значение сравнивается с критическими значениями в двустороннем тесте. Если G выходит за пределы критического диапазона (т.е. слишком высок или слишком низок), мы отвергаем нулевую гипотезу, делая вывод, что данные не случайны и демонстрируют определенную последовательность. И наоборот, если G попадает в критический диапазон, мы не можем отвергнуть нулевую гипотезу, предполагая, что данные, скорее всего, случайны без какого-либо определенного порядка.
Критические значения получаются из стандартной таблицы прогонов, когда количество элементов в данных, имеющих определенную характеристику (например, значения меньше медианы), обозначенной n1, и количество элементов в данных, имеющих другую характеристику (например, значения больше медианы), обозначаемой n2, меньше или равно 20 и находится на уровне значимости α= 0,05 (Примечание: не путайте эти числа с размером выборки n).
Когда эти условия не выполняются, т.е. когда n1 и n2 и больше 20 или когда уровень значимости α не равен 0,05, используется тестовая статистика z, которая вычисляется по следующей формуле:
Где μG и σG вычисляются по следующим уравнениям:
Критические значения z, т.е. отрицательные (левохвостые) и положительные (правохвостые) критические z, берутся из стандартной таблицы z-распределения. Когда тестовая статистика z (вычисленная из приведенных выше уравнений) выходит за пределы диапазона –z и +z, случайность отвергается, делая вывод о наличии в данных свидетельств определенной последовательности. Если тестовая статистика находится в пределах диапазона, случайность в данных не отбрасывается.
Тест прогонов не зависит от размера выборки или базового распределения генеральной совокупности и выборки, что делает его универсальным для обнаружения случайности различных типов последовательных данных. Однако, хотя он может определить, является ли последовательность случайной, он не измеряет степень или величину случайности в данных.
Ученый собрал данные о длине тела 30 бабуинов, приближающихся к источнику воды.
Таким образом, тест Вальда-Вулфовица может определить, является ли последовательность, в которой бабуины приближались к источнику воды, случайной или связана с длиной их тела.
Здесь нулевая гипотеза утверждает, что данные находятся в случайной последовательности, в то время как альтернативная гипотеза утверждает, что данные не находятся в случайной последовательности.
Для этих числовых данных прогоны — G — вычисляются путем присвоения двоичных знаков значениям, большим и меньшим, чем медиана 74,5.
Здесь значение G равно 17.
Обратите внимание, что число значений меньше медианы (n1) и больше медианы (n2) меньше 20.
Так, критические значения при α = 0,05 можно получить из стандартной таблицы.
Тест Вальда-Вулфовица является двусторонним. Таким образом, чтобы исключить случайность, тестовая статистика должна находиться за пределами диапазона критических значений.
В данном случае G попадает в этот диапазон, что свидетельствует в пользу нулевой гипотезы.
Related Videos
Nonparametric Statistics
676 Просмотры
Nonparametric Statistics
231 Просмотры
Nonparametric Statistics
736 Просмотры
Nonparametric Statistics
117 Просмотры
Nonparametric Statistics
78 Просмотры
Nonparametric Statistics
100 Просмотры
Nonparametric Statistics
107 Просмотры
Nonparametric Statistics
112 Просмотры
Nonparametric Statistics
166 Просмотры
Nonparametric Statistics
592 Просмотры
Nonparametric Statistics
685 Просмотры
Nonparametric Statistics
734 Просмотры
Nonparametric Statistics
628 Просмотры
Nonparametric Statistics
612 Просмотры
Nonparametric Statistics
623 Просмотры
Nonparametric Statistics
201 Просмотры
Nonparametric Statistics
72 Просмотры
Nonparametric Statistics
404 Просмотры
Nonparametric Statistics
163 Просмотры
Nonparametric Statistics
261 Просмотры
Nonparametric Statistics
175 Просмотры
Nonparametric Statistics
284 Просмотры