13.15: Вальд-Вулфовиц проводит тест I

Wald-Wolfowitz Runs Test I
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Wald-Wolfowitz Runs Test I
Please note that all translations are automatically generated. Click here for the English version.

637 Views

01:17 min
January 09, 2025

Overview

Тест Вальда-Вольфовица, также известный как тест прогонов, является непараметрическим статистическим тестом, используемым для оценки случайности последовательности двух различных типов элементов (например, положительных/отрицательных значений, успехов/неудач). Он проверяет, является ли порядок элементов в последовательности случайным или присутствует паттерн или тренд. Этот непараметрический тест применяется к любым упорядоченным данным, независимо от распределения данных генеральной совокупности и выборки, даже если доступен больший размер выборки.

Тест работает путем анализа «прогонов» в данных — непрерывных последовательностей похожих элементов. «Прогон» определяется как серия последовательных идентичных символов (например, серия положительных значений или серия отрицательных значений). Тест Вальда-Вольфовица сравнивает наблюдаемое количество пробежек с числом пробежек, ожидаемым при случайности. Рассмотрим следующий пример последовательности или прогона:

Набор данных-1:

0, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 1

В этом наборе данных [0, 0]; [1, 1, 1]; [0, 0, 0]; [1]; [0]; [1]; [0, 0, 0]; [1, 1]; [0, 0]; [1, 1] — это узнаваемые последовательности или прогоны, всего 10 прогонов. Поскольку 0 и 1 различны по своей природе (т.е. они предоставляют различную информацию, например, отсутствие и присутствие), 0 и 1 вместе не могут образовывать прогон. Это означает, что [0, 1]; [0, 1] не может рассматриваться как прогон.

Основной принцип теста WWR заключается в том, что “Отвергать случайность данных, когда количество прогонов чрезвычайно низкое или чрезвычайно высокое”. Тест дает количественную меру случайности на определенном уровне значимости, например, 0,05. Однако сам по себе тест WWR не дает четкого представления о том, насколько случайным является данный набор данных. Величина случайности по-прежнему является качественной и должна быть интерпретирована в зависимости от характера данных (т.е. двоичных, категориальных или числовых).

Transcript

Тест Вальда-Вольфовица проверяет случайность упорядоченных или последовательных данных. Он использует вычисленные прогоны из данных, где случайность отклоняется, когда значение прогонов слишком низкое или слишком высокое.

Прогон — это последовательность данных, следующая за другой аналогичной последовательностью в тех же данных, которая является взаимоисключающей от другой.

Прогоны могут быть вычислены для двоичных, категориальных или числовых данных.

Например, последовательность побед или поражений в теннисном матче является двоичными данными. Обратите внимание, что значения прогонов для dataset-1 и dataset-2 являются экстремальными, что делает их менее случайными, чем dataset-3.

Последовательность ДНК является типичным примером категориальных данных. Здесь значение прогонов для последовательностей-1 и последовательно-2 является экстремальным, что делает их менее случайными, чем последовательность-3.

Для вычисления числовых данных, таких как порядок размера листа, срезанного пчелой-листорезом, требуется его среднее или медиана. Назначьте знак + для каждого значения выше среднего или медианы и знак – для каждого значения меньше, чтобы получить последовательность двоичных знаков для вычисления прогонов.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for