13.9: Критерий ранговой суммы Вилкоксона

Wilcoxon Rank-Sum Test
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Wilcoxon Rank-Sum Test
Please note that all translations are automatically generated. Click here for the English version.

172 Views

01:21 min
January 09, 2025

Overview

Критерий ранговой суммы Вилкоксона, также известный как U-критерий Манна-Уитни, представляет собой непараметрический тест, используемый для определения существенной разницы между распределениями двух независимых выборок. Этот тест разработан специально для двух независимых популяций и имеет следующие ключевые требования:

  1. Образцы должны быть выбраны случайным образом.
  2. Данные должны быть порядковыми или иметь возможность преобразования в порядковую шкалу, что позволяет упорядочивать и ранжировать значения.

Нулевая гипотеза состоит в том, что медиана распределений двух популяций идентична, а альтернативная гипотеза заключается в том, что распределения двух популяций различны. Кроме того, нет никаких предположений о том, что образцы распределены нормально. В этом тесте, когда две выборки выбираются из двух идентичных популяций и ранжируются как один пул точек данных, ожидается, что их медианы будут различаться, если в одну из выборок преимущественно попадают меньшие или большие ранги.

Для выполнения критерия ранговой суммы Вилкоксона, также известного как U-критерий Манна-Уитни, данные из обеих выборок объединяются в единый ранжированный список, где каждому значению присваивается ранг от наименьшего к наибольшему. Если какие-либо значения равны, им присваивается среднее значение рангов для этих должностей. Затем ранги разделяются на соответствующие группы, и для каждой группы вычисляется сумма рангов.

Тестовая статистика (обозначаемая U в U-версии Манна-Уитни) выводится из этих ранговых сумм, и ее значимость оценивается для определения того, есть ли разница между двумя выборками. Значимый результат свидетельствует о том, что одна выборка систематически имеет более высокие или более низкие ранги, что указывает на разницу в базовых распределениях двух популяций. Для небольших размеров выборки (обычно n<20) используются критические значения для U из таблицы, в то время как для больших выборок применяется аппроксимация z-оценки, предполагающая нормальное распределение. Этот тест особенно полезен, когда предположения для двухвыборочного t-критерия не выполняются, например, с порядковыми или ненормально распределенными данными, предлагая надежную альтернативу для оценки различий между двумя независимыми группами.

Когда размер выборки достаточно велик, этот тест обычно более эффективен, чем его параметрический аналог, и, следовательно, более предпочтителен для анализа данных. Значимость, проверенная с помощью критерия ранговой суммы Вилкоксона, обычно надежна, несмотря на наличие выбросов в данных. Тем не менее, тест также подвержен более высокой ошибке первого рода, когда данные либо смещены, гетероскедастические (имеют различную дисперсию), либо когда распределение данных/выборки чрезвычайно далеко от нормального распределения.

Transcript

Ранговая сумма Вилкоксона, или U Манна-Уитни, является непараметрическим критерием, используемым для определения разницы между двумя популяциями путем сравнения их медиан.

Он строго относится к двум независимым простым случайным выборкам с равными или неравными размерами выборок.

Рассмотрим время реакции на захват добычи у двух разных видов пауков.

Здесь нулевая гипотеза утверждает, что медианное время отклика двух видов одинаково. Альтернативная гипотеза утверждает обратное.

Значения в этих двух выборках ранжируются с учетом их как единого пула точек данных. Однако сумма рангов вычисляется независимо.

Когда высокие или низкие ранги в основном обнаруживаются в одной выборке, чем в другой, эти две выборки могут иметь разные медианы.

Тестовая статистика z вычисляется с использованием следующих уравнений для проверки гипотезы.

Критерий ранговой суммы Вилкоксона является двусторонним. Таким образом, статистику теста следует сравнивать с положительными и отрицательными критическими значениями, как правило, на уровне 5%.

Поскольку в данном примере тестовая статистика находится за пределами диапазона этих критических значений, медианы двух выборок существенно различаются.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for