13.14: Тест Краскела-Уоллиса

Kruskal-Wallis Test
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Kruskal-Wallis Test
Please note that all translations are automatically generated. Click here for the English version.

582 Views

01:19 min
January 09, 2025

Overview

Критерий Краскела-Уоллиса, также известный как критерий Краскела-Уоллиса, служит непараметрической альтернативой одностороннему ANOVA, предлагая решение для анализа различий между тремя или более независимыми группами на основе одной порядково-зависимой переменной. Этот статистический тест особенно ценен в сценариях, где данные не соответствуют предположению о нормальном распределении, требуемому их параметрическими аналогами. Критерий Краскела-Уоллиса обычно предназначен для обработки порядковых данных или случаев, когда предположение об однородности дисперсий между группами не выполняется. Он предоставляет универсальный инструмент для исследователей в широком спектре областей.

В отличие от параметрических тестов, которые работают со средними данными, тест Краскела-Уоллиса фокусируется на рангах и группах. Каждая точка данных ранжируется по всему набору данных, и эти ранжирования используются для вычисления тестовой статистики по ее формуле, тем самым оценивая различия в медианных значениях среди групп с помощью распределения хи-квадрат с k-1 степенями свободы (где k — количество групп) для получения p-значения. Этот метод является преимуществом, поскольку он снижает влияние выбросов и ненормальных форм распределения, что делает его надежной альтернативой для анализа медианных различий.

Критерий Краскела-Уоллиса основан на нескольких ключевых предположениях: независимость наблюдений, требование идентичных форм и масштабов распределения по группам, а также использование порядковых или непрерывных данных. Его параметрический аналог, односторонняя ANOVA, предполагает, что данные нормально распределены и что дисперсии равны между группами. На практике тест Краскела-Уоллиса широко применяется в различных областях исследований. Например, в психологии его можно использовать для сравнения эффективности различных терапевтических подходов среди нескольких групп. В медицине исследователи могут использовать этот тест для оценки влияния различных методов лечения на ненормально распределенную переменную исхода. Ученые-экологи часто используют этот тест для сравнения экологических измерений на разных участках или в разных условиях.

Критерий Краскела-Уоллиса облегчает сравнение медиан в нескольких группах без строгих предположений, требуемых параметрическими тестами. Такая универсальность повышает его применимость в научных исследованиях, позволяя делать надежные и обоснованные выводы даже в тех случаях, когда данные не соответствуют идеальным условиям для параметрического анализа. В результате, тест Краскела-Уоллиса является бесценным инструментом для исследователей, стремящихся анализировать данные, которые могут не соответствовать традиционным статистическим предположениям.

Transcript

Критерий Краскела-Уоллиса, или H-критерий, является непараметрической альтернативой одностороннему ANOVA. Он эффективно проверяет нулевую гипотезу о том, что три или более популяции имеют идентичные медианы.

Рассмотрим набор данных о продажах красного, зеленого и черного винограда в супермаркете.

Как можно определить, происходят ли эти три выборки из популяций с одинаковым медианным объемом продаж?

Для проверки этого утверждения все сэмплы изначально объединяются для присвоения рангов. Затем сумма рангов для каждой выборки рассчитывается независимо.

Тестовая статистика, H, выводится с помощью формулы, которая количественно определяет дисперсию между суммами рангов.

В этом сценарии значение H следует распределению хи-квадрат, при этом степени свободы на одну меньше, чем общее число выборок, равное двум.

На этом уровне степеней свободы критическое значение определяется по соответствующей таблице при выбранном уровне значимости, например 0,05.

Учитывая, что вычисленное значение H ниже критического значения, нулевая гипотеза, предполагающая, что выборки происходят из популяций с эквивалентными медианами, не может быть отвергнута.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for