13.1: Введение в непараметрическую статистику

Introduction to Nonparametric Statistics
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Introduction to Nonparametric Statistics
Please note that all translations are automatically generated. Click here for the English version.

683 Views

01:28 min
January 09, 2025

Overview

Непараметрическая статистика представляет собой мощную альтернативу традиционным параметрическим методам, полезную в тех случаях, когда невозможно сделать предположения о распределении населения. В отличие от параметрических тестов, которые требуют, чтобы данные следовали определенному распределению с четко определенными параметрами (такими как среднее значение и стандартное отклонение), непараметрические тесты не требуют таких ограничений. Это делает их особенно ценными при работе с небольшими размерами выборки, искаженными данными или порядковыми и категориальными переменными.

Одним из ключевых преимуществ непараметрических испытаний является их гибкость. Они являются более общими и часто более простыми в применении, поскольку не требуют данных для удовлетворения определенных критериев, таких как однородность дисперсии или нормальное распределение. Кроме того, непараметрические методы могут работать с более широким спектром типов данных, включая порядковые данные (например, рейтинги или рейтинги) и номинальные данные (например, категории, такие как цвет глаз или пол), что делает их применимыми в ситуациях, когда параметрические методы были бы непригодны.

Распространенными примерами непараметрических тестов являются критерий ранговой суммы Вилкоксона, критерий Краскела-Уоллиса и критерий хи-квадрат, каждый из которых может анализировать данные, не требуя конкретных предположений о распределении. Эти тесты часто легче интерпретировать, поскольку они полагаются на ранжирование или таблицы сопряженности, а не на оценку параметров популяции. Кроме того, непараметрические методы более устойчивы к выбросам, уменьшая влияние экстремальных значений, которые в противном случае могли бы исказить результаты параметрического анализа. В результате непараметрические методы широко используются в различных областях, начиная от социальных наук и биологии и заканчивая экономикой и медициной.

По сравнению с параметрическими тестами, непараметрические методы имеют меньшую чувствительность: они теряют информацию, преобразуя количественные данные в качественные формы, такие как знаки или ранги. Например, запись изменений уровня океана в виде просто положительных или отрицательных знаков, а не в миллиметрах, снижает детализацию. Непараметрические тесты также требуют более существенных доказательств, таких как большие размеры выборки или большие различия, чтобы отвергнуть нулевую гипотезу. Когда доступны популяционные параметры (среднее, стандартное отклонение), параметрические тесты обычно предпочтительны из-за их более высокой эффективности.

Transcript

Большинство логических статистических методов являются параметрическими, требующими нормально распределенных популяций с определенными параметрами, такими как среднее значение, стандартное отклонение или доля популяции.

В отличие от них, непараметрические тесты не зависят от каких-либо параметров, что позволяет выбирать выборки из популяций без конкретных распределений. Таким образом, они также известны как тесты без распределения.

В отличие от параметрических тестов, они могут применяться к категориальным данным, таким как пол младенцев, рожденных в той или иной больнице.

Однако у этих тестов есть недостаток, заключающийся в том, что количественные данные сводятся к качественным данным, таким как знаки, что приводит к потере такой информации, как величина.

Их эффективность также ограничена по сравнению с параметрическими аналогами. Это ограничение часто компенсируется использованием более крупных выборок или значительной разницей между тестовой статистикой и критическими значениями.

В таблице сравнивается эффективность непараметрических тестов с их параметрическими аналогами.

Когда все остальные факторы равны и строгие условия параметрической статистики выполняются, рейтинг эффективности 0,63 указывает на то, что непараметрический тест требует 100 наблюдений для достижения тех же результатов, что и 63 наблюдения из соответствующего параметрического теста.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for