13.5: Тест на знак для номинальных данных

Sign Test for Nominal Data
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Sign Test for Nominal Data
Please note that all translations are automatically generated. Click here for the English version.

80 Views

01:12 min
January 09, 2025

Overview

Знаковый тест — это непараметрический метод, используемый для оценки гипотез о медиане одной выборки или для сравнения медиан двух связанных выборок. Тест на знак особенно полезен при работе с номинальными данными, которые включают в себя отдельные категории без присущего ему порядка, такие как имена, метки и предпочтения. Номинальные данные ограничивают статистический анализ оценкой пропорций населения, а не средних или медианных значений, которые требуют непрерывных данных.

Например, рассмотрим опрос, в котором людей спрашивают об их предпочтениях в отношении домашних животных, и результаты которого показывают, что определенное число предпочитает собак кошкам. В этом сценарии представлены номинальные данные, так как предпочтения домашних животных категоричны и не могут быть ранжированы. Затем можно применить тест на знаки, чтобы определить, существует ли статистически значимое предпочтение собак перед кошками (или наоборот) среди опрашиваемой популяции.

В этом примере процедура включает в себя две гипотезы: нулевую гипотезу (Н0), которая не постулирует предпочтения между собаками или кошками (предполагая равную долю предпочтений), и альтернативную гипотезу (Н1), предполагающую значительное предпочтение одной из них перед другой. Тест использует положительные и отрицательные знаки для представления предпочтений для каждой категории. Расчет тестовой статистики, часто преобразуемой в z-оценку для больших выборок (n > 25), используется для определения того, значительно ли наблюдаемое распределение предпочтений отклоняется от того, что можно было бы ожидать при нулевой гипотезе.

Если вычисленная статистика пересекает критическое значение на выбранном уровне достоверности (например, 0,05), нулевая гипотеза отклоняется, что указывает на отсутствие значимых предпочтений в популяции. Этот метод обеспечивает простой подход к проверке категориальных данных на различия, предлагая понимание предпочтений населения, не требуя предположений о распределении данных.

Transcript

Номинальные данные, состоящие из неупорядочиваемых имен, меток и категорий, позволяют анализировать только пропорции населения.

Учитывая, что данные являются номинальными, тест на признаки можно использовать для определения того, есть ли доказательства в пользу собаки или кошки в качестве предпочтительного домашнего животного.

Нулевая гипотеза утверждает, что доля любителей собак равна 0,5, в то время как альтернативная гипотеза предполагает, что любителей собак больше, чем любителей кошек.

Любители собак и кошек представлены положительными и отрицательными знаками соответственно.

Поскольку n больше 25, z-статистика вычисляется по приведенной формуле.

Этот тест рассматривается как левосторонний, потому что он проверяет, является ли количество отрицательных результатов значительно низким. При доверительной вероятности 0,05 критическое значение составляет -1,645.

Так как тестовая статистика меньше критического значения, нулевая гипотеза отклоняется. Таким образом, есть достаточно доказательств того, что люди с большей вероятностью являются любителями собак.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for