Тест на независимость — это критерий на основе хи-квадрат, используемый для определения того, являются ли две переменные или факторы независимыми или зависимыми. Этот тест гипотез используется для проверки независимости переменных. Можно построить два качественных опросных вопроса или эксперимента на основе переменных в таблице сопряженности. Цель состоит в том, чтобы увидеть, являются ли эти две переменные несвязанными (независимыми) или связанными (зависимыми). Нулевая и альтернативные гипотезы для этого теста:
H0: Две переменные (факторы) независимы.
H1: Две переменные (факторы) являются зависимыми
Во-первых, определяются наблюдаемые частоты и рассчитываются ожидаемые частоты. Ожидаемая частота каждой записи получается путем умножения суммы строки и суммы столбца и деления ее на сумму всех частот. Затем тестовая статистика рассчитывается с использованием наблюдаемых значений частот из таблиц непредвиденных ситуаций и рассчитанных ожидаемых частот. Затем с помощью таблицы хи-квадрат вычисляются критические значения в одностороннем тесте с подходящими уровнями достоверности. Если тестовая статистика больше критического значения и попадает в критическую область, нулевая гипотеза отвергается; в противном случае он принимается.
Этот текст адаптирован из Openstax, Вводная статистика, раздел 11.5, Сравнение тестов хи-квадрат.
Рассмотрим набор данных о потреблении алкоголя и смертельных случаях в результате несчастных случаев. Проверка гипотез проводится для того, чтобы установить, являются ли эти две переменные независимыми. Другими словами, существует ли связь между употреблением алкоголя и более высокой смертностью в результате несчастных случаев?
Нулевая гипотеза утверждает, что употребление алкоголя и несчастные случаи со смертельным исходом являются независимыми событиями, в то время как альтернативная гипотеза утверждает обратное.
Произведение итога строки на итог столбца, деленное на сумму всех частот, дает ожидаемую частоту для каждой записи таблицы.
Используя ожидаемые и наблюдаемые значения, вычислить статистику критерия хи-квадрат.
Далее с помощью таблицы хи-квадрат определим критическое значение, разделяющее область 0,05 в правом хвосте с одной степенью свободы.
Поскольку тестовая статистика больше критического значения и попадает в критическую область, нулевая гипотеза об отсутствии связи между потреблением алкоголя и смертельностью в результате дорожно-транспортных происшествий отвергается.
Таким образом, при уровне значимости 5% имеется достаточно доказательств, чтобы сделать вывод о том, что употребление алкоголя и несчастный случай со смертельным исходом являются зависимыми переменными.
Related Videos
Distributions
4.1K Просмотры
Distributions
3.1K Просмотры
Distributions
6.1K Просмотры
Distributions
2.8K Просмотры
Distributions
3.7K Просмотры
Distributions
3.0K Просмотры
Distributions
3.0K Просмотры
Distributions
3.4K Просмотры
Distributions
2.5K Просмотры
Distributions
2.5K Просмотры
Distributions
2.3K Просмотры
Distributions
3.6K Просмотры
Distributions
2.2K Просмотры
Distributions
2.0K Просмотры
Distributions
3.7K Просмотры