8.11: Введение в тест на независимость

Introduction to Test of Independence
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Introduction to Test of Independence
Please note that all translations are automatically generated. Click here for the English version.

2,294 Views

01:21 min
May 22, 2025

Overview

В статистике термин «независимость» означает, что можно напрямую получить вероятность любого события, включающего обе переменные, путем умножения их индивидуальных вероятностей. Тесты на независимость — это тесты хи-квадрат, предполагающие использование таблицы сопряженности наблюдаемых значений (данных).

Статистика теста на независимость аналогична статистике теста на пригодность:

Equation1

где:

  • O = наблюдаемые значения
  • E = ожидаемые значения (которые должны быть не менее 5)

Тест на независимость определяет, являются ли два фактора независимыми или нет. Тест на независимость всегда является правосторонним из-за вычисления статистики теста. Если ожидаемые и наблюдаемые значения не близки друг к другу, то тестовая статистика очень велика и находится далеко в правом хвосте кривой хи-квадрат, как и в хорошем соответствии.

Количество степеней свободы для теста на независимость составляет:

Equation2

Следующая формула вычисляет ожидаемое число (E):

Equation3

Этот текст адаптирован из Openstax, Вводная статистика, раздел 11.3 Тест на независимость

Transcript

Тест на независимость определяет, являются ли две переменные таблицы сопряженностей независимыми.

В данном случае независимость означает, что вероятность любого события, включающего обе переменные, может быть получена непосредственно путем умножения их индивидуальных вероятностей.

Например, чтобы понять взаимосвязь между потреблением алкоголя и смертельностью в результате дорожно-транспортных происшествий, расположите данные в таблице соотношения два на два. Строки представляют трезвость или состояние опьянения субъектов, а столбцы представляют смертельный или несмертельный исход дорожно-транспортных происшествий.

Данные случайно выбранных выборок представляют собой наблюдаемые частоты, расположенные в двусторонней таблице.

Здесь E обозначает ожидаемую частоту, r — количество строк, а c — количество столбцов. Ожидаемая частота для каждой ячейки должна быть не менее 5.

Статистика критерия хи-квадрат вычисляется с использованием этих ожидаемых и наблюдаемых частот. Критическое значение и P-значения рассчитываются с использованием подходящих степеней свободы из таблицы хи-квадрат или программного обеспечения.

Наконец, проводится проверка гипотез, чтобы определить, являются ли употребление алкоголя и смертность в дорожно-транспортном происшествии независимыми событиями.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for