8.11: Wprowadzenie do testu niezależności

Introduction to Test of Independence
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Introduction to Test of Independence
Please note that all translations are automatically generated. Click here for the English version.

2,226 Views

01:21 min
May 22, 2025

Overview

W statystyce termin niezależność oznacza, że prawdopodobieństwo wystąpienia dowolnego zdarzenia obejmującego obie zmienne można bezpośrednio uzyskać, mnożąc ich indywidualne prawdopodobieństwa. Testy niezależności to testy chi-kwadrat polegające na wykorzystaniu tabeli kontyngencji obserwowanych wartości (danych).

Statystyka testu dla testu niezależności jest podobna do statystyki testu dobroci dopasowania:

Równanie1

gdzie:

  • O = wartości obserwowane
  • E = wartości oczekiwane (które powinny wynosić co najmniej 5)

Test niezależności określa, czy dwa czynniki są niezależne, czy nie. Test niezależności jest zawsze prawostronny ze względu na obliczenie statystyki testu. Jeśli wartości oczekiwane i obserwowane nie są blisko siebie, to statystyka testowa jest bardzo duża i znajduje się daleko w prawym ogonie krzywej chi-kwadrat, tak jak w przypadku dobrego dopasowania.

Liczba stopni swobody dla testu niezależności wynosi:

Równanie2

Poniższy wzór oblicza oczekiwaną liczbę (E):

Równanie3

Ten tekst został zaadaptowany z Openstax, Introductory Statistics, Section 11.3 Test of Independence

Transcript

Test niezależności określa, czy dwie zmienne tabeli kontyngencji są niezależne.

W tym przypadku niezależność oznacza, że prawdopodobieństwo dowolnego zdarzenia obejmującego obie zmienne można uzyskać bezpośrednio, mnożąc ich indywidualne prawdopodobieństwa.

Na przykład, aby zrozumieć związek między spożyciem alkoholu a śmiertelnością w wypadkach drogowych, ułóż dane w tabeli awaryjnej dwa na dwa. Wiersze reprezentują trzeźwość lub stan nietrzeźwości badanych, podczas gdy kolumny reprezentują ofiary śmiertelne lub nieśmiertelne w wypadkach drogowych.

Dane z losowo wybranych prób reprezentują obserwowane częstości ułożone w tabeli dwukierunkowej.

Tutaj E reprezentuje oczekiwaną częstotliwość, r oznacza liczbę wierszy, a c oznacza liczbę kolumn. Oczekiwana częstość dla każdej komórki musi wynosić co najmniej 5.

Statystyka testu chi-kwadrat jest obliczana przy użyciu tych oczekiwanych i obserwowanych częstości. Wartość krytyczna i wartości P są obliczane przy użyciu odpowiednich stopni swobody z tabeli chi-kwadrat lub oprogramowania.

Na koniec przeprowadzany jest test hipotezy w celu określenia, czy spożycie alkoholu i śmiertelność w wypadkach drogowych są niezależnymi zdarzeniami.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for