12.6: Analiza chi-kwadrat

Chi-square Analysis
JoVE Core
Molecular Biology
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Molecular Biology
Chi-square Analysis
Please note that all translations are automatically generated. Click here for the English version.

36,370 Views

02:46 min
April 07, 2021

Overview

Test chi-kwadrat jest testem hipotezy statystycznej. Służy do sprawdzenia, czy istnieje znacząca różnica między wartością oczekiwaną a wartością obserwowaną. W kontekście genetyki pozwala nam zaakceptować lub odrzucić hipotezę na podstawie tego, jak bardzo obserwowane wartości odbiegają od wartości oczekiwanych.

Test chi-kwadrat został opracowany przez Pearsona w 1990 roku.

Pierwszym krokiem do przeprowadzenia analizy chi-kwadrat jest ustalenie hipotezy zerowej, która zakłada, że nie ma rzeczywistej różnicy między wartością oczekiwaną a wartością obserwowaną. Wszelkie pozorne odchylenia od wartości oczekiwanej wynikają po prostu z przypadku.

Hipoteza zerowa jest odrzucana, jeśli wartość prawdopodobieństwa jest mniejsza niż 5%. Weźmy na przykład krzyżówkę gatunku rośliny z żółtymi i zielonymi nasionami. Wszystkie rośliny generacji F1 miały zielone nasiona. Po samozapłodnieniu wśród pokolenia F1 wartość oczekiwana w pokoleniu F2 wynosi 660 roślin z zielonymi nasionami i 220 roślin z żółtymi nasionami. Jednak obserwowana wartość w pokoleniu F2 to 620 roślin z zielonymi nasionami i 260 roślin z żółtymi nasionami. Teraz chi-kwadrat służy do ustalenia, czy różnica między wartościami obserwowanymi i oczekiwanymi jest znacząca? Czy możemy wywnioskować, że obserwowane dziedziczenie następuje po mendlowskiej krzyżówce monohybrydowej?

Wartość chi-kwadrat oblicza się za pomocą wzoru podanego poniżej:

Rysunek1

Gdzie O jest wartością obserwowaną, a E jest wartością oczekiwaną.

Wartość chi-kwadrat jest obliczana jako 9,69. Aby przyjąć lub odrzucić hipotezę, wymagane są stopnie swobody. Stopień swobody to liczba klas pomniejszona o jeden. Odnosi się do wartości biorących udział w obliczeniach, które się różnią.

W powyższym przykładzie obserwuje się dwa różne kolory nasion. Zatem stopień swobody wyniesie 2 – 1 = 1. Aby sprawdzić, czy wynik jest istotny statystycznie, obliczona wartość chi-kwadrat i stopień swobody są analizowane na wykresie prawdopodobieństwa pod α=0,05. Wartość z tabeli wynosi 3,841. Ponieważ wartość chi-kwadrat 9,69 jest większa niż 3,841, mamy statystycznie istotne dowody na odrzucenie hipotezy zerowej. Innymi słowy, różnice zaobserwowane między wartościami eksperymentalnymi a oczekiwanymi wynikają wyłącznie z przypadku.

Transcript

Mendel postawił hipotezę, że stosunek fenotypowy krzyżówki monohybrydowej między osobnikami o cechy dominującej, takiej jak fioletowe kwiaty, i cechy recesywnej, takiej jak białe kwiaty, wynosiłby w przybliżeniu trzy do jednego, pod warunkiem, że allele są niezależnie dobrane.

Kiedy zakłada się, że dane będą pasować do pewnego stosunku, jak przewidywanie Mendla 3:1, ustanawia się hipotezę zerową. Hipoteza zerowa zakłada, że nie ma rzeczywistej różnicy między wartościami oczekiwanymi a obserwowanymi, a wszelkie pozorne różnice wynikają z przypadku.

Rozważ krzyżówkę monohybrydową między dwudziestoma wysokimi roślinami i dwudziestoma niskimi roślinami. Pokolenie F2 tej krzyżówki daje 33 wysokie rośliny i 7 niskich. Jest to wartość obserwowana.

Aby przetestować hipotezę zerową, można przeprowadzić analizę chi-kwadrat. Najpierw utwórz tabelę z trzema kolumnami: fenotyp, wartość obserwowana i wartość oczekiwana. Fenotyp i obserwowane wartości są już znane, ale należy obliczyć oczekiwane wartości.

Oblicz oczekiwane wartości, dzieląc całkowitą liczbę zaobserwowanych roślin przez całkowitą liczbę oczekiwanych roślin – czyli trzy plus jeden równa się cztery. Tak więc czterdzieści podzielone przez cztery to dziesięć.

Dziesięć reprezentuje “jeden” z oczekiwanej częstotliwości trzy do jednego. Stąd istnieje dziesięć roślin z recesywnym genem “krótkim”.

Teraz pomnóż dziesięć przez trzy, aby uzyskać “trzy” oczekiwanej częstotliwości trzy do jednego. Tak więc istnieje trzydzieści roślin z dominującym genem “wysokim”.

Oblicz różnicę między wartością obserwowaną a oczekiwaną w każdym wierszu i podnieś wyniki do kwadratu.

Następnie podziel tę wartość przez wartość oczekiwaną w każdym wierszu i dodaj je wszystkie razem, aby uzyskać wartość chi-kwadrat – 1,2.

Należy również obliczyć stopień swobody, który jest definiowany jako liczba wartości, które mogą się różnić w końcowym obliczeniu statystyki. Uzyskaj stopień swobody za pomocą tego wzoru, gdzie n jest liczbą klas lub w tym przypadku fenotypów. Tutaj jest jeden stopień swobody.

Korzystając z wartości chi-kwadrat i stopnia swobody, uzyskaj wynik na wykresie prawdopodobieństwa. Tutaj 1,2 mieści się w przedziale od 1,07 do 1,64. Wartości p dla nich wynoszą 0,30 i 0,20, czyli są większe niż 0,05. W związku z tym hipoteza zerowa nie jest odrzucana, co wskazuje, że allele dotyczące wysokości rośliny są niezależnie sortowane.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for