1.16: Regresja w kierunku średniej

Regression Toward the Mean
JoVE Core
Social Psychology
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Social Psychology
Regression Toward the Mean
Please note that all translations are automatically generated. Click here for the English version.

6,269 Views

01:52 min
February 12, 2020

Overview

Regresja w kierunku średniej (“RTM”) to zjawisko, w którym skrajnie wysokie lub niskie wartości – na przykład ciśnienie krwi danej osoby w danym momencie – wydają się bliższe średniej dla grupy po pomiarze. Chociaż ta statystyczna osobliwość jest wynikiem przypadkowego błędu i przypadku, była problematyczna w różnych zastosowaniach medycznych, naukowych, finansowych i psychologicznych. W szczególności RTM, jeśli nie jest brany pod uwagę, może przeszkadzać, gdy badacze próbują ekstrapolować wyniki zaobserwowane w małej próbie na większą populację będącą przedmiotem zainteresowania.

Statystyka opisowa, statystyka inferencyjna i RTM

Dziedzina statystyki ma dwie główne podkategorie, określane jako opisowe i wnioskowane (przegląd zob. Beins & McCarthy, 2019 i Franzoi, 2011). Jak sama nazwa wskazuje, pierwsza z nich ma na celu “opisanie danych” pochodzących z konkretnej próbki, np. noworodków w konkretnym szpitalu w Stanach Zjednoczonych, których matki przyjmowały witaminę prenatalną w czasie ciąży. Statystyki opisowe zazwyczaj obejmują miary tendencji centralnej (takie jak średnia), wskaźniki zmienności (takie jak odchylenie standardowe) oraz wykresy podsumowujące wyniki próby. Na przykład statystyki opisowe dla naszego przykładu noworodka mogą obejmować średnią masę urodzeniową i odchylenie standardowe, a także wykres rozkładu częstości mas urodzeniowych dla dzieci urodzonych w szpitalu w ciągu ostatniego roku. Co ważne, statystyki opisowe odnoszą się tylko do badanej próby i same w sobie nie mogą być wykorzystane do wyciągania wniosków na temat większej populacji – w tym przypadku wszystkich noworodków w Stanach Zjednoczonych urodzonych przez matki, które przyjmowały pigułki prenatalne.

Natomiast statystyki inferencyjne są wykorzystywane przez badaczy do “wnioskowania” lub wyciągania wniosków na temat populacji na podstawie wyników obliczonych dla reprezentatywnej próby. W tym przypadku naukowcy mogą porównać średnią masę urodzeniową dzieci urodzonych w szpitalu u matek wykonujących badania prenatalne z wagą noworodków, których matki nie miały takiej masy. Początkowo można zaobserwować, że dzieci w okresie prenatalnym mają wyższą średnią masę urodzeniową niż dzieci nieurodzeniowe. Korzystając ze złożonych równań matematycznych, statystyki wnioskowania mogą następnie określić, czy różnica między tymi dwiema średnimi jest znacząca – zdefiniowana w nauce jako mająca mniej niż 5% prawdopodobieństwa, że jest spowodowana przypadkiem. Jeśli tak jest, można wyciągnąć wnioski na temat większej populacji – w tym przypadku, że w całym kraju noworodki, których matki przyjmowały pigułki prenatalne, mają wyższą masę urodzeniową niż te, których matki tego nie robiły.

Niestety, RTM może sprawiać wrażenie, że istnieje znacząca różnica między grupami – z powodu leczenia, takiego jak powyższe leki prenatalne – podczas gdy w rzeczywistości nie ma znaczącej dysproporcji, a wszelkie rozbieżności są wynikiem losowego przypadku. Czasami badacze publikują nawet dane stwierdzające, że dany schemat był skuteczny, podczas gdy w rzeczywistości ich wyniki wynikają z tego zjawiska statystycznego; tak było m.in. w przypadku programów mających na celu walkę z otyłością u dzieci (Skinner, Heymsfield, Pietrobelli, Faith i Allison, 2015). Na szczęście opracowano metody statystyki wnioskowania, które oceniają i uwzględniają RTM, co pozwala badaczom być bardziej pewnymi prawdziwości swoich danych i skuteczności każdego leczenia (Barnett et al., 2005).

RTM w różnych dziedzinach

RTM ma daleko idące implikacje. W badaniach medycznych i naukowych zaobserwowano ciśnienie krwi (Bland i Altman, 1994), gęstość kości kobiet (Cummings, Palermo, Browner i in., 2000), tętno płodu (Park, Hoh i Park, 2012), a nawet jakość nasienia (Baker i Kovacs, 1985), by wymienić tylko kilka przykładów. Jednak RTM wykracza poza obserwacje medyczne i został odnotowany na giełdzie (Murstein, 2003), wynikach studentów latania (Kahneman i Tversky, 1973), a nawet był używany jako wyjaśnienie, dlaczego niektóre pary się rozwodzą (jak recenzowany w Murstein, 2003). Tak więc to zjawisko statystyczne wpływa na wiele dziedzin, od medycyny po finanse, i powinno być dokładnie rozważone przez badaczy wykorzystujących statystykę do wyciągania wniosków.

Transcript

Czasami ludzie myślą, że pewne wydarzenia są pod osobistą kontrolą. Na przykład mogą założyć, że ich ulubiony sportowiec zawsze będzie osiągał najlepsze wyniki, a zatem mogą być zaskoczeni, gdy po niesamowitym występie następuje przeciętny.

Warto zauważyć, że trend ten występuje dla wielu zmiennych o rozkładach normalnych. Na przykład, gdy lekarz mierzy ciśnienie krwi pacjentki, jej wartość rozkurczowa wynosi 95 mmHg. 

Następnie lekarz wprowadza i porównuje tę liczbę z liczbą wszystkich swoich pacjentów i zauważa, że – po przedstawieniu na wykresie – wartości te pokazują normalny rozkład w kształcie dzwonu.

W tym przypadku wynik kobiety znajduje się na skrajnym końcu krzywej. Zaniepokojony lekarz ponownie bada jej ciśnienie krwi; Co zaskakujące, stwierdza, że liczba rozkurczowa zmniejszyła się.

Innymi słowy, obserwowane wcześniej “ekstremalne” ciśnienie cofnęło się do średniej dla wszystkich pacjentów. Rzadko zdarza się, aby czyjeś wyniki były wielokrotnie dalekie od średniej, nawet na wyższym końcu.

To nachylenie nazywa się regresją w kierunku średniej – tendencją do tego, że po ponownej ocenie po wartości ekstremalnej następuje mniej radykalny wynik, zasadniczo zbliżający się do średniej grupy.

W rezultacie, jeśli terapia wpływa tylko na osoby z początkowo ekstremalnymi wynikami, prawdopodobnie jest to nieskuteczna strategia. Jeśli jednak leczenie obniża średnią dla danej grupy – na przykład w przypadku ciśnienia krwi – jest to silny dowód na jego skuteczność.

Nie mając świadomości tego zjawiska statystycznego, lekarz mógłby rozdawać leki na ciśnienie krwi, podczas gdy w rzeczywistości jego pacjent nie potrzebował leczenia.

W końcu wyniki oparte na wartościach odstających nie powinny być traktowane zbyt poważnie.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for