Testy statystyczne mogą obliczyć, czy istnieje związek lub korelacja między zmiennymi niezależnymi i zależnymi. Pośredni związek zmiennych oznacza korelację, podczas gdy bezpośredni związek pokazuje przyczynowość. Jeśli zostanie ustalone, że nie ma związku między zmiennymi, to korelacja jest zbiegiem okoliczności.
Korelacja a przyczynowość
Jeśli zmienna zależna rośnie lub maleje wraz ze wzrostem zmiennej niezależnej, istnieje odpowiednio dodatnia lub ujemna korelacja między tymi dwiema zmiennymi. Jeśli ta zależność jest pośrednia, to wynika to z korelacji. Jednak bezpośredni związek oznaczałby związek przyczynowy.
Na przykład, jeśli badacz chce określić przyczynę utraty ogonów w pięciu różnych populacjach gekonów i znajdzie ujemną zależność między liczbą gekonów bez ogonów a liczbą pasożytniczych kleszczy u wron, wynik ten stanowiłby ujemną korelację i wskazywałby, że pasożyt wrony nie powoduje bezpośrednio utraty ogona u gekonów.
Gdyby jednak wrony zostały policzone w pobliżu każdej populacji gekonów, można by znaleźć dodatni związek między liczbą wron a gekonami bezogonowymi. Jeśli po zbadaniu zawartości żołądków wron odkryto brakujące ogony gekonów, liczba wron bezpośrednio określiłaby liczbę ogonów utraconych przez gekony – wskazując na związek przyczynowy. Korelacja mogłaby być przypadkowa, gdyby w żołądkach wron nie znaleziono ogonów gekonów.
Co ważne, w tym przykładzie występuje ujemna korelacja między liczbą wron a liczbą pasożytniczych kleszczy wron. Liczba pasożytów wron prawdopodobnie będzie rosła wraz ze wzrostem liczby wron, co stanowi pozytywną korelację. W tym scenariuszu liczba kleszczy kruków również dodatnio korelowałaby z liczbą jaszczurek bezogoniastych. Jednak w przeciwieństwie do związku między populacjami wron i jaszczurek bezogoniastych, liczba kleszczy i jaszczurek bezogoniastych nie jest przyczynowo powiązana.