11.2: Coefficiente di correlazione

Coefficient of Correlation
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Coefficient of Correlation
Please note that all translations are automatically generated. Click here for the English version.

6,068 Views

01:12 min
April 30, 2023

Overview

Il coefficiente di correlazione, r, sviluppato da Karl Pearson all’inizio del 1900, è numerico e fornisce una misura della forza e della direzione dell’associazione lineare tra la variabile indipendente x e la variabile dipendente y.

Se sospetti una relazione lineare tra x e y, allora r può misurare quanto è forte la relazione lineare.

Cosa ci dice il VALORE di r:

Il valore di r è sempre compreso tra –1 e +1: –1 ≤ r ≤ 1.

La dimensione della correlazione r indica la forza della relazione lineare tra x e y. Valori di r vicini a –1 o a +1 indicano una relazione lineare più forte tra x e y.

Se r = 0, probabilmente non c’è correlazione lineare. È importante visualizzare il grafico a dispersione perché i dati che presentano un modello curvo o orizzontale possono avere una correlazione pari a 0.

Se r = 1, esiste una correlazione positiva perfetta. Se r = –1, esiste una correlazione negativa perfetta. In entrambi i casi, tutti i punti dati originali giacciono in linea retta. Naturalmente, nel mondo reale, questo non accadrà generalmente.

Cosa ci dice il SEGNO di r

Un valore positivo di r significa che quando x aumenta, y tende ad aumentare e quando x diminuisce, y tende a diminuire (correlazione positiva).

Un valore negativo di r significa che quando x aumenta, y tende a diminuire, e quando x diminuisce, y tende ad aumentare (correlazione negativa).

Il segno di r è lo stesso del segno della pendenza, b, della linea più adatta.

Questo testo è adattato da Openstax, Statistiche introduttive, Sezione 12.3, L’equazione di regressione

Transcript

Considera l’altezza e il peso di 5 atleti. All’aumentare dell’altezza degli atleti, aumenta anche il loro peso. Quindi, altezza e peso sono correlati positivamente.

Il grafico a dispersione del peso dell’atleta rispetto all’altezza mostra un modello lineare, che deve essere confermato utilizzando una misura quantitativa.

Il coefficiente di correlazione lineare, indicato con r, fornisce una misura quantitativa della forza di tale correlazione lineare tra due variabili.

Per un set di dati di questo tipo con n punti di dispersione i cui valori x e y sono noti, è possibile calcolare r.

Il valore di r è sempre compreso tra -1 e +1. Più alto è il modulo di r, più forte è la correlazione tra le variabili.

Se il valore di x o y viene scambiato o una delle variabili viene convertita in una scala diversa, il valore di r non viene modificato.

Il coefficiente di correlazione è fortemente influenzato dai valori anomali. Pertanto, se si sa che tali punti dati sono errori, possono essere rimossi per migliorare l’accuratezza del valore di r.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for