Il coefficiente di correlazione, r, sviluppato da Karl Pearson all’inizio del 1900, è numerico e fornisce una misura della forza e della direzione dell’associazione lineare tra la variabile indipendente x e la variabile dipendente y.
Se sospetti una relazione lineare tra x e y, allora r può misurare quanto è forte la relazione lineare.
Cosa ci dice il VALORE di r:
Il valore di r è sempre compreso tra –1 e +1: –1 ≤ r ≤ 1.
La dimensione della correlazione r indica la forza della relazione lineare tra x e y. Valori di r vicini a –1 o a +1 indicano una relazione lineare più forte tra x e y.
Se r = 0, probabilmente non c’è correlazione lineare. È importante visualizzare il grafico a dispersione perché i dati che presentano un modello curvo o orizzontale possono avere una correlazione pari a 0.
Se r = 1, esiste una correlazione positiva perfetta. Se r = –1, esiste una correlazione negativa perfetta. In entrambi i casi, tutti i punti dati originali giacciono in linea retta. Naturalmente, nel mondo reale, questo non accadrà generalmente.
Cosa ci dice il SEGNO di r
Un valore positivo di r significa che quando x aumenta, y tende ad aumentare e quando x diminuisce, y tende a diminuire (correlazione positiva).
Un valore negativo di r significa che quando x aumenta, y tende a diminuire, e quando x diminuisce, y tende ad aumentare (correlazione negativa).
Il segno di r è lo stesso del segno della pendenza, b, della linea più adatta.
Questo testo è adattato da Openstax, Statistiche introduttive, Sezione 12.3, L’equazione di regressione
Considera l’altezza e il peso di 5 atleti. All’aumentare dell’altezza degli atleti, aumenta anche il loro peso. Quindi, altezza e peso sono correlati positivamente.
Il grafico a dispersione del peso dell’atleta rispetto all’altezza mostra un modello lineare, che deve essere confermato utilizzando una misura quantitativa.
Il coefficiente di correlazione lineare, indicato con r, fornisce una misura quantitativa della forza di tale correlazione lineare tra due variabili.
Per un set di dati di questo tipo con n punti di dispersione i cui valori x e y sono noti, è possibile calcolare r.
Il valore di r è sempre compreso tra -1 e +1. Più alto è il modulo di r, più forte è la correlazione tra le variabili.
Se il valore di x o y viene scambiato o una delle variabili viene convertita in una scala diversa, il valore di r non viene modificato.
Il coefficiente di correlazione è fortemente influenzato dai valori anomali. Pertanto, se si sa che tali punti dati sono errori, possono essere rimossi per migliorare l’accuratezza del valore di r.
Related Videos
Correlation and Regression
11.7K Visualizzazioni
Correlation and Regression
6.1K Visualizzazioni
Correlation and Regression
5.9K Visualizzazioni
Correlation and Regression
5.7K Visualizzazioni
Correlation and Regression
4.0K Visualizzazioni
Correlation and Regression
7.3K Visualizzazioni
Correlation and Regression
4.6K Visualizzazioni
Correlation and Regression
6.8K Visualizzazioni
Correlation and Regression
2.2K Visualizzazioni
Correlation and Regression
3.0K Visualizzazioni