16.14:
Microsoft Excel: correlazione di Pearson
Microsoft Excel è un potente strumento per l’analisi statistica, incluso il calcolo del coefficiente di correlazione di Pearson, che misura la forza e la direzione di una relazione lineare tra due variabili continue. Il coefficiente di correlazione di Pearson, spesso indicato come “r”, varia da -1 a 1. Un valore vicino a 1 indica una forte correlazione positiva, il che significa che all’aumentare di una variabile, lo fa anche l’altra. Un valore vicino a -1 indica una forte correlazione negativa, il che implica che all’aumentare di una variabile, l’altra diminuisce. Un valore intorno a 0 significa che non c’è una relazione lineare.
Per calcolare la correlazione di Pearson in Excel, è possibile utilizzare la funzione integrata =CORREL(array1, array2). Array1 e array2 sono i due set di dati per i quali si desidera calcolare la correlazione. Ad esempio, se sono presenti dati per la variabile X nelle celle A1:A10 e dati per la variabile Y nelle celle B1:B10, la formula =CORRELAZIONE(A1:A10, B1:B10) restituirà il coefficiente di correlazione tra X e Y.
Excel consente inoltre di visualizzare le correlazioni utilizzando grafici a dispersione. È possibile creare un grafico a dispersione per osservare visivamente se esiste una tendenza lineare tra due variabili, quindi aggiungere una linea di tendenza con l’equazione visualizzata. Ciò fornisce una comprensione intuitiva di quanto i punti dati si adattino a una linea retta. Tuttavia, in caso di relazione non lineare, l’uso del coefficiente di correlazione di Pearson non è appropriato.
Un punto significativo da notare è che la correlazione non implica la causalità. Anche se due variabili hanno un’alta correlazione, ciò non significa che una causi il cambiamento dell’altra. La correlazione di Pearson misura solo le relazioni lineari, quindi potrebbe non catturare associazioni più complesse e non lineari tra le variabili.
Excel consente inoltre un’analisi statistica più affidabile, ad esempio utilizzando il componente aggiuntivo Data Analysis Toolpak, che fornisce matrici di correlazione per più variabili, semplificando il confronto delle relazioni tra i set di dati. La correlazione di Pearson con Excel offre un modo semplice ma potente per esplorare e quantificare le relazioni nei dati.
La correlazione è una relazione tra due variabili. Si considerino i seguenti dati ipotetici organizzati in Microsoft Excel.
Per eseguire la correlazione univariata, la variabile X deve essere disposta in una colonna e la variabile Y in una colonna alla sua destra.
Per tracciare queste due variabili, selezionare prima entrambe le colonne nella scheda Inserisci, trovare grafici e selezionare un grafico a dispersione.
Altri elementi come le linee di tendenza possono essere aggiunti ai disegni dei grafici.
Supponendo che i dati provengano da popolazioni normalmente distribuite, il coefficiente di correlazione di Pearson – r – viene calcolato utilizzando la funzione CORREL per i dati selezionati.
Anche un’altra funzione, PEARSON, restituisce lo stesso valore.
Queste funzioni misurano la forza e la direzione della relazione lineare tra due variabili. In questo caso, è 0,985, suggerendo una correlazione forte e positiva.
La funzione RSQ restituisce il valore al quadrato di r. Questo valore è il coefficiente di determinazione che misura la proporzione della varianza nella variabile dipendente che è prevedibile dalla variabile indipendente.
Related Videos
Statistical Softwares
565 Visualizzazioni
Statistical Softwares
505 Visualizzazioni
Statistical Softwares
287 Visualizzazioni
Statistical Softwares
338 Visualizzazioni
Statistical Softwares
329 Visualizzazioni
Statistical Softwares
184 Visualizzazioni
Statistical Softwares
125 Visualizzazioni
Statistical Softwares
140 Visualizzazioni
Statistical Softwares
145 Visualizzazioni
Statistical Softwares
131 Visualizzazioni
Statistical Softwares
175 Visualizzazioni
Statistical Softwares
237 Visualizzazioni
Statistical Softwares
903 Visualizzazioni
Statistical Softwares
503 Visualizzazioni
Statistical Softwares
621 Visualizzazioni
Statistical Softwares
323 Visualizzazioni