16.14: Microsoft Excel: correlazione di Pearson

Microsoft Excel: Pearson’s Correlation
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Microsoft Excel: Pearson’s Correlation
Please note that all translations are automatically generated. Click here for the English version.

503 Views

01:18 min
January 09, 2025

Overview

Microsoft Excel è un potente strumento per l’analisi statistica, incluso il calcolo del coefficiente di correlazione di Pearson, che misura la forza e la direzione di una relazione lineare tra due variabili continue. Il coefficiente di correlazione di Pearson, spesso indicato come “r”, varia da -1 a 1. Un valore vicino a 1 indica una forte correlazione positiva, il che significa che all’aumentare di una variabile, lo fa anche l’altra. Un valore vicino a -1 indica una forte correlazione negativa, il che implica che all’aumentare di una variabile, l’altra diminuisce. Un valore intorno a 0 significa che non c’è una relazione lineare.

Per calcolare la correlazione di Pearson in Excel, è possibile utilizzare la funzione integrata =CORREL(array1, array2). Array1 e array2 sono i due set di dati per i quali si desidera calcolare la correlazione. Ad esempio, se sono presenti dati per la variabile X nelle celle A1:A10 e dati per la variabile Y nelle celle B1:B10, la formula =CORRELAZIONE(A1:A10, B1:B10) restituirà il coefficiente di correlazione tra X e Y.

Excel consente inoltre di visualizzare le correlazioni utilizzando grafici a dispersione. È possibile creare un grafico a dispersione per osservare visivamente se esiste una tendenza lineare tra due variabili, quindi aggiungere una linea di tendenza con l’equazione visualizzata. Ciò fornisce una comprensione intuitiva di quanto i punti dati si adattino a una linea retta. Tuttavia, in caso di relazione non lineare, l’uso del coefficiente di correlazione di Pearson non è appropriato.

Un punto significativo da notare è che la correlazione non implica la causalità. Anche se due variabili hanno un’alta correlazione, ciò non significa che una causi il cambiamento dell’altra. La correlazione di Pearson misura solo le relazioni lineari, quindi potrebbe non catturare associazioni più complesse e non lineari tra le variabili.

Excel consente inoltre un’analisi statistica più affidabile, ad esempio utilizzando il componente aggiuntivo Data Analysis Toolpak, che fornisce matrici di correlazione per più variabili, semplificando il confronto delle relazioni tra i set di dati. La correlazione di Pearson con Excel offre un modo semplice ma potente per esplorare e quantificare le relazioni nei dati.

Transcript

La correlazione è una relazione tra due variabili. Si considerino i seguenti dati ipotetici organizzati in Microsoft Excel.

Per eseguire la correlazione univariata, la variabile X deve essere disposta in una colonna e la variabile Y in una colonna alla sua destra.

Per tracciare queste due variabili, selezionare prima entrambe le colonne nella scheda Inserisci, trovare grafici e selezionare un grafico a dispersione.

Altri elementi come le linee di tendenza possono essere aggiunti ai disegni dei grafici.

Supponendo che i dati provengano da popolazioni normalmente distribuite, il coefficiente di correlazione di Pearson – r – viene calcolato utilizzando la funzione CORREL per i dati selezionati.

Anche un’altra funzione, PEARSON, restituisce lo stesso valore.

Queste funzioni misurano la forza e la direzione della relazione lineare tra due variabili. In questo caso, è 0,985, suggerendo una correlazione forte e positiva.

La funzione RSQ restituisce il valore al quadrato di r. Questo valore è il coefficiente di determinazione che misura la proporzione della varianza nella variabile dipendente che è prevedibile dalla variabile indipendente.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for