16.11
Si considerino i tre ipotetici set di dati seguenti tracciati in Microsoft Excel.
Ora, tre misure della tendenza centrale - media, mediana e modale - possono essere calcolate utilizzando le funzioni di Excel MEDIA, MEDIANA e MODA. SNGL per l'intervallo di dati selezionato.
Dopo aver visualizzato i set di dati A e C, le loro code appaiono estese a sinistra e a destra.
Quantitativamente, questa asimmetria può essere determinata utilizzando la funzione di Excel INCLINA per l'intervallo di dati selezionato. Vengono calcolati come segue per i set di dati A, B e C.
La curtosi può essere misurata utilizzando la funzione KURT di Excel per l'intervallo di dati selezionato per i set di dati A, B e C.
L'asimmetria e la curtosi, come misure di asimmetria, determinano l'allontanamento dalla simmetria. Valori di inclinazione più vicini allo zero indicano una maggiore simmetria nei dati.
Valori positivi di curtosi indicano un picco più alto della distribuzione rispetto a una distribuzione normale, con meno valori al centro che nelle code.
Al contrario, i valori negativi mostrano la planarità della distribuzione, con più valori al centro che nelle code.
La tendenza centrale si riferisce al punto centrale o valore tipico di un set di dati. Riassume il set di dati con un singolo valore che rappresenta il centro della sua distribuzione. Le tre misure principali della tendenza centrale sono:
Media: la media aritmetica di tutti i punti dati. Viene calcolata sommando tutti i valori e dividendo per il numero di valori. La media è sensibile ai valori estremi (valori anomali).
Mediana: il valore intermedio quando i punti dati sono disposti in ordine crescente o decrescente. Se c'è un numero pari di osservazioni, la mediana è la media dei due numeri intermedi. La mediana è meno influenzata da valori anomali e dati asimmetrici.
Moda: il valore che si verifica più frequentemente in un set di dati. Un set di dati può avere una moda, più di una moda o nessuna moda.
La variazione misura la diffusione o la dispersione di un set di punti dati. Fornisce informazioni su quanto i punti dati differiscono dalla media e tra loro. Le principali misure di variazione includono:
Intervallo: la differenza tra i valori massimo e minimo nel set di dati. Fornisce un rapido senso della diffusione ma è altamente sensibile ai valori anomali.
Varianza: la media delle differenze al quadrato dalla media. Quantifica quanto sono distribuiti i punti dati attorno alla media.
Deviazione standard: la radice quadrata della varianza. È espressa nelle stesse unità dei dati e fornisce una misura della distanza media di ciascun punto dati dalla media.
Asimmetria
L'asimmetria misura l'asimmetria della distribuzione dei dati attorno alla media. Indica se i punti dati sono più concentrati su un lato della distribuzione o sul lato in cui la coda è più lunga o più spessa. I tipi di asimmetria includono:
Asimmetria positiva (asimmetria a destra): la coda destra è più lunga o più spessa di quella sinistra. In questo caso la media è maggiore della mediana.
Asimmetria negativa (asimmetria a sinistra): la coda sinistra è più lunga o più spessa di quella destra. In questo caso la media è inferiore della mediana.
Un valore di asimmetria vicino allo zero indica che la distribuzione dei dati è simmetrica.
Curtosi
La curtosi misura la "coda" o la nitidezza del picco di una distribuzione dei dati. Fornisce informazioni sulle estremità (code) della distribuzione. I tipi di curtosi includono:
Curtosi positiva (leptocurtica): indica una distribuzione con un picco più nitido e code più pesanti rispetto a una distribuzione normale. I punti dati sono più concentrati nelle code e nel picco.
Curtosi negativa (platicurtica): indica una distribuzione con un picco più piatto e code più leggere rispetto a una distribuzione normale. I punti dati sono meno concentrati nelle code e nel picco.
Mesocurtica: indica una distribuzione con curtosi simile a quella di una distribuzione normale.
La curtosi aiuta a comprendere i valori anomali e la probabilità di valori estremi nel set di dati.
Si considerino i tre ipotetici set di dati seguenti tracciati in Microsoft Excel.
Ora, tre misure della tendenza centrale - media, mediana e modale - possono essere calcolate utilizzando le funzioni di Excel MEDIA, MEDIANA e MODA. SNGL per l'intervallo di dati selezionato.
Dopo aver visualizzato i set di dati A e C, le loro code appaiono estese a sinistra e a destra.
Quantitativamente, questa asimmetria può essere determinata utilizzando la funzione di Excel INCLINA per l'intervallo di dati selezionato. Vengono calcolati come segue per i set di dati A, B e C.
La curtosi può essere misurata utilizzando la funzione KURT di Excel per l'intervallo di dati selezionato per i set di dati A, B e C.
L'asimmetria e la curtosi, come misure di asimmetria, determinano l'allontanamento dalla simmetria. Valori di inclinazione più vicini allo zero indicano una maggiore simmetria nei dati.
Valori positivi di curtosi indicano un picco più alto della distribuzione rispetto a una distribuzione normale, con meno valori al centro che nelle code.
Al contrario, i valori negativi mostrano la planarità della distribuzione, con più valori al centro che nelle code.
From Chapter 16:
Now Playing
Statistical Software
924 Views
Statistical Software
1.9K Views
Statistical Software
1.9K Views
Statistical Software
1.2K Views
Statistical Software
2.2K Views
Statistical Software
4.5K Views
Statistical Software
1.5K Views
Statistical Software
1.3K Views
Statistical Software
1.2K Views
Statistical Software
808 Views
Statistical Software
539 Views
Statistical Software
1.9K Views
Statistical Software
4.4K Views
Statistical Software
3.1K Views
Statistical Software
1.9K Views
See More