11.8: Variazione

Variation
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Variation
Please note that all translations are automatically generated. Click here for the English version.

6,754 Views

01:19 min
April 30, 2023

Overview

Una caratteristica importante di qualsiasi insieme di dati è la variazione dei dati. In alcuni set di dati, i valori dei dati sono concentrati vicino alla media; In altri set di dati, i valori dei dati sono più ampiamente distribuiti rispetto alla media. La misura più comune della variazione, o spread, è la deviazione standard, che è la radice quadrata della varianza.

Quando le variabili indipendenti e dipendenti vengono tracciate su un grafico a dispersione, la pendenza di una linea è un valore che descrive la velocità di variazione tra le due variabili. La pendenza ci dice come cambia la variabile dipendente (y) per ogni aumento unitario della variabile indipendente (x), in media. L’intercetta y descrive la variabile dipendente quando la variabile indipendente è uguale a zero. Una linea di regressione, o una linea di best fit, può essere tracciata su un grafico a dispersione e utilizzata per prevedere i risultati per le variabili x e y in un determinato set di dati o dati campione.

La differenza tra il valore del campione osservato, y, e il valore previsto,Equation1 dall’equazione di regressione, è nota come deviazione inspiegabile. Mentre la differenza tra il valore previsto e la media del campione, y̅, è chiamata deviazione spiegata. La differenza tra il valore osservato, y, e la media campionaria, , è la deviazione totale.

Se si sommano i quadrati delle deviazioni spiegate per tutti i punti dati, si ottiene la variazione spiegata. Allo stesso modo, se sommiamo i quadrati delle deviazioni inspiegabili per tutti i punti dati, otteniamo la variazione inspiegabile. Inoltre, se sommiamo i quadrati delle deviazioni totali per tutti i punti dati, otteniamo la variazione totale. Dividendo la variazione spiegata per la deviazione totale si ottiene il valore del coefficiente di determinazione, r2, che rappresenta la percentuale della variazione della variabile dipendente y che può essere spiegata dalla variazione della variabile indipendente x utilizzando la retta di regressione.

Questo testo è adattato da Openstax, Statistiche introduttive, Sezione 12, Regressione lineare e correlazione.

Transcript

In un set di dati non correlato, per un dato valore di x, il valore meglio previsto di y è la media.

Se le variabili hanno una correlazione lineare, un valore y può essere previsto sostituendo il valore x nell’equazione di regressione.

La distanza verticale tra il valore y previsto e la media campionaria, la barra y, è nota come deviazione spiegata. La relazione tra le due variabili può spiegare questa deviazione.

La distanza verticale tra il punto dati e il valore y previsto è nota come deviazione inspiegabile o residuo. La relazione tra le variabili non può spiegare questa deviazione; Può essere dovuto solo al caso o al coinvolgimento di altre variabili.

La somma delle deviazioni inspiegabili e spiegate dà la deviazione totale.

Elevando al quadrato le deviazioni e sommandole per tutti i punti dati si ottiene la quantità di variazione inspiegabile, spiegata e totale.

Il rapporto tra la variazione spiegata e la variazione totale è il valore r-quadrato, noto anche come coefficiente di determinazione. Indica la proporzione della variazione nel valore y che la linea di regressione può spiegare.

Key Terms and definitions​

  • Variation - The spread or deviation of the data values in relation to the mean of the data set.
  • Standard Deviation - The most common measure of variation, and equal to the square root of variance.
  • Regression Line - A predictive line indicating the relation between dependent and independent variables in a scatter plot.
  • Explained and Unexplained Variation - The parts of total variation attributable to and not attributable to the Regression Line, respectively.
  • Coefficient of Determination - Represents percentage of variation in dependent variable that can be explained using the Regression line.

Learning Objectives

  • Define Variation – Understand the spread in a given dataset (e.g., variation)
  • Contrast Explained and Unexplained Variation – Understand the different components of total variation (e.g., Explained and Unexplained Variation).
  • Explore Regression Line – Understanding its role in predicting values (e.g., Regression Line).
  • Explain Coefficient of Determination - Understanding what it represents.
  • Apply in Context – Understand how these concepts come together when analyzing a data set.

Questions that this video will help you answer

  • What is variation and how does it relate to standard deviation?
  • What's the role and significance of Regression Line in a scatter plot?
  • What is the coefficient of determination, and what does it represent?

This video is also useful for

  • Students – Understand how these key terms can help comprehend dataset characteristics
  • Educators – Provides a clearer framework for the teaching of the topic
  • Researchers – Crucial elements for a much broader scientific study or methodology
  • Science Enthusiasts – Offers insights and understandings that can satisfy curiosity towards these topics.