4.6: Varianza

Variance
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Variance
Please note that all translations are automatically generated. Click here for the English version.

9,482 Views

01:15 min
April 30, 2023

Overview

Las desviaciones muestran la dispersión de los datos con respecto a la media. Una desviación positiva se produce cuando el valor de los datos supera la media, mientras que una desviación negativa se produce cuando el valor de los datos es menor que la media. Si se suman las desviaciones, la suma siempre es cero. Por lo tanto, no se pueden simplemente sumar las desviaciones para obtener la dispersión de datos. Al elevar al cuadrado las desviaciones, los números se hacen positivos; Por lo tanto, su suma también será positiva.

La desviación estándar mide la dispersión en las mismas unidades que los datos. La varianza se define como el cuadrado de la desviación estándar. Por lo tanto, sus unidades difieren de las de los datos originales. La varianza de la muestra está representada por Equation1, mientras que la varianza de la población está representada por Equation2.

Para la varianza, el cálculo utiliza una división por n – 1 en lugar de n porque los datos son una muestra. Este cambio se debe a que la varianza de la muestra es una estimación de la varianza de la población. Con base en las matemáticas teóricas detrás de estos cálculos, dividir por (n – 1) da una mejor estimación de la varianza de la población.

Este texto es una adaptación de Openstax, Introducción a la estadística, Sección 2.7 Medida de la dispersión de los datos.

Transcript

La varianza es una estadística que estima la variabilidad de los valores del conjunto de datos a partir de la media. Es numéricamente igual al cuadrado de la desviación estándar de un conjunto de datos.

La varianza es una valiosa herramienta estadística utilizada en el análisis de la varianza, la estimación del riesgo o la volatilidad en los mercados financieros.

La varianza de la muestra se denota como el cuadrado de la desviación estándar de la muestra s, mientras que la varianza de la población se expresa como el cuadrado de la desviación estándar de la población sigma.

Imagínese si se estimara la variación del peso de la muestra de los osos polares en diferentes regiones del Ártico. Al dividir la población en muestras aleatorias y calcular las varianzas de la muestra, se observa que los valores se centran en el valor de la varianza constante de la población. Por lo tanto, la varianza de la muestra es un estimador imparcial de la varianza de la población.

La principal desventaja de la varianza es que sus unidades difieren enormemente de las unidades del conjunto de datos. Por ejemplo, las unidades de variación de la precipitación en un año serán milímetros cuadrados, lo cual no es útil. Por lo tanto, en la mayoría de los análisis, se prefiere la desviación estándar a la varianza.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for