La medida de variación más utilizada es la desviación estándar. Es un valor numérico que mide la distancia a la que se encuentran los valores de los datos de su media. El valor de la desviación estándar es pequeño cuando los datos se concentran cerca de la media, mostrando una ligera variación o dispersión. El valor de la desviación estándar nunca es negativo, es positivo o cero. La desviación estándar es mayor cuando los valores de los datos están más dispersos con respecto a la media, lo que significa que los valores de los datos presentan más variación.
Considere el tiempo de espera de los clientes en la caja de dos supermercados, X e Y. El tiempo medio de espera en ambos supermercados es de cinco minutos. En el supermercado X, la desviación estándar para el tiempo de espera es de dos minutos; en el supermercado Y, la desviación estándar del tiempo de espera es de cuatro minutos. Como el supermercado Y tiene una desviación estándar más alta, hay más variación en el tiempo de espera en el supermercado Y. En general, los tiempos de espera en el supermercado Y están más dispersos o muestran más desviaciones de la media. Por el contrario, los tiempos de espera en el supermercado X se concentran más cerca de la media.
La letra s minúscula significa la desviación estándar de la muestra, mientras que la letra griega σ (sigma, minúscula) representa la desviación estándar de la población.
La desviación estándar de la muestra viene dada por la fórmula
La desviación estándar de la población viene dada por la siguiente fórmula:
Este texto es una adaptación de <a href="https://openstax.org/books/introductory-statistics/pages/2-7-measures-of-the-spread-of-the-data?query=standard%20deviation&target=%7B%22type%22%3A%22search%22%2C%22index%22%3A0%7D#element-683">2.7 Medidas de la difusión de los datos – Estadísticas introductorias | OpenStax
Pensemos en los goles marcados por dos equipos con puntuaciones medias idénticas. Para averiguar el equipo con mejor rendimiento, se puede utilizar la desviación estándar, otra medida de variación, y comparar la dispersión de todos los valores de la media.
La fórmula de la desviación estándar depende de si los datos se extrajeron de una muestra o de una población completa. Si se trata de datos de muestra, la desviación estándar se denota por s. En el caso de los datos de población, se representa mediante sigma. Tenga en cuenta que el denominador es el tamaño de la población N para los datos de población, en lugar de n menos 1 como en los datos de muestra.
Si se trazan los datos del ejemplo, el gráfico de la izquierda muestra más dispersión, por lo tanto, mayor desviación estándar. Por el contrario, el de la derecha muestra una menor dispersión y una desviación estándar más pequeña. Por lo tanto, el equipo 2 es más consistente que el equipo 1.
Los valores de desviación estándar suelen ser positivos y son cero solo si todos los valores del conjunto de datos son iguales. La desviación estándar y el conjunto de datos comparten las mismas unidades: en este caso, es el número de objetivos.
Related Videos
Measures of Variation
11.4K Vistas
Measures of Variation
11.3K Vistas
Measures of Variation
16.1K Vistas
Measures of Variation
5.7K Vistas
Measures of Variation
7.4K Vistas
Measures of Variation
9.5K Vistas
Measures of Variation
3.8K Vistas
Measures of Variation
9.0K Vistas
Measures of Variation
5.2K Vistas
Measures of Variation
4.2K Vistas
Measures of Variation
2.6K Vistas