4.3
Consider the goals scored by two teams with identical mean scores. To find out the better performing team, one can use standard deviation, another measure of variation, and compare the spread of all values from the mean.
The standard deviation formula depends on whether the data was drawn from a sample or from an entire population. If it's sample data, the standard deviation is denoted by s. For population data, it is represented by sigma. Note that the denominator is population size N for population data, instead of n minus 1 as in sample data.
If one plots the data from the example, the graph on the left shows more spread, hence, greater standard deviation. In contrast, the one on the right shows less spread and a smaller standard deviation. So, Team 2 is more consistent than Team 1.
Standard deviation values are usually positive and are zero only if all the dataset values are equal. The standard deviation and the dataset share the same units: here, it is the number of goals.
De meest gebruikte maatstaf voor spreiding is de standaarddeviatie (ook wel standaardafwijking genoemd). Dit is een numerieke waarde die aangeeft hoe ver de gegevenswaarden afwijken van hun gemiddelde. De standaarddeviatie is klein wanneer de gegevens dicht bij het gemiddelde liggen en weinig spreiding vertonen. De standaarddeviatie is nooit negatief; deze is altijd positief of nul. Een grotere standaarddeviatie betekent dat de gegevens verder van het gemiddelde afwijken, wat duidt op een grotere spreiding van de gegevens.
Beschouw de wachttijd voor klanten bij de kassa in twee supermarkten, X en Y. De gemiddelde wachttijd in beide supermarkten bedraagt vijf minuten. In supermarkt X is de standaarddeviatie van de wachttijd twee minuten; in supermarkt Y is de standaarddeviatie van de wachttijd vier minuten. Aangezien supermarkt Y een hogere standaarddeviatie heeft, is er meer variabiliteit in de wachttijden bij supermarkt Y. Over het algemeen zijn de wachttijden bij supermarkt Y meer verspreid en vertonen ze grotere afwijkingen van het gemiddelde. Daarentegen liggen de wachttijden in supermarkt X meer geconcentreerd rond het gemiddelde.
De kleine letter ‘s’ duidt op de standaarddeviatie van een steekproef, terwijl de Griekse letter σ (sigma, kleine letter) de standaarddeviatie van de populatie aanduidt.
De standaarddeviatie van de steekproef wordt gegeven door de volgende formule:
De standaarddeviatie van de populatie wordt gegeven door de volgende formule:
Deze tekst is een bewerking van 2.7 Metingen van de verspreiding van de gegevens - Inleidende statistieken | OpenStax
Consider the goals scored by two teams with identical mean scores. To find out the better performing team, one can use standard deviation, another measure of variation, and compare the spread of all values from the mean.
The standard deviation formula depends on whether the data was drawn from a sample or from an entire population. If it's sample data, the standard deviation is denoted by s. For population data, it is represented by sigma. Note that the denominator is population size N for population data, instead of n minus 1 as in sample data.
If one plots the data from the example, the graph on the left shows more spread, hence, greater standard deviation. In contrast, the one on the right shows less spread and a smaller standard deviation. So, Team 2 is more consistent than Team 1.
Standard deviation values are usually positive and are zero only if all the dataset values are equal. The standard deviation and the dataset share the same units: here, it is the number of goals.
From Chapter 4:
Now Playing
Measures of Variation
18.3K Views
Measures of Variation
13.1K Views
Measures of Variation
12.4K Views
Measures of Variation
10.3K Views
Measures of Variation
11.3K Views
Measures of Variation
10.3K Views
Measures of Variation
6.2K Views
Measures of Variation
10.8K Views
Measures of Variation
8.2K Views
Measures of Variation
4.6K Views
Measures of Variation
2.6K Views