가장 일반적으로 사용되는 변동 측도는 표준 편차입니다. 데이터 값이 평균에서 얼마나 멀리 떨어져 있는지 측정하는 숫자 값입니다. 표준 편차 값은 데이터가 평균 가까이에 집중되어 있을 때 작으며 약간의 변동 또는 산포를 보입니다. 표준 편차 값은 음수가 아니며 양수 또는 0입니다. 표준 편차는 데이터 값이 평균에서 더 멀리 퍼져 있을 때 더 크며, 이는 데이터 값이 더 많은 변동을 보인다는 것을 의미합니다.
X와 Y의 두 슈퍼마켓에서 계산대에서 고객을 기다리는 시간을 생각해 보십시오. 두 슈퍼마켓의 평균 대기 시간은 5분입니다. 슈퍼마켓 X에서 대기 시간의 표준 편차는 2분입니다. 슈퍼마켓 Y에서 대기 시간의 표준 편차는 4분입니다. 슈퍼마켓 Y의 표준 편차가 더 높기 때문에 슈퍼마켓 Y의 대기 시간에 더 많은 변동이 있습니다. 전반적으로 슈퍼마켓 Y의 대기 시간은 더 분산되어 있거나 평균에서 더 많은 편차를 보입니다. 반면, 슈퍼마켓 X의 대기 시간은 평균에 더 집중되어 있습니다.
소문자 s는 표본 표준 편차를 나타내고 그리스 문자 σ(sigma, 소문자)는 모집단 표준 편차를 나타냅니다.
표본 표준 편차는 다음 공식으로 제공됩니다.
모집단 표준 편차는 다음 공식으로 제공됩니다.
이 텍스트는 <a href="https://openstax.org/books/introductory-statistics/pages/2-7-measures-of-the-spread-of-the-data?query=standard%20deviation&target=%7B%22type%22%3A%22search%22%2C%22index%22%3A0%7D#element-683"에서 발췌한 것입니다>2.7 Measures of the Spread of the Data – Introductory Statistics | 오픈스택스
Transcript
평균 점수가 동일한 두 팀이 득점한 골을 생각해 보십시오. 더 나은 성과를 내는 팀을 찾기 위해 표준 편차와 또 다른 변동 측도를 사용하고 평균에서 모든 값의 산포를 비교할 수 있습니다.
표준 편차 공식은 데이터가 표본에서 추출되었는지 아니면 전체 모집단에서 추출되었는지에 따라 달라집니다. 표본 데이터인 경우 표준 편차는 s로 표시됩니다. 모집단 데이터의 경우 시그마로 표시됩니다. 분모는 표본 데이터에서와 같이 n에서 1을 뺀 값이 아니라 모집단 데이터에 대한 모집단 크기 N입니다.
예제의 데이터를 플로팅하면 왼쪽 그래프가 더 많은 확산을 보여주므로 표준 편차가 더 큽니다. 반면, 오른쪽에 있는 것은 산포가 적고 표준 편차가 더 작다는 것을 보여줍니다. 따라서 팀 2는 팀 1보다 일관성이 높습니다.
표준 편차 값은 일반적으로 양수이며 모든 데이터 세트 값이 동일한 경우에만 0입니다. 표준 편차와 데이터 세트는 동일한 단위를 공유합니다: 여기서는 목표의 수입니다.