산술 평균은 데이터 집합의 중심 경향에 대해 가장 일반적으로 사용되는 측정값입니다. 데이터 세트를 구성하는 모든 요소의 합을 총 요소 수로 나눈 값으로 정의됩니다. 때로는 느슨하게 “평균”이라고 합니다.
데이터 세트의 모든 값이 고유하지 않은 경우 분자의 합계는 각 고유 값에 빈도를 곱하여 계산할 수 있습니다.
때때로, 표본의 산술 평균은 나머지와 크게 다른 몇 가지 데이터 포인트, 즉 이상치의 영향을 받을 수 있습니다. 예를 들어, 10명의 학생으로 구성된 표본에서 9명의 학생이 20세와 21세의 나이를 가지고 있고 한 명의 학생이 10세인 경우 산술 평균은 20보다 작으며, 이는 학생들의 연령의 중심 경향을 실제로 나타내지 않습니다. 따라서 산술 평균을 사용하여 데이터 세트의 중심 경향을 측정하기 전에 신중한 고려가 필요합니다.
정성적 데이터 세트의 산술 평균은 계산할 수 없습니다. 예를 들어, 국적이 다른 학생들로 구성된 학급에서는 국적에 대한 산술 평균이 없습니다.
Transcript
산술 평균은 종종 숫자 데이터 세트의 평균을 구하는 데 사용됩니다. 데이터 세트의 모든 값을 더하고 총 값 수 n으로 나누어 계산합니다. 여기서 대문자 시그마는 모든 값의 합을 나타냅니다.
예를 들어, 학교에서 학생들의 일일 스크린 타임을 생각해 보십시오. 산술 평균을 구하려면 모든 학생의 화면 시간을 더한 다음 결과를 총 학생 수로 나눕니다.
연구 표본은 무작위로 선택된 소수의 학생만 포함합니다. 이러한 표본 데이터의 평균을 표본 평균이라고 하며, x 막대로 표시됩니다.
대신, 학교의 모든 학생으로부터 데이터를 수집한 경우 인구 데이터가 됩니다. 결과로 생성되는 모집단 평균은 mu로 표시됩니다.
산술 평균은 모든 데이터 값을 고려하기 때문에 데이터를 대표하는 것으로 간주됩니다. 그러나 단일 극단값은 평균을 크게 변경할 수 있으므로 중심을 매우 민감하게 측정합니다.