데이터 세트의 평균을 측정하는 동안 평균을 중심 경향과 연관시킬 때 주의해야 합니다. 산술 평균, 기하 평균 또는 조화 평균도 마찬가지입니다. 이는 단일 이상치 데이터 값의 존재가 평균에 상당한 영향을 미칠 수 있기 때문입니다. 즉, 평균은 데이터 세트의 변동에 민감합니다.
중심 경향의 특정 측정값은 이상값에 민감하지 않지만, 문제를 해결하는 다른 버전의 평균이 있습니다. 절사 평균이 그러한 예 중 하나입니다. 데이터를 정렬한 후 산술 평균, 기하 평균 또는 조화 평균을 계산하기 전에 이상값을 제거할 수 있습니다. 트리밍이 상한과 하한 모두에서 정렬된 데이터의 동일한 비율에 대해 대칭적으로 수행되는 경우, 데이터는 해당 백분율만큼 트리밍된다고 합니다.
Transcript
일반적으로 데이터 세트의 평균은 모든 값의 합을 총 값 수로 나누어 계산합니다. 그러나 평균은 극단값의 존재 여부에 매우 민감합니다. 예를 들어, 학생의 평균 키는 이상값(너무 작거나 너무 큰 학생)의 영향을 받습니다.
이러한 경우 데이터가 먼저 정렬된 다음 이상값이 제거됩니다. 이제 나머지 데이터 값에 대한 평균이 계산됩니다. 이러한 평균을 절사 평균 또는 절삭 평균이라고 합니다.
여기서는 총 10개의 데이터 값 중에서 데이터 집합의 양쪽에 있는 값이 하나씩 잘립니다. 즉, 데이터의 10%가 양쪽에서 제거됩니다. 그런 다음 나머지 값에 대해 평균을 계산하고 10% 절사 평균이라고 합니다.
절사 평균은 평균에서 의미 없는 변동을 방지하는 데 도움이 됩니다. 예를 들어, 인플레이션율은 상품 가격의 절사 평균을 사용하여 계산됩니다. 변동성이 큰 가격 변동을 무시하고 데이터를 매끄럽게 하여 가장 정확한 인플레이션율을 제공합니다.