샘플 데이터 세트의 산술, 기하학 또는 조화 평균을 취하는 동안 모든 데이터 포인트에 동일한 중요도가 할당됩니다. 그러나 일부 데이터 세트에서 모든 값이 항상 동일하게 중요하지는 않을 수 있습니다. 내재적 편향으로 인해 특정 값에 다른 값보다 더 많은 가중치를 부여하는 것이 더 중요해질 수 있습니다.
예를 들어, 토너먼트 경기에서 득점한 골 수를 생각해 보십시오. 토너먼트에서 득점한 평균 골 수를 계산할 때 녹아웃 스테이지에서 치러진 경기를 고려하는 것이 더 중요할 수 있습니다. 녹아웃 스테이지의 목표는 다른 목표보다 더 많은 가중치를 가질 수 있습니다. 이 아이디어에 수치 추정치가 할당되면 토너먼트의 평균 골 수가 계산됩니다. 이러한 평균을 가중 평균이라고 합니다. 데이터 세트의 다른 요소에 내재적 가치를 할당하는 데 도움이 됩니다.
때로는 각 요소의 발생 확률이 가중치의 역할을 할 수 있습니다. 예를 들어, 편향된 주사위를 무작위로 몇 번 던지면 번호가 매겨진 면이 다른 면보다 더 자주 나타날 수 있습니다. 숫자의 가중 평균이 이러한 편향을 설명합니다.
Transcript
일부 값이 다른 값보다 더 중요한, 즉 더 많은 가중치를 갖는 데이터 집합을 생각해 보십시오.
이러한 데이터의 평균을 계산하기 위해 각 값에 가중치를 곱합니다. 결과 곱이 더해진 다음 가중치의 합으로 나뉩니다. 이를 가중 평균이라고 합니다.
예를 들어, 한 학생이 1년에 여러 번의 시험을 치르고 각각 가중치가 다릅니다. 모든 검정의 가중 평균을 확인하려면 개별 검정 점수에 해당 가중치를 곱하고 이러한 곱을 더하십시오. 그런 다음 이 최종 값을 모든 가중치의 합으로 나눕니다.
보시다시피 학생들은 더 높은 가중치로 테스트를 잘 수행함으로써 더 나은 평균 점수를 얻습니다. 즉, 가중치가 더 높은 데이터 값이 가중 평균에 더 많이 기여합니다.