기술 통계는 표본의 관련 특성을 설명하거나 요약하고 관심 있는 데이터를 분석하는 데 도움이 됩니다. 많은 양의 데이터를 분석하고 추론을 개발할 때 전체 데이터 세트를 대표하는 값을 식별해야 합니다. 중심 경향, 극한 값, 측정 범위 또는 가장 반복되는 값과 같은 특성은 데이터를 더 잘 이해하는 데 도움이 될 수 있습니다.
중심 경향은 가장 일반적으로 사용되는 데이터 특성입니다. 데이터를 고유하게 나타내는 단일 값을 식별하는 통계적 측정값입니다.
평균, 중앙값, 최빈값, 중간범위는 중심 경향의 네 가지 필수 척도이며 서로 장점과 단점이 있습니다.
평균: 평균은 데이터 세트의 평균 값으로 정의됩니다. 그러나 평균의 치명적인 단점은 특히 표본 크기가 작은 경우 이상치라고 하는 극단적인 값에 민감
하다는 것입니다.
중앙값: 중앙값은 모든 데이터 요소가 증가 또는 감소하는 순서로 정렬될 때 데이터 집합의 중심 또는 중간 값입니다. 중앙값은 일반적으로 극단값이나 이상값이 있을 때 중심을 더 잘 측정하는데, 이는 이상값의 정확한 수치에 영향을 받지 않기 때문입니다.
모드: 모드는 데이터 집합의 가장 빈번한 값으로 정의됩니다. 바이모달 데이터에는 두 가지 모드가 있고 멀티모달 데이터에는 두 가지 이상의 모드가 있습니다. 모드는 공칭 측정 수준에 대한 중심의 유일한 측정값입니다.
중간 범위: 중간 범위는 데이터 세트에서 두 극단 값 사이의 중간점을 제공합니다. 계산하기는 쉽지만 이상값에 취약하고 통계에 거의 사용되지 않습니다.
Transcript
중심 경향, 데이터 변동, 데이터 분포, 극한 값, 시간 경과에 따른 데이터 특성의 변화와 같은 데이터의 특성은 더 나은 통계 분석을 위해 중요합니다.
중심 경향은 데이터를 일반적으로 또는 고유하게 대표하는 단일 값을 식별하는 통계적 측정입니다.
평균, 중앙값, 최빈값, 중간범위는 중심 경향의 네 가지 필수 척도입니다. 학생 그룹의 퀴즈 점수를 고려하여 이를 이해할 수 있습니다.
평균은 데이터의 평균값을 나타냅니다. 이 예에서 평균은 학생들이 득점한 평균 점수입니다. 중앙값은 데이터의 중심 값 또는 중간점에 대한 통찰력을 제공하며, 이는 데이터를 증가 또는 내림차순으로 재정렬하여 얻을 수 있습니다.
이 모드는 데이터에서 가장 많이 반복되는 값 또는 최대 학생 수로 보호되는 점수를 식별합니다. 마지막으로, 중간 범위는 두 극한 값, 즉 최대 테스트 점수와 최소 테스트 점수의 평균 사이의 중간점을 제공합니다. 따라서 중심 경향의 각 측정값은 데이터에 대한 고유한 통찰력을 제공합니다.