체비쇼프의 부등식(Chebyshev’s Inequality)이라고도 하는 체비쇼프의 정리(Chebyshev’s Inequality)는 K 표준 편차에 대한 데이터 세트 값의 비율이 다음 방정식을 사용하여 계산된다고 말합니다.
여기서 K는 1보다 큰 양의 정수입니다. 예를 들어, K가 1.5인 경우 데이터 값의 56% 이상이 데이터 세트의 평균에서 1.5 표준 편차 내에 있습니다. K가 2인 경우 데이터 값의 75% 이상이 데이터 세트의 평균에서 2 표준 편차 내에 있고 K가 3인 경우 데이터 값의 89% 이상이 해당 데이터 세트의 평균에서 3 표준 편차 내에 있습니다.
흥미롭게도, 체비셰프의 정리는 주어진 표준 편차 수(최소 비율)와 외부(최대 비율)에 속하는 데이터의 비율을 추정합니다. K가 2와 같으면 이 규칙은 데이터 값의 75%가 평균에서 2개의 표준 편차 내에 있고 데이터 값의 25%가 평균에서 떨어진 두 표준 편차 밖에 있을 가능성을 제안합니다. 이 정리는 근사치만 제공하고 정확한 답은 제공하지 않는다는 것을 이해하는 것이 중요합니다.
이 정리의 장점 중 하나는 정규 분포, 알 수 없는 분포 또는 편향된 분포를 가진 데이터 세트에 적용할 수 있다는 것입니다. 대조적으로, 경험적 또는 3 시그마 규칙은 정규 분포가 있는 데이터 세트에만 사용할 수 있습니다.
Transcript
체비쇼프의 정리는 표준 편차의 값을 해석하는 데 도움이 됩니다. 정규 분포, 알 수 없는 분포 또는 편향된 분포가 있는 거의 모든 데이터 세트에 적용할
수 있습니다.
대조적으로, 경험적 규칙은 정규 분포 데이터에만 적용됩니다.
동물원에 있는 동물의 수명에 대한 평균 13년과 표준 편차가 1.5년인 데이터 세트를 생각해 보십시오.
체비셰프의 정리에 따르면, K 표준 편차 내에서 동물의 나이 비율은 적어도 1 빼기 1을 K 제곱으로 나눈 값입니다. 여기서 K는 1보다 큰 양수입니다.
K가 2인 경우, 동물의 나이 중 최소 75%가 평균의 2 표준 편차 내에 있어야 합니다. 마찬가지로, K가 3인 경우, 동물의 나이 중 최소 89%가 평균의 3 표준 편차 내에 속합니다.
체비쇼프의 정리는 광범위한 통계적 응용을 가지고 있지만 1보다 큰 표준 편차에 대한 하한 근사치만 제공합니다. 체비쇼프의 정리는 근사치만 제공한다는 점에 유의하는 것이 중요합니다.