clt로 약칭되는 중심 극한 정리는 모든 통계에서 가장 강력하고 유용한 아이디어 중 하나입니다. 표본 평균에 대한 중심 극한 정리는 주어진 크기의 표본을 반복적으로 추출하고 평균을 계산하고 해당 평균의 히스토그램을 생성하면 결과 히스토그램이 대략적인 정규 종 모양을 갖는 경향이 있다고 말합니다. 즉, 표본 크기가 증가하면 평균의 분포가 정규 분포를 더 가깝게 따릅니다.
“충분히 크게” 요구되는 표본 크기 n은 표본을 추출한 원래 모집단에 따라 다릅니다(표본 크기가 30 이상이어야 하거나 데이터가 정규 분포에서 추출되어야 함). 원래 모집단이 정규 분포와 거리가 멀면 표본 평균 또는 합이 정규 분포를 따르기 위해 더 많은 관측치가 필요합니다. 샘플링은 교체와 함께 수행됩니다.
통계 이론에서 중심 극한 정리의 중요성은 아무리 강조해도 지나치지 않을 것입니다. 데이터의 분포가 정규적이지 않더라도 예측 가능한 방식으로 동작한다는 것을 아는 것은 강력한 도구입니다.
정규 분포는 원래 분포와 동일한 평균을 가지며 원래 분산을 표본 크기로 나눈 값과 같은 분산을 갖습니다. 표준 편차는 분산의 제곱근이므로 표본 추출 분포의 표준 편차는 원래 분포의 표준 편차를 n의 제곱근으로 나눈 값입니다. 변수 n은 실험이 수행된 횟수가 아니라 함께 평균화된 값의 수입니다.