적합도 검정은 데이터가 특정 분포에 “적합”한지 여부를 결정하는 가설 검정의 한 유형입니다. 예를 들어, 일부 익명 데이터가 이항 분포에 적합할 수 있다고 의심할 수 있습니다. 카이-제곱 검정(가설 검정에 대한 분포가 카이제곱임을 의미)을 사용하여 적합치가 있는지 확인할 수 있습니다. 귀무 가설과 대립 가설은 문장으로 작성되거나 방정식 또는 부등식으로 명시될 수 있습니다. 적합도 검정에 대한 검정 통계량은 다음과 같습니다.
어디:
O = 관측값(데이터), E = 기대값(이론)
관측된 값은 데이터 값이고, 기대값은 귀무 가설이 참일 경우 얻을 것으로 예상되는 값입니다. 이 테스트를 사용하려면 각 셀의 예상 값이 최소 5개 이상이어야 한다는 점에 유의하는 것이 중요합니다. 자유도의 수는 이며, 여기서 k = 서로 다른 데이터 셀 또는 범주의 수입니다.
적합도 검정은 거의 항상 오른쪽 꼬리입니다. 관측된 값과 해당 기대값이 가깝지 않으면 검정 통계량이 유의하며 카이-제곱 곡선의 맨 오른쪽 꼬리에 위치합니다.