관찰된 빈도 값이 데이터 세트에 대해 예상되는 빈도와 통계적으로 유사한지 여부를 확인하기 위해 적합도 테스트가 수행됩니다. 데이터 세트에 대한 예상 빈도가 동일하다고 가정합니다(예: 주사위를 던질 때 나타나는 숫자의 빈도를 예측할 때). 이 경우 기대 빈도는 총 관측치 수(n)와 범주 수(k)의 비율입니다.
따라서 주사위를 캐스팅할 때 나타나는 숫자의 예상 빈도는 1/6이 됩니다.
그러나 데이터 세트의 예상 빈도가 같지 않다고 가정하고, 예상 빈도는 총 관측치 수 n과 범주에 대한 확률 p를 곱하여 구합니다.
Transcript
적합도 검정은 관측된 결과가 예상 결과와 통계적으로 유사한지 확인하기 위해 수행됩니다.
적합도 검정은 분포가 주장된 대로라고 가정하는 귀무 가설과 모순되는 대립 가설을 사용합니다.
신호등의 색상을 예측할 때와 같이 분포의 모든 예상 빈도가 동일한 경우 기대 빈도 – E는 총 작업 수 6과 k(범주 수 3)의 비율로 표현됩니다.
그러나 머리 색깔이 다른 여성을 찾는 것과 같이 기대 빈도가 같지 않은 경우 E는 관찰된 빈도의 합에 각 범주의 확률을 곱하여 계산됩니다.
앞의 출산 예에서는 기대 빈도와 관찰된 빈도가 카이제곱 값을 계산하는 데 사용됩니다. 카이제곱 표를 사용하면 기대 빈도와 관측된 빈도 간의 차이가 통계적으로 유의한지 여부를 확인할 수 있습니다.
이 차이와 검정 통계량이 크고 P-값이 작으면 검정 통계량이 임계 영역에 속한다는 것을 의미합니다. 따라서 귀무 가설은 기각됩니다. 그렇지 않은 경우 귀무 가설을 기각하지 않습니다.