8.8: 적합도 테스트

Goodness-of-Fit Test
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Goodness-of-Fit Test
Please note that all translations are automatically generated. Click here for the English version.

3,352 Views

01:16 min
May 22, 2025

Overview

적합도 검정은 데이터가 특정 분포에 “적합”한지 여부를 결정하는 가설 검정의 한 유형입니다. 예를 들어, 일부 익명 데이터가 이항 분포에 적합할 수 있다고 의심할 수 있습니다. 카이-제곱 검정(가설 검정에 대한 분포가 카이제곱임을 의미)을 사용하여 적합치가 있는지 확인할 수 있습니다. 귀무 가설과 대립 가설은 문장으로 작성되거나 방정식 또는 부등식으로 명시될 수 있습니다. 적합도 검정에 대한 검정 통계량은 다음과 같습니다.

Equation1

어디:

O = 관측값(데이터), E = 기대값(이론)

관측된 값은 데이터 값이고, 기대값은 귀무 가설이 참일 경우 얻을 것으로 예상되는 값입니다. 이 테스트를 사용하려면 각 셀의 예상 값이 최소 5개 이상이어야 한다는 점에 유의하는 것이 중요합니다. 자유도의 수는 Equation2이며, 여기서 k = 서로 다른 데이터 셀 또는 범주의 수입니다.

적합도 검정은 거의 항상 오른쪽 꼬리입니다. 관측된 값과 해당 기대값이 가깝지 않으면 검정 통계량이 유의하며 카이-제곱 곡선의 맨 오른쪽 꼬리에 위치합니다.

이 텍스트는 Openstax, Introductory Statistics, 11.2 Goodness-of-Fit Test에서 발췌한 것입니다.

Transcript

적합도 검정은 관측된 빈도 분포가 청구된 분포를 반영하는지 여부를 확인합니다.

평일에 체육관을 방문하는 사람들의 데이터 세트를 생각해 보십시오. 관찰된 고객 출석이 예상되는 고객 출석 빈도와 일치하는지 여부를 결정하기 위해 적합도 테스트를 수행할 수 있습니다.

적합도 검정을 수행하려면 데이터셋 값을 임의로 선택하고 각 범주에 대한 빈도 값을 가져야 하며, 각 범주의 예상 빈도는 5 이상이어야 합니다.

적합도 검정에 대한 카이-제곱 검정 통계량은 표시된 공식을 사용하여 계산할 수 있습니다. 여기서 O E는 관찰된 출석 수와 예상 출석 수를 나타내고, k는 평일 수, n은 기록된 표본 값 또는 출석 횟수의 수를 나타냅니다. 자유도의 수는 k에서 1을 뺀 값입니다.

적합도 가설 검정은 항상 직측이며, 이는 임계 영역과 임계값이 분포 곡선의 맨 오른쪽에 있음을 의미합니다.

임계값과 P-값은 관측된 값과 기대값 사이에 양호한 적합치가 있는지 확인하는 데 도움이 됩니다.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for