정규 분포 모집단에서 무작위로 추출된 표본 데이터를 나타내는 곡선을 생각해 보십시오. 모집단 표준 편차에 관한 주장을 추정하거나 테스트하기 위해 신뢰 구간을 구성해야 합니다. 예를 들어, 95% 신뢰 구간은 곡선 아래 영역의 95%를 포함하고 나머지 5%는 곡선의 양쪽에 균등하게 분포되어 있습니다. 이러한 신뢰 구간을 달성하려면 임계값을 결정해야 합니다. 임계 값은 단순히 가능성이 있는 값과 가능성이 없는 값을 구분하는 값입니다.
카이-제곱 분포가 비대칭이기 때문에 곡선의 양쪽에서 2.5%의 영역 또는 0.025의 유의 수준을 구분하는 왼쪽 및 오른쪽 임계값은 표를 사용하여 별도로 결정됩니다. 카이-제곱 임계값에 대한 표에서 임계값은 먼저 적절한 자유도 수 df에 해당하는 행을 찾아 구하며, 여기서 df = n – 1, n은 표본 크기를 나타냅니다. 유의 수준 α는 열을 결정하는 데 사용됩니다. 오른쪽 꼬리 값은 테이블 맨 위에 0.025의 영역을 찾아 계산됩니다. 테이블은 오른쪽의 누적 값을 기반으로 하므로 왼쪽 꼬리 값으로 곡선 아래의 전체 면적에서 0.025, 즉 1을 빼면 0.975가 됩니다. 해당 열의 값 0.975는 왼쪽 꼬리 임계값을 제공합니다.
Transcript
일부 자동차 브랜드의 연비에 대한 샘플 데이터를 고려해 보십시오. 모집단 표준 편차에 대한 95% 신뢰 구간을 얻으려면 가능성이 높은 결과와 가능성이 낮은 결과를 구분하는 임계값을 계산해야 합니다.
95% 신뢰 수준은 곡선 아래 영역의 95%를 포함하고, 나머지 5% 영역은 양쪽에 균등하게 분포
되어 있습니다.
카이-제곱 분포가 비대칭이기 때문에 양쪽에서 2.5% 또는 0.025의 면적을 구분하는 오른쪽 및 왼쪽 임계값이 개별적으로 결정됩니다.
오른쪽 꼬리 임계값을 확인하려면 카이-제곱 표의 자유도에 대한 왼쪽 열에서 9를 찾고 맨 위 행에서 0.025를 찾아 값 19.023을 산출합니다.
이 표는 임계값의 오른쪽에 누적 영역을 제공하므로 곡선 아래의 전체 영역에서 나머지 0.025 영역을 빼면 0.975가 됩니다. 이제 카이-제곱 표를 사용하여 왼쪽 꼬리 임계값이 계산됩니다.