통계에서 독립성이라는 용어는 개별 확률을 곱하여 두 변수와 관련된 모든 이벤트의 확률을 직접 얻을 수 있음을 의미합니다. 독립성 검정은 관측된 (데이터) 값의 분할표를 사용하는 카이제곱 검정입니다.
독립성 검정에 대한 검정 통계량은 적합도 검정의 통계량과 유사합니다.
어디:
O = 관찰된 값
E = 기대값(5 이상이어야 함)
독립성 테스트는 두 요소가 독립적인지 여부를 결정합니다. 독립성 검정은 검정 통계량의 계산 때문에 항상 오른쪽 꼬리입니다. 기대값과 관측값이 서로 가까이 있지 않으면 검정 통계량이 매우 크고 적합도에서와 같이 카이-제곱 곡선의 오른쪽 꼬리에서 멀리 벗어납니다.
독립성 검정에 대한 자유도의 수는 다음과 같습니다.
다음 수식은 예상 숫자(E)를 계산합니다.
이 텍스트는 <a href="https://openstax.org/books/introductory-statistics/pages/11-3-test-of-independence"에서 발췌한 것입니다>Openstax, Introductory Statistics, Section 11.3 Test of Independence
Transcript
독립성 검정은 분할표의 두 변수가 독립적인지 여부를 결정합니다.
이 경우 독립성은 두 변수와 관련된 모든 이벤트의 확률이 개별 확률을 곱하여 직접 얻을 수 있음을 의미합니다.
예를 들어, 알코올 섭취와 교통사고 사망률 간의 관계를 이해하려면 데이터를 2×2 분할표로 정렬합니다. 행은 피험자의 음주 또는 음주를 나타내고 열은 교통 사고의 사망 또는 비사망을 나타냅니다.
무작위로 선택된 표본의 데이터는 이원 표에 정렬된 관찰된 빈도를 나타냅니다.
여기서 E는 예상 빈도를, r은 행 수를, c는 열 수를 나타냅니다. 각 셀의 예상 주파수는 5 이상이어야 합니다.
카이-제곱 검정 통계량은 이러한 기대 빈도와 관측 빈도를 사용하여 계산됩니다. 임계값과 P-값은 카이-제곱 테이블 또는 소프트웨어에서 적절한 자유도를 사용하여 계산됩니다.
마지막으로, 알코올 섭취와 교통 사고 사망률이 독립적인 사건인지 여부를 결정하기 위해 가설 검정을 수행합니다.