일원 분산 분석은 하나의 요인으로 분류된 3개 이상의 표본을 분석합니다. 예를 들어, 스포츠 자전거의 평균 주행 거리를 비교할 수 있습니다. 여기서 데이터는 회사라는 한 가지 요소로 분류됩니다. 그러나 일원 분산 분석은 두 요인으로 분류된 3개 이상의 표본의 표본 평균을 동시에 비교하는 데 사용할 수 없습니다. 두 가지 요인의 예로는 사막이나 눈 덮인 풍경과 같은 다른 지형에서 주행하는 여러 회사의 스포츠 자전거가 있습니다. 여기서 양방향 ANOVA는 회사와 지형이라는 두 가지 요소가 관련되어 있기 때문에 사용됩니다.
일원 ANOVA를 사용하여 표본을 분석하기 전에 두 가지 가설, 즉 null 가설과 대립 가설이 명시됩니다. 귀무 가설은 분석 중에 사용된 표본의 평균이 동일하다는 것이고, 대립 가설은 표본 평균이 같지 않다는 것입니다. 두 가지 가설을 진술한 후 표본 간 및 표본 내 분산을 계산합니다. 표본 간의 분산은 표본 평균의 분산에 표본 크기 n을 곱하여 계산됩니다. 표본 내 분산은 표본 분산의 평균으로 계산됩니다.
다음으로, F 통계량은 표본 내 분산에 대한 표본 간 분산의 비율로 계산됩니다. F 통계량의 값이 1보다 크면 더 작은 P-값을 얻습니다. 이는 표본 간의 분산이 높거나 표본 내 분산이 클 때 발생합니다. 이를 통해 표본 평균이 동일하지 않고 귀무 가설이 기각된다는 것을 추론할 수 있습니다. F 통계량의 값이 1에 더 가깝거나 같으면 더 큰 P-값을 얻습니다. 이는 표본 간의 분산이 표본 내의 분산에 가깝거나 같을 때 발생합니다. 이러한 경우 표본 평균이 동일하다고 추론되므로 귀무 가설을 기각하지 못합니다.
이 텍스트는 <a href="https://openstax.org/books/introductory-statistics/pages/13-1-one-way-anova"에서 발췌한 것입니다>Openstax, Introductory Statistics, Section 13.1 One way ANOVA
Transcript
일원 분산 분석 검정은 하나의 요인으로 정의된 3개 이상의 표본의 평균을 비교합니다.
세 회사의 자동차의 평균 연비를 고려하십시오. 여기서 표본은 하나의 요소, 즉 회사에 의해 정의됩니다.
여름과 겨울에 주행하는 다른 회사의 자동차의 경우 편도 ANOVA는 회사와 시즌의 두 가지 요소를 동시에 테스트할 수 없습니다.
일반적으로 표본 평균이 같다는 귀무 가설과 표본 평균이 같지 않다는 대립 가설을 언급하는 것으로 시작합니다.
다음으로, 표본 간의 분산과 표본 내 분산을 계산하고 F 통계량을 계산합니다.
F 통계량 값이 1이 아니면 P-값이 작아집니다. 이는 표본 내 분산이 작거나 표본 간의 분산이 높을 때 발생합니다. 따라서 표본 평균의 부등식을 추론하고 귀무 가설을 기각합니다.
또는 F 통계량 값이 1에 가까우면 P-값이 커집니다. 이는 표본 간의 분산이 표본 내 분산에 가까울 때 발생합니다. 따라서 표본 평균의 동등성을 추론하고 귀무 가설을 기각하지 못합니다.