10.3
각각 세 개의 표본에서 학생의 키를 포함하는 두 개의 서로 다른 데이터 세트에 대해 일원 분산 분석을 수행하는 것이 좋습니다.
두 데이터 세트에서 세 표본 모두 동일한 표본 크기를 갖습니다.
여기서 세 샘플의 평균 높이가 모두 같다는 귀무 가설을 말할 수 있습니다. 대립 가설은 평균 중 하나 이상이 나머지 평균과 다르다는 것입니다.
먼저 두 데이터 세트에 대한 표본 평균과 표본 분산을 계산합니다. 두 데이터셋에서 첫 번째 표본의 평균만 크게 다르지만 표본 분산은 동일하다는 것을 관찰합니다.
다음으로, 두 데이터셋에 대한 F 통계량을 계산하고 P-값을 구합니다.
두 데이터 세트에서 첫 번째 샘플의 평균이 다르면 샘플 간의 분산에 상당한 변화가 발생합니다. 그러나 표본 내 분산은 계산하는 동안 표본 평균이 필요하지 않기 때문에 동일하게 유지됩니다.
두 데이터 세트에서 샘플 간의 분산 값이 다르면 F 통계에 영향을 미치므로 다른 결과가 나타납니다.
따라서 F 통계량이 표본 평균의 영향을 크게 받는다는 결론을 내릴 수 있습니다.
단방향 분산 분석은 표본 크기가 동일하거나 동일하지 않은 3개 이상의 표본에 대해 수행할 수 있습니다. 동일한 크기의 표본이 포함된 두 자료 집합에 대해 일원 분산 분석을 수행하면 계산된 F 통계량이 표본 평균에 매우 민감하다는 것을 쉽게 관찰할 수 있습니다.
표본 평균이 다르면 분산 추정치(표본 간의 분산)에 대한 값이 달라질 수 있습니다. 이는 표본 간의 분산이 표본 크기와 표본 평균 간의 분산의 곱으로 계산되기 때문입니다. 따라서 표본 크기가 동일한 두 자료 집합는 표본 간의 분산에 대해 두 개의 서로 다른 값을 가질 수 있습니다.
반대로 동일한 표본 크기를 갖는 두 개의 서로 다른 자료 집합이 동일한 표본 분산을 가지는 경우에도 표본 평균은 다를 수 있습니다. 합동 분산이라고도 하는 표본 내 분산은 표본 분산의 평균으로 계산되므로 표본 내 분산은 표본 크기가 동일한 두 자료 집합에 대해 동일할 수 있습니다.
두 자료 집합에 대해 계산된 F 통계 값은 자료 집합 사이의 표본 간의 분산은 같지 않지만 표본 내 분산은 같으므로 서로 다른 경우로 나타납니다.
각각 세 개의 표본에서 학생의 키를 포함하는 두 개의 서로 다른 데이터 세트에 대해 일원 분산 분석을 수행하는 것이 좋습니다.
두 데이터 세트에서 세 표본 모두 동일한 표본 크기를 갖습니다.
여기서 세 샘플의 평균 높이가 모두 같다는 귀무 가설을 말할 수 있습니다. 대립 가설은 평균 중 하나 이상이 나머지 평균과 다르다는 것입니다.
먼저 두 데이터 세트에 대한 표본 평균과 표본 분산을 계산합니다. 두 데이터셋에서 첫 번째 표본의 평균만 크게 다르지만 표본 분산은 동일하다는 것을 관찰합니다.
다음으로, 두 데이터셋에 대한 F 통계량을 계산하고 P-값을 구합니다.
두 데이터 세트에서 첫 번째 샘플의 평균이 다르면 샘플 간의 분산에 상당한 변화가 발생합니다. 그러나 표본 내 분산은 계산하는 동안 표본 평균이 필요하지 않기 때문에 동일하게 유지됩니다.
두 데이터 세트에서 샘플 간의 분산 값이 다르면 F 통계에 영향을 미치므로 다른 결과가 나타납니다.
따라서 F 통계량이 표본 평균의 영향을 크게 받는다는 결론을 내릴 수 있습니다.
From Chapter 10:
Now Playing
Analysis of Variance
3.6K Views
Analysis of Variance
9.8K Views
Analysis of Variance
12.6K Views
Analysis of Variance
6.1K Views
Analysis of Variance
3.6K Views
Analysis of Variance
2.7K Views
Analysis of Variance
2.7K Views