10.4: Односторонняя ANOVA: неравные размеры выборки

One-Way ANOVA: Unequal Sample Sizes
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
One-Way ANOVA: Unequal Sample Sizes
Please note that all translations are automatically generated. Click here for the English version.

5,772 Views

01:15 min
April 30, 2023

Overview

Односторонняя ANOVA может быть выполнена на трех и более образцах неравных размеров. Однако расчеты усложняются, когда размеры выборки не всегда одинаковы. Таким образом, при выполнении ANOVA с неравным размером выборки используется следующее уравнение:

Уравнение 1

В уравнении n — размер выборки, ͞x — среднее по выборке, x̿ — комбинированное среднее для всех наблюдений, k — количество выборок, а s2 — дисперсия выборки. Следует отметить, что подстрочный индекс «i» представляет собой конкретную выборку в наборе данных.

Обратите внимание, что обе оценки дисперсии, дисперсия между выборками и дисперсия внутри выборок являются взвешенными, поскольку они используют один и тот же размер для вычисления F-статистики. Другими словами, различные размеры выборки в наборе данных будут влиять на две оценки дисперсии – дисперсию между выборками и дисперсию внутри выборок, что в конечном итоге влияет на значение F-статистики.

Transcript

Рассмотрите возможность проведения одностороннего теста ANOVA на наборе данных с ростом учащихся из трех выборок с неравными размерами выборки.

Нулевая гипотеза заключается в том, что средние высоты трех выборок равны, а альтернативная гипотеза заключается в том, что по крайней мере одна из средних высот отличается.

Вычислите F-статистику, используя отношение дисперсии между выборками и дисперсии внутри выборок. Здесь x̿ — комбинированное среднее всех наблюдений, ͞xi — среднее значение i-й выборки, ni — размер i-й выборки, k — количество выборок и si2 — дисперсия i-й выборки.

Обратите внимание, что обе оценки дисперсии являются взвешенными, поскольку они учитывают размер выборки для вычисления F-статистики.

Из P-значения мы делаем вывод, что по крайней мере одна из средних высот из трех выборок отличается. И, следовательно, нулевая гипотеза отвергается.

Кроме того, чтобы определить, какая средняя высота значительно отличается от других, мы можем построить ящичковые диаграммы, построить доверительные интервалы или использовать несколько сравнительных тестов.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for