10.3:
Односторонняя ANOVA: равные размеры выборки
Односторонняя ANOVA может быть выполнена на трех или более выборках с равными или неравными размерами выборок. Когда односторонняя ANOVA выполняется на двух наборах данных с выборками одинакового размера, можно легко заметить, что вычисленная F-статистика очень чувствительна к среднему значению выборки.
Различные средние значения выборки могут привести к разным значениям для оценки дисперсии: дисперсия между выборками. Это связано с тем, что дисперсия между выборками вычисляется как произведение размера выборки на дисперсию между средними значениями выборки. Таким образом, два набора данных с равными размерами выборки могут иметь два разных значения дисперсии между выборками.
В отличие от этого, два разных набора данных с одинаковыми размерами выборки могут иметь одинаковую дисперсию выборки, но разные средние выборки. Поскольку дисперсия внутри выборок, также называемая объединенной дисперсией, вычисляется как среднее значение дисперсий выборки, дисперсия внутри выборок может быть равной для двух наборов данных с одинаковыми размерами выборки.
Вычисленное значение статистики F для двух наборов данных различается, так как наборы данных показывают неравные значения дисперсии между выборками, но одинаковые значения дисперсии внутри выборок.
Рассмотрите возможность выполнения одностороннего анализа ANOVA на двух разных наборах данных, каждый из которых содержит рост учащихся из трех выборок.
Обратите внимание, что в обоих наборах данных все три выборки имеют одинаковые размеры выборки.
Здесь мы можем сформулировать нулевую гипотезу о том, что средние высоты всех трех выборок равны. Альтернативная гипотеза заключается в том, что хотя бы одно из средств отличается от остальных.
Сначала вычислите средние значения выборки и дисперсии выборки для обоих наборов данных. Обратите внимание, что только средние значения первых выборок в обоих наборах данных существенно отличаются, но дисперсии выборки идентичны.
Затем рассчитайте F-статистику для обоих наборов данных и найдите P-значения.
Различные средние значения первых выборок в обоих наборах данных приводят к существенному изменению дисперсии между выборками. Тем не менее, дисперсия внутри выборок остается идентичной, так как для нее не требуется среднее значение выборки во время расчета.
Различные значения дисперсии между выборками в обоих наборах данных влияют на F-статистику, что приводит к разным результатам.
Таким образом, можно сделать вывод, что на F-статистику существенно влияет среднее значение выборки.
Related Videos
Analysis of Variance
7.9K Просмотры
Analysis of Variance
7.9K Просмотры
Analysis of Variance
3.3K Просмотры
Analysis of Variance
5.8K Просмотры
Analysis of Variance
3.9K Просмотры
Analysis of Variance
2.7K Просмотры
Analysis of Variance
2.6K Просмотры