8.9: Ожидаемая частота в тестах на пригодность

Expected Frequencies in Goodness-of-Fit Tests
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Expected Frequencies in Goodness-of-Fit Tests
Please note that all translations are automatically generated. Click here for the English version.

2,537 Views

01:19 min
April 30, 2023

Overview

Тест на пригодность проводится для определения того, являются ли наблюдаемые значения частоты статистически аналогичными частотам, ожидаемым для набора данных. Предположим, что ожидаемые частоты для набора данных равны, например, при прогнозировании частоты появления любого числа при отливке кубика. В этом случае ожидаемая частота представляет собой отношение общего числа наблюдений (n) к числу категорий (k).

Equation1

Следовательно, ожидаемая частота появления любого числа при отливке штампа будет равна 1/6.

Однако предположим, что ожидаемые частоты набора данных неравны; ожидаемая частота получается путем умножения общего числа наблюдений n на вероятность p для категории.

Equation2

Transcript

Тест на пригодность проводится для того, чтобы увидеть, являются ли наблюдаемые результаты статистически схожими с ожидаемыми.

В тесте на пригодность используется нулевая гипотеза, которая предполагает, что распределение соответствует заявленному, и противоречащая альтернативная гипотеза.

Если все ожидаемые частоты в распределении равны, например, при прогнозировании цвета светофоров, ожидаемая частота – E выражается как отношение общего числа операций, six и k, количества категорий, три.

Однако для неравных ожидаемых частот, таких как поиск женщин с разным цветом волос, E вычисляется путем умножения суммы наблюдаемых частот на вероятность для каждой категории.

В предыдущем примере с рождением ребенка ожидаемая и наблюдаемая частоты используются для вычисления значения хи-квадрат. Используя таблицу хи-квадрат, можно выяснить, является ли разница между ожидаемой и наблюдаемой частотами статистически значимой.

Если эта разница и тестовая статистика большая, с малым P-значением, это означает, что тестовая статистика попадает в критическую область. Следовательно, нулевая гипотеза отвергается. Если нет, не отвергайте нулевую гипотезу.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for