Тест на пригодность — это тип проверки гипотез, который определяет, «вписываются» ли данные в определенное распределение. Например, можно предположить, что некоторые анонимные данные могут подпадать под биномиальное распределение. Критерий хи-квадрат (т.е. распределение для проверки гипотезы является хи-квадратом) может быть использован для определения наличия соответствия. Нулевая и альтернативная гипотезы могут быть записаны в виде предложений или изложены в виде уравнений или неравенств. Статистика теста на пригодность приводится следующим образом:
где:
O = наблюдаемые значения (данные), а E = ожидаемые значения (из теории)
Наблюдаемые значения — это значения данных, а ожидаемые значения — это значения, которые вы ожидали бы получить, если бы нулевая гипотеза была верна. Важно отметить, что для использования этого теста ожидаемое количество клеток должно быть не менее пяти. Количество степеней свободы равно , где k = количество различных ячеек данных или категорий.
Тест на хорошую посадку почти всегда проводится с правым хвостом. Если наблюдаемые и соответствующие ожидаемые значения не близки, тестовая статистика будет значимой и будет расположена в крайнем правом хвосте кривой хи-квадрат.
Этот текст адаптирован из Openstax, Вводная статистика, 11.2 Тест на пригодность.
Тест на пригодность позволяет установить, отражает ли наблюдаемое частотное распределение заявленное распределение.
Рассмотрим набор данных о людях, посещающих тренажерный зал в будние дни. Можно провести тест на пригодность, чтобы определить, согласуется ли наблюдаемая посещаемость клиента с ожидаемой частотой посещения.
Чтобы выполнить тест на пригодность, значения набора данных должны быть выбраны случайным образом и иметь значение частоты для каждой категории, при этом ожидаемая частота каждой категории должна составлять не менее 5.
Статистику критерия хи-квадрат для теста на пригодность можно рассчитать с помощью приведенной формулы. Здесь O и E представляют наблюдаемую и ожидаемую посещаемость, k — количество рабочих дней, а n — количество записанных значений выборки или посещаемости. Число степеней свободы равно k минус единице.
Проверка гипотезы о хорошем соответствии всегда является правосторонней, что подразумевает, что критическая область и критические значения расположены в крайнем правом углу кривой распределения.
Критические значения и P-значения помогают определить, существует ли хорошее соответствие между наблюдаемыми и ожидаемыми значениями.
Related Videos
Distributions
4.1K Просмотры
Distributions
3.1K Просмотры
Distributions
6.1K Просмотры
Distributions
2.8K Просмотры
Distributions
3.7K Просмотры
Distributions
3.0K Просмотры
Distributions
3.0K Просмотры
Distributions
3.3K Просмотры
Distributions
2.5K Просмотры
Distributions
2.5K Просмотры
Distributions
2.3K Просмотры
Distributions
3.6K Просмотры
Distributions
2.2K Просмотры
Distributions
2.0K Просмотры
Distributions
3.7K Просмотры