11.10: Множественная регрессия

Multiple Regression
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Multiple Regression
Please note that all translations are automatically generated. Click here for the English version.

2,959 Views

01:25 min
April 30, 2023

Overview

Множественная регрессия оценивает линейную связь между одной ответной или зависимой переменной и двумя или более независимыми переменными. Он имеет множество практических применений.

Фермеры могут использовать множественную регрессию для определения урожайности сельскохозяйственных культур на основе более чем одного фактора, такого как доступность воды, удобрения, свойства почвы и т. д. В данном случае урожайность является ответной или зависимой переменной, поскольку она зависит от других независимых переменных. Анализ требует построения диаграммы рассеяния с последующим уравнением множественной линейной регрессии для вычисления кратного коэффициента детерминации, R2. Предположим, что значение R2 составляет 96%; Можно интерпретировать, что различные комбинации воды и удобрений объясняют 96% колебаний урожайности.

Однако значение R2 увеличивается с увеличением числа независимых переменных. Так, при анализе используется скорректированный коэффициент детерминации, учитывающий как размер выборки, так и количество переменных.

Transcript

Множественная регрессия — это статистический инструмент, используемый для анализа взаимосвязи между более чем двумя переменными.

Множественная регрессия может быть смоделирована в виде простого уравнения, которое оценивает линейную связь между ответной или зависимой переменной с более чем одним предиктором или независимыми переменными.

Например, потребление воды спортсменами положительно коррелирует как с температурой, так и с общим количеством тренируемого времени.

Здесь температура и общее количество времени практики являются переменными-предикторами, которые могут быть установлены независимо друг от друга. Расход воды является переменной отклика, так как он зависит от двух других переменных.

Поскольку ручной расчет уравнения множественной регрессии, как правило, сложен, для его решения используется программное обеспечение.

Кратный коэффициент детерминации вычисляется для измерения того, насколько хорошо уравнение соответствует набору данных. Это означает, что изменения температуры и общее количество времени практики могут объяснить 97% вариаций потребления воды.

Однако по мере использования большего количества переменных R2 обычно увеличивается.

В таких случаях рассчитывается скорректированный коэффициент детерминации, который учитывает размер выборки и количество переменных-предикторов.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for