11.3: Вычисление и интерпретация коэффициента линейной корреляции

Calculating and Interpreting the Linear Correlation Coefficient
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Calculating and Interpreting the Linear Correlation Coefficient
Please note that all translations are automatically generated. Click here for the English version.

5,923 Views

01:11 min
April 30, 2023

Overview

Коэффициент корреляции r, разработанный Карлом Пирсоном в начале 1900-х годов, является числовым и обеспечивает меру силы и направления линейной связи между независимой переменной x и зависимой переменной y. Следовательно, он также известен как коэффициент корреляции произведения и момента Пирсона. Его можно рассчитать с помощью следующей формулы:

Equation1

где n = количество точек данных.

95% критических значений в таблице коэффициентов корреляции выборки могут быть использованы для того, чтобы дать вам хорошее представление о том, является ли вычисленное значение r значимым или нет. Сравните r с соответствующим критическим значением в таблице. Если r не находится между положительным и отрицательным критическими значениями, то коэффициент корреляции является значимым. Если r имеет значение, то вы можете использовать линию для прогнозирования.

Коэффициент детерминации

Переменная r2 называется коэффициентом детерминации и представляет собой квадрат коэффициента корреляции, но обычно указывается в процентах, а не в десятичной форме. Он имеет интерпретацию в контексте данных:

r2, выраженный в процентах, представляет собой процент изменения зависимой (прогнозируемой) переменной y, которое может быть объяснено изменением независимой (пояснительной) переменной x с использованием линии регрессии (наилучшего соответствия).

1 – r2, выраженный в процентах, представляет собой процент изменения y, которое НЕ объясняется изменением в x с помощью линии регрессии. Это можно рассматривать как разброс наблюдаемых точек данных вокруг линии регрессии.

Этот текст адаптирован из Openstax, Вводная статистика, раздел 12.3 Уравнение регрессии

Transcript

Рассмотрим набор данных об уровнях углекислого газа в зависимости от годовой температуры за определенный период. Точечная диаграмма точек данных показывает вероятную линейную закономерность между двумя переменными.

Для подтверждения прямолинейной модели вычисляется коэффициент линейной корреляции r.

Сначала определяются x квадрат, y квадрат и произведение x и y, а затем складываются. Количество точек данных — 7.

Из этих значений рассчитывается коэффициент корреляции.

Значение значения коэффициента корреляции можно интерпретировать с помощью таблицы критических значений.

При уровне значимости 0,05, а n равном 7, критическое значение получается равным 0,754.

Поскольку модуль r больше критического значения, существует достаточно доказательств, подтверждающих вывод о том, что между переменными существует линейная корреляция.

Квадратичное значение указывает на то, что 76,2% колебаний годовой температуры можно объяснить линейной зависимостью между уровнем углекислого газа и годовой температурой.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for