11.2: Коэффициент корреляции

Coefficient of Correlation
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Coefficient of Correlation
Please note that all translations are automatically generated. Click here for the English version.

6,107 Views

01:12 min
April 30, 2023

Overview

Коэффициент корреляции r, разработанный Карлом Пирсоном в начале 1900-х годов, является числовым и обеспечивает меру силы и направления линейной связи между независимой переменной x и зависимой переменной y.

Если вы подозреваете линейную зависимость между x и y, то r может измерить, насколько сильна линейная зависимость.

О чем говорит нам VALUE of r:

Значение r всегда находится в диапазоне от –1 до +1: –1 ≤ r ≤ 1.

Величина корреляции r указывает на силу линейной зависимости между x и y. Значения r вблизи –1 или +1 указывают на более сильную линейную зависимость между x и y.

Если r = 0, то, скорее всего, линейной корреляции нет. Важно просматривать диаграмму рассеяния, так как данные, которые демонстрируют изогнутый или горизонтальный рисунок, могут иметь корреляцию, равную 0.

Если r = 1, то существует идеальная положительная корреляция. Если r = –1, то существует идеальная отрицательная корреляция. В обоих случаях все исходные точки данных лежат на прямой линии. Конечно, в реальном мире этого обычно не происходит.

О чем говорит нам ЗНАК r

Положительное значение r означает, что при увеличении x y имеет тенденцию к увеличению, а при уменьшении x y имеет тенденцию к уменьшению (положительная корреляция).

Отрицательное значение r означает, что при увеличении x y имеет тенденцию к уменьшению, а при уменьшении x y имеет тенденцию к увеличению (отрицательная корреляция).

Знак r совпадает со знаком наклона b, линии наилучшего соответствия.

Этот текст адаптирован из Openstax, Вводная статистика, раздел 12.3, Уравнение регрессии

Transcript

Рассмотрим рост и вес 5 спортсменов. По мере увеличения роста спортсменов увеличивается и их вес. Таким образом, рост и вес положительно коррелируют.

Точечная диаграмма зависимости веса спортсмена от роста показывает линейную закономерность, которую необходимо подтвердить с помощью количественного измерения.

Коэффициент линейной корреляции, обозначаемый r, обеспечивает количественную меру силы такой линейной корреляции между двумя переменными.

Для такого набора данных с n точками рассеяния, значения x и y которых известны, можно вычислить r.

Значение r всегда лежит в диапазоне от -1 до +1. Чем выше модуль r, тем сильнее корреляция между переменными.

Если значение x или y поменяно местами, или одна из переменных преобразована в другой масштаб, значение r не изменяется.

На коэффициент корреляции сильно влияют выбросы. Следовательно, если известно, что такие точки данных являются ошибками, они могут быть удалены для повышения точности значения r.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for