Коэффициент корреляции r, разработанный Карлом Пирсоном в начале 1900-х годов, является числовым и обеспечивает меру силы и направления линейной связи между независимой переменной x и зависимой переменной y.
Если вы подозреваете линейную зависимость между x и y, то r может измерить, насколько сильна линейная зависимость.
О чем говорит нам VALUE of r:
Значение r всегда находится в диапазоне от –1 до +1: –1 ≤ r ≤ 1.
Величина корреляции r указывает на силу линейной зависимости между x и y. Значения r вблизи –1 или +1 указывают на более сильную линейную зависимость между x и y.
Если r = 0, то, скорее всего, линейной корреляции нет. Важно просматривать диаграмму рассеяния, так как данные, которые демонстрируют изогнутый или горизонтальный рисунок, могут иметь корреляцию, равную 0.
Если r = 1, то существует идеальная положительная корреляция. Если r = –1, то существует идеальная отрицательная корреляция. В обоих случаях все исходные точки данных лежат на прямой линии. Конечно, в реальном мире этого обычно не происходит.
О чем говорит нам ЗНАК r
Положительное значение r означает, что при увеличении x y имеет тенденцию к увеличению, а при уменьшении x y имеет тенденцию к уменьшению (положительная корреляция).
Отрицательное значение r означает, что при увеличении x y имеет тенденцию к уменьшению, а при уменьшении x y имеет тенденцию к увеличению (отрицательная корреляция).
Знак r совпадает со знаком наклона b, линии наилучшего соответствия.
Этот текст адаптирован из Openstax, Вводная статистика, раздел 12.3, Уравнение регрессии
Рассмотрим рост и вес 5 спортсменов. По мере увеличения роста спортсменов увеличивается и их вес. Таким образом, рост и вес положительно коррелируют.
Точечная диаграмма зависимости веса спортсмена от роста показывает линейную закономерность, которую необходимо подтвердить с помощью количественного измерения.
Коэффициент линейной корреляции, обозначаемый r, обеспечивает количественную меру силы такой линейной корреляции между двумя переменными.
Для такого набора данных с n точками рассеяния, значения x и y которых известны, можно вычислить r.
Значение r всегда лежит в диапазоне от -1 до +1. Чем выше модуль r, тем сильнее корреляция между переменными.
Если значение x или y поменяно местами, или одна из переменных преобразована в другой масштаб, значение r не изменяется.
На коэффициент корреляции сильно влияют выбросы. Следовательно, если известно, что такие точки данных являются ошибками, они могут быть удалены для повышения точности значения r.
Related Videos
Correlation and Regression
11.7K Просмотры
Correlation and Regression
6.1K Просмотры
Correlation and Regression
5.9K Просмотры
Correlation and Regression
5.7K Просмотры
Correlation and Regression
4.0K Просмотры
Correlation and Regression
7.3K Просмотры
Correlation and Regression
4.6K Просмотры
Correlation and Regression
6.8K Просмотры
Correlation and Regression
2.2K Просмотры
Correlation and Regression
3.0K Просмотры