11.1: Корреляция

Correlation
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Correlation
Please note that all translations are automatically generated. Click here for the English version.

11,711 Views

01:09 min
April 30, 2023

Overview

В статистике две переменные считаются коррелированными, если значения одной переменной связаны с другой переменной. В зависимости от взаимосвязи между двумя переменными, корреляция может быть трех типов – положительная, отрицательная корреляция и нулевая корреляция.

Две переменные, например, a и b, считаются положительно коррелированными, если обе переменные движутся в одном направлении. Другими словами, существует положительная корреляция между двумя переменными, a и b, если:

  • Переменная a увеличивается по мере увеличения переменной b
  • Переменная a уменьшается по мере уменьшения переменной b

При отрицательной корреляции одна переменная, a, уменьшается, а другая переменная, b, увеличивается, и наоборот. Например, высота над уровнем моря и температура имеют отрицательную корреляцию, поскольку температура снижается с увеличением высоты.

Кроме того, когда две переменные не проявляют никакой связи, говорят, что корреляция между ними равна нулю. Например, нет никакой связи между количеством песен, которые слушают люди, и их высотой.

Кроме того, корреляция может быть линейной или нелинейной. Линейная зависимость — это зависимость, в которой прямая линия показывает корреляцию между двумя переменными. Экспоненциальная зависимость является примером нелинейной корреляции.

Transcript

В статистике, если значения одной переменной изменяются в зависимости от значений другой переменной, то говорят, что эти две переменные имеют корреляцию.

Рассмотрим точечную диаграмму продаж мороженого как функцию температуры, которая показывает отчетливую линейную картину.

Поскольку продажи мороженого увеличиваются с температурой, эти переменные имеют положительную корреляцию.

Теперь рассмотрим диаграмму рассеяния продаж горячего шоколада в зависимости от температуры. Точки данных в этом случае также имеют линейную закономерность и, следовательно, имеют корреляцию.

Но продажи горячего шоколада снижаются с повышением температуры, поэтому переменные имеют отрицательную корреляцию.

Помимо линейных, в реальной жизни можно наблюдать и другие закономерности. Например, с течением времени наблюдается экспоненциальный рост числа случаев COVID, прежде чем выйти на плато. Так что это нелинейная, положительная корреляция.

Могут быть случаи, когда корреляция между двумя переменными отсутствует. Например, количество просмотренных фильмов никак не коррелирует с размером обуви.

Key Terms and definitions​

  • Correlation - Measure of statistical relationship between two variables.
  • Positive Correlation - Both variables increase or decrease together.
  • Negative Correlation - One variable increases as the other decreases and vice versa.
  • Zero Correlation - No relationship exists between the variables.
  • Non-Linear Correlation - Relationship doesn't follow a straight line, example: an exponential relationship.

Learning Objectives

  • Define Correlation - Understand relationship between two variables (e.g., positive correlation).
  • Contrast Positive vs Negative Correlation - Identify key differences (e.g., movement of variables).
  • Explore Examples of Correlation Types - Describe scenarios (e.g., altitude and temperature).
  • Explain Zero Correlation - Understand when there is no relationship between the variables.
  • Apply Correlation in Statistics - Understand its importance in data analysis.

Questions that this video will help you answer

  • What is correlation and its types?
  • How can we identify positive and negative correlation?
  • What is an example of zero correlation?

This video is also useful for

  • Students - Understanding correlation aids in solving complex problems in statistics.
  • Educators - Provides a clear explanation to help with teaching the topic.
  • Researchers - Important in statistical analysis in various fields of study.
  • Data Analysts - Crucial for interpreting relationships among variables.