11.2: Coeficiente de Correlação

Coefficient of Correlation
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Coefficient of Correlation

6,042 Views

01:12 min
April 30, 2023

Overview

O coeficiente de correlação, r, desenvolvido por Karl Pearson no início dos anos 1900, é numérico e fornece uma medida de força e direção da associação linear entre a variável independente x e a variável dependente y.

Se você suspeitar de uma relação linear entre x e y, r pode medir o quão forte é a relação linear.

O que o VALOR de r nos diz:

O valor de r está sempre entre –1 e +1: –1 ≤ r ≤ 1.

O tamanho da correlação r indica a força da relação linear entre x e y. Valores de r próximos a –1 ou +1 indicam uma relação linear mais forte entre x e y.

Se r = 0, provavelmente não há correlação linear. É importante exibir o gráfico de dispersão porque os dados que exibem um padrão curvo ou horizontal podem ter uma correlação de 0.

Se r = 1, há uma correlação positiva perfeita. Se r = –1, há uma correlação negativa perfeita. Em ambos os casos, todos os pontos de dados originais estão em uma linha reta. É claro que, no mundo real, isso geralmente não acontecerá.

O que o SINAL de r nos diz

Um valor positivo de r significa que quando x aumenta, y tende a aumentar, e quando x diminui, y tende a diminuir (correlação positiva).

Um valor negativo de r significa que quando x aumenta, y tende a diminuir, e quando x diminui, y tende a aumentar (correlação negativa).

O sinal de r é o mesmo que o sinal da inclinação, b, da linha de melhor ajuste.

Este texto foi adaptado de Openstax, Introductory Statistics, Section 12.3, The Regression Equation

Transcript

Considere a altura e o peso de 5 atletas. À medida que a altura dos atletas aumenta, seu peso também aumenta. Portanto, altura e peso estão positivamente correlacionados.

O gráfico de dispersão do peso do atleta versus altura mostra um padrão linear, que precisa ser confirmado usando uma medida quantitativa.

O coeficiente de correlação linear, denotado por r, fornece uma medida quantitativa da força de tal correlação linear entre duas variáveis.

Para tal conjunto de dados com n pontos de dispersão cujos valores x e y são conhecidos, r pode ser calculado.

O valor de r sempre está entre -1 e +1. Quanto maior o módulo de r, mais forte é a correlação entre as variáveis.

Se o valor de x ou y for trocado, ou uma das variáveis for convertida em uma escala diferente, o valor de r não será afetado.

O coeficiente de correlação é fortemente afetado por outliers. Portanto, se esses pontos de dados forem conhecidos como erros, eles podem ser removidos para melhorar a precisão do valor de r.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for