O coeficiente de correlação, r, desenvolvido por Karl Pearson no início dos anos 1900, é numérico e fornece uma medida de força e direção da associação linear entre a variável independente x e a variável dependente y.
Se você suspeitar de uma relação linear entre x e y, r pode medir o quão forte é a relação linear.
O que o VALOR de r nos diz:
O valor de r está sempre entre –1 e +1: –1 ≤ r ≤ 1.
O tamanho da correlação r indica a força da relação linear entre x e y. Valores de r próximos a –1 ou +1 indicam uma relação linear mais forte entre x e y.
Se r = 0, provavelmente não há correlação linear. É importante exibir o gráfico de dispersão porque os dados que exibem um padrão curvo ou horizontal podem ter uma correlação de 0.
Se r = 1, há uma correlação positiva perfeita. Se r = –1, há uma correlação negativa perfeita. Em ambos os casos, todos os pontos de dados originais estão em uma linha reta. É claro que, no mundo real, isso geralmente não acontecerá.
O que o SINAL de r nos diz
Um valor positivo de r significa que quando x aumenta, y tende a aumentar, e quando x diminui, y tende a diminuir (correlação positiva).
Um valor negativo de r significa que quando x aumenta, y tende a diminuir, e quando x diminui, y tende a aumentar (correlação negativa).
O sinal de r é o mesmo que o sinal da inclinação, b, da linha de melhor ajuste.
Este texto foi adaptado de Openstax, Introductory Statistics, Section 12.3, The Regression Equation
Considere a altura e o peso de 5 atletas. À medida que a altura dos atletas aumenta, seu peso também aumenta. Portanto, altura e peso estão positivamente correlacionados.
O gráfico de dispersão do peso do atleta versus altura mostra um padrão linear, que precisa ser confirmado usando uma medida quantitativa.
O coeficiente de correlação linear, denotado por r, fornece uma medida quantitativa da força de tal correlação linear entre duas variáveis.
Para tal conjunto de dados com n pontos de dispersão cujos valores x e y são conhecidos, r pode ser calculado.
O valor de r sempre está entre -1 e +1. Quanto maior o módulo de r, mais forte é a correlação entre as variáveis.
Se o valor de x ou y for trocado, ou uma das variáveis for convertida em uma escala diferente, o valor de r não será afetado.
O coeficiente de correlação é fortemente afetado por outliers. Portanto, se esses pontos de dados forem conhecidos como erros, eles podem ser removidos para melhorar a precisão do valor de r.
Related Videos
Correlation and Regression
11.6K Visualizações
Correlation and Regression
6.0K Visualizações
Correlation and Regression
5.9K Visualizações
Correlation and Regression
5.6K Visualizações
Correlation and Regression
4.0K Visualizações
Correlation and Regression
7.3K Visualizações
Correlation and Regression
4.5K Visualizações
Correlation and Regression
6.7K Visualizações
Correlation and Regression
2.2K Visualizações
Correlation and Regression
2.9K Visualizações