11.3: Calculando e Interpretando o Coeficiente de Correlação Linear

Calculating and Interpreting the Linear Correlation Coefficient
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Calculating and Interpreting the Linear Correlation Coefficient

5,914 Views

01:11 min
April 30, 2023

Overview

O coeficiente de correlação, r, desenvolvido por Karl Pearson no início dos anos 1900, é numérico e fornece uma medida de força e direção da associação linear entre a variável independente, x, e a variável dependente, y. Por isso, também é conhecido como coeficiente de correlação produto-momento de Pearson. Pode ser calculado usando a seguinte equação:

Equation1

onde n = o número de pontos de dados.

Os valores críticos de 95% da tabela de coeficiente de correlação da amostra podem ser usados para dar uma boa ideia se o valor calculado de r é significativo ou não. Compare r com o valor crítico apropriado na tabela. Se r não estiver entre os valores críticos positivos e negativos, o coeficiente de correlação é significativo. Se r for significativo, talvez você queira usar a linha para previsão.

O coeficiente de determinação

A variável r2 é chamada de coeficiente de determinação e é o quadrado do coeficiente de correlação, mas geralmente é declarada como uma porcentagem e não na forma decimal. Tem uma interpretação no contexto dos dados:

R2, quando expresso em porcentagem, representa a porcentagem de variação na variável dependente (prevista) y que pode ser explicada pela variação na variável independente (explicativa) x usando a linha de regressão (melhor ajuste).

1 – r2, quando expresso como uma porcentagem, representa a porcentagem da variação em y que NÃO é explicada pela variação em x usando a linha de regressão. Isso pode ser visto como a dispersão dos pontos de dados observados sobre a linha de regressão.

Este texto foi adaptado de Openstax, Introductory Statistics, Section 12.3 The Regression Equation

Transcript

Considere o conjunto de dados dos níveis de dióxido de carbono versus a temperatura anual durante um período específico. O gráfico de dispersão dos pontos de dados mostra um provável padrão linear entre as duas variáveis.

Para confirmar um padrão de linha reta, o coeficiente de correlação linear, r, é calculado.

Primeiro, x quadrado, y quadrado e o produto de x e y são determinados e depois adicionados. O número de pontos de dados é 7.

A partir desses valores, o coeficiente de correlação é calculado.

O significado do valor do coeficiente de correlação pode ser interpretado usando a tabela de valores críticos.

Em um nível de significância de 0,05 e n igual a 7, o valor crítico é 0,754.

Como o módulo de r é maior que o valor crítico, há evidências suficientes para apoiar a conclusão de que existe uma correlação linear entre as variáveis.

O valor do quadrado r indica que 76,2% da variação da temperatura anual pode ser explicada pela relação linear entre os níveis de dióxido de carbono e a temperatura anual.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for