11.3:
Calculando e Interpretando o Coeficiente de Correlação Linear
O coeficiente de correlação, r, desenvolvido por Karl Pearson no início dos anos 1900, é numérico e fornece uma medida de força e direção da associação linear entre a variável independente, x, e a variável dependente, y. Por isso, também é conhecido como coeficiente de correlação produto-momento de Pearson. Pode ser calculado usando a seguinte equação:
onde n = o número de pontos de dados.
Os valores críticos de 95% da tabela de coeficiente de correlação da amostra podem ser usados para dar uma boa ideia se o valor calculado de r é significativo ou não. Compare r com o valor crítico apropriado na tabela. Se r não estiver entre os valores críticos positivos e negativos, o coeficiente de correlação é significativo. Se r for significativo, talvez você queira usar a linha para previsão.
O coeficiente de determinação
A variável r2 é chamada de coeficiente de determinação e é o quadrado do coeficiente de correlação, mas geralmente é declarada como uma porcentagem e não na forma decimal. Tem uma interpretação no contexto dos dados:
R2, quando expresso em porcentagem, representa a porcentagem de variação na variável dependente (prevista) y que pode ser explicada pela variação na variável independente (explicativa) x usando a linha de regressão (melhor ajuste).
1 – r2, quando expresso como uma porcentagem, representa a porcentagem da variação em y que NÃO é explicada pela variação em x usando a linha de regressão. Isso pode ser visto como a dispersão dos pontos de dados observados sobre a linha de regressão.
Este texto foi adaptado de Openstax, Introductory Statistics, Section 12.3 The Regression Equation
Considere o conjunto de dados dos níveis de dióxido de carbono versus a temperatura anual durante um período específico. O gráfico de dispersão dos pontos de dados mostra um provável padrão linear entre as duas variáveis.
Para confirmar um padrão de linha reta, o coeficiente de correlação linear, r, é calculado.
Primeiro, x quadrado, y quadrado e o produto de x e y são determinados e depois adicionados. O número de pontos de dados é 7.
A partir desses valores, o coeficiente de correlação é calculado.
O significado do valor do coeficiente de correlação pode ser interpretado usando a tabela de valores críticos.
Em um nível de significância de 0,05 e n igual a 7, o valor crítico é 0,754.
Como o módulo de r é maior que o valor crítico, há evidências suficientes para apoiar a conclusão de que existe uma correlação linear entre as variáveis.
O valor do quadrado r indica que 76,2% da variação da temperatura anual pode ser explicada pela relação linear entre os níveis de dióxido de carbono e a temperatura anual.
Related Videos
Correlation and Regression
11.7K Visualizações
Correlation and Regression
6.1K Visualizações
Correlation and Regression
5.9K Visualizações
Correlation and Regression
5.7K Visualizações
Correlation and Regression
4.0K Visualizações
Correlation and Regression
7.3K Visualizações
Correlation and Regression
4.6K Visualizações
Correlation and Regression
6.8K Visualizações
Correlation and Regression
2.2K Visualizações
Correlation and Regression
3.0K Visualizações