16.14: Microsoft Excel: Correlação de Pearson [em inglês]

Microsoft Excel: Pearson’s Correlation
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Microsoft Excel: Pearson’s Correlation
Please note that all translations are automatically generated. Click here for the English version.

390 Views

01:18 min
January 09, 2025

Overview

O Microsoft Excel é uma ferramenta poderosa para análise estatística, incluindo o cálculo do coeficiente de correlação de Pearson, que mede a força e a direção de uma relação linear entre duas variáveis contínuas. O coeficiente de correlação de Pearson, muitas vezes denotado como “r”, varia de -1 a 1. Um valor próximo a 1 indica uma forte correlação positiva, o que significa que à medida que uma variável aumenta, a outra também. Um valor próximo a -1 indica uma forte correlação negativa, o que implica que, à medida que uma variável aumenta, a outra diminui. Um valor em torno de 0 significa que não há relação linear.

Para calcular a correlação de Pearson no Excel, você pode usar a função interna =CORREL(array1, array2). A matriz1 e a matriz2 são os dois conjuntos de dados para os quais você deseja calcular a correlação. Por exemplo, se você tiver dados para a variável X nas células A1:A10 e dados para a variável Y nas células B1:B10, a fórmula =CORREL(A1:A10, B1:B10) retornará o coeficiente de correlação entre X e Y.

O Excel também permite visualizar correlações usando gráficos de dispersão. Você pode criar um gráfico de dispersão para observar visualmente se há uma tendência linear entre duas variáveis e, em seguida, adicionar uma linha de tendência com a equação exibida. Isso fornece uma compreensão intuitiva de quão próximos os pontos de dados se encaixam em uma linha reta. No entanto, no caso de relacionamento não linear, o uso do coeficiente de correlação de Pearson não é apropriado.

Um ponto significativo a ser observado é que a correlação não implica causalidade. Mesmo que duas variáveis tenham uma alta correlação, isso não significa que uma faça com que a outra mude. A correlação de Pearson mede apenas relações lineares, portanto, pode não capturar associações mais complexas e não lineares entre variáveis.

O Excel também permite uma análise estatística mais robusta, como o uso do complemento Data Analysis Toolpak, que fornece matrizes de correlação para várias variáveis, facilitando a comparação de relacionamentos entre conjuntos de dados. A correlação de Pearson com o Excel oferece uma maneira simples, mas poderosa, de explorar e quantificar relacionamentos em dados.

Transcript

A correlação é uma relação entre duas variáveis. Considere os seguintes dados hipotéticos organizados no Microsoft Excel.

Para realizar a correlação univariada, a variável X deve ser organizada em uma coluna e a variável Y em uma coluna à sua direita.

Para plotar essas duas variáveis, primeiro selecione ambas as colunas na guia de inserção, localize gráficos e selecione um gráfico de dispersão.

Outros elementos, como linhas de tendência, também podem ser adicionados aos designs dos gráficos.

Assumindo que os dados são de populações normalmente distribuídas, o coeficiente de correlação de Pearson — r — é calculado usando a função CORREL o selecionado para os dados.

Outra função, PEARSON, também retorna o mesmo valor.

Essas funções medem a força e a direção da relação linear entre duas variáveis. Nesse caso, é 0,985, sugerindo uma correlação forte e positiva.

A função RSQ retorna o valor quadrado de r. Esse valor é o coeficiente de determinação que mede a proporção da variância na variável dependente que é previsível a partir da variável independente.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for