16.14:
Microsoft Excel: Correlação de Pearson [em inglês]
O Microsoft Excel é uma ferramenta poderosa para análise estatística, incluindo o cálculo do coeficiente de correlação de Pearson, que mede a força e a direção de uma relação linear entre duas variáveis contínuas. O coeficiente de correlação de Pearson, muitas vezes denotado como “r”, varia de -1 a 1. Um valor próximo a 1 indica uma forte correlação positiva, o que significa que à medida que uma variável aumenta, a outra também. Um valor próximo a -1 indica uma forte correlação negativa, o que implica que, à medida que uma variável aumenta, a outra diminui. Um valor em torno de 0 significa que não há relação linear.
Para calcular a correlação de Pearson no Excel, você pode usar a função interna =CORREL(array1, array2). A matriz1 e a matriz2 são os dois conjuntos de dados para os quais você deseja calcular a correlação. Por exemplo, se você tiver dados para a variável X nas células A1:A10 e dados para a variável Y nas células B1:B10, a fórmula =CORREL(A1:A10, B1:B10) retornará o coeficiente de correlação entre X e Y.
O Excel também permite visualizar correlações usando gráficos de dispersão. Você pode criar um gráfico de dispersão para observar visualmente se há uma tendência linear entre duas variáveis e, em seguida, adicionar uma linha de tendência com a equação exibida. Isso fornece uma compreensão intuitiva de quão próximos os pontos de dados se encaixam em uma linha reta. No entanto, no caso de relacionamento não linear, o uso do coeficiente de correlação de Pearson não é apropriado.
Um ponto significativo a ser observado é que a correlação não implica causalidade. Mesmo que duas variáveis tenham uma alta correlação, isso não significa que uma faça com que a outra mude. A correlação de Pearson mede apenas relações lineares, portanto, pode não capturar associações mais complexas e não lineares entre variáveis.
O Excel também permite uma análise estatística mais robusta, como o uso do complemento Data Analysis Toolpak, que fornece matrizes de correlação para várias variáveis, facilitando a comparação de relacionamentos entre conjuntos de dados. A correlação de Pearson com o Excel oferece uma maneira simples, mas poderosa, de explorar e quantificar relacionamentos em dados.
A correlação é uma relação entre duas variáveis. Considere os seguintes dados hipotéticos organizados no Microsoft Excel.
Para realizar a correlação univariada, a variável X deve ser organizada em uma coluna e a variável Y em uma coluna à sua direita.
Para plotar essas duas variáveis, primeiro selecione ambas as colunas na guia de inserção, localize gráficos e selecione um gráfico de dispersão.
Outros elementos, como linhas de tendência, também podem ser adicionados aos designs dos gráficos.
Assumindo que os dados são de populações normalmente distribuídas, o coeficiente de correlação de Pearson — r — é calculado usando a função CORREL o selecionado para os dados.
Outra função, PEARSON, também retorna o mesmo valor.
Essas funções medem a força e a direção da relação linear entre duas variáveis. Nesse caso, é 0,985, sugerindo uma correlação forte e positiva.
A função RSQ retorna o valor quadrado de r. Esse valor é o coeficiente de determinação que mede a proporção da variância na variável dependente que é previsível a partir da variável independente.
Related Videos
Statistical Softwares
526 Visualizações
Statistical Softwares
436 Visualizações
Statistical Softwares
263 Visualizações
Statistical Softwares
299 Visualizações
Statistical Softwares
259 Visualizações
Statistical Softwares
147 Visualizações
Statistical Softwares
112 Visualizações
Statistical Softwares
114 Visualizações
Statistical Softwares
129 Visualizações
Statistical Softwares
120 Visualizações
Statistical Softwares
150 Visualizações
Statistical Softwares
182 Visualizações
Statistical Softwares
604 Visualizações
Statistical Softwares
390 Visualizações
Statistical Softwares
561 Visualizações
Statistical Softwares
226 Visualizações