11.6: Resíduos e Propriedade dos Mínimos Quadrados

Residuals and Least-Squares Property
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Residuals and Least-Squares Property

7,326 Views

01:11 min
April 30, 2023

Overview

A distância vertical entre o valor real de y e o valor estimado de y. Em outras palavras, ele mede a distância vertical entre o ponto de dados real e o ponto previsto na linha Equation1

Se o ponto de dados observado estiver acima da linha, o resíduo será positivo e a linha subestimará o valor real dos dados para y. Se o ponto de dados observado estiver abaixo da linha, o resíduo será negativo e a linha superestimará o valor real dos dados para y.

O processo de ajuste da linha de melhor ajuste é chamado de regressão linear. A ideia por trás de encontrar a linha de melhor ajuste é baseada na suposição de que os dados estão espalhados em uma linha reta. O critério para a linha de melhor ajuste é que a soma dos erros quadrados (SSE) seja minimizada, ou seja, feita o menor possível. Qualquer outra linha que você escolher teria um SSE mais alto do que a linha de melhor ajuste. Essa linha de melhor ajuste é chamada de linha de regressão de mínimos quadrados.

Na linha de regressão, o quadrado dos resíduos pode ser visualizado desenhando áreas quadradas usando o ponto original. A soma da área de todos esses quadrados deve ser mínima para que a reta de regressão seja a linha de melhor ajuste. Isso é chamado de propriedade de mínimos quadrados.

Este texto foi adaptado de Opestax, Introductory Statistics, Section 12.3 The Regression Equation.

Transcript

Considere os dados semanais para o número de resultados positivos versus testes COVID durante a pandemia. Uma linha de regressão desenhada no gráfico de dispersão mostra uma tendência linear entre as variáveis.

Se essa linha de regressão é a linha de melhor ajuste é determinada usando resíduos – as distâncias verticais dos pontos de dados originais dos valores previstos na linha de regressão.

Por exemplo, para o ponto de dados com coordenadas 820 e 48, o valor previsto pode ser encontrado substituindo x por 820 na equação de regressão.

A diferença entre os valores observados e previstos fornece o valor residual. Da mesma forma, os resíduos para os pontos de dados restantes também são calculados.

O quadrado desses resíduos pode ser visualizado desenhando áreas quadradas usando o ponto original.

A soma da área de todos esses quadrados deve ser mínima para que a reta de regressão seja a linha de melhor ajuste. Isso é chamado de propriedade de mínimos quadrados.

Para qualquer outra linha reta, a soma das áreas é maior, portanto, não pode ser considerada a linha mais adequada.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for