11.6:
Resíduos e Propriedade dos Mínimos Quadrados
A distância vertical entre o valor real de y e o valor estimado de y. Em outras palavras, ele mede a distância vertical entre o ponto de dados real e o ponto previsto na linha
Se o ponto de dados observado estiver acima da linha, o resíduo será positivo e a linha subestimará o valor real dos dados para y. Se o ponto de dados observado estiver abaixo da linha, o resíduo será negativo e a linha superestimará o valor real dos dados para y.
O processo de ajuste da linha de melhor ajuste é chamado de regressão linear. A ideia por trás de encontrar a linha de melhor ajuste é baseada na suposição de que os dados estão espalhados em uma linha reta. O critério para a linha de melhor ajuste é que a soma dos erros quadrados (SSE) seja minimizada, ou seja, feita o menor possível. Qualquer outra linha que você escolher teria um SSE mais alto do que a linha de melhor ajuste. Essa linha de melhor ajuste é chamada de linha de regressão de mínimos quadrados.
Na linha de regressão, o quadrado dos resíduos pode ser visualizado desenhando áreas quadradas usando o ponto original. A soma da área de todos esses quadrados deve ser mínima para que a reta de regressão seja a linha de melhor ajuste. Isso é chamado de propriedade de mínimos quadrados.
Este texto foi adaptado de Opestax, Introductory Statistics, Section 12.3 The Regression Equation.
Considere os dados semanais para o número de resultados positivos versus testes COVID durante a pandemia. Uma linha de regressão desenhada no gráfico de dispersão mostra uma tendência linear entre as variáveis.
Se essa linha de regressão é a linha de melhor ajuste é determinada usando resíduos – as distâncias verticais dos pontos de dados originais dos valores previstos na linha de regressão.
Por exemplo, para o ponto de dados com coordenadas 820 e 48, o valor previsto pode ser encontrado substituindo x por 820 na equação de regressão.
A diferença entre os valores observados e previstos fornece o valor residual. Da mesma forma, os resíduos para os pontos de dados restantes também são calculados.
O quadrado desses resíduos pode ser visualizado desenhando áreas quadradas usando o ponto original.
A soma da área de todos esses quadrados deve ser mínima para que a reta de regressão seja a linha de melhor ajuste. Isso é chamado de propriedade de mínimos quadrados.
Para qualquer outra linha reta, a soma das áreas é maior, portanto, não pode ser considerada a linha mais adequada.
Related Videos
Correlation and Regression
11.7K Visualizações
Correlation and Regression
6.1K Visualizações
Correlation and Regression
5.9K Visualizações
Correlation and Regression
5.7K Visualizações
Correlation and Regression
4.0K Visualizações
Correlation and Regression
7.3K Visualizações
Correlation and Regression
4.6K Visualizações
Correlation and Regression
6.8K Visualizações
Correlation and Regression
2.2K Visualizações
Correlation and Regression
3.0K Visualizações