11.6: Residuals 및 Least-Squares 속성

Residuals and Least-Squares Property
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Residuals and Least-Squares Property
Please note that all translations are automatically generated. Click here for the English version.

7,343 Views

01:11 min
April 30, 2023

Overview

y의 실제 값과 y의 추정 값 사이의 수직 거리입니다. 즉, 실제 데이터 포인트와 라인의 예측 포인트 사이의 수직 거리를 측정합니다 Equation1

관측된 데이터 점이 선 위에 있으면 잔차는 양수이고 선은 y에 대한 실제 데이터 값을 과소평가합니다. 관측된 데이터 점이 선 아래에 있으면 잔차는 음수이고 선은 y에 대한 실제 데이터 값을 과대 추정합니다.

최적선을 맞추는 과정을 선형 회귀라고 합니다. 최적선을 찾는 이면의 아이디어는 데이터가 직선을 중심으로 흩어져 있다는 가정을 기반으로 합니다. 최적선의 기준은 제곱 오차의 합(SSE)을 최소화하는 것, 즉 가능한 한 작게 만드는 것입니다. 선택할 수 있는 다른 라인은 최적 핏 라인보다 SSE가 높습니다. 이 최적선을 최소 제곱 회귀선이라고 합니다.

회귀선에서 잔차의 제곱은 원래 점을 사용하여 제곱 영역을 그려 시각화할 수 있습니다. 이러한 모든 사각형 면적의 합은 회귀선이 최적선이 되려면 최소값이어야 합니다. 이를 최소 제곱 속성이라고 합니다.

이 텍스트는 Opestax, Introductory Statistics, Section 12.3 The Regression Equation에서 발췌한 것입니다.

Transcript

팬데믹 기간 동안 COVID 검사 대비 양성 판정 건수에 대한 주간 데이터를 고려하십시오. 산점도에 그려진 회귀선은 변수 간의 선형 추세를 보여줍니다.

이 회귀선이 가장 적합한 선인지 여부는 잔차(회귀선의 예측 값에서 원래 데이터 포인트의 수직 거리)를 사용하여 결정됩니다.

예를 들어, 좌표가 820과 48인 데이터 포인트의 경우 회귀 방정식에서 x를 820으로 대체하여 예측 값을 찾을 수 있습니다.

관측된 값과 예측된 값의 차이는 잔존 가치를 제공합니다. 마찬가지로 나머지 데이터 점에 대한 잔차도 계산됩니다.

이러한 잔차의 제곱은 원래 점을 사용하여 정사각형 영역을 그려 시각화할 수 있습니다.

이러한 모든 사각형 면적의 합은 회귀선이 최적선이 되려면 최소값이어야 합니다. 이를 최소 제곱 속성이라고 합니다.

다른 직선의 경우 면적의 합이 더 높으므로 최적 선으로 간주될 수 없습니다.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for