y의 실제 값과 y의 추정 값 사이의 수직 거리입니다. 즉, 실제 데이터 포인트와 라인의 예측 포인트 사이의 수직 거리를 측정합니다
관측된 데이터 점이 선 위에 있으면 잔차는 양수이고 선은 y에 대한 실제 데이터 값을 과소평가합니다. 관측된 데이터 점이 선 아래에 있으면 잔차는 음수이고 선은 y에 대한 실제 데이터 값을 과대 추정합니다.
최적선을 맞추는 과정을 선형 회귀라고 합니다. 최적선을 찾는 이면의 아이디어는 데이터가 직선을 중심으로 흩어져 있다는 가정을 기반으로 합니다. 최적선의 기준은 제곱 오차의 합(SSE)을 최소화하는 것, 즉 가능한 한 작게 만드는 것입니다. 선택할 수 있는 다른 라인은 최적 핏 라인보다 SSE가 높습니다. 이 최적선을 최소 제곱 회귀선이라고 합니다.
회귀선에서 잔차의 제곱은 원래 점을 사용하여 제곱 영역을 그려 시각화할 수 있습니다. 이러한 모든 사각형 면적의 합은 회귀선이 최적선이 되려면 최소값이어야 합니다. 이를 최소 제곱 속성이라고 합니다.