모집단 평균의 점 추정치는 단일 표본에서 얻습니다. 이러한 점 추정치는 모집단의 변동성을 고려해야 하기 때문에 모집단을 잘 나타내지 않습니다. 단일 점 추정치는 표본이 무작위로 선택되더라도 편향될 수도 있습니다. 따라서 점 추정치는 종종 신뢰할 수 없습니다. 이러한 불안정성을 줄이기 위해 신뢰 구간이 필요합니다.
평균에 대한 신뢰 구간은 모집단 평균의 추정치를 제공하는 값의 범위입니다. 모집단 평균은 알 수 없지만 고정된 값이기 때문에 여러 표본이나 정확한 표본 추출 방법으로는 알 수 없지만 추정할 수는 있습니다. 평균의 신뢰 구간은 모집단 평균의 실제 값을 찾을 수 있는 값의 범위를 제공합니다.
신뢰 구간 계산에는 오차 한계와 모집단 표준 편차(또는 분산)에 대한 사전 지식이 필요합니다. 모집단 표준 편차(분산)를 알고 있는 경우 표본의 정규성을 가정할 때 z 분포를 사용하여 오차 한계를 계산합니다. 이 경우 표본 크기는 30보다 커야 합니다. 모집단 표준 편차(분산)를 알 수 없는 경우 오차 한계는 t 분포를 사용하여 계산됩니다. t 분포는 비정규 대칭 분포이지만, 추정을 위해서는 정규 분포 모집단에서 표본을 추출해야 하거나 표본 크기가 30보다 커야 합니다. t 분포를 사용하여 계산되는 신뢰 구간은 자유도(또는 표본 크기)에 따라 다릅니다. 주어진 신뢰 수준과 표본 크기에 대해 z 분포를 사용하여 계산된 것보다 넓습니다.
두 경우 모두의 신뢰 구간(즉, 알려진 또는 알려지지 않은 모집단 SD)은 미리 결정된 신뢰 수준, 즉 90%에서 추정됩니다.95% 또는 99%.
95% 수준에서 신뢰 구간을 계산할 때 모집단 평균의 실제 값이 신뢰 한계의 하한값과 상한 값 사이에 있다고 95% 확신합니다. 즉, 여러 표본을 취하여 여러 신뢰 구간을 계산하면 그 중 95%가 모집단 평균을 포함한다는 것을 의미할 수도 있습니다. 모집단 평균이 하나의 고정 값이므로 신뢰 구간 내에서 모집단 모수의 실제 값을 찾을 확률이 95%라고 말하는 것은 적절하지 않습니다. 표본 평균의 95%가 계산된 신뢰 한계 범위 내에 속한다고 말하는 것도 올바르지 않습니다.
Transcript
모집단 평균의 점 추정치는 단일 표본에서 얻을 때 신뢰할 수 없는 경우가 많습니다.
따라서 해당 샘플에서 얻은 몇 가지 알려진 변수를 사용하여 신뢰 구간을 그립니다.
모집단 표준 편차가 알려진 경우 특정 신뢰 수준에서의 임계값은 z 분포에서 얻어집니다.
그러나 모집단 표준 편차를 알 수 없는 경우 t 분포에서 원하는 신뢰 수준의 임계값이 사용됩니다.
모집단과 표본이 정규 분포를 따른다고 가정할 수 있으므로 신뢰 한계는 다음과 같이 표현할 수 있습니다.
95% 신뢰 수준에서 두 경우 모두 계산된 신뢰 구간이 모집단 평균을 포함합니다.
즉, 동일한 표본 추출 방법을 통해 많은 신뢰 구간을 구하면 그 중 95%에 실제 모집단 평균이 포함됩니다.
임계값을 사용하여 계산된 신뢰 구간은 임계값 z 값을 사용하여 계산된 신뢰 구간보다 넓지만 모집단 평균을 예측하는 데는 똑같이 정확합니다.
간단히 말해서, 모집단 표준 편차를 모른다고 해서 평균 추정치가 부정확해지는 것은 아닙니다.