7.10: Estimating Population Mean with Unknown Standard Deviation(알 수 없는 표준 편차를 사용한 모집단 평균 추정)

Estimating Population Mean with Unknown Standard Deviation
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Estimating Population Mean with Unknown Standard Deviation
Please note that all translations are automatically generated. Click here for the English version.

7,656 Views

01:22 min
April 30, 2023

Overview

실제로, 우리는 모집단 표준 편차를 거의 알지 못합니다. 과거에는 표본 크기가 클 때 통계학자들에게 문제가 되지 않았습니다. 그들은 표본 표준 편차 sσ에 대한 추정치로 사용하고 이전과 같이 진행하여 충분히 가까운 결과를 가진 신뢰 구간을 계산했습니다. 그러나 통계학자들은 표본 크기가 작을 때 문제에 부딪혔습니다. 표본 크기가 작으면 신뢰 구간이 부정확해졌습니다.

아일랜드 더블린에 있는 기네스 양조장의 William S. Gosset(1876–1937)은 이 문제에 부딪혔습니다. 홉과 보리에 대한 그의 실험은 매우 적은 샘플을 생성했습니다. σs로 바꾸는 것만으로는 신뢰 구간을 계산하려고 할 때 정확한 결과가 나오지 않았습니다. 그는 계산에 정규 분포를 사용할 수 없다는 것을 깨달았습니다. 그는 실제 분포가 표본 크기에 따라 달라진다는 것을 발견했습니다. 이 문제로 인해 그는 스튜던트 t 분포(Student’s t distribution)라고 불리는 것을 “발견”하게 되었습니다. 이름은 Gosset이 “Student”라는 필명으로 썼다는 사실에서 비롯되었습니다.

1970년대 중반까지만 해도 일부 통계학자들은 큰 표본 크기에 대해 정규 분포 근사치를 사용하고 최대 30의 표본 크기에 대해서만 스튜던트 t 분포를 사용했습니다. 그래프 계산기와 컴퓨터를 사용하면 이제 sσ에 대한 추정치로 사용될 때마다 Student’s t distribution을 사용하는 것이 좋습니다.

평균 μ과 알 수 없는 모집단 표준 편차가 있는 근사 정규 분포를 가진 모집단에서 크기 n의 단순 무작위 표본을 추출하고 표본 SD를 사용하여 t 점수를 계산하는 경우, 표준 편차를 σ

.

스튜던트 t 분포의 속성

  • 스튜던트 t 분포에 대한 그래프는 표준 정규 곡선과 유사합니다.
  • 스튜던트 t 분포에 대한 평균은 0이고 분포는 0에 대해 대칭입니다.
  • 스튜던트 t 분포는 t 분포의 산포가 표준 정규 분포의 산포보다 크기 때문에 표준 정규 분포보다 꼬리에 있을 확률이 더 큽니다. 따라서 스튜던트의 t-분포 그래프는 표준 정규 분포의 그래프보다 꼬리가 더 두껍고 중앙이 더 짧습니다.
  • 스튜던트 t 분포의 정확한 형상은 자유도에 따라 다릅니다. 자유도가 증가함에 따라 스튜던트 t 분포의 그래프는 표준 정규 분포의 그래프와 더 비슷해집니다.
  • 개별 관측치의 기본 모집단은 알 수 없는 모집단 평균 μ 알 수 없는 모집단 표준 편차 σ로 정규 분포를 따르는 것으로 가정합니다. 기본 인구의 크기는 매우 작지 않는 한 일반적으로 관련이 없습니다. 종 모양(정상)이면 가정이 충족되고 논의가 필요하지 않습니다. 무작위 샘플링이 가정되지만 이는 정규성과 완전히 별개의 가정입니다.

계산기와 컴퓨터는 모든 학생의 t 확률을 쉽게 계산할 수 있습니다. 스튜던트 t 분포에 대한 확률표도 사용할 수 있습니다. 이 표는 신뢰 수준(열)과 자유도(행)에 해당하는 t 점수를 제공합니다. t 테이블을 사용하는 경우 일부 테이블은 열 머리글에 신뢰 수준을 표시하도록 형식이 지정되는 반면 일부 테이블의 열 머리글은 한쪽 또는 양쪽 꼬리에 해당 영역만 표시할 수 있습니다.

학생의 t 테이블은 자유도와 오른쪽 꼬리 확률이 주어지면 t 점수를 제공합니다. 테이블은 매우 제한적입니다. 계산기와 컴퓨터는 모든 학생의 t-확률을 쉽게 계산할 수 있습니다.

스튜던트의 t 분포(T를 랜덤 변수로 사용)에 대한 표기법은 다음과 같습니다.

  • T ~ tdf 여기서 df = n – 1.
  • 예를 들어, n = 20개 항목의 표본이 있는 경우 자유도를 df = n – 1 = 20 – 1 = 19로 계산하고 분포를 T ~ t19로 씁니다.

모집단 표준 편차를 알 수 없는 경우 모집단 평균에 대한 오차 한계는 표본 SD를 사용하여 계산됩니다.

이 텍스트는 Openstax, Introductory Statistics, Section 8.2 A single population mean using Student’s t 배포.

Transcript

신뢰 구간에서 모집단 평균을 추정하려면 오차 한계가 필요합니다.

모집단 표준 편차가 알려져 있고, 표본 크기가 30보다 크며, 모집단이 정규 분포를 따르는 경우 z 값을 사용하여 계산됩니다.

현실적인 상황에서는 모집단 분포가 정규 분포라고 가정할 수 있지만 모집단 표준 편차는 알 수 없습니다.

따라서 오차 한계는 다음 방정식을 사용하여 다르게 계산됩니다.

여기서 임계값은 t 분포를 사용하여 계산되고 표본 표준 편차가 사용됩니다.

임계 t 값(tα/2)은 표본 크기에 따라 변하므로 일정하지 않습니다.

일반적으로 z 값보다 크므로 모집단 평균 추정에 사용되는 값의 범위가 더 넓어질 수 있습니다.

t 분포를 사용하려면 표본이 최소한 근사적으로 정규 분포를 따라야 하고 표본 크기가 30보다 커야 합니다.

여기서 표본 평균은 최적의 점 추정치로 유지되지만 신뢰 구간은 모집단 평균의 실제 값에 대한 신뢰할 수 있는 추정치를 제공합니다.

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for