8.3: 学生 t 分布

Student <em>t</em> Distribution
JoVE Core
Statistics
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Core Statistics
Student t Distribution
Please note that all translations are automatically generated. Click here for the English version.

6,074 Views

01:31 min
May 22, 2025

Overview

在许多日常统计示例中,总体标准差很少为人所知。当样本量较大时,使用置信区间很容易估计总体标准差,从而提供足够接近原始值的结果。然而,当样本量较小时,统计学家遇到了问题。样本量小会导致置信区间不准确。

学生 t 分布由爱尔兰都柏林吉尼斯啤酒厂的 William S. Goset (1876–1937) 开发,用于估计样本量较小时的总体标准差。此发行版的名称来自 Gosset 使用的笔名 “Student”。

每当使用 s 估计 σ 时,都会使用 Student t 分布。如果从具有均值 μ 的近似正态分布中抽取大小为 n 的简单随机样本,则计算出 σt 分数的总体标准差,则 t 分数将遵循具有 n – 1 自由度的学生 t 分布。t 分数的解释与 z 分数类似。它测量一个值与其均值μ的距离。对于每个样本数量 n,存在不同的 Student t 分布。

t 分数或统计数据如下:

方程 1

Student t 分布的属性:

  1. Student t 分布的图形类似于标准正态曲线。
  2. Student t 分布的均值为零,并且分布大约为零对称。
  3. Student t 分布的尾部概率大于标准正态分布,因为 t 分布的散布大于标准正态分布的散布。因此,Student t 分布曲线的尾部较粗,中心较短。
  4. Student t 分布的确切形状取决于自由度。随着自由度的增加,Student t 分布的图形变得更像标准正态分布的图形。
  5. 假设单个观测值的基础总体呈正态分布,总体均值μ未知,总体标准差σ未知。

本文改编自 第 8.2 节,使用学生 t 分布的单一总体均值Introductory Statistics,Openstax,

Transcript

正态分布用于具有已知标准差的总体。但是,对于大多数真实数据,总体标准差是未知的。

对于此类总体,Student t 分布可以使用样本统计量估计总体均值。在这种情况下,样本均值是总体均值的最佳点估计值。

此分布可用于来自正态分布总体的简单随机样本,或者当样本量大于 30 时。

对于正态分布的总体,可以给出 Student t 分布,如大小 n 的所有值所示。

由于估计的样本量较小,因此此分布中的置信区间更宽,临界值大于正态分布。可以使用给定的公式评估边际误差,这有助于计算置信区间限值。

Student t 分布显示样本变异性。尽管对称,但它的分布范围更广,并且比正态分布的变异性更大。它的标准差始终大于 1。

但是,随着样本量的增加,Student t 分布更接近正态分布。

Key Terms and definitions​

Learning Objectives

Questions that this video will help you answer

This video is also useful for