JoVE Core
Statistics
Chapter 8: Distributions
8.1:
用于估计总体的分布参数
总体参数 (如总体比例、总体均值和总体标准差 (或方差) ) 的准确值通常是未知的。这些是固定值,只能从样本中收集的数据进行估计。这些参数中的每一个的估计值是样本比率、样本均值和样本标准差(或方差)。要获得这些样本统计量的值,需要具有特定分布和集中趋势的数据。这些样本分布是必不可少的,需要转换为估计总体参数所需的一些特定概率分布。
当满足高样本量(通常大于 30)、随机和无偏抽样以及总体的正态分布和样本的正态分布等条件时,估计总体参数就变得简单明了。然而,这样的条件既不能对给定的样本假设,也不能每次或每次研究都达到。在这种情况下,估计需要其他分布。
为了根据样本比例估计总体比例,使用了 z 分布和 z 表。在这里,样本不需要遵循标准正态分布,但它们至少应近似对称且呈正态分布。然后,可以使用从样本数据计算的 z 分数来估计总体比例的点,并且可以构建置信区间。
z 分布也可用于估计总体均值,但需要事先了解总体标准差(或方差)。然后,可以使用 z 分布来获得总体均值的点估计值,并且可以构建所需置信水平的置信区间,以便对总体均值进行可靠的估计。
在大多数现实情况下,对于给定的研究,总体标准差(估计总体平均值)可能不是先验已知的。在这种情况下,总体参数(如总体均值)的估计基于学生 t 分布。t 分布是对称分布,例如正态分布,但它是标准正态分布的近似值。它的形状 (浅或陡) 根据自由度 (或样本量) 而变化。当样本量低于 30 时,学生 t 分布可能是有利的。
估计总体标准差(或方差)需要卡方分布,该分布不对称。卡方分布中的偏度根据自由度(或样本量)而变化。它接近 90 以上样本量的正态分布。卡方分布有助于估计总体标准差(或方差),即使在较小的样本量下也是如此。
可以使用点估计或通过多个随机样本获得的置信区间来估计真实总体参数值。
从此类样本中获得的样本统计量(例如样本均值)具有特定的分布、集中趋势和偏差。
当观察到总体和样本分布的正态性,或者实现高样本量时,由于可以使用标准正态分布,因此查找点估计、临界值和置信区间变得简单明了。
但是,在许多情况下,无法实现基于正态分布的估计的所有要求。
为了解决这些不足,可以使用 z、t、卡方或 F 分布。
Z 分布用于估计总体比例。当总体标准差已知时,它还用于估计总体均值。
当总体标准差未知时,T 分布用于估计总体均值。
当总体和样本分布偏态时,使用卡方分布和 F 分布进行估计。
了解这些分布至关重要,因为它们在假设检验中具有广泛的应用。
Related Videos
Distributions
4.1K 浏览
3.2K 浏览
6.1K 浏览
2.8K 浏览
3.7K 浏览
3.0K 浏览
3.4K 浏览
2.6K 浏览
2.5K 浏览
2.3K 浏览
3.6K 浏览
2.2K 浏览
2.0K 浏览