ARTICLE
样本统计量
样本统计量 (Sample Statistic) 样本统计量是统计学中最基础的概念之一,指基于样本数据计算得出的任何数值度量。样本统计量作为总体参数的估计量,承担着从有限观测推断总体特征的核心任务。它与总体参数形成对应关系:总体参数是固定但未知的常数,而样本统计量是随样本变化的随机变量。 常见样本统计量 设从总体中抽取样本 \X_1, X_2, , X_n\
样本统计量 (Sample Statistic)
样本统计量是统计学中最基础的概念之一,指基于样本数据计算得出的任何数值度量。样本统计量作为总体参数的估计量,承担着从有限观测推断总体特征的核心任务。它与总体参数形成对应关系:总体参数是固定但未知的常数,而样本统计量是随样本变化的随机变量。
常见样本统计量
设从总体中抽取样本 ,以下是最常用的样本统计量:
样本均值 (Sample Mean)
样本均值是总体均值 的无偏估计量,即 ,其方差为 。由大数定律和中心极限定理保证,无论总体分布如何,当样本量充分大时, 的抽样分布近似正态。
样本方差 (Sample Variance)
分母采用 (而非 )是为了保证无偏性:。若使用 作分母,则产生有偏估计量,偏差为 。这里的 称为自由度,源于估计 时已消耗一个自由度。
样本标准差 (Sample Standard Deviation)
注意 是 的有偏估计量,因为平方根变换不保持无偏性。在大样本中此偏差可忽略。
样本比例 (Sample Proportion)
其中 为样本中具有某特征的个体数。 是总体比例 的无偏估计量,其方差为 。
样本统计量与抽样分布
任一统计量都是随机变量,有其抽样分布。抽样分布描述了统计量在所有可能样本上的概率分布,是统计推断的理论基础:
- 若总体服从 ,则 。
- 若总体正态,则 。
- ,这是t检验的基础。
统计量的优良性准则
评价一个样本统计量作为参数估计量的优劣,通常考虑以下准则:
- 无偏性 (Unbiasedness):。统计量的期望等于被估计参数。
- 一致性 (Consistency):。随样本量增大,统计量依概率收敛于真值。
- 有效性 (Efficiency):在所有无偏估计量中,方差最小者更有效。
- 充分性 (Sufficiency):统计量包含样本中关于参数的全部信息,即充分统计量。
区分:样本统计量 vs 总体参数
这一区分是统计推断的出发点:
- 总体参数(如 ):固定常数,通常不可知。
- 样本统计量(如 ):已知变量,因样本不同而变动,用于估计参数。
用符号约定:希腊字母表示参数,拉丁字母表示统计量。
实践意义
样本统计量是描述性统计与推断性统计的桥梁。在实证研究中,研究者用样本统计量进行点估计和区间估计,构建置信区间,执行假设检验。理解统计量的抽样变异和标准误差,是正确解读实证结果、避免过度推断的前提。