ARTICLE

样本统计量

样本统计量 (Sample Statistic) 样本统计量是统计学中最基础的概念之一,指基于样本数据计算得出的任何数值度量。样本统计量作为总体参数的估计量,承担着从有限观测推断总体特征的核心任务。它与总体参数形成对应关系:总体参数是固定但未知的常数,而样本统计量是随样本变化的随机变量。 常见样本统计量 设从总体中抽取样本 \X_1, X_2, , X_n\

浏览 9 更新 2025-10-26

样本统计量 (Sample Statistic)

样本统计量统计学中最基础的概念之一,指基于样本数据计算得出的任何数值度量。样本统计量作为总体参数的估计量,承担着从有限观测推断总体特征的核心任务。它与总体参数形成对应关系:总体参数是固定但未知的常数,而样本统计量是随样本变化的随机变量

常见样本统计量

设从总体中抽取样本 {X1,X2,,Xn}\{X_1, X_2, \dots, X_n\},以下是最常用的样本统计量:

样本均值 (Sample Mean)

Xˉ=1ni=1nXi\bar{X} = \frac{1}{n}\sum_{i=1}^{n} X_i

样本均值是总体均值 μ\mu无偏估计量,即 E[Xˉ]=μE[\bar{X}] = \mu,其方差为 σ2/n\sigma^2 / n。由大数定律中心极限定理保证,无论总体分布如何,当样本量充分大时,Xˉ\bar{X}抽样分布近似正态。

样本方差 (Sample Variance)

S2=1n1i=1n(XiXˉ)2S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \bar{X})^2

分母采用 n1n-1(而非 nn)是为了保证无偏性:E[S2]=σ2E[S^2] = \sigma^2。若使用 nn 作分母,则产生有偏估计量,偏差为 σ2/n-\sigma^2/n。这里的 n1n-1 称为自由度,源于估计 Xˉ\bar{X} 时已消耗一个自由度。

样本标准差 (Sample Standard Deviation)

S=S2S = \sqrt{S^2}

注意 SSσ\sigma有偏估计量,因为平方根变换不保持无偏性。在大样本中此偏差可忽略。

样本比例 (Sample Proportion)

p^=Xn\hat{p} = \frac{X}{n}

其中 XX 为样本中具有某特征的个体数。p^\hat{p} 是总体比例 pp 的无偏估计量,其方差为 p(1p)/np(1-p)/n

样本统计量与抽样分布

任一统计量都是随机变量,有其抽样分布。抽样分布描述了统计量在所有可能样本上的概率分布,是统计推断的理论基础:

  • 若总体服从 N(μ,σ2)N(\mu, \sigma^2),则 XˉN(μ,σ2/n)\bar{X} \sim N(\mu, \sigma^2/n)
  • 若总体正态,则 (n1)S2/σ2χ2(n1)(n-1)S^2/\sigma^2 \sim \chi^2(n-1)
  • XˉμS/nt(n1)\frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1),这是t检验的基础。

统计量的优良性准则

评价一个样本统计量作为参数估计量的优劣,通常考虑以下准则:

  1. 无偏性 (Unbiasedness)E[θ^]=θE[\hat{\theta}] = \theta。统计量的期望等于被估计参数。
  2. 一致性 (Consistency)θ^npθ\hat{\theta}_n \xrightarrow{p} \theta。随样本量增大,统计量依概率收敛于真值。
  3. 有效性 (Efficiency):在所有无偏估计量中,方差最小者更有效。
  4. 充分性 (Sufficiency):统计量包含样本中关于参数的全部信息,即充分统计量

区分:样本统计量 vs 总体参数

这一区分是统计推断的出发点:

  • 总体参数(如 μ,σ2,p\mu, \sigma^2, p):固定常数,通常不可知。
  • 样本统计量(如 Xˉ,S2,p^\bar{X}, S^2, \hat{p}):已知变量,因样本不同而变动,用于估计参数。

用符号约定:希腊字母表示参数,拉丁字母表示统计量。

实践意义

样本统计量是描述性统计推断性统计的桥梁。在实证研究中,研究者用样本统计量进行点估计区间估计,构建置信区间,执行假设检验。理解统计量的抽样变异标准误差,是正确解读实证结果、避免过度推断的前提。