ARTICLE

Sample Mean

Sample Mean (样本均值) 样本均值(Sample Mean)是统计学中最基本、最常用的描述性统计量之一,用于衡量一组样本数据的集中趋势(Central Tendency)。给定来自某个总体的独立同分布(i.i.d.)样本 X_1, X_2, , X_n,样本均值定义为所有观测值的算术平均: 其中 n 为样本容量(Sample Size), X_n

浏览 0 更新 2025-10-26

Sample Mean (样本均值)

样本均值(Sample Mean)是统计学中最基本、最常用的描述性统计量之一,用于衡量一组样本数据的集中趋势(Central Tendency)。给定来自某个总体的独立同分布(i.i.d.)样本 X1,X2,,XnX_1, X_2, \ldots, X_n,样本均值定义为所有观测值的算术平均:

Xˉn=1ni=1nXi\bar{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i

其中 nn 为样本容量(Sample Size),Xˉn\bar{X}_n 常简记为 Xˉ\bar{X}。样本均值是总体均值(Population Mean)μ=E[Xi]\mu = \mathbb{E}[X_i] 最自然的估计量,在频率学派框架下具有优良的统计性质,是连接描述统计推断统计的核心枢纽。

统计性质

样本均值具有一系列优异的理论性质,使其成为参数估计的首选工具。

无偏性(Unbiasedness):样本均值的期望等于总体均值,即 E[Xˉ]=μ\mathbb{E}[\bar{X}] = \mu。这意味着无论样本容量多大,样本均值在重复抽样中不会系统性地高估或低估总体均值。这是线性估计量中最基本的优良性质之一。

一致性(Consistency):由大数定律(Law of Large Numbers, LLN),当 nn \to \infty 时,Xˉnpμ\bar{X}_n \xrightarrow{p} \mu。样本均值依概率收敛于总体均值,样本量越大,估计越精确。这是频率学派推断的理论基石——通过增加样本量可任意逼近真实参数。

最小方差:在所有线性无偏估计量中,当数据来自正态分布时,样本均值是UMVUE(一致最小方差无偏估计量)。更一般地,由高斯-马尔可夫定理,在满足经典线性模型假定时,样本均值是最佳线性无偏估计量(BLUE)。

抽样分布:若 XiN(μ,σ2)X_i \sim \mathcal{N}(\mu, \sigma^2),则 XˉN(μ,σ2n)\bar{X} \sim \mathcal{N}(\mu, \frac{\sigma^2}{n})。更一般地,无论总体分布如何,由中心极限定理(Central Limit Theorem, CLT),当 nn 充分大时:

XˉndN(μ,σ2n)\bar{X}_n \xrightarrow{d} \mathcal{N}\left(\mu, \frac{\sigma^2}{n}\right)

这一结论使得基于正态近似的置信区间假设检验在大样本下具有普遍适用性。

标准误与估计

样本均值的方差为 Var(Xˉ)=σ2n\operatorname{Var}(\bar{X}) = \frac{\sigma^2}{n},其平方根 σn\frac{\sigma}{\sqrt{n}} 称为标准误(Standard Error)。由于总体标准差 σ\sigma 通常未知,实践中用样本标准差 s=1n1i=1n(XiXˉ)2s = \sqrt{\frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2} 替代,得到估计标准误 sn\frac{s}{\sqrt{n}}。此时,Xˉμs/ntn1\frac{\bar{X} - \mu}{s/\sqrt{n}} \sim t_{n-1} 服从自由度为 n1n-1学生t分布,构成t检验t置信区间的理论基础。

重要注意事项

尽管样本均值简单直观,使用时需警惕其局限性。样本均值对异常值(Outliers)高度敏感——单个极端观测即可大幅拉动均值偏离数据中心位置,此时中位数(Median)或截尾均值(Trimmed Mean)可能是更稳健的替代方案。对于偏态分布,均值未必是集中趋势的最佳度量。此外,当数据不满足独立同分布条件(如时间序列数据存在自相关)时,标准误公式需调整,直接使用 sn\frac{s}{\sqrt{n}} 会低估真实不确定性。

应用与延伸

样本均值是几乎所有统计方法的基础构件:方差分析(ANOVA)中的组均值比较、线性回归中的截距和斜率估计、蒙特卡洛方法中的积分近似、以及机器学习交叉验证的平均误差计算,均以样本均值为核心运算。从贝叶斯视角看,在共轭先验下后验均值可表示为先验均值与样本均值的加权平均。样本均值的普遍性源于它是期望的样本类比(Empirical Analog),将概率论的理论矩映射到数据的可计算量。