ARTICLE

Population Mean

总体均值 (Population Mean) 总体均值是描述统计与推断统计中最核心的集中趋势度量之一,记作 。它定义为有限总体中所有个体取值的算术平均,或在无限总体情形下理解为概率分布的期望。设总体包含 N 个个体,第 i 个个体的观测值为 X_i,则总体均值为: 对于无限总体或由随机变量 X 描述的总体,总体均值即为期望 = E[X]。在连续情形下,若 X

浏览 0 更新 2025-10-26

总体均值 (Population Mean)

总体均值是描述统计推断统计中最核心的集中趋势度量之一,记作 μ\mu。它定义为有限总体中所有个体取值的算术平均,或在无限总体情形下理解为概率分布的期望。设总体包含 NN 个个体,第 ii 个个体的观测值为 XiX_i,则总体均值为:

μ=1Ni=1NXi\mu = \frac{1}{N} \sum_{i=1}^{N} X_i

对于无限总体或由随机变量 XX 描述的总体,总体均值即为期望 μ=E[X]\mu = E[X]。在连续情形下,若 XX 有概率密度函数 f(x)f(x),则 μ=xf(x)dx\mu = \int_{-\infty}^{\infty} x f(x)\, dx;在离散情形下,μ=xxP(X=x)\mu = \sum_{x} x \cdot P(X = x)。总体均值与样本均值 Xˉ=1ni=1nXi\bar{X} = \frac{1}{n}\sum_{i=1}^{n} X_i 是对应但不相同的概念:前者是总体的固定参数(通常未知),后者是从总体中随机抽取的统计量。

性质与数学基础

总体均值是最重要的总体参数之一,它与方差 σ2=E[(Xμ)2]\sigma^2 = E[(X-\mu)^2] 共同构成描述总体的基本框架。其核心数学性质包括:

  • 线性性:对任意常数 a,ba, b,有 E[aX+b]=aE[X]+bE[aX + b] = aE[X] + b。这一性质使得总体均值在线性变换下具有可预测的行为。
  • 最小化平方误差μ\mu 是使得期望平方误差 E[(Xc)2]E[(X - c)^2] 最小的常数 cc,即 μ=argmincE[(Xc)2]\mu = \arg\min_{c} E[(X-c)^2]。这一性质将总体均值与最小二乘法在理论上联系起来。
  • 重期望律 (Law of Total Expectation):若以另一个随机变量 YY 对总体进行分层,则 E[X]=E[E[XY]]E[X] = E[E[X \mid Y]]。这是分层抽样中后分层估计方法的理论基础。
  • 大数定律:当独立同分布样本量 nn \to \infty 时,样本均值 Xˉn\bar{X}_n 几乎必然收敛(强大数定律)或依概率收敛(弱大数定律)到总体均值 μ\mu。这是频率学派统计推断的根本保证。

对于多元总体,总体均值推广为均值向量 μ=E[X]=(E[X1],,E[Xp])T\boldsymbol{\mu} = E[\mathbf{X}] = (E[X_1], \ldots, E[X_p])^T,在多元正态分布主成分分析中起核心作用。

估计与推断

在绝大多数实际情境中,总体均值 μ\mu 是未知的,需要通过样本进行估计。

点估计

样本均值 Xˉ\bar{X} 是总体均值 μ\mu无偏估计量E[Xˉ]=μE[\bar{X}] = \mu,且其方差为 Var(Xˉ)=σ2/n\operatorname{Var}(\bar{X}) = \sigma^2/n。当总体方差未知时,使用样本方差 s2=1n1(XiXˉ)2s^2 = \frac{1}{n-1}\sum (X_i - \bar{X})^2 估计 σ2\sigma^2,此时 Xˉ\bar{X} 的标准误差为 SE(Xˉ)=s/n\operatorname{SE}(\bar{X}) = s/\sqrt{n}

有限总体校正背景下,若抽样比例 n/Nn/N 不可忽略(如超过 5\%),则需乘以校正因子 1n/N\sqrt{1 - n/N},即 Var(Xˉ)=σ2nNnN1\operatorname{Var}(\bar{X}) = \frac{\sigma^2}{n} \cdot \frac{N-n}{N-1}

区间估计

总体均值的置信区间构造取决于已知信息:

  • 方差已知(或大样本):基于中心极限定理Xˉμσ/nN(0,1)\frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)100(1α)%100(1-\alpha)\% 置信区间为 Xˉ±zα/2σ/n\bar{X} \pm z_{\alpha/2} \cdot \sigma/\sqrt{n}
  • 方差未知,正态总体:使用t分布Xˉ±tα/2,n1s/n\bar{X} \pm t_{\alpha/2, n-1} \cdot s/\sqrt{n},这是Gosset (Student)于 1908 年的突破性成果。
  • 非正态总体,小样本:可借助Bootstrap方法或非参数统计中的符号秩方法进行区间估计。

假设检验

关于总体均值的假设检验是统计推断的核心工具。单样本情形下,检验 H0:μ=μ0H_0: \mu = \mu_0 使用单样本t检验,检验统计量为 t=(Xˉμ0)/(s/n)t = (\bar{X} - \mu_0)/(s/\sqrt{n}),在 H0H_0 下服从 t(n1)t(n-1) 分布。两独立总体均值比较使用两样本t检验(需区分等方差与不等方差情形,后者即Welch t检验),而配对设计则使用配对t检验,将配对差值的均值与 0 比较。

当正态性假设存疑时,常使用Wilcoxon符号秩检验(单样本/配对)或Mann-Whitney U检验(两独立样本)等非参数替代。

加权总体均值

在某些应用中,总体内不同个体的重要性不同,此时使用加权均值

μw=i=1NwiXii=1Nwi\mu_w = \frac{\sum_{i=1}^{N} w_i X_i}{\sum_{i=1}^{N} w_i}

其中 wi>0w_i > 0 为第 ii 个个体的权重。加权均值在调查统计(如按抽样权重调整)、金融(如投资组合的加权平均收益率)和元分析(按研究精度加权合并效应量)中应用广泛。在抽样调查中,Horvitz-Thompson估计量就是一种加权形式的总体均值估计。

与其它统计概念的关系

总体均值与中位数众数构成集中趋势的三大支柱。对于对称单峰分布(如正态分布),三者重合。但对于偏态分布,均值受极端值影响更大:在收入分布等右偏情境中,均值通常高于中位数,这是帕累托分布等偏态模型的典型特征。选择均值还是中位数作为总体"典型值"取决于分析目标和数据分布形态。

回归分析中,条件均值 E[YX=x]E[Y \mid X = x] 是回归函数的核心——线性回归假定 E[YX]=β0+β1XE[Y \mid X] = \beta_0 + \beta_1 X,即条件均值是预测变量的线性函数。更一般地,广义线性模型通过链接函数将线性预测子与条件均值相关联。因果推断中的平均处理效应(ATE)同样定义为潜在结果差异的总体均值:τ=E[Y(1)Y(0)]\tau = E[Y(1) - Y(0)]

总体均值也是矩估计法(Method of Moments)的基础:用样本均值(一阶样本矩)来匹配总体均值(一阶总体矩),进而求解参数估计值。这一方法由Karl Pearson在 19 世纪末系统提出,虽然在大样本效率上通常不如最大似然估计,但其直观性和易计算性使其至今仍在教学和工程实践中占有一席之地。