ARTICLE

充分性

充分性 (Sufficiency) 充分性 (Sufficiency) 是数理统计和统计推断中的核心概念,由 R.A. Fisher 引入。一个统计量若包含样本中关于未知参数的全部信息,则称为该参数的 充分统计量 (sufficient statistic)。在获得充分统计量后,原始样本数据对推断该参数不再提供额外信息。充分性原则实现了对数据的有效压缩与降维

浏览 78 更新 2025-10-29

充分性 (Sufficiency)

充分性 (Sufficiency) 是数理统计统计推断中的核心概念,由 R.A. Fisher 引入。一个统计量若包含样本中关于未知参数的全部信息,则称为该参数的 充分统计量 (sufficient statistic)。在获得充分统计量后,原始样本数据对推断该参数不再提供额外信息。充分性原则实现了对数据的有效压缩与降维,在不损失推断信息的前提下用一个或少数几个值代替整个数据集。

Fisher-Neyman 因子分解定理

X=(X1,,Xn) X = (X_1, \ldots, X_n) 来自概率密度函数概率质量函数 f(xθ) f(x|\theta) 的随机样本,θ \theta 为未知参数。统计量 T(X) T(X) θ \theta 的充分统计量,当且仅当联合概率函数可分解为:

L(θx)=g(T(x),θ)h(x)L(\theta|x) = g(T(x), \theta) \cdot h(x)

其中 g(T(x),θ) g(T(x), \theta) 对数据 x x 的依赖完全通过 T(x) T(x) 体现,h(x) h(x) 完全不依赖 θ \theta 。该定理将似然函数中与 θ \theta 相关的部分隔离在 g g 中,对 θ \theta 的推断(如最大似然估计)仅依赖于 T(x) T(x)

典型示例

伯努利分布: XiBernoulli(p) X_i \sim \mathrm{Bernoulli}(p) ,联合 PMF 为 L(px)=pxi(1p)nxi L(p|x) = p^{\sum x_i}(1-p)^{n-\sum x_i} 。定义 T(X)=Xi T(X) = \sum X_i ,则 g(T,p)=pT(1p)nT g(T, p) = p^T (1-p)^{n-T} h(x)=1 h(x) = 1 。故成功总次数即为 p p 的充分统计量——估计硬币正面概率只需知道正面总次数,无需记录抛掷顺序。

正态分布(均值未知,方差已知): XiN(μ,σ2) X_i \sim N(\mu, \sigma^2) ,联合 PDF 分解得 T(X)=Xi T(X) = \sum X_i (或样本均值 Xˉ \bar{X} )为 μ \mu 的充分统计量。若 μ \mu σ2 \sigma^2 均未知,充分统计量为二维向量 (Xi,Xi2) (\sum X_i, \sum X_i^2)

重要性与应用

数据压缩: 充分性使海量数据集可无损缩减至少数统计量。

Rao-Blackwell 定理 对任意无偏估计量,计算其在充分统计量下的条件期望,可获得方差更小的新无偏估计量,为寻找最小方差无偏估计量 (MVUE) 提供系统路径。

估计理论基础: 最大似然估计量 (MLE) 若存在,必然是充分统计量的函数。

相关概念

  • 最小充分统计量 达到最大数据压缩的充分统计量,是任何其他充分统计量的函数。
  • 完备统计量E[ϕ(T)]=0 E[\phi(T)] = 0 对所有 θ \theta 成立则 P(ϕ(T)=0)=1 P(\phi(T)=0)=1
  • Lehmann-Scheffé 定理 若统计量同时充分且完备,基于其构造的任何无偏估计量即为唯一 MVUE。
  • 辅助统计量 分布完全不依赖 θ \theta 巴苏定理指出完备最小充分统计量与任何辅助统计量独立。