ARTICLE

内曼-费雪因子分解定理

内曼-费雪因子分解定理 (Neyman-Fisher Factorization Theorem) 内曼-费雪因子分解定理(Neyman-Fisher Factorization Theorem),又称费雪-内曼因子分解定理,是数理统计学中关于充分统计量(Sufficient Statistic)的核心判据。该定理给出了一个统计量是充分统计量的充要条件,由罗

浏览 4 更新 2025-10-26

内曼-费雪因子分解定理 (Neyman-Fisher Factorization Theorem)

内曼-费雪因子分解定理(Neyman-Fisher Factorization Theorem),又称费雪-内曼因子分解定理,是数理统计学中关于充分统计量(Sufficient Statistic)的核心判据。该定理给出了一个统计量是充分统计量的充要条件,由罗纳德·费雪(Ronald Fisher)于 1922 年首次提出其思想,后由耶日·内曼(Jerzy Neyman)于 1935 年给出严格证明,是统计推断中数据降维与信息压缩的理论基石。

充分统计量的直观含义

一个统计量 T(X) T(X) 被称为对于参数 θ \theta (或参数族)是充分的,当且仅当:给定 T(X) T(X) 的值之后,样本 X X 的条件分布不再依赖于参数 θ \theta 。换言之,T(X) T(X) 提取了样本中关于 θ \theta 全部信息,原始数据中的剩余变异性仅包含随机噪声,不再提供关于参数的额外信息。

例如,在估计正态分布均值 μ \mu (已知方差 σ2 \sigma^2 )时,样本均值 Xˉ \bar{X} μ \mu 的充分统计量:一旦知道了 Xˉ \bar{X} ,各个观测值相对于 Xˉ \bar{X} 的偏离不再包含关于 μ \mu 的任何信息。

定理的正式陈述

设随机样本 X=(X1,X2,,Xn) X = (X_1, X_2, \ldots, X_n) 来自一个参数分布族 {f(xθ):θΘ} \{f(x \mid \theta) : \theta \in \Theta\} ,其中 f(xθ) f(x \mid \theta) 为联合概率密度函数(连续情形)或联合概率质量函数(离散情形)。统计量 T(X) T(X) 是参数 θ \theta 的充分统计量,当且仅当存在非负函数 g g h h ,使得对所有的样本 x x 和参数 θ \theta ,联合密度/质量函数可以分解为:

f(xθ)=g(T(x),θ)h(x)f(x \mid \theta) = g\big(T(x), \theta\big) \cdot h(x)

其中:

  • g(T(x),θ) g(T(x), \theta) 通过 x x 仅依赖于统计量 T(x) T(x) 的值,可以含有参数 θ \theta
  • h(x) h(x) 不依赖于参数 θ \theta (可以依赖于 x x ,但不含 θ \theta )。

直观解释:因子分解将似然函数分为两部分——g g 捕获了样本中与 θ \theta 相关的全部信息且仅通过 T(X) T(X) 中介;h h 则是纯噪声部分,与 θ \theta 无关。因此,仅保留 T(X) T(X) 不会损失关于 θ \theta 的信息,这就是"充分"一词的数学表达。

经典示例

伯努利试验:设 X1,,XniidBernoulli(p) X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Bernoulli}(p) ,联合概率质量函数为:

f(xp)=i=1npxi(1p)1xi=pxi(1p)nxi1f(x \mid p) = \prod_{i=1}^{n} p^{x_i} (1-p)^{1-x_i} = p^{\sum x_i} (1-p)^{n - \sum x_i} \cdot 1

T(X)=i=1nXi T(X) = \sum_{i=1}^{n} X_i (成功次数)、g(t,p)=pt(1p)nt g(t, p) = p^{t} (1-p)^{n-t} h(x)=1 h(x) = 1 ,则满足因子分解条件,故成功总次数是 p p 的充分统计量。

正态分布(均值未知,方差已知):设 XiN(μ,σ02) X_i \sim N(\mu, \sigma_0^2) σ02 \sigma_0^2 已知。联合密度:

f(xμ)=(2πσ02)n/2exp ⁣(12σ02(xiμ)2)f(x \mid \mu) = (2\pi\sigma_0^2)^{-n/2} \exp\!\left(-\frac{1}{2\sigma_0^2} \sum (x_i - \mu)^2\right)

利用 (xiμ)2=(xixˉ)2+n(xˉμ)2 \sum (x_i - \mu)^2 = \sum (x_i - \bar{x})^2 + n(\bar{x} - \mu)^2 ,可分解为:

f(xμ)=exp ⁣(n(xˉμ)22σ02)g(xˉ,μ)(2πσ02)n/2exp ⁣((xixˉ)22σ02)h(x)f(x \mid \mu) = \underbrace{\exp\!\left(-\frac{n(\bar{x} - \mu)^2}{2\sigma_0^2}\right)}_{g(\bar{x}, \mu)} \cdot \underbrace{(2\pi\sigma_0^2)^{-n/2} \exp\!\left(-\frac{\sum (x_i - \bar{x})^2}{2\sigma_0^2}\right)}_{h(x)}

因此样本均值 Xˉ \bar{X} μ \mu 的充分统计量。

均匀分布:设 XiU(0,θ) X_i \sim U(0, \theta) ,联合密度:

f(xθ)=1θn1{0<x(1)}1{x(n)<θ}=1θn1{x(n)<θ}g(x(n),θ)1{0<x(1)}h(x)f(x \mid \theta) = \frac{1}{\theta^n} \cdot \mathbf{1}_{\{0 < x_{(1)}\}} \cdot \mathbf{1}_{\{x_{(n)} < \theta\}} = \underbrace{\frac{1}{\theta^n} \mathbf{1}_{\{x_{(n)} < \theta\}}}_{g(x_{(n)}, \theta)} \cdot \underbrace{\mathbf{1}_{\{0 < x_{(1)}\}}}_{h(x)}

其中 x(n)=maxixi x_{(n)} = \max_i x_i 。因此最大次序统计量 X(n) X_{(n)} θ \theta 的充分统计量。

定理的理论意义

  1. 充分性降维原则:因子分解定理为充分统计量的构造与验证提供了可操作的代数判据。在实际应用中,只需将联合密度按定理要求进行因式分解,即可识别充分统计量,而无需计算复杂的条件分布。
  2. 与指数族的联系:对于指数族分布(Exponential Family),因子分解形式天然成立,充分统计量的维度等于自然参数的维度,揭示了指数族在统计推断中的优良性质。
  3. 最小充分统计量:在充分统计量类中可进一步寻找最小充分统计量(Minimal Sufficient Statistic),实现最大程度的数据压缩,其为任意充分统计量的函数。
  4. Rao-Blackwell 改进:结合Rao-Blackwell 定理,基于充分统计量的条件期望可在不增加偏差的前提下降低估计量的方差,充分统计量因此成为构造最优无偏估计量的关键工具。

内曼-费雪因子分解定理将"充分性"这一深刻的统计概念转化为可操作的代数条件,构成了经典统计推断理论中从点估计假设检验置信区间构造的通用方法论基础,是统计学家工具箱中不可或缺的核心定理。