ARTICLE

费雪-奈曼分解定理

费雪-奈曼分解定理 (Fisher-Neyman Factorization Theorem) 费雪-奈曼分解定理，也称因子分解定理或充分性分解定理，是数理统计中刻画充分统计量的核心定理。它由R. A. Fisher于1922年首次提出思想，后由Jerzy Neyman于1935年给出严格的数学表述和证明。该定理为判断一个统计量是否"充分"——即是否在不损失

浏览 2 更新 2025-10-26

费雪-奈曼分解定理 (Fisher-Neyman Factorization Theorem)

费雪-奈曼分解定理，也称因子分解定理或充分性分解定理，是数理统计中刻画充分统计量的核心定理。它由R. A. Fisher于1922年首次提出思想，后由Jerzy Neyman于1935年给出严格的数学表述和证明。该定理为判断一个统计量是否"充分"——即是否在不损失参数信息的前提下压缩数据——提供了简洁易用的充要条件,是统计推断和数据降维的理论基石。

直觉与动机

在参数估计中，样本 $X_1,\ldots,X_n$ 包含关于未知参数 $\theta$ 的全部信息。但原始数据维度高，我们希望找到一个低维统计量 $T(X)$ ，使其完整保留样本中所有关于 $\theta$ 的信息。满足此性质的 $T$ 即为充分统计量。

分解定理的直觉：若联合密度(或概率质量函数)可分解为"仅通过 $T(x)$ 依赖于 $\theta$ 的部分"和"完全不依赖于 $\theta$ 的部分"的乘积，则 $T$ 之外的信息与 $\theta$ 无关—— $T$ 已捕获 $\theta$ 的全部信息。

定理的正式表述

设样本 $X = (X_1,\ldots,X_n)$ 的联合概率密度(连续情形)或联合概率质量函数(离散情形)为 $f(x|\theta)$ ，其中 $\theta \in \Theta$ 为未知参数(可为向量)。统计量 $T = T(X)$ 是 $\theta$ 的充分统计量，当且仅当存在非负函数 $g$ 和 $h$ ，使得对所有 $x$ 和 $\theta$ ：

f(x|\theta) = g(T(x), \theta) \cdot h(x)

其中 $g$ 仅通过 $T(x)$ 依赖于样本 $x$ ，而 $h(x)$ 完全不依赖于参数 $\theta$ 。

多维参数扩展：若 $\theta = (\theta_1,\ldots,\theta_k)$ ，则充分统计量通常也是多维向量 $T(X) = (T_1(X),\ldots,T_m(X))$ ，分解形式不变。

若干经典示例

例1：伯努利试验。设 $X_i \sim \text{Bernoulli}(p)$ i.i.d.，联合PMF：

f(x|p) = \prod_{i=1}^{n} p^{x_i}(1-p)^{1-x_i} = p^{\sum x_i}(1-p)^{n-\sum x_i}

令 $T(x) = \sum_{i=1}^{n} x_i$ ，取 $g(t,p) = p^t(1-p)^{n-t}$ ， $h(x) = 1$ 。由分解定理， $T = \sum X_i$ 是 $p$ 的充分统计量。成功总次数就是对成功率最精炼的概括。

例2：正态分布均值(方差已知)。设 $X_i \sim N(\mu, \sigma_0^2)$ ， $\sigma_0^2$ 已知：

\begin{aligned} f(x|\mu) &= (2\pi\sigma_0^2)^{-n/2} \exp\left\{-\frac{1}{2\sigma_0^2}\sum(x_i-\mu)^2\right\} \\ &= (2\pi\sigma_0^2)^{-n/2} \exp\left\{-\frac{1}{2\sigma_0^2}\sum x_i^2 + \frac{\mu}{\sigma_0^2}\sum x_i - \frac{n\mu^2}{2\sigma_0^2}\right\} \end{aligned}

令 $T(x) = \sum x_i$ ，则 $g(t,\mu) = \exp\{\mu t/\sigma_0^2 - n\mu^2/(2\sigma_0^2)\}$ ， $h(x) = (2\pi\sigma_0^2)^{-n/2}\exp\{-\sum x_i^2/(2\sigma_0^2)\}$ 。 $T = \sum X_i$ (等价于 $\bar{X}$ )是 $\mu$ 的充分统计量。

例3：均匀分布。设 $X_i \sim U(0,\theta)$ i.i.d.，联合密度：

f(x|\theta) = \frac{1}{\theta^n} \mathbf{1}_{\{0 < x_{(1)} \leq x_{(n)} < \theta\}} = \frac{1}{\theta^n} \mathbf{1}_{\{x_{(n)} < \theta\}} \cdot \mathbf{1}_{\{0 < x_{(1)}\}}

取 $T(x) = x_{(n)} = \max_i x_i$ ，则 $g(t,\theta) = \theta^{-n}\mathbf{1}_{\{t < \theta\}}$ ， $h(x) = \mathbf{1}_{\{0 < x_{(1)}\}}$ 。最大值即充分统计量——一旦知道最大值，其余顺序统计量的排列对 $\theta$ 无增量信息。

例4：正态分布(均值和方差均未知)。设 $X_i \sim N(\mu,\sigma^2)$ ，参数 $\theta = (\mu,\sigma^2)$ ：

f(x|\mu,\sigma^2) = (2\pi\sigma^2)^{-n/2} \exp\left\{-\frac{1}{2\sigma^2}\sum(x_i-\bar{x})^2 - \frac{n}{2\sigma^2}(\bar{x}-\mu)^2\right\}

分解定理表明二维统计量 $T(X) = (\bar{X}, S^2)$ ，其中 $S^2 = \sum(X_i-\bar{X})^2$ ，是 $(\mu,\sigma^2)$ 的联合充分统计量。

与指数族的关系

分解定理与指数族分布存在深刻的结构性联系。若样本来自指数族：

f(x|\theta) = h(x)\exp\left\{\eta(\theta)^\top T(x) - A(\theta)\right\}

则 $T(X)$ 天然是 $\theta$ 的充分统计量。事实上，指数族是唯一一类"充分统计量的维数不随样本量增长"的分布族——这一结论由Pitman-Koopman-Darmois定理确立。换言之，分解定理揭示：能在有限维统计量中无损压缩信息的分布，几乎必然是(或等价于)指数族。

证明概要

必要性( $\Leftarrow$ )：若分解成立，给定 $T(X) = t$ ，条件分布：

f(x|T=t, \theta) = \frac{f(x|\theta)}{f_T(t|\theta)} = \frac{g(t,\theta)h(x)}{f_T(t|\theta)}

由于分母由 $g(t,\theta)$ 积分而得，也与 $\theta$ 相关，但比值中 $\theta$ 消失——条件分布不依赖 $\theta$ ，因此 $T$ 充分。

充分性( $\Rightarrow$ )：若 $T$ 充分，条件分布 $f(x|T=t)$ 不依赖 $\theta$ 。则：

f(x|\theta) = f(x|T=t) \cdot f_T(T(x)|\theta)

令 $g(T(x),\theta) = f_T(T(x)|\theta)$ ， $h(x) = f(x|T=T(x))$ ，即得分解。

离散情形的证明完全平行，仅需将密度替换为概率质量函数。

在统计实践中的意义

数据压缩：分解定理为降维提供了理论依据。例如在OLS回归中， $(\sum Y_i, \sum X_i Y_i, \sum Y_i^2)$ 构成 $(\beta_0,\beta_1,\sigma^2)$ 的充分统计量——无论样本量多大，只需保留这三个数即可进行完全的似然推断。

估计量的改进：根据Rao-Blackwell定理，任何估计量在对其充分统计量取条件期望后，方差不会增大。分解定理是寻找充分统计量的工具，进而用于构造UMVUE(一致最小方差无偏估计量)。

模型诊断：若一个看似合理的统计量未通过分解定理检验(如中位数对正态均值不充分)，则基于该统计量的推断必损失信息。这对稳健统计和非参数方法的权衡具有指导意义。

局限与延伸

局限：分解定理本身不回答"哪个充分统计量最优"——若 $T$ 充分， $2T$ 、 $(T, T^2)$ 等也充分(充分性对一一变换封闭，但非一一变换不保证)。实际中我们寻求最小充分统计量(minimal sufficient)，即所有充分统计量中"最粗"的那个——等价于似然比划分的最粗统计量。

现代延伸：在高维统计(LASSO、稀疏估计)中，"近似充分"和"局部充分"成为活跃方向；在贝叶斯统计中，分解定理与共轭先验和充分性原理紧密相连。

总之，费雪-奈曼分解定理以极其简洁的代数条件，精准刻画了充分统计量的本质，是连接统计理论与数据分析实践的桥梁。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。