ARTICLE

内曼-费雪因子分解定理

内曼-费雪因子分解定理 (Neyman-Fisher Factorization Theorem) 内曼-费雪因子分解定理（Neyman-Fisher Factorization Theorem），又称费雪-内曼因子分解定理，是数理统计学中关于充分统计量（Sufficient Statistic）的核心判据。该定理给出了一个统计量是充分统计量的充要条件，由罗

浏览 4 更新 2025-10-26

内曼-费雪因子分解定理 (Neyman-Fisher Factorization Theorem)

内曼-费雪因子分解定理（Neyman-Fisher Factorization Theorem），又称费雪-内曼因子分解定理，是数理统计学中关于充分统计量（Sufficient Statistic）的核心判据。该定理给出了一个统计量是充分统计量的充要条件，由罗纳德·费雪（Ronald Fisher）于 1922 年首次提出其思想，后由耶日·内曼（Jerzy Neyman）于 1935 年给出严格证明，是统计推断中数据降维与信息压缩的理论基石。

充分统计量的直观含义

一个统计量 $T(X)$ 被称为对于参数 $\theta$ （或参数族）是充分的，当且仅当：给定 $T(X)$ 的值之后，样本 $X$ 的条件分布不再依赖于参数 $\theta$ 。换言之， $T(X)$ 提取了样本中关于 $\theta$ 的全部信息，原始数据中的剩余变异性仅包含随机噪声，不再提供关于参数的额外信息。

例如，在估计正态分布均值 $\mu$ （已知方差 $\sigma^2$ ）时，样本均值 $\bar{X}$ 是 $\mu$ 的充分统计量：一旦知道了 $\bar{X}$ ，各个观测值相对于 $\bar{X}$ 的偏离不再包含关于 $\mu$ 的任何信息。

定理的正式陈述

设随机样本 $X = (X_1, X_2, \ldots, X_n)$ 来自一个参数分布族 $\{f(x \mid \theta) : \theta \in \Theta\}$ ，其中 $f(x \mid \theta)$ 为联合概率密度函数（连续情形）或联合概率质量函数（离散情形）。统计量 $T(X)$ 是参数 $\theta$ 的充分统计量，当且仅当存在非负函数 $g$ 和 $h$ ，使得对所有的样本 $x$ 和参数 $\theta$ ，联合密度/质量函数可以分解为：

f(x \mid \theta) = g\big(T(x), \theta\big) \cdot h(x)

其中：

$g(T(x), \theta)$ 通过 $x$ 仅依赖于统计量 $T(x)$ 的值，可以含有参数 $\theta$ ；
$h(x)$ 不依赖于参数 $\theta$ （可以依赖于 $x$ ，但不含 $\theta$ ）。

直观解释：因子分解将似然函数分为两部分—— $g$ 捕获了样本中与 $\theta$ 相关的全部信息且仅通过 $T(X)$ 中介； $h$ 则是纯噪声部分，与 $\theta$ 无关。因此，仅保留 $T(X)$ 不会损失关于 $\theta$ 的信息，这就是"充分"一词的数学表达。

经典示例

伯努利试验：设 $X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Bernoulli}(p)$ ，联合概率质量函数为：

f(x \mid p) = \prod_{i=1}^{n} p^{x_i} (1-p)^{1-x_i} = p^{\sum x_i} (1-p)^{n - \sum x_i} \cdot 1

取 $T(X) = \sum_{i=1}^{n} X_i$ （成功次数）、 $g(t, p) = p^{t} (1-p)^{n-t}$ 、 $h(x) = 1$ ，则满足因子分解条件，故成功总次数是 $p$ 的充分统计量。

正态分布（均值未知，方差已知）：设 $X_i \sim N(\mu, \sigma_0^2)$ ， $\sigma_0^2$ 已知。联合密度：

f(x \mid \mu) = (2\pi\sigma_0^2)^{-n/2} \exp\!\left(-\frac{1}{2\sigma_0^2} \sum (x_i - \mu)^2\right)

利用 $\sum (x_i - \mu)^2 = \sum (x_i - \bar{x})^2 + n(\bar{x} - \mu)^2$ ，可分解为：

f(x \mid \mu) = \underbrace{\exp\!\left(-\frac{n(\bar{x} - \mu)^2}{2\sigma_0^2}\right)}_{g(\bar{x}, \mu)} \cdot \underbrace{(2\pi\sigma_0^2)^{-n/2} \exp\!\left(-\frac{\sum (x_i - \bar{x})^2}{2\sigma_0^2}\right)}_{h(x)}

因此样本均值 $\bar{X}$ 是 $\mu$ 的充分统计量。

均匀分布：设 $X_i \sim U(0, \theta)$ ，联合密度：

f(x \mid \theta) = \frac{1}{\theta^n} \cdot \mathbf{1}_{\{0 < x_{(1)}\}} \cdot \mathbf{1}_{\{x_{(n)} < \theta\}} = \underbrace{\frac{1}{\theta^n} \mathbf{1}_{\{x_{(n)} < \theta\}}}_{g(x_{(n)}, \theta)} \cdot \underbrace{\mathbf{1}_{\{0 < x_{(1)}\}}}_{h(x)}

其中 $x_{(n)} = \max_i x_i$ 。因此最大次序统计量 $X_{(n)}$ 是 $\theta$ 的充分统计量。

定理的理论意义

充分性降维原则：因子分解定理为充分统计量的构造与验证提供了可操作的代数判据。在实际应用中，只需将联合密度按定理要求进行因式分解，即可识别充分统计量，而无需计算复杂的条件分布。
与指数族的联系：对于指数族分布（Exponential Family），因子分解形式天然成立，充分统计量的维度等于自然参数的维度，揭示了指数族在统计推断中的优良性质。
最小充分统计量：在充分统计量类中可进一步寻找最小充分统计量（Minimal Sufficient Statistic），实现最大程度的数据压缩，其为任意充分统计量的函数。
Rao-Blackwell 改进：结合Rao-Blackwell 定理，基于充分统计量的条件期望可在不增加偏差的前提下降低估计量的方差，充分统计量因此成为构造最优无偏估计量的关键工具。

内曼-费雪因子分解定理将"充分性"这一深刻的统计概念转化为可操作的代数条件，构成了经典统计推断理论中从点估计、假设检验到置信区间构造的通用方法论基础，是统计学家工具箱中不可或缺的核心定理。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。