ARTICLE

唯一最小方差无偏估计量

唯一最小方差无偏估计量（uniformly minimum variance unbiased estimator，简称UMVUE）是数理统计中点估计理论中的核心概念，代表了无偏估计框架下的最优解。在给定的统计模型中，若一个无偏估计量在所有可能的无偏估计量中具有最小的方差，则称其为唯一最小方差无偏估计量。这一概念由统计学家Lehmann和Scheffé在20

浏览 5 更新 2025-10-26

唯一最小方差无偏估计量（uniformly minimum variance unbiased estimator，简称UMVUE）是数理统计中点估计理论中的核心概念，代表了无偏估计框架下的最优解。在给定的统计模型中，若一个无偏估计量在所有可能的无偏估计量中具有最小的方差，则称其为唯一最小方差无偏估计量。这一概念由统计学家Lehmann和Scheffé在20世纪50年代系统化，为估计理论奠定了坚实的基础。UMVUE的核心思想在于：当我们要求估计量无偏时，自然希望其方差尽可能小，而UMVUE恰好在所有无偏估计量中实现了方差的最小化，从而体现了在无偏约束下估计精度所能达到的理论上限。

基本定义

设样本 $X_1, X_2, \ldots, X_n$ 来自某个参数族分布 $\{f(x;\theta): \theta \in \Theta\}$ ，待估目标参数为 $g(\theta)$ 。若存在一个估计量 $\delta(X)$ ，满足以下两个条件：其一， $\delta(X)$ 是 $g(\theta)$ 的无偏估计量，即对任意 $\theta \in \Theta$ 均有 $\mathbb{E}_\theta[\delta(X)] = g(\theta)$ ；其二，对任意其他无偏估计量 $\delta'(X)$ ，不等式 $\operatorname{Var}_\theta(\delta(X)) \leq \operatorname{Var}_\theta(\delta'(X))$ 对所有 $\theta \in \Theta$ 一致成立，则称 $\delta(X)$ 为 $g(\theta)$ 的唯一最小方差无偏估计量。这里的"一致成立"意味着在参数空间的每一点上方差都更小或相等，而非仅在某个局部成立。值得注意的是，UMVUE不一定存在，且当存在时也不一定唯一——但在完备统计量的条件下，其唯一性可以得到保证。UMVUE之所以在统计推断中占据重要地位，是因为它在无偏性的约束下最大限度地提高了估计的精度，为参数估计提供了一个理论上最优的基准。

勒曼-薛费定理

勒曼-薛费定理（Lehmann–Scheffé theorem）是构造和识别UMVUE的最重要工具，由Erich Lehmann和Henry Scheffé于1950年提出。该定理的内容如下：若 $T(X)$ 是参数 $\theta$ 的充分完备统计量，且 $\eta(T)$ 是 $g(\theta)$ 的某个无偏估计量，则 $\eta(T)$ 就是 $g(\theta)$ 的唯一最小方差无偏估计量。这一定理将UMVUE的寻找过程分解为两个清晰的步骤：第一，找出参数的充分完备统计量；第二，基于该统计量构造出目标参数的无偏估计量。充分性保证了估计量压缩了样本中的全部相关信息而不损失信息，完备性则保证了无偏估计量在同一充分统计量下是唯一的。两者的结合恰好刻画了UMVUE的核心特征。

充分完备统计量的判定

充分完备统计量的寻找通常依赖指数族分布的性质。一个分布族若属于正则指数族，其自然形式的统计量通常就是充分完备的。具体而言，若分布的概率密度函数可以写成 $f(x;\theta) = h(x)\exp\{\eta(\theta)^\top T(x) - A(\theta)\}$ 的形式，且参数空间包含某个开集，则 $T(X)$ 就是充分完备统计量。这一结论大大简化了UMVUE的构造过程，因为许多常见分布——包括正态分布、泊松分布、二项分布、伽马分布、贝塔分布等——都属于指数族。在实际操作中，Rao–Blackwell定理为改进任意无偏估计量提供了另一条路径：从任意一个无偏估计量出发，对其关于充分统计量求条件期望，可以得到方差更小的无偏估计量；若该充分统计量还是完备的，则得到的估计量就是UMVUE。

Cramér–Rao下界及其与UMVUE的关系

Cramér–Rao不等式是另一个与UMVUE密切相关的重要理论工具。该不等式在适当的正则条件下给出了无偏估计量方差的一个下界，即 $\operatorname{Var}_\theta(\delta(X)) \geq \frac{[g'(\theta)]^2}{n I(\theta)}$ ，其中 $I(\theta)$ 为Fisher信息量。如果一个无偏估计量的方差恰好达到Cramér–Rao下界，则它一定是UMVUE。然而，反之不真：UMVUE的方差可能严格大于Cramér–Rao下界，因为该下界并非总是可达的。实际上，Cramér–Rao下界可达的充要条件是指数族分布中的特定参数形式，这使得Cramér–Rao下界成为寻找UMVUE的一个充分而非必要条件。

典型示例分析

在正态分布 $\mathcal{N}(\mu, \sigma^2)$ 中，样本均值 $\bar{X}$ 是总体均值 $\mu$ 的UMVUE。当方差已知时， $\bar{X}$ 的方差恰好等于 $\sigma^2/n$ ，达到了Cramér–Rao下界。对于方差参数的估计情况则更加丰富：当均值 $\mu$ 已知时， $\frac{1}{n}\sum_{i=1}^n (X_i - \mu)^2$ 是 $\sigma^2$ 的UMVUE；当均值 $\mu$ 未知时，样本方差 $S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2$ 是 $\sigma^2$ 的UMVUE。有趣的是， $S^2$ 的方差并不等于Cramér–Rao下界，这说明UMVUE不一定达到该下界。在泊松分布 $\operatorname{Poi}(\lambda)$ 中，样本均值 $\bar{X}$ 是 $\lambda$ 的UMVUE，其方差恰好达到Cramér–Rao下界。在伯努利分布 $\operatorname{Bern}(p)$ 中，样本比例 $\bar{X}$ 是成功概率 $p$ 的UMVUE。在指数分布 $\operatorname{Exp}(\lambda)$ 中，样本均值 $\bar{X}$ 是均值 $1/\lambda$ 的UMVUE，而 $\frac{n-1}{\sum X_i}$ 则是速率参数 $\lambda$ 的有偏估计——其无偏版本需要通过适当的变换得到。

局限性及拓展

尽管UMVUE在理论上具有最优性，但在实际应用中存在若干局限性。首先，UMVUE的构造依赖于充分完备统计量的存在，而在复杂模型或高维参数空间中，充分完备统计量往往难以获得甚至不存在。首先，UMVUE并非在所有模型中存在：当分布族缺乏充分完备统计量时，可能无法找到UMVUE。其次，UMVUE有时会取到参数空间之外的数值，例如在方差分量估计中可能出现负值，或者当参数有界时UMVUE可能越界，这在实际解释中会造成困难。第三，UMVUE在某些情形下可能不是最自然的估计量——最大似然估计在渐进意义上通常具有更优的性质。最后，在均方误差准则下，引入适当偏差的有偏估计量（如Stein收缩估计量、岭回归估计量等）往往能够在方差和偏差之间取得更好的平衡，从而获得更小的整体均方误差。这一认识推动了现代高维统计中正则化方法的广泛发展，表明无偏性并非总是最优的选择。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。