ARTICLE

Huber-White

Huber-White 估计量 (Huber-White Estimator) Huber-White估计量，又称异方差稳健标准误（Heteroskedasticity-Consistent Standard Errors）、三明治估计量（Sandwich Estimator）或Eicker-Huber-White估计量，是计量经济学和统计推断中最具影响力的

浏览 0 更新 2026-01-07

Huber-White 估计量 (Huber-White Estimator)

Huber-White估计量，又称异方差稳健标准误（Heteroskedasticity-Consistent Standard Errors）、三明治估计量（Sandwich Estimator）或Eicker-Huber-White估计量，是计量经济学和统计推断中最具影响力的发展之一。它由Peter Huber（1967）在M估计理论中首次提出，并由Halbert White（1980, 1982）系统引入计量经济学领域。其根本意义在于：在{{线性回归}}模型存在异方差性时，仍能为回归系数提供正确的标准误估计，从而保证推断的有效性。

问题的背景与动机

在经典线性回归模型 $Y = X\beta + \varepsilon$ 中，OLS估计量 $\hat{\beta} = (X'X)^{-1}X'Y$ 的方差为：

\mathrm{Var}(\hat{\beta} \mid X) = (X'X)^{-1} X' \Omega X (X'X)^{-1}

其中 $\Omega = \mathrm{Var}(\varepsilon \mid X)$ 是 $n \times n$ 的误差协方差矩阵。在经典假设下，误差项满足同方差性（Homoscedasticity）和无自相关，即 $\Omega = \sigma^2 I_n$ ，此时上式简化为：

\mathrm{Var}(\hat{\beta} \mid X) = \sigma^2 (X'X)^{-1}

这一简洁表达式构成了OLS标准误的基础。然而，当异方差性出现时——即 $\mathrm{Var}(\varepsilon_i \mid X_i) = \sigma_i^2$ 随观测不同而变化——上述简化不再成立。若仍错误地使用同方差公式，标准误将产生偏误，导致t检验、F检验和置信区间全部失效。在许多实证场景中——如横截面数据分析、金融时间序列、发展经济学中基于调查数据的研究——异方差性是常态而非例外。

Huber-White估计量的核心思想

Huber-White估计量的核心洞察是：尽管 $\Omega$ 是未知的，但我们可以在不设定异方差结构的情况下，利用 $\hat{OLS残差}$ $\hat{\varepsilon}_i$ 对 $\Omega$ 进行一致估计。White（1980）证明了如下的异方差一致协方差矩阵估计量：

\widehat{\mathrm{Var}}(\hat{\beta}) = (X'X)^{-1} \left( \sum_{i=1}^{n} \hat{\varepsilon}_i^2 X_i X_i' \right) (X'X)^{-1}

这一公式被称为三明治估计量（Sandwich Estimator），因为其结构可以形象地理解为"面包-肉-面包"：两端的"面包"是 $(X'X)^{-1}$ （即模型设计矩阵部分），中间的"肉"是 $\sum_{i=1}^{n} \hat{\varepsilon}_i^2 X_i X_i'$ （即数据驱动部分）。这一命名最早由计量经济学家Arnold Zellner提出，后来被学界广泛接受。

将此矩阵的平方根（即对角元素的平方根）作为回归系数的稳健标准误（Robust Standard Errors），即可在异方差存在时进行有效的统计推断。

估计量的渐近性质

Huber-White估计量具有以下关键性质：

一致性：在相当弱的正则条件下， $\widehat{\mathrm{Var}}(\hat{\beta})$ 是 $\mathrm{Var}(\hat{\beta})$ 的一致估计量。这意味着随着样本量的增大，稳健标准误与真实标准误之差依概率收敛于零。
异方差一致性：无论异方差的具体形式如何——只要方差是有限且非退化的——该估计量都保持一致性。这一性质使其具有极强的实用性。
非有效性：需要指出的是，Huber-White估计量虽然一致，但并非BLUE。在异方差结构已知的情况下，加权最小二乘法（WLS）或可行性广义最小二乘法（FGLS）估计效率更高。然而，在"异方差结构未知"这一最普遍的实证场景中，Huber-White标准误是唯一可行的稳健推断工具。

小样本偏误与有限样本修正

Huber-White估计量的一个重要局限在于小样本偏误。当样本量 $n$ 较小（如 $n < 100$ ）或存在高杠杆点（即 $X_i$ 取自极端值）时，残差 $\hat{\varepsilon}_i$ 可能会系统性偏小（因为OLS倾向于"过度拟合"数据），从而导致标准误被低估。这一问题在早期应用中导致了对稳健标准误可靠性的质疑。

为解决这一问题，计量经济学家提出了多种有限样本修正（Finite-Sample Corrections）：

HC0：White（1980）原始形式，无修正，使用 $\hat{\varepsilon}_i^2$ 。
HC1：引入自由度修正因子 $\frac{n}{n-k}$ （其中 $k$ 为回归参数个数），即使用 $\frac{n}{n-k} \hat{\varepsilon}_i^2$ 。这是Stata等统计软件默认采用的形式。
HC2：使用 $\frac{\hat{\varepsilon}_i^2}{1 - h_{ii}}$ ，其中 $h_{ii}$ 是帽子矩阵 $H = X(X'X)^{-1}X'$ 的第 $i$ 个对角元。这一调整利用了 $\mathrm{Var}(\hat{\varepsilon}_i) = \sigma_i^2 (1 - h_{ii})$ 的事实，在异方差存在时提供无偏估计。
HC3：使用 $\frac{\hat{\varepsilon}_i^2}{(1 - h_{ii})^2}$ ，由Davidson和MacKinnon（1993）提出。这一修正近似于Jackknife估计，对高杠杆点特别敏感，在小样本中表现优异。Angrist和Pischke（2009）在《Mostly Harmless Econometrics》中推荐在实际应用中优先使用HC3。

模拟研究表明，在样本量达到500以上时，各修正版本之间的差异通常可以忽略。但在常见的中等样本（ $n = 50 \sim 200$ ）研究情境中，HC3或至少HC2应优先于HC0或HC1。

Huber-White估计量的推广与拓展

Huber-White估计量的影响力远远超出了基本的横截面回归模型。以下是一些重要的推广：

聚类稳健标准误 (Cluster-Robust Standard Errors)

当数据具有集群结构（Cluster Structure），例如同一学校内的学生、同一年份内的企业或同一地域内的居民，误差项不仅可能异方差，还可能组内相关。Liang和Zeger（1986）将三明治估计量推广至广义估计方程（GEE）框架，提出聚类稳健标准误：

\widehat{\mathrm{Var}}_{\text{cluster}}(\hat{\beta}) = (X'X)^{-1} \left( \sum_{g=1}^{G} X_g' \hat{\varepsilon}_g \hat{\varepsilon}_g' X_g \right) (X'X)^{-1}

其中 $g$ 代表聚类， $X_g$ 和 $\hat{\varepsilon}_g$ 分别为第 $g$ 个聚类对应的自变量子矩阵和残差向量。这一估计量允许组内存在任意形式的异方差和相关性，仅要求组数 $G$ 足够大。Bertrand、Duflo和Mullainathan（2004）在关于双重差分法的经典论文中，特别强调了聚类稳健标准误在面板数据设定中的关键作用。

时间序列中的HAC估计量

在时间序列环境中，误差项不仅可能存在异方差，还可能存在自相关。Newey和West（1987）提出了异方差自相关一致估计量（Heteroskedasticity and Autocorrelation Consistent, HAC），将三明治框架拓展至时间序列数据。其核心修改在于中间的"肉"部分：

\hat{S} = \sum_{i=1}^{n} \hat{\varepsilon}_i^2 X_i X_i' + \sum_{l=1}^{L} w_l \sum_{t=l+1}^{n} \hat{\varepsilon}_t \hat{\varepsilon}_{t-l} (X_t X_{t-l}' + X_{t-l} X_t')

其中 $w_l$ 是核权重（如Bartlett核）， $L$ 是截断滞后阶数。这一估计量在宏观计量经济学中已成为标准工具。

工具变量法与GMM中的Huber-White估计

在工具变量法（IV）和广义矩估计（GMM）中，Huber-White估计量同样发挥着核心作用。对于IV估计量 $\hat{\beta}_{\mathrm{IV}} = (Z'X)^{-1} Z'Y$ ，其稳健方差估计为：

\widehat{\mathrm{Var}}_{\mathrm{IV}}(\hat{\beta}) = (Z'X)^{-1} \left( \sum_{i=1}^{n} \hat{\varepsilon}_i^2 Z_i Z_i' \right) (X'Z)^{-1}

在过度识别的GMM框架下，Hansen（1982）的J检验正是基于三明治方差矩阵构造的。

在实证研究中的应用指南

基于Huber-White估计量的广泛应用和现有计量经济学文献，以下实践建议值得注意：

第一，在横截面数据分析中，应始终报告稳健标准误，无论是否怀疑异方差的存在。正如Angrist和Pischke（2009）所言："在今天的实证研究中，报告同方差标准误而非稳健标准误，需要特殊的理由。"这一立场已成为当代实证经济学的主流共识。

第二，在报告稳健标准误时，应明确告知读者使用的是哪种修正版本（HC0-HC3），并最好说明选择理由。不同版本的有限样本表现差异在实际决策中可能具有实质性影响。

第三，当样本量较小（如 $n < 50$ 或组数 $G < 20$ ）时，稳健标准误的有限样本表现可能不令人满意。此时，自举法（Bootstrap）——特别是百分位数自举或学生化自举——可作为替代或补充。

第四，在面板数据中，应同时考虑在个体维度和时间维度上的聚类。Thompson（2011）和Cameron、Gelman、Miller（2011）分别提出了双向聚类稳健标准误（Two-Way Cluster-Robust Standard Errors），允许误差在两个维度上同时相关。

历史意义与局限

Huber-White估计量对实证经济学的贡献是变革性的。在此之前，异方差性往往导致研究者放弃OLS转而寻求复杂的参数方法，或在不恰当的假设下冒险进行推断。三明治估计量的出现使研究者能够"在异方差的阴影下依然保持一致推断"（White, 1980），这极大地扩展了OLS的实用范围。

然而，Huber-White估计量并非万能。其核心局限性包括：首先，它是大样本工具，在小样本中表现不佳，即使采用HC3修正也仅能部分缓解问题。其次，在存在弱工具变量或错误设定的模型结构下，稳健标准误的稳健性本身也会受损。第三，三明治估计量对稀有事件或极端权重的观察值敏感，可能在某些情况下导致推断失误。

综上所述，Huber-White估计量是现代实证计量经济学工具箱中不可或缺的组成部分。它将标准误估计从对误差项分布假设的依赖中解放出来，使推断更加可靠和可信。结合适当的有限样本修正和稳健性检验，研究者可以在面对未知异方差结构时，仍然对回归系数的统计显著性做出可靠的判断。正如Halbert White本人所指出的，这一方法的真正价值在于它"在不知道 $\Omega$ 的真实形式时，仍能正确地估计 $\hat{\beta}$ 的方差"，从而将计量经济学的实践基础从"正确设定误差结构"转向了"稳健推断"这一更为坚实的基石。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。