ARTICLE

异方差-稳健标准误

异方差-稳健标准误 (Heteroskedasticity-Robust Standard Errors) 异方差-稳健标准误,又称异方差一致标准误(Heteroskedasticity-Consistent Standard Errors, HCSE)或 White 标准误,是一类在回归分析误差项存在未知形式异方差时仍能给出有效统计推断的标准误估计方法。该

浏览 4 更新 2026-07-20

异方差-稳健标准误 (Heteroskedasticity-Robust Standard Errors)

异方差-稳健标准误,又称异方差一致标准误(Heteroskedasticity-Consistent Standard Errors, HCSE)或 White 标准误,是一类在回归分析误差项存在未知形式异方差时仍能给出有效统计推断的标准误估计方法。该方法由 Halbert White 于1980年在《Econometrica》上发表的开创性论文中提出,是当代应用计量经济学中被最广泛使用的推断工具之一。

异方差问题与OLS标准误的失效

在经典普通最小二乘法(OLS)框架下,线性回归模型为:

yi=xiβ+εi,i=1,,ny_i = \mathbf{x}_i' \boldsymbol{\beta} + \varepsilon_i, \quad i = 1, \ldots, n

OLS 估计量 β^=(XX)1Xy\hat{\boldsymbol{\beta}} = (\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{y} 的方差-协方差矩阵在同方差假设 Var(εixi)=σ2\operatorname{Var}(\varepsilon_i \mid \mathbf{x}_i) = \sigma^2 下为:

Var(β^X)=σ2(XX)1\operatorname{Var}(\hat{\boldsymbol{\beta}} \mid \mathbf{X}) = \sigma^2 (\mathbf{X}'\mathbf{X})^{-1}

但当误差项存在异方差,即 Var(εixi)=σi2\operatorname{Var}(\varepsilon_i \mid \mathbf{x}_i) = \sigma_i^2σi2\sigma_i^2 随观测个体变化时,OLS 估计量仍保持一致性无偏性,但上述标准方差公式不再成立。此时真实的方差为:

Var(β^X)=(XX)1XΣX(XX)1\operatorname{Var}(\hat{\boldsymbol{\beta}} \mid \mathbf{X}) = (\mathbf{X}'\mathbf{X})^{-1} \mathbf{X}' \boldsymbol{\Sigma} \mathbf{X} (\mathbf{X}'\mathbf{X})^{-1}

其中 Σ=diag(σ12,,σn2)\boldsymbol{\Sigma} = \operatorname{diag}(\sigma_1^2, \ldots, \sigma_n^2)。继续使用同方差假定下的标准误将导致假设检验失效:t 统计量和 F 统计量不再服从其标称分布,置信区间的覆盖率偏离名义水平,可能产生虚假的统计显著性。问题的关键在于 Σ\boldsymbol{\Sigma} 中的 nn 个未知方差无法从 nn 个观测中直接估计——这正是 White(1980)的核心突破所解决的问题。

White 异方差一致估计量

White 的关键洞见在于:尽管 σi2\sigma_i^2 本身不可单独识别,但不需要估计完整的 Σ\boldsymbol{\Sigma} 矩阵——只需估计 k×kk \times k 矩阵 XΣX=i=1nσi2xixi\mathbf{X}'\boldsymbol{\Sigma}\mathbf{X} = \sum_{i=1}^n \sigma_i^2 \mathbf{x}_i \mathbf{x}_i'。用 OLS 残差平方 ε^i2\hat{\varepsilon}_i^2 作为 σi2\sigma_i^2 的替代,可得:

Var^HC0(β^)=(XX)1(i=1nε^i2xixi)(XX)1\widehat{\operatorname{Var}}_{\text{HC0}}(\hat{\boldsymbol{\beta}}) = (\mathbf{X}'\mathbf{X})^{-1} \left( \sum_{i=1}^n \hat{\varepsilon}_i^2 \mathbf{x}_i \mathbf{x}_i' \right) (\mathbf{X}'\mathbf{X})^{-1}

该估计量称为 HC0,是最基础的异方差一致协方差矩阵估计量。在大样本下,HC0 是 Var(β^X)\operatorname{Var}(\hat{\boldsymbol{\beta}} \mid \mathbf{X}) 的一致估计,不依赖于异方差的具体函数形式,因此被称为"非参数"或"完全稳健"的方法。

HC0 至 HC3:有限样本修正

由于 HC0 在有限样本下存在向下的偏误(倾向于低估标准误),文献中发展出若干修正版本:

  • HC1(MacKinnon-White, 1985):将 HC0 乘以 nnk\frac{n}{n - k} 进行自由度校正,等价于将 ε^i2\hat{\varepsilon}_i^2 替换为 nnkε^i2\frac{n}{n-k}\hat{\varepsilon}_i^2。HC1 是 Stata 中 \texttt{reg, robust} 的默认设定。
  • HC2:将 ε^i2\hat{\varepsilon}_i^2 替换为 ε^i21hii\frac{\hat{\varepsilon}_i^2}{1 - h_{ii}},其中 hii=xi(XX)1xih_{ii} = \mathbf{x}_i'(\mathbf{X}'\mathbf{X})^{-1}\mathbf{x}_i杠杆值。此修正来自经典线性模型中 Var(ε^i)=σi2(1hii)\operatorname{Var}(\hat{\varepsilon}_i) = \sigma_i^2(1 - h_{ii}) 的启发。
  • HC3:以 ε^i2(1hii)2\frac{\hat{\varepsilon}_i^2}{(1 - h_{ii})^2} 替代 ε^i2\hat{\varepsilon}_i^2,近似于刀切法(jackknife)估计量。HC3 在有限样本下的偏误最小,尤其在小样本和存在高杠杆观测的情形下表现最优,被 MacKinnon 和 Long 等学者推荐为默认选择。

各版本在小样本下的优劣取决于样本量和杠杆值分布。模拟研究表明,n<250n < 250 时 HC3 最为可靠;大样本下各版本差异缩小。

聚类稳健标准误

当数据在组内相关时——如面板数据中同一横截面个体跨期的误差项相关、或抽样调查中同一群组内的个体相关——异方差稳健标准误不足以处理组内相关。此时需要聚类稳健标准误(Cluster-Robust Standard Errors):

Var^cluster(β^)=(XX)1(g=1GXgε^gε^gXg)(XX)1\widehat{\operatorname{Var}}_{\text{cluster}}(\hat{\boldsymbol{\beta}}) = (\mathbf{X}'\mathbf{X})^{-1} \left( \sum_{g=1}^G \mathbf{X}_g' \hat{\boldsymbol{\varepsilon}}_g \hat{\boldsymbol{\varepsilon}}_g' \mathbf{X}_g \right) (\mathbf{X}'\mathbf{X})^{-1}

其中 g=1,,Gg = 1, \ldots, G 索引聚类(如省份、学校、家庭)。该估计量允许同一聚类内任意形式的误差相关,仅要求聚类间相互独立。聚类数量 GG 需足够大(通常要求 G50G \ge 50)以保证推断有效性;聚类数量过少时标准误严重下偏,需使用 Wild bootstrap 等替代方法。在面板数据的双维聚类情形中,Cameron、Gelbach 和 Miller(2011)提出的双维聚类同时允许个体维度和时间维度的相关性,例如对上市公司面板数据同时按公司和年份聚类。此外,当回归变量在聚类层面变化时(如州级政策变量与个体微观数据),聚类稳健标准误尤为关键——此时若忽略组内相关,标准误将被严重低估,t 统计量膨胀,导致过度拒绝零假设。

与加权最小二乘法的关系

当异方差的形式已知或可参数化时,广义最小二乘法(GLS)或加权最小二乘法(WLS)是最有效的方法:对高方差观测赋予较小权重,直接修正异方差。然而在实际应用中,异方差的具体形式几乎从不确切可知。White 标准误的核心优势在于无需对异方差形式做任何假设——研究者无需猜测 σi2\sigma_i^2 的结构,即可获得有效的标准误。这一特性使稳健标准误成为现代实证研究的标配,也是Angrist-Pischke意义上"可信度革命"的方法论基石之一——它降低了推断对模型假设的敏感性。

但需注意,稳健标准误的效率低于正确指定的 WLS:当异方差确实严重时,使用稳健标准误的 OLS 虽然推断有效,但估计量本身并非最有效。特别是当异方差与解释变量强相关时,OLS 与 WLS 的效率差距可能相当显著,即使用稳健标准误也无法挽回估计精度的损失——这类似于在已知各观测精度不同的情况下仍坚持等权平均,虽然"推断正确"但资源利用不尽合理。此外,稳健标准误不能替代对模型设定的审慎考量——遗漏变量、函数形式误设等问题仍会导致估计不一致,此时无论标准误如何"稳健"都无法挽救一个有偏的估计量。

实证实践与使用建议

当前实证研究中,"robust standard errors"已成为默认报告项。主流统计软件均提供简便的实现方式:Stata 中使用 \texttt{reg y x, robust}(对应 HC1)或 \texttt{reg y x, vce(hc3)};R 中 \texttt{sandwich} 包的 \texttt{vcovHC()} 函数配合 \texttt{lmtest} 包的 \texttt{coeftest()} 使用;Python 中 \texttt{statsmodels} 的 \texttt{fit(cov\_type='HC3')} 选项。使用建议为:

  1. 报告 HC1 或 HC3 标准误,尤其当样本量不特别大时优先 HC3。
  2. 当数据结构包含群组或面板维度时,使用聚类稳健标准误替代简单异方差稳健标准误。
  3. 异方差稳健标准误并不能修正模型设定错误,仅解决推断层面的方差估计问题;结合Ramsey RESET等设定检验进行模型诊断。
  4. 在样本量较小(n<100n < 100)时,稳健标准误的有限样本表现可能不佳,需审慎使用,必要时结合 Wild bootstrap 等方法进行推断。

自 White(1980)发表以来,异方差-稳健标准误已从理论创新演变为实证研究的标准配置,深刻改变了应用经济学的研究范式,使得可靠的统计推断不再依赖于严苛且通常不现实的同方差假设。Halbert White 本人也因其在异方差稳健推断及拟最大似然估计等领域的贡献,深刻塑造了现代计量经济学的面貌。稳健标准误的普及意味着实证研究者不再因担心异方差而被迫采用复杂的变换或非参数方法——一条简洁的代码行即可确保推断的基本可靠性。但正如 White 本人所强调的,稳健标准误解决的只是方差估计的稳健性,而非模型设定的一致性;工具只是开始,而非终点。