ARTICLE

怀特检验 (White Test)

怀特检验 (White Test) 概述 怀特检验(White Test),又称怀特一般异方差性检验(White's General Heteroscedasticity Test),是由美国计量经济学家Halbert White于1980年提出的一种用于检验线性回归模型中误差项是否存在异方差性(heteroscedasticity)的统计方法。与Breus

浏览 0 更新 2025-10-26

怀特检验 (White Test)

概述

怀特检验(White Test),又称怀特一般异方差性检验(White's General Heteroscedasticity Test),是由美国计量经济学家Halbert White于1980年提出的一种用于检验线性回归模型中误差项是否存在异方差性(heteroscedasticity)的统计方法。与Breusch-Pagan检验等早期方法相比,怀特检验的一个显著优点是不需要对异方差的具体函数形式作任何先验假定,因此是一种一般性检验(general test)。

怀特检验在实证经济学、金融学以及社会科学领域得到了极为广泛的应用,是回归诊断中的标准工具之一。通常与Huber-White稳健标准误(又称异方差稳健标准误)配合使用:先用怀特检验诊断异方差性,若检验结果显著,则采用Huber-White标准误进行统计推断。

理论背景

异方差性的定义

考虑经典线性回归模型:

yi=xiβ+εi,i=1,2,,ny_i = \mathbf{x}_i'\boldsymbol{\beta} + \varepsilon_i, \quad i = 1, 2, \dots, n

其中 xi \mathbf{x}_i k×1 k \times 1 的解释变量向量,β \boldsymbol{\beta} 是参数向量。高斯-马尔可夫定理(Gauss-Markov Theorem)成立的条件之一是同方差性(homoscedasticity):

Var(εixi)=σ2,i\mathrm{Var}(\varepsilon_i \mid \mathbf{x}_i) = \sigma^2, \quad \forall i

当此条件被违反时,即 Var(εixi)=σi2 \mathrm{Var}(\varepsilon_i \mid \mathbf{x}_i) = \sigma_i^2 i i 而变化,则称模型存在异方差性(heteroscedasticity)。

异方差性的后果

异方差性本身不会导致OLS估计量有偏或不一致,但会产生以下严重后果:

  1. OLS估计量不再有效(不再具有最小方差性),存在更优的加权最小二乘估计量。
  2. 标准误估计量有偏,从而导致基于t检验、F检验的统计推断失效。
  3. 在存在异方差的情况下,通常的置信区间和假设检验结果不再可信。

White (1980) 的贡献

White (1980) 在《Econometrica》上发表了经典论文《A Heteroskedasticity-Consistent Covariance Matrix Estimator and a Direct Test for Heteroskedasticity》,同时提出了两样工具:

  • 异方差稳健协方差矩阵估计量(即现在通称的Huber-White标准误异方差稳健标准误)。
  • 用于检测异方差性的怀特一般性检验

怀特检验的基本原理

怀特检验的核心思想十分直观:如果模型不存在异方差,那么OLS残差的平方(作为 σi2 \sigma_i^2 的代理变量)不应与解释变量、解释变量的平方以及交叉乘积项之间存在系统性的相关关系。反之,如果残差平方能够被这些项显著地解释,则拒绝同方差的原假设。

检验步骤

步骤一:估计原模型并进行OLS回归

估计原始回归模型:

yi=β0+β1x1i+β2x2i++βkxki+εiy_i = \beta_0 + \beta_1 x_{1i} + \beta_2 x_{2i} + \dots + \beta_k x_{ki} + \varepsilon_i

获得OLS残差 ε^i=yixiβ^ \hat{\varepsilon}_i = y_i - \mathbf{x}_i'\hat{\boldsymbol{\beta}}

步骤二:构造辅助回归

以残差平方 ε^i2 \hat{\varepsilon}_i^2 为被解释变量,以原始解释变量、所有解释变量的平方项以及所有两两交叉乘积项为解释变量,建立辅助回归方程:

ε^i2=α0+α1x1i++αkxki+αk+1x1i2++α2kxki2+p<qγpqxpixqi+vi\hat{\varepsilon}_i^2 = \alpha_0 + \alpha_1 x_{1i} + \dots + \alpha_k x_{ki} + \alpha_{k+1} x_{1i}^2 + \dots + \alpha_{2k} x_{ki}^2 + \sum_{p < q} \gamma_{pq} x_{pi} x_{qi} + v_i

其中 vi v_i 为辅助回归的随机误差项。

步骤三:计算检验统计量

怀特检验的统计量有两种等价形式:

(a) LM形式(拉格朗日乘子形式):

White统计量=nRaux2\text{White统计量} = n \cdot R^2_{\text{aux}}

其中 n n 为样本容量,Raux2 R^2_{\text{aux}} 为辅助回归的判定系数。在原假设(同方差)下,该统计量渐近服从自由度为 p p 的卡方分布 χ2(p) \chi^2(p) ,其中 p p 为辅助回归中除常数项以外的解释变量个数。

(b) F形式:

辅助回归的F统计量也可用于检验,但通常以LM形式更为常用。

步骤四:做出判断

给定显著性水平 α \alpha (通常取0.05或0.01),查卡方分布临界值 χα2(p) \chi^2_{\alpha}(p)

  • nRaux2>χα2(p) n \cdot R^2_{\text{aux}} > \chi^2_{\alpha}(p) ,则拒绝原假设,认为存在异方差性。
  • 否则,不拒绝同方差的原假设。

检验的简化形式

当原始模型的解释变量较多时,辅助回归中的项数会迅速膨胀。例如,若有 k=5 k = 5 个解释变量,辅助回归将包含 1+5+5+C(5,2)=1+5+5+10=21 1 + 5 + 5 + C(5,2) = 1 + 5 + 5 + 10 = 21 个解释变量(含常数项),自由度损失严重。为此,实践中常采用无交叉项版本(White test without cross terms),即辅助回归中只保留解释变量的一次项和平方项,省略交叉乘积项:

ε^i2=α0+α1x1i++αkxki+αk+1x1i2++α2kxki2+vi\hat{\varepsilon}_i^2 = \alpha_0 + \alpha_1 x_{1i} + \dots + \alpha_k x_{ki} + \alpha_{k+1} x_{1i}^2 + \dots + \alpha_{2k} x_{ki}^2 + v_i

此时辅助回归的解释变量个数为 2k 2k (不含常数项),检验的自由度为 2k 2k

怀特检验与Breusch-Pagan检验的关系

Breusch-Pagan (BP) 检验是另一种常用的异方差检验方法,二者有密切联系但也有重要区别:

  • 对异方差形式的假设:怀特检验无特定形式假设(一般性);BP检验需指定异方差的函数形式。
  • 辅助回归的解释变量:怀特检验含平方项与交叉项;BP检验通常只含一次项。
  • 自由度消耗:怀特检验较多(大模型时可能过大);BP检验较少。
  • 检验效力:怀特检验对多种异方差形式均有检测力;BP检验对特定形式检测力更强。
  • 小样本性质:两者均为渐近检验,小样本可能偏误。

实际上,怀特检验可以视为BP检验的一般化版本。当辅助回归中仅包含原始解释变量的一次项时,怀特检验退化为BP检验。因此,怀特检验更具一般性,但也因消耗更多自由度而在小样本下的检验功效(power)可能低于BP检验。

辅助回归中解释变量的计数

设原始模型有 k k 个解释变量(不含常数项),则:

  • 含交叉项的怀特检验:辅助回归除常数项外共有 k+k+k(k1)2=k(k+3)2 k + k + \frac{k(k-1)}{2} = \frac{k(k+3)}{2} 个解释变量。
  • 无交叉项的怀特检验:辅助回归除常数项外共有 k+k=2k k + k = 2k 个解释变量。

例如,当 k=3 k = 3 时,完整检验的辅助回归有 3+3+3=9 3 + 3 + 3 = 9 个解释变量;当 k=10 k = 10 时,完整检验有 10+10+45=65 10 + 10 + 45 = 65 个解释变量,这对于中等样本容量(如 n=100 n = 100 )来说显然过多。

怀特检验的假设条件与局限

假设条件

  1. 原始模型为线性回归模型(含常数项)。
  2. 样本独立同分布(i.i.d.),或至少满足某种渐近独立条件。
  3. 模型设定正确(无遗漏变量、无函数形式误设)。
  4. 辅助回归中的解释变量之间不存在完全多重共线性。

局限性与注意事项

  1. 检验是一种联合检验:怀特检验的原假设是同方差,但拒绝原假设时,只能说明存在某种形式的异方差性,无法告知异方差的具体结构。
  1. 对模型设定错误敏感:如果原始模型存在遗漏变量或函数形式误设(如遗漏了二次项),怀特检验可能会因模型设定偏误而错误地拒绝同方差原假设。因此,在解释检验结果时需谨慎——显著的结果可能反映的是异方差性,也可能是模型设定问题。
  1. 小样本性质欠佳:怀特检验是渐近检验,在小样本下其真实显著性水平可能偏离名义水平。特别是在辅助回归中包含大量解释变量时,检验的功效(power)会显著下降。Greene (2018) 建议当样本量 n<100 n < 100 时慎用完整形式的怀特检验。
  1. 自由度消耗过多:k k 较大而 n n 不够大时,辅助回归可能因自由度不足而导致估计不可靠。此时应使用无交叉项的简化形式,或改用其他检验方法(如BP检验、Goldfeld-Quandt检验等)。
  1. 不适用于纯虚拟变量模型:当所有解释变量均为虚拟变量时,怀特检验可能不适用,因为平方项与原始变量完全共线性。

软件实现与操作

Stata

在Stata中,完成OLS回归后直接使用 \texttt{estat imtest, white} 命令:

regress y x1 x2 x3
estat imtest, white

Stata默认报告的是无交叉项的怀特检验结果,并同时给出LM统计量和对应的p值。

R

在R中,可使用 \texttt{lmtest} 包中的 \texttt{bptest} 函数并通过设置辅助回归形式来实现:

library(lmtest)
model <- lm(y \~ x1 + x2 + x3, data = dat)
\section{完整形式的怀特检验(含交叉项和平方项)}
bptest(model, \~ x1*x2*x3 + I(x1^2) + I(x2^2) + I(x3^2), data = dat)
\section{简化形式的怀特检验(仅含平方项)}
bptest(model, \~ x1 + x2 + x3 + I(x1^2) + I(x2^2) + I(x3^2), data = dat)

Python (Statsmodels)

import statsmodels.api as sm
from statsmodels.stats.diagnostic import het\_white

model = sm.OLS(y, sm.add\_constant(X)).fit()
white\_test = het\_white(model.resid, model.model.exog)
print(f"LM Statistic: {white\_test[0]}")
print(f"LM p-value: {white\_test[1]}")

\texttt{het\_white} 函数默认使用包含交叉项的完整形式,并同时返回LM统计量和F统计量及其对应的p值。

怀特检验的应用实例

假设我们研究工资决定模型:

log(wagei)=β0+β1educi+β2experi+β3tenurei+εi\log(\text{wage}_i) = \beta_0 + \beta_1 \text{educ}_i + \beta_2 \text{exper}_i + \beta_3 \text{tenure}_i + \varepsilon_i

使用某调查数据(n=526 n = 526 )进行OLS估计后,我们怀疑不同教育水平和经验水平的个体其工资方差不同(即存在异方差性)。运行怀特检验(含交叉项):

  • 辅助回归:ε^i2 \hat{\varepsilon}_i^2 对 educ, exper, tenure, educ^2, exper^2, tenure^2 以及两两交叉项进行回归。
  • 得到 Raux2=0.1023 R^2_{\text{aux}} = 0.1023 n=526 n = 526
  • LM统计量 = 526×0.1023=53.81 526 \times 0.1023 = 53.81
  • 辅助回归解释变量个数 p=9 p = 9
  • 查表得 χ0.052(9)=16.92 \chi^2_{0.05}(9) = 16.92
  • 由于 53.81>16.92 53.81 > 16.92 ,拒绝同方差原假设,认为模型中存在异方差性。

此时应使用Huber-White稳健标准误重新计算标准误并进行统计推断。

怀特检验的扩展与相关概念

怀特检验与模型设定检验

由于怀特检验对模型的函数形式误设也敏感,一些计量经济学家将其用作模型设定检验(specification test)的辅助工具。如果怀特检验显著,且研究者通过残差图、偏回归图等工具排除了模型设定错误的可能性,则可以较为确信地判定存在异方差性。

异方差稳健推断框架

怀特检验是异方差稳健推断(heteroscedasticity-robust inference)这一现代计量经济学范式的重要组成部分。该范式的核心思想是:不再将异方差视为需要修正的问题,而是通过使用稳健标准误来获得正确的推断结果。在这一框架下,怀特检验的作用是诊断异方差的严重程度,而非决定是否使用稳健标准误——部分学者(如Angrist \& Pischke, 2009)建议在实证研究中直接报告稳健标准误,而不必事先进行异方差检验。

修正的怀特检验

一些学者提出了怀特检验的小样本修正版本。例如,Davidson \& MacKinnon (1993) 建议使用辅助回归的F检验形式而非渐近卡方形式,因为在有限样本下F检验具有更好的尺寸性质(size properties)。

总结

怀特检验是计量经济学中检测异方差性最常用的方法之一,其核心优势在于检测的一般性——无需对异方差的函数形式做先验假设。然而,这一优势也伴随着自由度消耗较多的代价,在使用时应注意样本容量与模型复杂度的匹配。

在实践中,推荐以下操作流程:

  1. 完成OLS回归后,使用怀特检验(必要时采用无交叉项简化版本)检测异方差性。
  2. 若检验显著,使用Huber-White稳健标准误进行后续统计推断。
  3. 如果样本容量较小(n<100 n < 100 ),谨慎使用完整形式的怀特检验,可考虑使用BP检验或Goldfeld-Quandt检验作为补充。
  4. 结合残差图等可视化工具综合判断异方差的存在性。

怀特检验的问世极大地推动了异方差性诊断与稳健推断的发展,是Halbert White对计量经济学的重要贡献之一,至今仍是实证研究中的标准诊断工具。

参考文献

  • White, H. (1980). A Heteroskedasticity-Consistent Covariance Matrix Estimator and a Direct Test for Heteroskedasticity. Econometrica, 48(4), 817-838.
  • Greene, W. H. (2018). Econometric Analysis (8th ed.). Pearson.
  • Wooldridge, J. M. (2019). Introductory Econometrics: A Modern Approach (7th ed.). Cengage Learning.
  • Davidson, R., \& MacKinnon, J. G. (1993). Estimation and Inference in Econometrics. Oxford University Press.
  • Angrist, J. D., \& Pischke, J.-S. (2009). Mostly Harmless Econometrics: An Empiricist's Companion. Princeton University Press.
  • Breusch, T. S., \& Pagan, A. R. (1979). A Simple Test for Heteroscedasticity and Random Coefficient Variation. Econometrica, 47(5), 1287-1294.