ARTICLE

怀特检验

怀特检验(White's test)是由著名计量经济学家哈尔伯特·怀特(Halbert White)于1980年在《Econometrica》发表的经典论文中提出的一种用于检验回归模型中误差项是否存在异方差性的统计诊断方法。它是现代计量经济学实证研究中最常用的异方差检验工具之一,因其无需预先设定异方差的具体函数形式、适用范围广泛而被各国研究者普遍采用。 背景

浏览 3 更新 2025-10-26

怀特检验(White's test)是由著名计量经济学家哈尔伯特·怀特(Halbert White)于1980年在《Econometrica》发表的经典论文中提出的一种用于检验回归模型中误差项是否存在异方差性的统计诊断方法。它是现代计量经济学实证研究中最常用的异方差检验工具之一,因其无需预先设定异方差的具体函数形式、适用范围广泛而被各国研究者普遍采用。

背景与动机

在经典线性回归模型(Classical Linear Regression Model, CLRM)的基本假定中,误差项同方差(homoscedasticity)是高斯-马尔可夫定理(Gauss-Markov Theorem)成立的核心条件之一。同方差假定要求误差项 εi \varepsilon_i 的条件方差在所有观测值上保持恒定,即 Var(εiX)=σ2 \mathrm{Var}(\varepsilon_i | X) = \sigma^2 。当这一假定被违反时,误差项的方差随解释变量的取值变化而不同,就出现了异方差性(heteroscedasticity)。

异方差性在横截面数据(cross-sectional data)中尤为常见,例如研究家庭消费支出时,高收入家庭的消费波动通常远大于低收入家庭。异方差性虽然不会导致OLS估计量有偏或不一致(仍保持无偏性和一致性),但会使OLS估计量的方差估计不再准确,标准误产生偏差,进而导致t统计量、F统计量以及相应的置信区间失效。传统的补救方法是加权最小二乘法(WLS),但WLS需要知道异方差的具体结构,这在实践中往往难以实现。怀特检验正是为这一问题提供了一种不依赖异方差具体形式的通用诊断方法。

检验原理

怀特检验的核心思想十分直观:如果存在异方差性,那么误差项的方差应与某些解释变量或其函数形式存在相关性。因此,可以通过将OLS回归获得的残差平方对原始解释变量及其平方项和交叉项进行辅助回归,再检验该辅助回归的整体显著性,从而间接判断异方差是否存在。

具体步骤

第一步:估计原模型。 对于多元线性回归模型:

yi=β0+β1x1i+β2x2i++βkxki+εiy_i = \beta_0 + \beta_1 x_{1i} + \beta_2 x_{2i} + \cdots + \beta_k x_{ki} + \varepsilon_i

使用普通最小二乘法(OLS)进行估计,得到残差序列 ε^i=yiy^i \hat{\varepsilon}_i = y_i - \hat{y}_i

第二步:构建辅助回归方程。 将残差平方 ε^i2 \hat{\varepsilon}_i^2 作为被解释变量,对所有解释变量、各解释变量的平方项以及所有两两交叉项进行回归:

ε^i2=α0+j=1kγjxji+j=1kδjxji2+j=1k1l=j+1kθjlxjixli+νi\hat{\varepsilon}_i^2 = \alpha_0 + \sum_{j=1}^{k} \gamma_j x_{ji} + \sum_{j=1}^{k} \delta_j x_{ji}^2 + \sum_{j=1}^{k-1} \sum_{l=j+1}^{k} \theta_{jl} x_{ji} x_{li} + \nu_i

这一辅助回归之所以包含平方项和交叉项,是为了捕捉异方差可能存在的各种非线性模式。

第三步:计算LM检验统计量。 怀特检验使用拉格朗日乘数(LM)形式的统计量:

LM=nRaux2\mathrm{LM} = n \cdot R^2_{\text{aux}}

其中 n n 为样本容量,Raux2 R^2_{\text{aux}} 为辅助回归的拟合优度。在原假设(同方差)下,该统计量渐近服从自由度为 p p 的卡方分布,即 LMχ(p)2 \mathrm{LM} \sim \chi^2_{(p)} ,其中 p p 为辅助回归中除截距项外的解释变量个数。

第四步:统计推断。 将计算得到的 LM \mathrm{LM} 统计量与给定显著性水平(如5\%)下卡方分布的临界值进行比较。若 LM>χ0.052(p) \mathrm{LM} > \chi^2_{0.05}(p) ,则拒绝同方差的原假设,认为模型存在异方差性。反之,则没有充分证据拒绝同方差假定。

软件实现

怀特检验在主流统计软件中均有便捷实现。在EViews中,运行OLS回归后依次点击"View → Residual Diagnostics → Heteroskedasticity Tests",在弹出的对话框中选择"White"即可输出检验结果,并可以选择是否包含交叉项。在R语言中,\texttt{lmtest}包的\texttt{bptest()}函数可执行怀特检验,设置参数\texttt{studentize = FALSE}即得到原始怀特检验统计量。Python用户可使用\texttt{statsmodels.stats.diagnostic.het\_white(resid, exog)}函数,直接返回LM统计量、p值、F统计量及F检验p值。Stata中则在回归后输入\texttt{estat imtest, white}命令即可。

优缺点与注意事项

主要优点: 怀特检验的最大优势在于其通用性和灵活性。它不需要研究者对异方差的具体形式做出任何先验假设,能够有效检测线性、非线性及混合形式的异方差性。这一特性使其在实证经济学、金融学和社会科学领域得到了极为广泛的应用。

主要局限性: 第一,当模型包含较多解释变量时,辅助回归中平方项和交叉项的数量呈二次型增长(若包含 k k 个解释变量,辅助回归项数可达 k(k+3)/2 k(k+3)/2 ),导致自由度迅速消耗。针对这一问题,实践中常采用"无交叉项"(omit cross terms)的简化版本,仅保留解释变量及其平方项。第二,怀特检验是渐近检验,在小样本(如 n<100 n < 100 )情况下检验功效可能偏低,且容易产生尺寸扭曲(size distortion)。第三,检验结果仅能告知是否存在异方差,无法揭示异方差的具体结构。第四,怀特检验对模型设定误差(如遗漏变量、函数形式错误)较为敏感——模型设定偏差很可能被误判为异方差。

与Breusch-Pagan检验的关系

布罗施—帕甘检验(Breusch-Pagan test)是另一种经典异方差检验方法,由Breusch和Pagan于1979年提出。两者本质区别在于辅助回归的设定:Breusch-Pagan检验的辅助回归仅包含解释变量本身(即 ε^i2 \hat{\varepsilon}_i^2 x1,x2,,xk x_1, x_2, \dots, x_k 回归),而怀特检验在此基础上加入了平方项和交叉项。因此,怀特检验可视为Breusch-Pagan检验的一般化形式——当异方差仅与解释变量的线性组合相关时,两者功效相当;但当异方差涉及非线性关系时,怀特检验更具优势。

怀特异方差一致标准误

值得一提的是,怀特在提出异方差检验方法的同时,也给出了异方差一致标准误估计量(Heteroskedasticity-Consistent Covariance Matrix Estimator, HCCME),即通常所称的"怀特标准误"(White standard errors)或"稳健标准误"(robust standard errors)。该估计量的核心思想是在不改变OLS系数估计值的前提下,对系数协方差矩阵进行校正,使其在异方差下仍保持一致估计。在实证研究中,许多学者将怀特检验与怀特标准误配合使用:先通过怀特检验诊断异方差性,若发现存在异方差,则直接报告基于怀特标准误的统计推断结果,而不必改用WLS重新估计模型。这一方法因其简便性和稳健性,已成为现代实证经济学论文的标准实践之一。

参考文献

  • White, H. (1980). A Heteroskedasticity-Consistent Covariance Matrix Estimator and a Direct Test for Heteroskedasticity. *Econometrica*, 48(4), 817–838.
  • Wooldridge, J. M. (2016). *Introductory Econometrics: A Modern Approach* (6th ed.). Cengage Learning.
  • Greene, W. H. (2018). *Econometric Analysis* (8th ed.). Pearson.
  • 陈强 (2014). 《高级计量经济学及Stata应用》(第二版). 高等教育出版社.
  • 李子奈、潘文卿 (2020). 《计量经济学》(第五版). 高等教育出版社.