ARTICLE

Durbin–Wu–Hausman检验

Durbin–Wu–Hausman 检验 (Durbin–Wu–Hausman Test) Durbin–Wu–Hausman 检验(简称 DWH 检验或 Hausman 检验)是 计量经济学 (Econometrics) 中用于判断 解释变量 是否与 误差项 存在 相关性 的经典 统计检验 方法。该检验由三位计量经济学家独立发展而成:James Durbi

浏览 1 更新 2026-07-11

Durbin–Wu–Hausman 检验 (Durbin–Wu–Hausman Test)

Durbin–Wu–Hausman 检验(简称 DWH 检验或 Hausman 检验)是 计量经济学 (Econometrics) 中用于判断 解释变量 是否与 误差项 存在 相关性 的经典 统计检验 方法。该检验由三位计量经济学家独立发展而成:James Durbin(1954年)、De-Min Wu(1973年)和 Jerry Hausman(1978年),其中 Hausman 于1978年发表的形式最为广泛流传,他也因此贡献在计量经济学理论中占据核心地位。DWH 检验的根本目的,是在 OLS 估计普通最小二乘法)与 工具变量估计 (Instrumental Variables Estimation) 之间做出系统性选择,是处理 内生性 (Endogeneity) 问题时的关键诊断工具。

检验背景与内生性问题

在经典 线性回归模型 y=Xβ+εy = X\beta + \varepsilon 中,OLS 估计量保持一致性和无偏性的关键前提条件是 外生性假定,即解释变量 XX 与误差项 ε\varepsilon 不相关。然而,在实证研究中,这一假定经常因以下原因而遭到违反:

  • 遗漏变量偏误 (Omitted Variable Bias):模型中遗漏了同时影响因变量和某个解释变量的重要变量,导致解释变量与误差项产生相关性。
  • 测量误差 (Measurement Error):解释变量存在观测误差,使得实际观测值与其真实值之间的差异进入误差项。
  • 联立性 (Simultaneity):因变量与解释变量之间存在双向因果关系,即 yy 影响 XX 的同时 XX 也影响 yy,这在 供需模型宏观经济 方程中尤为常见。
  • 自选择偏误 (Self-Selection Bias):个体对处理状态的选择非随机,与潜在结果相关。

当存在上述任何一种内生性来源时,OLS 估计量将不再具有一致性和无偏性。此时,计量经济学家通常转向 工具变量法 (Two-Stage Least Squares, 2SLS) 以获得一致估计。然而,工具变量法虽然能解决内生性问题,却以降低估计效率为代价——在解释变量实际上是外生的情况下,使用 IV 会导致不必要的 方差 增大。DWH 检验正是在这一权衡的背景下提供了科学的判别依据。

检验的基本原理

DWH 检验的核心逻辑是:在 原假设 (Null Hypothesis) 下,解释变量的内生性不存在,此时 OLS 和 IV 估计量都是一致的,但 OLS 更有效;在 备择假设 (Alternative Hypothesis) 下,OLS 不一致而 IV 仍然一致。因此,检验的关键在于判断两个估计量之间的差异在统计上是否显著。

β^OLS\hat{\beta}_{\text{OLS}} 为 OLS 估计量,β^IV\hat{\beta}_{\text{IV}} 为 IV 估计量。在原假设(外生性成立)下,两者的差异 β^IVβ^OLS\hat{\beta}_{\text{IV}} - \hat{\beta}_{\text{OLS}} 应当渐近收敛于零向量;若该差异在统计上显著不为零,则表明 OLS 估计量存在偏误,内生性假设被数据拒绝。

Hausman 检验统计量

Hausman (1978) 提出的标准检验统计量为:

H=(β^IVβ^OLS)[Var(β^IV)Var(β^OLS)]1(β^IVβ^OLS)H = (\hat{\beta}_{\text{IV}} - \hat{\beta}_{\text{OLS}})' \left[ \text{Var}(\hat{\beta}_{\text{IV}}) - \text{Var}(\hat{\beta}_{\text{OLS}}) \right]^{-1} (\hat{\beta}_{\text{IV}} - \hat{\beta}_{\text{OLS}})

原假设 成立且模型正确设定的条件下,该统计量 渐近地 (Asymptotically) 服从 卡方分布 χ2(k)\chi^2(k),其中 kk 为被检验的 内生解释变量 的个数。直观上,Hausman 检验量衡量了 OLS 与 IV 估计量之间的加权距离,权重由两者方差-协方差矩阵之差决定。

检验的逐步操作程序

实际应用中,DWH 检验通常按照以下步骤执行:

  1. 设定模型与识别内生变量:明确回归模型 y=X1β1+X2β2+εy = X_1\beta_1 + X_2\beta_2 + \varepsilon,其中 X1X_1 为外生变量,X2X_2 为可能存在内生性的变量。选择合适的 工具变量 ZZ,满足 相关性条件ZZX2X_2 相关)和 外生性条件ZZε\varepsilon 不相关)。
  2. 第一阶段回归:将每个可疑的内生解释变量对所有外生变量(包括工具变量)进行回归,获得残差 v^\hat{v}
  3. 辅助回归(Durbin–Wu 形式):将原始方程中的因变量 yy 对原始外生变量 X1X_1、内生变量 X2X_2 以及第一阶段残差 v^\hat{v} 进行回归。若残差项的系数在统计上显著,则表明存在内生性。
  4. 计算 Hausman 统计量:直接计算 OLS 与 IV 估计量的差异及其 协方差矩阵,构造 HH 统计量并计算 p值 (p-value)。
  5. 判断结论:若 p 值小于预设的 显著性水平(通常为 0.05 或 0.10),则拒绝外生性原假设,认定存在内生性问题,应使用 IV 或 2SLS 估计;反之,接受外生性假定,采用更有效的 OLS 估计。

应用场景与典型示例

DWH 检验在实证研究中具有极广泛的应用,几乎涵盖所有面临内生性挑战的计量分析领域:

  • 劳动经济学中的教育回报率:在估计 明瑟方程 (Mincer Equation) 时,个体的教育水平可能因能力等不可观测因素而内生于工资方程。DWH 检验用于判断 义务教育法 或出生季度等工具变量是否必要。
  • 发展经济学中的制度与增长:在考察 制度质量 对经济增长的影响时,制度变量可能因双向因果关系而内生。研究者常用历史移民死亡率(Acemoglu 等)等工具变量,DWH 检验确认 IV 是否必要。
  • 金融经济学中的公司治理:公司绩效与治理结构之间的关系常面临内生性挑战,DWH 检验帮助研究者判断行业平均治理水平等工具变量是否被需要。
  • 健康经济学中的医疗支出:医疗保险参与决策与健康状况之间存在自选择偏误,DWH 检验用于评估 OLS 与 IV 估计之间的实质性差异。

检验的限制与注意事项

DWH 检验在使用中需特别注意以下问题:

  • 工具变量的有效性:DWH 检验的前提是所选的工具变量是有效的(满足相关性和外生性条件)。若 IV 本身存在 弱工具变量 (Weak Instruments) 问题或外生性被违反,检验结果将不可靠。建议同时报告 第一阶段 F 统计量 (First-Stage F-statistic) 以评估工具强度。
  • 有限样本偏差:在小样本中,Hausman 统计量的 渐近近似 可能不准确,检验的 拒绝率 (Rejection Rate) 可能出现偏差。此时,可考虑使用 Wild Bootstrap再抽样 (Resampling) 技术获得更可靠的推断。
  • 方差矩阵的可逆性:在某些情况下,Var(β^IV)Var(β^OLS)\text{Var}(\hat{\beta}_{\text{IV}}) - \text{Var}(\hat{\beta}_{\text{OLS}}) 可能不是正定矩阵,导致统计量无法计算。这一问题的出现通常意味着 OLS 和 IV 的方差差异不够显著,本身可能暗示外生性假定成立。
  • C 统计量(差分的 Sargan 检验):在过度识别的情况下,研究者可改用 Durbin–Wu–Hausman 的 C 统计量(亦称差分的 Sargan 检验),它通过比较约束模型和无约束模型的 J 统计量 之差来判断特定变量的内生性,在有限样本中表现更稳健。
  • 异方差稳健性:在存在 异方差 (Heteroscedasticity) 的情况下,标准 Hausman 检验可能失效。此时应使用 稳健 Hausman 检验 (Robust Hausman Test) 或基于 异方差稳健标准误 的 Durbin–Wu 辅助回归版本。

与其他诊断工具的关系

DWH 检验并非孤立存在的诊断工具,而是内生性检验体系中的核心环节。在 IV 估计流程中,研究者通常按以下顺序进行诊断:首先通过 过度识别检验(Sargan 检验或 Hansen J 检验)验证工具变量的外生性;然后通过 弱工具变量检验Cragg–Donald F 统计量Stock–Yogo 临界值)评估工具的相关性强度;最后,在确保工具质量的前提下,进行 DWH 检验以判断 IV 估计是否真正必要。三者形成一套完整的 IV 诊断三部曲,确保估计策略的科学性和结论的可信度。