ARTICLE
Durbin–Wu–Hausman检验
Durbin–Wu–Hausman 检验 (Durbin–Wu–Hausman Test) Durbin–Wu–Hausman 检验(简称 DWH 检验或 Hausman 检验)是 计量经济学 (Econometrics) 中用于判断 解释变量 是否与 误差项 存在 相关性 的经典 统计检验 方法。该检验由三位计量经济学家独立发展而成:James Durbi
Durbin–Wu–Hausman 检验 (Durbin–Wu–Hausman Test)
Durbin–Wu–Hausman 检验(简称 DWH 检验或 Hausman 检验)是 计量经济学 (Econometrics) 中用于判断 解释变量 是否与 误差项 存在 相关性 的经典 统计检验 方法。该检验由三位计量经济学家独立发展而成:James Durbin(1954年)、De-Min Wu(1973年)和 Jerry Hausman(1978年),其中 Hausman 于1978年发表的形式最为广泛流传,他也因此贡献在计量经济学理论中占据核心地位。DWH 检验的根本目的,是在 OLS 估计(普通最小二乘法)与 工具变量估计 (Instrumental Variables Estimation) 之间做出系统性选择,是处理 内生性 (Endogeneity) 问题时的关键诊断工具。
检验背景与内生性问题
在经典 线性回归模型 中,OLS 估计量保持一致性和无偏性的关键前提条件是 外生性假定,即解释变量 与误差项 不相关。然而,在实证研究中,这一假定经常因以下原因而遭到违反:
- 遗漏变量偏误 (Omitted Variable Bias):模型中遗漏了同时影响因变量和某个解释变量的重要变量,导致解释变量与误差项产生相关性。
- 测量误差 (Measurement Error):解释变量存在观测误差,使得实际观测值与其真实值之间的差异进入误差项。
- 联立性 (Simultaneity):因变量与解释变量之间存在双向因果关系,即 影响 的同时 也影响 ,这在 供需模型、宏观经济 方程中尤为常见。
- 自选择偏误 (Self-Selection Bias):个体对处理状态的选择非随机,与潜在结果相关。
当存在上述任何一种内生性来源时,OLS 估计量将不再具有一致性和无偏性。此时,计量经济学家通常转向 工具变量法 (Two-Stage Least Squares, 2SLS) 以获得一致估计。然而,工具变量法虽然能解决内生性问题,却以降低估计效率为代价——在解释变量实际上是外生的情况下,使用 IV 会导致不必要的 方差 增大。DWH 检验正是在这一权衡的背景下提供了科学的判别依据。
检验的基本原理
DWH 检验的核心逻辑是:在 原假设 (Null Hypothesis) 下,解释变量的内生性不存在,此时 OLS 和 IV 估计量都是一致的,但 OLS 更有效;在 备择假设 (Alternative Hypothesis) 下,OLS 不一致而 IV 仍然一致。因此,检验的关键在于判断两个估计量之间的差异在统计上是否显著。
设 为 OLS 估计量, 为 IV 估计量。在原假设(外生性成立)下,两者的差异 应当渐近收敛于零向量;若该差异在统计上显著不为零,则表明 OLS 估计量存在偏误,内生性假设被数据拒绝。
Hausman 检验统计量
Hausman (1978) 提出的标准检验统计量为:
在 原假设 成立且模型正确设定的条件下,该统计量 渐近地 (Asymptotically) 服从 卡方分布 ,其中 为被检验的 内生解释变量 的个数。直观上,Hausman 检验量衡量了 OLS 与 IV 估计量之间的加权距离,权重由两者方差-协方差矩阵之差决定。
检验的逐步操作程序
实际应用中,DWH 检验通常按照以下步骤执行:
- 设定模型与识别内生变量:明确回归模型 ,其中 为外生变量, 为可能存在内生性的变量。选择合适的 工具变量 ,满足 相关性条件( 与 相关)和 外生性条件( 与 不相关)。
- 第一阶段回归:将每个可疑的内生解释变量对所有外生变量(包括工具变量)进行回归,获得残差 。
- 辅助回归(Durbin–Wu 形式):将原始方程中的因变量 对原始外生变量 、内生变量 以及第一阶段残差 进行回归。若残差项的系数在统计上显著,则表明存在内生性。
- 计算 Hausman 统计量:直接计算 OLS 与 IV 估计量的差异及其 协方差矩阵,构造 统计量并计算 p值 (p-value)。
- 判断结论:若 p 值小于预设的 显著性水平(通常为 0.05 或 0.10),则拒绝外生性原假设,认定存在内生性问题,应使用 IV 或 2SLS 估计;反之,接受外生性假定,采用更有效的 OLS 估计。
应用场景与典型示例
DWH 检验在实证研究中具有极广泛的应用,几乎涵盖所有面临内生性挑战的计量分析领域:
- 劳动经济学中的教育回报率:在估计 明瑟方程 (Mincer Equation) 时,个体的教育水平可能因能力等不可观测因素而内生于工资方程。DWH 检验用于判断 义务教育法 或出生季度等工具变量是否必要。
- 发展经济学中的制度与增长:在考察 制度质量 对经济增长的影响时,制度变量可能因双向因果关系而内生。研究者常用历史移民死亡率(Acemoglu 等)等工具变量,DWH 检验确认 IV 是否必要。
- 金融经济学中的公司治理:公司绩效与治理结构之间的关系常面临内生性挑战,DWH 检验帮助研究者判断行业平均治理水平等工具变量是否被需要。
- 健康经济学中的医疗支出:医疗保险参与决策与健康状况之间存在自选择偏误,DWH 检验用于评估 OLS 与 IV 估计之间的实质性差异。
检验的限制与注意事项
DWH 检验在使用中需特别注意以下问题:
- 工具变量的有效性:DWH 检验的前提是所选的工具变量是有效的(满足相关性和外生性条件)。若 IV 本身存在 弱工具变量 (Weak Instruments) 问题或外生性被违反,检验结果将不可靠。建议同时报告 第一阶段 F 统计量 (First-Stage F-statistic) 以评估工具强度。
- 有限样本偏差:在小样本中,Hausman 统计量的 渐近近似 可能不准确,检验的 拒绝率 (Rejection Rate) 可能出现偏差。此时,可考虑使用 Wild Bootstrap 等 再抽样 (Resampling) 技术获得更可靠的推断。
- 方差矩阵的可逆性:在某些情况下, 可能不是正定矩阵,导致统计量无法计算。这一问题的出现通常意味着 OLS 和 IV 的方差差异不够显著,本身可能暗示外生性假定成立。
- C 统计量(差分的 Sargan 检验):在过度识别的情况下,研究者可改用 Durbin–Wu–Hausman 的 C 统计量(亦称差分的 Sargan 检验),它通过比较约束模型和无约束模型的 J 统计量 之差来判断特定变量的内生性,在有限样本中表现更稳健。
- 异方差稳健性:在存在 异方差 (Heteroscedasticity) 的情况下,标准 Hausman 检验可能失效。此时应使用 稳健 Hausman 检验 (Robust Hausman Test) 或基于 异方差稳健标准误 的 Durbin–Wu 辅助回归版本。
与其他诊断工具的关系
DWH 检验并非孤立存在的诊断工具,而是内生性检验体系中的核心环节。在 IV 估计流程中,研究者通常按以下顺序进行诊断:首先通过 过度识别检验(Sargan 检验或 Hansen J 检验)验证工具变量的外生性;然后通过 弱工具变量检验(Cragg–Donald F 统计量 或 Stock–Yogo 临界值)评估工具的相关性强度;最后,在确保工具质量的前提下,进行 DWH 检验以判断 IV 估计是否真正必要。三者形成一套完整的 IV 诊断三部曲,确保估计策略的科学性和结论的可信度。