ARTICLE
Hausman检验
Hausman检验 (Hausman Test) Hausman检验是计量经济学中最重要的模型设定检验之一,由 Jerry Hausman 于 1978 年提出。其核心思想简洁而深刻:给定两个一致估计量(consistent estimator),其中一个是有效估计量(efficient),另一个不是,通过比较二者的差异来判断原假设是否成立。若原假设为真,有
Hausman检验 (Hausman Test)
Hausman检验是计量经济学中最重要的模型设定检验之一,由 Jerry Hausman 于 1978 年提出。其核心思想简洁而深刻:给定两个一致估计量(consistent estimator),其中一个是有效估计量(efficient),另一个不是,通过比较二者的差异来判断原假设是否成立。若原假设为真,有效估计量与非有效估计量应给出相近的结果;若原假设为假,有效估计量不再一致,二者的估计值将系统性地分离。Hausman检验将这一直觉转化为具有已知渐近分布的检验统计量,在面板数据模型选择、内生性检验、模型设定诊断等领域具有广泛而深远的应用。
统计框架与核心思想
Hausman检验的一般设定如下:考虑参数向量 的两种估计量 和 ,满足以下条件:
- 在原假设 下, 是一致的且渐近有效(达到 Cramér-Rao 下界), 也是一致的但非有效。
- 在备择假设 下, 仍然保持一致,但 不再一致。
关键一步是构造差值向量 。在 下,由于两个估计量都一致, 趋近于零;在 下,由于 不一致而 一致, 不会趋于零。Hausman 的核心引理表明:在 下,有效估计量与其和非有效估计量之差是渐近不相关的,即
由此可得协方差矩阵的简洁分解:
Hausman 检验统计量定义为:
其中 为 的维数(或更准确地说,为两个估计量有系统性差异的参数维数)。若 超过 卡方分布 的临界值,则拒绝 ,认为不应依赖有效但可能不一致的估计量。
面板数据中的经典应用:固定效应 vs 随机效应
Hausman检验最广为人知的应用发生在面板数据分析中,用于在固定效应模型(Fixed Effects, FE)和随机效应模型(Random Effects, RE)之间作出选择。
考虑标准面板数据模型:
其中 为不可观测的个体异质性(individual heterogeneity)。
- 随机效应模型假设 ,即个体效应与解释变量不相关。在此假设下,RE 估计量(广义最小二乘法 GLS)是一致且渐近有效的——它通过利用组内和组间两个维度的变异,达到比 FE 更小的方差。
- 固定效应模型不依赖上述假设,通过组内去均值(within transformation)或 LSDV(Least Squares Dummy Variable)方法消除 ,从而无论 是否为零,FE 估计量始终一致。但 FE 仅利用组内变异,在 RE 有效的条件下效率低于 RE。
Hausman 检验将 RE 估计量 置于 的"有效但脆弱"位置,FE 估计量 置于"稳健但低效"位置:
- :(RE 一致且有效)
- :(RE 不一致,FE 一致)
检验统计量为:
其中 为时变解释变量(time-varying regressors)的个数——不随时间变化的变量在 FE 变换中被消除,因此不参与比较。
若拒绝 ,表明个体效应与解释变量存在相关性,RE 估计量不一致,应使用 FE;若不拒绝 ,则 RE 估计量既一致又有效,是更优选择。
内生性检验:OLS vs IV
Hausman 检验的另一个经典应用是检验解释变量的内生性(endogeneity)。在此场景中:
若 Hausman 检验拒绝 ,说明 OLS 与 IV 之间存在系统性差异,支持存在内生性的判断,IV 结果更为可信。这一版本也被称为 Durbin-Wu-Hausman 检验(DWH 检验),Durbin (1954) 和 Wu (1973) 在 Hausman 之前已提出了等价或相关的方法,Hausman (1978) 将其纳入统一的渐近框架。
DWH 检验在实践中常用一种回归形式的等价实现:将疑似内生的变量对其工具变量和所有外生变量作第一阶段回归,获取残差;再将残差纳入原结构方程,若残差的系数显著,则拒绝外生性假设。这一辅助回归方法计算简便,在实证研究中广受欢迎。
实际应用中的注意事项
尽管 Hausman 检验在理论上优雅且通用,应用时需关注若干问题:
第一,协方差矩阵的正定性。检验统计量要求 为正定矩阵。在有限样本中,这一条件可能不成立——尤其当两个估计量的协方差矩阵估计不精确,或 下二者的效率差异很小时。若出现负定情况,检验统计量可能为负,此时应警惕小样本问题或模型设定错误,某些软件会报告这一警告。
第二,聚类稳健标准误的使用。当误差项存在异方差或组内相关时,FE 和 RE 的标准误估计都应使用聚类稳健形式。Hausman 检验在聚类稳健框架下的直接推广并非平凡——此时 FE 不一定比 RE"更低效"(在聚类-稳健意义上),标准的 Hausman 检验可能失效。可考虑使用 Wooldridge 的辅助回归方法或基于 bootstrap 的稳健 Hausman 检验。
第三,时不变变量的处理。Hausman 检验只基于时变变量比较 FE 和 RE,因此检验结果仅涉及这些变量系数的可靠性。时不变变量(如性别、种族、初始年份特征)的系数仅在 RE 框架下可识别;若检验未拒绝 ,它们可被信任;若拒绝,则需借助 Hausman–Taylor模型 等工具。
第四,检验功效与样本量。在 或 较小时,Hausman 检验的功效可能不足,导致错误地不拒绝 而误用 RE。同时,过大的样本量可能使检验过度敏感——微小的、经济上不重要的差异也被判定为显著。因此,检验结果应与经济学直觉和具体研究情境相互印证。
与相关检验的关系
Hausman 检验的思想已辐射至计量经济学的诸多领域:
- Durbin–Wu–Hausman检验(DWH):检验内生性/测量误差,是 Hausman 原理在 OLS vs IV 场景的具体化。
- Breusch-Pagan LM 检验:检验 RE 的必要性(即是否存在个体效应 ),常与 Hausman 检验配套使用——先以 Breusch-Pagan检验 判断是否应超越混合 OLS,再以 Hausman 检验在 FE 和 RE 间抉择。
- Mundlak 方法:将组内均值 纳入 RE 方程,若 的联合显著性检验拒绝 ,则结论与 Hausman 检验一致,且该方法天然兼容聚类稳健标准误。
- Sargan-Hansen 过度识别检验:在 GMM 框架中,当工具变量数量超过内生变量数量时,过度识别约束检验可视为 Hausman 检验在多维 IV 下的推广。
小结
Hausman 检验将模型选择从一个模糊的定性判断转化为统计上严格的假设检验。其统一的逻辑——比较一个"总是稳健"和一个"仅在原假设下有效"的估计量——超越了面板数据和内生性等具体场景,成为一种贯穿计量经济学的通用方法论工具。理解 Hausman 检验,不仅意味着掌握一个检验操作,更意味着领悟一种考察模型设定与识别策略的思维方式。