ARTICLE

Hausman test

豪斯曼检验 (Hausman Test) 豪斯曼检验(Hausman Test),又称豪斯曼设定检验(Hausman Specification Test),是由经济学家杰里·豪斯曼(Jerry Hausman)于1978年在其经典论文 Specification Tests in Econometrics 中提出的统计检验方法。该检验的核心思想是:在计量经

浏览 0 更新 2026-07-14

豪斯曼检验 (Hausman Test)

豪斯曼检验(Hausman Test),又称豪斯曼设定检验(Hausman Specification Test),是由经济学家杰里·豪斯曼(Jerry Hausman)于1978年在其经典论文 Specification Tests in Econometrics 中提出的统计检验方法。该检验的核心思想是:在计量经济学中,当一个模型存在两个估计量——一个在零假设下有效且一致,另一个仅在零假设下一致但在备择假设下可能不一致——可以通过比较这两个估计量的差异来检验模型设定的正确性。豪斯曼检验广泛应用于面板数据分析中判断应使用固定效应模型还是随机效应模型,也用于内生性检验和工具变量有效性评估,是现代应用计量经济学中最常用的设定检验工具之一。

豪斯曼检验的数学基础

heta heta 为待估参数向量,heta^C\hat{ heta}_C 为无论零假设是否成立均一致的估计量(即一致估计量),heta^E\hat{ heta}_E 为仅在零假设下一致且在零假设下渐近有效的估计量(即有效估计量)。豪斯曼检验的核心识别条件在于:在零假设 H0H_0 下,两个估计量之差 q^=heta^Cheta^E\hat{q} = \hat{ heta}_C - \hat{ heta}_E 的概率极限为零;而在备择假设 H1H_1 下, ext{plim}\,\(\hat{q} eq 0\)。这一性质源于有效估计量在模型设定错误时丧失一致性的事实。豪斯曼(1978)证明,在零假设下,nq^\sqrt{n}\hat{q} 渐近服从均值为零的正态分布,且其渐近方差矩阵等于一致估计量的渐近方差减去有效估计量的渐近方差。基于此,可构造前述卡方检验统计量。该统计量的直觉是:若两个估计量差异较大,则表明有效估计量已不一致,模型设定存在问题。

理论动机与基本思想

计量经济学建模过程中,研究者常常面临模型设定的选择困境。以面板数据为例,个体效应可能以固定效应(与解释变量相关)或随机效应(与解释变量不相关)的形式存在。若真实模型为固定效应却误用随机效应估计,将导致参数估计不一致;反之,若真实模型为随机效应却使用固定效应,虽仍一致但会损失效率。豪斯曼检验正是为区分这两种情形而设计的假设检验框架。

豪斯曼检验的深层理论依据是:在零假设(模型设定正确)下,一个一致的估计量 θ^C\hat{\theta}_C 与一个有效的估计量 θ^E\hat{\theta}_E 都应收敛到真实参数值 θ0\theta_0,因此二者之差 q^=θ^Cθ^E\hat{q} = \hat{\theta}_C - \hat{\theta}_E 应趋近于零向量。而在备择假设(模型设定错误)下,有效的估计量不再一致,二者之差将偏离零。检验统计量正是基于这一差异的二次型构造的。

统计构造与渐近性质

豪斯曼检验的统计量构造如下:设 θ^C\hat{\theta}_C 为一致估计量(如固定效应估计量),θ^E\hat{\theta}_E 为有效估计量(如随机效应估计量)。在零假设 H0H_0 下,n(θ^Cθ^E)\sqrt{n}(\hat{\theta}_C - \hat{\theta}_E) 渐近服从均值为零的正态分布,且其渐近方差等于 Var(θ^C)Var(θ^E)\text{Var}(\hat{\theta}_C) - \text{Var}(\hat{\theta}_E)。检验统计量为:

H=(θ^Cθ^E)[Var(θ^C)Var(θ^E)]1(θ^Cθ^E)dχ2(k)H = (\hat{\theta}_C - \hat{\theta}_E)' [\text{Var}(\hat{\theta}_C) - \text{Var}(\hat{\theta}_E)]^{-1} (\hat{\theta}_C - \hat{\theta}_E) \xrightarrow{d} \chi^2(k)

其中 kk 为被检验参数的维度。在零假设下,该统计量渐近服从卡方分布。若计算得到的 HH 值超过给定显著性水平下的临界值,则拒绝零假设,表明有效估计量不一致,应选择固定效应模型

值得特别注意的是,豪斯曼检验中要求方差差矩阵 Var(θ^C)Var(θ^E)\text{Var}(\hat{\theta}_C) - \text{Var}(\hat{\theta}_E) 必须是正定矩阵。在实际应用中,若该矩阵非正定,检验将无法进行。此外,豪斯曼检验要求有效估计量在零假设下是真有效率的,否则检验的实质效力将大打折扣。当聚类标准误异方差稳健标准误被使用时,检验的构造需做相应调整。

Durbin-Wu-Hausman 检验与内生性检测

豪斯曼检验的另一重要应用是所谓的Durbin-Wu-Hausman 检验(简称DWH检验),用于检测解释变量内生性。在线性回归模型 y=Xβ+uy = X\beta + u 中,若怀疑某些解释变量 X1X_1误差项 uu 相关,则普通最小二乘法(OLS)估计将不一致。DWH检验通过比较OLS估计量与工具变量(IV)估计量(如两阶段最小二乘法,2SLS)来判定内生性是否存在。

DWH检验的步骤为:首先将可疑的内生变量对所有外生变量工具变量做回归,得到残差;然后将残差纳入原回归方程;最后检验残差项的系数是否联合显著。若残差系数显著,则表明存在内生性问题,OLS估计不一致,应使用工具变量估计。该检验的原假设是解释变量外生,备择假设是存在内生性。值得注意的是,DWH检验的有效性依赖于工具变量的有效性——若工具变量本身无效(不满足外生性或相关性条件),则检验结果不可靠。

扩展与变体

豪斯曼检验的思想已被推广至多种计量经济学情境。增强的豪斯曼检验通过自助法(Bootstrap)改进有限样本下的检验表现;非线性豪斯曼检验适用于广义矩估计(GMM)框架;递归豪斯曼检验则用于时间序列中的结构突变检测。在面板数据领域,还存在Robust Hausman Test,其对异方差和序列相关具有更好的稳健性,解决了标准豪斯曼检验在非球形误差下失效的问题。

此外,贝叶斯版本的豪斯曼检验也被提出,通过后验概率比较固定效应与随机效应模型的适用性,从而避免了经典检验中边界参数问题导致的检验水平扭曲。这些扩展使得豪斯曼检验的思想在现代计量经济学工具箱中持续发挥重要作用。

应用实例:面板数据模型选择

豪斯曼检验在实证研究中最经典的应用场景是面板数据分析中固定效应与随机效应模型的选择。固定效应模型允许个体效应与解释变量相关,通过组内变换消除个体效应后使用OLS估计,得到的估计量无论个体效应是否与解释变量相关均保持一致。随机效应模型则假设个体效应与解释变量不相关,采用广义最小二乘法(GLS)估计,在假设成立时比固定效应更有效。在实际应用中,研究者首先分别估计固定效应和随机效应模型,然后计算豪斯曼统计量。若统计量显著(p值小于0.05或0.01),则拒绝个体效应与解释变量不相关的零假设,选择固定效应模型;否则接受随机效应模型。然而,这一决策规则并非绝对——当样本量较小或模型存在异方差时,标准豪斯曼检验可能产生偏误,研究者需使用稳健版本的检验或结合经济理论综合判断。

局限性与注意事项

豪斯曼检验在实践中需注意以下局限。其一,检验的前提是其中一个估计量在零假设下必须有效,若有效估计量的条件不成立,检验将产生误导性结果。其二,当参数维度 kk 很大时,方差矩阵的逆运算可能不稳定,导致检验统计量的计算不可靠。其三,豪斯曼检验在有限样本下的表现有时不尽如人意,可能存在第一类错误概率放大的问题。因此,研究者在使用豪斯曼检验时,应结合经济理论模型诊断敏感性分析做出综合判断,而非机械地依赖检验的二分结果。近年来部分学者建议使用修正的豪斯曼检验辅助回归方法作为替代方案,以提升检验的有限样本表现。