ARTICLE

Hausman–Taylor模型

Hausman–Taylor模型 (Hausman–Taylor Model) Hausman–Taylor模型(简称 HT 模型)由 Jerry Hausman 和 William Taylor 于 1981 年在 Econometrica 上提出,是面板数据计量经济学中一个里程碑式的估计方法。该模型在固定效应模型(FE)与随机效应模型(RE)之间开辟了第

浏览 0 更新 2026-01-06

Hausman–Taylor模型 (Hausman–Taylor Model)

Hausman–Taylor模型(简称 HT 模型)由 Jerry Hausman 和 William Taylor 于 1981 年在 Econometrica 上提出,是面板数据计量经济学中一个里程碑式的估计方法。该模型在固定效应模型(FE)与随机效应模型(RE)之间开辟了第三条道路:它允许部分解释变量与个体效应相关(从而放松了 RE 的关键假设),同时又能一致地估计不随时间变化的变量(即 FE 无法识别的参数)。HT 模型的核心思想是利用模型内部不同类别变量的外生性差异构造工具变量,通过工具变量(IV)或广义矩估计(GMM)框架实现识别,在实证研究中具有重要的理论价值和广泛的应用场景。

问题的提出:FE 与 RE 的两难困境

标准面板数据模型可写为:

yit=xitβ+ziγ+αi+εit,i=1,,N,  t=1,,Ty_{it} = x_{it}'\beta + z_i'\gamma + \alpha_i + \varepsilon_{it}, \quad i=1,\ldots,N,\; t=1,\ldots,T

其中 xitx_{it} 为随时间和个体变化的时变变量(time-varying),ziz_i 为不随时间变化的时不变变量(time-invariant),αi\alpha_i 为不可观测的个体效应,εit\varepsilon_{it} 为 idiosyncratic 误差项。

在这一设定下,两个传统方法各有致命局限:

  • 固定效应模型通过对每个个体进行组内去均值(within transformation)消除 αi\alpha_i,从而对 β\beta 给出始终一致的估计。但组内变换也同时消除了所有时不变变量 ziz_i,使得 γ\gamma 完全不可识别。
  • 随机效应模型通过广义最小二乘法(GLS)同时利用组内和组间变异,可以估计 β\betaγ\gamma。然而它要求 αi\alpha_i 与所有解释变量不相关(即 Cov(xit,αi)=0\operatorname{Cov}(x_{it}, \alpha_i) = 0Cov(zi,αi)=0\operatorname{Cov}(z_i, \alpha_i) = 0),这一假设在实证中往往过于严苛,一旦违反,RE 估计量即不一致。

因此,当研究者既关心某些时不变变量的系数(如教育、性别、种族、制度特征),又担心个体效应与解释变量存在相关性时,FE 和 RE 都无法单独胜任。Hausman–Taylor 模型正是为解决这一两难困境而设计。

模型设定与变量分类

HT 模型的关键在于对变量进行精细分类。将 xitx_{it}ziz_i 各自划分为两组:

  • xit=[x1it,  x2it]x_{it} = [x_{1it},\; x_{2it}]x1itx_{1it} 是时变变量中与 αi\alpha_i 不相关的子集(外生时变变量),x2itx_{2it} 是与 αi\alpha_i 相关的子集(内生时变变量)。
  • zi=[z1i,  z2i]z_i = [z_{1i},\; z_{2i}]z1iz_{1i} 是时不变变量中与 αi\alpha_i 不相关的子集(外生时不变变量),z2iz_{2i} 是与 αi\alpha_i 相关的子集(内生时不变变量)。

分类的排他条件总结如下:

Cov(x1it,αi)=0,Cov(x2it,αi)0,Cov(z1i,αi)=0,Cov(z2i,αi)0.\begin{aligned} &\operatorname{Cov}(x_{1it}, \alpha_i) = 0, \quad \operatorname{Cov}(x_{2it}, \alpha_i) \neq 0,\\ &\operatorname{Cov}(z_{1i}, \alpha_i) = 0, \quad \operatorname{Cov}(z_{2i}, \alpha_i) \neq 0. \end{aligned}

此外,所有变量均假设与 idiosyncratic 误差项 εit\varepsilon_{it} 不相关,即 εit\varepsilon_{it} 满足严格外生性。

识别策略与工具变量构造

HT 估计量是一种内部工具变量估计量,它不需要模型外部的额外数据,而是利用不同类别变量自身的矩条件来构造工具。其工具变量集合如下:

  1. 对于外生时变变量 x1itx_{1it}:使用其自身的组内离差形式 x~1it=x1itxˉ1i\tilde{x}_{1it} = x_{1it} - \bar{x}_{1i} 作为工具,因为组内变换消除了 αi\alpha_i,使 x~1it\tilde{x}_{1it}αi\alpha_i 正交。
  2. 对于内生时变变量 x2itx_{2it}:同样使用其组内离差 x~2it\tilde{x}_{2it} 作为工具——组内变换同样消除了 αi\alpha_i,使得 x~2it\tilde{x}_{2it}αi\alpha_i 无关。
  3. 对于外生时不变变量 z1iz_{1i}:使用外生时变变量的个体均值 xˉ1i\bar{x}_{1i} 作为工具,因为 xˉ1i\bar{x}_{1i}αi\alpha_i 不相关(由 x1itx_{1it} 的外生性保证),且 xˉ1i\bar{x}_{1i}z1iz_{1i} 存在相关性(通过 xxzz 的相关结构),从而满足工具的相关性条件。
  4. 对于内生时不变变量 z2iz_{2i}:此类变量没有合法的内部工具,因此无法识别——换言之,HT 模型要求时不变变量中至少有一部分是外生的(k1k2k_1 \geq k_2),这是模型的秩条件(rank condition)。

上述工具的个数为:k1T+k2T+k1=(k1+k2)T+k1k_1 T + k_2 T + k_1 = (k_1 + k_2)T + k_1,其中 k1=dim(x1it)k_1 = \dim(x_{1it})k2=dim(x2it)k_2 = \dim(x_{2it})。待估参数个数为 (k1+k2)+k1+k2(k_1 + k_2) + k_1 + k_2。阶条件要求工具个数不少于参数个数,即 k1k2k_1 \geq k_2——也就是说,外生时变变量的个数不得少于内生时不变变量的个数。这一条件也是 HT 模型可识别的必要前提。

两步估计程序

HT 模型的估计通常采用以下两步程序:

第一步:获得一致但非有效的初始估计

对模型进行组内变换(within transformation),得到 β\beta 的 FE 估计量 β^FE\hat{\beta}_{\text{FE}}。该估计量始终一致,因为组内变换消除了 αi\alpha_i。然后,利用 β^FE\hat{\beta}_{\text{FE}} 计算残差:

e^it=yitxitβ^FE\hat{e}_{it} = y_{it} - x_{it}'\hat{\beta}_{\text{FE}}

对每个个体取平均,得到个体层面的残差 e^ˉi\bar{\hat{e}}_i

e^ˉi=ziγ+αi+εˉi\bar{\hat{e}}_i = z_i'\gamma + \alpha_i + \bar{\varepsilon}_i

由于 αi\alpha_i 的存在,对上述方程直接使用 OLS 估计 γ\gamma 会得到不一致的结果,因为 z2iz_{2i}αi\alpha_i 相关。取而代之,使用 xˉ1i\bar{x}_{1i}z1iz_{1i} 作为工具变量对 γ\gamma 进行 IV 估计,得到 γ^HT\hat{\gamma}_{\text{HT}}

第二步:利用方差结构改进效率

根据第一步的估计结果,可以得到方差分量(variance components)的估计,进而构造 feasible GLS 变换。定义误差项:

uit=αi+εitu_{it} = \alpha_i + \varepsilon_{it}

其方差结构为:

Var(uit)=σα2+σε2,Cov(uit,uis)=σα2(ts)\operatorname{Var}(u_{it}) = \sigma_\alpha^2 + \sigma_\varepsilon^2,\quad \operatorname{Cov}(u_{it}, u_{is}) = \sigma_\alpha^2 \quad (t \neq s)

利用第一步的一致残差估计 σ^α2\hat{\sigma}_\alpha^2σ^ε2\hat{\sigma}_\varepsilon^2,对方程进行 GLS 变换,然后使用相同的工具变量集合对变换后的方程进行 IV 估计,可以得到渐近有效的 HT 估计量 β^HT\hat{\beta}_{\text{HT}}γ^HT\hat{\gamma}_{\text{HT}}

与相关方法的比较

与 FE 和 RE 的关系

HT 模型可以视为 FE 和 RE 的自然折中与推广:

  • 当所有变量都与 αi\alpha_i 相关(即 k=k2k = k_2k1=0k_1 = 0)时,阶条件 k1k2k_1 \geq k_2 无法满足,HT 模型退化为 FE——仅能估计 β\beta,无法识别 γ\gamma
  • 当所有变量都与 αi\alpha_i 不相关(即 k1=kk_1 = kk2=0k_2 = 0)时,HT 模型的所有矩条件与 RE 重合,二者等价。
  • k1k2>0k_1 \geq k_2 > 0 时,HT 模型介于二者之间:它像 FE 一样允许部分变量存在内生性,又像 RE 一样可以估计时不变变量的系数。

与其他 IV/GMM 面板估计量的关系

  • Arellano–Bond 估计量:主要应用于动态面板数据(包含滞后因变量),利用滞后值的差分作为工具。HT 模型聚焦于静态面板中的内生性与时不变变量识别问题,二者针对的场景不同。
  • Chamberlain–Mundlak–Wooldridge 方法:Mundlak (1978) 将个体效应设为各变量组均值的线性函数 αi=xˉiψ+ηi\alpha_i = \bar{x}_i'\psi + \eta_i,代入原模型后进行 RE 估计。该方法与 HT 模型在理念上相通——均试图通过引入组均值来控制个体效应与解释变量的相关性。但 HT 模型更为灵活,因为它允许对不同的变量赋予不同的外生性假设,且通过 IV 框架实现识别。
  • 随机系数模型:当面板的个体效应随系数变化而非截距项变化时,需使用更一般的随机系数设定,HT 模型仅处理截距项中的个体异质性。

实证应用与实例

HT 模型在劳动经济学、教育经济学、发展经济学和制度经济学等领域具有广泛应用。一个经典的应用场景是估计教育回报率。考虑如下模型:

lnwit=β1经验it+β2经验it2+β3工会身份it+γ1教育年限i+γ2性别i+αi+εit\ln w_{it} = \beta_1 \text{经验}_{it} + \beta_2 \text{经验}^2_{it} + \beta_3 \text{工会身份}_{it} + \gamma_1 \text{教育年限}_i + \gamma_2 \text{性别}_i + \alpha_i + \varepsilon_{it}

其中,教育年限 ziz_i 不随时间变化。由于能力(αi\alpha_i)往往与教育选择相关,RE 估计可能不一致;而 FE 无法识别教育回报率 γ1\gamma_1。HT 模型提供了一条可行的路径:将经验、经验平方等变量设为外生时变变量(x1itx_{1it}),将工会身份等可能受能力影响的变量设为内生时变变量(x2itx_{2it}),将教育年限设为内生时不变变量(z2iz_{2i}),将性别设为外生时不变变量(z1iz_{1i})。此时 k1=2k_1 = 2(经验及其平方),k2=1k_2 = 1(工会身份),阶条件 k1k2k_1 \geq k_2 满足,模型可识别。

另一个典型应用是制度经济学中的跨国面板分析。研究者常关注制度质量、法律起源等时不变或近似时不变的变量对经济增长的影响,同时担心制度变量与不可观测的国家特征(如文化、历史)相关。HT 模型允许部分解释变量存在内生性,同时利用内部工具识别制度变量的系数。

局限性与注意事项

尽管 HT 模型在理论上极具吸引力,在实际应用中存在若干挑战:

  1. 分类的外生性假设不可检验:变量划分(哪些变量归入 x1itx_{1it}z1iz_{1i})必须基于先验的经济学理论或制度知识,无法从数据中直接验证。错误分类将直接导致估计不一致。
  2. 弱工具变量问题xˉ1i\bar{x}_{1i} 作为 z2iz_{2i} 的工具,其相关性可能很弱,尤其当组内变异远大于组间变异时。弱工具变量会导致 γ^\hat{\gamma} 的有限样本偏误增大。
  3. 阶条件的约束k1k2k_1 \geq k_2 的要求意味着至少需要有与内生时不变变量同等数量的外生时变变量,否则模型不可识别。这在变量选择较为有限的实证场景中可能构成显著约束。
  4. 过度识别检验:当 k1>k2k_1 > k_2 时,模型存在过度识别约束,可使用Hausman检验或 Sargan–Hansen 检验对矩条件进行验证。若拒绝过度识别约束,表明部分变量的外生性假设可能不成立。
  5. 有限样本性质:当 TT 较小而 NN 有限时,HT 估计量的有限样本偏误可能不可忽视。Monte Carlo 模拟表明,在 T3T \geq 3N100N \geq 100 的条件下,HT 估计量表现良好,但当 T=2T = 2 时精度显著下降。

小结

Hausman–Taylor 模型是面板数据计量经济学中一个富有洞见的方法论创新。它通过在 FE 和 RE 之间架设一座桥梁,使研究者得以在放松随机效应假设的同时保留对时不变参数的识别能力。其核心贡献在于展示了如何利用模型内部变量的外生性差异构造工具变量——这一思想直接预示了后来更一般的"内部 IV"方法的发展。在实证应用中,HT 模型特别适用于那些关注时不变变量的效应、又对解释变量的内生性心存疑虑的研究情境,但其有效性高度依赖于分类假设的理论合理性。因此,研究者在使用 HT 模型时,应始终结合具体问题的制度背景和理论框架,审慎评估变量分类的经济学依据。