ARTICLE

工具变量

工具变量 (Instrumental Variable) 工具变量 (Instrumental Variable, IV) 是计量经济学中处理内生性问题的核心方法。当解释变量与误差项相关时,普通最小二乘法 (OLS) 将产生有偏且不一致的估计。工具变量法通过引入一个与误差项无关的外部变量,分离出解释变量中的外生变异,从而获得对因果关系的一致估计。 内生性:O

浏览 90 更新 2025-10-26

工具变量 (Instrumental Variable)

工具变量 (Instrumental Variable, IV) 是计量经济学中处理内生性问题的核心方法。当解释变量与误差项相关时,普通最小二乘法 (OLS) 将产生有偏且不一致的估计。工具变量法通过引入一个与误差项无关的外部变量,分离出解释变量中的外生变异,从而获得对因果关系的一致估计。

内生性:OLS 为何失效

考虑线性模型 Yi=β0+β1Xi+uiY_i = \beta_0 + \beta_1 X_i + u_i。OLS 一致性的关键假设是 Cov(Xi,ui)=0\operatorname{Cov}(X_i, u_i) = 0,即外生性。当该条件不成立时,XiX_i内生的,主要来源有三:

  1. 遗漏变量偏误:遗漏了一个既影响 YY 又与 XX 相关的变量,该变量进入误差项 uu,导致 XXuu 相关。
  2. 测量误差XX 的观测值含系统性偏差,使测量后的变量与误差项相关。
  3. 联立性XX 影响 YY,同时 YY 也影响 XX,如供给与需求模型中的价格与数量。

工具变量的两个核心条件

一个有效的工具变量 ZZ 必须同时满足:

  1. 相关性ZZ 与内生变量 XX 相关,即 Cov(Z,X)0\operatorname{Cov}(Z, X) \neq 0。该条件可通过第一阶段回归的 F 统计量检验。
  2. 外生性(排他性约束):ZZ 仅通过 XX 这一条路径影响 YY,即 Cov(Z,u)=0\operatorname{Cov}(Z, u) = 0。该条件无法通过统计检验直接验证,必须依赖经济理论与制度背景来论证。

两阶段最小二乘法 (2SLS)

实践中常用2SLS进行估计。第一阶段将内生变量 XX 对工具变量 ZZ 回归:X=π0+π1Z+vX = \pi_0 + \pi_1 Z + v,获得预测值 X^\hat{X}。由于 X^\hat{X} 完全由外生变量构成,与误差项 uu 不再相关。第二阶段用 X^\hat{X} 替换 XXYY 回归:Y=β0+β1X^+ϵY = \beta_0 + \beta_1 \hat{X} + \epsilon,所得 β^1\hat{\beta}_1 即为一致估计量。

在单一内生变量和单一工具变量的最简单情形下,IV 估计量可直观表示为:

β^1,IV=Cov(Z,Y)Cov(Z,X)\hat{\beta}_{1,IV} = \frac{\operatorname{Cov}(Z, Y)}{\operatorname{Cov}(Z, X)}

分子度量 ZZYY 的总效应,分母度量 ZZXX 的第一阶段效应,二者之比即为 XXYY 的因果效应。

经典应用

  1. 教育回报率:Angrist 和 Krueger (1991) 使用出生季度作为教育的工具变量。义务教育法使不同季度出生者受教育年限存在系统性差异(相关性),而出生季度与个人能力无关(外生性)。
  2. 需求弹性估计:以天气状况作为鱼价的工具变量。恶劣天气减少渔船出海、推高鱼价(相关性),但不直接影响消费者需求偏好(外生性)。

局限与注意事项

弱工具变量是实践中最常见的问题:当 ZZXX 相关性很弱时,IV 估计量在有限样本中偏误严重且标准误极大。经验规则要求第一阶段 F 统计量大于 10。此外,排他性约束在恰好识别情形下无法检验;即使过度识别时可进行过度识别检验(如 Sargan-Hansen 检验),也只能检验多余工具变量的外生性,无法验证全部工具变量的有效性。工具变量的可靠性最终取决于研究设计的经济学逻辑,而非纯粹的统计检验。