ARTICLE

工具变量 (Instrumental Variables, IV)

工具变量 (Instrumental Variables, IV) 工具变量(Instrumental Variables,简称IV)是计量经济学中处理内生性问题最经典、应用最广泛的方法之一,由Wright(1928)在估算需求弹性时率先提出,后经Reiersøl(1945)和Durbin(1954)等学者不断发展和完善。在回归模型中,当解释变量与误差项之间

浏览 0 更新 2026-07-20

工具变量 (Instrumental Variables, IV)

工具变量(Instrumental Variables,简称IV)是计量经济学中处理内生性问题最经典、应用最广泛的方法之一,由Wright(1928)在估算需求弹性时率先提出,后经Reiersøl(1945)和Durbin(1954)等学者不断发展和完善。在回归模型中,当解释变量与误差项之间存在相关性时——无论是源于遗漏变量偏误测量误差还是联立性偏差——普通最小二乘法(OLS)将丧失一致性,其估计量依概率收敛至一个非真实的参数值,即产生所谓的内生性偏误。工具变量法的核心思想在于:寻找一个与内生解释变量高度相关、但与误差项无关的额外变量(称为工具变量),借助该变量所携带的"干净"(外生)变异来识别和估计因果参数。

内生性问题的来源与IV的基本逻辑

考虑一个标准线性回归模型:

yi=xiβ+ϵi,i=1,,ny_i = x_i \beta + \epsilon_i, \quad i = 1, \ldots, n

OLS估计量具有一致性的经典条件是 E[xiϵi]=0\mathbb{E}[x_i \epsilon_i] = 0,即解释变量满足严格外生性。若 E[xiϵi]0\mathbb{E}[x_i \epsilon_i] \neq 0,则:

β^OLSpβ+C(x,ϵ)V(x)\hat{\beta}_{\text{OLS}} \xrightarrow{p} \beta + \frac{\mathbb{C}(x, \epsilon)}{\mathbb{V}(x)}

出现了无法忽略的渐近偏误。内生性的常见来源包括:(1)遗漏变量——存在同时影响解释变量和被解释变量的未观测因素;(2)测量误差——解释变量被不精确地观测;(3)联立性——被解释变量与解释变量之间存在双向因果关系。

工具变量法引入变量 ziz_i,它必须满足两个基本条件:

  • 相关性条件(Relevance):C(zi,xi)0\mathbb{C}(z_i, x_i) \neq 0,即工具变量必须与内生解释变量存在显著的相关性,这也是其被称为"工具"的原因——通过相关性"撬动"内生解释变量的变动。
  • 外生性条件(Exogeneity):E[ziϵi]=0\mathbb{E}[z_i \epsilon_i] = 0,即工具变量独立于误差项,这意味着工具变量对被解释变量的影响只能通过内生解释变量这一条路径传导。

在上述两个条件满足时,IV估计量可表示为:

β^IV=i=1n(zizˉ)(yiyˉ)i=1n(zizˉ)(xixˉ)\hat{\beta}_{\text{IV}} = \frac{\sum_{i=1}^n (z_i - \bar{z})(y_i - \bar{y})}{\sum_{i=1}^n (z_i - \bar{z})(x_i - \bar{x})}

这本质上是用工具变量与内生解释变量之间的协方差"缩放"工具变量与被解释变量之间的协方差,从而剔除内生解释变量中与误差项相关的变异成分。

多元模型与两阶段最小二乘法

当模型包含多个解释变量且其中部分变量为内生时,需要借助两阶段最小二乘法(2SLS)进行估计。考虑标准多元线性模型:

yi=xiβ+ϵiy_i = \mathbf{x}_i' \boldsymbol{\beta} + \epsilon_i

其中 xi\mathbf{x}_i 包含 k1k_1 个内生变量和 k2k_2 个外生变量。设工具变量向量 zi\mathbf{z}_i 包含所有外生解释变量(自身即为工具)和额外引入的排他性工具变量,其维度为 m×1m \times 1(满足 mk1m \ge k_1 的阶条件)。

第一阶段回归:将每个内生解释变量对所有外生变量(包括工具变量)进行OLS回归,得到拟合值:

X^=Z(ZZ)1ZX=PZX\hat{\mathbf{X}} = \mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'\mathbf{X} = \mathbf{P}_{\mathbf{Z}}\mathbf{X}

其中 PZ=Z(ZZ)1Z\mathbf{P}_{\mathbf{Z}} = \mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}' 是投影矩阵。这一步骤实质上是将内生解释变量分解为"由工具变量解释的部分"(拟合值)和"与误差项可能相关的部分"(残差)。

第二阶段回归:用第一阶段的拟合值 X^\hat{\mathbf{X}} 替代原始 X\mathbf{X} 对被解释变量进行OLS回归:

β^2SLS=(X^X^)1X^y=(XPZX)1XPZy\hat{\boldsymbol{\beta}}_{\text{2SLS}} = (\hat{\mathbf{X}}'\hat{\mathbf{X}})^{-1}\hat{\mathbf{X}}'\mathbf{y} = (\mathbf{X}'\mathbf{P}_{\mathbf{Z}}\mathbf{X})^{-1}\mathbf{X}'\mathbf{P}_{\mathbf{Z}}\mathbf{y}

m=k1m = k_1(恰好识别情形)时,IV估计量简化为 β^IV=(ZX)1Zy\hat{\boldsymbol{\beta}}_{\text{IV}} = (\mathbf{Z}'\mathbf{X})^{-1}\mathbf{Z}'\mathbf{y};当 m>k1m > k_1(过度识别情形)时,2SLS实质上是广义矩估计(GMM)在条件同方差下的特例,其加权方案自动实现了渐进最有效的工具变量组合。值得注意的是,2SLS的残差必须使用原始 X\mathbf{X} 而非拟合值 X^\hat{\mathbf{X}} 计算,否则将得到不正确方差估计量。

IV估计量的统计性质

在基本假设(相关性、外生性及正则条件)成立的前提下,IV估计量具有以下关键性质:

  • 一致性β^IVpβ\hat{\boldsymbol{\beta}}_{\text{IV}} \xrightarrow{p} \boldsymbol{\beta},这是IV估计量的最基本优势,也是研究者放弃更有效率的OLS而选择IV的根本原因。
  • 渐近正态性n(β^IVβ)dN(0,σ2(QxzQzz1Qxz)1)\sqrt{n}(\hat{\boldsymbol{\beta}}_{\text{IV}} - \boldsymbol{\beta}) \xrightarrow{d} N(\mathbf{0}, \sigma^2 (\mathbf{Q}_{xz}'\mathbf{Q}_{zz}^{-1}\mathbf{Q}_{xz})^{-1}),其中 Q\mathbf{Q} 为各二阶矩矩阵的概率极限,这构建了IV系数统计推断的基础。
  • 有限样本偏误:IV估计量并非无偏估计量。在有限样本中,IV偏误的方向通常朝向OLS估计量,其大小与第一阶段F统计量成反比。Bound、Jaeger和Baker(1995)指出,即使在较大样本下,弱工具变量导致的偏误也无法通过增大样本量有效消除。
  • 效率损失:相比于外生性成立时的OLS,IV估计量的渐近方差总是更大——因为它只能利用内生变量中与工具变量相关的部分变异,丢弃了其余信息。

弱工具变量问题

弱工具变量(Weak Instruments)是指工具变量与内生解释变量之间的相关性较弱的情况,这是IV方法在实际应用中所面临的最严峻挑战。当工具变量较弱时,即使样本量较大,IV估计量仍可能存在显著的有限样本偏误,且其渐近分布对正态近似的依赖变得不可靠。

Staiger和Stock(1997)提出经验法则:对于单个内生变量,若第一阶段回归的F统计量小于10,则存在弱工具变量风险。针对弱工具变量问题,研究者可采用对弱工具变量更稳健的推断方法,包括Anderson-Rubin检验(对弱工具变量下系数检验有效的稳健方法)、有限信息最大似然估计(LIML,其在弱工具变量下的偏误小于2SLS)以及连续更新估计量(CUE)等。

模型诊断与检验

过度识别约束检验(Overidentification Test)。当工具变量数量超过内生变量数量(m>k1m > k_1)时,可利用过度识别信息检验工具变量的外生性假设。常用的Sargan检验(或Hansen's J检验)统计量为:

J=nϵ^Z(ZZ)1Zϵ^ϵ^ϵ^dχmk12J = n \cdot \frac{\hat{\boldsymbol{\epsilon}}'\mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'\hat{\boldsymbol{\epsilon}}}{\hat{\boldsymbol{\epsilon}}'\hat{\boldsymbol{\epsilon}}} \xrightarrow{d} \chi^2_{m - k_1}

在原假设(所有工具变量均为外生)下,该统计量服从自由度为 mk1m - k_1 的卡方分布。拒绝原假设意味着至少部分工具变量不满足外生性条件。

Hausman内生性检验。通过比较OLS与IV估计量之间的差异来检验是否存在内生性问题。若差异显著,表明存在内生性,应使用IV估计;若差异不显著,OLS因其更小的标准误而成为更优选择。但在弱工具变量情形下,该检验的功效会大幅下降。

主要应用领域与经典案例

工具变量法广泛应用于当代应用经济学的各主要领域。在劳动经济学中,Angrist和Krueger(1991)使用出生季度作为教育年限的工具变量,开创性地估计了教育的因果回报率。在发展经济学中,Acemoglu、Johnson和Robinson(2001)使用殖民者死亡率作为制度质量的工具变量,识别了制度对长期经济增长的因果效应。在产业组织中,投入品价格或竞争对手的成本冲击常被用作价格变量的工具变量进行需求估计。在金融经济学中,Larcker和Rusticus(2010)系统回顾了公司财务领域对工具变量的使用,指出许多常用的工具变量可能存在外生性不可靠的问题。在健康经济学公共经济学中,距离最近医疗设施的远近、彩票中奖金额、政策实施的区域差异等自然实验产生的变异常被用作工具变量。工具变量法与断点回归设计(RDD)及双重差分法(DID)共同构成了当代实证研究中进行因果推断的核心工具组合,其应用范围仍在不断扩展。