ARTICLE

工具变量模型

工具变量模型 (Instrumental Variables Model) 工具变量模型（Instrumental Variables，简称IV）是计量经济学中处理内生性问题的核心方法。当回归模型中的解释变量与误差项相关时，普通最小二乘法（OLS）估计量将是有偏且不一致的。工具变量法通过引入与内生解释变量相关、但与误差项无关的"工具"变量，恢复对因果效应的一

浏览 0 更新 2025-11-08

工具变量模型 (Instrumental Variables Model)

工具变量模型（Instrumental Variables，简称IV）是计量经济学中处理内生性问题的核心方法。当回归模型中的解释变量与误差项相关时，普通最小二乘法（OLS）估计量将是有偏且不一致的。工具变量法通过引入与内生解释变量相关、但与误差项无关的"工具"变量，恢复对因果效应的一致估计。这一方法由Philip G. Wright于1928年在其对农产品供需的研究中首次提出，后经两阶段最小二乘法（2SLS）的标准化而成为实证研究的必备工具。

内生性问题的来源

工具变量模型解决的根本问题是内生性（Endogeneity），即 $\operatorname{Cov}(X_i, u_i) \neq 0$ 。内生性主要有三个来源：

遗漏变量偏误（Omitted Variable Bias）：存在既影响因变量 $Y$ 又与解释变量 $X$ 相关的不可观测因素 $Z$ 。若 $Z$ 被遗漏，则它进入误差项 $u$ ，导致 $X$ 与 $u$ 相关。典型例子：估计教育对工资的回报时，能力（不可观测）同时影响教育水平和工资。

测量误差（Measurement Error）：当自变量存在测量误差 $X = X^* + v$ 时，即使真实值 $X^*$ 与误差项不相关，观测值 $X$ 也会通过 $v$ 与误差项产生关联，导致衰减偏误。

联立性偏误（Simultaneity Bias）：在供需系统中，价格和数量由供给和需求曲线同时决定。任何一方方程中的价格变量都与该方程的误差项相关，因为价格是系统内生的结果，而非外生给定的原因。这违反了OLS的核心假设，使得直接估计供需弹性不可行。

有效工具变量的两个条件

一个有效的工具变量 $Z$ 必须同时满足两个条件：

相关性（Relevance）： $\operatorname{Cov}(Z_i, X_i) \neq 0$ 。工具变量必须与内生解释变量显著相关。这一条件可以在第一阶段回归中直接检验：将 $X$ 对 $Z$ （以及所有外生变量）回归，检验 $Z$ 的系数是否显著。若相关性很弱，则称为弱工具变量问题，会导致IV估计量严重偏向OLS估计量，且标准误膨胀。

外生性（Exogeneity）： $\operatorname{Cov}(Z_i, u_i) = 0$ 。工具变量必须与结构方程的误差项不相关，即 $Z$ 只能通过 $X$ 间接影响 $Y$ ，而不能有独立的直接影响路径。这一条件是不可直接检验的——它依赖于经济理论和研究者的论证。在恰好识别（工具变量数等于内生变量数）的情况下，外生性只能作为一种信念被维持；在过度识别情况下，可以通过过度识别检验提供间接证据。

两阶段最小二乘法 (2SLS)

对于最简单的模型：

Y_i = \beta_0 + \beta_1 X_i + u_i, \quad \operatorname{Cov}(X_i, u_i) \neq 0

其中 $Z_i$ 是 $X_i$ 的有效工具变量，2SLS估计分两步进行：

第一阶段（First Stage）：将内生变量 $X$ 对外生工具变量 $Z$ （以及模型中所有外生控制变量 $W$ ）进行OLS回归：

X_i = \pi_0 + \pi_1 Z_i + \pi_2 W_i + v_i

由此得到 $X$ 的预测值 $\hat{X}_i$ 。这一步骤将 $X$ 分解为两部分：由外生工具变量 $Z$ 解释的"干净"部分 $\hat{X}_i$ ，以及与误差项 $v_i$ 相关的"污染"部分。

第二阶段（Second Stage）：用第一阶段得到的 $\hat{X}_i$ 替代原始 $X_i$ ，对结构方程进行OLS回归：

Y_i = \beta_0 + \beta_1 \hat{X}_i + \beta_2 W_i + \varepsilon_i

由于 $\hat{X}_i$ 是 $Z$ （和 $W$ ）的线性组合，而 $Z$ 和 $W$ 均与结构误差项 $u_i$ 不相关，因此 $\hat{X}_i$ 与 $u_i$ 也不相关，从而恢复了 $\beta_1$ 的一致性估计。

注意：2SLS第二阶段的标准误必须进行修正。因为 $\hat{X}_i$ 是基于第一阶段的估计值而非真正的 $X_i$ ，直接使用OLS公式计算的标准误会偏小。所有现代计量软件（Stata的\texttt{ivreg2}、R的\texttt{AER::ivreg}、Python的\texttt{linearmodels}）都会自动进行这一修正。

多元内生变量与识别条件

当存在多个内生变量时，IV模型自然扩展。设有 $k$ 个内生变量，则至少需要 $k$ 个工具变量。识别条件分为三种情况：

恰好识别（Exactly Identified）：工具变量数量 $m$ 等于内生变量数量 $k$ 。模型参数被唯一确定，2SLS等价于间接最小二乘法（ILS）。

过度识别（Over-identified）： $m > k$ 。存在比所需更多的工具变量，参数有多组可能的估计值。2SLS通过将这些工具变量的信息以最优方式组合，得出唯一估计。过度识别允许进行过度识别约束检验（如Sargan检验或Hansen J检验），为外生性假设提供部分统计证据。

识别不足（Under-identified）： $m < k$ 。工具变量数量不足，模型参数无法被识别，任何估计都是无意义的。这是实证研究中最致命的问题之一。

诊断检验

弱工具变量检验：若第一阶段 $F$ 统计量（检验所有工具变量系数联合为零的假设）小于经验阈值10（Stock-Yogo准则），则存在弱工具变量问题。此时IV估计量不仅不改善OLS偏误，反而可能更差。解决方案包括：使用有限信息最大似然法（LIML）——它对弱工具变量更稳健；或寻找更强的工具。

过度识别检验：Sargan检验（同方差假设下）和Hansen J检验（异方差稳健）用于检验过度识别约束的有效性。原假设是所有工具变量都是外生的。若拒绝原假设，则至少有一个工具变量不满足外生性条件，模型设定存疑。但这些检验不能指出哪个工具变量有问题，且检验效力依赖于至少有部分工具是有效的。

Hausman检验（或称Durbin-Wu-Hausman检验）：用于正式检验是否存在内生性。通过比较OLS和IV估计量的差异，若两者在统计上显著不同，则拒绝"所有解释变量均为外生"的原假设，确认需要使用IV。

经典应用与实例

Angrist \& Krueger (1991)：利用出生季度作为教育的工具变量估计教育回报。美国的义务教育法规定学生在达到特定年龄后方可辍学，而入学截止日期因州而异，因此出生季度影响实际受教育年限（相关性），但出生季度本身与个人能力或工资决定因素无关（外生性）。

Levitt (1997)：使用市长和州长选举周期作为警察雇佣的工具变量，估计警察数量对犯罪率的影响。选举周期影响警察雇佣决策（相关性），但与直接影响犯罪的其他社会经济因素无直接关联。

Acemoglu, Johnson \& Robinson (2001)：使用殖民者死亡率作为制度的工具变量，估计制度质量对经济发展的因果效应。殖民者在高死亡率地区建立的制度更具掠夺性（相关性路径），而殖民者死亡率不直接影响当今的经济表现。

局限性与注意事项

尽管工具变量法是解决内生性的黄金标准方法，但仍有若干重要局限：首先，外生性不可证伪——无论统计检验多么完美，工具变量的外生性最终建立在理论论证之上，最精巧的IV设计也可能因一个未被注意的因果路径而崩塌。其次，IV估计的是局部平均处理效应（LATE），而非总体的平均处理效应（ATE）——只有当工具变量对所有人的影响都相同时，IV才等于ATE，这一条件在现实中极少成立。再次，弱工具变量可能比OLS更差——在有限样本下，弱IV的偏误可能超过OLS的内生性偏误，方向甚至与OLS相同。最后，好工具变量极度稀缺——在观察性数据中找到一个同时满足相关性和外生性的变量，往往需要深刻的理论洞察和巧妙的自然实验设计。

总之，工具变量模型是计量经济学因果推断的核心武器。从Wright最初的供需识别，到Angrist-Krueger的出生季度研究，再到当代断点回归和双重差分等准实验方法，IV的思想——利用外生变异识别因果效应——始终贯穿于实证经济学的方法论演进。掌握IV不仅是学会一个技术，更是理解"因果关系"在非实验数据中何以可能被识别这一核心哲学问题。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。