ARTICLE
工具变量法 (IV)
工具变量法 (IV) 工具变量法(Instrumental Variables, IV)是计量经济学中识别和估计因果关系的核心方法之一。当解释变量与误差项相关,导致普通最小二乘法(OLS)估计不一致时,IV 通过引入一个或多个工具变量来切断内生性链条,从而获得一致的参数估计。工具变量法是实证经济学因果推断工具箱中的基石,其思想也深度影响了生物统计学、流行病学
工具变量法 (IV)
工具变量法(Instrumental Variables, IV)是计量经济学中识别和估计因果关系的核心方法之一。当解释变量与误差项相关,导致普通最小二乘法(OLS)估计不一致时,IV 通过引入一个或多个工具变量来切断内生性链条,从而获得一致的参数估计。工具变量法是实证经济学因果推断工具箱中的基石,其思想也深度影响了生物统计学、流行病学和社会科学中的因果推断方法。
内生性问题的本质
考虑线性回归模型:
OLS 估计量 一致性的关键条件为 。当这一正交条件不成立时,OLS 将产生偏误且不一致的估计。内生性的三大主要来源是遗漏变量偏误(如遗漏的能力变量同时影响教育与收入)、测量误差(如自报收入存在系统性偏差)、以及联立性(如价格与需求量在市场均衡中相互决定)。工具变量法的核心思路是:找到一条仅通过内生解释变量来影响因变量的外生变异路径。
工具变量的条件
设存在内生解释变量 ,一个有效的工具变量 必须满足两个条件。
相关性(Relevance):工具变量与内生解释变量相关,即 。若相关性很弱,则称为弱工具变量,会导致 IV 估计量方差急剧膨胀,估计结果不可靠。实践中通常通过第一阶段 F 统计量检验相关性,经验规则是 F > 10 才可避免弱工具变量偏误。
外生性(Exogeneity):工具变量与误差项不相关,即 。这一条件在恰好识别(工具变量数等于内生变量数)时无法直接检验,只能依靠经济理论、制度背景或逻辑推理来论证。在过度识别(工具变量多于内生变量)的情形下,可以通过Sargan-Hansen检验或 J 检验来检验外生性条件是否成立。
直观地,工具变量充当了自然实验中的随机分配机制:它像随机分配一样将研究对象分为不同的组,再通过内生变量间接影响结果变量。
IV 估计量的推导与形式
在简单一元回归模型 中,工具变量的外生性条件 给出了一个矩条件:。解此方程得 ,代入样本矩即得到 IV 估计量:
这等价于协方差之比的形式:
这一公式的分子衡量工具变量与结果变量的总体关联,分母衡量工具变量与内生变量的关联强度,两者相除即剥离出内生变量的因果效应。这一比率形式最早可追溯到 Wald(1940)提出的分组估计量。在多元回归中,IV 估计量的一般形式为:
其中 为工具变量矩阵, 为内生解释变量矩阵。当工具变量数多于内生变量数时,使用两阶段最小二乘法(2SLS):
其中 是正交投影矩阵,2SLS 本质上是在所有工具变量的线性组合中寻找与内生变量最相关的部分。当工具变量恰好识别时,2SLS 估计量退化为简单 IV 估计量。当存在异方差性时,广义矩估计(GMM)比 2SLS 在效率上更优,因为 GMM 可以通过最优权重矩阵利用异方差结构。
统计性质
在大样本下,IV 估计量具有以下性质:
- 一致性:,前提是工具变量满足相关性和外生性。
- 渐近正态性:,其中 。
- 效率损失:同等样本量下 IV 估计量的渐近方差大于 OLS 估计量。这是为获得一致性付出的代价,即「无偏性与效率的权衡」。
识别与检验
阶条件是识别的必要条件:工具变量数()至少等于内生解释变量数()。当 时为恰好识别;当 时为过度识别。
关键诊断检验包括:
- 弱工具变量检验:第一阶段 F 统计量 < 10 提示弱工具变量问题。
- 过度识别检验:如Sargan-Hansen检验,检验工具变量是否与误差项不相关(前提是至少有一个多余的工具变量)。
- 豪斯曼检验(Hausman test):比较 OLS 与 IV 估计量是否存在显著差异,判断内生性的统计显著性。
经典应用案例
IV 方法催生了实证经济学中一系列里程碑式的研究。在劳动经济学中,Angrist(1990)利用越战抽签号码作为服兵役的工具变量,估计发现越战服役对白人退伍军人收入有显著的负面影响。在教育经济学中,Angrist 和 Krueger(1991)使用出生季度作为教育年限的工具变量,利用义务教育法导致的入学年龄差异来识别教育回报的因果效应,发现 OLS 可能低估了教育回报。Card(1995)利用大学附近的地理位置作为教育工具变量,也得出类似结论。
在发展经济学领域,Acemoglu、Johnson 和 Robinson(2001)使用早期欧洲殖民者的死亡率作为制度质量的工具变量,揭示了制度对长期经济增长的因果效应——这一研究已成为发展经济学中被引用最多的文献之一。在健康经济学中,医疗保险对健康水平的影响也常借助 IV 方法识别,例如使用政策变化或距离医疗设施的距离作为工具变量。
在政治经济学中,研究者利用历史边界划分或气候冲击等作为工具变量,研究民主化、媒体自由和冲突等议题。
局限与注意事项
尽管 IV 方法应用广泛,但其有重要局限:外生性条件在恰好识别时不可检验,完全依赖研究者对经济机制的理解;弱工具变量不仅使估计不精确,还会放大有限样本偏误;IV 估计量识别的是局部平均处理效应(LATE),仅反映合规者(compliers,即那些因工具变量变化而改变内生变量取值的人群)的因果效应,未必能推广到总体。
总结
工具变量法是处理内生性问题、识别因果关系的强大且成熟的计量方法。其成功应用依赖于对经济制度背景的深刻理解,以选择合理的外生工具变量。结合前沿的弱工具变量稳健推断方法和敏感性分析,IV 方法仍然在当代实证研究中扮演不可替代的角色。