ARTICLE
2SLS
2SLS (Two-Stage Least Squares) 两阶段最小二乘法(Two-Stage Least Squares,简称 2SLS)是计量经济学中处理内生性问题最核心的估计方法之一。当回归模型中存在内生变量(即与误差项相关的解释变量)时,普通最小二乘法(OLS)将产生不一致且有偏的估计量。2SLS 通过引入工具变量(Instrumental Va
2SLS (Two-Stage Least Squares)
两阶段最小二乘法(Two-Stage Least Squares,简称 2SLS)是计量经济学中处理内生性问题最核心的估计方法之一。当回归模型中存在内生变量(即与误差项相关的解释变量)时,普通最小二乘法(OLS)将产生不一致且有偏的估计量。2SLS 通过引入工具变量(Instrumental Variables, IV),将内生变量在第一阶段用外生变量回归,在第二阶段用第一阶段得到的预测值替换原内生变量进行最终回归,从而消除内生性偏误,获得一致的参数估计。
内生性问题与工具变量
在标准的线性回归模型 中,OLS 一致性的关键条件是 ,即解释变量与误差项不相关。当这一条件不成立时,存在内生性。内生性有三个主要来源:遗漏变量(与解释变量相关且影响因变量的因素被错误地归入误差项)、测量误差(解释变量存在系统性观测偏差)、以及联立性(因变量与解释变量相互决定,例如供给与需求模型中的价格和数量)。
工具变量是解决内生性的关键。一个有效的工具变量 必须满足两个条件:相关性(relevant),即工具变量与内生解释变量相关,;以及外生性(exogenous),即工具变量与误差项不相关,。相关性保证工具变量能提取内生变量中干净变异,外生性保证工具变量自身不被误差项污染。直观理解,工具变量充当自然实验中的随机分配机制,仅通过影响内生解释变量来间接影响因变量。
两阶段估计过程
考虑内生变量 与工具变量 。简单模型为:
其中 满足 且 。
第一阶段回归将内生变量对工具变量(及所有外生变量)进行 OLS 回归:
获得预测值 ,这是 中由工具变量解释的部分,已排除误差项 的影响。
第二阶段回归将因变量对第一阶段的预测值进行 OLS 回归:
第二阶段得到的 即为一致估计量。矩阵形式为:
其中 是工具变量矩阵的正交投影矩阵。这一形式揭示了 2SLS 与广义最小二乘法的深层联系。
当工具变量数量等于内生变量数量时 2SLS 退化为简单 IV 估计;当工具变量多于内生变量(过度识别)时,2SLS 通过投影机制高效合成多个工具变量信息为最优线性组合。
统计性质与检验
大样本下 2SLS 估计量一致且渐近正态:,且 。但与 OLS 相比 2SLS 方差更大,弱工具变量会严重膨胀方差。
关键诊断检验包括:第一阶段 F 统计量,经验规则为 F 应大于 10,否则存在严重弱工具变量偏误;过度识别检验如Sargan-Hansen检验,用于工具变量多于内生变量时检验外生性;豪斯曼检验比较 OLS 与 2SLS 估计量,判断内生性是否统计显著。
应用与局限
2SLS 广泛应用于劳动经济学、教育经济学和健康经济学。经典案例为 Angrist 和 Krueger(1991)用出生季度作教育的工具变量估计工资回报。局限包括:弱工具变量放大偏误;外生性不可直接检验(恰好识别时);2SLS 估计局部平均处理效应(LATE),结果推广需注意合规者群体的特殊性。异方差性存在时需稳健标准误。尽管有局限,2SLS 仍是处理内生性的基准方法,是实证微观经济研究中因果推断的基石工具。