ARTICLE

2SLS

2SLS (Two-Stage Least Squares) 两阶段最小二乘法(Two-Stage Least Squares,简称 2SLS)是计量经济学中处理内生性问题最核心的估计方法之一。当回归模型中存在内生变量(即与误差项相关的解释变量)时,普通最小二乘法(OLS)将产生不一致且有偏的估计量。2SLS 通过引入工具变量(Instrumental Va

浏览 5 更新 2025-10-26

2SLS (Two-Stage Least Squares)

两阶段最小二乘法(Two-Stage Least Squares,简称 2SLS)是计量经济学中处理内生性问题最核心的估计方法之一。当回归模型中存在内生变量(即与误差项相关的解释变量)时,普通最小二乘法(OLS)将产生不一致且有偏的估计量。2SLS 通过引入工具变量(Instrumental Variables, IV),将内生变量在第一阶段用外生变量回归,在第二阶段用第一阶段得到的预测值替换原内生变量进行最终回归,从而消除内生性偏误,获得一致的参数估计。

内生性问题与工具变量

在标准的线性回归模型 yi=xiβ+ϵiy_i = \mathbf{x}_i'\boldsymbol{\beta} + \epsilon_i 中,OLS 一致性的关键条件是 E[xiϵi]=0\mathbb{E}[\mathbf{x}_i\epsilon_i] = \mathbf{0},即解释变量与误差项不相关。当这一条件不成立时,存在内生性。内生性有三个主要来源:遗漏变量(与解释变量相关且影响因变量的因素被错误地归入误差项)、测量误差(解释变量存在系统性观测偏差)、以及联立性(因变量与解释变量相互决定,例如供给与需求模型中的价格和数量)。

工具变量是解决内生性的关键。一个有效的工具变量 ziz_i 必须满足两个条件:相关性(relevant),即工具变量与内生解释变量相关,Cov(zi,xi)0\operatorname{Cov}(z_i, x_i) \neq 0;以及外生性(exogenous),即工具变量与误差项不相关,Cov(zi,ϵi)=0\operatorname{Cov}(z_i, \epsilon_i) = 0。相关性保证工具变量能提取内生变量中干净变异,外生性保证工具变量自身不被误差项污染。直观理解,工具变量充当自然实验中的随机分配机制,仅通过影响内生解释变量来间接影响因变量。

两阶段估计过程

考虑内生变量 xx 与工具变量 zz。简单模型为:

y=β1x+ϵ,E[xϵ]0y = \beta_1 x + \epsilon, \quad \mathbb{E}[x\epsilon] \neq 0

其中 zz 满足 E[zϵ]=0\mathbb{E}[z\epsilon] = 0Cov(z,x)0\operatorname{Cov}(z, x) \neq 0

第一阶段回归将内生变量对工具变量(及所有外生变量)进行 OLS 回归:

x=πz+vx = \pi z + v

获得预测值 x^=π^z\hat{x} = \hat{\pi} z,这是 xx 中由工具变量解释的部分,已排除误差项 ϵ\epsilon 的影响。

第二阶段回归将因变量对第一阶段的预测值进行 OLS 回归:

y=β1x^+uy = \beta_1 \hat{x} + u

第二阶段得到的 β^1,2SLS\hat{\beta}_{1,2SLS} 即为一致估计量。矩阵形式为:

β^2SLS=(XPZX)1XPZy\hat{\beta}_{2SLS} = (\mathbf{X}'\mathbf{P}_Z\mathbf{X})^{-1}\mathbf{X}'\mathbf{P}_Z\mathbf{y}

其中 PZ=Z(ZZ)1Z\mathbf{P}_Z = \mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}' 是工具变量矩阵的正交投影矩阵。这一形式揭示了 2SLS 与广义最小二乘法的深层联系。

当工具变量数量等于内生变量数量时 2SLS 退化为简单 IV 估计;当工具变量多于内生变量(过度识别)时,2SLS 通过投影机制高效合成多个工具变量信息为最优线性组合。

统计性质与检验

大样本下 2SLS 估计量一致且渐近正态:β^2SLSpβ\hat{\beta}_{2SLS} \xrightarrow{p} \beta,且 n(β^2SLSβ)dN(0,σ2Qxz1QzzQzx1)\sqrt{n}(\hat{\beta}_{2SLS} - \beta) \xrightarrow{d} \mathcal{N}(0, \sigma^2 \mathbf{Q}_{xz}^{-1}\mathbf{Q}_{zz}\mathbf{Q}_{zx}^{-1})。但与 OLS 相比 2SLS 方差更大,弱工具变量会严重膨胀方差。

关键诊断检验包括:第一阶段 F 统计量,经验规则为 F 应大于 10,否则存在严重弱工具变量偏误;过度识别检验Sargan-Hansen检验,用于工具变量多于内生变量时检验外生性;豪斯曼检验比较 OLS 与 2SLS 估计量,判断内生性是否统计显著。

应用与局限

2SLS 广泛应用于劳动经济学教育经济学健康经济学。经典案例为 Angrist 和 Krueger(1991)用出生季度作教育的工具变量估计工资回报。局限包括:弱工具变量放大偏误;外生性不可直接检验(恰好识别时);2SLS 估计局部平均处理效应(LATE),结果推广需注意合规者群体的特殊性。异方差性存在时需稳健标准误。尽管有局限,2SLS 仍是处理内生性的基准方法,是实证微观经济研究中因果推断的基石工具。