ARTICLE

两阶段最小二乘法 (2SLS)

两阶段最小二乘法 (Two-Stage Least Squares, 2SLS) 两阶段最小二乘法(Two-Stage Least Squares,简称2SLS),是计量经济学中处理内生性问题的最基本且应用最广泛的工具变量(IV)估计方法。当回归模型中的解释变量与误差项相关时,普通最小二乘法(OLS)估计量不再具有一致性,2SLS通过引入与内生变量相关而与误

浏览 0 更新 2026-07-20

两阶段最小二乘法 (Two-Stage Least Squares, 2SLS)

两阶段最小二乘法(Two-Stage Least Squares,简称2SLS),是计量经济学中处理内生性问题的最基本且应用最广泛的工具变量(IV)估计方法。当回归模型中的解释变量与误差项相关时,普通最小二乘法(OLS)估计量不再具有一致性,2SLS通过引入与内生变量相关而与误差项无关的工具变量,分两个阶段完成参数的一致估计。2SLS由Theil(1953)和Basmann(1957)独立提出,是广义矩估计(GMM)的一种特殊情形。

内生性问题与工具变量策略

考虑线性回归模型:

yi=xiβ+ϵi,i=1,,ny_i = \mathbf{x}_i' \boldsymbol{\beta} + \epsilon_i, \quad i = 1, \ldots, n

其中 xi \mathbf{x}_i k×1k \times 1 的解释变量向量。OLS一致性的核心条件是 E[xiϵi]=0 \mathbb{E}[\mathbf{x}_i \epsilon_i] = \mathbf{0} ,即所有解释变量为外生性。当部分变量与误差项相关时(如存在遗漏变量、测量误差或联立性偏差),OLS估计量 依概率收敛 至错误值,产生内生性偏误。

2SLS的解决策略是引入工具变量向量 zi\mathbf{z}_i(维度 m×1m \times 1mkm \ge k),满足两个条件:

  • 相关性(Relevance):E[zixi]\mathbb{E}[\mathbf{z}_i \mathbf{x}_i'] 满列秩,工具变量与内生解释变量相关。
  • 外生性(Exogeneity):E[ziϵi]=0\mathbb{E}[\mathbf{z}_i \epsilon_i] = \mathbf{0},工具变量与误差项无关。

两阶段估计程序

第一阶段(First Stage)。将每个内生解释变量 xijx_{ij} 对所有工具变量进行OLS回归,获得拟合值:

xij=ziπj+vij,x^ij=ziπ^jx_{ij} = \mathbf{z}_i' \boldsymbol{\pi}_j + v_{ij}, \quad \hat{x}_{ij} = \mathbf{z}_i' \hat{\boldsymbol{\pi}}_j

以矩阵形式表示,X=ZΠ+V\mathbf{X} = \mathbf{Z}\boldsymbol{\Pi} + \mathbf{V},则所有解释变量的拟合值矩阵为:

X^=Z(ZZ)1ZX=PZX\hat{\mathbf{X}} = \mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'\mathbf{X} = \mathbf{P}_{\mathbf{Z}}\mathbf{X}

其中 PZ=Z(ZZ)1Z\mathbf{P}_{\mathbf{Z}} = \mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}' 为投影矩阵。此阶段的核心是将内生解释变量中与误差项相关的部分剥离,仅保留由工具变量所解释的外生性成分。

第二阶段(Second Stage)。用第一阶段得到的拟合值 X^\hat{\mathbf{X}} 替代原始 X\mathbf{X},对被解释变量进行OLS回归:

yi=x^iβ+uiy_i = \hat{\mathbf{x}}_i' \boldsymbol{\beta} + u_i

由此得到2SLS估计量:

β^2SLS=(X^X^)1X^y=(XPZX)1XPZy\hat{\boldsymbol{\beta}}_{\text{2SLS}} = (\hat{\mathbf{X}}'\hat{\mathbf{X}})^{-1}\hat{\mathbf{X}}'\mathbf{y} = (\mathbf{X}'\mathbf{P}_{\mathbf{Z}}\mathbf{X})^{-1}\mathbf{X}'\mathbf{P}_{\mathbf{Z}}\mathbf{y}

2SLS估计量的代数性质

将上述公式展开可得几个等价表达。当 m=km = k(恰好识别)时,2SLS退化为简单间接最小二乘法(ILS):

β^2SLS=(ZX)1Zy\hat{\boldsymbol{\beta}}_{\text{2SLS}} = (\mathbf{Z}'\mathbf{X})^{-1}\mathbf{Z}'\mathbf{y}

m>km > k(过度识别)时,2SLS等价于以 PZX\mathbf{P}_{\mathbf{Z}}\mathbf{X} 为工具的GMM估计量。2SLS残差须使用原始 X\mathbf{X} 计算:

ϵ^i=yixiβ^2SLS\hat{\epsilon}_i = y_i - \mathbf{x}_i' \hat{\boldsymbol{\beta}}_{\text{2SLS}}

残差方差的估计量为 σ^2=1nki=1nϵ^i2 \hat{\sigma}^2 = \frac{1}{n - k} \sum_{i=1}^n \hat{\epsilon}_i^2 。值得注意的是,若在第二阶段的实际回归中使用 X^\hat{\mathbf{X}} 计算残差,所得的残差方差和标准误是错误的;正确的标准误应基于原始 X\mathbf{X} 和2SLS估计量计算。

渐近性质

在大样本下,2SLS估计量具有以下性质:

  • 一致性:若工具变量满足相关性与外生性条件,则 β^2SLSpβ\hat{\boldsymbol{\beta}}_{\text{2SLS}} \xrightarrow{p} \boldsymbol{\beta}
  • 渐近正态性n(β^2SLSβ)dN(0,σ2QxzQzz1Qxz)\sqrt{n}(\hat{\boldsymbol{\beta}}_{\text{2SLS}} - \boldsymbol{\beta}) \xrightarrow{d} N(\mathbf{0}, \sigma^2 \mathbf{Q}_{xz}'\mathbf{Q}_{zz}^{-1}\mathbf{Q}_{xz}),其中 Q\mathbf{Q} 表示概率极限中的各矩阵。
  • 有限样本偏误:2SLS为有偏估计量,偏误的方向通常朝向OLS估计量,偏误的大小与 1/F1/F 成比例,其中 FF 为第一阶段回归的F统计量。

弱工具变量与诊断检验

弱工具变量问题。当工具变量与内生变量的相关性很低时(第一阶段F统计量很小),2SLS估计量的有限样本偏误可能非常严重,甚至比有偏的OLS更差。Staiger和Stock(1997)提出的经验法则为第一阶段F统计量应大于10;低于此阈值则可能存在弱工具变量问题,需使用LIML连续更新估计量(CUE)等对弱工具变量更稳健的方法。

过度识别约束检验。当工具变量数量超过内生变量数量时(m>km > k),可利用过度识别信息检验工具变量的外生性。Sargan-Hansen检验(J检验)的统计量为:

J=nϵ^Z(ZZ)1Zϵ^ϵ^ϵ^dχmk2J = n \cdot \frac{\hat{\boldsymbol{\epsilon}}'\mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'\hat{\boldsymbol{\epsilon}}}{\hat{\boldsymbol{\epsilon}}'\hat{\boldsymbol{\epsilon}}} \xrightarrow{d} \chi^2_{m-k}

在工具变量外生的原假设下,JJ 统计量渐近服从自由度为 mkm - k 的卡方分布。拒绝原假设则表明至少部分工具变量不满足外生性条件。

Hausman内生性检验。可通过比较OLS和2SLS的估计结果,利用Hausman检验判断是否存在内生性问题。若二者差异显著,则存在内生性,应使用2SLS;若差异不显著,OLS更有效率,因其具有较小的标准误。

应用场景与实例

2SLS广泛应用于实证经济学的各领域。在劳动经济学中,Angrist和Krueger(1991)使用出生季度作为工具变量估计教育回报率;在发展经济学中,Acemoglu、Johnson和Robinson(2001)使用殖民者死亡率作为制度的工具变量估计制度对经济增长的因果效应。在产业组织理论中,成本侧的外生冲击常被用作价格的工具变量以进行需求估计。2SLS是实证经济学研究中进行因果推断的基本工具,其思想贯穿整个应用计量经济学。