ARTICLE

两阶段最小二乘法 (2SLS)

两阶段最小二乘法 (Two-Stage Least Squares, 2SLS) 两阶段最小二乘法（Two-Stage Least Squares，简称2SLS），是计量经济学中处理内生性问题的最基本且应用最广泛的工具变量（IV）估计方法。当回归模型中的解释变量与误差项相关时，普通最小二乘法（OLS）估计量不再具有一致性，2SLS通过引入与内生变量相关而与误

浏览 0 更新 2026-07-20

两阶段最小二乘法 (Two-Stage Least Squares, 2SLS)

两阶段最小二乘法（Two-Stage Least Squares，简称2SLS），是计量经济学中处理内生性问题的最基本且应用最广泛的工具变量（IV）估计方法。当回归模型中的解释变量与误差项相关时，普通最小二乘法（OLS）估计量不再具有一致性，2SLS通过引入与内生变量相关而与误差项无关的工具变量，分两个阶段完成参数的一致估计。2SLS由Theil（1953）和Basmann（1957）独立提出，是广义矩估计（GMM）的一种特殊情形。

内生性问题与工具变量策略

考虑线性回归模型：

y_i = \mathbf{x}_i' \boldsymbol{\beta} + \epsilon_i, \quad i = 1, \ldots, n

其中 $\mathbf{x}_i$ 为 $k \times 1$ 的解释变量向量。OLS一致性的核心条件是 $\mathbb{E}[\mathbf{x}_i \epsilon_i] = \mathbf{0}$ ，即所有解释变量为外生性。当部分变量与误差项相关时（如存在遗漏变量、测量误差或联立性偏差），OLS估计量依概率收敛至错误值，产生内生性偏误。

2SLS的解决策略是引入工具变量向量 $\mathbf{z}_i$ （维度 $m \times 1$ ， $m \ge k$ ），满足两个条件：

相关性（Relevance）： $\mathbb{E}[\mathbf{z}_i \mathbf{x}_i']$ 满列秩，工具变量与内生解释变量相关。
外生性（Exogeneity）： $\mathbb{E}[\mathbf{z}_i \epsilon_i] = \mathbf{0}$ ，工具变量与误差项无关。

两阶段估计程序

第一阶段（First Stage）。将每个内生解释变量 $x_{ij}$ 对所有工具变量进行OLS回归，获得拟合值：

x_{ij} = \mathbf{z}_i' \boldsymbol{\pi}_j + v_{ij}, \quad \hat{x}_{ij} = \mathbf{z}_i' \hat{\boldsymbol{\pi}}_j

以矩阵形式表示， $\mathbf{X} = \mathbf{Z}\boldsymbol{\Pi} + \mathbf{V}$ ，则所有解释变量的拟合值矩阵为：

\hat{\mathbf{X}} = \mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'\mathbf{X} = \mathbf{P}_{\mathbf{Z}}\mathbf{X}

其中 $\mathbf{P}_{\mathbf{Z}} = \mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'$ 为投影矩阵。此阶段的核心是将内生解释变量中与误差项相关的部分剥离，仅保留由工具变量所解释的外生性成分。

第二阶段（Second Stage）。用第一阶段得到的拟合值 $\hat{\mathbf{X}}$ 替代原始 $\mathbf{X}$ ，对被解释变量进行OLS回归：

y_i = \hat{\mathbf{x}}_i' \boldsymbol{\beta} + u_i

由此得到2SLS估计量：

\hat{\boldsymbol{\beta}}_{\text{2SLS}} = (\hat{\mathbf{X}}'\hat{\mathbf{X}})^{-1}\hat{\mathbf{X}}'\mathbf{y} = (\mathbf{X}'\mathbf{P}_{\mathbf{Z}}\mathbf{X})^{-1}\mathbf{X}'\mathbf{P}_{\mathbf{Z}}\mathbf{y}

2SLS估计量的代数性质

将上述公式展开可得几个等价表达。当 $m = k$ （恰好识别）时，2SLS退化为简单间接最小二乘法（ILS）：

\hat{\boldsymbol{\beta}}_{\text{2SLS}} = (\mathbf{Z}'\mathbf{X})^{-1}\mathbf{Z}'\mathbf{y}

当 $m > k$ （过度识别）时，2SLS等价于以 $\mathbf{P}_{\mathbf{Z}}\mathbf{X}$ 为工具的GMM估计量。2SLS残差须使用原始 $\mathbf{X}$ 计算：

\hat{\epsilon}_i = y_i - \mathbf{x}_i' \hat{\boldsymbol{\beta}}_{\text{2SLS}}

残差方差的估计量为 $\hat{\sigma}^2 = \frac{1}{n - k} \sum_{i=1}^n \hat{\epsilon}_i^2$ 。值得注意的是，若在第二阶段的实际回归中使用 $\hat{\mathbf{X}}$ 计算残差，所得的残差方差和标准误是错误的；正确的标准误应基于原始 $\mathbf{X}$ 和2SLS估计量计算。

渐近性质

在大样本下，2SLS估计量具有以下性质：

一致性：若工具变量满足相关性与外生性条件，则 $\hat{\boldsymbol{\beta}}_{\text{2SLS}} \xrightarrow{p} \boldsymbol{\beta}$ 。
渐近正态性： $\sqrt{n}(\hat{\boldsymbol{\beta}}_{\text{2SLS}} - \boldsymbol{\beta}) \xrightarrow{d} N(\mathbf{0}, \sigma^2 \mathbf{Q}_{xz}'\mathbf{Q}_{zz}^{-1}\mathbf{Q}_{xz})$ ，其中 $\mathbf{Q}$ 表示概率极限中的各矩阵。
有限样本偏误：2SLS为有偏估计量，偏误的方向通常朝向OLS估计量，偏误的大小与 $1/F$ 成比例，其中 $F$ 为第一阶段回归的F统计量。

弱工具变量与诊断检验

弱工具变量问题。当工具变量与内生变量的相关性很低时（第一阶段F统计量很小），2SLS估计量的有限样本偏误可能非常严重，甚至比有偏的OLS更差。Staiger和Stock（1997）提出的经验法则为第一阶段F统计量应大于10；低于此阈值则可能存在弱工具变量问题，需使用LIML或连续更新估计量（CUE）等对弱工具变量更稳健的方法。

过度识别约束检验。当工具变量数量超过内生变量数量时（ $m > k$ ），可利用过度识别信息检验工具变量的外生性。Sargan-Hansen检验（J检验）的统计量为：

J = n \cdot \frac{\hat{\boldsymbol{\epsilon}}'\mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'\hat{\boldsymbol{\epsilon}}}{\hat{\boldsymbol{\epsilon}}'\hat{\boldsymbol{\epsilon}}} \xrightarrow{d} \chi^2_{m-k}

在工具变量外生的原假设下， $J$ 统计量渐近服从自由度为 $m - k$ 的卡方分布。拒绝原假设则表明至少部分工具变量不满足外生性条件。

Hausman内生性检验。可通过比较OLS和2SLS的估计结果，利用Hausman检验判断是否存在内生性问题。若二者差异显著，则存在内生性，应使用2SLS；若差异不显著，OLS更有效率，因其具有较小的标准误。

应用场景与实例

2SLS广泛应用于实证经济学的各领域。在劳动经济学中，Angrist和Krueger（1991）使用出生季度作为工具变量估计教育回报率；在发展经济学中，Acemoglu、Johnson和Robinson（2001）使用殖民者死亡率作为制度的工具变量估计制度对经济增长的因果效应。在产业组织理论中，成本侧的外生冲击常被用作价格的工具变量以进行需求估计。2SLS是实证经济学研究中进行因果推断的基本工具，其思想贯穿整个应用计量经济学。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。