ARTICLE

2SLS

2SLS (Two-Stage Least Squares) 两阶段最小二乘法（Two-Stage Least Squares，简称 2SLS）是计量经济学中处理内生性问题最核心的估计方法之一。当回归模型中存在内生变量（即与误差项相关的解释变量）时，普通最小二乘法（OLS）将产生不一致且有偏的估计量。2SLS 通过引入工具变量（Instrumental Va

浏览 5 更新 2025-10-26

2SLS (Two-Stage Least Squares)

两阶段最小二乘法（Two-Stage Least Squares，简称 2SLS）是计量经济学中处理内生性问题最核心的估计方法之一。当回归模型中存在内生变量（即与误差项相关的解释变量）时，普通最小二乘法（OLS）将产生不一致且有偏的估计量。2SLS 通过引入工具变量（Instrumental Variables, IV），将内生变量在第一阶段用外生变量回归，在第二阶段用第一阶段得到的预测值替换原内生变量进行最终回归，从而消除内生性偏误，获得一致的参数估计。

内生性问题与工具变量

在标准的线性回归模型 $y_i = \mathbf{x}_i'\boldsymbol{\beta} + \epsilon_i$ 中，OLS 一致性的关键条件是 $\mathbb{E}[\mathbf{x}_i\epsilon_i] = \mathbf{0}$ ，即解释变量与误差项不相关。当这一条件不成立时，存在内生性。内生性有三个主要来源：遗漏变量（与解释变量相关且影响因变量的因素被错误地归入误差项）、测量误差（解释变量存在系统性观测偏差）、以及联立性（因变量与解释变量相互决定，例如供给与需求模型中的价格和数量）。

工具变量是解决内生性的关键。一个有效的工具变量 $z_i$ 必须满足两个条件：相关性（relevant），即工具变量与内生解释变量相关， $\operatorname{Cov}(z_i, x_i) \neq 0$ ；以及外生性（exogenous），即工具变量与误差项不相关， $\operatorname{Cov}(z_i, \epsilon_i) = 0$ 。相关性保证工具变量能提取内生变量中干净变异，外生性保证工具变量自身不被误差项污染。直观理解，工具变量充当自然实验中的随机分配机制，仅通过影响内生解释变量来间接影响因变量。

两阶段估计过程

考虑内生变量 $x$ 与工具变量 $z$ 。简单模型为：

y = \beta_1 x + \epsilon, \quad \mathbb{E}[x\epsilon] \neq 0

其中 $z$ 满足 $\mathbb{E}[z\epsilon] = 0$ 且 $\operatorname{Cov}(z, x) \neq 0$ 。

第一阶段回归将内生变量对工具变量（及所有外生变量）进行 OLS 回归：

x = \pi z + v

获得预测值 $\hat{x} = \hat{\pi} z$ ，这是 $x$ 中由工具变量解释的部分，已排除误差项 $\epsilon$ 的影响。

第二阶段回归将因变量对第一阶段的预测值进行 OLS 回归：

y = \beta_1 \hat{x} + u

第二阶段得到的 $\hat{\beta}_{1,2SLS}$ 即为一致估计量。矩阵形式为：

\hat{\beta}_{2SLS} = (\mathbf{X}'\mathbf{P}_Z\mathbf{X})^{-1}\mathbf{X}'\mathbf{P}_Z\mathbf{y}

其中 $\mathbf{P}_Z = \mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'$ 是工具变量矩阵的正交投影矩阵。这一形式揭示了 2SLS 与广义最小二乘法的深层联系。

当工具变量数量等于内生变量数量时 2SLS 退化为简单 IV 估计；当工具变量多于内生变量（过度识别）时，2SLS 通过投影机制高效合成多个工具变量信息为最优线性组合。

统计性质与检验

大样本下 2SLS 估计量一致且渐近正态： $\hat{\beta}_{2SLS} \xrightarrow{p} \beta$ ，且 $\sqrt{n}(\hat{\beta}_{2SLS} - \beta) \xrightarrow{d} \mathcal{N}(0, \sigma^2 \mathbf{Q}_{xz}^{-1}\mathbf{Q}_{zz}\mathbf{Q}_{zx}^{-1})$ 。但与 OLS 相比 2SLS 方差更大，弱工具变量会严重膨胀方差。

关键诊断检验包括：第一阶段 F 统计量，经验规则为 F 应大于 10，否则存在严重弱工具变量偏误；过度识别检验如Sargan-Hansen检验，用于工具变量多于内生变量时检验外生性；豪斯曼检验比较 OLS 与 2SLS 估计量，判断内生性是否统计显著。

应用与局限

2SLS 广泛应用于劳动经济学、教育经济学和健康经济学。经典案例为 Angrist 和 Krueger（1991）用出生季度作教育的工具变量估计工资回报。局限包括：弱工具变量放大偏误；外生性不可直接检验（恰好识别时）；2SLS 估计局部平均处理效应（LATE），结果推广需注意合规者群体的特殊性。异方差性存在时需稳健标准误。尽管有局限，2SLS 仍是处理内生性的基准方法，是实证微观经济研究中因果推断的基石工具。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。