ARTICLE

两阶段最小二乘法

两阶段最小二乘法 (Two-Stage Least Squares, 2SLS) 两阶段最小二乘法 (Two-Stage Least Squares, 2SLS 或 TSLS) 是 计量经济学 中处理线性 回归模型 中解释变量与 误差项 相关问题的核心参数估计方法。当模型的解释变量存在 内生性 (Endogeneity) 时,传统的 普通最小二乘法 (OLS

浏览 73 更新 2025-10-26

两阶段最小二乘法 (Two-Stage Least Squares, 2SLS)

两阶段最小二乘法 (Two-Stage Least Squares, 2SLSTSLS) 是 计量经济学 中处理线性 回归模型 中解释变量与 误差项 相关问题的核心参数估计方法。当模型的解释变量存在 内生性 (Endogeneity) 时,传统的 普通最小二乘法 (OLS) 会产生 有偏 (biased) 且 不一致 (inconsistent) 的估计量,而 2SLS 通过 工具变量 (Instrumental Variables, IV) 获得 一致性估计量 (consistent estimator),是 IV 估计中最常见的实现形式,也是计量经济学实证研究的必备工具。

内生性问题:为何需要 2SLS?

在经典线性回归模型 y=β0+β1x+u y = \beta_0 + \beta_1 x + u 中,核心假设是解释变量 x x 与误差项 u u 不相关,即 外生性 (Exogeneity)。当这一假设被违背,即 Cov(x,u)0 \mathrm{Cov}(x, u) \neq 0 时,x x 成为 内生变量,OLS 估计量 β^1OLS \hat{\beta}_1^{OLS} 的概率极限不再等于真实参数 β1 \beta_1 。内生性问题主要源于以下三个方面:

  1. 遗漏变量偏误 (Omitted Variable Bias):模型遗漏了同时影响 y y 且与 x x 相关的变量,该变量进入误差项 u u ,导致 x x u u 相关。这是实证研究中最常见的遗漏变量问题来源。
  2. 联立性 (Simultaneity)y y x x 之间存在双向因果关系,例如在供给需求系统中,价格与数量相互决定,使得价格变量内生。
  3. 测量误差 (Measurement Error):当解释变量 x x 的测量存在误差时,其测量值会与包含真实误差的扰动项相关,产生衰减偏误 (attenuation bias)。

一旦存在内生性,OLS 估计量不仅在有限样本中偏离真实值,而且即使样本容量趋于无穷大,该偏差也不会消失(即不一致)。因此需要一种能够从根本上解决这一问题的估计方法。

工具变量的两个基本条件

2SLS 的核心思想在于引入 工具变量 (Instrumental Variable, IV)。工具变量充当了从内生变量中提取外生变异的"过滤器"。一个合格的工具变量 z z 必须同时满足:

  1. 相关性 (Relevance)Cov(z,x)0 \mathrm{Cov}(z, x) \neq 0 ,即 z z 必须能解释 x x 的部分变动。若相关性过弱,会导致 弱工具变量 (Weak Instruments) 问题,使得 2SLS 估计量的有限样本性质严重恶化。
  2. 外生性 (Exogeneity),又称 排他性约束 (Exclusion Restriction)Cov(z,u)=0 \mathrm{Cov}(z, u) = 0 ,即 z z 只能通过影响 x x 来间接影响 y y ,不能有其他直接影响 y y 的渠道。这一条件无法用数据直接检验,必须依赖经济学理论的论证。

工具变量的作用在于将内生变量 x x 的变异分解为两部分:由 z z 决定的、与误差项 u u 无关的"干净"部分,以及与 u u 相关的"污染"部分。2SLS 正是通过分离并利用前者来获得一致性估计。常见的工具变量实例包括:利用政策变动作为外生冲击、利用地理或历史变量作为自然实验、或利用随机实验中的处理分配。

两阶段估计步骤

以结构方程 y=β0+β1x+u y = \beta_0 + \beta_1 x + u 为例,其中 x x 为内生变量,z z 为满足条件的工具变量。

第一阶段 (First Stage)

将内生变量 x x 对工具变量 z z 进行 OLS 回归:

x=π0+π1z+vx = \pi_0 + \pi_1 z + v

得到估计系数 π^0,π^1 \hat{\pi}_0, \hat{\pi}_1 ,进而计算预测值 x^=π^0+π^1z \hat{x} = \hat{\pi}_0 + \hat{\pi}_1 z 。由于 z z 外生,其线性组合 x^ \hat{x} 也渐近外生,即 x^ \hat{x} 与误差项 u u 在渐近意义上不相关。第一阶段的核心在于提取 x x 中仅由外生工具变量解释的变异。

第二阶段 (Second Stage)

用第一阶段得到的 x^ \hat{x} 替换原始结构方程中的内生变量 x x

y=β0+β1x^+errory = \beta_0 + \beta_1 \hat{x} + \text{error}

由此得到的 β^12SLS \hat{\beta}_1^{2SLS} 即为两阶段最小二乘估计量。该估计量克服了内生性问题,是 β1 \beta_1 的一致性估计量。其直观机制在于:第二阶段使用的是 x x 的"清洁版本" x^ \hat{x} ,它与误差项不再相关,因此 OLS 在此回归中恢复了一致性。

重要提示:手动分两步执行 OLS 得到的 标准误 (standard errors) 不正确,因为第二阶段未考虑 x^ \hat{x} 是第一阶段的估计值,存在额外的抽样不确定性。实际应用中必须使用专门的 IV 回归命令(如 Stata 的 \texttt{ivregress 2sls}、R 的 \texttt{iv\_robust})以获得正确的标准误。

多元回归模型中的 2SLS

当模型包含多个解释变量时,2SLS 的逻辑保持一致。设模型为:

y=β0+β1x1+β2w1+uy = \beta_0 + \beta_1 x_1 + \beta_2 w_1 + u

其中 x1 x_1 为内生变量,w1 w_1 为外生控制变量,z1 z_1 为工具变量。第一阶段将 x1 x_1 所有 外生变量回归(包括工具变量和模型中原有的外生控制变量):

x1=π0+π1z1+π2w1+vx_1 = \pi_0 + \pi_1 z_1 + \pi_2 w_1 + v

得到 x^1 \hat{x}_1 。第二阶段用 x^1 \hat{x}_1 替换 x1 x_1 进行回归,得到 β^1 \hat{\beta}_1 β^2 \hat{\beta}_2 的 2SLS 估计量。识别条件:要估计 k k 个内生解释变量的系数,至少需要 k k 个不在模型结构方程中出现的独立工具变量,这称为 阶数条件 (Order Condition)。若工具变量恰好等于内生变量数量,模型为 恰好识别 (Exactly Identified);若工具变量多于内生变量,则为 过度识别 (Overidentified)。

工具变量有效性检验

2SLS 的成败完全取决于工具变量的质量,因此检验工具变量的有效性至关重要:

  1. 相关性检验:在第一阶段回归中对工具变量的系数进行联合显著性 F 检验。一个广泛采用的经验法则是:若第一阶段的 F 统计量小于 10,则表明存在弱工具变量问题,此时 2SLS 在有限样本中的偏差可能比 OLS 更大,且通常的假设检验会严重扭曲。
  2. 外生性检验Cov(z,u)=0 \mathrm{Cov}(z, u) = 0 无法直接检验(涉及不可观测的误差项)。但在 过度识别 情形下,可进行 过度识别检验,常用 Sargan 检验Hansen J 统计量,其原假设为"所有工具变量均外生"。拒绝原假设意味着至少有一个工具变量不满足排他性约束,对 2SLS 估计的有效性构成严重挑战。恰好识别模型无法进行此项检验,此时外生性的成立必须完全依赖于经济理论与逻辑论证。

总结

两阶段最小二乘法是处理回归模型中内生性问题的标准方法。它通过工具变量将内生解释变量的变异分离为外生与内生两部分,利用外生部分获得一致性估计,是实证经济学中因果推断的核心工具之一。2SLS 的有效性完全取决于工具变量的质量——寻找和论证高质量、有说服力的工具变量往往是实证研究中最具挑战性也最具创造性的环节。在方法论上,2SLS 可视为更广义的 广义矩方法 (GMM) 在条件同方差假设下的特例。