ARTICLE

同时性偏误

同时性偏误 (Simultaneity Bias) 同时性偏误 (Simultaneity Bias),也称为联立性偏误,是计量经济学中内生性问题的三大经典来源之一(其余两者为遗漏变量偏误与测量误差)。它产生于这样一种情形:回归模型中的解释变量与被解释变量并非单向因果关系,而是被同一个经济系统同时决定——即两者互为因果、相互反馈。当这种双向决定机制存在时,解

浏览 4 更新 2025-10-26

同时性偏误 (Simultaneity Bias)

同时性偏误 (Simultaneity Bias),也称为联立性偏误,是计量经济学内生性问题的三大经典来源之一(其余两者为遗漏变量偏误测量误差)。它产生于这样一种情形:回归模型中的解释变量与被解释变量并非单向因果关系,而是被同一个经济系统同时决定——即两者互为因果、相互反馈。当这种双向决定机制存在时,解释变量必然与误差项相关,从而违背普通最小二乘法 (OLS) 的核心假设 E[εX]=0 \mathbb{E}[\varepsilon \mid X] = 0 ,导致 OLS 估计量既有偏不一致

问题的本质:为何 OLS 失效

考虑线性回归模型 Y=β0+β1X+ε Y = \beta_0 + \beta_1 X + \varepsilon 。OLS 一致性的基石是解释变量与误差项不相关,即 Cov(X,ε)=0 \operatorname{Cov}(X, \varepsilon) = 0 。当 XXYY 同时被决定时,任何冲击 ε \varepsilon 在影响 YY 的同时,经由经济系统内部的反馈回路,也会改变 XX 的取值,从而使得 Cov(X,ε)0 \operatorname{Cov}(X, \varepsilon) \neq 0 。OLS 于是将误差项对 YY 的部分效应错误地归因于 XX,产生系统性偏误。

这一问题的严重性在于其不一致性:偏误不会随样本容量的增大而消失。即使拥有无限多的观测数据,OLS 估计量也不会依概率收敛到真实参数值。这与异方差等问题形成鲜明对比——后者仅影响有效性,而无偏性与一致性得以保留。

经典示例:供给与需求模型

供给与需求系统是阐释同时性偏误最直观的框架。设市场需求与供给方程分别为:

Qd=α0+α1P+ud(需求方程,  α1<0)Qs=β0+β1P+us(供给方程,  β1>0)\begin{aligned} Q^d &= \alpha_0 + \alpha_1 P + u_d \quad (\text{需求方程}, \; \alpha_1 < 0) \\ Q^s &= \beta_0 + \beta_1 P + u_s \quad (\text{供给方程}, \; \beta_1 > 0) \end{aligned}

在市场出清条件下,Qd=Qs=Q Q^d = Q^s = Q 。研究者若天真地以 OLS 估计需求方程 Q=α0+α1P+ud Q = \alpha_0 + \alpha_1 P + u_d ,将面临严重的内生性问题:观测到的价格 PP 并非外生变量,而是由供给冲击 usu_s 和需求冲击 udu_d 共同决定的内生结果。

联立求解均衡价格:

P=β0α0α1β1+usudα1β1P = \frac{\beta_0 - \alpha_0}{\alpha_1 - \beta_1} + \frac{u_s - u_d}{\alpha_1 - \beta_1}

由此可计算 PP 与需求冲击 udu_d 的协方差(假设 Cov(us,ud)=0 \operatorname{Cov}(u_s, u_d) = 0 ):

Cov(P,ud)=Var(ud)α1β1>0\operatorname{Cov}(P, u_d) = -\frac{\operatorname{Var}(u_d)}{\alpha_1 - \beta_1} > 0

因为 α1β1<0 \alpha_1 - \beta_1 < 0 (需求曲线向下、供给曲线向上),协方差为正。OLS 估计量 α^1\hat{\alpha}_1 的概率极限为:

plim(α^1)=α1+Cov(P,ud)Var(P)>α1\operatorname{plim}(\hat{\alpha}_1) = \alpha_1 + \frac{\operatorname{Cov}(P, u_d)}{\operatorname{Var}(P)} > \alpha_1

由于真实的 α1 \alpha_1 为负,这一正向偏误使估计的需求曲线过于平坦——OLS 回归线既不反映真实需求曲线,也不反映真实供给曲线,而仅仅描绘了供需曲线共同移动所产生的均衡点轨迹。

数学结构:从结构式到简约式

同时性偏误的根源可通过联立方程模型的结构式与简约式之区分来严格理解。结构式 (structural form) 表达经济理论所设定的行为关系,其中内生变量出现在方程的左侧与右侧。简约式 (reduced form) 则将每一个内生变量表示为所有外生变量与随机扰动项的显函数。

一般地,考虑包含 GG 个内生变量的线性联立系统:

YΓ+XB=U\mathbf{Y} \boldsymbol{\Gamma} + \mathbf{X} \mathbf{B} = \mathbf{U}

其中 Y\mathbf{Y}n×Gn \times G 的内生变量矩阵,X\mathbf{X}n×Kn \times K 的外生变量矩阵。其简约式为:

Y=XBΓ1+UΓ1=XΠ+V\mathbf{Y} = -\mathbf{X} \mathbf{B} \boldsymbol{\Gamma}^{-1} + \mathbf{U} \boldsymbol{\Gamma}^{-1} = \mathbf{X} \boldsymbol{\Pi} + \mathbf{V}

简约式参数 Π=BΓ1\boldsymbol{\Pi} = -\mathbf{B} \boldsymbol{\Gamma}^{-1} 揭示了每个内生变量如何受所有外生变量与全部结构扰动项的共同驱动。这正是 Cov(Xendo,ε)0 \operatorname{Cov}(X_{\text{endo}}, \varepsilon) \neq 0 的结构性来源:任何一个结构方程中的内生解释变量,在简约式中都是所有结构方程扰动项的函数。

识别条件

在试图估计联立系统之前,必须确认目标方程是可识别的 (identified)。两个经典条件为:

  1. 阶条件 (Order Condition):方程排除的外生变量数目不得少于该方程包含的内生解释变量数目减一。这是识别的必要条件。
  2. 秩条件 (Rank Condition):从系统中其余方程的结构参数中,可构造出与被估计方程排除变量对应且满秩的子矩阵。这是识别的充分必要条件。

若阶条件以等式成立,方程为恰好识别 (exactly identified);以严格不等式成立则为过度识别 (over-identified)。识别不足 (under-identified) 的方程,其结构参数在数学上不可能从数据中唯一恢复。

估计方法

处理同时性偏误的基准方法是工具变量法 (IV) 及其实现形式两阶段最小二乘法 (2SLS)。一个有效的工具变量 ZZ 需满足:

  1. 相关性 (Relevance)Cov(Z,X)0 \operatorname{Cov}(Z, X) \neq 0 ,工具变量必须能解释内生解释变量的部分变异。
  2. 外生性 (Exogeneity)Cov(Z,ε)=0 \operatorname{Cov}(Z, \varepsilon) = 0 ,工具变量仅通过影响内生解释变量来间接作用于被解释变量,不直接进入结构方程。

2SLS 分为两步:

  1. 第一阶段:将内生解释变量对所有外生变量(含工具变量)回归,得到拟合值 X^ \hat{X} 。该拟合值由外生变异驱动,与结构误差渐近不相关。
  2. 第二阶段:以 X^ \hat{X} 替换原始内生变量,再次执行 OLS,得到一致的结构参数估计。

在过度识别情形下,广义矩估计 (GMM) 提供了比 2SLS 更有效率的估计量,尤其是在存在异方差自相关的条件下。对于包含多个联立方程的完整系统,三阶段最小二乘法 (3SLS) 和完全信息最大似然法 (FIML) 利用跨方程的误差协方差结构,可进一步提升估计效率。

与其他内生性来源的比较

同时性偏误与遗漏变量偏误测量误差共同构成内生性的三大来源,但三者在机制上有本质区别。遗漏变量偏误源于不可观测的混淆因素同时影响 XXYY;测量误差源于解释变量的观测值与真实值之间的系统性偏差;而同时性偏误则源于经济系统内部的双向因果关系,是经济均衡本质的直接反映。在实际研究中,三者常交织并存——例如,在估计教育回报率时,受教育年限既可能与不可观测的能力(遗漏变量)相关,也可能与预期工资存在双向因果(同时性),同时教育年限本身也可能存在报告误差(测量误差)。

检测:Hausman 内生性检验

豪斯曼检验 (Hausman Test) 是检测同时性偏误的经典统计工具。其核心思想是:在原假设(所有解释变量均为外生)下,OLS 与 IV/2SLS 估计量均是一致的,但 OLS 更有效率;在备择假设(存在内生性)下,仅 IV/2SLS 保持一致,OLS 不再一致。若两种估计量的差异在统计上显著,则拒绝外生性原假设,判定同时性偏误存在。检验统计量服从卡方分布,自由度为内生解释变量的数目。

经济学实例

同时性偏误广泛存在于各类经济实证研究中。在劳动经济学中,工资与工作时长、教育投资与未来收入均存在双向决定。在产业组织领域,价格与市场份额、广告投入与销售额相互影响。在宏观经济学中,消费与国民收入、货币供给与利率均构成联立系统——这正是考尔斯委员会在 20 世纪 40 年代推动联立方程方法论发展的核心动因。在金融学中,股价与交易量、杠杆率与企业价值同样存在反馈回路。理解并处理同时性偏误,是实证研究者从相关性推断走向因果识别的关键一步。