ARTICLE

联立性偏误

联立性偏误 (Simultaneity Bias) 联立性偏误(Simultaneity Bias)是计量经济学中应用线性回归模型时的一种常见内生性(Endogeneity)问题。它发生于当模型中一个或多个解释变量与因变量是同时被决定的(联立决定),而非存在单向的因果关系时。这种双向因果关系或共同决定的结构,违反了普通最小二乘法(Ordinary Least

浏览 53 更新 2025-10-26

联立性偏误 (Simultaneity Bias)

联立性偏误(Simultaneity Bias)是计量经济学中应用线性回归模型时的一种常见内生性(Endogeneity)问题。它发生于当模型中一个或多个解释变量与因变量是同时被决定的(联立决定),而非存在单向的因果关系时。这种双向因果关系或共同决定的结构,违反了普通最小二乘法(Ordinary Least Squares, OLS)的一个核心假设,从而导致 OLS 估计量不仅是有偏的(biased),而且是不一致的(inconsistent)。

问题的本质:对 OLS 基本假设的违背

为了理解联立性偏误的根源,必须回归到 OLS 方法的基本假设。OLS 估计量能够成为最佳线性无偏估计量(BLUE),依赖于一系列假设,其中之一是解释变量与误差项不相关。用数学语言表达即 E[uX]=0\mathbb{E}[u|X] = 0,或者用较弱的协方差条件 Cov(xi,ui)=0\operatorname{Cov}(x_i, u_i) = 0 对所有 ii 成立。这个假设意味着,影响因变量 yiy_i 但未被模型解释的部分(即误差项 uiu_i),与任何解释变量 xix_i 都不相关。

然而在联立方程系统中,一个解释变量 xix_i 本身就是因变量 yiy_i 的函数,反之亦然。因此,任何影响 yiy_i 的随机冲击(体现在 uiu_i 中)都会通过这个联立系统反过来影响 xix_i,这就必然导致 xix_iuiu_i 相关,即 Cov(xi,ui)0\operatorname{Cov}(x_i, u_i) \neq 0。一旦这个假设被违背,OLS 估计程序就会错误地将 uiu_iyiy_i 的部分影响归因于 xix_i 的影响,从而产生有偏误的系数估计。

经典案例:供给与需求模型

供给与需求模型是解释联立性偏误最经典的例子。假设一个市场的需求和供给关系可以由以下两个线性方程表示:需求方程为 Qd=α0+α1P+udQ_d = \alpha_0 + \alpha_1 P + u_d,供给方程为 Qs=β0+β1P+usQ_s = \beta_0 + \beta_1 P + u_s。其中 α1\alpha_1需求的价格弹性相关系数,通常为负;β1\beta_1供给的价格弹性相关系数,通常为正;udu_dusu_s 是模型的误差项,分别代表需求和供给冲击。

在市场达到均衡时,需求量等于供给量,即 Qd=Qs=QQ_d = Q_s = Q。一位研究者可能天真地想通过回归观测到的数量 QQ 对价格 PP 来估计需求方程。但这里的核心问题是,观测到的价格 PP 并非一个外生变量,它是供给和需求共同作用下在系统内部决定的。求解均衡价格表达式,令 Qd=QsQ_d = Q_s,整理可得:

Peq=β0α0α1β1+usudα1β1P_{eq} = \frac{\beta_0 - \alpha_0}{\alpha_1 - \beta_1} + \frac{u_s - u_d}{\alpha_1 - \beta_1}

从这个式子可以清晰地看到,均衡价格 PeqP_{eq} 是需求冲击 udu_d 和供给冲击 usu_s 的函数。计算协方差 Cov(P,ud)=Var(ud)/(α1β1)\operatorname{Cov}(P, u_d) = -\operatorname{Var}(u_d)/(\alpha_1 - \beta_1)。由于 Var(ud)>0\operatorname{Var}(u_d) > 0α1<0\alpha_1 < 0β1>0\beta_1 > 0,分母 (α1β1)(\alpha_1 - \beta_1) 为负,因此 Cov(P,ud)>0\operatorname{Cov}(P, u_d) > 0,明确违反了 OLS 假设。OLS 回归线既没有描绘出真正的需求曲线也没有描绘出真正的供给曲线,而是描绘了一系列由需求和供给曲线共同移动所产生的均衡点的轨迹。

联立性偏误的后果

第一,有偏的估计量:OLS 估计的系数的期望值不等于真实的参数值。例如在供需模型中,OLS 估计的需求价格弹性系数会向上偏误(即偏向于零,绝对值变小)。第二,不一致的估计量:即使样本容量趋于无穷大,OLS 估计量也不会收敛于真实的参数值,简单地增加数据量无法解决这个问题。第三,无效的统计推断:由于估计量是错误的,基于这些估计量构建的t检验F检验置信区间都是无效的,会导致错误的结论和政策建议。

如何解决联立性偏误

解决联立性偏误问题的关键在于使用能够处理内生性的估计方法。最常用的方法是工具变量法(Instrumental Variables, IV)。一个有效的工具变量必须满足两个条件:一是相关性,即工具变量 ZZ 必须与内生解释变量 XX 相关,Cov(Z,X)0\operatorname{Cov}(Z, X) \neq 0;二是外生性(或称排他性约束),即工具变量 ZZ 必须与模型的误差项 uu 不相关,Cov(Z,u)=0\operatorname{Cov}(Z, u) = 0,这意味着 ZZ 只能通过影响 XX 来间接影响因变量 YY

在供需模型的例子中,要估计需求曲线,需要一个只影响供给而不直接影响需求的工具变量。例如天气状况(如降水量)可以作为好的工具变量:好的降水会增加农产品供给(移动供给曲线)从而影响价格 PP,但天气本身通常不直接影响消费者对该农产品的需求。最常见的 IV 估计方法是两阶段最小二乘法(Two-Stage Least Squares, 2SLS)。第一阶段将内生变量 PP 对工具变量 ZZ 进行回归得到 PP 的拟合值 P^\hat{P},这是 PP 中可以被外生变量 ZZ 解释的部分,与原始误差项不相关。第二阶段用第一阶段得到的拟合值 P^\hat{P} 替代原始的 PP 对原方程进行 OLS 回归。矩阵形式为 β^2SLS=(XPZX)1XPZy\hat{\beta}_{2SLS} = (\mathbf{X}'\mathbf{P}_Z\mathbf{X})^{-1}\mathbf{X}'\mathbf{P}_Z\mathbf{y},其中 PZ=Z(ZZ)1Z\mathbf{P}_Z = \mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}' 是投影矩阵。此外更复杂的系统估计方法如三阶段最小二乘法(3SLS)和广义矩估计(GMM)也可用于处理联立方程模型。

其他经济学实例

消费与收入:在凯恩斯主义模型中,消费是可支配收入的函数 (C=f(Yd)C = f(Y_d)),但国民收入本身也由消费构成 (Y=C+I+G+NXY = C + I + G + NX),两者联立决定。教育回报研究:工资是受教育水平的函数,但个人对未来工资的预期也可能影响其接受教育的决策,导致教育和工资之间存在双向因果关系。犯罪率与警察数量:犯罪率影响警察数量,而警察数量又影响犯罪率,简单回归会遭遇严重联立性偏误。因此,深入理解和正确处理联立性偏误问题,是实证研究中识别因果关系、避免虚假回归的关键环节,也是现代计量经济学因果推断方法不断发展的核心驱动力之一。