知经 KNOWECON · 卓越的经济金融统计数学学习平台

联立性

# 联立性 (Simultaneity)

联立性 (Simultaneity) 是{{{计量经济学}}}中一个核心的{{{内生性 (Endogeneity)}}}问题。它描述了一种情况,即模型中的一个或多个解释变量(自变量)与因变量是相互作用、共同决定的,而不是单向的因果关系。当联立性存在时,解释变量会与误差项相关,这违反了{{{普通最小二乘法 (OLS)}}}的关键假定之一,即解释变量的严格外生性。

具体来说,在一个{{{回归模型}}} $Y = \beta_0 + \beta_1 X + u$ 中,我们通常假设 $X$ 对 $Y$ 有影响,但 $Y$ 的变化不会反过来影响 $X$。然而,在许多经济系统中,变量之间存在反馈回路(feedback loop)。例如,价格影响需求量,同时需求量也与供给共同决定了价格。这种双向因果或共同决定的关系就是联立性的本质。

## 一. 问题的根源:违反OLS的外生性假定

{{{OLS}}}估计量要具备无偏性和一致性,其核心假定之一是解释变量与误差项不相关,即 $E(u | X) = 0$。这个假定被称为零条件均值假定。这意味着在给定解释变量 $X$ 的情况下,误差项 $u$ 的期望值为零。误差项代表了所有影响 $Y$ 但未被模型包含的因素。如果 $X$ 与这些未观测因素无关,那么该假定成立。

然而,在联立方程模型 (Simultaneous Equations Model) 中,至少有一个解释变量是由系统内的其他方程决定的,这使得它必然与其中一个方程的误差项相关。

我们以宏观经济学中最经典的供需模型为例来说明:

假设我们想估计冰淇淋市场的{{{需求曲线}}}: $$Q^d = \alpha_0 + \alpha_1 P + u_d \quad (1)$$ 其中,$Q^d$ 是需求量,$P$ 是价格,$u_d$ 是需求冲击(如天气突然变热、消费者偏好改变等),代表了除价格外影响需求的所有未观测因素。根据经济学理论,我们预期 $\alpha_1 < 0$。

同时,市场上还有一条{{{供给曲线}}}: $$Q^s = \beta_0 + \beta_1 P + u_s \quad (2)$$ 其中,$Q^s$ 是供给量,$u_s$ 是供给冲击(如牛奶成本突然上升、生产技术革新等)。我们预期 $\beta_1 > 0$。

在市场出清的{{{均衡}}}状态下,需求量等于供给量: $$Q^d = Q^s = Q \quad (3)$$

现在的问题是:我们能否直接使用观测到的价格和数量数据 $(P_i, Q_i)$,通过OLS回归方程(1)来得到对价格弹性 $\alpha_1$ 的无偏估计?

答案是不能。理由如下: 假设出现一个正的需求冲击 $u_d > 0$(例如,异常炎热的天气导致人们想吃更多冰淇淋)。这个冲击会使需求曲线向右移动。在新的均衡点,价格 $P$ 和数量 $Q$ 都会上升。这意味着 $u_d$ 的增加导致了 $P$ 的增加。因此,解释变量 $P$ 与方程(1)中的误差项 $u_d$ 是正相关的,即 $Cov(P, u_d) > 0$。这直接违反了OLS的外生性假定。

## 二. 数学证明:联立性如何导致内生性

我们可以通过求解该系统的{{{简约式模型 (Reduced-Form Model)}}}来严格证明这种相关性。结构式模型(如方程(1)和(2))描述了变量之间的理论关系,而简约式模型则将内生变量(这里是 $P$ 和 $Q$)表示为所有外生变量和随机误差项的函数。

将 $Q^d = Q^s = Q$ 代入,我们得到: $$\alpha_0 + \alpha_1 P + u_d = \beta_0 + \beta_1 P + u_s$$

现在,我们解出均衡价格 $P$: $$(\alpha_1 - \beta_1)P = \beta_0 - \alpha_0 + u_s - u_d$$ $$P = \frac{\beta_0 - \alpha_0}{\alpha_1 - \beta_1} + \frac{u_s - u_d}{\alpha_1 - \beta_1} \quad (4)$$

这个方程就是价格 $P$ 的简约式。它清晰地表明,均衡价格 $P$ 是由模型的参数、以及需求冲击 $u_d$ 和供给冲击 $u_s$ 共同决定的。

现在我们来计算解释变量 $P$ 和需求方程误差项 $u_d$ 的协方差 $Cov(P, u_d)$: $$Cov(P, u_d) = Cov\left( \frac{\beta_0 - \alpha_0}{\alpha_1 - \beta_1} + \frac{u_s - u_d}{\alpha_1 - \beta_1}, u_d \right)$$ 由于常数项的协方差为零,且通常假定需求冲击和供给冲击不相关 ($Cov(u_s, u_d) = 0$),上式简化为: $$Cov(P, u_d) = \frac{Cov(u_s, u_d) - Cov(u_d, u_d)}{\alpha_1 - \beta_1} = \frac{0 - Var(u_d)}{\alpha_1 - \beta_1} = -\frac{Var(u_d)}{\alpha_1 - \beta_1}$$ 因为方差 $Var(u_d)$ 恒为正,而 $\alpha_1 < 0$ (向下倾斜的需求曲线) 且 $\beta_1 > 0$ (向上倾斜的供给曲线),所以分母 $(\alpha_1 - \beta_1)$ 是负的。因此: $$Cov(P, u_d) = -\frac{(+)}{(-)} > 0$$ 这数学上证明了价格 $P$ 和需求冲击 $u_d$ 正相关。

## 三. 联立性的后果:联立性偏误

当解释变量与误差项相关时,使用OLS进行估计会导致有偏 (Biased)不一致 (Inconsistent) 的结果。这种偏误被称为联立性偏误 (Simultaneity Bias)

对于简单回归模型,OLS估计量 $\hat{\alpha}_1$ 的概率极限是: $$ \text{plim}(\hat{\alpha}_1) = \alpha_1 + \frac{Cov(P, u_d)}{Var(P)} $$ 由于我们已经证明 $Cov(P, u_d) > 0$,且 $Var(P) > 0$,所以 $\frac{Cov(P, u_d)}{Var(P)} > 0$。这意味着: $$ \text{plim}(\hat{\alpha}_1) > \alpha_1 $$ 由于真实的 $\alpha_1$ 是负数,这个正向的偏误会使得OLS估计出的需求曲线比真实的更平坦(即弹性绝对值更小),甚至可能得到一个正的斜率,这与经济学理论完全相悖。

不一致性是一个比有偏性更严重的问题。它意味着即使样本容量趋于无穷大,OLS估计量也不会收敛到真实的参数值。因此,简单地增加样本数据量无法解决联立性问题。

## 四. 识别与解决方法

为了解决联立性问题,我们需要使用OLS以外的估计方法。但在估计之前,必须首先解决{{{识别问题 (Identification Problem)}}}。一个方程被认为是已识别的 (identified),意味着我们可以从数据的简约式中唯一地求解出该方程的结构参数。

* 阶条件 (Order Condition):一个简便的必要条件。它要求一个方程中被排除的外生变量数目必须大于或等于该方程中包含的内生解释变量数目减一。 * 秩条件 (Rank Condition):一个充分必要条件,形式更复杂,确保方程组的系数矩阵满足一定的秩要求。

一旦确认我们想估计的方程是已识别的,就可以采用以下方法进行估计:

### 1. 工具变量法 (Instrumental Variables, IV) 核心思想是找到一个或多个{{{工具变量}}} (Z),这些变量需要满足两个条件: * 相关性 (Relevance):工具变量 $Z$ 与内生解释变量 $X$ 相关,即 $Cov(Z, X) \neq 0$。 * 外生性 (Exogeneity):工具变量 $Z$ 与模型的误差项 $u$ 不相关,即 $Cov(Z, u) = 0$。

在我们的供需模型中,如果要估计需求方程(1),我们需要一个工具变量来替代内生的价格 $P$。一个好的工具变量是能够移动供给曲线但不会直接影响需求曲线的变量。例如,天气状况(如影响甘蔗产量的降雨量)是一个很好的供给方工具变量。降雨量影响供给,从而影响价格,满足相关性;但通常天气本身不直接影响冰淇淋消费者的偏好(除非天气是需求冲击本身),满足外生性。

### 2. 两阶段最小二乘法 (Two-Stage Least Squares, 2SLS/TSLS) {{{2SLS}}}是应用工具变量法最常见的方式,其过程分为两个阶段:

* 第一阶段:将内生解释变量($P$)对所有外生变量(包括需求方程中已有的外生变量和我们找到的工具变量 $Z$)进行OLS回归。 $$P = \pi_0 + \pi_1 Z_1 + $...$ + \pi_k Z_k + v$$ 其中 $\{Z_1, $...$, Z_k\}$ 是系统中所有的外生变量。然后,得到 $P$ 的拟合值 $\hat{P}$。这个 $\hat{P}$ 是 $P$ 中能够被所有外生变量解释的部分。由于它完全由外生变量构成,因此它与原始结构方程的误差项 $u_d$ 是(在渐近意义上)不相关的。

* 第二阶段:用第一阶段得到的拟合值 $\hat{P}$ 替代原始需求方程中的 $P$,然后对这个新方程进行OLS回归。 $$Q = \alpha_0 + \alpha_1 \hat{P} + \text{error}$$ 此时得到的估计量 $\hat{\alpha}_{1, 2SLS}$ 是对真实参数 $\alpha_1$ 的一致估计。

### 3. 系统估计方法 当一个模型包含多个需要估计的联立方程时,可以采用系统估计方法,如{{{三阶段最小二乘法 (3SLS)}}}或{{{广义矩方法 (GMM)}}},它们能够同时估计所有方程的参数,并且在某些条件下比2SLS更有效率。