ARTICLE

协整

协整 (Cointegration) 协整 (Cointegration) 是时间序列分析中的核心概念,由 Clive Granger 于 1981 年提出,后与 Robert Engle 合作完善,二人因此获得 2003 年诺贝尔经济学奖。协整描述的是:两个或多个非平稳时间序列之间可能存在一种长期稳定的均衡关系,尽管每个序列各自是 I(1)(一阶单整),但

浏览 0 更新 2025-11-18

协整 (Cointegration)

协整 (Cointegration) 是时间序列分析中的核心概念,由 Clive Granger 于 1981 年提出,后与 Robert Engle 合作完善,二人因此获得 2003 年诺贝尔经济学奖。协整描述的是:两个或多个非平稳时间序列之间可能存在一种长期稳定的均衡关系,尽管每个序列各自是 I(1)I(1)(一阶单整),但它们的某个线性组合却是 I(0)I(0)(平稳的)。

协整的革命性在于它为经济学家提供了一条"第三条道路":在此之前,研究者面对非平稳数据只有两种选择——要么对数据进行差分以消除趋势(但丢失了长期信息),要么直接对水平值回归(但面临伪回归风险)。这一困境在宏观经济学中尤为突出:许多核心理论(如永久收入假说、购买力平价)预测变量间存在长期均衡,但用于检验这些理论的数据几乎都是非平稳的。协整与 误差修正模型 (ECM) 的结合,使得短期动态调整与长期均衡关系可以在同一框架内建模,从而从根本上化解了这一方法论难题。

伪回归问题

协整概念诞生于对伪回归 (Spurious Regression) 的深刻反思。GrangerNewbold (1974) 通过蒙特卡洛模拟揭示了一个令人警醒的现象:对两个完全独立的随机游走序列进行 OLS 回归,即使在两者毫无经济关联的情况下,仍常常得到统计显著的 tt 值和较高的 R2R^2,且 Durbin-Watson 统计量偏低。这就是伪回归——看似"显著"的统计推断实为谬误。伪回归的根本原因在于非平稳序列的随机趋势 (Stochastic Trend) 导致了标准推断失效,这一发现彻底改变了应用计量经济学的研究规范。

定义与数学表述

{yt}\{y_t\}{xt}\{x_t\} 均为 I(1)I(1) 过程,即它们的一阶差分 Δyt\Delta y_tΔxt\Delta x_t 是平稳的。若存在一个非零向量 β=(1,θ)\beta = (1, -\theta)' 使得线性组合

ut=ytθxtI(0)u_t = y_t - \theta x_t \sim I(0)

是平稳过程,则称 yty_txtx_t协整的 (Cointegrated),记作 yt,xtCI(1,1)y_t, x_t \sim CI(1,1)。向量 β\beta 称为协整向量 (Cointegrating Vector),标量 θ\theta 为协整参数。更一般地,对于 nnI(1)I(1) 变量组成的向量 YtY_t,若存在 rr 个线性独立的协整向量(0<r<n0 < r < n),则称该系统存在秩为 rr 的协整关系,其中 rr 称为协整秩 (Cointegrating Rank)。

直观上,协整意味着变量之间被一种"引力"约束着:虽然每个变量各自游走不定,但它们之间的某种线性差距始终围绕一个均值回复,不会偏离太远。典型的协整例子包括:短期利率与长期利率(期限结构)、消费与收入、股价与股息等。

恩格尔-格兰杰两步法

EngleGranger (1987) 提出了检验与估计协整关系的经典程序,即 恩格尔-格兰杰两步法 (Engle-Granger Two-Step Method):

第一步,用 OLS 估计长期均衡关系(协整回归):

yt=α^+θ^xt+u^ty_t = \hat{\alpha} + \hat{\theta} x_t + \hat{u}_t

第二步,对残差序列 u^t\hat{u}_t 进行 ADF检验(不含常数项和趋势项),检验其是否平稳。若拒绝"存在单位根"的零假设(即残差平稳),则认为变量间存在协整关系。需注意,该检验的临界值不能使用标准 DF 分布,而应使用 Engle-Granger 协整检验专用的临界值(比标准 DF 临界值更负),因为残差来自第一步估计。

若协整关系成立,则可将第一步估计的残差滞后项 u^t1\hat{u}_{t-1} 作为误差修正项纳入短期动态方程,建立 误差修正模型 (ECM):

Δyt=γ0+γ1Δxt+λu^t1+εt\Delta y_t = \gamma_0 + \gamma_1 \Delta x_t + \lambda \hat{u}_{t-1} + \varepsilon_t

其中 λ<0\lambda < 0 为调整系数,衡量系统向长期均衡调整的速度。

格兰杰表示定理

格兰杰表示定理 (Granger Representation Theorem) 是协整理论的数学基石。该定理指出:若一组 I(1)I(1) 变量之间存在协整关系,则该系统必然可以等价地表示为向量误差修正模型 (VECM);反之,任何 VECM 都蕴含着一组协整关系。形式上,对于 nnI(1)I(1) 向量 YtY_t,存在 VECM 表示:

ΔYt=ΠYt1+i=1p1ΓiΔYti+εt\Delta Y_t = \Pi Y_{t-1} + \sum_{i=1}^{p-1} \Gamma_i \Delta Y_{t-i} + \varepsilon_t

其中 Π=αβ\Pi = \alpha \beta'n×nn \times n 矩阵,可分解为调整速度矩阵 α\alpha (n×rn \times r) 与协整向量矩阵 β\beta (n×rn \times r) 的乘积。该定理将长期均衡(β\beta)与短期调整(α\alpha)统一于一个紧凑的线性框架。

Johansen 协整检验

恩格尔-格兰杰方法的一个局限是它只能检验单一协整关系,且在多个变量时可能因标准化选择而产生歧义。Johansen (1988, 1991) 基于 VAR 模型的极大似然估计提出了系统性的协整检验方法,可以同时确定协整秩 rr 并估计所有协整向量。Johansen 方法提供两种似然比检验统计量:迹统计量 (Trace Statistic) 和最大特征值统计量 (Maximum Eigenvalue Statistic),二者分别检验 H0:rr0H_0: r \leq r_0H0:r=r0H_0: r = r_0 备择 r=r0+1r = r_0 + 1

应用与局限

协整分析广泛应用于宏观经济学(货币需求、购买力平价)、金融学(期货与现货价格、利率期限结构)和国际经济学。其核心贡献在于使研究者不再被迫在"差分丢失信息"与"水平伪回归"之间二择其一。在实证研究中,协整已经成为处理非平稳时间序列的标准范式:研究者首先进行单位根检验确认变量单整阶数,然后通过协整检验探寻长期均衡,最后在 VECM 框架内同时估计长短期效应。

然而协整方法也有限制:(1)要求变量同阶单整(通常为 I(1)I(1)),对 I(2)I(2) 或分数阶单整需借助多协整 (Multicointegration) 或分数协整 (Fractional Cointegration) 等特殊处理;(2)协整关系捕捉的是线性长期均衡,若真实关系是非线性的,则需借助阈值协整 (Threshold Cointegration) 或平滑转移协整等非线性格兰杰类方法;(3)在有限样本下,协整检验的功效可能不高,特别是当调整速度缓慢(λ\lambda 接近零)或样本量较小时容易漏判;(4)协整关系可能因结构突变 (Structural Break) 而改变,忽略突变点会导致检验偏误,需使用考虑结构突变的协整检验(如 Gregory-Hansen 检验)。尽管有诸多扩展,协整的基本思想——非平稳变量可以分享共同的随机趋势——已成为现代时间序列计量经济学最深刻也最具操作性的洞见之一。