ARTICLE
Engle-Granger 两步法
Engle-Granger 两步法 (Engle-Granger Two-Step Method) Engle-Granger 两步法是由 罗伯特·恩格尔 (Robert Engle) 和 克莱夫·格兰杰 (Clive Granger) 于1987年在其经典论文 Co-Integration and Error Correction: Representat
Engle-Granger 两步法 (Engle-Granger Two-Step Method)
Engle-Granger 两步法是由 罗伯特·恩格尔 (Robert Engle) 和 克莱夫·格兰杰 (Clive Granger) 于1987年在其经典论文 Co-Integration and Error Correction: Representation, Estimation, and Testing 中提出的 协整检验 (Cointegration Test) 方法。该方法的核心思想是利用简单的 OLS估计 来检验两个或多个 非平稳时间序列 (Non-stationary Time Series) 之间是否存在 长期均衡关系 (Long-run Equilibrium Relationship)。恩格尔和格兰杰因这一贡献共同荣获2003年 诺贝尔经济学奖。Engle-Granger 两步法因其计算简便、直观易懂而成为应用计量经济学中最为广泛使用的协整检验工具之一。
背景与动机
在传统 时间序列分析 中,若直接对两个互不相关的 一阶单整 I(1) 序列进行 回归分析,往往会出现 伪回归 (Spurious Regression) 现象——即回归系数在统计上高度显著、拟合优度 极高,但 Durbin-Watson 统计量 却极低,表明残差存在严重的 自相关 (Autocorrelation)。格兰杰(1981)和恩格尔与格兰杰(1987)的贡献在于指出:尽管许多经济变量(如 消费 与 收入、短期利率与长期利率、汇率 与 价格水平)各自呈现非平稳的随机游走行为,但它们之间可能存在一种 长期均衡关系,使得它们的某个 线性组合 在统计意义上是平稳的。当这种关系存在时,变量被称为是 协整的 (Cointegrated),而 Engle-Granger 两步法正是检验这种协整关系存在与否的经典方法。
第一步:估计长期均衡方程
Engle-Granger 两步法的第一步是对可能存在协整关系的变量进行 静态OLS回归 (Static OLS Regression),估计长期均衡方程。考虑两个 I(1) 序列 和 ,设定回归模型为:
其中 和 为待估参数, 为误差项。通过 OLS 估计得到参数估计值 和 ,进而计算 残差序列 (Residual Series):
在这一步中,由于变量 和 均为一阶单整,传统的 OLS 推断(如 t 检验和 F 检验)已不再适用,但 OLS 估计量本身具有 超一致性 (Super-consistency) 的性质——即当变量存在协整关系时, 以 的速率收敛于真实参数值 ,远快于平稳回归中的 收敛速率。这一性质使得即使忽略 内生性 (Endogeneity) 和 自相关误差 (Autocorrelated Errors) 问题,OLS 估计仍能给出参数的一致估计。
第二步:残差单位根检验
第二步的核心任务是对第一步得到的残差序列 进行 单位根检验 (Unit Root Test),以判断其是否平稳。若残差序列是平稳的(即拒绝单位根原假设),则表明 和 之间存在协整关系;反之,若残差序列仍存在单位根(即非平稳),则两变量之间不存在长期均衡关系,第一步的回归结果为伪回归。
实际操作中,最常用的检验方法是 扩展的 Dickey-Fuller 检验 (Augmented Dickey-Fuller Test, ADF Test),对残差序列拟合以下回归方程:
检验的原假设为 (即残差存在单位根,变量间不存在协整关系),备择假设为 (即残差平稳,变量间存在协整关系)。
临界值与分布特征
Engle-Granger 两步法的一个关键特性在于:检验残差平稳性时不能直接使用标准 ADF 检验的临界值表。这是因为残差 并非真正的误差项 ,而是从 OLS 回归中估计得到的,其分布受到参数估计过程的影响。恩格尔和格兰杰(1987)以及 麦金农 (MacKinnon, 1991, 1996) 通过 蒙特卡洛模拟 获得了专门用于协整检验的临界值表。这些临界值取决于以下因素:
- 样本容量 :临界值随样本量的增大而趋于更加严格。
- 回归变量个数 :随着协整回归中变量数量的增加,临界值的绝对值也相应增大,这反映了"数据挖掘"效应——在更高维度的空间中更容易错误地发现协整关系。
- 回归设定形式:回归方程是否包含截距项和 时间趋势 项直接影响临界值的取值。常用设定包括:无截距无趋势、含截距无趋势、含截距含趋势三种情形。
麦金农(1991, 1996)提供了响应面函数形式的临界值计算公式,使得研究者可以针对任意样本量快速计算相应的临界值,极大地便利了 Engle-Granger 两步法的实际应用。
误差修正模型与格兰杰表达定理
Engle-Granger 两步法的一个重要延伸是 格兰杰表达定理 (Granger Representation Theorem),该定理由恩格尔和格兰杰(1987)共同证明。该定理指出:如果一组 I(1) 变量之间存在协整关系,则它们必然可以表示为一个 误差修正模型 (Error Correction Model, ECM)。具体而言,若 和 存在协整关系,则存在如下 ECM 表示:
其中, 即为滞后一期的 误差修正项 (Error Correction Term),它反映了系统在 t 时刻偏离长期均衡的程度。系数 (通常为负值)被称为 调整速度 (Speed of Adjustment),衡量系统每期向长期均衡回复的比例。ECM 的优越之处在于,它同时刻画了系统的短期动态调整过程(由差分项捕捉)和长期均衡关系(由误差修正项承载),实现了短期波动与长期均衡的统一分析框架。
应用场景
Engle-Granger 两步法在经济学和金融学的多个领域有着广泛应用:
- 宏观经济学:检验 消费函数 中消费与收入的长期均衡关系;分析 购买力平价 (PPP) 理论下汇率与价格水平的协整性;研究 利率期限结构 中短期利率与长期利率之间的联动关系。
- 金融经济学:检验 股票市场 中不同公司股票价格之间是否存在共同趋势;分析 期货价格 与 现货价格 之间的长期均衡关系,为套利策略提供依据。
- 国际经济学:检验 出口 与 进口 之间的长期均衡关系;分析不同国家 GDP 序列的协同运动模式。
- 环境经济学:研究 碳排放 与 经济增长 之间的长期关系,为 环境库兹涅茨曲线 (Environmental Kuznets Curve) 假说提供统计检验。
局限性与替代方法
尽管 Engle-Granger 两步法应用广泛,但存在若干明显的局限性:
- 变量顺序敏感性:在 对 回归和 对 回归两种设定下,残差序列不同,协整检验的结论可能截然不同。这种不对称性使得研究者面临变量归一化选择的困境。在实践中,通常根据经济理论来确定哪个变量应充当被解释变量。
- 无法检验多重协整关系:当涉及三个及以上变量时,系统中可能存在多个协整向量(即多个线性组合均为平稳过程)。Engle-Granger 两步法最多只能识别出一个协整关系,无法处理此类多重协整情形。
- 小样本偏差:在样本量较小时,两步法的检验功效 (Statistical Power) 显著下降,容易犯第二类错误——即实际存在协整关系但未能拒绝伪回归假设。
- 同质调整速度假设:ECM 框架中隐含假设所有变量以相同的速度向均衡调整,这一假设在实际经济系统中常常过于严格。
- 不能检验协整向量的结构假设:Engle-Granger 两步法无法检验关于协整向量具体值的假设,如 等经济理论蕴含的约束条件。
为克服上述局限,Johansen 检验 (Johansen Test, 1988, 1991) 提供了更为一般的框架。Johansen 检验基于 向量自回归模型 (VAR) 的 极大似然估计 (MLE),可以同时检验多个协整关系,并对协整向量的线性约束进行假设检验。然而,Johansen 检验对滞后阶数的选择更为敏感,且在小样本下存在 过度拒绝 (Over-rejection) 的倾向。在实际应用中,研究者通常结合两种方法进行交叉验证:先用 Engle-Granger 两步法进行初步诊断,再使用 Johansen 检验进行更为深入的协整结构分析。
软件实现
主流统计软件均提供了 Engle-Granger 两步法的实现。在 R 语言中,\texttt{urca} 包的 \texttt{ca.po()} 函数和 \texttt{egcm} 包可实现协整检验;在 Python 中,\texttt{statsmodels.tsa.stattools.coint()} 函数提供了 Engle-Granger 协整检验的便捷接口;在 EViews 中,协整检验作为时间序列分析模块的内置功能可直接调用;在 Stata 中,\texttt{egranger} 命令专门用于执行 Engle-Granger 两步法协整检验。这些软件实现通常会自动报告基于麦金农临界值的检验结果,并可选地输出 ECM 估计结果。