ARTICLE

格兰杰因果检验

格兰杰因果检验 (Granger Causality Test) 格兰杰因果检验 (Granger Causality Test) 是由英国计量经济学家克莱夫·格兰杰 (Clive Granger) 于 1969 年提出的统计假设检验方法，用于判断一个时间序列 (Time Series) 是否有助于预测另一个时间序列。其核心思想并非哲学意义上的因果性，而是预

浏览 0 更新 2026-07-12

格兰杰因果检验 (Granger Causality Test)

格兰杰因果检验 (Granger Causality Test) 是由英国计量经济学家克莱夫·格兰杰 (Clive Granger) 于 1969 年提出的统计假设检验方法，用于判断一个时间序列 (Time Series) 是否有助于预测另一个时间序列。其核心思想并非哲学意义上的因果性，而是预测因果性 (Predictive Causality)：若在预测 $Y_t$ 时，引入 $X_{t-1}, X_{t-2}, \ldots$ 的滞后信息能显著降低预测误差的方差，则称 $X$ 是 $Y$ 的格兰杰原因 (Granger Cause)。

格兰杰因这一贡献于 2003 年获得诺贝尔经济学奖。该方法已成为宏观经济学、金融学、神经科学和政治学等领域中分析变量间时序依赖关系的标准工具。

定义与数学表述

设 $\{X_t\}$ 和 $\{Y_t\}$ 为两个平稳协方差平稳时间序列。令 $\mathcal{F}_t^{(Y)}$ 为截至 $t$ 时刻由 $Y$ 的滞后值生成的信息集， $\mathcal{F}_t^{(X,Y)}$ 为同时包含 $X$ 和 $Y$ 滞后值的信息集。若

\operatorname{Var}\bigl(Y_t \mid \mathcal{F}_{t-1}^{(X,Y)}\bigr) < \operatorname{Var}\bigl(Y_t \mid \mathcal{F}_{t-1}^{(Y)}\bigr),

即加入 $X$ 的滞后信息能显著减小 $Y$ 的预测误差方差，则称 $X$ Granger 引起 $Y$ ，记作 $X \xrightarrow{\text{Granger}} Y$ 。

实际操作中，通常通过估计以下向量自回归模型 (VAR, Vector Autoregression) 来进行检验：

Y_t = \alpha_0 + \sum_{i=1}^{p} \alpha_i Y_{t-i} + \sum_{i=1}^{p} \beta_i X_{t-i} + \varepsilon_t,

其中 $p$ 为滞后阶数。检验的原假设为

H_0: \beta_1 = \beta_2 = \cdots = \beta_p = 0,

即 $X$ 对 $Y$ 无格兰杰因果作用。该假设可通过 $F$ 检验或沃尔德检验 (Wald Test) 进行统计推断。

检验步骤

平稳性检验：在检验之前，需确认各序列为平稳过程。若存在单位根 (Unit Root)，则应先差分至平稳，或采用协整框架下的误差修正模型。
确定滞后阶数：通过信息准则（如 AIC、BIC 或 HQ）选择最优滞后阶数 $p$ 。
估计受限模型与不受限模型：受限模型仅包含 $Y$ 的滞后项，不受限模型同时包含 $Y$ 与 $X$ 的滞后项。
计算检验统计量：构造 $F$ 统计量 \[ F = \frac{(\text{RSS}_r - \text{RSS}_u)/p}{\text{RSS}_u/(T - 2p - 1)} \sim F(p, T - 2p - 1), \] 其中 $\text{RSS}_r$ 与 $\text{RSS}_u$ 分别为受限与不受限模型的残差平方和， $T$ 为样本量。
做出判断：若 $p$ 值小于显著性水平（通常取 0.05 或 0.01），则拒绝原假设，认为 $X$ 是 $Y$ 的格兰杰原因。

双向因果与反馈系统

格兰杰因果检验的一个独特优势在于能检测双向因果 (Bidirectional Causality) 或反馈 (Feedback) 关系。若检验结果同时表明 $X \xrightarrow{\text{Granger}} Y$ 且 $Y \xrightarrow{\text{Granger}} X$ ，则称二者存在格兰杰双向因果关系。这在经济系统中极为常见——例如 GDP 与投资之间往往相互预测。

重要局限

非哲学因果：格兰杰因果严格限于"预测能力"范畴，不能直接等同于结构性或干预性因果关系。若存在遗漏变量 $Z$ 同时驱动 $X$ 与 $Y$ ，则可能产生伪相关 (Spurious Correlation) 导致的虚假格兰杰因果。
对频率敏感：格兰杰因果检验对数据采样频率高度敏感。若两个变量存在瞬时因果关系，在使用低频数据（如年度数据）时可能完全无法识别。
线性假设：标准检验仅能捕捉线性预测关系，非线性依赖可能无法被检测。对此可采用非参数方法或基于机器学习的扩展检验。
非平稳序列：若变量存在单位根且不满足协整关系，直接检验可能导致严重偏误。此时应使用误差修正模型 (ECM) 框架下的因果检验。

拓展与变体

基于 VAR 的多元格兰杰检验：将双变量框架推广至多变量系统，在 VAR 框架下同时检验多个变量的预测能力，从而有效控制其他变量的影响、避免遗漏变量偏误。
频率域格兰杰因果：利用谱分析 (Spectral Analysis) 方法，考察因果关系的频率特征——例如短期高频冲击与长期低频趋势的因果可能截然不同。该方法特别适用于区分货币政策短期与长期效应。
非线性格兰杰因果：通过非参数回归或神经网络等非线性模型检验预测能力提升是否显著，适用于存在阈值效应或状态转换的非线性经济系统。
DAG 与结构因果推断：结合有向无环图 (DAG) 与珍珠的 do-演算，可将格兰杰因果从预测层面提升至结构层面。

与协整的关系

当两个非平稳序列存在协整关系 (Cointegration) 时，标准 VAR 框架下的格兰杰因果检验可能失效。Engle 与 Granger (1987) 提出的误差修正模型 (ECM) 提供了解决方案：将格兰杰因果分解为短期因果与长期因果两个来源，差分项系数反映短期动态调整，误差修正项系数则反映长期均衡牵引作用，从而更全面地刻画变量间的时序依赖结构。

经济学应用实例

最经典的格兰杰因果检验应用之一来自 Sims (1972) 关于货币与产出关系的检验。Sims 利用美国战后季度数据检验货币供应量 $M_1$ 是否格兰杰引起实际 GNP，发现引入货币滞后项后对 GNP 的预测误差有显著降低，结论支持了货币主义的主张。此后，该检验被广泛用于检验金融市场联动、通货膨胀与失业的菲利普斯曲线、财政政策与经济增长之间的时序关系等。

> 核心直觉：格兰杰因果检验的本质是时间上的先行性检验——原因不能在结果之后发生。虽然它无法证明因果，但它能有效排除变量间"无时序依赖"的零假设，是实证经济学中不可或缺的初步诊断工具。

代码示例 (R)

以下示例在 R 语言中使用 \texttt{lmtest} 包的 \texttt{grangertest()} 函数进行双变量格兰杰因果检验：

\texttt{grangertest(GNP \textasciitilde{} M1, order = 4, data = USData)}

其中 \texttt{GNP \textasciitilde{} M1} 表示以 GNP 为因变量、M1 为预测变量，\texttt{order = 4} 指定滞后 4 阶。该命令将输出 $F$ 统计量及对应的 $p$ 值。

总结

格兰杰因果检验是时间序列分析中最具影响力的方法论贡献之一。它通过"预测能力"这一可操作的定义，将抽象的因果讨论转化为可检验的统计假设，为实证研究提供了严谨的起点。然而，研究者必须清醒认识到其"预测性"而非"结构性"的本质，在解释结果时避免过度推断。当与结构识别策略（如工具变量、自然实验或结构 VAR）相结合时，格兰杰因果检验能够成为因果推断链条中强有力的一环。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。