ARTICLE

向量自回归 (VAR)

向量自回归 (VAR) 向量自回归模型(Vector Autoregression,VAR)是时间序列分析中最重要的多变量建模框架之一,由Christopher Sims于1980年在题为《Macroeconomics and Reality》的里程碑式论文中系统引入计量经济学领域。其核心思想是将一组内生变量表示为自身及其所有变量的滞后值的线性函数,从而在不

浏览 0 更新 2025-11-08

向量自回归 (VAR)

向量自回归模型(Vector Autoregression,VAR)是时间序列分析中最重要的多变量建模框架之一,由Christopher Sims于1980年在题为《Macroeconomics and Reality》的里程碑式论文中系统引入计量经济学领域。其核心思想是将一组内生变量表示为自身及其所有变量的滞后值的线性函数,从而在不施加强先验经济理论约束的前提下,捕捉变量间的动态交互关系。VAR模型的出现标志着宏观计量经济学从结构方程模型(如联立方程模型)主导的"大规模约束范式"向"无约束多变量时间序列"范式的根本性转变,并深刻重塑了宏观经济学的经验研究方法论。

模型设定与数学表述

一个 pp 阶VAR模型——记为VAR(p)(p)——由以下系统方程定义:

yt=c+Φ1yt1+Φ2yt2++Φpytp+εt\mathbf{y}_t = \mathbf{c} + \mathbf{\Phi}_1 \mathbf{y}_{t-1} + \mathbf{\Phi}_2 \mathbf{y}_{t-2} + \cdots + \mathbf{\Phi}_p \mathbf{y}_{t-p} + \boldsymbol{\varepsilon}_t

其中 yt=(y1t,y2t,,yKt)\mathbf{y}_t = (y_{1t}, y_{2t}, \ldots, y_{Kt})'K×1K \times 1 维内生变量列向量,c\mathbf{c}K×1K \times 1 常数截距向量,Φi\mathbf{\Phi}_ii=1,,pi = 1, \ldots, p)是 K×KK \times K 系数矩阵,刻画了第 ii 阶滞后对所有变量的当期影响,εt\boldsymbol{\varepsilon}_tK×1K \times 1白噪声误差项向量,满足 E(εt)=0E(\boldsymbol{\varepsilon}_t) = \mathbf{0},协方差矩阵 Σ=E(εtεt)\Sigma = E(\boldsymbol{\varepsilon}_t \boldsymbol{\varepsilon}_t') 为对称正定矩阵,且各期误差之间无序列相关。该系统的核心特征在于误差项之间允许同期相关(即 Σ\Sigma 非对角),这恰好反映了不同变量在同一时期受到的未观测共同冲击。每个方程均采用相同的一组解释变量(所有变量的 pp 阶滞后),因而VAR可以视作各方程均使用相同回归元的似不相关回归(SUR)系统,在正态性假定下各方程可分别通过OLS(普通最小二乘法)进行一致且有效的估计。

稳定性条件与滞后阶数选择

VAR系统的稳定性(或平稳性)要求特征多项式 det(IKΦ1zΦ2z2Φpzp)=0\det(\mathbf{I}_K - \mathbf{\Phi}_1 z - \mathbf{\Phi}_2 z^2 - \cdots - \mathbf{\Phi}_p z^p) = 0 的所有根的模均大于1,即所有特征根均落在单位圆之外。若存在模小于1的特征根,则系统含有单位根或爆炸性过程,此时VAR在水平值上的OLS估计将产生伪回归问题,传统推断(如Granger因果检验的F统计量)也相应地失效。实践中,对于I(1)变量,通常的做法是先检验协整关系,若存在协整则采用向量误差修正模型(VECM),否则在一阶差分后估计VAR。

滞后阶数 pp 的选择是VAR建模中最关键的实践决策。阶数过小会导致残差自相关和模型设定偏误,阶数过大则因参数过度化(VAR(p)(p) 需估计的参数总数高达 K+pK2K + pK^2)而严重损失估计效率。常用的选择准则包括AIC(赤池信息准则)、BIC(贝叶斯信息准则)和HQ(Hannan-Quinn准则),其中BIC在大样本下具有一致性但倾向于选择过简的模型,AIC则偏向选择更丰富但可能过度参数化的模型。此外,似然比检验(LR检验)也可用于嵌套模型的序贯比较。实证中通常综合多种信息准则并结合经济理论判断,同时通过残差的Ljung-Box Q检验Portmanteau检验验证选定阶数下残差是否近似白噪声。

脉冲响应分析与方差分解

VAR模型的应用价值主要体现在两个核心分析工具——脉冲响应函数(Impulse Response Function, IRF)和方差分解(Variance Decomposition)——而非回归系数本身。VAR系数量大且高度相关,单个系数的经济解释十分困难,脉冲响应分析则通过追踪某个变量的一单位标准差正交化冲击对其他所有变量的动态传导路径来解决这一困境。然而,由于VAR简化形式的误差项εt\boldsymbol{\varepsilon}_t的协方差矩阵Σ\Sigma非对角,对各方程误差项直接施加冲击不具有结构含义。为此需要施加识别约束以恢复结构冲击,最常用的方法为乔利斯基分解(Cholesky分解),其通过对Σ\Sigma进行下三角分解将同期相关性归因于变量排序中的因果顺序:排序靠前的变量当期影响靠后的变量,而靠后的变量对靠前变量的影响存在一期时滞。这一方法的核心缺陷在于结果对变量排序高度敏感——不同的排序可能导致截然不同的脉冲响应路径。替代识别方法包括结构VAR(SVAR),其基于经济理论施加短期或长期符号约束,如Blanchard-Quah分解利用长期乘子约束区分永久性冲击和暂时性冲击。

预测误差方差分解(Forecast Error Variance Decomposition, FEVD)补充了脉冲响应的信息:它报告在给定的预测水平上,每个结构冲击对各变量预测误差方差的相对贡献比例。FEVD揭示了变量间动态关系的相对重要性:若在12期的预测水平上,变量A的方差中有80\%可由变量B的冲击解释,而变量B的方差中仅有10\%可由变量A的冲击解释,则表明变量B更"外生",对系统的影响力更大。

Granger因果检验

Granger因果检验(Granger Causality Test)是VAR框架中最常用的统计推断工具,由Clive Granger于1969年提出。其核心理念并非哲学意义上的因果关系,而是基于"因发生在果之前"的时间顺序可预测性概念:若在包含变量yy自身滞后值的前提下,变量xx的滞后项仍能显著提升对yy的预测精度,则称xxyyGranger原因。在VAR框架下,检验xx是否Granger引起yy等价于检验所有xx滞后项系数在yy方程中的联合显著性,通常使用F检验或Wald检验。需要注意的是,Granger因果关系对滞后阶数选择、变量遗漏、数据频率结构性断裂极为敏感,且不适用于非平稳系统——若变量含有单位根且不存在协整关系,则需在差分后再进行检验。

结构VAR与识别策略

标准VAR(简化形式VAR)虽然有效描述了数据的动态特征,但其误差项缺乏结构解释力。结构VAR(Structural VAR, SVAR)通过在简化形式VAR的残差上施加经济理论驱动的约束来恢复具有明确经济含义的结构冲击。设简化形式残差εt\boldsymbol{\varepsilon}_t与结构冲击ut\mathbf{u}_t之间满足线性关系εt=But\boldsymbol{\varepsilon}_t = \mathbf{B} \mathbf{u}_t,其中B\mathbf{B}为待估计的K×KK \times K冲击传导矩阵,结构冲击ut\mathbf{u}_t满足E(ut)=0E(\mathbf{u}_t) = \mathbf{0}E(utut)=IKE(\mathbf{u}_t \mathbf{u}_t') = \mathbf{I}_K,即各结构冲击之间正交且方差标准化为1。经典识别需要施加K(K1)/2K(K-1)/2个额外约束以使模型恰好识别。根据约束类型,SVAR可分为短期约束SVAR(如Sims的乔利斯基分解,在B\mathbf{B}矩阵的逆A1A^{-1}上施加零约束)和长期约束SVAR(如Blanchard-Quah分解,限制某些冲击在无限期累积效应为零)。近年来,符号约束(Sign Restrictions)和叙事符号约束(Narrative Sign Restrictions)等方法进一步拓展了结构识别工具箱,通过绑定各冲击对关键宏观经济变量(如GDP通货膨胀率失业率利率)的响应方向而非精确的数量化约束来进行识别,在避免"令人困惑的"脉冲响应(如价格上涨对利率上升的正向响应)方面具有显著优势。

局限性与扩展方向

VAR模型的局限性主要体现在以下几个方面:首先,"维数诅咒"问题在变量较多和滞后阶数较长时极为严重,参数过度化导致估计效率急剧下降;其次,传统VAR的参数恒定性假定与宏观经济中的结构性变化(如货币政策体制转换)之间存在固有矛盾;再次,识别约束的任意性和敏感性始终是VAR研究的核心争议。针对这些局限,计量经济学发展了一系列重要扩展:贝叶斯VAR(BVAR)通过引入Minnesota先验等先验分布有效缓解了维数诅咒问题并在预测竞赛中表现优异;时变参数VAR(TVP-VAR)和马尔可夫转换VAR(MS-VAR)允许系数矩阵随时间变化以适应结构性变化;因子增广VAR(FAVAR)通过从大量经济变量中提取公共因子来扩展VAR的信息集;全局VAR(GVAR)则处理跨国层面的交互依赖问题。在当代宏观经济学中,VAR与DSGE模型(动态随机一般均衡模型)之间形成了互补关系:DSGE基于结构的理论参数在VAR的脉冲响应目标上通过间接推断贝叶斯估计进行校准,从而使理论模型的经验相关性得以量化验证。