ARTICLE
向量自回归模型
向量自回归模型 (Vector Autoregression, VAR) 向量自回归模型(Vector Autoregression,VAR)是一种刻画多个时间序列变量之间动态交互关系的多变量统计模型。在VAR模型中,每一个内生变量都被表示为其自身滞后值、系统中所有其他变量的滞后值以及一个外生截距项的线性函数,不含事先假定的结构性零约束。该框架由经济学家 C
向量自回归模型 (Vector Autoregression, VAR)
向量自回归模型(Vector Autoregression,VAR)是一种刻画多个时间序列变量之间动态交互关系的多变量统计模型。在VAR模型中,每一个内生变量都被表示为其自身滞后值、系统中所有其他变量的滞后值以及一个外生截距项的线性函数,不含事先假定的结构性零约束。该框架由经济学家 Christopher Sims 于1980年在其经典论文"Macroeconomics and Reality"中正式提出,其核心动机是对当时主导宏观经济学的大型联立方程模型中"不可信的识别约束"(incredible identification restrictions)的批判——Sims认为,宏观经济理论通常无法提供足够的先验信息来对动态关系施加有效的排他性约束,因此与其依赖争议性假设,不如让数据自身揭示变量间的互动模式。
数学形式
一个含 个变量、 阶滞后的 VAR(p) 模型的标准形式为:
其中 为 的内生变量向量; 为 的常数项向量;()为 的系数矩阵,每个矩阵包含 个待估参数; 为 的向量白噪声过程,满足零均值、正定协方差矩阵 以及跨期无自相关 ()。
以双变量 VAR(1) 为例,其展开形式为:
可见每一变量不仅受自身滞后的影响(通过 、),还受系统内其他变量滞后的交叉影响(通过 、),体现了VAR模型的核心特征:所有变量被对称地对待,无内生-外生的人为划分。
估计方法
VAR模型的估计具有显著的操作便利性。当每个方程包含完全相同的右侧变量(所有内生变量的 阶滞后项及截距项)且扰动项不存在跨方程同期相关性时,逐方程普通最小二乘(equation-by-equation OLS)等价于 广义最小二乘法,是一致且渐近有效的估计方法。若扰动项存在同期相关,似不相关回归(Seemingly Unrelated Regression, SUR)理论上可提供效率增益,但由于各方程的右侧变量完全相同,SUR与逐方程OLS在代数上等价。
滞后阶数 的选择是模型设定中的关键决策: 过小则遗漏动态结构,导致残差自相关和参数估计不一致; 过大则过度消耗自由度,放大估计方差并引入噪声。实践中通过信息准则进行选择:赤池信息准则(AIC)倾向于选择较大的滞后阶数以降低预测误差;贝叶斯信息准则(BIC/Schwarz准则)在大样本下具有一致性,倾向于更精简的模型;Hannan-Quinn准则(HQ)的性质介于两者之间。通常建议综合比较三者并辅以残差诊断(如Portmanteau白噪声检验)后进行最终选择。
核心分析工具
VAR模型的实证价值主要体现在以下三种分析工具中:
脉冲响应函数(Impulse Response Function, IRF)追踪系统中某一变量在受到一个单位(通常为一个标准差)的外生冲击后,所有内生变量在未来各期的动态响应路径。IRF的核心难题在于简化式扰动 的各分量通常存在同期相关性(即 非对角),意味着对单一 的孤立冲击缺乏经济学解释。最常用的处理方法是 Cholesky分解:将 分解为下三角矩阵 与其转置之积 ,通过 将简化式扰动正交化为互不相关的结构性冲击。Cholesky分解隐含了对变量排序施加的递归因果假设——排序靠前的变量同期影响排序靠后的变量,反向则无。因此,变量的排列顺序对IRF结果具有实质性影响,是实证研究中必须谨慎论证的关键选择。
方差分解(Forecast Error Variance Decomposition, FEVD)将每个变量的向前 步预测误差方差归因于系统中各个结构性冲击的贡献比例。当某一变量的预测误差方差主要由自身冲击解释时,该变量呈现强外生特征;反之,若其他变量的冲击占据主导份额,则该变量高度内生于系统动态。
格兰杰因果检验(格兰杰因果检验)在VAR框架下检验某一变量的滞后值是否对预测另一变量的当前值具有统计上显著的额外解释力。传统的两变量Granger因果检验在VAR中自然推广为多变量框架下的块外生性检验(Block Exogeneity Test),即联合检验某一变量组所有滞后项的系数是否同时为零。需要强调的是,Granger因果是纯粹基于预测精度的统计概念,不等于经济学意义上的结构因果。
结构VAR与识别策略
简化式VAR的冲击()是各结构性冲击的线性混合,本身不具备经济学含义。结构向量自回归(Structural VAR, SVAR)通过在简化式之上施加源自经济理论的约束,将简化式扰动"分解"为具有经济学可解释性的结构性冲击(如货币政策冲击、技术冲击、需求冲击、供给冲击)。
标准的AB模型将结构关系写为 ,其中 为相互正交的结构性冲击(方差为单位矩阵),矩阵 与 需要基于经济理论进行约束。常用的识别策略包括:第一,短期递归约束(Cholesky分解),如Sims(1980)将政策变量置于排序末端以反映政策对宏观变量的滞后反应;第二,长期约束,如 Blanchard-Quah(1989)假设需求冲击对产出的长期累积效应为零,仅供给冲击永久影响产出水平;第三,符号约束,如Uhlig(2005)不对脉冲响应的精确形态施加限制,仅要求其符号在若干期内与经济理论一致(如紧缩性货币政策冲击应使价格下降、利率上升)。
扩展、应用与局限
VAR模型被广泛用于宏观经济预测、货币政策传导机制分析和财政乘数估计,也是多数中央银行进行条件预测与压力测试的基准工具。为应对简化式VAR在维度和结构上的不足,一系列扩展已被提出:贝叶斯VAR(BVAR)通过Minnesota先验(Litterman先验)对参数空间进行收缩,显著改善高维情形的预测精度;因子增广VAR(FAVAR)将大量信息变量通过因子模型压缩后纳入VAR框架,克服了低维度信息不足的问题;时变参数VAR(TVP-VAR)允许系数矩阵与协方差矩阵随时间演化,以刻画经济结构的变化;协整VAR(VECM)在变量间存在 协整关系时,将长期均衡约束显式纳入模型。
VAR模型的主要局限包括:第一,维度诅咒——待估参数数量随变量数以平方速度增长( 个系数),在宏观经济学常见的中小样本下(如季度数据几十至上百期),高维VAR的估计精度迅速衰减;第二,无理论内核——简化式VAR本质上是数据的统计描述,SVAR的结构解释完全依赖于识别假设,而这些假设经常引发学术争议;第三,线性假定——标准VAR无法捕捉经济中普遍存在的非对称调整、区制转换与状态依赖效应;第四,平稳性要求——VAR要求变量为平稳过程或经协整联系,若对非平稳序列直接建模而不加处理,可能导致 伪回归问题;第五,遗漏变量偏误——任何实证VAR都只是真实经济系统的低维近似,关键变量的系统性缺失将使估计结果产生偏误,且该偏误的方向和大小通常难以评估。