ARTICLE

ARMA

ARMA (自回归移动平均模型) ARMA,即 自回归移动平均模型 (Autoregressive Moving Average Model),是时间序列分析中最核心的线性平稳模型之一。它将AR(自回归)与MA(移动平均)两个分量结合,用少量参数刻画平稳时间序列的动态相依结构。ARMA 由 George E. P. Box 与 Gwilym Jenkins

浏览 0 更新 2025-11-09

ARMA (自回归移动平均模型)

ARMA,即 自回归移动平均模型 (Autoregressive Moving Average Model),是时间序列分析中最核心的线性平稳模型之一。它将AR(自回归)与MA(移动平均)两个分量结合,用少量参数刻画平稳时间序列的动态相依结构。ARMA 由 George E. P. Box 与 Gwilym Jenkins 在1970年的经典著作《Time Series Analysis: Forecasting and Control》中系统化推广,奠定了现代时间序列建模的方法论基础,即Box-Jenkins方法

模型定义

一个 ARMA(p,q) \text{ARMA}(p, q) 模型定义为:

yt=c+ϕ1yt1+ϕ2yt2++ϕpytp+εt+θ1εt1++θqεtqy_t = c + \phi_1 y_{t-1} + \phi_2 y_{t-2} + \cdots + \phi_p y_{t-p} + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \cdots + \theta_q \varepsilon_{t-q}

其中 {εt} \{\varepsilon_t\} 白噪声过程,满足 E[εt]=0 \mathbb{E}[\varepsilon_t]=0 Var(εt)=σ2 \operatorname{Var}(\varepsilon_t)=\sigma^2 ,且 εt \varepsilon_t 之间无自相关。p p 为自回归阶数,q q 为移动平均阶数。

引入滞后算子 L L (满足 Lyt=yt1 L y_t = y_{t-1} ),模型可紧凑写作:

ϕ(L)yt=c+θ(L)εt\phi(L) y_t = c + \theta(L) \varepsilon_t

其中 ϕ(L)=1ϕ1Lϕ2L2ϕpLp \phi(L) = 1 - \phi_1 L - \phi_2 L^2 - \cdots - \phi_p L^p 是 AR 多项式,θ(L)=1+θ1L++θqLq \theta(L) = 1 + \theta_1 L + \cdots + \theta_q L^q 是 MA 多项式。

两个特殊情形:

  • ARMA(p,0) \text{ARMA}(p, 0) AR(p) \text{AR}(p) :纯自回归模型,yt y_t 仅由其过去值线性表示。
  • ARMA(0,q) \text{ARMA}(0, q) MA(q) \text{MA}(q) :纯移动平均模型,yt y_t 仅由当期和过去冲击的加权和驱动。

平稳性与可逆性

ARMA 模型的统计性质由 AR 多项式和 MA 多项式的根决定:

平稳性条件:AR 多项式 ϕ(z)=0 \phi(z)=0 的所有根必须落在单位圆外(即 z>1 |z|>1 )。这保证了冲击的影响随时间衰减,序列具有不随时间变化的均值和自协方差结构。若 ϕ(z) \phi(z) 存在单位根(z=1 z=1 ),则序列非平稳,需通过差分转化为ARIMA模型。

可逆性条件:MA 多项式 θ(z)=0 \theta(z)=0 的所有根必须落在单位圆外(即 z>1 |z|>1 )。可逆性保证模型可以用有限阶或收敛的 AR( \infty ) 表示,这对参数估计和预测至关重要。不可逆的 MA 成分会导致似然函数出现多个局部最优,使估计困难。

当平稳性和可逆性均满足时,ARMA 模型具有唯一的Wold表示和平稳解。

自相关函数 (ACF) 与偏自相关函数 (PACF)

ACF 和 PACF 是 ARMA 模型识别阶段的核心诊断工具:

  • AR(p p ):ACF 呈指数衰减或阻尼正弦波衰减(拖尾),PACF 在滞后 p p 之后截尾(即 ϕkk=0 \phi_{kk}=0 对所有 k>p k>p )。
  • MA(q q ):ACF 在滞后 q q 之后截尾,PACF 衰减(拖尾)。
  • ARMA(p,q p,q ):ACF 和 PACF 均在滞后超过各自阶数后呈现衰减模式(双双拖尾),仅从图像难以精确判断 p p q q ,需借助信息准则。

这一对偶关系为Box-Jenkins方法的"识别"阶段提供了直观指导。

Box-Jenkins 建模策略

Box-Jenkins 方法分为三个阶段:

第一阶段:识别 (Identification)。通过ADF检验KPSS检验判断序列是否平稳;若非平稳则差分至平稳(得到 d d )。随后绘制样本 ACF 和 PACF 图,初步推断 p p q q 的范围。

第二阶段:估计 (Estimation)。在候选阶数下,一般采用极大似然估计(MLE)或条件最小二乘法估计参数 (ϕ1,,ϕp,θ1,,θq,σ2) (\phi_1,\ldots,\phi_p,\theta_1,\ldots,\theta_q,\sigma^2) 。MLE 假定 εt \varepsilon_t 服从正态分布,最大化联合似然函数。

第三阶段:诊断检验 (Diagnostic Checking)。检验残差是否为白噪声(常用Ljung-Box Q Q 统计量),若残差仍存在显著自相关,则需返回第一阶段修改阶数。同时检查参数显著性(t t 检验)和模型简约性。

模型选择准则

当多组 (p,q) (p,q) 均通过诊断检验时,信息准则提供定量比较依据:

AIC=2lnL+2k,BIC=2lnL+klnT\text{AIC} = -2\ln L + 2k, \quad \text{BIC} = -2\ln L + k\ln T

其中 L L 为似然函数最大值,k=p+q+1 k = p+q+1 (或 p+q+2 p+q+2 含截距项),T T 为样本量。AIC倾向于选择预测能力较好的模型,BIC对复杂度惩罚更严,在大样本下具有相合性(以概率1选出真模型)。实践中两者常结合使用,若 AIC 和 BIC 指向不同阶数,通常更信赖 BIC 在较大样本下的选择。

预测

基于 ARMA 模型的条件期望预测具有迭代递推结构。令 y^T+hT \hat{y}_{T+h|T} 表示基于时刻 T T 的信息集对 yT+h y_{T+h} 的预测:

  • 对于 hq h \leq q ,预测依赖于可观测的过去冲击 εT,εT1, \varepsilon_T, \varepsilon_{T-1}, \ldots ,后者通过残差回代获得。
  • 对于 h>q h > q ,MA 部分的冲击期望归零,预测主要由 AR 部分驱动,呈均值回归趋势。

预测误差方差随预测步长 h h 增加而单调递增,并收敛于序列的无条件方差。预测区间基于 εt \varepsilon_t 的正态性假设构造,h h 步预测的 95% 95\% 置信区间约为 y^T+hT±1.96σ^h \hat{y}_{T+h|T} \pm 1.96 \cdot \hat{\sigma}_h

局限性与扩展

ARMA 模型有两个核心局限:第一,要求序列平稳,无法直接处理趋势或季节性;第二,假设条件方差恒定,忽略波动率聚簇。相应的扩展包括:

  • ARIMA(p,d,q p,d,q ):通过 d d 阶差分将非平稳序列变为平稳后再建模,是 ARMA 最直接且最重要的推广。
  • SARIMA(季节 ARIMA):引入季节自回归和季节移动平均项 ARIMA(p,d,q)(P,D,Q)s \text{ARIMA}(p,d,q)(P,D,Q)_s ,处理月度、季度等周期性数据。
  • ARIMAX:在 ARIMA 框架中加入外生解释变量 Xt X_t ,适用于有协变量信息的场景。
  • GARCH:对残差的条件方差单独建模,形成 ARMA-GARCH 联合模型,广泛应用于金融波动率分析。
  • VAR(向量自回归):将单变量 AR 结构推广到多元时间序列系统,捕捉变量间的动态交互。

ARMA 是连接统计学、计量经济学信号处理的桥梁概念。在宏观经济学中,它广泛用于 GDP 增长率、通胀率和失业率等指标的建模与预测;在金融工程中,它是理解资产收益率动态、构建交易策略和风险管理模型的基础工具。