ARTICLE

ARMA

ARMA (自回归移动平均模型) ARMA，即自回归移动平均模型 (Autoregressive Moving Average Model)，是时间序列分析中最核心的线性平稳模型之一。它将AR（自回归）与MA（移动平均）两个分量结合，用少量参数刻画平稳时间序列的动态相依结构。ARMA 由 George E. P. Box 与 Gwilym Jenkins

浏览 0 更新 2025-11-09

ARMA (自回归移动平均模型)

ARMA，即 自回归移动平均模型 (Autoregressive Moving Average Model)，是时间序列分析中最核心的线性平稳模型之一。它将AR（自回归）与MA（移动平均）两个分量结合，用少量参数刻画平稳时间序列的动态相依结构。ARMA 由 George E. P. Box 与 Gwilym Jenkins 在1970年的经典著作《Time Series Analysis: Forecasting and Control》中系统化推广，奠定了现代时间序列建模的方法论基础，即Box-Jenkins方法。

模型定义

一个 $\text{ARMA}(p, q)$ 模型定义为：

y_t = c + \phi_1 y_{t-1} + \phi_2 y_{t-2} + \cdots + \phi_p y_{t-p} + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \cdots + \theta_q \varepsilon_{t-q}

其中 $\{\varepsilon_t\}$ 是白噪声过程，满足 $\mathbb{E}[\varepsilon_t]=0$ ， $\operatorname{Var}(\varepsilon_t)=\sigma^2$ ，且 $\varepsilon_t$ 之间无自相关。 $p$ 为自回归阶数， $q$ 为移动平均阶数。

引入滞后算子 $L$ （满足 $L y_t = y_{t-1}$ ），模型可紧凑写作：

\phi(L) y_t = c + \theta(L) \varepsilon_t

其中 $\phi(L) = 1 - \phi_1 L - \phi_2 L^2 - \cdots - \phi_p L^p$ 是 AR 多项式， $\theta(L) = 1 + \theta_1 L + \cdots + \theta_q L^q$ 是 MA 多项式。

两个特殊情形：

$\text{ARMA}(p, 0)$ 即 $\text{AR}(p)$ ：纯自回归模型， $y_t$ 仅由其过去值线性表示。
$\text{ARMA}(0, q)$ 即 $\text{MA}(q)$ ：纯移动平均模型， $y_t$ 仅由当期和过去冲击的加权和驱动。

平稳性与可逆性

ARMA 模型的统计性质由 AR 多项式和 MA 多项式的根决定：

平稳性条件：AR 多项式 $\phi(z)=0$ 的所有根必须落在单位圆外（即 $|z|>1$ ）。这保证了冲击的影响随时间衰减，序列具有不随时间变化的均值和自协方差结构。若 $\phi(z)$ 存在单位根（ $z=1$ ），则序列非平稳，需通过差分转化为ARIMA模型。

可逆性条件：MA 多项式 $\theta(z)=0$ 的所有根必须落在单位圆外（即 $|z|>1$ ）。可逆性保证模型可以用有限阶或收敛的 AR( $\infty$ ) 表示，这对参数估计和预测至关重要。不可逆的 MA 成分会导致似然函数出现多个局部最优，使估计困难。

当平稳性和可逆性均满足时，ARMA 模型具有唯一的Wold表示和平稳解。

自相关函数 (ACF) 与偏自相关函数 (PACF)

ACF 和 PACF 是 ARMA 模型识别阶段的核心诊断工具：

AR( $p$ )：ACF 呈指数衰减或阻尼正弦波衰减（拖尾），PACF 在滞后 $p$ 之后截尾（即 $\phi_{kk}=0$ 对所有 $k>p$ ）。
MA( $q$ )：ACF 在滞后 $q$ 之后截尾，PACF 衰减（拖尾）。
ARMA( $p,q$ )：ACF 和 PACF 均在滞后超过各自阶数后呈现衰减模式（双双拖尾），仅从图像难以精确判断 $p$ 和 $q$ ，需借助信息准则。

这一对偶关系为Box-Jenkins方法的"识别"阶段提供了直观指导。

Box-Jenkins 建模策略

Box-Jenkins 方法分为三个阶段：

第一阶段：识别 (Identification)。通过ADF检验或KPSS检验判断序列是否平稳；若非平稳则差分至平稳（得到 $d$ ）。随后绘制样本 ACF 和 PACF 图，初步推断 $p$ 和 $q$ 的范围。

第二阶段：估计 (Estimation)。在候选阶数下，一般采用极大似然估计(MLE)或条件最小二乘法估计参数 $(\phi_1,\ldots,\phi_p,\theta_1,\ldots,\theta_q,\sigma^2)$ 。MLE 假定 $\varepsilon_t$ 服从正态分布，最大化联合似然函数。

第三阶段：诊断检验 (Diagnostic Checking)。检验残差是否为白噪声（常用Ljung-Box $Q$ 统计量），若残差仍存在显著自相关，则需返回第一阶段修改阶数。同时检查参数显著性（ $t$ 检验）和模型简约性。

模型选择准则

当多组 $(p,q)$ 均通过诊断检验时，信息准则提供定量比较依据：

\text{AIC} = -2\ln L + 2k, \quad \text{BIC} = -2\ln L + k\ln T

其中 $L$ 为似然函数最大值， $k = p+q+1$ （或 $p+q+2$ 含截距项）， $T$ 为样本量。AIC倾向于选择预测能力较好的模型，BIC对复杂度惩罚更严，在大样本下具有相合性（以概率1选出真模型）。实践中两者常结合使用，若 AIC 和 BIC 指向不同阶数，通常更信赖 BIC 在较大样本下的选择。

预测

基于 ARMA 模型的条件期望预测具有迭代递推结构。令 $\hat{y}_{T+h|T}$ 表示基于时刻 $T$ 的信息集对 $y_{T+h}$ 的预测：

对于 $h \leq q$ ，预测依赖于可观测的过去冲击 $\varepsilon_T, \varepsilon_{T-1}, \ldots$ ，后者通过残差回代获得。
对于 $h > q$ ，MA 部分的冲击期望归零，预测主要由 AR 部分驱动，呈均值回归趋势。

预测误差方差随预测步长 $h$ 增加而单调递增，并收敛于序列的无条件方差。预测区间基于 $\varepsilon_t$ 的正态性假设构造， $h$ 步预测的 $95\%$ 置信区间约为 $\hat{y}_{T+h|T} \pm 1.96 \cdot \hat{\sigma}_h$ 。

局限性与扩展

ARMA 模型有两个核心局限：第一，要求序列平稳，无法直接处理趋势或季节性；第二，假设条件方差恒定，忽略波动率聚簇。相应的扩展包括：

ARIMA( $p,d,q$ )：通过 $d$ 阶差分将非平稳序列变为平稳后再建模，是 ARMA 最直接且最重要的推广。
SARIMA（季节 ARIMA）：引入季节自回归和季节移动平均项 $\text{ARIMA}(p,d,q)(P,D,Q)_s$ ，处理月度、季度等周期性数据。
ARIMAX：在 ARIMA 框架中加入外生解释变量 $X_t$ ，适用于有协变量信息的场景。
GARCH：对残差的条件方差单独建模，形成 ARMA-GARCH 联合模型，广泛应用于金融波动率分析。
VAR（向量自回归）：将单变量 AR 结构推广到多元时间序列系统，捕捉变量间的动态交互。

ARMA 是连接统计学、计量经济学与信号处理的桥梁概念。在宏观经济学中，它广泛用于 GDP 增长率、通胀率和失业率等指标的建模与预测；在金融工程中，它是理解资产收益率动态、构建交易策略和风险管理模型的基础工具。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。