ARTICLE

ARMA模型

ARMA模型 (自回归移动平均模型) ARMA模型，全称自回归移动平均模型 (Autoregressive Moving Average Model)，是时间序列分析中最为基础和核心的线性平稳模型。它由两部分构成：AR（自回归，Autoregressive）部分刻画序列当前值与其历史值之间的线性依赖关系，MA（移动平均，Moving Average）部分刻画

浏览 0 更新 2025-07-14

ARMA模型 (自回归移动平均模型)

ARMA模型，全称自回归移动平均模型 (Autoregressive Moving Average Model)，是时间序列分析中最为基础和核心的线性平稳模型。它由两部分构成：AR（自回归，Autoregressive）部分刻画序列当前值与其历史值之间的线性依赖关系，MA（移动平均，Moving Average）部分刻画当前值与过去随机冲击之间的关联。两者结合使 ARMA 能够用极少的参数灵活描述各类平稳时间序列的动态结构。

该模型的系统化方法论由 George E. P. Box 和 Gwilym Jenkins 在1970年出版的《Time Series Analysis: Forecasting and Control》中确立，形成了著名的Box-Jenkins方法——一套包含模型识别、参数估计和诊断检验的完整建模流程。

数学定义

一个 $\text{ARMA}(p, q)$ 模型的标准形式为：

y_t = c + \phi_1 y_{t-1} + \phi_2 y_{t-2} + \cdots + \phi_p y_{t-p} + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \cdots + \theta_q \varepsilon_{t-q}

其中 $\{\varepsilon_t\}$ 为白噪声过程，满足 $\mathbb{E}[\varepsilon_t] = 0$ ， $\operatorname{Var}(\varepsilon_t) = \sigma^2$ ，且序列不相关。 $p$ 为自回归阶数， $q$ 为移动平均阶数， $c$ 为常数项。

引入滞后算子 $L$ （定义为 $L^k y_t = y_{t-k}$ ），模型可紧凑表示为：

\phi(L) y_t = c + \theta(L) \varepsilon_t

其中 $\phi(L) = 1 - \phi_1 L - \cdots - \phi_p L^p$ 为 AR 多项式， $\theta(L) = 1 + \theta_1 L + \cdots + \theta_q L^q$ 为 MA 多项式。

三种特殊情形值得注意： $\text{ARMA}(p, 0)$ 退化为 $\text{AR}(p)$ ，序列仅由其历史值解释； $\text{ARMA}(0, q)$ 退化为 $\text{MA}(q)$ ，序列仅由当期和过去的冲击驱动； $\text{ARMA}(0, 0)$ 即为纯白噪声。

平稳性与可逆性

ARMA 模型的统计性质完全由特征多项式的根决定，这是理解模型行为的理论基石。

平稳性条件：AR 多项式 $\phi(z) = 0$ 的所有根必须严格落在复平面单位圆外（即 $|z| > 1$ ）。满足此条件时，冲击对序列的影响随时间指数衰减，序列具有时间不变的均值、方差和自协方差结构。若存在单位根（ $z = 1$ ），序列变为非平稳，需通过差分转化为ARIMA模型处理。

可逆性条件：MA 多项式 $\theta(z) = 0$ 的所有根也必须落在单位圆外。可逆性确保了当前 $\varepsilon_t$ 可以表示为当前和过去 $y_t$ 的收敛线性组合，使得模型可用有限阶自回归近似。不可逆的 MA 成分会使似然函数出现多峰，严重妨碍参数估计。

当平稳性和可逆性同时满足时，ARMA 过程具有唯一的Wold表示，即将任何协方差平稳过程分解为确定性成分和随机冲击的无限阶移动平均之和。

自相关与偏自相关函数

ACF（自相关函数）和 PACF（偏自相关函数）是Box-Jenkins方法中模型识别阶段的核心诊断工具，二者的衰减模式为判断 $p$ 和 $q$ 提供直观依据：

AR( $p$ )：ACF 呈指数衰减或阻尼正弦波衰减（拖尾），PACF 在滞后 $p$ 处截尾（即 $\phi_{kk} = 0$ 对所有 $k > p$ ）。
MA( $q$ )：ACF 在滞后 $q$ 处截尾，PACF 呈衰减模式（拖尾）。
ARMA( $p, q$ )：ACF 和 PACF 均呈拖尾衰减，仅凭图像难以精确判定阶数，需借助信息准则做进一步筛选。

这一对偶关系——AR 的 PACF 截尾与 MA 的 ACF 截尾——构成了阶数识别的经典框架。但在实际样本中，抽样变异往往使截尾不如理论预期清晰，因此需要结合多种方法综合判断。

Box-Jenkins 建模策略

Box-Jenkins 方法将建模过程系统化为三个阶段：

阶段一：识别 (Identification)。首先通过ADF检验或KPSS检验判断序列是否平稳。若存在趋势或单位根，需差分至平稳（由此确定差分阶数 $d$ ，进入ARIMA框架）。随后绘制样本 ACF 和 PACF 图，初步推断 $p$ 和 $q$ 的候选范围。

阶段二：估计 (Estimation)。在候选阶数下，通常采用极大似然估计(MLE)或条件最小二乘法估计所有参数。在正态性假设下，MLE 最大化联合似然函数；条件最小二乘法最小化残差平方和，在大样本下二者渐近等价。

阶段三：诊断检验 (Diagnostic Checking)。核心是检验残差是否为白噪声——常用Ljung-Box $Q$ 统计量检验残差的自相关性。若残差仍存在显著结构，需返回第一阶段修正模型设定，同时检查各参数估计的 $t$ 显著性，剔除冗余项以保证模型简约。

模型选择准则

当多组候选阶数均通过诊断检验时，引入信息准则进行定量比较：

\text{AIC} = -2\ln L + 2k, \qquad \text{BIC} = -2\ln L + k \ln T

其中 $L$ 为似然函数最大值， $k = p + q + 1$ （含方差参数）， $T$ 为样本量。AIC 以最小化预测误差为目标，倾向于选择稍复杂的模型；BIC 对参数个数的惩罚更重，在大样本下具有模型选择相合性（以概率1选出真模型）。实践中若二者分歧，大样本下通常更信赖 BIC。

预测

基于 ARMA 模型进行预测利用了条件期望的线性结构。令 $\hat{y}_{T+h|T}$ 表示基于时刻 $T$ 的信息集 $\mathcal{F}_T$ 对 $y_{T+h}$ 的 $h$ 步向前预测：

当 $h \leq q$ 时，预测依赖于可观测的残差 $\varepsilon_T, \varepsilon_{T-1}, \ldots$ ，这些通过模型回代获得。
当 $h > q$ 时，MA 部分的新息期望归零，预测主要由 AR 部分驱动，序列向无条件均值回归。

预测误差方差随 $h$ 单调递增，渐近收敛于序列的无条件方差。在正态性假设下， $h$ 步预测的约 $95\%$ 置信区间为 $\hat{y}_{T+h|T} \pm 1.96 \cdot \hat{\sigma}_h$ 。预测区间随 $h$ 扩大而变宽，反映了远期预测的不确定性累积。

局限性与核心扩展

ARMA 模型有两大根本局限：第一，它仅适用于平稳时间序列，无法直接处理趋势、季节性和结构突变；第二，它假设条件方差恒定，忽略了金融数据中常见的波动率聚簇现象。针对这些局限，一系列重要扩展被相继提出：

ARIMA( $p, d, q$ )：通过 $d$ 阶差分将非平稳序列转化为平稳序列，是 ARMA 最直接、最经典的推广。绝大多数宏观经济和金融序列的建模都始于 ARIMA 框架。
SARIMA（季节 ARIMA）：引入季节自回归和季节移动平均项，处理月度、季度等周期性数据中的季节性模式。
GARCH：将 ARMA 结构应用于条件方差方程，形成均值-方差联合建模框架，是金融波动率分析的标准工具。
VAR（向量自回归）：将单变量 AR 结构推广为多元系统，捕捉多个时间序列之间的动态交互和因果传导。
ARIMAX：在 ARIMA 中纳入外生解释变量，适合存在协变量信息的场景，如政策评估和事件研究。

ARMA 模型处于统计学、计量经济学与信号处理的交叉地带。在宏观经济学中，它被用于 GDP 增长率、通胀率和失业率的建模与预测；在金融工程中，它是理解资产收益率动态、构建量化交易策略和风险管理模型的基础构件。尽管深度学习等方法不断涌现，ARMA 及其衍生模型因其透明性、解释性和坚实的统计理论基础，仍在实证研究和政策分析中占据不可替代的地位。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。