ARTICLE

ARIMA

ARIMA(自回归综合移动平均) ARIMA(Autoregressive Integrated Moving Average,自回归综合移动平均)是时间序列分析中最重要的一类预测模型,由博克斯(Box)和詹金斯(Jenkins)于1970年在其经典著作《时间序列分析:预测与控制》中系统化提出,因此又称博克斯-詹金斯模型(Box-Jenkins Model)

浏览 3 更新 2026-07-14

ARIMA(自回归综合移动平均)

ARIMA(Autoregressive Integrated Moving Average,自回归综合移动平均)是时间序列分析中最重要的一类预测模型,由博克斯(Box)和詹金斯(Jenkins)于1970年在其经典著作《时间序列分析:预测与控制》中系统化提出,因此又称博克斯-詹金斯模型(Box-Jenkins Model)。ARIMA模型的核心思想是:任何一个时间序列的动态结构都可以用其自身过去值的自回归项、过去的预测误差的移动平均项、以及适当的差分阶数来刻画。模型记作 ARIMA(p,d,q)\mathrm{ARIMA}(p,d,q),其中 pp 为自回归阶数,dd 为差分阶数,qq 为移动平均阶数。当时间序列表现出季节性模式时,可扩展为SARIMA(Seasonal ARIMA)模型。

模型结构

自回归成分(AR, pp

自回归模型的概念源于回归分析的基本思想——将因变量对其自身滞后值进行回归,而非对外生变量回归。这一看似简单的转换使其能够捕捉经济金融时间序列中常见的惯性特征:高增长期往往持续高增长,衰退期也往往延续衰退,即序列呈现聚类波动(volatility clustering)之外的均值回归与动量效应。

自回归(Autoregressive, AR)成分刻画序列当前值与其滞后值之间的线性关系。一个 AR(p)\mathrm{AR}(p) 过程的数学表达式为:

yt=c+ϕ1yt1+ϕ2yt2++ϕpytp+εty_t = c + \phi_1 y_{t-1} + \phi_2 y_{t-2} + \dots + \phi_p y_{t-p} + \varepsilon_t

其中 ϕ1,,ϕp\phi_1,\dots,\phi_p 是自回归系数,εt\varepsilon_t白噪声序列,cc 为常数项。AR 过程的平稳性条件要求特征方程 1ϕ1zϕ2z2ϕpzp=01 - \phi_1 z - \phi_2 z^2 - \dots - \phi_p z^p = 0 的所有根的模均大于1。从谱分析角度看,AR 成分刻画序列的"记忆"特征:当 ϕ1\phi_1 接近于1时,序列表现出强持续性(persistence),冲击消退缓慢。

差分成分(I, dd

差分(Integration/Differencing)是使非平稳序列转化为平稳序列的预处理手段。一阶差分定义为 Δyt=ytyt1\Delta y_t = y_t - y_{t-1};二阶差分为 Δ2yt=Δ(Δyt)\Delta^2 y_t = \Delta(\Delta y_t),以此类推。d=1d=1 意味着原始序列是单位根过程随机游走,即对序列做一次差分后变为平稳;d=0d=0 意味着原始序列本身已是平稳序列。单位根检验(如 ADF 检验、PP 检验)是确定差分阶数 dd 的标准统计工具。引入差分的意义在于:伪回归(spurious regression)问题——若直接用非平稳序列进行回归,即使变量间毫无因果关系,也可能得到表面显著的统计结果(Granger \& Newbold, 1974)。

移动平均成分(MA, qq

移动平均(Moving Average, MA)成分刻画序列当前值对过去白噪声冲击的线性响应。一个 MA(q)\mathrm{MA}(q) 过程的数学表达式为:

yt=μ+εt+θ1εt1+θ2εt2++θqεtqy_t = \mu + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \theta_2 \varepsilon_{t-2} + \dots + \theta_q \varepsilon_{t-q}

其中 θ1,,θq\theta_1,\dots,\theta_q 为移动平均系数。MA 过程的可逆性(invertibility)条件要求特征方程 1+θ1z+θ2z2++θqzq=01 + \theta_1 z + \theta_2 z^2 + \dots + \theta_q z^q = 0 的所有根的模大于1。可逆性确保 MA 表示可以唯一地转化为 AR 表示。MA 成分的核心经济含义在于:它捕捉的是有限记忆冲击——一个冲击的影响在 qq 期之后完全消失,这与 AR 成分的无限衰减形成对比。

完整的 ARIMA 模型

将上述三个成分组合,ARIMA(p,d,q)\mathrm{ARIMA}(p,d,q) 模型的紧凑写法为:

ϕ(B)(1B)dyt=c+θ(B)εt\phi(B)(1 - B)^d y_t = c + \theta(B) \varepsilon_t

其中 BB 为滞后算子(Bkyt=ytkB^k y_t = y_{t-k}),ϕ(B)=1ϕ1BϕpBp\phi(B) = 1 - \phi_1 B - \dots - \phi_p B^p 为 AR 多项式,θ(B)=1+θ1B++θqBq\theta(B) = 1 + \theta_1 B + \dots + \theta_q B^q 为 MA 多项式。该形式清晰地展示了 ARIMA 模型的简约性:用少量参数即可刻画丰富的时间序列动态模式。

博克斯-詹金斯方法论

博克斯和詹金斯提出了建立 ARIMA 模型的三阶段迭代方法

(1)模型识别(Identification)。利用自相关函数(ACF)和偏自相关函数(PACF)的样本图形来推断 ppqq 的候选阶数。AR(p)\mathrm{AR}(p) 的 PACF 在滞后 pp 后截尾(突然降至零附近),而 ACF 呈指数或正弦衰减(拖尾);MA(q)\mathrm{MA}(q) 的 ACF 在滞后 qq 后截尾,PACF 拖尾;ARMA(p,q)\mathrm{ARMA}(p,q) 则两者皆拖尾。实际操作中常辅以赤池信息准则(AIC)或贝叶斯信息准则(BIC)在候选模型中进行选择。

(2)参数估计(Estimation)。通常采用最大似然估计(MLE)或条件最小二乘法(CLS)。对于 ARIMA(p,d,q)\mathrm{ARIMA}(p,d,q) 模型,先对序列做 dd 阶差分,再对差分后的平稳序列拟合 ARMA 模型。卡尔曼滤波也可用于状态空间形式的 ARIMA 估计,尤其在处理缺失数据时具有优势。

(3)模型诊断(Diagnostic Checking)。检验残差是否为白噪声——若残差中仍存在自相关,说明模型未能充分捕获数据中的动态结构,需要重新识别和估计。常用诊断工具包括 Ljung-Box Q 检验、残差的 ACF 图以及正态性检验

模型选择与预测

模型选择的核心权衡是拟合优度简约性之间的平衡。AIC 和 BIC 在似然函数值的基础上加入参数数量的惩罚项,前者惩罚较轻(参数每增加一个,惩罚为2),后者惩罚较重(惩罚为 ln(T)\ln(T) 倍参数个数),因此 AIC 倾向于选择更大的模型,BIC 倾向于更简约的模型。

预测是 ARIMA 模型的核心应用场景和主要价值所在。对于 ARIMA(p,d,q)\mathrm{ARIMA}(p,d,q) 模型,最优线性预测由模型的条件期望给出,预测误差的方差随预测步长的增加而收敛于序列的无条件方差(对于平稳 ARMA 部分)。这一性质的经济含义是:短期预测的精度高于长期预测,且预测区间的宽度随步长单调递增。

扩展与应用

SARIMA(Seasonal ARIMA)记为 SARIMA(p,d,q)(P,D,Q)s\mathrm{SARIMA}(p,d,q)(P,D,Q)_s,其中 ss 为季节性周期(如月度数据 s=12s=12,季度数据 s=4s=4)。SARIMA 在非季节性分量的基础上增加了季节性自回归和移动平均项,适用于季节性调整经济指标预测和能源需求预测。

ARIMAX(ARIMA with Exogenous Variables)在 ARIMA 基础上引入外生解释变量,使模型可以纳入干预分析(如政策变化、突发事件)或其他协变量的影响。ARIMAX 是动态回归的一种形式,其标准形式为:

yt=βxt+θ(B)ϕ(B)(1B)dεty_t = \beta x_t + \frac{\theta(B)}{\phi(B)(1-B)^d} \varepsilon_t

经济学金融学中,ARIMA 类模型的应用极为广泛。在宏观经济学领域,它被用于GDP增长率预测、通胀率建模、失业率分析与工业增加值短期预报;在金融经济学中,ARIMA 常被应用于股票收益分析、利率期限结构建模及汇率波动预测。在计量经济学中,ARIMA 是格兰杰因果检验协整分析的基础工具之一。尽管在机器学习时代,长短期记忆网络(LSTM)等复杂模型在一些预测任务中表现更优,ARIMA 因其可解释性强、估计稳定、理论基础成熟,在学术研究和实务预测中仍保持着不可替代的地位。