ARTICLE
arima
ARIMA模型 (Autoregressive Integrated Moving Average Model) ARIMA模型,全称自回归整合移动平均模型(Autoregressive Integrated Moving Average Model),是时间序列分析和预测中最著名和最广泛使用的统计方法之一。它基于时间序列数据自身的变化规律,通过数学模型描述
ARIMA模型 (Autoregressive Integrated Moving Average Model)
ARIMA模型,全称自回归整合移动平均模型(Autoregressive Integrated Moving Average Model),是时间序列分析和预测中最著名和最广泛使用的统计方法之一。它基于时间序列数据自身的变化规律,通过数学模型描述和预测未来值。核心思想是:一个时间序列的未来值可以被解释为其过去值、过去的预测误差以及随机扰动的线性组合。该模型由乔治·博克斯和格威利姆·詹金斯在20世纪70年代推广,其建模过程常被称为Box-Jenkins方法。ARIMA模型表示为ARIMA,其中三个参数分别代表模型三个核心部分。
三部分构成
自回归(AR)部分。AR模型认为时刻的值可用自身过去个滞后值预测:,其中为自回归系数,为白噪声误差项。简而言之AR就是对其自身滞后项进行线性回归。
差分(I)部分。时间序列分析的平稳性(Stationarity)要求序列统计特性(均值、方差、自相关)不随时间变化。许多经济金融序列(GDP、股价)因趋势性而非平稳,直接建模会导致伪回归等问题。I(Integrated)部分通过差分将非平稳序列转化为平稳序列:一阶差分消除线性趋势,二阶差分消除曲线趋势。参数为差分次数——序列经次差分后平稳则称I,通常取0、1或2。
移动平均(MA)部分。MA模型关注预测误差:,为移动平均系数,用来捕捉无法被AR解释的短期随机冲击。MA和AR虽形式相似但捕获不同类型的时间依赖:AR依赖过去观测值,MA依赖过去预测误差。
组合三部分后ARIMA的完整形式为:对原始序列进行阶差分后得到平稳序列,再对该平稳序列拟合ARMA模型——即AR和MA的组合。ARIMA 退化为普通ARMA模型。
建模过程与应用
Box-Jenkins方法采用递推三阶段建模流程。模型识别:通过自相关函数(ACF)和偏自相关函数(PACF)图初步确定和的可能取值,通过单位根检验(ADF检验)确定差分阶数。参数估计:使用最大似然估计或条件最小二乘法估计AR和MA系数。模型诊断:检验残差是否为白噪声(无自相关)、通过信息准则(AIC、BIC)比较候选模型。
ARIMA模型的扩展包括:季节性ARIMA(SARIMA)加入季节性差分和季节性AR/MA项;ARIMAX引入外生解释变量;与ARCH/GARCH型结合同时建模条件均值和条件方差。ARIMA在宏观经济预测(GDP、通胀、失业率)、金融时序分析(股价、汇率)、库存管理和需求预测等领域有广泛应用。尽管近年来深度学习方法(LSTM、Transformer)在时序预测领域兴起,ARIMA以其坚实的统计理论基础和可解释性,仍是时间序列建模的标准基准方法。