ARTICLE
时间序列模型 (Time Series Models)
时间序列模型 (Time Series Models) 时间序列模型是以时间先后顺序排列的观测数据为对象的统计建模框架。时间序列数据以固定的时间间隔(如每日、每月、每季度)采集,其核心特征在于自相关——相邻观测值之间往往存在统计上的依赖关系,这区别于横截面数据中的独立同分布假设。时间序列模型广泛应用于宏观经济学(如GDP、通胀率预测)、金融学(如资产收益率、
时间序列模型 (Time Series Models)
时间序列模型是以时间先后顺序排列的观测数据为对象的统计建模框架。时间序列数据以固定的时间间隔(如每日、每月、每季度)采集,其核心特征在于自相关——相邻观测值之间往往存在统计上的依赖关系,这区别于横截面数据中的独立同分布假设。时间序列模型广泛应用于宏观经济学(如GDP、通胀率预测)、金融学(如资产收益率、波动率建模)、计量经济学、工程信号处理和气象学等领域。按其是否包含随机成分,时间序列模型可分为确定性趋势模型和随机过程模型,后者是现代时间序列分析的主流。
时间序列的基本概念
平稳性(stationarity)是时间序列建模的前提条件。严格平稳要求序列的联合分布对时间平移不变;弱平稳(协方差平稳)则只要求均值恒定、方差有限,且自协方差仅依赖于时间间隔而非具体时点:,。非平稳序列(如含确定性趋势或单位根的序列)需先经过差分或去趋势等变换后才能建模。
自相关函数(ACF)定义为 ,衡量序列自身与滞后 期之间的线性相关性。偏自相关函数(PACF)则在剔除中间滞后影响后给出滞后 的净相关。ACF 与 PACF 的截尾/拖尾模式是Box-Jenkins方法中模型识别阶段的核心判据。
经典时间序列模型
自回归模型 (AR)将当前值表示为其过去值的线性组合加上白噪声冲击。AR 模型为 ,其平稳要求 AR 多项式的根位于单位圆外。自回归模型的阶数 可通过 PACF 的截尾滞后阶数进行初步判断。
移动平均模型 (MA)将当前值表示为当期及过去冲击的加权和。MA 模型为 ,在任意权重下均平稳,但要求可逆性条件以保证参数唯一可识别。MA 模型的阶数 可通过 ACF 的截尾特征进行初步识别。
自回归移动平均模型 (ARMA) 融合二者:,以最少参数刻画平稳序列的自相关结构。ARMA 模型的识别比纯 AR 或纯 MA 更为复杂,因为其 ACF 和 PACF 均呈拖尾衰减模式,需借助信息准则进行阶数选择。
差分自回归移动平均模型 (ARIMA) 通过先对非平稳序列进行 阶差分使其平稳,再对差分后序列拟合 ARMA 模型。ARIMA 的引入极大扩展了时间序列模型的适用范围,使之能够处理含趋势和季节成分的实际数据。对于季节性强的时间序列,SARIMA 模型进一步引入季节差分和季节自回归/移动平均项。
模型选择与诊断检验
在 Box-Jenkins 建模框架中,模型构建分为识别、估计和诊断检验三个阶段。识别阶段借助 ACF 和 PACF 的图形模式初步判定备选阶数。估计阶段通常采用最大似然估计(MLE)或条件最小二乘法,在正态性假设下获得参数的一致估计和渐近正态分布。诊断检验阶段通过残差的 Ljung-Box Q 统计量验证白噪声假设:若残差仍存在显著自相关,则模型设定不足,需重新调整阶数。模型选择常辅以赤池信息准则 (AIC)或贝叶斯信息准则 (BIC)进行权衡,在拟合优度和模型简洁性之间寻求最优平衡。
波动率模型
经典 ARMA 类模型假设误差项的同方差性,但金融资产收益率的时间序列往往呈现波动集聚性——大幅波动后常跟随更多大幅波动。ARCH 模型(自回归条件异方差)和其推广 GARCH 模型(广义自回归条件异方差)通过在方差方程中引入过去冲击的平方和/或过去条件方差的滞后项来捕捉这一现象。GARCH(1,1) 为 ,其中 是条件方差, 衡量新信息的冲击力度, 反映波动的持续性, 越接近1则波动冲击的衰减越慢。更复杂的扩展包括允许杠杆效应的 EGARCH 和 GJR-GARCH,以及多元情形下的 DCC-GARCH 等。在金融风险管理中,GARCH 类模型是计算风险价值(VaR)和预期短缺(ES)的标准工具。
多元与状态空间方法
当需要同时建模多个相互关联的时间序列时,向量自回归(VAR)将单变量 AR 推广至多元情形:。VAR 模型是宏观经济学中货币政策分析、脉冲响应和格兰杰因果关系检验的标准工具。脉冲响应函数(IRF)刻画了某一变量的一单位冲击对其他所有变量当前和未来取值的影响路径,是 VAR 分析的核心产出之一。
状态空间模型则为时间序列分析提供了统一的表示框架。它通过隐含的状态方程和可观测的测量方程将系统分解为不可观测的潜在状态和观测噪声,通过卡尔曼滤波进行递归估计和预测。状态空间模型的灵活性使其能够统一处理 ARIMA、结构时间序列、时变参数模型和动态因子模型。在宏观经济学中,状态空间模型常用于估计不可观测变量,如自然失业率、潜在产出和通胀预期。
现代发展
近年来,机器学习方法逐步渗透时间序列领域。长短期记忆网络(LSTM)和 Transformer 架构在捕捉长期依赖关系上展现出超越传统 ARIMA 的能力,特别适用于高维和非线性时间序列预测场景。与此同时,贝叶斯结构时间序列(BSTS)将状态空间方法与贝叶斯统计相结合,在因果推断(如干预效果评估)和不确定性量化方面提供严谨的概率框架。
尽管深度学习方法在复杂预测任务中表现突出,传统的时间序列模型因其良好的可解释性、透明的统计性质和成熟的理论基础,在学术研究和政策实务中仍然是不可替代的分析武器。理解 ARIMA、GARCH 和 VAR 等经典模型,是掌握现代时间序列分析的必经之路。