ARTICLE

自回归条件异方差

自回归条件异方差 (ARCH) 自回归条件异方差(Autoregressive Conditional Heteroskedasticity, 简称 ARCH)是由罗伯特·恩格尔 (Robert F. Engle) 于1982年在《Econometrica》发表的经典论文中提出的时间序列模型,恩格尔因此贡献获得2003年诺贝尔经济学奖。ARCH 模型的核心思

浏览 6 更新 2025-10-29

自回归条件异方差 (ARCH)

自回归条件异方差(Autoregressive Conditional Heteroskedasticity, 简称 ARCH)是由罗伯特·恩格尔 (Robert F. Engle) 于1982年在《Econometrica》发表的经典论文中提出的时间序列模型,恩格尔因此贡献获得2003年诺贝尔经济学奖。ARCH 模型的核心思想是:时间序列数据中误差项的条件方差并非恒定,而是依赖于过去误差平方的大小。这一发现颠覆了传统计量经济学中同方差性的基本假设,为描述经济和金融数据中普遍存在的"波动率聚集"现象提供了强有力的分析工具。

经济直觉与背景

在金融市场中,一个显著的典型事实是大波动往往跟随大波动,小波动跟随小波动——即波动率在时间上具有持续性。传统ARMA模型假设扰动项具有恒定的无条件方差,无法刻画这种时变波动特征。ARCH 模型的突破在于:将当前波动率建模为过去冲击平方的线性函数,使得模型能够自适应地捕捉波动率的动态变化。

模型设定

对于均值方程 yt=xtβ+εt y_t = \mathbf{x}_t'\boldsymbol{\beta} + \varepsilon_t ,ARCH(q) 模型将条件方差 σt2Var(εtFt1) \sigma_t^2 \equiv \text{Var}(\varepsilon_t \mid \mathcal{F}_{t-1}) 设定为:

σt2=α0+α1εt12+α2εt22++αqεtq2\sigma_t^2 = \alpha_0 + \alpha_1 \varepsilon_{t-1}^2 + \alpha_2 \varepsilon_{t-2}^2 + \cdots + \alpha_q \varepsilon_{t-q}^2

其中 Ft1 \mathcal{F}_{t-1} t1 t-1 时刻的信息集。参数约束要求 α0>0 \alpha_0 > 0 αi0 \alpha_i \geq 0 i=1,,q i = 1, \ldots, q )以确保方差恒为正;同时 i=1qαi<1 \sum_{i=1}^q \alpha_i < 1 保证过程的协方差平稳性。扰动项通常假设服从条件正态分布 εtFt1N(0,σt2) \varepsilon_t \mid \mathcal{F}_{t-1} \sim N(0, \sigma_t^2) ,或更厚尾的学生 t 分布以更好地拟合金融数据的尖峰厚尾特征。

模型性质

ARCH 过程具有以下关键统计性质:

  1. 无条件方差恒定:尽管条件方差随时间变化,εt \varepsilon_t 的无条件方差为 Var(εt)=α0/(1i=1qαi) \text{Var}(\varepsilon_t) = \alpha_0 / (1 - \sum_{i=1}^q \alpha_i) ,仍为常数。这使得 ARCH 过程本身是白噪声,但其平方序列 {εt2} \{\varepsilon_t^2\} 表现出自相关性。
  2. 波动率聚集:当 αi \alpha_i 为正时,一个大的冲击 εti \varepsilon_{t-i} 导致 σt2 \sigma_t^2 膨胀,使得当期更可能产生大波动,从而内生出波动率的持续时段。
  3. 尖峰厚尾:即使 εt \varepsilon_t 条件正态,ARCH 过程的无条件分布也具有比正态分布更厚的尾部,这解释了金融收益率数据常见的超额峰度现象。

估计与检验

ARCH 模型通常采用极大似然估计 (MLE)。在条件正态假设下,对数似然函数为(忽略常数项):

(θ)=12t=1T(lnσt2+εt2σt2)\ell(\boldsymbol{\theta}) = -\frac{1}{2} \sum_{t=1}^{T} \left( \ln \sigma_t^2 + \frac{\varepsilon_t^2}{\sigma_t^2} \right)

其中 σt2 \sigma_t^2 依赖于参数 θ=(β,α0,α1,,αq) \boldsymbol{\theta} = (\boldsymbol{\beta}', \alpha_0, \alpha_1, \ldots, \alpha_q)' 。估计通过数值优化(如BHHH算法)实现。

判断是否应使用 ARCH 类模型的两个标准检验:

  • 恩格尔ARCH检验:对 OLS 残差平方 ε^t2 \hat{\varepsilon}_t^2 进行 q q 阶自回归,检验 H0:α1==αq=0 H_0: \alpha_1 = \cdots = \alpha_q = 0 。检验统计量 TR2 TR^2 渐近服从 χ2(q) \chi^2(q)
  • Ljung-Box Q检验:应用于残差平方序列,检验是否存在自相关性。若 Q Q 统计量显著,则拒绝同方差原假设。

主要扩展

ARCH 模型的主要局限在于:往往需要较大的 q q 才能充分捕捉波动持续性,这会引入大量参数并导致估计困难。由此发展出以下重要扩展:

  • GARCH (广义ARCH):由蒂姆·博勒斯列夫 (Bollerslev, 1986) 提出,将条件方差建模为 σt2=α0+i=1qαiεti2+j=1pβjσtj2 \sigma_t^2 = \alpha_0 + \sum_{i=1}^q \alpha_i \varepsilon_{t-i}^2 + \sum_{j=1}^p \beta_j \sigma_{t-j}^2 。通过加入方差自身的滞后项,GARCH(1,1) 通常便能充分描述波动持续性,极大地减少参数数量。
  • EGARCH (Nelson, 1991):对对数条件方差建模,无需非负约束,且能捕捉杠杆效应——负面冲击对波动率的影响通常大于同等幅度正面冲击。
  • GARCH-M:将条件方差直接引入均值方程 yt=xtβ+γσt2+εt y_t = \mathbf{x}_t'\boldsymbol{\beta} + \gamma \sigma_t^2 + \varepsilon_t ,用于检验风险溢价假设。
  • 多元GARCH:将单变量框架推广至多个资产,用于研究波动溢出效应时变相关性

应用领域

ARCH 及 GARCH 类模型的应用极为广泛:

  1. 金融风险度量 VaR (Value at Risk) 和预期亏损 (Expected Shortfall) 的计算依赖于对波动率的准确预测,GARCH 族模型是业界标准工具之一。
  2. 资产定价:在期权定价(如 Duan (1995)的 GARCH 期权定价模型)和 CAPM的时变贝塔估计中应用广泛。
  3. 宏观经济:分析通货膨胀的不确定性、汇率波动传递效应以及GDP增长率的波动特征。
  4. 政策分析:评估政策冲击对金融市场波动性的影响。

模型诊断与选择

建立 ARCH 族模型后,需要进行系统的诊断检验:

  • 标准化残差检验:将残差除以估计的条件标准差 ε^t/σ^t \hat{\varepsilon}_t / \hat{\sigma}_t ,标准化残差及其平方应不再具有自相关性。若 Ljung-Box 检验仍然显著,说明模型尚未充分捕捉波动动态,需增加阶数或更换模型形式。
  • 信息准则:使用 AIC BIC 在 ARCH(q) 的不同阶数间进行选择,避免过度参数化。实践中,GARCH(1,1) 在绝大多数金融时间序列中表现优异,已成为默认基准。
  • 分布假设检验:条件正态假设常被拒绝(残差仍呈现厚尾),此时可采用拟极大似然估计或切换至学生 t 分布、广义误差分布等更灵活的设定。

ARCH 与有效市场假说

ARCH 模型的出现对有效市场假说 (EMH) 产生了微妙的影响。在弱式有效市场中,收益率本身不可预测,但 ARCH 模型表明收益率的二阶矩(波动率)具有可预测性。这一发现并非对市场有效性的否定——因为波动率的可预测性可能源于信息到达的时序聚类(信息产生过程本身具有自相关性)或市场微观结构效应——但它确实扩展了我们对"可预测性"的理解边界。与此相关,波动率交易(如 VIX 衍生品)和波动率择时策略的兴起,直接受益于 ARCH 族模型提供的波动率预测能力。

计算实现

主流统计软件均内置了 ARCH 类模型的估计功能:\texttt{R} 语言的 \texttt{rugarch} 和 \texttt{fGarch} 包提供了从单变量到多变量的完整实现;\texttt{Python} 的 \texttt{arch} 库(由 Kevin Sheppard 开发)支持多种 GARCH 变体;\texttt{Stata} 的 \texttt{arch} 命令和 \texttt{EViews} 的 ARCH 估计模块被广泛应用于实证研究。这些工具使得研究者可以专注于模型设定与经济解释,而无需手动处理复杂的数值优化问题。

局限与反思

ARCH 类模型的主要批评包括:参数的非负约束可能过于严格(虽然后续模型已经放宽此限制);模型设定是统计性的而非源自经济理论,缺乏对波动率经济机制的微观基础解释;对波动率结构突变的适应能力有限;以及在高频数据环境下预测能力下降——已实现波动率 (Realized Volatility) 方法在高频领域展现出更强的预测精度。此外,ARCH 模型在波动率预测中的表现虽然优于常数方差模型,但预测的 R2 R^2 通常较低,反映了波动率自身的高度不确定性。

尽管如此,ARCH 模型开创的时变波动分析范式深刻改变了计量经济学金融学的研究面貌。从最初的 ARCH(q) 到如今不计其数的变体——包括引入长记忆性的FIGARCH、结合已实现测度的Realized GARCH、以及纳入机器学习元素的新一代模型——这一领域始终保持着旺盛的生命力。恩格尔的开创性工作不仅解决了一个具体的技术问题,更揭示了一个经济学基本原则:不确定性本身也是动态演化的,且这种演化具有可建模、可预测的内在结构。