ARTICLE

门限自回归

门限自回归 (Threshold Autoregressive Model) 门限自回归(Threshold Autoregressive Model,简称 TAR)是一种重要的非线性时间序列模型,由 Tong(1978)和 Tong \& Lim(1980)提出。该模型的核心思想是:时间序列的动态结构(即自回归系数)会根据某个门限变量(threshold

浏览 0 更新 2025-11-09

门限自回归 (Threshold Autoregressive Model)

门限自回归(Threshold Autoregressive Model,简称 TAR)是一种重要的非线性时间序列模型,由 Tong(1978)和 Tong \& Lim(1980)提出。该模型的核心思想是:时间序列的动态结构(即自回归系数)会根据某个门限变量(threshold variable)的取值是否超过特定门限值(threshold value)而呈现出分段的、区制切换(regime-switching)的特征。与传统的线性自回归模型(AR)不同,TAR 模型允许不同区制具有截然不同的动态行为,从而能够捕捉非对称周期、非线性均值回复等复杂现象,广泛应用于宏观经济学计量经济学金融学统计学等领域。

模型设定

以两区制(two-regime)TAR 模型为例,其基本形式如下:

yt={ϕ1,0+ϕ1,1yt1++ϕ1,pytp+ε1,t,若 ztdγϕ2,0+ϕ2,1yt1++ϕ2,pytp+ε2,t,若 ztd>γy_t = \begin{cases} \phi_{1,0} + \phi_{1,1} y_{t-1} + \cdots + \phi_{1,p} y_{t-p} + \varepsilon_{1,t}, & \text{若 } z_{t-d} \le \gamma \\ \phi_{2,0} + \phi_{2,1} y_{t-1} + \cdots + \phi_{2,p} y_{t-p} + \varepsilon_{2,t}, & \text{若 } z_{t-d} > \gamma \end{cases}

其中,yty_t 为目标时间序列;pp 为自回归滞后阶数;ztdz_{t-d} 为门限变量(通常取 ytdy_{t-d} 自身,此时模型称为自激励门限自回归模型,即 SETAR);dd 为延迟参数(delay lag),决定使用哪一期的观测值作为门限变量;γ\gamma 为门限值(threshold),划分两个区制的边界;ϕ1,j\phi_{1,j}ϕ2,j\phi_{2,j} 分别为两个区制的自回归系数;εi,t\varepsilon_{i,t} 为区制内的白噪声误差项,方差异允许在不同区制中不同。当存在多个门限值时,模型可扩展为三区制或多区制 TAR。

关键特征

TAR 模型的核心优势在于其分段线性(piecewise linear)结构:每个区制内部是线性 AR 模型,但整体上呈现非线性。这种性质既保留了线性模型的解释力,又赋予了模型捕捉非对称动态的能力。例如,经济增长在衰退期和扩张期可能具有不同的持续性特征(深度衰退后的强反弹 vs 温和扩张后的平稳延续),这种非对称性可通过 SETAR 模型实现:当 ytdy_{t-d}低于门限值(经济处于衰退)时为一组 AR 系数,高于门限值(经济处于扩张)时为另一组 AR 系数。

TAR 模型还支持阈值效应(Threshold Effect)的统计检验。最常用的方法为 Hansen(1996)提出的自举(bootstrap)检验:原假设为线性 AR 模型(无门限效应),备择假设为 TAR 模型。由于门限参数在原假设下不可识别(Davies 问题),传统检验统计量不服从标准分布,Hansen 建议使用自举法计算 pp 值。对于多区制的扩展,可执行序贯检验:先检验是否存在单一门限,若拒绝原假设则检验是否存在两个门限,以此类推。

估计方法

TAR 模型的参数估计通常采用条件最小二乘法(Conditional Least Squares, CLS),也可通过最大似然估计(MLE)实现(当误差项服从正态分布时二者等价)。估计分为以下步骤:

  1. 设定门限变量 ztdz_{t-d} 和延迟参数 dd,通常通过 AIC、BIC 等信息准则选择最优的 dd 和滞后阶数 pp
  2. 对于给定的门限值 γ\gamma,将样本按门限变量是否超过 γ\gamma 划分为两个(或多个)子样本,在每个子样本内分别用 OLS 估计 AR 系数。
  3. 计算残差平方和(SSR),并在 γ\gamma 的可行范围内搜索使 SSR 最小的门限值。Hansen(2000)建议将 γ\gamma 限制在门限变量分布的两端各修剪(trim)一定比例(通常 10\%—15\%)的范围内,以保证每个区制有足够的观测值。
  4. 得到最优 γ^\hat{\gamma} 后,利用相应区制内的 AR 系数估计值即可获得完整的 TAR 模型。

主要拓展形式

SETAR(Self-Exciting TAR)是应用最广泛的 TAR 变体,其门限变量即为目标变量自身的滞后值 ztd=ytdz_{t-d} = y_{t-d},适用于刻画时间序列的内生性区制切换行为,如失业率在不同阶段的动态差异。

TAR-GARCH 模型将 TAR 框架与GARCH模型结合,允许条件均值和条件方差同时随区制切换,常用于金融时间序列中不同波动环境的建模。

Band-TARBAND-TAR 等多区制模型则进一步引入中立带(neutral band)概念,中间区制内序列可能呈现随机游走特征,而外部区制体现均值回复力量,适合分析汇率等存在目标区制度的经济变量。

应用与局限

在应用中,TAR 模型已成功揭示汇率的目标区行为、利率的非对称调整、股票市场的波动率集聚等非线性现象。然而,该模型也存在一些局限:门限参数的不连续性质使推断和区间估计较为困难;当区制数目较多或滞后阶数较大时,模型参数激增,容易过拟合;此外,门限变量均为可观测变量,难以刻画潜在的不可观测区制转换(该场景更适合马尔可夫转换模型)。

总体而言,门限自回归模型为非线性时间序列分析提供了一套直观且富有解释力的框架,在经济、金融、气候等领域的非线性动态研究中占据了不可替代的地位。