ARTICLE

仿射期限结构模型

仿射期限结构模型 (Affine Term Structure Model) 仿射期限结构模型(Affine Term Structure Model, ATSM)是一类假设债券收益率(或其对数价格)为有限个状态变量的仿射(线性加常数)函数的利率建模框架。该模型由 Duffie 与 Kan (1996) 系统化提出,并经 Dai 与 Singleton (2

浏览 6 更新 2026-07-10

仿射期限结构模型 (Affine Term Structure Model)

仿射期限结构模型(Affine Term Structure Model, ATSM)是一类假设债券收益率(或其对数价格)为有限个状态变量的仿射(线性加常数)函数的利率建模框架。该模型由 Duffie 与 Kan (1996) 系统化提出,并经 Dai 与 Singleton (2000) 完成详尽分类,已成为连续时间金融中定价零息债券、利率衍生品和管理利率风险的核心工具。其核心吸引力在于,仿射结构在保持解析可处理性的同时,能够灵活捕捉收益率曲线的时序动态和横截面形状——包括水平、斜率和曲率因子。

基本设定与仿射结构

在无套利定价框架下,考虑一个由 NN 维状态向量 XtX_t 驱动的连续时间经济。短期利率 rtr_t 被设定为状态变量的仿射函数:

rt=δ0+δXXtr_t = \delta_0 + \delta_X^\top X_t

其中 δ0R\delta_0 \in \mathbb{R}δXRN\delta_X \in \mathbb{R}^N。状态变量在风险中性测度 Q\mathbb{Q} 下遵循仿射扩散过程:

dXt=κQ(θQXt)dt+ΣStdWtQdX_t = \kappa^\mathbb{Q} (\theta^\mathbb{Q} - X_t) dt + \Sigma \cdot S_t \cdot dW_t^\mathbb{Q}

这里 StS_t 为对角矩阵,其对角元 Sii,t=αi+βiXtS_{ii, t} = \sqrt{\alpha_i + \beta_i^\top X_t},确保波动率为状态变量的仿射平方根形式——此条件正是模型得以求解的关键约束。

在此设定下,到期日为 τ=Tt\tau = T - t 的零息债券价格 P(t,T)P(t, T) 具有指数-仿射形式:

P(t,T)=exp(A(τ)+B(τ)Xt)P(t, T) = \exp\left( A(\tau) + B(\tau)^\top X_t \right)

其中 A(τ)A(\tau)B(τ)B(\tau) 为满足 Riccati 常微分方程组的确定性函数。相应地,零息收益率 y(t,τ)=1τlnP(t,τ)y(t, \tau) = -\frac{1}{\tau} \ln P(t, \tau) 为状态变量的严格仿射函数:

y(t,τ)=A(τ)τB(τ)τXty(t, \tau) = -\frac{A(\tau)}{\tau} - \frac{B(\tau)^\top}{\tau} X_t

这一性质——收益率是状态向量的线性函数——即为"仿射期限结构模型"得名的缘由,也是其经验上高度便利的根本原因。

经典特例:Vasicek 与 CIR

两个经典的单因子模型构成了 ATSM 的基石。

Vasicek 模型 (1977) 设定短期利率在风险中性测度下遵循 Ornstein-Uhlenbeck 过程:

drt=κ(θrt)dt+σdWtQdr_t = \kappa (\theta - r_t) dt + \sigma dW_t^\mathbb{Q}

此处波动率恒为常数 σ\sigma(即 α=σ2\alpha = \sigma^2β=0\beta = 0),属于高斯 ATSM。Vasicek 模型的解析解特别简洁——A(τ)A(\tau)B(τ)B(\tau) 为指数函数的闭式组合——但其致命缺陷在于 rtr_t 可能取负值,与名义利率的非负约束相悖。

Cox-Ingersoll-Ross (CIR) 模型 (1985) 通过引入平方根波动率修正了 Vasicek 模型的这一缺陷:

drt=κ(θrt)dt+σrtdWtQdr_t = \kappa (\theta - r_t) dt + \sigma \sqrt{r_t} \, dW_t^\mathbb{Q}

此处 α=0\alpha = 0β=1\beta = 1。当 Feller 条件 2κθ>σ22\kappa\theta > \sigma^2 满足时,rtr_t 严格为正。CIR 模型同样产生仿射收益率结构,其 Bond 价格公式涉及双曲函数,在保持灵活性的同时确保了利率的非负性。

Duffie-Kan 框架与 Dai-Singleton 分类

Duffie 与 Kan (1996) 将上述特例推广至一般 NN 因子情形,并为 ATSM 的仿射结构提供了充分必要条件:漂移项和波动率平方(方差-协方差矩阵)均须为状态变量的仿射函数,且波动率矩阵需保持正半定性。

Dai 与 Singleton (2000) 在此基础上完成了对 NN-因子 ATSM 的完整分类。他们将 NN 个状态变量中具有平方根波动率(即 βi>0\beta_i > 0)的因子个数记为 mm0mN0 \leq m \leq N),并按 mm 将模型分为 N+1N+1 个子类 Am(N)\mathbb{A}_m(N)A0(N)\mathbb{A}_0(N) 为纯高斯模型(所有因子为 Gaussian),AN(N)\mathbb{A}_N(N) 为纯 CIR 模型(所有因子为平方根过程),中间的 Am(N)\mathbb{A}_m(N) 混合两类过程。这一分类对经验实施至关重要:不同子类在识别性(Identification)、极大似然估计和滤波算法上具有极为不同的性质。实践中,A1(3)\mathbb{A}_1(3)A2(3)\mathbb{A}_2(3) 三因子模型在收益率曲线拟合和预测中表现得最为稳健。

风险溢价设定与"本质上仿射"

从物理测度 P\mathbb{P} 到风险中性测度 Q\mathbb{Q} 的转换由风险的市场价格 Λt\Lambda_t 参数化。在完全仿射设定下,Λt\Lambda_t 被约束为波动率的倍数。然而,Duffee (2002) 指出,这一约束严重限制了风险溢价的时变灵活性——完全仿射模型难以复现预期超额收益的可预测性。为此,Duffee 提出了本质上仿射(Essentially Affine)的扩展:允许高斯因子对应的风险价格不仅依赖波动率,还可随状态变量本身自由变动,从而在保持仿射结构的前提下大幅提升了模型拟合超额收益时变特征的能力。这一扩展已成为后续实证 ATSM 文献的标准设定。

估计方法与实证应用

ATSM 的估计策略主要分为三类。极大似然估计(MLE)结合 Kalman 滤波:以可观测的少数关键期限收益率为观测方程,状态变量为潜变量,通过 Kalman 滤波递归计算似然函数。模拟矩估计(SMM 与 EMM):利用模型的模拟矩匹配数据的样本矩,特别适合因子不可直接观测的情形。贝叶斯方法:通过 MCMC 对状态变量和参数进行联合后验推断,在处理平方根过程的边界偏误和高维参数空间时具有优势。

在中央银行和政策分析中,ATSM 被广泛用于从收益率曲线中提取市场隐含的通胀预期、实际利率预期和期限溢价——以著名的 ACM 分解(Adrian、Crump 与 Moench, 2013)为代表,该方法利用三因子仿射模型将名义收益率分解为短期利率预期路径和剩余期限溢价两部分。ACM 方法的关键创新在于通过三阶段线性回归避开了传统极大似然估计中似然函数的多峰和数值不稳定问题,使估计过程极为快速稳健,已被美联储、欧央行和中国人民银行等机构采纳为常规分析工具。在投资实践中,ATSM 为久期管理蝶式交易利率互换的定价与对冲提供基础分析框架。实证研究表明,三因子高斯仿射模型在样本外预测一年期以上收益率时,显著优于随机游走基准——这一预测能力源于风险溢价的均值回复性和期望利率的可预测性。

局限与扩展方向

尽管地位显赫,ATSM 面临若干实证挑战。第一,仿射约束意味着因子载荷为恒常线性映射,难以捕捉金融危机期间非线性区制转换和尾部依赖特征——为此,区制转换模型和二次期限结构模型(QTSM)作为备选方案在部分情境中表现更优。第二,高维 ATSM 面临过参数化和识别弱性问题:在多因子设定下,不同参数组合可能产生几乎相同的似然值,使点估计不可靠——这推动了以目标约简和正则化为主的估计技术发展,如 Joslin、Singleton 与 Zhu (2011) 的正则化极大似然法。第三,零利率下限 (ZLB) 和负利率政策的出现催生了影子利率 ATSM(Shadow-Rate ATSM),其在仿射框架下对名义利率施加零下界约束,将观测利率定义为影子利率与零的最大值,保留了解析可处理性的同时克服了高斯模型的负利率漏洞——Krippner (2012) 与 Wu 与 Xia (2016) 的影子利率模型已成为央行界分析非常规货币政策的标配工具。

ATSMs 的核心洞见——通过有限个潜因子以仿射形式为整条收益率曲线定价——深刻地塑造了现代固定收益分析的方法论,从学术研究到交易前台,从货币政策沟通到宏观金融压力测试,均可见其深远影响。