ARTICLE

违约概率

违约概率 (Probability of Default, PD) 违约概率(Probability of Default,简称 PD)是信用风险管理中最为核心的量化指标之一,衡量债务人在未来特定时段内无法按约定履行债务偿还义务的可能性。作为巴塞尔资本协议(Basel Accords)内部评级法(IRB)的基础参数,PD 与违约损失率(LGD)、违约风险暴露

浏览 0 更新 2026-07-18

违约概率 (Probability of Default, PD)

违约概率(Probability of Default,简称 PD)是信用风险管理中最为核心的量化指标之一,衡量债务人在未来特定时段内无法按约定履行债务偿还义务的可能性。作为巴塞尔资本协议(Basel Accords)内部评级法(IRB)的基础参数,PD 与违约损失率(LGD)、违约风险暴露(EAD)和有效期限(M)共同构成银行计算监管资本的核心输入。其精确估计不仅直接关系到单一信贷决策,更对金融机构整体风险加权资产的计算和资本充足率产生系统性影响。

基本定义与度量框架

在概念层面,违约概率可形式化地定义如下:令债务人 ii 在时间窗口 [t,t+Δt][t, t+\Delta t] 内的违约事件为二元变量 Di(t,Δt){0,1}D_{i}(t, \Delta t) \in \{0, 1\},则该债务人的违约概率为:

PDi(t,Δt)=P[Di(t,Δt)=1Ft]PD_{i}(t, \Delta t) = \mathbb{P}[D_{i}(t, \Delta t) = 1 \mid \mathcal{F}_{t}]

其中 Ft\mathcal{F}_{t} 表示在时刻 tt 可获得的所有信息集合,包括债务人的财务数据、信用历史、宏观经济状况等。PD 的时间维度至关重要:通常所指的一年期违约概率(One-Year PD)是监管资本计算的标准期限,但实践中亦涉及多年期累计违约概率和违约概率期限结构

在巴塞尔协议框架下,"违约"的认定遵循严格的监管标准:当债务人被判定为不可能全额偿还债务、或对某项实质性债务的逾期超过 90 天时,即触发违约事件。这一标准化定义确保了不同机构间 PD 估计的可比性与一致性。

PD 的估计方法

信用风险领域对违约概率的估计方法可大致划分为三类:结构模型(Structural Models)、简化模型(Reduced-Form Models)和统计/机器学习方法。

结构模型(Merton 模型及其扩展)

Merton 模型(1974)是结构方法的基础框架,它基于期权定价理论将公司股权视为其资产价值的看涨期权,行权价格为债务面值。模型假设公司资产价值 VtV_t 服从几何布朗运动:

dVt=μVtdt+σVVtdWtdV_t = \mu V_t dt + \sigma_V V_t dW_t

违约在公司资产价值低于债务面值 DD 时发生。在时刻 tt,公司资产价值为 VtV_t,距离违约的距离(Distance to Default, DD)定义为:

DD=ln(Vt/D)+(μσV2/2)(Tt)σVTtDD = \frac{\ln(V_t/D) + (\mu - \sigma_V^2/2)(T-t)}{\sigma_V \sqrt{T-t}}

在风险中性测度下,违约概率为 PD=Φ(DD)PD = \Phi(-DD),其中 Φ\Phi 为标准正态累积分布函数。Merton 模型的扩展包括KMV 模型(Moody's KMV,现为 Moody's Analytics),该模型使用期望违约频率(Expected Default Frequency, EDF)作为 PD 的实际估计,通过历史数据库中具有相似 DD 的公司的经验违约率来校准,从而避免了纯理论假设下对违约概率的系统性低估。

简化模型

简化模型(Reduced-Form Models)不试图解释违约的经济机制,而是将违约视为外生的随机事件,由强度过程(Intensity Process)λ(t)\lambda(t) 所驱动。在Jarrow-Turnbull 模型(1995)和Duffie-Singleton 模型(1999)等框架中,违约到达被建模为泊松过程,其首次违约时间 τ\tau 的分布满足:

P[τ>T]=E[exp(tTλ(s)ds)Ft]\mathbb{P}[\tau > T] = \mathbb{E}\left[\exp\left(-\int_{t}^{T} \lambda(s)\, ds\right) \mid \mathcal{F}_{t}\right]
λ(t)\lambda(t)

本身可以被建模为随机过程,并受到宏观经济因子和公司层面变量的影响。简化模型在定价信用衍生品(如信用违约互换,CDS)方面具有天然优势,因为它能灵活地拟合市场观测到的信用利差期限结构。

统计与机器学习方法

实践中,PD 的估计广泛使用统计模型。Logistic 回归是最为经典的工具:将违约事件 Yi{0,1}Y_i \in \{0,1\} 对一组解释变量 XiX_i 进行建模:

log(pi1pi)=β0+β1Xi1++βkXik\log\left(\frac{p_i}{1 - p_i}\right) = \beta_0 + \beta_1 X_{i1} + \cdots + \beta_k X_{ik}

其中 pi=P[Yi=1Xi]p_i = \mathbb{P}[Y_i = 1 \mid X_i] 即为给定特征下的 PD。Logistic 回归的优势在于输出的概率值天然落在 [0,1][0,1] 区间内,且估计结果易于解释和监管验证。

近年来,机器学习方法——包括随机森林梯度提升机(Gradient Boosting Machines, GBM)和神经网络——在 PD 建模中展现出更强的预测能力,尤其擅长捕捉变量间的非线性交互效应。然而,这些方法的黑箱性质在监管合规(特别是模型可解释性要求)方面面临挑战,通常需要辅以SHAP值或LIME等解释性工具。

时点 PD 与跨周期 PD

监管框架对 PD 的估计存在一项深刻的方法论区分:

  • 时点 PD(Point-in-Time, PIT PD):基于当前经济状况和债务人特征,反映的是短期(通常为一年)内的违约概率。PIT PD 随经济周期波动显著——在经济扩张期下降,在衰退期上升。它适用于贷款定价和日常风险监控。
  • 跨周期 PD(Through-the-Cycle, TTC PD):通过对完整经济周期的数据进行平均或使用仅在缓慢变化的系统性风险因子来估计,旨在剥离周期性波动、反映债务人的长期平均违约倾向。巴塞尔协议要求用于监管资本计算的 PD 应是 TTC 或至少混合型的,以避免顺周期性——即在经济上行时低估风险、下行时高估风险,从而放大信贷周期的波动。

两者的转换是 PD 建模中的核心挑战之一。一种常见做法是利用经济周期指标对 PIT PD 进行 Vasicek 单因子调整,或采用混合模型将系统性风险因子平滑化。

PD 期限结构

单一的一年期 PD 无法全面刻画信用风险的时间维度。违约概率期限结构描述了 PD 如何随时间跨度的变化而变化。令累积违约概率为 F(t)=P[τt]F(t) = \mathbb{P}[\tau \leq t],则边际违约概率(即期间违约概率)可表示为:

h(t)=F(t+Δt)F(t)1F(t)h(t) = \frac{F(t+\Delta t) - F(t)}{1 - F(t)}

对于投资级债务人,PD 期限结构通常呈现向上倾斜的趋势——时间跨度越长,累积违约概率越大,且边际违约概率也逐步上升。对投机级债务人则可能出现非单调的期限结构:短期违约风险高企(体现为"破产墙"效应),若能渡过近期,远期违约风险反而下降。

在信用组合建模中,PD 期限结构直接影响到贷款或债券的信用估值调整(CVA)和预期损失的计算。巴塞尔协议对长期零售和批发性敞口的期限调整提出了具体要求。

与其他风险参数的关联

违约概率在信用风险量化体系中并非孤立存在。预期损失(Expected Loss, EL)的计算公式为:

EL=PD×LGD×EADEL = PD \times LGD \times EAD

其中,LGD(违约损失率)为一旦违约发生后无法收回的敞口比例,EAD(违约风险暴露)为违约时刻的敞口总额。三者之间存在复杂的相关关系:高 PD 的债务人在经济低迷期违约时,LGD 往往同时升高(抵押品价值缩水、回收率下降),这被称为违约损失率的顺周期性。监管资本计算因此要求进行低迷期 LGD(Downturn LGD)估计,以应对 PD-LGD 联动带来的风险低估。

监管与实践前沿

巴塞尔 III 最终方案("Basel IV")对 PD 估计提出了更严格的要求:零售敞口的 PD 底线设为 0.05\%,批发敞口为 0.03\%,以防止模型过度低估低风险敞口的实际风险。同时,监管机构日益强调模型验证(Model Validation)的独立性和持续性——包括区分力测试(如ROC 曲线和 Accuracy Ratio)、校准测试(如二项检验Hosmer-Lemeshow 检验)以及稳定性评估。

在实践中,PD 建模正从传统的年报财务数据驱动转向融合高频交易数据、支付行为、供应链信息和社交媒体情绪的多元数据源。实时信用评分前瞻性 PD(Forward-Looking PD)——特别是纳入气候风险等新兴维度的预期——正在重塑信用风险管理的未来图景。