ARTICLE

密度预测

密度预测 (Density Forecasting) 密度预测 (Density Forecasting) 是一种估计未来观测值完整概率分布的方法,与仅给出单一数值的点预测 (Point Forecast) 和仅给出区间的区间预测 (Interval Forecast) 形成本质区别。密度预测的输出是一个概率密度函数 f(y_t+h I_t) 或累积分布函数

浏览 0 更新 2025-12-19

密度预测 (Density Forecasting)

密度预测 (Density Forecasting) 是一种估计未来观测值完整概率分布的方法,与仅给出单一数值的点预测 (Point Forecast) 和仅给出区间的区间预测 (Interval Forecast) 形成本质区别。密度预测的输出是一个概率密度函数 f(yt+hIt) f(y_{t+h} \mid \mathcal{I}_t) 或累积分布函数 F(yt+hIt) F(y_{t+h} \mid \mathcal{I}_t) ,其中 It \mathcal{I}_t 表示时刻 t t 的信息集。这一方法将预测不确定性完整量化,使决策者能够评估各种可能结果的发生概率,而非仅依赖条件均值或某个置信区间。

点预测、区间预测与密度预测的层级关系

传统预测方法以点预测为核心,在均方误差 (MSE) 最小化准则下,最优点预测是条件期望 E[yt+hIt] \mathbb{E}[y_{t+h} \mid \mathcal{I}_t] 。然而,点预测完全忽略了不确定性的大小和形态:两个预测对象可能具有相同的条件均值,但一个的预测分布高度集中而另一个极端分散——仅凭点预测无法区分这两种情形。

区间预测弥补了这一缺陷,通过给出一个覆盖目标值的区间 [Lt+h,Ut+h] [L_{t+h}, U_{t+h}] (1α) (1-\alpha) 的名义覆盖率来量化不确定性。但区间预测仍然丢失了分布形状的信息:对称区间无法反映偏态,等尾区间掩盖了尾部厚度的差异。更重要的是,区间预测无法回答诸如"GDP 增长率低于 2\% 的概率是多少"这种需要完整分布函数的问题。

密度预测则给出了不确定性最完整的刻画。从密度预测出发,点预测(如均值、中位数、众数)和任意置信水平的区间预测都可以直接导出,因此密度预测是预测问题的最一般形式

构建密度预测的主要方法

构建密度预测的方法可归为三大类。

参数方法假设预测分布属于某个参数族 f(y;θ) f(y; \theta) ,将预测问题转化为参数 θ \theta 的估计问题。例如,在 ARMA 模型的基础上假设误差项服从正态分布 εtN(0,σ2) \varepsilon_t \sim N(0, \sigma^2) ,则 h h 步预测分布为:

yt+hItN(y^t+ht, σ^h2)y_{t+h} \mid \mathcal{I}_t \sim N\left(\hat{y}_{t+h|t},\ \hat{\sigma}_h^2\right)

其中 σ^h2 \hat{\sigma}_h^2 h h 步预测误差方差。若存在条件异方差,则可使用 ARCHGARCH 模型,使预测方差随时间动态变化:

yt=μt+εt,εt=σtzt,zti.i.d.(0,1)y_t = \mu_t + \varepsilon_t,\quad \varepsilon_t = \sigma_t z_t,\quad z_t \sim i.i.d.(0,1)
σt2=ω+αεt12+βσt12\sigma_t^2 = \omega + \alpha \varepsilon_{t-1}^2 + \beta \sigma_{t-1}^2

此时 h h 步密度预测需要考虑波动率的路径依赖性,通常通过模拟方法实现。参数方法的优势在于简洁可解释,但若分布族假设错误,预测将产生系统性偏差。

非参数与半参数方法放松了分布假设。Bootstrap 方法通过对残差的重抽样来近似预测分布,不需要指定参数形式。分位数回归 (Quantile Regression) 可以直接估计条件分布的分位数函数 Qτ(yt+hIt) Q_\tau(y_{t+h} \mid \mathcal{I}_t) ,通过在不同分位数水平 τ \tau 上拟合回归模型,将分位数曲线拼接为完整分布。核密度估计则基于历史预测误差的经验分布,通过平滑技术构建密度。

贝叶斯方法将密度预测自然地置于后验框架中。给定先验分布 p(θ) p(\theta) 和似然函数 p(yθ) p(y \mid \theta) 后验预测分布 (Posterior Predictive Distribution) 为:

p(yt+hIt)=p(yt+hθ)p(θIt)dθp(y_{t+h} \mid \mathcal{I}_t) = \int p(y_{t+h} \mid \theta)\, p(\theta \mid \mathcal{I}_t)\, d\theta

这一积分同时考虑了参数不确定性(通过后验 p(θIt) p(\theta \mid \mathcal{I}_t) )和随机扰动不确定性(通过 p(yt+hθ) p(y_{t+h} \mid \theta) )。在使用 MCMC 方法时,后验预测分布可直接从后验样本中模拟生成。

密度预测的评估:校准与锐度

评估密度预测质量的两个核心维度是校准 (Calibration) 和锐度 (Sharpness)。

概率积分变换 (Probability Integral Transform, PIT) 是检验校准的基本工具。若密度预测 Ft F_t 与真实数据生成过程一致,则 PIT 值 ut=Ft(yt) u_t = F_t(y_t) 应独立同分布于 U(0,1) U(0,1) 。因此,通过检验 {ut} \{u_t\} 是否服从均匀分布,即可判断密度预测是否校准良好。PIT 直方图偏离均匀形态(如 U 形、驼峰形)揭示了预测过度集中或过度分散的问题。

评分规则 (Scoring Rules) 提供了同时评估校准与锐度的统一框架。最常用的有:

  • 对数得分 (Log Score, LS):LS(f,y)=logf(y) \text{LS}(f, y) = -\log f(y) ,等价于负对数似然,是严格局部评分规则。
  • 连续秩概率得分 (Continuous Ranked Probability Score, CRPS):CRPS(F,y)=[F(u)1(uy)]2du \text{CRPS}(F, y) = \int_{-\infty}^{\infty} [F(u) - \mathbf{1}(u \geq y)]^2 du ,度量预测 CDF 与真实观测的平方距离积分。CRPS 可视为均方误差在概率分布上的推广。

一个良好的评分规则应满足严格性:在所有分布中,只有真实分布使期望得分最优,从而激励预测者报告其真实信念。

应用场景

密度预测在宏观经济与金融领域有广泛实践。英格兰银行自 1996 年起发布通货膨胀的"扇图" (Fan Chart),以不同深浅的色带表示 GDP 增长和通胀率在各置信水平下的预测分布范围,是全球央行密度预测的标杆。风险管理中,VaR 本质上是损益分布的一个极端分位数,而预期亏损 (Expected Shortfall) 则是尾部条件期望——两者均从密度预测导出。在资产配置中,密度预测使投资者能够基于整个回报分布(而非仅均值和方差)进行优化决策。

此外,密度预测在天气与能源预测中同样关键。集合预报 (Ensemble Forecasting) 通过对初始条件施加扰动后进行多次模拟,直接生成预测分布的经验近似。在流行病学中,密度预测被用于估计疫情峰值的时间和规模分布,为公共卫生决策提供概率支持。

常见误区与局限性

  • 正态性假设的滥用:金融收益率常呈现厚尾和偏态特征,直接假设正态密度预测会严重低估极端事件概率。
  • 参数不确定性被忽视:许多密度预测仅考虑扰动项方差而忽略参数估计本身的误差,导致预测区间过于狭窄,校准失败。
  • 多步预测的路径依赖:在多期预测中,波动率的路径依赖性使解析密度难以获得,需依赖计算密集型模拟,样本量不足时模拟误差不可忽略。
  • 模型风险:不同模型产生的密度预测可能差异巨大,模型平均 (Model Averaging) 或组合预测 (Forecast Combination) 可部分缓解此问题,但组合权重的选择本身又引入新的不确定性。

密度预测将预测思维从"给出一个最优猜测"提升为"完整刻画未来状态的概率分布",是现代预测科学、风险管理贝叶斯统计共同的核心方法论。