ARTICLE

D1准则

D1准则 (D1 Criterion) D1准则 (D1 Criterion) 是统计学与计量经济学中一类基于距离度量的模型评价与选择准则。其核心思想是利用概率分布之间的D1距离来衡量候选模型与真实数据生成过程之间的差异,并以此作为模型优劣的判别依据。D1准则属于更广泛的"距离准则"家族,与赤池信息准则 (AIC)和贝叶斯信息准则 (BIC)等信息准则在方法

浏览 0 更新 2026-01-15

D1准则 (D1 Criterion)

D1准则 (D1 Criterion) 是统计学计量经济学中一类基于距离度量的模型评价与选择准则。其核心思想是利用概率分布之间的D1距离来衡量候选模型与真实数据生成过程之间的差异,并以此作为模型优劣的判别依据。D1准则属于更广泛的"距离准则"家族,与赤池信息准则 (AIC)贝叶斯信息准则 (BIC)等信息准则在方法论上形成互补。

数学定义

PP 为真实数据生成过程对应的概率测度,QθQ_\theta 为参数 θ\theta 索引的候选模型分布。D1距离定义为两个累积分布函数 (CDF) 之间的 L1L^1 积分距离:

dD1(P,Qθ)=+FP(x)FQθ(x)dxd_{D1}(P, Q_\theta) = \int_{-\infty}^{+\infty} |F_P(x) - F_{Q_\theta}(x)| \, dx

其中 FPF_PFQθF_{Q_\theta} 分别为对应分布的 CDF。与柯尔莫哥洛夫-斯米尔诺夫检验采用的 LL^\infty 上确界距离 supxFP(x)FQθ(x)\sup_x |F_P(x) - F_{Q_\theta}(x)| 不同,D1距离衡量两条 CDF 曲线之间的面积差异,对分布整体的形状偏离更为敏感,而非仅关注最大单点偏差。这一特性使 D1准则在评估分布全局拟合质量时具有独特优势。

在实际建模中,由于真实分布 PP 不可知,通常采用经验分布函数 F^n\hat{F}_n 替代,从而得到 D1准则的经验版本:

d^D1=+F^n(x)Fθ^(x)dx\hat{d}_{D1} = \int_{-\infty}^{+\infty} |\hat{F}_n(x) - F_{\hat{\theta}}(x)| \, dx

其中 θ^\hat{\theta} 为基于样本估计的模型参数。该积分可通过数值求积或排序残差方法在有限样本下高效计算。

理论基础

D1准则的合理性建立在经验分布函数的一致收敛性之上。根据格里汶科-坎泰利定理 (Glivenko-Cantelli Theorem),当样本量 nn \to \infty 时,F^n\hat{F}_n 几乎必然一致收敛于 FPF_P。由此可证,若候选模型族包含真实分布,则最小化 d^D1\hat{d}_{D1} 的模型选择具有一致性。与基于似然的信息准则相比,D1准则不依赖完整的概率密度函数的设定,仅需 CDF 的信息,因此在半参数或非参数框架下更具灵活性。

与其它准则的比较

  • 赤池信息准则 (AIC):度量核心为 K-L散度 + 2k2k 惩罚;渐近有效,适合预测导向。
  • 贝叶斯信息准则 (BIC):度量核心为边际似然近似 + klnnk\ln n 惩罚;一致估计,适合结构识别。
  • D1准则:度量核心为 CDF 间 L1L^1 积分距离;几何直观,对全局形态敏感。
  • 柯尔莫哥洛夫-斯米尔诺夫检验:度量核心为 CDF 间 LL^\infty 上确界距离;对局部极值偏离敏感。

D1准则的核心优势在于其几何可解释性d^D1\hat{d}_{D1} 的值直接对应于经验 CDF 与拟合 CDF 之间的面积,具有直观的概率含义——该面积越小,模型在分布整体层面的拟合越优。相比之下,AIC 和 BIC 的绝对数值缺乏类似的直观几何解释。

实际应用

1. 收入分布建模

收入分布 (Income Distribution) 研究中,研究者常需在对数正态分布帕累托分布威布尔分布等候选模型间做出选择。传统似然方法对密度尾部极为敏感,而 D1准则直接度量累积分布的整体拟合度,对中等收入群体的适配性赋予更高权重,在政策分析场景中更具实践意义。

2. 生存分析中的模型诊断

生存分析 (Survival Analysis) 中,D1准则可用于比较不同参数模型(如指数、威布尔、对数逻辑斯蒂模型)对生存函数的拟合优度。相较于基于风险函数的诊断方法,D1准则基于生存函数(即 1 减去 CDF)的积分差异,对长期生存概率的估计偏差具有更均衡的敏感度。

3. 蒙特卡洛模拟验证

蒙特卡洛模拟 (Monte Carlo Simulation) 中,D1准则可作为验证模拟输出分布与目标分布一致性的诊断工具。模拟的 CDF 与理论 CDF 之间的面积差异提供了模拟精度的单一汇总指标,有助于自动化大批量模拟实验的质量控制。

相关概念

小结

D1准则以分布函数之间的 L1L^1 积分距离为核心,提供了一种几何直观、对全局拟合质量敏感的模型评价方式。其不依赖完整似然函数的灵活性使其在半参数建模和非标准分布族中具有独特价值。尽管在理论完备性和泛用广度上不及 AIC 和 BIC,D1准则在注重分布整体形态的拟合场景——尤其是收入分布、生存分析和模拟验证等领域——中提供了有益的补充视角。