ARTICLE

逆CDF

逆CDF / 分位数函数 (Inverse CDF / Quantile Function) 逆CDF,即逆累积分布函数(Inverse Cumulative Distribution Function),在统计学中也称为分位数函数(Quantile Function),是一维随机变量累积分布函数(CDF)的广义逆映射。给定随机变量 X 的CDF F_X(x

浏览 0 更新 2025-11-08

逆CDF / 分位数函数 (Inverse CDF / Quantile Function)

逆CDF,即逆累积分布函数(Inverse Cumulative Distribution Function),在统计学中也称为分位数函数(Quantile Function),是一维随机变量累积分布函数(CDF)的广义逆映射。给定随机变量 XX 的CDF FX(x)=P(Xx)F_X(x) = P(X \le x),其逆CDF定义为:

Q(p)=FX1(p)=inf{xR:FX(x)p},p(0,1)Q(p) = F_X^{-1}(p) = \inf\{x \in \mathbb{R} : F_X(x) \ge p\}, \quad p \in (0,1)

采用下确界而非普通反函数的原因在于CDF可能并非严格单调:当CDF存在平坦段(即概率密度为零的区间)时,多个 xx 对应同一概率值,下确界定义确保分位数函数的唯一性。当 FXF_X 连续且严格递增时,Q(p)Q(p) 就是 FXF_X 的普通反函数,满足 FX(Q(p))=pF_X(Q(p)) = p

核心性质

逆CDF具有三个基本性质。第一,单调性Q(p)Q(p)(0,1)(0,1) 上非递减,即 p1<p2Q(p1)Q(p2)p_1 < p_2 \Rightarrow Q(p_1) \le Q(p_2),这是CDF单调性的直接推论。第二,左连续性Q(p)Q(p) 在每一点 p(0,1)p \in (0,1) 处左连续,这与CDF的右连续形成对偶关系。第三,分位数刻画Q(p)Q(p) 给出了分布的第 100p100p 百分位数——例如 Q(0.5)Q(0.5) 是中位数,Q(0.25)Q(0.25)Q(0.75)Q(0.75) 分别是第一和第三四分位数。这些分位数在描述性统计和稳健统计推断中具有核心地位,因为它们对异常值不敏感。

一个关键恒等式是 FX(x)p    xQ(p)F_X(x) \ge p \iff x \ge Q(p),该等价关系在涉及分位数约束的优化问题中频繁使用。

概率积分变换

概率积分变换(Probability Integral Transform)是逆CDF最重要的理论应用之一。该定理断言:若 XX 是连续随机变量且CDF为 FXF_X,则 U=FX(X)Uniform(0,1)U = F_X(X) \sim \text{Uniform}(0,1)。反之,若 UUniform(0,1)U \sim \text{Uniform}(0,1),则 X=Q(U)X = Q(U) 的分布函数正是 FXF_X。后一方向构成了逆变换采样(Inverse Transform Sampling)的理论基础:通过生成均匀随机数并施加逆CDF,即可从任意指定分布中抽样。这一方法在蒙特卡洛模拟贝叶斯统计中的后验采样以及计算金融中具有广泛应用。

常见分布的逆CDF

不同分布的逆CDF形式各异。指数分布 XExp(λ)X \sim \text{Exp}(\lambda) 的CDF为 F(x)=1eλxF(x) = 1 - e^{-\lambda x},其逆CDF在 (0,1)(0,1) 上具有闭式表达:Q(p)=1λln(1p)Q(p) = -\frac{1}{\lambda}\ln(1-p),这一简洁形式使其在离散事件模拟中极为便捷。正态分布的逆CDF Φ1(p)\Phi^{-1}(p) 没有闭式解析表达式,但作为probit函数在计量经济学中广泛应用:probit模型正是通过 Φ1(p)\Phi^{-1}(p) 将概率映射回线性预测子。柯西分布的逆CDF Q(p)=tan(π(p1/2))Q(p) = \tan(\pi(p - 1/2)) 在重尾建模中具有角色。对于离散分布,逆CDF定义为广义逆,在bootstrap重抽样中起着关键作用。

经济学和金融学应用

风险管理中,在险价值(Value at Risk, VaR)直接通过逆CDF定义:给定置信水平 α\alphaVaRα=Q(1α)\text{VaR}_\alpha = -Q(1-\alpha),即收益率分布下尾分位数的负值。监管机构(如巴塞尔协议框架)要求金融机构报告特定置信水平下的VaR以评估市场风险。在收入不平等测度中,洛伦兹曲线的逆函数与分位数函数紧密相关,基尼系数可通过分位数函数的积分表达。在分位数回归(Quantile Regression)中,Koenker和Bassett(1978)的框架不对条件均值建模而是直接对条件分位数函数建模,从而刻画解释变量对响应变量整个分布的影响,而不仅仅是中心趋势。逆CDF还在随机占优检验和copula建模中发挥基础性作用,是实现从均匀边际到任意联合分布转换的关键组件。