ARTICLE

分位数函数

分位数函数 (Quantile Function) 分位数函数是概率论与统计学中的核心概念，它是一个随机变量的累积分布函数 (Cumulative Distribution Function, CDF) 的广义逆函数。分位数函数将一个概率 p (0, 1) 映射为随机变量取值空间中的对应点 x，使得随机变量不超过该点的概率至少为 p。它提供了从概率到取值的反

浏览 6 更新 2025-11-08

分位数函数 (Quantile Function)

分位数函数是概率论与统计学中的核心概念，它是一个随机变量的累积分布函数 (Cumulative Distribution Function, CDF) 的广义逆函数。分位数函数将一个概率 $p \in (0, 1)$ 映射为随机变量取值空间中的对应点 $x$ ，使得随机变量不超过该点的概率至少为 $p$ 。它提供了从概率到取值的反向映射路径，在统计推断、风险价值计算和蒙特卡洛模拟中具有不可替代的作用。

正式定义

设 $X$ 是一个随机变量，其累积分布函数为 $F_X(x) = P(X \leq x)$ 。则 $X$ 的分位数函数 $Q_X: (0, 1) \to \mathbb{R}$ 定义为：

Q_X(p) = \inf\{\, x \in \mathbb{R} \mid F_X(x) \geq p \,\}, \quad 0 < p < 1

其中 $\inf$ 表示下确界。这一定义采用下确界而非直接取逆，原因是 CDF 可能存在平坦段（对应于随机变量概率为零的区域）或跳跃点（离散分布的情形）。当 $F_X$ 是严格单调递增的连续函数时，分位数函数就是 CDF 的普通逆函数，即 $Q_X(p) = F_X^{-1}(p)$ 。

对于常见的 $p$ 值，分位数函数给出了广为人知的统计量： $Q(0.5)$ 是中位数， $Q(0.25)$ 和 $Q(0.75)$ 分别是第一四分位数和第三四分位数，而 $Q(0.01)$ 、 $Q(0.05)$ 等对应着分布的尾部极值。

关键性质

分位数函数具有一系列优良的数学性质：

单调性：分位数函数是非递减的。若 $p_1 \leq p_2$ ，则 $Q(p_1) \leq Q(p_2)$ 。这直接源于 CDF 的非递减性。
左连续性：对于任意 $p \in (0, 1)$ ，分位数函数是左连续的，即 $\lim_{\epsilon \to 0^+} Q(p - \epsilon) = Q(p)$ 。
概率积分变换：若 $U \sim \text{Uniform}(0, 1)$ ，则随机变量 $Y = Q_X(U)$ 的分布与 $X$ 相同，即 $Y \stackrel{d}{=} X$ 。这一性质是逆变换采样 (Inverse Transform Sampling) 的理论基础。
分位数函数的 CDF 性质：对于任意实数 $x$ 和 $p \in (0, 1)$ ，有 $Q(p) \leq x$ 当且仅当 $p \leq F_X(x)$ 。这一对偶关系将分位数函数与 CDF 紧密耦合。
位置-尺度族：若 $X$ 的分位数函数为 $Q_X(p)$ ，则对于线性变换 $Y = a + bX$ （其中 $b > 0$ ），有 $Q_Y(p) = a + b Q_X(p)$ 。

常见分布的分位数函数

不同的分布族拥有特定形式的分位数函数，以下列举几个典型例子：

均匀分布 $U(a, b)$ 。其 CDF 为 $F(x) = (x - a) / (b - a)$ ，直接求逆得到线性的分位数函数：

Q(p) = a + (b - a) p, \quad 0 \leq p \leq 1

指数分布 $\text{Exp}(\lambda)$ 。CDF 为 $F(x) = 1 - e^{-\lambda x}$ （ $x \geq 0$ ），求逆得：

Q(p) = -\frac{1}{\lambda} \ln(1 - p), \quad 0 < p < 1

正态分布 $N(\mu, \sigma^2)$ 。正态分布的 CDF $\Phi$ 没有闭式表达式，其分位数函数同样没有解析形式，通常记为 $\Phi^{-1}(p)$ 或 $\text{probit}(p)$ 。在实际计算中，通过有理函数逼近（如AS241算法）来精确计算。对于一般正态分布 $N(\mu, \sigma^2)$ ：

Q(p) = \mu + \sigma \Phi^{-1}(p)

柯西分布 $\text{Cauchy}(\mu, \gamma)$ 。其厚尾特性使得分位数函数具有相对简单的解析形式：

Q(p) = \mu + \gamma \tan\left(\pi (p - \frac{1}{2})\right)

值得注意的是，当 $p \to 0^+$ 或 $p \to 1^-$ 时，许多分布的分位数函数会发散到 $-\infty$ 或 $+\infty$ ，反映了分布尾部无界的特点。

核心应用

分位数函数在经济学和金融学中扮演着关键角色。

风险价值 (Value at Risk, VaR)。在金融风险管理中，VaR 本质上就是资产收益率分布的分位数。给定置信水平 $\alpha$ （如 95\% 或 99\%），VaR 定义为损失分布的 $(1 - \alpha)$ -分位数。例如，若某投资组合日收益率的 1\% 分位数为 $-3\%$ ，则其 99\% VaR 为 3\%，意味着在一天内损失超过 3\% 的概率不超过 1\%。

Q-Q 图 (Quantile-Quantile Plot)。Q-Q 图是检验数据是否服从特定分布的可视化工具。它将样本分位数与理论分位数绘制在同一坐标系中：若数据来自该理论分布，点应大致落在 45 度线上。Q-Q 图的系统性偏离可用于诊断厚尾、偏度或模型失配。

逆变换采样。在蒙特卡洛方法中，生成服从特定分布的随机样本可以通过分位数函数完成：先生成均匀随机数 $U$ ，再计算 $X = Q(U)$ ，则 $X$ 服从目标分布。这一方法简单高效，广泛用于仿真和贝叶斯计算。

分位数回归 (Quantile Regression)。由罗杰·科恩克 (Roger Koenker) 和吉尔伯特·巴塞特 (Gilbert Bassett) 于 1978 年提出，分位数回归不再局限于建模条件均值 $E(Y \mid X)$ ，而是直接对条件分位数函数 $Q_{Y \mid X}(p)$ 建模。这使得研究者能够分析解释变量对响应变量分布任意位置的影响，特别适用于刻画异质性效应和尾部行为。

与 CDF 的关系及直观理解

分位数函数与累积分布函数构成了"概率空间"与"取值空间"之间的双向桥梁。CDF 回答的是"随机变量不超过 $x$ 的概率是多少"，而分位数函数回答的是"在概率 $p$ 的水平上，随机变量的取值上限是多少"。这种对称性使得分位数函数成为描述随机性全貌的另一视角：如果说 CDF 从纵轴（概率）看横轴（取值），分位数函数则从横轴看纵轴。

在经济数据分析中，分位数函数所蕴含的分布信息比均值和方差等矩统计量更为丰富。例如，在研究收入不平等时，中位数 $Q(0.5)$ 和 90/10 分位数比率 $Q(0.9)/Q(0.1)$ 比均值更能稳健地刻画分布的核心趋势与离散程度，因为它们不受极端值的影响。与此紧密相关的是 extbf{四分位距} (Interquartile Range, IQR)，定义为 $IQR = Q(0.75) - Q(0.25)$ ，它是衡量数据离散程度的稳健指标，广泛应用于箱线图的构造和异常值检测。

此外，分位数函数还衍生出 extbf{经验分位数函数} (Empirical Quantile Function)，即基于样本数据直接构造的分位数估计。设样本的次序统计量为 $X_{(1)} \leq X_{(2)} \leq \cdots \leq X_{(n)}$ ，则常见的经验分位数函数在 $p = k/(n+1)$ 处取值为 $X_{(k)}$ ，中间点通过线性插值填补。经验分位数函数随着样本量增大依概率收敛于理论分位数函数，这为统计推断中的非参数方法提供了理论基础。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。