ARTICLE

分布函数

分布函数 (Distribution Function) 分布函数是概率论与数理统计中最基本的描述工具之一,全称累积分布函数 (Cumulative Distribution Function, CDF)。它完整刻画了一个随机变量的概率分布特征,无论该随机变量是离散型、连续型还是混合型。对于任意实值随机变量 X,其分布函数 F(x) 定义为随机变量取值不超过

浏览 0 更新 2025-11-09

分布函数 (Distribution Function)

分布函数概率论数理统计中最基本的描述工具之一,全称累积分布函数 (Cumulative Distribution Function, CDF)。它完整刻画了一个随机变量的概率分布特征,无论该随机变量是离散型、连续型还是混合型。对于任意实值随机变量 XX,其分布函数 F(x)F(x) 定义为随机变量取值不超过 xx 的概率:

F(x)=P(Xx),xRF(x) = P(X \leq x), \quad x \in \mathbb{R}

这一简洁的定义赋予了分布函数三个核心性质,构成了现代概率理论的公理化基础。在 Kolmogorov 的公理化体系中,分布函数是连接抽象概率空间与具体数值分析的桥梁:给定分布函数 FF,总可以构造一个概率空间及其上的随机变量使其以 FF 为分布函数,从而保证概率模型的存在性。

基本性质

任何分布函数 F(x)F(x) 均满足以下充要条件:

  1. 单调非降性:若 x1<x2x_1 < x_2,则 F(x1)F(x2)F(x_1) \leq F(x_2)。这是累积本质的直接体现——随着 xx 增大,事件 {Xx}\{X \leq x\} 范围扩大,概率不可能减小。
  2. 有界性与极限行为0F(x)10 \leq F(x) \leq 1,且 limxF(x)=0\lim_{x \to -\infty} F(x) = 0limx+F(x)=1\lim_{x \to +\infty} F(x) = 1。这意味着随机变量终将以概率 1 取到某个有限值。
  3. 右连续性:对任意 xx,有 limh0+F(x+h)=F(x)\lim_{h \to 0^+} F(x + h) = F(x)。右连续性保证了分布函数在跳跃点处的定义是明确的,且与符号 P(Xx)P(X \leq x) 中的等号一致。

任一满足上述三条性质的函数均唯一对应一个概率分布,这一事实称为对应定理,它为从函数分析角度研究概率分布提供了理论基础。分布函数在 xx 处的跳跃大小等于该点的概率质量P(X=x)=F(x)limh0+F(xh)P(X = x) = F(x) - \lim_{h \to 0^+} F(x - h)。若 FFxx 处连续,则 P(X=x)=0P(X = x) = 0

离散型与连续型的统一表述

分布函数的最大优势在于其统一性:无论随机变量的类型如何,均可用同一框架描述。

对于离散型随机变量,其概率质量函数 p(xi)=P(X=xi)p(x_i) = P(X = x_i) 与分布函数的关系为:

F(x)=xixp(xi)F(x) = \sum_{x_i \leq x} p(x_i)

此时 F(x)F(x) 呈阶梯状,在每一取值点 xix_i 处向上跳跃 p(xi)p(x_i)。例如,Bernoulli分布二项分布Poisson分布 等经典离散分布的分布函数均可由上述和式精确表达。

对于连续型随机变量,若存在非负可积函数 f(t)f(t) 使得:

F(x)=xf(t)dt,xRF(x) = \int_{-\infty}^{x} f(t) \, dt, \quad \forall x \in \mathbb{R}

则称 XX 为连续型随机变量,f(x)f(x) 为其概率密度函数 (PDF)。在 FF 可微的点 xx 处,有 f(x)=F(x)f(x) = F'(x)正态分布指数分布均匀分布 等常见连续分布的分布函数均有封闭表达式或可通过标准函数表(如 Φ()\Phi(\cdot) 表示标准正态的 CDF)查询。

经验分布函数

在统计推断中,总体分布函数 F(x)F(x) 通常是未知的。给定来自总体的独立同分布样本 X1,X2,,XnX_1, X_2, \ldots, X_n经验分布函数 (Empirical Distribution Function, EDF) 定义为:

F^n(x)=1ni=1n1{Xix}\hat{F}_n(x) = \frac{1}{n} \sum_{i=1}^{n} \mathbf{1}_{\{X_i \leq x\}}

其中 1{}\mathbf{1}_{\{\cdot\}} 为示性函数。经验分布函数是总体分布函数的非参数估计量,具有重要的渐近性质。由 Glivenko-Cantelli定理F^n(x)\hat{F}_n(x) 以概率 1 一致收敛于 F(x)F(x)

supxRF^n(x)F(x)a.s.0\sup_{x \in \mathbb{R}} |\hat{F}_n(x) - F(x)| \xrightarrow{\text{a.s.}} 0

进一步地,Dvoretzky-Kiefer-Wolfowitz不等式 (DKW 不等式) 给出了有限样本下一致收敛的非渐近界,为Kolmogorov-Smirnov检验 提供了理论基础。KS 检验正是通过比较经验分布函数与假设的理论分布函数之间的最大垂直距离来评估拟合优度。

分位数函数与逆分布函数

分布函数的广义逆——分位数函数 (Quantile Function)——在实际应用中具有同等重要的地位。对于分布函数 FF,其分位数函数 Q(p)Q(p) 定义为:

Q(p)=inf{xR:F(x)p},p(0,1)Q(p) = \inf \{ x \in \mathbb{R} : F(x) \geq p \}, \quad p \in (0, 1)

FF 是连续且严格单调的,则 Q(p)=F1(p)Q(p) = F^{-1}(p)。分位数函数在风险价值 (Value at Risk, VaR) 的计算、QQ图 的构造以及蒙特卡洛模拟中的逆变换采样法 (Inverse Transform Sampling) 中发挥着核心作用。经济学与金融学中常用的Lorenz曲线Gini系数本质上也是对分布函数及其分位数函数的变换。

多元分布函数

对于 dd 维随机向量 X=(X1,X2,,Xd)\mathbf{X} = (X_1, X_2, \ldots, X_d)联合分布函数定义为:

F(x1,x2,,xd)=P(X1x1,X2x2,,Xdxd)F(x_1, x_2, \ldots, x_d) = P(X_1 \leq x_1, X_2 \leq x_2, \ldots, X_d \leq x_d)

多元分布函数不仅包含各分量的边缘分布信息,还蕴含了变量之间的相依结构Sklar定理 指出,任意多元联合分布函数均可通过一个Copula函数 CC 与各分量的边缘分布函数组合表示:

F(x1,,xd)=C(F1(x1),,Fd(xd))F(x_1, \ldots, x_d) = C\big(F_1(x_1), \ldots, F_d(x_d)\big)

这一定理在现代金融风险管理计量经济学中具有深远影响,使研究者能够将边缘分布的建模与相依结构的建模分离开来。

经济学与计量经济学中的应用

分布函数在经济学中扮演着多种角色。在收入分配研究中,Pareto分布的分布函数用于刻画高收入尾部的厚尾特征。在拍卖理论博弈论中,竞拍者的私人估价通常被建模为来自某个分布函数的独立抽取,均衡策略直接依赖于该分布函数的形式。在离散选择模型(如 Logit模型Probit模型)中,选择概率通过Logistic分布或标准正态分布的分布函数来表达:

P(Yi=1xi)=F(xiTβ)P(Y_i = 1 \mid \mathbf{x}_i) = F(\mathbf{x}_i^T \boldsymbol{\beta})

其中 Logit 对应 F(z)=ez1+ezF(z) = \frac{e^z}{1 + e^z},Probit 对应 F(z)=Φ(z)F(z) = \Phi(z)

极值理论中,广义极值分布 (Generalized Extreme Value, GEV) 的分布函数统一了 FréchetWeibullGumbel 三种极值类型,为金融市场极端事件和自然灾害风险的建模提供了理论框架。在处理效应评估中,倾向得分 (Propensity Score) 的分布及其平衡性诊断也高度依赖经验分布函数的比较。

生存函数与危险率函数

与分布函数紧密关联的两个概念是生存函数 (Survival Function) 和危险率函数 (Hazard Function),它们在久期分析 (Duration Analysis) 和可靠性工程中占据核心地位。生存函数定义为随机变量超过某阈值的概率:

S(x)=P(X>x)=1F(x)S(x) = P(X > x) = 1 - F(x)

危险率函数(也称失败率或瞬时风险率)衡量在"存活"至 xx 的条件下,事件在紧接着的瞬间发生的概率密度:

λ(x)=f(x)S(x)=f(x)1F(x)\lambda(x) = \frac{f(x)}{S(x)} = \frac{f(x)}{1 - F(x)}

危险率与分布函数之间存在一一对应关系:F(x)=1exp(0xλ(t)dt)F(x) = 1 - \exp\left(-\int_{0}^{x} \lambda(t) \, dt\right)。在劳动经济学中,失业持续时间的分布函数及其衍生的危险率被用于分析再就业概率如何随失业时长变化。若危险率随时间递减(负久期依赖),意味着长期失业者更难重新就业,具有重要的政策含义。在健康经济学中,生存分析框架——以分布函数和危险率为核心——被广泛用于评估医疗干预对患者生存时间的影响。

分布函数的估计方法

除经验分布函数外,分布函数的估计还可通过参数方法和半参数方法实现。参数估计假定总体分布属于某参数族 F(x;θ)F(x; \theta),通过最大似然估计矩估计得到 θ^\hat{\theta},进而得到 F(x;θ^)F(x; \hat{\theta})核平滑估计通过对经验分布函数进行光滑化处理,产生连续的分布函数估计量,具有比经验分布函数更优的均方误差性质。在删失数据 (Censored Data) 情形下,标准的经验分布函数不再适用,需借助Kaplan-Meier估计量——它是生存函数的非参数极大似然估计,能够有效利用不完全观测信息。

综上,分布函数不仅是概率论的基础构件,更是计量经济学实证研究、金融风险建模和经济理论分析中不可或缺的统一语言。从最基础的描述统计到最前沿的相依结构建模,分布函数始终贯穿其中,构成了连接概率理论与经济应用的核心纽带。