ARTICLE
Exponential distribution
指数分布(Exponential Distribution) 在概率论和统计学中,指数分布(Exponential Distribution)是描述独立随机事件发生的时间间隔的连续概率分布。它是唯一具有无记忆性的连续分布,也是泊松过程中等待时间的核心分布,在可靠性工程、排队论、生存分析和金融建模中广泛应用。 定义与参数化 若随机变量 X 服从指数分布,记作
指数分布(Exponential Distribution)
在概率论和统计学中,指数分布(Exponential Distribution)是描述独立随机事件发生的时间间隔的连续概率分布。它是唯一具有无记忆性的连续分布,也是泊松过程中等待时间的核心分布,在可靠性工程、排队论、生存分析和金融建模中广泛应用。
定义与参数化
若随机变量 服从指数分布,记作 ,其中 为速率参数(rate parameter),其概率密度函数(PDF)为:
0, \& x < 0.
相应的累积分布函数(CDF)为:
0, \& x < 0.
另一种常见参数化使用尺度参数 ,此时 。两种参数化本质等价,需根据上下文区分。在经济和统计软件中,R 的 \texttt{rexp} 默认使用 rate,而某些工程文献偏好 scale。
数字特征
设 ,则:
- 期望(均值):。速率越大,平均等待时间越短。
- 方差:,标准差等于均值。
- 矩母函数(MGF):,对 成立。
- 中位数:,中位数始终小于均值——反映分布的正偏态特性。
- 偏度:2(恒定正偏);峰度:9(尖峰,比正态分布尾部更厚)。
无记忆性(Memoryless Property)
指数分布最具特征性的性质是无记忆性:对任意 ,
这意味着:无论已经等待了多长时间(),未来的剩余等待时间()的分布与从头开始等待完全相同。直观地说,一个已经使用了 100 小时的灯泡,剩余寿命的概率规律与全新灯泡一致——前提是它的寿命服从指数分布。
指数分布是唯一具有无记忆性的连续概率分布(离散情形是几何分布)。这一性质使得它在建模上极其简洁,但也意味着它在许多实际场景中过于理想化——真实设备的失效率通常随时间变化(如老化),需要威布尔分布或Gamma分布来刻画。
与泊松分布和泊松过程的关系
- 计数视角:在强度为 的齐次泊松过程中,固定时长 内事件发生的次数 。
- 间隔视角:相邻事件发生的时间间隔 独立同分布,服从 。
因此,如果一个商店顾客的到达速率为每分钟 2 人(),则相邻顾客到达的时间间隔服从均值为 分钟的指数分布。两者共享同一个 ,使得泊松过程在理论和计算上都极为方便。
极大似然估计(MLE)
给定 i.i.d. 样本 , 的极大似然估计为:
也就是说,速率参数的 MLE 是样本均值的倒数。这是少数具有闭式解的 MLE 之一。Fisher 信息量为 ,因此 的渐近方差为 。
经济学与金融学中的应用
- 持续时间分析(Duration Analysis):在劳动经济学中,失业持续时间常假设服从指数分布(含风险率 恒定的情形)。尽管限制较强,这个假设为考克斯比例风险模型提供了基准参照。
- 信用风险建模:在简化形式的信用风险模型中,违约到达被视为泊松过程,违约时间间隔服从指数分布。参数 对应违约强度(default intensity),可通过信用利差市场数据校准。
- 高频金融:超短时间尺度上交易到达的时间间隔常用指数分布近似。这种近似是ACD模型(Autoregressive Conditional Duration)的基础分布假设。
- 拍卖与搜索模型:在搜寻理论中,买家收到报价的到达时间常用指数分布建模, 反映市场"厚度"(market thickness)。
- 保险精算:小概率大损失的赔付到达可用指数分布建模,作为复合泊松过程的第一步。
与其他分布的关系
指数分布是Gamma分布 的特殊情形(,),也是威布尔分布在形状参数 时的特例。这一嵌套关系在统计推断中极为有用:可以通过似然比检验比较指数模型与其更灵活的一般化形式,判断恒定风险率假设是否合理。
独立同分布的指数随机变量之和服从 Gamma 分布:若 ,则 。这一性质使得 Gamma 分布成为建模多个独立指数阶段总耗时(如多阶段服务系统)的自然工具。
常见误区与注意事项
- 混淆均值与速率:初学者常在 与参数 之间产生混淆。写出假设时应明确:是速率还是尺度。
- 滥用无记忆性:无记忆性是强假设。若数据呈现递增或递减的风险率(如老化或磨合效应),应优先考虑威布尔分布或对数正态分布。
- 与几何分布的关系:指数分布是连续时间无记忆分布;几何分布是离散时间无记忆分布。如将时间离散化(如按天),指数可用几何近似。
- 尾部行为:指数分布的尾部衰减速率中等(指数衰减),介于正态分布(超指数衰减)和幂律分布(厚尾)之间。金融收益率中极端事件的频率通常超出指数分布预测,需要厚尾分布(如帕累托分布)来捕捉。