伽玛分布 (Gamma Distribution)
伽玛分布是广泛使用的连续型概率分布,由形状参数 α 和速率参数 β(或尺度参数 θ=1/β)刻画。是指数分布的推广:指数分布描述等待第1次事件的时间,伽玛分布描述等待第 α 次事件的时间。
概率密度函数
形状-速率参数化(更常用):X∼Γ(α,β)
f(x;α,β)=Γ(α)βαxα−1e−βx,x>0
其中 Γ(α)=∫0∞tα−1e−tdt 是伽玛函数(阶乘的推广,Γ(n)=(n−1)!),βα/Γ(α) 是归一化常数。
形状-尺度参数化:f(x;k,θ)=xk−1e−x/θ/(Γ(k)θk)。
参数影响
形状参数 α:0<α<1 时PDF呈反J形;α=1 退化为指数分布;α>1 时单峰偏态,增大会趋于正态(中心极限定理)。速率参数 β:越大分布越集中靠近0。
主要性质
E[X]=βα,Var(X)=β2α,众数=βα−1 (α>1)
可加性:若 Xi∼Γ(αi,β) 独立且同速率参数,则 ∑Xi∼Γ(∑αi,β)。
与其他分布的关系
- 指数分布:Γ(1,β)=Exponential(β)
- 卡方分布:χ2(k)=Γ(k/2,1/2)(假设检验中关于样本方差的推断至关重要)
- 爱尔朗分布:当 α 为正整数
- 泊松分布:描述泊松过程的两面(事件次数\~Poisson,等待时间\~Gamma)
- 贝塔分布:若 X∼Γ(α1,β), Y∼Γ(α2,β) 独立,则 X/(X+Y)∼Beta(α1,α2)
应用领域
排队论与可靠性工程(等待时间、设备寿命)、金融与保险(保险索赔、信用风险)、贝叶斯统计(泊松速率和正态精度的共轭先验)、气象水文学(降雨量)。示例:呼叫中心每分钟3个电话(β=3),等第5个电话的时间 ∼Γ(5,3),P(T>2)=P(Poisson(6)<5)≈28.5%。