贝塔分布 (Beta Distribution)
贝塔分布(Beta Distribution)是定义在区间[0,1]上的连续型概率分布族,由两个正的形状参数α和β所刻画。它在统计学、贝叶斯推断以及众多应用领域中扮演着核心角色,特别适用于对比例、概率和率等取值有界的随机现象进行建模。作为灵活的分布族,贝塔分布能够通过调整参数产生多种不同的分布形态——从均匀分布到高度偏态的单峰分布均可由其表示。
概率密度函数与分布形态
贝塔分布的概率密度函数(PDF)为:
f(x;α,β)=B(α,β)xα−1(1−x)β−1,0<x<1
其中α>0和β>0是形状参数,B(α,β)=Γ(α)Γ(β)/Γ(α+β)是贝塔函数,Γ(⋅)为伽玛函数。贝塔函数的作用是确保PDF在整个定义域上的积分为1——满足概率归一化条件。
参数α和β的相对大小和绝对数值共同决定了分布形态。关于对称性,当α=β时分布关于x=0.5对称;特别地当α=β=1时贝塔分布退化为区间[0,1]上的均匀分布。关于偏态方向,当α>β时分布呈左偏态,概率质量集中在较大值区域;当α<β时呈右偏态,概率质量集中在较小值区域。关于峰度与集中度,当α和β同时增大且比值不变时分布更集中(方差减小)峰度增加;两参数均大于1时呈单峰形态,均小于1时呈U形且概率质量集中在两端。
重要统计性质
设X∼Beta(α,β)。期望为E[X]=α/(α+β)——完全由两个参数的相对比例决定。方差为Var(X)=αβ/[(α+β)2(α+β+1)]——随α+β增大而减小,反映参数总和对分布集中程度的控制。众数为当α>1且β>1时Mode(X)=(α−1)/(α+β−2);当α≤1或β≤1时众数位于边界点0或1。注意贝塔分布有界性使得其矩母函数无封闭形式,但各阶矩可通过递归关系方便计算。
贝塔分布是二项分布的共轭先验,这是其在贝叶斯统计中广泛使用的核心原因。若先验为Beta(α,β)且似然为二项分布,则后验仍然是贝塔分布——参数更新规则简单直观:先验参数α加上成功次数、β加上失败次数。这一性质使贝叶斯估计在比例参数推断中极为便捷。例如在A/B测试中判断两个变体的转化率是否显著不同,在质量控制中估计产品缺陷率,以及在机器学习中作为狄利克雷分布(多维推广)的基础用于主题建模等场景。贝塔分布以其灵活性和数学便利性成为现代概率建模工具箱中不可或缺的工具。