ARTICLE

Beta分布

Beta分布 (Beta Distribution) Beta分布(Beta Distribution)是概率论与统计学中一类定义在区间(0, 1)上的连续概率分布族。它由两个正值参数 和 决定,这两个参数控制了分布的形状。由于定义域限定在(0, 1)之间,Beta分布常被用于模拟概率或比例的随机变量。在贝叶斯统计中Beta分布占据核心地位,因为它是二项分布

浏览 11 更新 2025-12-05

Beta分布 (Beta Distribution)

Beta分布(Beta Distribution)是概率论统计学中一类定义在区间(0,1)(0, 1)上的连续概率分布族。它由两个正值参数α\alphaβ\beta决定,这两个参数控制了分布的形状。由于定义域限定在(0,1)(0, 1)之间,Beta分布常被用于模拟概率或比例的随机变量。在贝叶斯统计中Beta分布占据核心地位,因为它是二项分布伯努利分布共轭先验——如果先验分布是Beta分布且似然函数是二项分布,那么后验分布仍然是Beta分布。

统计特征与分布形态

Beta分布的概率密度函数(PDF)为f(x;α,β)=xα1(1x)β1/B(α,β)f(x; \alpha, \beta) = x^{\alpha-1}(1-x)^{\beta-1}/B(\alpha, \beta),其中B(α,β)=Γ(α)Γ(β)/Γ(α+β)B(\alpha, \beta) = \Gamma(\alpha)\Gamma(\beta)/\Gamma(\alpha+\beta)Beta函数,作为归一化常数确保PDF积分为1。累积分布函数通过正则化不完全Beta函数表示:F(x;α,β)=Ix(α,β)F(x; \alpha, \beta) = I_x(\alpha, \beta)

期望值由两参数比率决定——E[X]=α/(α+β)E[X] = \alpha/(\alpha+\beta)。直观理解为:若α\alpha代表"成功"的虚拟计数、β\beta代表"失败"的虚拟计数,则期望值即为成功比例。方差Var(X)=αβ/[(α+β)2(α+β+1)]Var(X) = \alpha\beta/[(\alpha+\beta)^2(\alpha+\beta+1)],当α+β\alpha+\beta很大时方差趋近于0——表示大量证据下对概率的估计会非常确定。当α>1\alpha > 1β>1\beta > 1时分布呈单峰形,众数(α1)/(α+β2)(\alpha-1)/(\alpha+\beta-2)

分布形态随参数变化:α=β\alpha=\beta时对称且关于0.5对称;α=β=1\alpha=\beta=1时退化为均匀分布α>β\alpha > \beta时左偏(概率集中在高值区);α<β\alpha < \beta时右偏。α,β\alpha, \beta同时增大使分布更集中(方差减小)。

贝叶斯应用与推导

Beta分布在贝叶斯推断中的核心优势在于共轭性质。考虑先验XBeta(α,β)X \sim Beta(\alpha, \beta),观测到nn次试验中ss次成功和ff次失败,似然为xs(1x)f\propto x^s (1-x)^f。后验分布为Beta(α+s,β+f)Beta(\alpha+s, \beta+f)——这一极其简便的更新规则使Beta分布成为比例模型的不二之选。从参数的角度看,初始先验的α\alphaβ\beta可理解为"先验伪计数"——在贝叶斯分析开始前我们认为已经观察到了α1\alpha-1次成功和β1\beta-1次失败。每观察到一次成功就将α\alpha加1,观察到一次失败就将β\beta加1。后验期望为E[Xs,f]=(α+s)/(α+β+n)E[X|s,f] = (\alpha+s)/(\alpha+\beta+n),是最大似然估计s/ns/n和先验期望α/(α+β)\alpha/(\alpha+\beta)的加权平均——权重分别由样本量nn和先验强度α+β\alpha+\beta决定。Beta分布在A/B测试、质量控制和机器学习中的汤普森抽样等领域有广泛应用。