ARTICLE

贝塔(Beta)分布的推导

贝塔(Beta)分布的推导 贝塔分布(Beta Distribution)是概率论与统计学中一个极为重要的连续概率分布族。它定义在区间 [0, 1] 上,由两个正值参数 和 (称为形状参数)所决定。由于其取值范围的特性,贝塔分布常被用来为各种比例或百分比数据建模。 在贝叶斯统计中,贝塔分布扮演着核心角色,它是伯努利分布、二项分布、负二项分布以及几何分布的共轭

浏览 22 更新 2025-10-25

贝塔(Beta)分布的推导

贝塔分布Beta Distribution)是概率论统计学中一个极为重要的连续概率分布族。它定义在区间 [0,1][0, 1] 上,由两个正值参数 α\alphaβ\beta(称为形状参数)所决定。由于其取值范围的特性,贝塔分布常被用来为各种比例或百分比数据建模。

贝叶斯统计中,贝塔分布扮演着核心角色,它是伯努利分布二项分布负二项分布以及几何分布共轭先验。本讲义通过几种不同的方法推导贝塔分布的概率密度函数(PDF),其标准形式为:

f(x;α,β)=xα1(1x)β1B(α,β)f(x; \alpha, \beta) = \frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha, \beta)}

其中 0x10 \le x \le 1α>0\alpha > 0β>0\beta > 0B(α,β)B(\alpha, \beta)贝塔函数,作为归一化常数,B(α,β)=01tα1(1t)β1dt=Γ(α)Γ(β)Γ(α+β)B(\alpha, \beta) = \int_0^1 t^{\alpha-1}(1-t)^{\beta-1} dt = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)},而 Γ()\Gamma(\cdot)伽玛函数

从均匀分布的顺序统计量推导

假设我们有 nn 个相互独立的随机变量 U1,U2,,UnU_1, U_2, \ldots, U_n,均服从 [0,1][0, 1] 上的均匀分布。将这些随机变量排序得到顺序统计量 U(1)U(2)U(n)U_{(1)} \le U_{(2)} \le \ldots \le U_{(n)}。我们将证明第 kk 个顺序统计量 U(k)U_{(k)} 服从贝塔分布。

方法一:通过累积分布函数 (CDF) 严格推导

  1. 理解事件:事件“U(k)xU_{(k)} \le x”意味着在 nn 个样本中,至少有 kk 个的值不大于 xx
  2. 构建二项实验:定义“成功”为 UixU_i \le x,概率为 p=xp = x。有 nn 次独立伯努利试验,成功次数 YBin(n,x)Y \sim \text{Bin}(n, x)。因此: \[ F_{U_{(k)}}(x) = P(Y \ge k) = \sum_{j=k}^{n} \binom{n}{j} x^j (1-x)^{n-j} \]
  3. 求导得到PDF:对求和式逐项求导产生伸缩求和 (Telescoping Sum),大量项抵消后只剩下 j=kj=k 的正数部分。最终得到: \[ f_{U_{(k)}}(x) = \frac{n!}{(k-1)!(n-k)!} x^{k-1}(1-x)^{n-k} \]
  4. 与贝塔分布对比:令 α=k\alpha = kβ=nk+1\beta = n-k+1。归一化常数 n!(k1)!(nk)!=1B(k,nk+1)\frac{n!}{(k-1)!(n-k)!} = \frac{1}{B(k, n-k+1)}。因此 U(k)Beta(k,nk+1)U_{(k)} \sim \text{Beta}(k, n-k+1)

结论:来自 U(0,1)U(0,1) 的大小为 nn 的样本的第 kk 个顺序统计量,服从形状参数为 α=k\alpha=kβ=nk+1\beta=n-k+1 的贝塔分布。

方法二:通过无穷小分析直观推导

考虑事件“U(k)U_{(k)} 恰好落在 (x,x+dx)(x, x+dx) 内”。根据PDF定义,需满足:

  1. 有 1 个样本点落入 (x,x+dx)(x, x+dx)(概率 dxdx(n1)=n\binom{n}{1}=n 种选择)
  2. k1k-1 个样本点落入 [0,x)[0, x)(概率 xk1x^{k-1}(n1k1)\binom{n-1}{k-1} 种选择)
  3. 剩下 nkn-k 个样本点落入 (x+dx,1](x+dx, 1](概率 (1x)nk(1-x)^{n-k}

组合得到:

fU(k)(x)=n!(k1)!(nk)!xk1(1x)nkf_{U_{(k)}}(x) = \frac{n!}{(k-1)!(n-k)!} x^{k-1} (1-x)^{n-k}

再次证明 U(k)Beta(k,nk+1)U_{(k)} \sim \text{Beta}(k, n-k+1)

从伽玛 (Gamma) 分布推导

定理:设 XGamma(α,θ)X \sim \text{Gamma}(\alpha, \theta)YGamma(β,θ)Y \sim \text{Gamma}(\beta, \theta) 独立。则 Z=XX+YBeta(α,β)Z = \frac{X}{X+Y} \sim \text{Beta}(\alpha, \beta)

  1. 联合PDF: \[ f_{X,Y}(x,y) = \frac{1}{\Gamma(\alpha)\Gamma(\beta)\theta^{\alpha+\beta}} x^{\alpha-1} y^{\beta-1} e^{-(x+y)/\theta} \]
  2. 变量变换:定义 Z=XX+YZ = \frac{X}{X+Y}W=X+YW = X+Y。反函数:X=ZWX = ZWY=W(1Z)Y = W(1-Z)。取值范围:w>0w>00<z<10 < z < 1
  3. 雅可比行列式J=w|J| = w
  4. 联合PDF变换: \[ f_{Z,W}(z,w) = \frac{z^{\alpha-1}(1-z)^{\beta-1}}{\Gamma(\alpha)\Gamma(\beta)\theta^{\alpha+\beta}} \cdot w^{\alpha+\beta-1} e^{-w/\theta} \]
  5. ZZ 的边际PDF:对 ww 积分: \[ f_Z(z) = \frac{z^{\alpha-1}(1-z)^{\beta-1}}{\Gamma(\alpha)\Gamma(\beta)\theta^{\alpha+\beta}} \int_{0}^{\infty} w^{\alpha+\beta-1} e^{-w/\theta} dw \] 积分等于 Γ(α+β)θα+β\Gamma(\alpha+\beta)\theta^{\alpha+\beta},代入得: \[ f_Z(z) = \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)} z^{\alpha-1}(1-z)^{\beta-1} = \frac{1}{B(\alpha, \beta)} z^{\alpha-1}(1-z)^{\beta-1} \]

这正是 Beta(α,β)\text{Beta}(\alpha, \beta) 分布的PDF。尺度参数 θ\theta 在最终结果中被消去了。

总结与意义

本讲义展示了贝塔分布的两种核心推导方式:

  1. 从顺序统计量推导:将贝塔分布解释为均匀分布样本中某个位次的值的分布。当参数为整数时,α=k\alpha=k 代表“成功”的排序位置,β=nk+1\beta=n-k+1 与“失败”的排序位置相关。
  2. 从伽玛分布推导:将贝塔分布视为两个独立伽玛变量之和的比率。揭示了贝塔分布与伽玛分布的深刻代数关系,在贝叶斯等级模型等高等统计应用中至关重要。

这两种推导都从不同角度阐明了为什么贝塔分布的形式 xα1(1x)β1x^{\alpha-1}(1-x)^{\beta-1} 在统计建模中如此自然和普遍。