ARTICLE

贝塔（Beta）分布的推导

贝塔（Beta）分布的推导贝塔分布（Beta Distribution）是概率论与统计学中一个极为重要的连续概率分布族。它定义在区间公式上，由两个正值参数公式和公式（称为形状参数）所决定。由于其取值范围的特性，贝塔分布常被用来为各种比例或百分比数据建模。在贝叶斯统计中，贝塔分布扮演着核心角色，它是伯努利分布、二项分布、负二项分布以及几何分布的

浏览 22 更新 2025-10-25

贝塔（Beta）分布的推导

贝塔分布（Beta Distribution）是概率论与统计学中一个极为重要的连续概率分布族。它定义在区间 $[0, 1]$ 上，由两个正值参数 $\alpha$ 和 $\beta$ （称为形状参数）所决定。由于其取值范围的特性，贝塔分布常被用来为各种比例或百分比数据建模。

在贝叶斯统计中，贝塔分布扮演着核心角色，它是伯努利分布、二项分布、负二项分布以及几何分布的共轭先验。本讲义通过几种不同的方法推导贝塔分布的概率密度函数（PDF），其标准形式为：

f(x; \alpha, \beta) = \frac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha, \beta)}

其中 $0 \le x \le 1$ ， $\alpha > 0$ ， $\beta > 0$ 。 $B(\alpha, \beta)$ 是贝塔函数，作为归一化常数， $B(\alpha, \beta) = \int_0^1 t^{\alpha-1}(1-t)^{\beta-1} dt = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}$ ，而 $\Gamma(\cdot)$ 是伽玛函数。

从均匀分布的顺序统计量推导

假设我们有 $n$ 个相互独立的随机变量 $U_1, U_2, \ldots, U_n$ ，均服从 $[0, 1]$ 上的均匀分布。将这些随机变量排序得到顺序统计量 $U_{(1)} \le U_{(2)} \le \ldots \le U_{(n)}$ 。我们将证明第 $k$ 个顺序统计量 $U_{(k)}$ 服从贝塔分布。

方法一：通过累积分布函数 (CDF) 严格推导

理解事件：事件“ $U_{(k)} \le x$ ”意味着在 $n$ 个样本中，至少有 $k$ 个的值不大于 $x$ 。
构建二项实验：定义“成功”为 $U_i \le x$ ，概率为 $p = x$ 。有 $n$ 次独立伯努利试验，成功次数 $Y \sim \text{Bin}(n, x)$ 。因此： \[ F_{U_{(k)}}(x) = P(Y \ge k) = \sum_{j=k}^{n} \binom{n}{j} x^j (1-x)^{n-j} \]
求导得到PDF：对求和式逐项求导产生伸缩求和 (Telescoping Sum)，大量项抵消后只剩下 $j=k$ 的正数部分。最终得到： \[ f_{U_{(k)}}(x) = \frac{n!}{(k-1)!(n-k)!} x^{k-1}(1-x)^{n-k} \]
与贝塔分布对比：令 $\alpha = k$ ， $\beta = n-k+1$ 。归一化常数 $\frac{n!}{(k-1)!(n-k)!} = \frac{1}{B(k, n-k+1)}$ 。因此 $U_{(k)} \sim \text{Beta}(k, n-k+1)$ 。

结论：来自 $U(0,1)$ 的大小为 $n$ 的样本的第 $k$ 个顺序统计量，服从形状参数为 $\alpha=k$ 和 $\beta=n-k+1$ 的贝塔分布。

方法二：通过无穷小分析直观推导

考虑事件“ $U_{(k)}$ 恰好落在 $(x, x+dx)$ 内”。根据PDF定义，需满足：

有 1 个样本点落入 $(x, x+dx)$ （概率 $dx$ ， $\binom{n}{1}=n$ 种选择）
有 $k-1$ 个样本点落入 $[0, x)$ （概率 $x^{k-1}$ ， $\binom{n-1}{k-1}$ 种选择）
剩下 $n-k$ 个样本点落入 $(x+dx, 1]$ （概率 $(1-x)^{n-k}$ ）

组合得到：

f_{U_{(k)}}(x) = \frac{n!}{(k-1)!(n-k)!} x^{k-1} (1-x)^{n-k}

再次证明 $U_{(k)} \sim \text{Beta}(k, n-k+1)$ 。

从伽玛 (Gamma) 分布推导

定理：设 $X \sim \text{Gamma}(\alpha, \theta)$ 和 $Y \sim \text{Gamma}(\beta, \theta)$ 独立。则 $Z = \frac{X}{X+Y} \sim \text{Beta}(\alpha, \beta)$ 。

联合PDF： \[ f_{X,Y}(x,y) = \frac{1}{\Gamma(\alpha)\Gamma(\beta)\theta^{\alpha+\beta}} x^{\alpha-1} y^{\beta-1} e^{-(x+y)/\theta} \]
变量变换：定义 $Z = \frac{X}{X+Y}$ ， $W = X+Y$ 。反函数： $X = ZW$ ， $Y = W(1-Z)$ 。取值范围： $w>0$ ， $0 < z < 1$ 。
雅可比行列式： $|J| = w$ 。
联合PDF变换： \[ f_{Z,W}(z,w) = \frac{z^{\alpha-1}(1-z)^{\beta-1}}{\Gamma(\alpha)\Gamma(\beta)\theta^{\alpha+\beta}} \cdot w^{\alpha+\beta-1} e^{-w/\theta} \]
求 $Z$ 的边际PDF：对 $w$ 积分： \[ f_Z(z) = \frac{z^{\alpha-1}(1-z)^{\beta-1}}{\Gamma(\alpha)\Gamma(\beta)\theta^{\alpha+\beta}} \int_{0}^{\infty} w^{\alpha+\beta-1} e^{-w/\theta} dw \] 积分等于 $\Gamma(\alpha+\beta)\theta^{\alpha+\beta}$ ，代入得： \[ f_Z(z) = \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)} z^{\alpha-1}(1-z)^{\beta-1} = \frac{1}{B(\alpha, \beta)} z^{\alpha-1}(1-z)^{\beta-1} \]

这正是 $\text{Beta}(\alpha, \beta)$ 分布的PDF。尺度参数 $\theta$ 在最终结果中被消去了。

总结与意义

本讲义展示了贝塔分布的两种核心推导方式：

从顺序统计量推导：将贝塔分布解释为均匀分布样本中某个位次的值的分布。当参数为整数时， $\alpha=k$ 代表“成功”的排序位置， $\beta=n-k+1$ 与“失败”的排序位置相关。
从伽玛分布推导：将贝塔分布视为两个独立伽玛变量之和的比率。揭示了贝塔分布与伽玛分布的深刻代数关系，在贝叶斯等级模型等高等统计应用中至关重要。

这两种推导都从不同角度阐明了为什么贝塔分布的形式 $x^{\alpha-1}(1-x)^{\beta-1}$ 在统计建模中如此自然和普遍。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。