ARTICLE

边际似然

边际似然 (Marginal Likelihood) 边际似然 (Marginal Likelihood)，在贝叶斯统计中也称为证据 (Evidence) 或积分似然 (Integrated Likelihood)，是贝叶斯统计推断和模型比较中的核心概念。它定义为在给定模型 M 的前提下，观测数据 y 的边际概率，通过对模型的所有参数进行积分得到：其中

浏览 0 更新 2025-11-21

边际似然 (Marginal Likelihood)

边际似然 (Marginal Likelihood)，在贝叶斯统计中也称为证据 (Evidence) 或积分似然 (Integrated Likelihood)，是贝叶斯统计推断和模型比较中的核心概念。它定义为在给定模型 $M$ 的前提下，观测数据 $y$ 的边际概率，通过对模型的所有参数 $\theta$ 进行积分得到：

p(y \mid M) = \int p(y \mid \theta, M) \, p(\theta \mid M) \, d\theta

其中 $p(y \mid \theta, M)$ 是似然函数， $p(\theta \mid M)$ 是参数的先验分布。边际似然将所有参数空间上的可能性按其先验权重进行加权平均，反映了模型在观察到数据之前的预测能力。

在贝叶斯推断中的角色

在贝叶斯定理中，边际似然出现在分母位置，是归一化常数：

p(\theta \mid y, M) = \frac{p(y \mid \theta, M) \, p(\theta \mid M)}{p(y \mid M)}

它确保后验分布积分为1。在模型选择中，边际似然通过贝叶斯因子进行模型比较：

\text{BF}_{12} = \frac{p(y \mid M_1)}{p(y \mid M_2)}

贝叶斯因子衡量了数据支持模型 $M_1$ 相对于 $M_2$ 的强度。它天然地惩罚过复杂模型，体现了贝叶斯奥卡姆剃刀原则：复杂模型的先验分布在更高维空间中更加分散，导致其似然峰值附近的先验密度较低，从而降低了边际似然值。与频率主义的似然比检验不同，这一惩罚是自动实现的，不需要显式调整。

计算挑战

边际似然的计算极具挑战性，因为涉及高维参数空间的多重积分。除共轭先验下的线性回归模型等少数情况外，通常没有解析解。常用计算方法包括拉普拉斯近似（二次泰勒展开）、重要性抽样和桥接抽样、马尔可夫链蒙特卡洛热力学积分，以及变分贝叶斯下界 (ELBO)。其中调和均值估计量虽简单但方差过大，在实践中被认为不可靠。

与信息准则的关系

边际似然与贝叶斯信息准则 (BIC) 密切相关：在样本量较大且先验信息较少时， $\log p(y \mid M) \approx -\frac{1}{2}\text{BIC}$ 。但BIC省略了对先验分布的显式依赖，而真正的边际似然需要明确的先验设定。相比之下，赤池信息准则 (AIC) 源于频率主义的预测误差框架，理论基础完全不同。

应用

边际似然广泛应用于贝叶斯模型平均 (BMA)，以边际似然为权重对不同模型进行加权平均，降低模型不确定性带来的风险。在机器学习中，自动相关性判定 (ARD) 通过边际似然优化超参数，自动调整各特征的权重。在系统发育学中，边际似然用于比较不同的进化树模型。

总结

边际似然是贝叶斯统计中连接参数推断与模型选择的纽带。它通过积分运算自然实现了对模型复杂度的惩罚，避免了频率主义方法中需要显式调整的做法。尽管计算困难，但随着拉普拉斯近似、桥接抽样和变分推理等方法的不断发展，边际似然在实际应用中的可及性已显著提高。理解边际似然的本质和局限性，是进行严谨贝叶斯建模的基础。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。