ARTICLE

后验概率

后验概率 (Posterior Probability) 后验概率 (Posterior Probability) 是贝叶斯统计的核心概念,指在观测到新数据或证据之后,对某随机事件或不确定命题的更新概率。它通过贝叶斯定理将先验概率与似然函数融合,完成了从"事前信念"到"事后信念"的学习过程。 贝叶斯定理与后验概率的计算 设 H 为假设(如患者患病),E 为观

浏览 41 更新 2026-07-15

后验概率 (Posterior Probability)

后验概率 (Posterior Probability) 是贝叶斯统计的核心概念,指在观测到新数据或证据之后,对某随机事件或不确定命题的更新概率。它通过贝叶斯定理先验概率似然函数融合,完成了从"事前信念"到"事后信念"的学习过程。

贝叶斯定理与后验概率的计算

HH 为假设(如患者患病),EE 为观测证据(如检测阳性)。后验概率 P(HE)P(H|E) 由贝叶斯定理给出:

P(HE)=P(EH)P(H)P(E)P(H|E) = \frac{P(E|H) \, P(H)}{P(E)}

其中 P(H)P(H) 为先验概率,P(EH)P(E|H) 为似然性。分母 P(E)P(E) 是证据的边缘概率,通过全概率公式计算:

P(E)=P(EH)P(H)+P(EHc)P(Hc)P(E) = P(E|H) P(H) + P(E|H^c) P(H^c)

后验概率可简写为比例关系:P(HE)P(EH)P(H)P(H|E) \propto P(E|H) P(H),即后验正比于似然与先验的乘积。这一简洁表达式是贝叶斯推断的基石。

示例:医学诊断中的基率问题

设某罕见病患病率(先验)为 1%1\%,检测灵敏度为 99%99\%、特异度为 95%95\%。检测阳性者的后验患病概率为:

P(HE)=0.99×0.010.99×0.01+0.05×0.99=0.00990.05940.167P(H|E) = \frac{0.99 \times 0.01}{0.99 \times 0.01 + 0.05 \times 0.99} = \frac{0.0099}{0.0594} \approx 0.167

即仅约 16.7%16.7\%。此反直觉结果揭示了基率谬误:罕见病背景下,健康人群的假阳性在数量上远超患者的真阳性,凸显了先验概率在贝叶斯更新中的关键作用。

性质与解释

后验概率具有以下核心性质:

  • 信息融合:综合先验知识与数据信息,是理性学习的数学模型。
  • 序贯更新:一次更新后的后验可作为下一次更新的先验,形成递归学习。
  • 大样本一致性:随样本量增大,后验概率收敛于真值附近的退化分布,与频率学派推断渐趋一致(Bernstein--von Mises定理)。

应用

后验概率广泛应用于多个领域。在机器学习中,朴素贝叶斯分类器选择后验概率最大的类别;贝叶斯神经网络高斯过程以后验分布量化预测不确定性。在计量经济学中,贝叶斯VAR、随机波动率模型以及分层贝叶斯模型均依赖后验分布进行参数推断与政策评估。在金融领域,投资者依据新信息更新资产收益的后验信念,动态调整投资组合。在A/B测试中,贝叶斯方法直接计算实验组优于对照组的后验概率,提供更直观的决策依据。

与频率学派的比较

频率学派认为参数为固定常数,推断依赖于重复抽样的渐近性质;贝叶斯学派赋予参数概率分布,后验概率直接衡量参数的不确定性。在无信息先验下,后验区间在数值上常与频率学派的置信区间吻合,但其概率解释截然不同:后验概率直接陈述参数落入某区间的概率,而置信区间只能从重复抽样的长期频率进行诠释。