知经 KNOWECON · 卓越的经济金融统计数学学习平台

后验概率

# 后验概率 (Posterior Probability)

后验概率 (Posterior Probability) 是{{{贝叶斯统计}}} (Bayesian statistics) 框架下的一个核心概念。它指的是在观察到新的数据或证据之后,一个{{{随机事件}}}或一个不确定命题的{{{概率}}}。从本质上讲,后验概率是对我们初始信念(即{{{先验概率}}})进行更新后得到的修正信念。这个更新过程是基于所收集到的新信息或证据的。

在贝叶斯推断中,后验概率的计算是整个分析的核心,它体现了从数据中学习的过程。其计算的数学基础是著名的{{{贝叶斯定理}}} (Bayes' Theorem)。

## 贝叶斯定理与后验概率的计算

假设 $H$ 代表一个我们感兴趣的{{{假设}}} (Hypothesis) 或命题(例如,某位患者患有某种疾病),而 $E$ 代表我们观察到的新证据 (Evidence)(例如,该患者的检测结果为阳性)。我们希望计算在给定证据 $E$ 的情况下,假设 $H$ 成立的概率,即 $P(H|E)$。这个{{{条件概率}}} $P(H|E)$ 就是后验概率。

根据{{{贝叶斯定理}}},其计算公式为:

$$ P(H|E) = \frac{P(E|H) \cdot P(H)}{P(E)} $$

公式的各个组成部分解释如下:

* $P(H|E)$:后验概率 (Posterior)。这是我们最终的目标,即在观察到证据 $E$ 之后,假设 $H$ 成立的概率。 * $P(H)$:{{{先验概率}}} (Prior)。这是在观察到任何新证据之前,我们对假设 $H$ 成立可能性的初始信念或估计。它可以基于历史数据、领域知识或主观判断。 * $P(E|H)$:{{{似然性}}} (Likelihood)。这表示在假设 $H$ 成立的条件下,观察到证据 $E$ 的概率。它将数据与假设联系起来,衡量了在该假设下,当前数据出现的合理性。注意,它不是 $P(H|E)$,这两者很容易混淆。 * $P(E)$:证据的{{{边缘概率}}} (Marginal Probability of Evidence)。这表示在不考虑任何特定假设的情况下,观察到证据 $E$ 的总概率。它通常被视为一个“归一化常数”,以确保所有可能的假设的后验概率之和为 1。

### 证据的边缘概率的计算

$P(E)$ 的计算通常需要使用{{{全概率公式}}} (Law of Total Probability)。如果我们有一系列互斥且完备的假设 $H_1, H_2, \ldots, H_n$ (即 $\sum_{i=1}^{n} P(H_i) = 1$),那么:

$$ P(E) = \sum_{i=1}^{n} P(E|H_i) \cdot P(H_i) $$

在最简单的情况下,即只有假设 $H$ 和其对立假设 $H^c$(非 $H$),公式简化为:

$$ P(E) = P(E|H) \cdot P(H) + P(E|H^c) \cdot P(H^c) $$

## 一个具体的学习示例:医学诊断

为了更好地理解后验概率的计算和意义,我们来看一个经典的医学诊断问题。

问题背景: 假设有一种罕见疾病,人群中的患病率(先验知识)为 1% 。现在有一种新的诊断测试方法,其准确性如下: 1. 如果一个患者确实患有该病,测试结果呈阳性的概率为 99% (这被称为测试的{{{灵敏度}}} (Sensitivity))。 2. 如果一个患者没有患病,测试结果呈阴性的概率为 95% (这被称为测试的{{{特异性}}} (Specificity))。

现在,一个随机选择的人接受了这项测试,结果呈阳性。请问:这个人真正患有该疾病的概率是多少?

分析与计算: 我们的目标是计算“在测试结果为阳性的条件下,此人患病的概率”。这正是一个后验概率问题。

* 定义事件: * $H$:此人患有该疾病。 * $H^c$:此人没有患病。 * $E$:测试结果为阳性。

* 整理已知信息: * 先验概率 $P(H) = 0.01$。因此,不患病的先验概率为 $P(H^c) = 1 - P(H) = 0.99$。 * 似然性 $P(E|H) = 0.99$ (灵敏度,真阳性率)。 * 特异性 $P(E^c|H^c) = 0.95$。因此,假阳性率(没有病但测出阳性)为 $P(E|H^c) = 1 - 0.95 = 0.05$。

* 应用贝叶斯定理: * 我们要求解的后验概率是 $P(H|E)$。 * 公式为:$P(H|E) = \frac{P(E|H) \cdot P(H)}{P(E)}$。

* 计算分母 $P(E)$: 根据全概率公式: $$ P(E) = P(E|H) \cdot P(H) + P(E|H^c) \cdot P(H^c) $$ $$ P(E) = (0.99 \cdot 0.01) + (0.05 \cdot 0.99) $$ $$ P(E) = 0.0099 + 0.0495 = 0.0594 $$ 这个值告诉我们,从人群中随机抽取一个人进行测试,其结果为阳性的总概率是 5.94%。

* 计算后验概率 $P(H|E)$: $$ P(H|E) = \frac{0.0099}{0.0594} \approx 0.1667 $$

结论与解读: 即使这个测试看起来非常准确(99%的灵敏度和95%的特异性),一个测试结果为阳性的人,其实际患病的概率(后验概率)大约只有 16.7%

这个与直觉相悖的结果凸显了先验概率的重要性。因为该疾病本身非常罕见(先验概率仅为1%),绝大多数的阳性结果实际上是由庞大的健康人群中出现的少量“假阳性”贡献的,而不是由少数患病人群中的“真阳性”贡献的。这个例子生动地展示了后验概率是如何结合先验知识和新证据,从而得出一个更全面、更准确的判断。

## 后验概率与比例关系

在很多应用中,我们更关心不同假设的相对可能性,而不是其绝对概率值。在这种情况下,我们可以忽略分母 $P(E)$,因为它对于所有假设都是一个相同的常数。这引出了一个非常重要的比例关系:

$$ P(H|E) \propto P(E|H) \cdot P(H) $$

这个表达式可以读作:后验概率正比于似然性与先验概率的乘积

这个关系是贝叶斯推断的基石。它告诉我们,我们对一个假设的最终信念(后验)是由我们对它的初始信念(先验)和数据对该假设的支持程度(似然性)共同决定的。

## 应用领域

后验概率的概念和计算被广泛应用于众多领域:

* {{{机器学习}}}:在{{{朴素贝叶斯分类器}}} (Naive Bayes Classifier) 中,算法计算给定特征下,样本属于各个类别的后验概率,并选择后验概率最大的类别作为预测结果。 * {{{金融}}}与{{{经济学}}}:在{{{金融市场}}}中,投资者会根据新的市场新闻(证据)来更新他们对某个资产未来收益(假设)的预测。在{{{贝叶斯计量经济学}}}中,研究者使用数据来更新对经济模型参数的估计。 * 信息检索:搜索引擎可能会根据用户的查询词(证据)来计算一个网页与用户意图相关的后验概率。 * A/B测试:在互联网产品中,可以通过贝叶斯方法分析A/B测试数据,计算新版本(B版本)优于旧版本(A版本)的后验概率,从而做出决策。