ARTICLE

贝叶斯信念网络

贝叶斯信念网络 贝叶斯信念网络(Bayesian Belief Network, BBN),又称贝叶斯网络、信念网络或有向无环图模型,是一种基于概率推理的图形化模型。它通过有向无环图(DAG)表示变量间的条件依赖关系,每个节点代表一个随机变量,有向边则编码了变量间的因果或影响方向,是处理不确定性知识表示和推理的核心工具之一。 结构与参数 贝叶斯信念网络由两个

浏览 0 更新 2025-07-15

贝叶斯信念网络

贝叶斯信念网络(Bayesian Belief Network, BBN),又称贝叶斯网络、信念网络或有向无环图模型,是一种基于概率推理的图形化模型。它通过有向无环图(DAG)表示变量间的条件依赖关系,每个节点代表一个随机变量,有向边则编码了变量间的因果或影响方向,是处理不确定性知识表示和推理的核心工具之一。

结构与参数

贝叶斯信念网络由两个核心组件构成。其一是图结构:节点代表随机变量(离散或连续),有向边表示变量间的因果关系或直接影响。若存在边 XY X\to Y ,则 X X Y Y 的父节点,Y Y X X 的子节点。其二是条件概率表(CPT):每个节点关联一个条件概率分布 P(XiParents(Xi)) P(X_i\mid \text{Parents}(X_i)) ,量化了父节点对该节点的影响强度。对于无父节点的根节点,CPT 退化为先验概率分布 P(Xi) P(X_i)

数学基础

贝叶斯信念网络的数学根基是贝叶斯定理与概率链式法则。对于包含 n n 个变量 X1,X2,,Xn X_1,X_2,\ldots,X_n 的网络,其联合概率分布可因式分解为各节点在其父节点条件下的条件概率之积:

P(X1,X2,,Xn)=i=1nP(XiParents(Xi))P(X_1,X_2,\ldots,X_n)=\prod_{i=1}^{n} P(X_i\mid \text{Parents}(X_i))

这一因式分解利用了条件独立性假设,将原本指数级庞大的联合概率表拆解为多个小规模条件概率表,大幅降低了模型复杂度,是贝叶斯网络高效推理的关键。

条件独立性与推理

网络中条件独立性可通过d-分离准则判定。给定证据变量集合 Z Z ,若 X X Y Y 之间的所有路径被 Z Z 阻塞,则称 X X Y Y 在给定 Z Z 时 d-分离,即 XYZ X\perp Y\mid Z 。三种基本连接模式决定了信息流的传递方式:

  • 串行连接XZY X\to Z\to Y ):Z Z 未被观测时 X X Y Y 不独立;Z Z 被观测后,二者条件独立。
  • 发散连接XZY X\leftarrow Z\to Y ):Z Z 未被观测时 X X Y Y 相关;Z Z 被观测后,路径阻塞。
  • 汇聚连接XZY X\to Z\leftarrow Y ,v-structure):Z Z 未被观测时 X X Y Y 独立;Z Z 被观测后,二者反而变得相关——这被称为"解释消除"效应。

推理分为精确推理(变量消元法、团树传播算法)和近似推理(MCMC 采样如 Gibbs 采样、变分推理)。当网络稠密导致精确推理不可行(\#P-hard)时,近似方法成为必要选择。

学习

参数学习在结构已知时从数据估计 CPT:最大似然估计(MLE)基于数据频率;贝叶斯估计引入 Dirichlet 先验,等价于伪计数平滑;EM 算法处理含缺失值或隐变量的情况。结构学习在结构未知时需同时学习拓扑与参数(NP-hard),分为基于约束的方法(PC算法)、基于评分的方法(BIC/BDeu)和混合方法。

应用与局限

应用涵盖医疗诊断(如 QMR-DT 系统关联数百种疾病与数千种症状)、故障诊断、生物信息学(基因调控网络推断)、金融风险管理与自然语言处理。优势在于可解释性强、可融合先验知识、天然处理不确定性、支持双向推理。局限包括结构学习 NP-hard、连续变量处理需离散化或扩展、DAG 禁止反馈回路、大规模稠密网络推理代价高。马尔可夫随机场(无向图模型)与隐马尔可夫模型(动态贝叶斯网络特例)是其重要关联模型。