贝叶斯网络(Bayesian Network),又称信念网络(Belief Network)或概率图模型,是一种用于表示变量间概率依赖关系的图模型,它结合了图论和概率论,通过有向无环图(DAG)描述变量间的条件独立性,并利用条件概率表(CPT)量化变量间的依赖强度。

- 有向边:表示变量间的直接因果或依赖关系,方向表示依赖方向(从因到果)。
- 无环性:图中不允许有循环,即不能从某个节点出发沿有向边回到该节点。
-
条件概率表(CPT):
- 每个节点都有一个条件概率分布,给定其父节点(直接前驱)的状态,该节点取不同值的概率。
- 对于没有父节点的节点,使用先验概率分布。
-
条件独立性:
- 贝叶斯网络的核心假设:每个节点在给定其父节点的条件下,独立于其非后代节点。
- 更一般地,可以通过图的“d-分离”(d-separation)准则判断任意两组变量在给定第三组变量时是否条件独立。
构建与表示
- 构建网络需要:
- 确定相关变量及其可能取值。
- 根据领域知识或数据学习确定变量间的依赖结构(有向边)。
- 估计条件概率表(通过专家知识或数据学习)。
推理与计算
- 主要任务:在已知某些变量观测值(证据)的情况下,计算其他变量的后验概率分布。
- 典型查询:
- 后验概率查询:求某个变量在证据下的概率。
- 最大后验假设(MAP):求最可能的变量组合。
- 推理算法:
- 精确推理:变量消元、联结树算法等,但复杂度随网络结构增长。
- 近似推理:蒙特卡洛方法(如吉布斯采样)、变分推断等,适用于大规模网络。
学习
- 结构学习:从数据中学习网络结构(有向边),方法有:
- 基于约束的方法:使用独立性检验确定边。
- 基于评分的方法:如BIC、AIC等,寻找最优评分结构。
- 混合方法。
- 参数学习:已知结构下学习CPT,方法有:
- 最大似然估计(MLE)。
- 贝叶斯估计(如引入狄利克雷先验)。
特点与优势
- 直观表达因果关系:适合表示领域知识。
- 高效处理不确定性:通过概率推理整合证据。
- 模块化:局部条件概率易于理解和维护。
- 可解释性:图结构提供变量间关系的可视化。
应用领域
- 医疗诊断:症状与疾病的关系。
- 金融风险评估:因素间依赖建模。
- 自然语言处理:词性标注、语义分析。
- 生物信息学:基因调控网络。
- 智能系统:故障诊断、决策支持。
示例
假设一个简单的贝叶斯网络:天气 → 草地湿滑,洒水器 → 草地湿滑,节点“草地湿滑”有两个父节点(天气和洒水器),其CPT给出在天气和洒水器不同状态组合下草地湿滑的概率,已知草地湿滑,可以反向推断天气或洒水器的可能状态。
贝叶斯网络是一种强大的不确定性推理工具,将复杂系统的概率依赖以直观的图形表示,并支持高效的概率计算。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。