Bayes网络推理结论的解释机制研究

合集下载

Bayes定理

Bayes定理

❖Ⅲ2不是携带者前概率为3/4
❖系谱中特定的条件:

1
2
❖Ⅲ1和Ⅲ2婚后生了一个不

❖是聋哑的正常女儿,如
1
2
❖Ⅲ2是携带者,生出正常女

❖儿的概率为1/2,如Ⅲ2不是
1
2
携带者,生出正常女儿的概

❖率为1,
1
2

先天性聋哑家系Ⅲ2为携带者的概率
概率 前概率 条件概率
Ⅲ2是杂合子(Aa) 1/2 1/2

Ⅲ1是纯合子(aa)的概率是

1-0.13=0.87。Ⅲ1是杂合子在

20岁时未发病的条件概率是

0.92(因为20岁以前发病者占
8%,1-0.08=0.92),是纯合子(aa)未病概率是1。
• 概率
前概率 条件概率 联合概率 后概率
Ⅲ1是杂合子(Aa)
0.26× 1/2= 0.13 1-0.08 = 0.92 0.13×0.92 = 0.12 0.12/(0.12+0.87)=0.12
Ⅲ 2是纯合子(AA) 3/4 1
联合概率 后概率
1/4×1/2 =1/8
1/8
= 1/7 1/8+3/4
3/4×1 = 3/4 3/4 = 6/7
1/8+3/4
答案: Ⅲ2再生孩子是聋哑的风险为1/2×1/7=1/14
随着出生健康孩子数越多,表明Ⅲ2是携带者的概率越 低,如Ⅲ1和Ⅲ2一旦生出患者, Ⅲ2即可确定就是携带 者,此时生出患者的风险就会上升到1/2。
• (三)在X连锁隐性遗传病中的应用 • 下图为血友病A家系图,图中Ⅲ1的两个舅舅
患血友病,此女前来咨询她的后代是否患病?

机器学习中的贝叶斯网络及其推理分析

机器学习中的贝叶斯网络及其推理分析

机器学习中的贝叶斯网络及其推理分析张慧莹;宁媛;邵晓非【摘要】机器学习作为当今国内外研究的热点在智能系统中得到了重视和运用,贝叶斯是机器学习的核心方法之一,以贝叶斯理论作为中心的贝叶斯网络必将应用延伸到各个问题领域,本文介绍了贝叶斯网络的概念及其学习推理过程,并结合MATLAB中的BNT工具箱,引用来自UCI的标准数据集对贝叶斯网络进行仿真测试.【期刊名称】《现代机械》【年(卷),期】2012(000)002【总页数】4页(P91-94)【关键词】机器学习;贝叶斯网络;MATLAB;贝叶斯学习推理;BNT工具箱【作者】张慧莹;宁媛;邵晓非【作者单位】贵州大学电气工程学院,贵州贵阳550003;贵州大学电气工程学院,贵州贵阳550003;贵州大学电气工程学院,贵州贵阳550003【正文语种】中文【中图分类】TP1830 引言机器学习作为当今国内外研究的热点,在智能系统中得到了重视和运用,而贝叶斯是机器学习的核心方法之一,以贝叶斯理论作为中心的贝叶斯网络更是将应用延伸到各个问题领域,所有需要作出概率预测的地方都可以见到贝叶斯的影子,这背后的深刻原因在于现实世界本身就是不确定的,人类的观察能力是有局限性的,这正是贝叶斯网络的优点,值得深入研究。

1 机器学习机器学习即是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

对于机器学习的研究成果已经无声的走入了人类的日常生活,自动驾驶、智能机器手、智能窗帘等等很多方面都可以看到机器学习的应用,它不仅为人类的生活带来了便利,也引领着全世界进入一个智能化的多元世纪。

机器学习旨在建立学习的计算理论,构造各种学习系统,并在各个领域应用这些系统,它有四个构成要素:环境、学习环节、知识库和执行环节[1]。

四个环节之间构成了如图1 所示的关系流程,即“认识—实践—再认识”,从而实现机器学习的过程。

这样一个动态的学习过程表明,机器学习实际是一个有特定目的的知识获取过程,对知识的认识是机器学习研究的基础,知识的获取和提高是机器学习的两个重要内容。

贝叶斯网络的模型可解释性分析

贝叶斯网络的模型可解释性分析

在当今数据科学和人工智能领域,贝叶斯网络作为一种概率图模型,被广泛应用于对复杂系统的建模和分析。

贝叶斯网络的模型可解释性分析是对该模型进行理解和解释的重要方法之一。

本文将从贝叶斯网络的基本原理入手,探讨其模型可解释性分析的方法和意义。

贝叶斯网络是一种用来表示变量之间依赖关系的概率图模型。

它由有向无环图和条件概率分布组成,其中节点代表随机变量,边代表变量之间的依赖关系。

贝叶斯网络的条件概率分布可以通过观察数据进行学习,从而用来推断变量之间的关系以及进行预测。

贝叶斯网络的模型可解释性分析即是对该模型进行解释和理解,以便更好地应用于实际问题中。

模型可解释性分析的第一步是对贝叶斯网络结构进行解释。

贝叶斯网络的结构反映了变量之间的依赖关系,通过观察网络结构可以了解到不同变量之间的直接和间接影响关系。

在实际应用中,可以通过对网络结构的解释来理解不同变量之间的因果关系,从而更好地理解和解释模型的预测结果。

其次,模型可解释性分析还包括对贝叶斯网络参数的解释。

贝叶斯网络的参数是条件概率分布,它反映了不同变量之间的概率关系。

通过对参数的解释,可以了解到不同变量之间的概率关系,从而知晓在观察到某些变量的取值情况下,其他变量的概率分布是如何变化的。

这对于理解模型的预测结果和进行模型的修正和改进都具有重要意义。

另外,模型可解释性分析还可以通过对贝叶斯网络的推断过程进行解释来理解模型的工作原理。

贝叶斯网络可以用来进行概率推断,即在观察到一些变量的取值情况下,推断其他变量的概率分布。

通过对推断过程的解释,可以了解到在不同观察条件下模型是如何进行推断的,从而理解模型的预测结果是如何得出的。

总的来说,贝叶斯网络的模型可解释性分析对于理解和解释模型的预测结果具有重要意义。

通过对网络结构、参数和推断过程的解释,我们可以更好地理解模型的工作原理和预测结果,从而更好地应用该模型于实际问题中。

因此,对贝叶斯网络的模型可解释性分析的研究具有重要的理论和应用意义。

(完整版)贝叶斯算法原理分析

(完整版)贝叶斯算法原理分析

贝叶斯算法原理分析Bayes法是一种在已知先验概率与条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。

Bayes方法的薄弱环节在于实际情况下,类别总体的概率分布和各类样本的概率分布函数(或密度函数)常常是不知道的。

为了获得它们,就要求样本足够大。

另外,Bayes法要求表达文本的主题词相互独立,这样的条件在实际文本中一般很难满足,因此该方法往往在效果上难以达到理论上的最大值。

1.贝叶斯法则机器学习的任务:在给定训练数据D时,确定假设空间H中的最佳假设。

最佳假设:一种方法是把它定义为在给定数据D以及H中不同假设的先验概率的有关知识下的最可能假设。

贝叶斯理论提供了一种计算假设概率的方法,基于假设的先验概率、给定假设下观察到不同数据的概率以及观察到的数据本身。

2.先验概率和后验概率用P(h)表示在没有训练数据前假设h拥有的初始概率。

P(h)被称为h的先验概率。

先验概率反映了关于h是一正确假设的机会的背景知识,如果没有这一先验知识,可以简单地将每一候选假设赋予相同的先验概率。

类似地,P(D)表示训练数据D的先验概率,P(D|h)表示假设h成立时D的概率。

机器学习中,我们关心的是P(h|D),即给定D时h的成立的概率,称为h的后验概率。

3.贝叶斯公式贝叶斯公式提供了从先验概率P(h)、P(D)和P(D|h)计算后验概率P(h|D)的方法:p(h|D)=P(D|H)*P(H)/P(D) ,P(h|D)随着P(h)和P(D|h)的增长而增长,随着P(D)的增长而减少,即如果D独立于h时被观察到的可能性越大,那么D对h的支持度越小。

4.极大后验假设学习器在候选假设集合H中寻找给定数据D时可能性最大的假设h,h被称为极大后验假设(MAP),确定MAP的方法是用贝叶斯公式计算每个候选假设的后验概率,计算式如下:h_map=argmax P(h|D)=argmax (P(D|h)*P(h))/P(D)=argmax P(D|h)*p(h) (h属于集合H)最后一步,去掉了P(D),因为它是不依赖于h的常量。

贝叶斯网络与因果推理

贝叶斯网络与因果推理

贝叶斯网络与因果推理贝叶斯网络是一种常用的概率图模型,被广泛应用于因果推理领域。

它以概率分布和有向无环图为基础,能够帮助我们理解和分析变量之间的因果关系。

本文将详细介绍贝叶斯网络的原理与应用,以及它在因果推理中的重要作用。

一、贝叶斯网络的原理贝叶斯网络基于贝叶斯定理和条件独立性假设,通过节点、边和概率表达式构成有向无环图,从而建立变量之间的因果关系模型。

在贝叶斯网络中,节点代表随机变量,边表示变量之间的依赖关系,而概率表达式则描述了变量之间的条件概率分布。

贝叶斯网络的核心是贝叶斯定理,其形式为P(A|B) = (P(B|A) * P(A)) / P(B)。

其中,P(A|B)表示在已知B发生的条件下,A发生的概率;P(B|A)表示在已知A发生的条件下,B发生的概率;P(A)和P(B)分别表示A和B独立发生的概率。

二、贝叶斯网络的应用1. 分类和预测:贝叶斯网络可以通过学习已知数据的概率关系,进行分类和预测任务。

通过给定一些观测变量,可以计算出其他未观测变量的概率分布,从而进行分类或预测。

2. 诊断和故障检测:贝叶斯网络可以用于诊断系统故障或进行故障检测。

通过观测系统中的一些变量,可以推断其他未观测变量的概率分布,从而确定系统的故障原因。

3. 原因分析和决策支持:贝叶斯网络可以用于原因分析和决策支持。

通过构建概率模型,可以确定某个事件发生的原因,从而辅助决策制定。

三、贝叶斯网络与因果推理1. 因果关系建模:贝叶斯网络可以帮助我们理解和建模变量之间的因果关系。

通过有向无环图,我们可以确定变量之间的依赖关系和因果关系。

贝叶斯网络的条件概率表达式则描述了变量之间的因果关系。

2. 因果推理:贝叶斯网络可以用于因果推理,即通过观测到的一些变量,来推断其他未观测变量的概率分布。

这种推理方式能够帮助我们分析和预测因果关系,并进行有效的决策。

3. 因果关系判定:贝叶斯网络可以用于判定变量之间的因果关系。

通过条件独立性和概率计算,我们可以判断出某个变量对另一个变量的影响程度,从而确定因果关系。

贝叶斯网络的基本原理

贝叶斯网络的基本原理

贝叶斯网络是一种用于建模不确定性和概率推理的图形模型。

它的基本原理是基于贝叶斯定理,通过描述不同变量之间的条件依赖关系来表示概率分布。

贝叶斯网络可以用于各种不同的领域,包括医学诊断、金融风险管理、自然语言处理等。

贝叶斯网络的基本原理是基于概率和图论的。

它由两部分组成:一个是有向无环图(DAG),另一个是条件概率分布。

有向无环图是由节点和有向边组成的,每个节点代表一个随机变量,而有向边表示节点之间的依赖关系。

条件概率分布则描述了每个节点在给定其父节点值的情况下的条件概率。

贝叶斯网络的一个重要特性是可以对变量之间的依赖关系进行建模。

通过定义节点之间的条件概率分布,贝叶斯网络可以捕捉到变量之间的直接和间接关系,从而可以进行概率推理和预测。

这使得贝叶斯网络成为了一个强大的工具,可以用于分析复杂系统中的不确定性和概率关系。

贝叶斯网络的建模过程通常包括两个步骤:结构学习和参数学习。

结构学习是指确定网络的拓扑结构,即确定节点之间的有向边的连接关系。

参数学习则是指确定每个节点的条件概率分布。

这两个步骤通常需要依赖于大量的数据和专业知识,因为在实际应用中,很多变量之间的关系是复杂的,需要通过数据分析和领域知识来进行建模。

贝叶斯网络在实际应用中有着广泛的用途。

在医学诊断领域,贝叶斯网络可以用于帮助医生进行疾病诊断和预测病情发展趋势。

在金融风险管理领域,贝叶斯网络可以用于分析不同变量之间的风险关系,帮助金融机构进行风险评估和风险控制。

在自然语言处理领域,贝叶斯网络可以用于语义分析和文本分类,帮助计算机理解和处理自然语言。

贝叶斯网络的优势在于能够处理不确定性和复杂性,同时能够利用领域知识和数据进行建模和推理。

然而,贝叶斯网络也有一些局限性,例如对大规模数据和复杂模型的建模能力有限,以及对参数的选择和网络结构的确定需要一定的专业知识和经验。

总的来说,贝叶斯网络是一种强大的概率图模型,它的基本原理是基于概率和图论的,通过描述变量之间的条件依赖关系来进行建模和推理。

基于贝叶斯推理的网络攻击检测方法研究

基于贝叶斯推理的网络攻击检测方法研究

基于贝叶斯推理的网络攻击检测方法研究随着互联网的普及和信息技术的快速发展,网络攻击已经成为一个普遍存在的问题。

网络攻击威胁着每一个使用网络的人,企业和政府机构也不例外。

为了保证网络安全,许多研究者将注意力集中在了网络攻击检测方法的研究上。

目前,基于贝叶斯推理的网络攻击检测方法备受研究者关注。

一、网络攻击检测的重要性网络攻击是指利用计算机技术对计算机系统、网络系统、应用系统和数据进行破坏、窃取、篡改等非法活动。

网络攻击具有隐蔽性、高效性和破坏性等特点,给网络安全带来了极大的威胁。

因此,网络攻击检测是保证网络安全的重要手段之一。

通过检测网络攻击活动,可以及时发现、阻止和应对网络攻击行为,从而保障网络的正常运行。

二、基于贝叶斯推理的网络攻击检测方法简介贝叶斯推理是一种统计推断方法,利用已知数据对未知数据进行预测和分类。

贝叶斯公式为P(A|B) = P(B|A)P(A) / P(B),其中P(A|B)表示在B发生的情况下A发生的概率,P(B|A)表示在A发生的情况下B发生的概率,P(A)和P(B)分别表示A和B发生的概率。

基于贝叶斯推理的网络攻击检测方法利用贝叶斯公式对网络流量数据进行分类和预测,从而实现对网络攻击的检测。

该方法主要包括以下几个步骤:1. 数据预处理:对网络流量数据进行预处理,包括去噪、抽特征等。

2. 建立模型:建立基于贝叶斯推理的模型,利用Bayes分类器对网络流量数据进行分类和预测。

3. 训练模型:利用已有的网络流量数据对模型进行训练和优化,提高模型的准确率和鲁棒性。

4. 检测网络攻击:利用训练好的模型对实时流量数据进行检测,及时发现网络攻击活动并采取相应的防御措施。

三、基于贝叶斯推理的网络攻击检测方法的优缺点基于贝叶斯推理的网络攻击检测方法具有以下优点:1. 可以对大量的网络流量数据进行快速分类和预测,减少了手工分析的工作量和时间成本。

2. 可以自动化、智能化地检测网络攻击,避免了人为的疏漏和误判。

bayes法

bayes法

Bayes法概述Bayes法,也称为贝叶斯法或贝叶斯统计学,是以英国数学家Thomas Bayes命名的一种统计学方法。

Bayes法基于贝叶斯定理,通过利用相关先验概率和观测数据的条件概率,推断出后验概率分布。

Bayes法在各个领域都有广泛的应用,包括机器学习、人工智能、自然语言处理等。

贝叶斯定理贝叶斯定理是Bayes法的核心基础。

贝叶斯定理是一种用于更新概率估计的公式,它表达了在观测到新信息后如何更新先验概率。

贝叶斯定理的数学表达如下:P(A|B) = P(B|A) * P(A) / P(B)其中,P(A|B)表示在B发生的条件下A发生的概率,P(B|A)表示在A发生的条件下B发生的概率,P(A)和P(B)分别表示A和B的先验概率。

贝叶斯分类器贝叶斯分类器是Bayes法在机器学习领域的一个重要应用。

贝叶斯分类器基于贝叶斯定理,通过计算给定特征条件下每个类别的后验概率,来预测未知实例的类别。

贝叶斯分类器在文本分类、垃圾邮件过滤、情感分析等任务中有广泛的应用。

贝叶斯分类器的基本原理是先计算每个类别的先验概率,然后计算给定特征条件下每个类别的似然概率,最后通过贝叶斯定理计算后验概率,选择具有最高后验概率的类别作为预测结果。

贝叶斯分类器在计算后验概率时,通常假设特征之间是独立的,这称为朴素贝叶斯分类器。

贝叶斯网络贝叶斯网络是一种用于建模不同变量之间条件依赖关系的图模型。

贝叶斯网络由有向无环图表示,其中节点表示变量,边表示变量之间的依赖关系。

贝叶斯网络可以用于推断变量之间的概率分布,根据已知的变量值,推断未知变量的概率分布。

贝叶斯网络常用于处理不确定性的推理问题,包括诊断、预测、决策等。

贝叶斯网络还可用于发现变量之间的因果关系和生成概率模型。

贝叶斯网络在医学诊断、图像处理、金融风险分析等领域有广泛的应用。

贝叶斯优化贝叶斯优化是一种优化算法,用于解决黑盒函数的最优化问题。

贝叶斯优化通过不断探索和利用函数在搜索空间中的信息,逐步优化目标函数的值。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机研究与发展ISSN 1000 1239/CN 11 1777/T PJournal of Computer Research and Development 42(9):1527~1532,2005收稿日期:2003-11-13;修回日期:2004-04-05基金项目:国家自然科学基金项目(60175011,60375011);安徽省自然科学基金项目(03042207);安徽省优秀青年科技基金项目(04042044)Bayes 网络推理结论的解释机制研究汪荣贵 张佑生 高 隽 彭青松(合肥工业大学计算机与信息学院 合肥 230009)(wangrgui@mail hf ah cn)Research on Explanation Function for Reason C onclusions with Bayesian NetworkWang Ronggui,Zhang Yousheng,Gao Jun,and Peng Qingsong(College of Comp uter and I nf or mation ,H ef ei Univer sity of T echnology ,H ef ei 230009)Abstract In this paper,an explanation function about Bayesian network is presented With it,evidences effect deg ree,direction and paths on reason conclusion can be ex plained Necessity factor and sufficiency factor are designed as a measure approach,to valuate evidences effect degree on posteriori distributions By the w ay of qualitatively analysis the character of netw ork structure,notes relative to reason conclusion are find out Based on those notes,and combined w ith the quantitatively analysis,sub chains w hich consist of effect paths are found out,too Those sub chains are valuated to create and explain the effect paths Ex per im ent results show the effectiveness of the ex plain functionKey words Bayesian network;posteriori distribution;1 normal;effect degree;effect direction;effect path摘 要提出一种关于Bayes 网络的解释机制,用于解释证据对推理结论的作用程度、方向及路径 引入必要性和充分性因子作为度量来评价证据对推理结论的作用程度;通过定性分析网络结构特点,找出与推理结论有关的节点,在此基础上,结合定量分析找出组成作用路径的子链,并分析这些子链对推理结论的作用,由此生成和解释证据对推理结论的作用路径 实验结果验证了方法的有效性关键词Bayes 网络;后验概率分布;1 范数;作用程度;作用方向;作用路径中图法分类号 T P1811 引 言Bayes 网络模型[1,2]的知识表示和推理算法基于联合概率分布,不能像MYCIN 等系统那样通过翻译推理链自动生成解释[3,4] Bayes 网络推理结论的解释机制的研究正在形成一个热点[5]Bayes 网络推理的解释方法研究的核心问题在于找到适当的方法评价证据对兴趣节点的后验概率分布的作用大小及路径[2,6] 文本提出一种称为删除法的技术来研究这个问题,在此基础上建立一种Bayes 网络推理的解释方法,实验结果验证了方法的有效性2 证据对结论的作用程度Bayes 网络推理就是在已知证据节点集合E 的取值状态下,算出网络中其余节点(非证据节点)X 的概率分布,即计算后验概率分布P (X |E ) 现在提出一种称为删除法的技术来分析证据对推理结论的作用程度,就是当考察网络结构中的某个(些)证据对推理结论的作用时,就将它(们)从证据集合中删除(即在Bayes 网络模型中将其看成非证据节点),然后计算推理结论的变化 对于Bayes 网络模型中某一特定的非证据节点X ,在证据集合为E 时的推理结论为后验概率分布P(X |E ) 考察E 中的某一证据L 对P (X |E )的作用 从E 中删除L ,得到的集合为E -L,相应的后验概率分布为P (X |E -L ) 使用向量差P (X |E )-P (X |E -L )的1 范数来度量两者间的差异,并记为M (P (X |E ),P (X |E-L)),即M (P (X |E ),P (X |E -L ))=|p i -q i |,(1)其中,P (X =x i |E )=p i ,P (X |E -L )=q i ,i =1,2,!,m ;m 是X 的状态数令 (L ,X )=M (P (X |E ),P (X |E -L))M (P (X |E ),P (X )), (L ,X )为L 对X 的必要性因子 它表示L 的必要性程度在证据集合E 中所占的比例 令 (L ,X )的阈值 =1 (|E |+1),|E |表示集合E 的基数 若 (L ,X )> ,则表明L 对推理结论P(X |E )具有显著的必要性图1是关于大学生学习成绩简化的Bayes 网络,称之为成绩网络 它由一个有向无环图和6个边际或条件概率矩阵组成 各变量的名称分别为智商(X 1)、努力程度(X 2)、应试能力(X 3)、知识掌握程度(X 4)、考试成绩(X 5)与作业成绩(X 6) 网络结构中蕴含的独立性及条件独立性有P (X 1,X 2)=P (X 1)P (X 2);P (X 3|X 1,X 2)=P (X 3|X 1);P (X 4|X 1,X 2,X 3)=P (X 4|X 1,X 2);P (X 5|X 1,X 2,X 3,X 4)=P (X 5|X 3,X 4);P (X 6|X 1,X 2,X 3,X 4,X 5)=P (X 6|X 4) 相应的知识表示为 P(X 1,X 2,X 3,X 4,X 5,X 6)=P (X 1)P (X 2)P (X 3|X 1)P(X 4|X 1,X 2)P(X 5|X 3,X 4)P (X 6|X 4)F ig 1 Bayesian networ ks for student sco re图1 学生学习成绩的Bay es 网络令证据集合E ={X 1=∀高#,X 2=∀勤奋#},需要解释的是X 5的后验概率分布P (X 5|E ) 若要考察E 中的证据∀X 2=勤奋#,对P (X 5|E )的作用,则取L =∀X 2=勤奋#,E -L ={X 1=∀高#} 计算结果(表1)表明,要取得优良的成绩,高智商和勤奋都很重要Table 1 The Necessity Factor of P(X 5|E )for L表1 L 对P (X 5|E)的必要性因子Probabilistic Distribution Probabilistic Distribution of X 5A B C D E 1 Normal Effect Factor(%)P (X 5|E )0 55290 28880 09340 04580 0191P (X 5)0 23980 22260 24720 21470 0756M (P (X 5|E ),P(X 5))0 5896P (X 5|E-L)0 37400 24750 17560 14350 0594M (P (X 5|E ),P(X 5|E-L))0 3014(L ,X 5)51 12表1中的 (L ,X 5)值表示如果不知道X 2的取值状态,对推理结论会造成多大的损失 若 (L ,X )值较大,则说明证据L 在证据集合E 中对形成推理结论P(X |E )的必要性较大,对P (X |E )的作用当然也较大 但是,若 (L ,X )值较小,则并不能由此断定L 对P (X |E )的作用较小 因为L 对推理结论的作用可能与证据集合中其他证据相重叠 如果在原有的证据集合中增加一条证据:作业成绩(X 6)=∀优#,即令证据集合E ={X 1=∀高#,X 2=∀勤奋#,X 6=∀优#},需要解释的是X 5的后验概率分布P (X 5|E ) 若要考察E 中的证据X 2=∀勤奋#对P(X 5|E )的作用,则取L =X 2为该证据,于是E-L={X 1=∀高#,X 6=∀优#} 得到计算结果如表2所示 可以看出,此时L 对X 5的必要性因子 (L ,X 5)较小 这说明X 2的取值状态未知(不知道是否∀勤奋#),对推理结论的作用较小 由于证据1528计算机研究与发展 2005,42(9)∀X6=优#对推理结论的作用与证据∀X2=勤奋#的作用相重叠, (L,X5)较小并不意味着证据∀X2=勤奋#单独对推理结论的作用不重要为消除重叠现象对解释的干扰,现在寻找L对推理结论P(X|E)的充分性程度 若将除L以外的所有证据节点看成非证据节点,则X的后验概率分布从P(X|E)变成P(X|L),相应的必要性因子为 (E-L,X),它度量了除L以外的所有证据E-L对形成推理结论的必要性程度 令(L,X)=1- (E-L,X),称(L,X)为L对X的充分性因子 从表2可以看出,L对X5的充分性因子(L,X5)较大,体现了学习中勤奋的重要性Table2 The Ef fect Factor of P(X5|E)for L 表2 L对P(X5|E)的作用因子Probabilistic DistributionProbabilistic Dis tribution of X5A B C D E1 Normal E ffect Factor(%)P(X5|E)0 57600 29410 08290 03320 0139P(X5)0 23980 22260 24720 21470 0756M(P(X5|E),P(X5))0 8152(L,X5)42 32 P(X5|E-L)0 53640 28490 10100 05480 0228M(P(X5|E),P(X5|E-L))0 0974 (L,X5)11 95 P(X5|L)0 36630 26860 18430 13470 0460M(P(X5|E),P(X5|L))0 4702 (E-L,X5)57 68可以根据表3所示的规则,使用 , (L,X)和(L,X)这3个数据,将证据分为关键证据、必要证据、重要证据、次要证据等4种类型 例如,若取阈值 =1 4,则根据表2、表3得到如下解释:证据集合{智商(X1)=∀高#,努力(X2)=∀勤奋#,作业成绩(X6)=∀优#}中,证据∀努力(X2)=勤奋#是重要证据 ∀努力(X2)=勤奋#与∀作业成绩(X6)=优#的对推理结论的作用有重叠现象 因为若没有证据∀作业成绩(X6)=优#,则∀努力(X2)=勤奋#就有显著的必要性 因此,对于证据集合{智商(X1)=∀高#,努力(X2)=∀勤奋#},∀努力(X2)=勤奋#是关键证据Table3 The Explanation Rule for the Effect Extent to the Inf erence Conclusion表3 对推理结论的作用程度的解释规则(L,X)(L,X)T he Effect Extent of L for X,i e the Effect Extent for the In feren ce Conclusion P(X|E)T ype > > L has important contributi on to inference conclusion,and this kind of contributi on can t be s ubstituted for other evi dences in EKey Evidence> < T hough L itself does not have much contribution to inference conclusion,it is important in E Because if th ere is no L,the contribution of other eviden ces i n E w ill decrease remarkably Necessity Evi dence< > L has important contribution to inference conclusion,w hile part of the contri bution overlap w ith the contributi on of other evidences in E Th en L could be substituted for other evidences in E Important Evi dence< < L i tself does not have much contri bution to inference conclusi on,and it could be substituted forother evidences in E T hen it is unimportant evidence in EM inor Evidence3 证据对结论的作用路径3 1 由P(X|E)生成的Bayes网络根据Bayes网络的结构特征与条件独立性之间的关系,推理结论P(X|E)一般只与网络中部分节点有关 找出证据对推理结论产生影响的路径,只需考察可能与计算P(X|E)有关的节点 对于规模较大的Bayes网络,删除网络中与计算P(X|E)无关的节点可以减少问题的复杂性 不难证明:如果节点N满足如下3个条件之一,那么它与计算P(X| E)无关:∃N不是X或X的某一先驱节点,也不是证据节点或某个证据节点的先驱节点;%N和X被E或E中的元素有向分割(d separation)[7,8];&连接N和X的每条路径中都存在与计算P(X|E)无关的节点删除网络结构中所有与计算P(X|E)无关的节点,就生成一个新的Bayes网络模型,本文称之为由P(X|E)生成的Bayes网络,该Bayes网络的网络结构就是简化后的网络结构,条件概率分布就是原Bayes网络模型中对应的条件概率分布3 2 生成作用路径现在要从由P(X|E)生成的Bayes网络结构中找出所有连接L和X的有向路径(有向链) 所谓1529汪荣贵等:Bayes网络推理结论的解释机制研究连接L和X的有向路径,就是指一些互异的节点{X1,X2,!,X K}组成的节点序列,且满足如下4个条件:∃序列的起点和终点分别对应于L和X,即X1=L,X K=X;%对于X i和X i+1,存在从X i到X i+1,或者从X i+1到X i的有向边;&{X1,X2,!, X K}中每个节点都与计算P(X|E)有关;∋不能含有异于L证据节点 本文设计了如下深度优先穷尽搜索算法,寻找连接L和X的有向路径对于单连通的网络结构,任意两个节点之间只有惟一的连接路径,可以通过分析路径中节点的概率分布的变化,直接生成对该路径的解释 对于多连通网络结构,可能有多个连接L和X的有向路径,它们对P(X|E)的作用程度不一定相同,作用路径间可能存在重叠 为此将连接路径适当分割为若干子链,定量分析每条子链对推理结论P(X|E)的作用程度,生成作用子链 具体的分割算法比较简单,不再赘述 要从这些可能的子链中找出L作用X的作用子链,则需要对这些子链做进一步的定量分析3 3 解释作用路径如果某条作用子链存在于每条连接L与X的有向路径,则该子链显然是L作用X的必经之路,称这种子链为关键子链 对于所有的非关键子链,可以使用删除法来分析它们对推理结论作用程度 如果要考察某条非关键子链对推理结论P(X|E)的作用,就从由P(X|E)生成的Bayes网络结构中删除该链两端点之间的部分,然后通过度量和分析P(X|E)的变化来生成对该链的解释 使用删除法分析子链对推理结论的作用需要处理好如下两个问题:∃从网络结构中删除子链两端点之间的部分,改变了网络结构,子链的某个端点在网络结构中的父节点数可能会减少,其条件概率分布会发生变化,此时如何计算新的条件概率分布;%从网络结构中删除子链,相当于增加了条件独立性假设,改变了知识库的结构,由此可能改变网络节点X的先验概率P(X),如何处理先验概率的这种变化设Bayes网络中某节点A有父节点B0,B1,!, B K,删除A的父节点B0,根据概率的归一性,有:P(A|B1,!,B K)=B0P(A,B0|B1,B2,!,B K)= B0P(B0|B1,B2,!,B K)P(A|B0,B1,B2,!,B K)(3) 可以按上式计算删除B0后的关于节点A的条件概率分布,其中P(A|B0,B1,B2,!,B K)就是删除B0前节点A的条件概率分布,P(B0|B1,B2, !,B K)可由Bay es网络所确定的联合概率分布计算:P(B0|B1,B2,!,B K)=P(B0,B1,B2,!,B K) P(B1,B2,!,B K)从由P(X|E)生成的Bayes网络模型中删除某条作用子链C两端点之间的部分,若端点父节点数发生变化,则可以根据式(3)算出新的条件概率分布,形成一个新的Bayes网络模型 根据该模型可以算出节点X的新的先验概率分布P*(X)和作为推理结论的后验概率分布P*(X|E),进一步算出基于该模型的L对X的充分性因子*(L,X)Table4 The Explanation Rule of Effect Path f or Evidence L to the Influence C onclusion表4 证据L对推理结论作用路径的解释规则d(L,X)M(P,P*)Color Explanati on T ype>!<∀Bulky Black T he effect of the changing for the know ledge database s tructure is not obvious,then difference d(L,X)is mai nly the probabilistic informationpropagated by the sub chain T hen this sub chain transfers mai n probabilistic informationBelong to main path>!>∀Black M(P,P*)being obvious,difference d(L,X)contains part effect ofthe changing of know ledge database structure H ow ever it could not assure the sub chain w i ll transfer mass informationBelong to main path<!<∀Bulky Gray T his sub chain will transfer minor probabilistic information Not belong to main path <!>∀Colorless T he effect of knowledge database changing is obvi ous,and d(L,X)isminor T his situati on i s peculiar使用P(X)与P*(X)之差的1 范数M(P(X), P*(X))度量两者的差异 令d(L,X)=(L,X) -*(L,X),根据如表4所示的解释和表示规则,就可以通过分别考察d(L,X)及M(P(X),P*(X))的大小,生成对作用子链C的解释,并着上相应的颜色 由颜色相同的子链组成的有向路径就是一条作用路径 该作用路径的类型由其颜色确定 表4中的阈值!和∀需要根据经验选取1530计算机研究与发展 2005,42(9)4 应用实例:解释ALAR M 模型的作用路径ALARM 模型是由Beinlich 等人构建的[9],用于监视麻醉状态下病人身体状况及相关医疗设备的工作状态 它有46条边37个节点,包括8个诊断节点(感兴趣的输出节点)、16个证据节点、13个中间节点,图2表示该模型的网络结构,本节用N j 表示图中第j 个节点 如每个节点的医学含义、取值状态、条件或先验概率分布等,可以从网页[10,11]中得到令L =∀N 13=0#,首先找出与计算P (X |E )有关的所有节点,组成由P (X |E )生成的Bayes 网络(如图3(a)所示);然后找出所有连接L 和X 的有向路径,共有3条:{N 13,N 36,N 24};{N 13,N 22,N 35,N 36,N 24};{N 13,N 23,N 35,N 36,N 24} 这些有向路径组成一个关于L 和X 的网络结构,如图3(b)所示;将图3(b )中网络结构分割成若干有向路径的子链,共有5条,它们是C 1={N 36,N 24};C 2={N 13,N 36};C 3={N 35,N 36};C 4={N 13,N 22,N 35};C 5={N 13,N 23,N 35} 节点N 23的概率分布几乎不变,满足命题2的条件,因此C 5不是作用子链 其余4条为所有可能的作用子链,C 1是关键子链;最后,分别计算作用子链C 2,C 3,C 4的(d (L ,X ),M (P (X ),P *(X )))值,计算结果分别为(48 82%,0 0213);(2 35%,0 0324);(2 12%,0 0532),根据表4生成对作用路径的解释,如图3(c)所示证据∀N 13=0#对节点N 24的作用路径有两条:{N 13,N 36,N 24}和{N 13,N 22,N 35,N 36,N 24} 其中{N 13,N 36,N 24}是主要作用路径,{N 13,N 22,N 35,N 36,N 24}是次要作用路径 证据N 13主要通过N 36来作用N 24,而节点N 22,N 35对N 24的作用不大 事实上,节点N 36表示输氧管道的通风状态,与节点N 24的因果关系显然十分密切F ig 3 Finding and Explaining the effect path (a)Nodes r elated to the computing process of P (X |E);(b)Dir ect path connecting L and X ;and (c)T he effect path of L to X图3 寻找并解释作用路径 (a)与计算P(X |E )有关的节点;(b)连接L 和X 的有向路径;(c)L 对X 的作用路径F ig 2 N etw ork structure of the AL ARM model图2 AL ARM 模型的网络结构1531汪荣贵等:Bayes 网络推理结论的解释机制研究5 总 结使用经典的概率理论处理不确定性信息和知识面临着两个主要困难[4]:∃计算量与概率模型的精度之间难以取舍;%概率理论基于公理系统,其推理方式与人的思维方式有较大差别,难以构建基于概率型智能系统的解释机制 因此,人们一般使用广义概率方法(如主观Bayes方法、确定性因子等)或其他的启发式方法(D S证据理论、模糊理论等),来解决智能信息处理中的不确定性信息和知识 Bayes 网络模型通过巧妙使用条件独立性克服了第1个困难[1],使得人们恢复了对经典的概率理论和方法的信心,导致近十几年来智能信息处理中经典的概率理论和方法的复兴 本文的研究表明,基于Bay es网络的智能信息系统可以构造有效的解释机制,解释证据对推理结论作用的程度及路径参考文献1J Pearl Probabilistic Reasoning i n Expert Systems:Netw orks of Plausible Inference San M ateo,CA:M organ Kaufmann,1988 2S L Lauritzen,D J Spiegelhalter Local computati ons with probabilities on graphical structures and their appli cati on to expert systems Journal of the Royal Statistical Society,Series B,1988, 50(2):157~2243C Elsaes s er,et al Explanation of probabi listic inference In: Proc Conf Un certainty in Artificial Intelligence Amsterdam, Holland:Elsevier Science Publishers,1989 319~3284G S hafer,J Pearl,eds Readings in Uncertain Reasoning San M ateo,CA:M organ Kaufmann,19905D M adigan,et al Graphical explanations in belief networks Journal of Computational and Graphic Statistics,1997,6(2): 1601~1816U Chajew ska,J Y Halpern Defining explanation in probabilis tic systems In:Proc 30th Conf Uncertai nty in Artificial Intelli gence San Francisco:M organ Kaufmann,1997 62~717D Geiger,et al D Separation:From th eorems to algori thms T he5th W orkshop on U ncertainty in Artificial Intelligence,Wind sor,Ontari o,19898D Geiger,T Verma,J Pearl Identifying independence in Bayesian netw orks Netw orks,1990,20(2):507~5349I A Bei nli ch,e t al T he ALARM monitoring system:A case study w ith tw o probabilis tic inference techniques for belief n et works In Proc the2n d European Conf Artificial Intelligence i n M edical Care Berlin:S pringer Verlag,1989 247~25610I A Beinlich A logical alarm reduction mechanism http:( ww netlib alarm.htm,2002 1011I A Beinlich A m edical diagnostic alarm message system http: (ww netlib ALARM.dnet,2002 10Wang Ronggui,born in1966 Received hisPh D deg ree in2004 His curr ent researchinter ests include intelligent information processing,know ledge engineer,Bay esian Network,imag e understanding汪荣贵,1966年生,博士,副教授,主要研究方向为智能信息处理、知识工程、Bay es网络、图像理解Zhang Yousheng,born in1941 He hasbeen professor and Ph. D.supervisor ofHefei U niversity of T echnology since1994His current r esearch interests include ar tificial intelligent and its applicat ion in imagerecog nit ion and understanding张佑生,1941年生,教授,博士生导师,主要研究方向为人工智能在图形和图像识别与理解中应用Gao Jun,born in1963 He has been professor and Ph. D.supervisor of Hefei U niv ersity of T echnolog y since2000 H i s current resear ch interests include image processing,pattern recognition,neural netw orks,intelligent information processing高隽,1963年生,教授,博士生导师,主要研究方向为图像处理、模式识别、神经网络理论及应用、光电信息处理、智能信息处理Peng Qingsong,born in1975 Received hisPh D.deg ree in2004 His curr ent researchinter ests include art ificial intelligent and itsapplicatio n in image reco gnition and understanding彭青松,1975年生,博士,主要研究方向为人工智能及其图像识别与理解中应用Research BackgroundBayesian networ k can be used to compute the uncertain information and knowledge T he joint probabilist ic distribution is used to r epresent the knowledge to enhance consistency and to improve the reasonability of the inference conclusion,and conditional indepen dence contained in graphical mo dels is used to decrease the complex ity of joint probabili stic distribution Ho wever the infer ence conclu sion of the Bayesian network i s t he form of posteriori pr obabilistic distr ibut ion,and what s serious is that it could not be ex plained di rectly by translating inference chain o r inference networ k So the ex planation mechanism of the Bay esian netw ork is a research topic t hat is w orthy of researching We have resear ched and r ealized a kind of explanation mechanism and have prov ided new solut ion to study on the ex planation mechanism of Bayesian network T he research is supported by the national science research foundation(No 60175011,No 60375011)1532计算机研究与发展 2005,42(9)。

相关文档
最新文档