知识图在问答系统中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第20卷
V01.20
第1期
No.1
电子设计工程
Electronic Design Engineering
2012年1月
Jan.2012
知识图在问答系统中的应用
王江南.胡广朋
(江苏科技大学计算机科学与工程学院,江苏镇江212003)
摘要:基于判定问答系统当前问题是否是话题的一个部分以及正确地理解自然语言,提出了基于规划知识图的识别
方法.结合问句的语境分析处理问题。给出了一个带有智能规划和识别句子完整性的系统模型。利用规划库将句子缺
省信息和隐含信息表示完整,再结合句子语境检索。得出了利用规划知识图可以正确的理解用户意图,结合语境分析
用户当前的动作可以提高理解的准确率,从而提高用户对系统的满意度。
关键词:问答系统;规划识别;知识图;语义分析
中图分类号:TP315 文献标识码:A 文章编号:1674—6236(2O12)01—0027一O3
Application of knowledge graph in question answering system
WANG Jiang-nan,HU Guang・peng
(J/angsu University ofScience and Technology,Zhenjiang 212003,China)
Abstract:In order to determine whether the current problem is a part of the topic and the correct understanding of natural
language in the Q&A system,this paper proposes a method to analyze problems based on knowledge graph identification with
the sentence context.And presents a system model with this intelligent planning,which can identify the integrity of the
sentence.The method uses planning library to complete information of the default sentence and implies information to retrieval
combination of scn ̄tence context.Using planning knowledge graph can CO1TeC ̄y understand the user’S intent;thereby the
contextual analysis of user actions can impmve the accuracy of the current understanding and increase user’S satisfaction with
the system.
Key words:question answering system;plan recognition;knowledge graph;semantic analysis
规划识别llj可用来进行谈话分析,理解用户提出的问题, 支持智能回答的生成。对用户提出的省略句以及不完整语句 的理解有很好的帮助,此外,还可以揭示具有语句中的隐含 意义。随着网络的普及,越来越多的人们通过网络寻求解决 问题的方法,问答系统的生成正顺应着这一发展。 本文运用带有支持度和阈值的知识图对问答系统的求 解过程进行规划,将用户的第二问,第三问等作为一个新的 观察对象,增加到解图的生成过程中,综合考虑用户的求解 目的。因考虑到在现实生活中.登陆问答系统咨询的用户,并 不是所有人都可以在第一次将所要描述的问题描述清楚且 全面。在第一次提出问题,系统给出答案后,往往会追加一个 或几个问题对所要表达的问题进行补充,本文的重点就是对 这些后来提出的问题做出判断.判断是否是相关联的问题。 从而给出用户一个合理的答案。 1国内外研究现状 问答系统的研究起源于60年代,风靡于80年代,但是 由于条件的限制,曾一直被限定在特殊的专家系统领域,后 因文本处理技术的兴起,问答系统的研究受到了冷落 。较早 收稿日期:2011-tO一14 稿件编号:2011l0058 研究且较为成功的问答系统有麻省理工大学人工智能实验
室的START及北京理工大学研制的针对银行和企事业服务
咨询的问答系统,能够接受用户的自然语言提问,并提供准
确的答案。到目前为止,问答系统仍存在两个方面的不足:一
是,局限于分析一个独立的句子,上下文的关系以及谈话环
境对本句的约束和影响还缺乏系统的研究,因此,歧义分析、
词语省略、语境、代词所指等还没有规律可循。
规划识别属于人工智能中一个比较活跃的领域,规划识
别主要研究的是从某一智能体的动作推导过程和目标。选用
图规划作[31为解决问题的方法是因为在所有的规划策略中,
图规划具有启发式的功效。因而本文选择规划知识图作为问
答系统中答案抽取的主要方法,结合用户之前的动作进行信
息的检索最终生成最符合用户意图的答案解集。
2基于规划识别的问答系统模型
2.1 问答系统的结构图
系统的结构如图1所示。
2.2规划知识图
规划知识图 是一个非循环的与或图,是一种基于层次
结构的规划识别方法。图中的节点代表事件。连接符从父节
作者简介:王江南(1986一),女,江苏大丰人,硕士研究生。研究方向:规划识别。
-
27-
《电子设计工程}2012年第1期
图1系统框架结构图
Fig.1 System frame structure
点指向子节点,用以表示事件之间是整体与部分的关系或具
体与抽象的关系。其中,整体与部分的关系用分解表达式表
示,具体与抽象的关系用抽象表达式表示。
例,规划B分为:规划C、规划D、规划E、规划F,用一阶
谓词表示可表示为V×B( )DC( ),表示C是抽象规划B的
一
个具体子规划;规划C由规划G和规划H组成,用一阶谓
词可表示为V xC3G(s ( ))A H(s:( )),其中5。( ),s ( )是
关联函数,说明C的信息由这2部分组成,表明整体与部分
的关系。
将其表示成带概率的规划知识图如图2所示,每条弧赋
上概率初始值,初始值可以依据经验而定。
田
1
图2规划知识图
Fig.2 Planning knowledge graph
但是,概率的大小直接影响搜索的结果,因而概率最好
从实际生活中得来最好,所以,文中通过成功对该事件进行
检索的动作判断概率的大小。
3算法分析
根据用户提出的问题,找出每个问句的目的。从规划知
识图中某一的节点出发。找到的一个包含这些节点的子图。
规定原图为G(graph),解图为SG,存放观测到的现象为
stacl SG。
3.1算法
算法1:分析当前问句
1)读入用户输入的问句Q;
2)对问句Q进行分词(以中科院ICTCLAS中的分词
-
28-
为基础改编的),调用SplitWord分词,并注明词性,Q={口。,
啦,… l;
3)判断句子的完整性,对句子进行句法分析。缺少名词
或者动宾短语转4,存在指示代词转5,其余的转6;
4)提取该语句所在语境的名词和动词。若Q中没有加入
进来,Q={Ⅱl,啦,… ,b 一,bj),转6;
5)提取该语句所在语境的名词,Q中没有的加入到Q
中,Q=f口1,啦,…an…b…,b };
6)调用算法3对当前问句进行检索:
7)答案列表依概率的大小排序,与当前问句相似度最高
的排在最前端:
8)输出给用户,算法结柬。
算法2:当前句子的语境分析
1)当前句子为i,i-1为当前句子的前一个句子, 一2为当
前句子之前的第二个句子,以此类推,追溯到 一8(在英国国
家语料库中一般性的对话不少于10个问题且不多于15个
问题[41。因而在考虑对话的上下文关系的时候选取i=8这个
数,在8个问题之内自动认为用户问的是同一个问题,超过8
个问题就自动认为是下一个话题 ),其中 >O√=1,2,…,8;
2)提取句子中的人名,地名等其他专有名词和动词;
3)采用衰退的方法计算之前句子对本句的影响;
4)返回当前句子的语境。
算法3:生成解图
1)数据库中已有的问题以知识图的方式存储在数据库
中.依据Q对知识图进行规划,规划知识图的解图算法利用
闫书亚的KGPPR算法【6】,但做了一些改进,当父节点和子
节点都被观测到时,子节点的其余与节点小于阈值(0.5)便
舍去;
2)Q中的词语m在知识图中不存在时。寻找m的近义
词、同义词,用m的同义词和近义词代替m;
3)加入语境对解图进行扩展。避免解图产生震荡。
3.2分析
文中说明的算法在解图生成的过程中,删除了概率很小
的节点,同时又解决了解图震荡性,这样在一个规模庞大的
知识图求解过程中将减少很多的冗余节点。我们首先将数据
库中的问题按知识图进行分类存储,先通过知识图的检索缩
小检索的范围,再用句子的检索策略,对这个范围内的答案
进行排序。这不仅解决了系统中不存在的新规划求解的问
题.同时也提高了检索的正确性与准确率。
例.对知识图3依据观察到的节点用上述算法计算解
图。用户在某一时刻提出了第一个问题,Q1:居里夫人出生在
哪里?时间i+1又提出了第二个问题,Q2:居里夫人有着怎样
的童年?
时间序列i,观测到现象居里夫人、出生,句子的语境是
f l,对解图不产生影响,解图如图4所示,过程如表1所示。
时间序列i+1,观测到现象居里夫人、童年。句子的语境
是{居里夫人、出生l,在知识图3中,童年是一个无效的规划,