从问答系统看知识智能

合集下载

知识图谱在智能问答中的应用:提升问答系统效果的重要手段

知识图谱在智能问答中的应用:提升问答系统效果的重要手段

知识图谱在智能问答中的应用:提升问答系统效果的重要手段引言随着互联网的快速发展,人们对于快速、准确获取信息的需求不断增加。

智能问答系统作为信息检索领域的重要应用,越来越受到关注。

知识图谱作为一种表示和推理知识的工具,为智能问答系统的发展提供了新的机遇。

本文将深入探讨知识图谱在智能问答系统中的应用,以及如何利用知识图谱提升问答系统的效果。

图1知识图谱在智能问答中的应用:提升问答系统效果的重要手段一、知识图谱的基本原理与特点知识图谱的基本原理知识图谱是一种以图形化的方式表示知识的工具。

它以实体、属性和关系为基础元素,通过连接不同实体之间的关系,呈现出丰富的知识结构和语义信息。

知识图谱可以实现对知识的语义理解、推理和查询,为智能问答系统提供强大的支持。

知识图谱的特点(1)语义丰富:知识图谱能够以图形化的方式呈现知识的丰富语义信息,帮助机器理解人类语言中的复杂概念和关系。

(2)可扩展性强:知识图谱可以通过不断添加新的实体和关系来扩展其覆盖范围,实现知识的持续更新和优化。

(3)可交互性好:知识图谱可以与其他应用程序进行集成,实现数据的共享和交互,提高工作效率和准确性。

三、智能问答系统中知识图谱的应用问题理解与分类智能问答系统中,对问题的理解与分类是关键。

知识图谱可以帮助系统更好地理解问题的语义信息和实体关系,从而对问题进行准确的分类。

通过对问题的实体、属性和关系进行分析,可以快速定位到相关领域的知识,提高问题处理的效率。

答案生成与推理基于知识图谱的智能问答系统可以通过对知识图谱的查询和推理来生成准确答案。

通过对问题的实体和关系进行匹配,可以快速找到与问题相关的知识点,从而生成准确的答案。

此外,通过知识图谱的推理功能,还可以实现知识的逻辑推理和推断,提高答案的精度。

跨领域问答传统的问答系统通常针对特定领域的问题进行回答。

然而,实际应用中往往需要对跨领域的问题进行回答。

知识图谱可以帮助实现跨领域的知识共享和融合,使得问答系统能够处理不同领域的问题,提高系统的通用性和实用性。

基于人工智能的知识库问答系统研究

基于人工智能的知识库问答系统研究

基于人工智能的知识库问答系统研究随着人工智能技术的不断发展,越来越多的应用场景开始向人工智能方向转移。

其中,知识库问答系统已经成为了人工智能技术在知识领域的重要应用之一。

本文将探讨基于人工智能的知识库问答系统研究,以及其发展前景和挑战。

一、知识库问答系统的概念知识库问答系统(KBQA)是一种基于自然语言理解、知识表达和知识推理技术,为用户提供自然语言接口,能够以智能化的方式回答用户关于某个特定领域的问题。

与传统的关键词搜索引擎相比,知识库问答系统更侧重于理解用户提出的问题,并给出精确的回答。

在发展过程中,知识库问答系统逐渐从基于规则的技术向深度学习、神经网络等技术转移,并逐步实现了真正的人机对话。

二、基于人工智能的知识库问答系统研究基于人工智能的知识库问答系统主要包含自然语言处理、知识表示与推理、语义匹配等技术。

1. 自然语言处理自然语言处理是知识库问答系统的基础。

该技术主要包括分词、词性标注、实体识别、语义角色标注、句法分析等环节。

通过这些环节,系统能够对自然语言文本进行深入的理解。

2. 知识表示与推理知识表示与推理技术是知识库问答系统的核心技术。

该技术主要包括知识图谱、本体论、规则等,通过这些技术,系统可以对知识进行表达,推理和存储。

3. 语义匹配语义匹配技术是知识库问答系统高效回答问题的关键技术。

通过该技术,系统可以将用户提出的自然语言问题与知识库中的实体、属性及关系进行匹配,找到最合适的答案。

三、基于人工智能的知识库问答系统的发展前景随着人工智能技术的进一步研究和应用,基于人工智能的知识库问答系统也将迎来更加广阔的发展前景。

1. 实现真正的人机对话基于人工智能的知识库问答系统将实现真正的人机对话,使得用户可以通过自然语言与系统进行沟通,从而实现更加智能、高效的知识获取。

2. 对知识库的更新和维护提出更高的要求基于人工智能的知识库问答系统将对知识库的更新和维护提出更高的要求,需要保证知识的完整性、准确性和时效性。

基于人工智能的智能问答系统

基于人工智能的智能问答系统

基于人工智能的智能问答系统智能问答系统是一种基于人工智能技术的应用系统,它能理解用户的问题并给出准确的答案。

随着人工智能技术的快速发展,智能问答系统在各个领域得到了广泛的应用,比如教育、医疗、金融等。

本文将重点介绍基于人工智能的智能问答系统的原理、应用以及未来发展趋势。

首先,我们来了解智能问答系统的工作原理。

智能问答系统通常分为两个模块:理解问题和查找答案。

在理解问题的模块中,系统利用自然语言处理技术对用户的问题进行分析和语义理解,将问题转化为计算机可处理的形式。

在查找答案的模块中,系统会从事先准备好的知识库或者网络上的文档中搜索相关信息,并根据问题的语义和上下文给出答案。

这一过程涉及到关键的技术,比如文本分析、信息检索和机器学习等。

智能问答系统的应用十分广泛。

在教育领域,智能问答系统可以帮助学生解答问题、提供相关资料和学习指导,提高学习效果。

在医疗领域,智能问答系统可以提供疾病诊断、健康咨询等服务,帮助患者更好地了解自己的健康状况。

在金融领域,智能问答系统可以为用户提供股票、基金等投资咨询,帮助用户做出更明智的决策。

此外,智能问答系统还可以用于智能客服、智能助手等场景,在各个领域提升用户体验和服务质量。

随着技术的不断发展和创新,智能问答系统还有许多潜力可以挖掘。

一方面,我们可以进一步提升系统的准确性和智能化程度。

通过引入更加先进的自然语言处理模型和深度学习算法,可以提高系统对复杂问题的理解和答案生成能力。

此外,利用大数据和云计算技术,可以构建更大规模的知识图谱和知识库,为系统提供更丰富、更准确的信息资源。

另一方面,智能问答系统可以与其他技术进行结合,创造出更多的应用场景。

比如,将智能问答系统与虚拟现实和增强现实技术相结合,可以实现更直观、更沉浸式的用户体验。

此外,结合语音识别和语音合成技术,可以实现智能语音问答系统,让用户通过语音进行交互,提高系统的易用性和便捷性。

然而,智能问答系统在实际应用中还存在一些挑战和问题需要解决。

知识图谱与智能问答系统

知识图谱与智能问答系统

知识图谱与智能问答系统近年来,人工智能技术的发展日新月异,其中最为引人注目的莫过于知识图谱和智能问答系统。

它们可以通过深度学习算法,将海量的数据进行自动抽取、挖掘和建模,实现对于复杂知识体系的高效管理和智能分析。

在此背景下,知识图谱和智能问答系统已经成为很多企业和科研机构进行人工智能技术应用的重要方向。

本文将从这两个方面对知识图谱和智能问答系统进行详细探讨。

一、知识图谱在现代互联网时代,信息爆炸和数据呈指数增长已经成为常态。

而“知识图谱”则是一种推动信息快速处理与应用的解决方案,它是指通过语义构建和数据挖掘技术,将相关实体、属性、关系进行标记和链接,并以图谱的方式进行呈现的一种新型知识表达方式。

知识图谱主要由三个部分组成:实体、属性和关系。

实体即知识图谱中抽象概念的对象,如人、地点、组织、事件等;属性是实体的特征或者性质,比如一个人的年龄、出生日期、职业等;关系则是两个或两个以上实体之间的联系,如一个人和他的亲属、他所在的组织和他所属的行业等。

知识图谱的建立需要整合多来源的数据,如文本、图片、表格和半结构数据等,基于大量数据自动抽取和分析,得到包含多种实体、属性和关系信息的知识库。

这样构建的知识图谱可以应用于各种场景,如智能搜索、智能客服、自动文本阅读、医疗诊断等。

除此之外,知识图谱还可以推动人工智能、机器学习等技术的应用,为产业升级和经济发展提供有力支撑。

二、智能问答系统智能问答系统是基于人工智能技术中的自然语言处理技术和机器学习算法等,可自动化地获取、理解和处理人类语言的系统。

简单来说,它是指一个系统能够根据人的提问进行自动回答和解释的一种智能技术。

用户可以通过语音或文字等方式提出问题,系统会根据自己的知识库和推理逻辑,给出最精准的答案或者不同的可能解释。

智能问答系统的核心技术是自然语言处理(NLP)算法。

通过语料库中的数据训练机器学习模型,使其能够自动理解人类语言中的词汇、句法和语义等,从而能够更好地回答用户提出的问题。

人工智能工程师智能问答系统总结

人工智能工程师智能问答系统总结

人工智能工程师智能问答系统总结在人工智能的领域中,智能问答系统是一项重要而复杂的任务。

它旨在通过自然语言处理和机器学习等技术,使计算机能够理解用户提出的问题,并给出准确、有用的回答。

作为一个人工智能工程师,在开发智能问答系统的过程中,我深刻体会到了其中的挑战和技术要点,现在我将对此进行总结。

一、智能问答系统的基本流程智能问答系统的基本流程包括问题分析、查询、信息抽取、回答生成和回答输出。

首先,针对用户提出的问题,系统需要对问题进行分析,包括问题类型的识别、关键词抽取、问题主体提取等。

接下来,系统会根据问题的特征进行查询,通常是在数据库或网络上搜索相关的信息。

然后,系统需要从查询结果中进行信息抽取,提取出与问题相关的核心知识。

基于这些知识,系统会生成准确、有用的回答,并将回答输出给用户。

二、技术要点在智能问答系统的开发中,有几个关键的技术要点需要特别注意。

1. 自然语言处理自然语言处理是智能问答系统中至关重要的技术。

它涉及问题分析、语义理解、信息抽取等多个方面。

对于问题分析,系统需要通过识别问题类型、提取关键词等手段,对用户的问题进行准确解读。

对于语义理解,系统需要能够理解问题中的隐含意思和语境信息。

信息抽取则是将查询结果中的文本进行解析和分析,提取出与问题相关的知识。

2. 知识表示与存储智能问答系统需要以结构化、可计算的方式存储和表示知识。

这通常涉及到本体表示、数据编码等技术。

本体表示可以将知识按照一定的语义规范进行抽象和表达,便于计算机进行理解和处理。

数据编码则是将文本、图像等非结构化的信息转化为计算机可以识别和处理的形式,提供给系统进行查询和信息抽取。

3. 机器学习与深度学习机器学习和深度学习是智能问答系统中常用的技术手段。

通过对大量的问题和回答数据进行训练,系统可以学习到问题和回答之间的关系和模式。

这使得系统能够更准确地理解用户提出的问题,并生成更有用的回答。

机器学习和深度学习也可以用于问题分类、问题匹配、实体识别等任务,提高系统的性能和智能化程度。

问答系统的应用场景

问答系统的应用场景

问答系统的应用场景近年来,随着人工智能技术的不断发展,问答系统逐渐成为人们生活中的重要助手。

问答系统是一种能够回答用户提出的问题的人工智能系统,它通过分析和理解用户的问题,从大量的知识库中获取相关信息,并将准确的答案返回给用户。

问答系统的应用场景非常广泛,下面将从不同领域分别介绍几个典型的应用场景。

1. 在教育领域,问答系统可以为学生提供个性化的学习答疑服务。

学生在学习过程中遇到问题时,可以直接向问答系统提问,系统会根据学生的问题和知识点进行匹配,给出相应的解答。

这样,学生可以随时随地获得针对性的学习帮助,提高学习效率。

2. 在医疗领域,问答系统可以为医生和患者提供辅助诊断和健康咨询服务。

医生和患者可以向问答系统提问病情、疾病治疗等相关问题,系统会根据医学知识库和临床经验给出相应的建议和解答。

这样,医生和患者可以通过问答系统获取及时准确的医疗信息,提高诊断和治疗水平。

3. 在金融领域,问答系统可以为客户提供智能化的理财咨询和投资建议。

客户可以向问答系统咨询关于股票、基金、保险等金融产品的相关问题,系统会根据客户的风险偏好和投资目标给出个性化的理财方案和投资建议。

这样,客户可以通过问答系统了解金融市场的动态和投资机会,提高投资决策的准确性和收益率。

4. 在客服领域,问答系统可以为用户提供自助式的问题解答服务。

用户在使用产品或服务过程中遇到问题时,可以通过问答系统获取相应的解答,避免了繁琐的人工客服流程。

问答系统还可以通过语义分析和情感分析等技术,实现对用户情绪和需求的感知,提供更加个性化的服务。

5. 在智能家居领域,问答系统可以为用户提供智能化的家居控制和生活辅助服务。

用户可以通过语音或文字向问答系统提问关于家居设备的控制、家庭日程安排、天气预报等相关问题,系统会根据用户的需求和习惯给出相应的指令和建议。

这样,用户可以通过问答系统实现智能化的家居管理和便捷的生活方式。

问答系统在教育、医疗、金融、客服、智能家居等领域都有着广泛的应用。

人工智能技术在智能问答中的应用

人工智能技术在智能问答中的应用

人工智能技术在智能问答中的应用随着人工智能技术的不断发展和普及,智能问答系统也逐渐得到了广泛的应用。

人工智能技术在智能问答中的应用正在逐步提高自然语言理解、文本分析、语音识别和图像识别等技术的能力和效率,为各行各业的应用场景提供了更加高效、准确、智能化的服务。

一、智能问答的基本原理智能问答系统是一种能够利用自然语言处理技术,通过分析用户提问的问题,快速给用户提供满意的答案的系统。

其核心技术是文本匹配和答案生成,即通过对问题与数据库中大量的文本数据进行匹配,找到与问题相匹配的答案,并将答案返回给用户。

随着人工智能技术的加入,智能问答系统不仅能够提高问题与答案匹配的精准度和速度,还能够提供更加智能化的答案展示和解释,实现更加高效、准确、自然化的交互体验。

二、人工智能技术在智能问答中的应用1. 自然语言理解技术自然语言理解技术可以帮助智能问答系统快速准确地理解用户提问的含义。

通过对大量的语言和文本数据的学习和模拟,智能问答系统可以掌握不同语言和语境中的语法结构、词汇意义和句子逻辑关系,进而实现快速、准确地识别分析用户提问的问题文本。

2. 文本分析技术文本分析技术可以帮助智能问答系统对大量文本数据进行深度分析,提取出诸如实体、关系、事件、情感等元素。

基于这些元素,智能问答系统可以实现对用户提问问题的深度理解和答案生成,从而提供更加准确、全面、自然化的答案。

3. 语音识别技术语音识别技术可以将人类语音转化为文本,并进行语音信息识别、分析和处理。

智能问答系统可以通过语音识别技术收集用户的语音输入,从而实现语音问答,提供更加自然化、便捷的交互方式。

4. 图像识别技术图像识别技术可以帮助智能问答系统对用户提供的图片、图标等信息进行快速识别和处理。

例如,在用户提问中包含了某个房间内某个物品的照片,智能问答系统可以通过图像识别技术快速判断出该物品,并提供用户相应的答案。

三、智能问答技术在不同领域的应用智能问答技术的应用已逐步覆盖了各个行业和领域,如金融、医疗、教育、电商、社交等。

AI智能问答

AI智能问答

AI智能问答AI智能问答系统(Artificial Intelligence Question Answering System)是指通过人工智能技术实现的一种能够读懂问题并给出准确答案的系统。

它不仅能够根据查询自动搜索相关的信息,还可以理解问题的语义和上下文,从大量的数据中进行推理,并最终给出用户满意的答案。

在各个领域,AI智能问答系统的发展都取得了显著的成果,它既能提高信息检索速度和准确性,又能为用户提供定制化的答案和解决方案。

一、AI智能问答系统的基本原理AI智能问答系统基于自然语言处理(Natural Language Processing,NLP)技术和机器学习算法进行构建。

其基本原理如下:1.问题理解AI智能问答系统首先需要理解用户的问题。

通过NLP技术,系统能够对用户输入的自然语言进行分析和处理,识别出问题所涉及的关键词、语法结构和语义信息,从而准确理解用户的意图。

2.知识获取为了能够回答用户的问题,AI智能问答系统需要从各种数据源中获取相关的知识和信息。

这些数据源包括但不限于结构化数据库、文本文档、网络数据、知识图谱等。

系统通过数据爬取、信息抽取等技术将这些知识转化为机器可理解的形式,以供后续处理和推理。

3.问题匹配在获取到用户问题和相关知识后,系统需要根据问题的语义和上下文进行匹配,从知识库中筛选出与问题相关的信息和答案。

这一过程可以通过算法模型进行,比如基于向量空间模型的语义相似度计算、深度学习模型的语义匹配等。

4.答案生成在找到与问题匹配的知识后,AI智能问答系统还需要对这些知识进行推理和整合,以生成符合用户需求的答案。

这一过程包括逻辑推理、信息融合、答案排序等,旨在提供给用户最准确、完整且可理解的答案。

二、AI智能问答系统的应用领域AI智能问答系统在各个领域都有着广泛的应用,以下是其中几个典型的领域:1.教育领域在教育领域,AI智能问答系统可以为学生提供在线辅导和答疑解惑。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

问答系统发展历程问答系统的研究经历了几个阶段。

从20世纪50~60年代开始,人工智能科学家就致力于研究基于知识推理的问答系统,其特点是:专家建立知识库,答案或者从知识库中检索得到,或者在知识库上经过推理得到。

推理主要是基于专家制定的启发式规则进行。

代表性系统是美国麻省理工学院开发的数学符号运算系统MACSYMA[1]。

基于知识推理的问答系统具有性能良好、回答准确、具有推理能力等优点。

但是这种方法也有明显的缺点:人工构建知识库非常困难,知识库规模和领域有限,如果问题超出了知识库的范围,则系统性能会很差。

20世纪90年代,随着互联网技术的发展,网络信息日益丰富,搜索引擎为信息获取提供了极大的便利,但却无法清楚地表达人们的意图,而且其返回的是网页,并不是确切的答案,因此不能很好地满足人们的信息需求。

为了弥补搜索引擎的不足,研究人员提出了问答式检索系统,如麻省理工学院开发的Start1、Umass开发的QuASM2和微软公司开发的Encarta3。

这类系统的主要特点是:利用信息检索以及浅层自然语言处理技术从大规模文本库或者网页库中抽取出答案。

与基于知识推理的问答系统相比,问答式检索系统不受知识库规模和领域的限制,更加接近真实的应用需求;与传统的搜索引擎相比,问答式检索系统接受的是自然语言形式的提问,对用户意图的把握更加准确,呈现给用户的答案也更加准确。

但是目前,问答式检索系统仅能处理有限类型的简单问题,如事实性的问题、定义性的问题等。

而且,由于只用到检索技术和一些浅层的自然语言处理技术,问答图灵测试让计算机具有人的智能,一直是科学家追求的目标。

1950年,阿兰·图灵(A. M. Turing)提出“图灵测试”:让一个人在不接触对方的情况下,通过一种特殊的方式和对方进行一系列问答;如果在相当长的时间内,他无法根据这些问题判断对方是人还是计算机,那么就可以认为这台计算机具有相当于人的智力,即这台计算机是能思维的。

自此,问答系统成为判断计算机是否具有智能(特别是语言智能)的理想模型。

美国认知心理学家奥尔森(G. M. Olson)认为,判别计算机是否理解自然语言的四个标准是:问答系统(question answer-ing)、文摘(summari z ation)、复述(paraphrase)和机器翻译(machinetranslation)。

计算机只要达到四个标准之一,就认为它理解了自然语言。

赵 军中国科学院自动化研究所从问答系统看知识智能关键词:问答系统 知识智能1 /。

2 /IRLab/11-743s04/。

3 /。

式检索系统几乎没有推理能力。

2011年,IBM研发的问答机器人沃森(Watson)在美国智力竞赛节目“危险边缘”(Jeopardy!)中战胜人类选手,成为问答系统发展的一个里程碑。

沃森的技术优势大致可以分为三个方面:(1)强大的硬件平台:包括90台IBM服务器、分布式计算环境;(2)强大的知识资源:存储了大约2亿页的图书、新闻、电影剧本、辞海、文选和《世界图书百科全书》等资料;(3)深层问答技术(DeepQA):涉及统计机器学习、句法分析、主题分析、信息抽取、知识库集成和知识推理等深层技术。

然而,沃森并没有突破传统问答式检索系统的局限性,使用的技术主要还是检索和匹配,回答的大多是简单的实体或词语类问题,而且推理能力不强。

随着Web2.0的兴起,基于用户生成内容(User-Generated Con-tent, UGC)的互联网服务越来越流行,社区问答系统应运而生,例如Yahoo! Answers4、百度知道5等。

据统计,2010年,“Yahoo! Answers”已解决的问题达10亿个;2011年,“百度知道”已解决的问题达3亿个,而且这些社区问答数据覆盖了用户知识和信息需求的方方面面。

问答社区的出现为互联网知识分享提供了新的途径和平台,也为问答技术的发展带来了新的机遇。

科学家们开始研究如何对海量社区问答数据进行有效的挖掘和利用,从而回答用户提出的新问题。

无论是问答式检索系统还是社区问答系统,都是建立在大规模语料库基础上的,其主要技术手段是检索和验证。

知识库的匮乏一直是影响问答系统智能化的重要因素。

在问答系统方面,对知识表示和推理技术并没有进行深入系统的研究,因此,目前离智能问答系统的目标还有相当大的距离。

开放知识库成为智能问答突破的关键为了实现智能问答,需要理解文本信息的语义,将自然语言表示的知识转化为计算机可以理解的形式化表达。

事实上,科学家们一直在以专家建造的方式努力描述知识。

问答系统所用到的知识可以粗略地分为语言知识和世界知识。

语言知识表示资源最典型的代表是英文知识库WordNet、FrameNet、北京大学现代汉语语法信息知识库、HowNet等。

世界知识表示资源最典型的代表是Cyc(来源是“encyclopedia”),该项目是在人工智能鼻祖道格拉斯·莉娜(Douglas Lenat)带领下实现的目前全世界最大的完全由人工建立的常识知识库。

虽然目前它已包括500万条专家定义的断言,涉及50万个概念、3万个关系,但还远远不能满足问答系统对知识的需求。

为了突破知识表示资源的瓶颈,学术界一直尝试利用信息抽取技术从海量网络资源中自动抽取知识建立知识库,涉及实体识别、实体消歧和关系抽取等关键技术。

卡内基梅隆大学在美国国防部高级研究计划署(DARPA)、美国国家科学基金会(NSF)、谷歌和雅虎的共同资助下正在开展“Read the Web”项目。

该项目致力于研发一个不停学习的计算机系统——NELL(Never-EndingLanguage Learner)[2],不间断地从互联网上抽取和挖掘知识,构建可以支持多种智能信息处理应用需求的海量规模网络知识库。

有代表性的工作还包括:华盛顿大学图灵实验室的TextRunner[3]、ReVerb[4]、R2A2[5]、WOE[6]、OL-LIE[7],德国柏林工业大学DSIM组的Wanderlust[8]、KrakeN[9],德国马克斯普朗克研究院(MaxplanckInstitute)的PA TTY[10]和ClausIE[11],微软研究院推出的Probase[12]。

工业界从另一个角度进行了全新的探索——以群体智慧的方式建设知识资源,并取得了丰硕成果。

2001年,第一个用户可编辑的“互联网百科全书”网站——维基百科正式面向公众开放,该平台支持网民自助建设知4 /。

5 http://z /。

识资源。

截至目前,维基百科已经构建了涵盖287种语言的3000多万条知识条目。

维基百科的发展给知识库资源的建设带来了新的生机。

但它仍然是面向人的知识,由于形式化程度不够,同时缺乏语义描述,计算机使用起来仍然很困难。

因此,业界开始基于维基百科生成计算机可利用的知识库,其中YAGO、DBpedia、Freebase、KOG/kyliy、PORE都是基于维基百科自动生成的知识库。

由于这些资源涵盖不同领域的知识,内容也随着人类知识的增长而不断丰富,因此引起了搜索引擎巨头的极大关注。

谷歌于2010年收购了Freebase6后,一直致力于构建相互关联的实体及其属性的巨大知识图表Knowl-edge Graph,并据此建立了谷歌语义搜索。

谷歌搜索部门高管艾米特·辛格尔(Amit Singhal)表示:“谷歌在知识图表的支撑下,能够将网页上的单词转变为带有属性的实体,使机器能够更加精确地理解语义信息,从而实现从基于关键词的字符串到基于实体的语义匹配。

”目前,该知识图表已经包含了超过两亿个实体。

在国内,百度和搜狗也分别推出了雄心勃勃的计划——“百度知心”和“搜狗知立方”。

智能问答的研究重点学术界和工业界在知识图谱建设方面的显著成果为智能问答系统技术的突破奠定了基础。

在知识图谱的支撑下进行问答成为近年来的研究热点。

科学家们围绕实体消歧、关系映射、问句的语义解析以及知识的学习和推理等关键技术问题进行了深入探索。

实体消歧命名实体歧义指的是一个实体名在不同的上下文中可以对应到不同的真实世界实体的语言现象。

例如,给定三个包含实体名“华盛顿”的句子:美国开国元勋华盛顿;美国首都华盛顿特区;华盛顿州,位于美国西北部。

这三个句子中的实体名“华盛顿”分别指向实体“美国第一任总统”、“美国首府”和“美国华盛顿州”。

在知识图谱建设和问句语义解析等应用中,都需要确定文本中的实体名所指向的真实世界实体,这就是命名实体消歧。

高性能的命名实体消歧依赖于语义知识的利用,虽然互联网上存在多种知识源,但是由于知识源的多源异构性以及很多语义知识隐藏在知识源的深层结构中,计算机通常难以获取和利用这些知识源中的语义知识。

因此,研究多源异构知识源中语义知识的挖掘与集成方法,在命名实体消歧以及其他自然语言处理任务中具有重要的意义。

结构化知识源中的大部分语义知识都可以以概念关联的形式表示。

文献[13]提出了统一的结构化语义知识表示模型——语义图和基于图的结构化语义知识挖掘算法——结构化语义关联,来挖掘语义图中的显式和隐式知识。

实验结果表明,与传统的基于词袋子模型的实体消歧系统和基于社会化网络的实体消歧系统相比,结构化语义知识可以显著提升实体消歧的性能。

非结构化知识源中存在着大量概率化语义知识。

为了挖掘和集成概率化语义知识,文献[15]提出了基于语言模型的实体知识表示框架——实体语言模型,并基于此研究了文本语料库中的实体知识挖掘算法。

同时针对实体语言模型参数估计中的训练样本不足的问题,提出了两种基于文本语料库结构的训练样本挖掘策略:基于相似度结构的相关文档扩展和基于层次分类结构的相关文档扩展。

实验结果表明,实体语言模型能有效地表示实体知识,基于相关文档扩展和基于层次分类结构扩展的实体语言模型参数估计方法能显著提升实体知识挖掘性能。

为了充分利用实体指称项的上下文信息以及从多个知识源中挖掘出的概率化语义知识和结构化语义知识来构建高性能的实体链接系统,韩(Xianpei Han)等人提出了局部一致性和全局一致性模型[14]。

其中局部一致性模型将实体指称项建模为实体语言模型6 /。

生成的样本,全局一致性模型利用结构化语义关联对指称项上下文的主题一致性进行建模。

基于局部一致性和全局一致性模型,文献[14]构建了高性能的实体链接系统。

实验结果表明,基于局部一致性和全局一致性模型的实体链接系统可以获得良好的性能:与基于词袋子模型的系统相比,该系统的性能显著提升;与目前最新技术水平(state-of-the-art)的系统相比,该系统的性能也有一定程度提升。

关系语义分类实体语义关系分类是把非结构化文本变成结构化文本的关键技术。

例如,给定一个自然语言句子“斧子的把手是用紫杉木做的”(The [haft] of the [axe] is made of yew wood),我们需要判断两个实体“把手”(haft)和“斧子”(axe)具有部分-整体(component-whole)的关系。

相关文档
最新文档