问答系统研究综述

合集下载

问答系统中问句分类方法研究综述

问答系统中问句分类方法研究综述

用自然语言与用户进行互动的计算机系统称之为问答系统。

问答系统(QA)由问句分析、信息检索、答案抽取三部分组成[1],问句分类作为QA的初始环节,其能否正确地对问句进行分类会直接影响到后续的答案抽取环节。

另外,问句分类能够对系统提供较为重要的数据信息,这些信息对于帮助用户找到想要的答案至关重要。

问句分类对问答系统的重要作用主要表现在两个方面:(1)根据期望的答案类型来为问句分配相应的标签,这是问句分类的基础,从而缩小候选答案的范围。

例如,问句“第一个登上月球的人是谁?”,用户真正想要知道的答案是“阿姆斯特朗”,而不是去检索过多包含“第一”或是“世界”相关内容的资料。

在进行问句分类操作后,能够得知这是一个询问人名的问句,答案应与问句的类型相一致,故在答案抽取阶段会把人名以外的候选语句筛除掉,只需要把焦点放在一些和人名有关的答案即可,而无需将过多注意力放在和人名无关的候选答案语句上面。

问答系统中问句分类方法研究综述韩东方,吐尔地·托合提,艾斯卡尔·艾木都拉新疆大学信息科学与工程学院,乌鲁木齐830046摘要:问答系统作为信息检索的一种高阶形式,能够迅速、精准地为用户提供所需的信息服务,在给定一个问题后,会相应地给出准确的答案,这使得它在自然语言处理领域成为一个越发受人关注的研究方向。

问句分类作为问答系统中的问题分析和处理的首要环节,是问答系统中尤为重要的一部分,其分类精度会直接影响到问答系统的性能。

近些年来,机器学习和深度学习等技术的快速发展极大地促进了问句分类的研究和发展,其在问句分类上具有较强的可行性和优越性。

为此就问句分类的国内外研究现状、问句分类标准体系、问句特征抽取、传统的机器学习分类方法和近来流行的深度学习分类方法进行总结和分析,阐述了问句分类当前所面临的一些研究难点,并对未来的研究和发展方向做了初步展望。

关键词:问答系统;问句分类;分类体系;机器学习;深度学习文献标志码:A中图分类号:TP391doi:10.3778/j.issn.1002-8331.2009-0211Survey on Question Classification Method in Question Answering SystemHAN Dongfang,Turdy Toheti,Askar HamdullaSchool of Information Science and Technology,Xinjiang University,Urumqi830046,ChinaAbstract:As a high-level form of information retrieval,the Question Answering system(QA)can quickly and accuratelyprovide users with the required information services.After giving a question,an accurate answer will be given accordingly, which makes it become a more and more attention research direction in the field of natural language processing.Question Classification(QC)is the most important part of question analysis and processing in the QA,and its classification accuracy will directly affect the overall performance of the QA.In recent years,the rapid development of machine learning and deep learning technologies has greatly promoted the research and development of QC,which has strong feasibility and superiority in question classification.This paper summarizes and analyzes the domestic and foreign research status of QC, question classification standard system,question feature extraction,traditional machine learning classification methods and recently popular deep learning classification methods,and elaborates the current status of QC.This paper expounds research difficulties in QC,and makes preliminary prospects for future research and development directions.Key words:question answering system;question classification;classification system;machine learning;deep learning基金项目:国家自然科学基金(61562083,61262062);国家重点研发计划(2017YFC0820603)。

社区问答系统研究综述

社区问答系统研究综述

e r h a d e p n e e rh si n i n x a d rs ac e nCQA. c
Ke wod Co y rs mmu iyq e t n a s r g Usrb h vo , n e tq ai ee t n, e t n s ac n t u si n wei , e e a ir Co tn u ly d tci Qu si e rh o n t o o
第3卷 7
第 1 期 1






Vo - 7 No 1 l3 . 1
No 01 v2 0
21 0 0年 1 月 1
Co u e S in e mp t r ce c
社 区 问答 系统 研 究综 述
张 中峰 李 秋丹
( 中科 院 自动 化研 究所 北京 1 0 9 ) 0 1 0
测、 问题检 索等 C QA 中主要 问题的研 究以及 C QA在其他媒体 中的应 用。最后 展望 了 C A 中下一步值得 研 究的 问 Q
题 。本 讨论 有助 于进 一步 丰 富和 拓 展 C QA 的研 究 。 关键词 社 区问 答 系统 , 用户 行 为 模 式 , 内容 质 量 检 测 , 问题 检 索 TP 9TP 1 3 , 3 文 献标 识码 A 中 图 法 分类 号
f r f o i l d a F n l , ic s e o eis e o u t e t d . e d s u s n h sp p ra eb n fca o o mso ca s me i. i al we d s u s d s m u s f rf r h rs u y Th ic s i si t i a e r e e iil y s o n t

问答系统研究综述

问答系统研究综述

PC:Sl=问答系统研究综述吴灵慧摘要目前,问答系统已经广泛应用到社会各个方面,其作为整个计算机领域重点的研究领域,引起了人们6勺高度重视.文章对问答系统的基础概念、发展历史、关键技术及未来的发展趋势进行简要阐述,旨在为问答系统今后发展打下良好基础。

关键词问答系统;信息检索;答案抽取;问题分析中图分类号TP3文献标识码A文章编号1674-6708(2019)230-0147-02随着互联网的迅猛发展和计算机的广泛普及,人们一直寻找迅速并准确地获取信息的方法。

在过去20年里,各类搜索引擎产品不断出现和发展,迎合了用户的信息检索需求。

然而当数据量不断增加,海量数据资源汇集到一起时,搜索引擎的缺点逐渐开始暴露。

传统的搜索引擎只能以检索关键词作为输入,这就要求用户必须用数量有限的词来准确表达查询需求,对用户的信息检索能力要求较高,这对于绝大多数普通用户来说并不友好。

此外,传统搜索引擎返回的结果通常也不尽如人意,仍需用户自己在搜索引擎系统返回的网页列表中查找具体的信息,这就容易使用户的体验大打折扣。

基于上述存在的问题,问答系统应运而生,与传统搜索引擎不同,问答系统可以针对任意以自然语言形式提岀的问题返回给用户确切的答案。

由此可见,问答系统能更好地表达和满足用户的要求。

本文对问答系统的发展历史、关键技术及发展趋势进行简要介绍,旨在帮助读者对问答系统有全面的认识和了解。

1问答系统发展历史问答系统的发展历史已有70余年,早在1950年,计算机科学之父艾伦图灵便提出了使用自然语言进行人机交互的相关技术,进而使得问答系统的诞生成为了现实。

在20世纪60年代,借助人工智能的相关技术,第一批问答系统出现在人们的视眼中,典型的代表系统有BASEBALL、LUNAR和ELIZA111□Baseball允许用户对篮球比赛的相关内容进行提问,并返回相应的结果;Lunar能够对岩石样本分析实验的相关内容进行问答;ELIZA系统主要用于精神疾病患者的恢复过程,能够实现简单的交流过程。

问答系统综述

问答系统综述
图书馆开展个性化服务的具体措施41读者库数据化结语按照数据存储的需要将图书馆所拥有的读者群体进行库存毋庸置疑信息技术的进步造就了大数据与读者们的亲密接化可以保证读者自身相关信息的准确识别有助于将读者的最新触积极思考并尝试解决图书馆信息服务和资源使用过程ቤተ መጻሕፍቲ ባይዱ的大需求进行集中和无缝隙的对接实现一种最佳传递方式的到达保数据问题将是图书馆克服目前资源发现领域技术上和模式上局限证将图书馆内部信息与读者信息进行相互融合一方面能够将更多关键所在有助于服务工作在飞速发展的知识社会中谋求崭新一的服务信息传递给读者自身另外一方面能够让读者更为便捷地将参考文献建让读者数据库的价值全面体现出来
3 问答 系统 的 分 类
传统的 自动问答系统包括三个主要部分 : 问题分析 、 信 息检 索 和答案抽取 。 陈谷 川和陈豫认为 自动 问答系统可 以分为 以下三类 : ( 1 ) 直 接基 于文档检 索的 自动问答系统 :这种系统使用文档检 索技术 , 针对询 问的关键词检索 出最为接近 的文档 。 这类系统使用 各种途径来判断用户的询 问语句 中的关键词, 但在建立询 问或者提 交答案的过程 中没有使用任何 自然语言处理技术 。 ( 2 ) 基于I E 的 自动 问答系统 : 这种系统把要解决的 问题看作是 次信息抽取 , 从文档中抽取所需要的实体类型 的信息 。 一般是把 信息填人预先定制好 的模板 , 或者是在定义 了的 问题集 中找 出匹配 的答案 。 ( 3 ) 基于询 问处理和命名实体抽取技术 的系统 : 这类系统使用 自 然语言处理技术并对 待参考的答案进行实体识别 。 用到的主要技术 包括浅层 句法分析、 询 问类型识别 、 命名实体识别等 。
_ _ t f
| j 孛 技 术
应 用研 究

基于人工智能技术的智能问答系统研究

基于人工智能技术的智能问答系统研究

基于人工智能技术的智能问答系统研究近年来,人工智能领域的迅速发展使得人脑智能与计算机智能的融合成为了可能,智能问答系统作为人脑智能与计算机智能的结晶,正被越来越多地重视和应用。

在智能问答系统中,计算机能够通过对用户的提问进行分析、理解,并通过推理、知识库、自然语言处理等技术,给出精准的答案。

一、智能问答系统的概述智能问答系统属于人工智能领域中的自然语言处理技术。

它可以通过对用户提出的问题进行理解和分析,并提供针对性的答案。

在这其中,最重要的一环便是自然语言处理技术,只有掌握了这项技术,计算机才能够对自然语言进行理解,依据其答案库自动推断出准确的答案。

随着深度学习、语音识别技术和知识图谱等技术的崛起,智能问答系统的应用场景也越来越广泛。

例如:智能客服系统、智能语音助手、智能搜索引擎以及智能知识库等领域均可以应用智能问答系统,为用户提供更加高效精准的服务。

二、智能问答系统的工作流程智能问答系统一般分为两个阶段:理解和解答。

理解阶段主要是对自然语言进行分析和理解,以提取出问题的核心意思,而解答阶段则通过推理和查询知识库,匹配答案并回答用户的问题。

1、理解阶段在理解阶段,智能问答系统需要依靠自然语言处理技术(NLP)对用户的问题进行识别和分析。

这需要经过如下的步骤:(1)分词:将句子中的每个单词进行切分,分析每个单词所具备的语义信息。

(2)词性标注:对分词后的单词进行标注,以确定其在句子中所代表的语法角色。

(3)语法分析:通过对词性的分析,确定句子的语法结构。

(4)语义理解:通过自然语言处理技术的应用,将句子的内容与知识库中所保存的信息进行比对和匹配,以理解用户的意图。

2、解答阶段在理解用户问题之后,智能问答系统便可以开始回答用户的问题。

这需要结合知识库中所保存的信息,通过一些技术手段实现快速准确的回答。

解答阶段主要的技术手段有:信息检索技术(IR)、自然语言推理技术(NLI)、知识表示技术(KR)等。

近几年我国网络互动问答平台研究述评

近几年我国网络互动问答平台研究述评

结论
柳永研究作为北宋文化研究的一个重要组成部分,近年来取得了一系列重要 的成果。然而,也存在一些问题和挑战,需要未来的研究加以解决。在未来的研 究中,应充分重视柳永作品的艺术价值和社会意义,全面深入地探究其生平和创 作背景以及作品对于北宋社会和文化的反映和影响。
同时,应注重跨学科的研究方法和思路,将柳永研究与历史、文化、音乐等 学科相结合,以期取得更为全面和深入的研究成果。
2、用户行为与体验:进一步深入探讨用户在使用网络互动问答平台时的体 验和满意度。通过了解用户的需求和期望,优化平台的设计和功能,提高用户的 满意度和忠诚度。
3、信息质量评估与提高:进一步研究和改进信息质量的评估方法和技术。 例如,利用机器学习和自然语言处理技术,实现更加准确和高效的答案筛选和推 荐;建立更加完善的信息质量评估体系,提高评估的客观性和公正性。
此外,监管机构应该加强对网络平台互动的监管,规范企业的融资行为,保 护投资者的权益。
在这个信息爆炸的时代,网络平台互动无疑已经成为企业和投资者之间的重 要桥梁。通过研究网络平台互动如何影响企业融资约束,我们可以更好地理解现 代金融市场的运行机制,优化企业的融资策略,提高市场的整体效率。未来,随 着网络技术的不断发展,我们有理由相信,网络平台互动将在缓解企业融资约束 方面发挥更大的作用。
一、研究现状
近年来,我国网络互动问答平台的研究逐渐成为了热点。研究主要集中在平 台的设计与实现、用户行为、信息质量等方面。在平台的设计与实现方面,研究 者们针对不同的领域和需求,设计并实现了一系列功能丰富、交互友好的网络互 动问答平台。
在用户行为方面,研究者们通过大规模的实证研究和实验,深入探讨了用户 在使用网络互动问答平台时的行为模式、习惯和偏好。在信息质量方面,研究者 们对网络互动问答平台中的信息进行了全面的分析和评估,提出了提高信息质量 的策略和方法。

问答系统研究综述

问答系统研究综述

问答系统研究综述一、系统定义与背景问答系统是一种基于自然语言处理(NLP)的计算机系统,旨在回答用户提出的问题。

它涉及人工智能、机器学习、自然语言理解等多个领域,是当前信息技术研究的热点之一。

随着互联网和移动设备的普及,问答系统在人们日常生活和工作中发挥着越来越重要的作用,例如智能客服、智能助手等。

二、研究目的与方法问答系统的研究目的在于提高系统的准确性和效率,以便更好地满足用户需求。

研究方法主要包括以下几个方面:1. 自然语言处理技术:问答系统需要具备自然语言处理的能力,包括分词、词性标注、命名实体识别、句法分析等,以便对用户问题进行理解和分析。

2. 知识图谱:知识图谱是问答系统的重要组成部分,它包含了各种领域的知识和信息。

通过构建和维护知识图谱,问答系统可以更加准确地回答用户问题。

3. 机器学习和深度学习:机器学习和深度学习是问答系统的核心,它们可以帮助系统自动学习和优化答案生成和排序算法,提高系统的效率和准确性。

4. 自然语言生成:自然语言生成是问答系统的另一个重要方面,它可以根据系统生成的答案自动生成自然语言文本,以便更好地满足用户需求。

三、技术原理及实现问答系统的技术原理主要包括以下几个步骤:1. 问题分析:对用户提出的问题进行分析,包括关键词提取、情感分析等。

2. 答案生成:根据问题分析的结果,从知识图谱或数据库中提取相关信息,生成多个可能的答案。

3. 答案排序:对生成的答案进行排序,根据其相关性和可靠性等因素,选择最合适的答案。

4. 答案输出:将选定的答案以自然语言形式输出给用户。

四、应用场景与优势问答系统具有广泛的应用场景,例如:1. 智能客服:通过问答系统,企业可以提供更加高效和便捷的客户服务。

用户可以通过自然语言与机器人进行交流,获取相关信息和解决方案。

2. 智能助手:问答系统可以作为智能助手,帮助人们解决日常生活中的问题,例如健康咨询、旅游攻略等。

同时也可以为个人提供信息查询和知识普及等服务。

中文问答系统问句分析研究综述

中文问答系统问句分析研究综述

中文问答系统问句分析研究综述本文主要介绍了中文问答系统问句分析技术,具体来说就是语言处理技术,它可以帮助我们进行语义理解,也就是把用户输入的问句理解为计算机可以理解的模型。

近年来,随着自然语言处理技术发展迅速,中文问答系统问句分析技术也取得了长足的进步,应用于实际场景的技术也取得了很大的发展。

本文将首先介绍中文问答系统问句分析的技术基础,接着介绍相关技术的发展历程,最后介绍实际应用中这项技术的发展现状。

一、中文问答系统问句分析技术基础中文问答系统问句分析技术的核心技术是语言处理技术,它是一种基于自然语言理解的技术,它的目的是把用户输入的问句转化为计算机可以理解的模型。

语言处理技术包括语法分析、语义分析、文本分析、机器学习等,这些技术是特定应用的基础。

语言处理技术的发展,依赖于语言的发展。

如果我们想要实现有效的语言理解,就必须对语言的细微差别进行分析,以便将用户输入的问句转换为计算机可以理解的模型。

常用的分析策略包括人工语言理解(ALI)、自然语言理解(NLU)和统计语言模型(SLM)等。

人工语言理解(ALI)是一种基于机器学习和模式识别技术的语言处理技术,它可以帮助我们识别用户输入的问句中的每个词,以及不同的含义。

自然语言理解(NLU)是一种基于规则的语言处理技术,它可以识别用户输入的问句中的单词以及词组,根据定义的规则将其转换为计算机可以理解的模型。

统计语言模型(SLM)是一种基于机器学习的语言处理技术,它可以识别用户输入的问句中的每个词,并根据这些词来预测句子的意思。

二、中文问答系统问句分析技术的发展历程中文问答系统问句分析技术的发展历程可以追溯到20世纪80年代,当时研究者开始研究如何把用户输入的问句转换为计算机可以理解的模型。

当时的技术很简单,主要是根据给定的规则来抽取问句的关键信息,如实体、属性等等。

随着计算机技术的发展,中文问答系统问句分析技术也迅速发展。

可以将人工语言理解、自然语言理解和统计语言模型等技术结合起来,代替以前只能采用规则的方式,使用更加精确的技术来分析用户输入的问句,从而更加准确的识别问句的意思。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ISSN 1673-9418 CODEN JKYTA8 Journal of Frontiers of Computer Science and Technology 1673-9418/2012/06(03)-0193-15 DOI: 10.3778/j.issn.1673-9418.2012.03.001
1.3 问答系统研究的基本问题
对应问答系统的处理流程, 问答系统一般包括 三个主要组成部分:问题分析、信息检索和答案抽 取。这表明问答系统研究包含三个基本问题:如何 去分析问题; 如何根据问题的分析结果去缩小答案 可能存在的范围; 如何从可能存在答案的信息块中 抽取答案。
在问答系统的不同发展阶段, 对于这三个基本 问题的解决方法随着数据类型的变化在不断变化, 从而形成了不同类型的问答系统。
1.4 问答系统的复杂性
一般情况下, 问答系统的复杂程度可以从三个 维度来衡量:问题、数据、答案。对于问题维度, 问 答系统可以分为限定领域(指系统能接受的问题只 能是关于某个特定的主题)的问答系统和开放领域 (指系统能接受的问题可以是任意主题的问题, 没 有任何限制)的问答系统; 对于数据维度, 问答系统 可以分为处理结构数据(或半结构数据)的问答系统 (例如关系数据)和处理无结构数据(例如文本)的问 答系统; 对于答案维度, 问答系统可以分为抽取式 (所谓抽取, 是指答案是从数据或者文本中抽取出 来的, 例如文本片段)问答系统和产生式(所谓产生, 是指答案是通过一定的规则或者内在的编码生成 出来的, 例如对话)问答系统。所以问答系统根据这 三个维度各自采取的形式拥有不同的复杂性。一般 地, 开放领域的问答系统比限定领域的问答系统复 杂, 处理无结构数据的问答系统比处理结构数据的 问答系统复杂, 同时抽取式的问答系统比产生式的 问答系统复杂。因此衡量和分析问答系统的复杂性, 可以从问题、数据、答案三个维度来评价; 同时问 答系统根据问题、数据、答案三个维度的不同而属 于不同类别。
2 问答系统的发展历程
图灵测试可能是对问答系统最早的构想。本文
毛先领 等:问答系统研究综述
195
依据问答系统处理的数据格式, 将问答系统的发展 历史划分为三个阶段:基于结构化数据的发展阶 段、基于自由文本数据的发展阶段、基于问题答案 对(question-answer pairs)数据的发展阶段。其中基于 结构化数据的发展阶段又可以划分为人工智能 (artificial intelligence, AI)阶段和计算语言学阶段两 个子阶段。其大概的时间划分、特点和代表系统分 别叙述如下:
E-mail: fcst@
Tel: +86-10-51616056
问答系统研究综述*
毛先领+, 李晓明
北京大学 信息科学技术学院, 北京 100871
A Survey on Question and Answering Systems*
MAO Xianling+, LI Xiaoming
基于结构数据的问答系统有两个相关研究大量
1) 这种阶段划分旨在强调方法的时代特征, 并不意味着这种方法已经过时或者消亡, 很多旧有方法在现在仍然被大量使用, 只是这种技术在目前没有大突破, 例如基于结构化数据的技术在今天仍然在医疗等限定领域内被大量使用。
196
Journal of Frontiers of Computer Science and Technology 计算机科学与探索
School of Electronics Engineering and Computer Science, Peking University, Beijing 100871, China + Corresponding author: E-mail: mxl@
MAO Xianling, LI Xiaoming. A survey on question and answering systems. Journal of Frontiers of Computer Science and Technology, 2012, 6(3): 193−207.
摘 要:近年来, 问答系统被大量广泛地研究。问答系统的目标是给定一个问题, 能够得到简短、精确的 答案。根据处理数据的不同, 将问答系统分为三类:基于结构化数据的问答系统、基于自由文本的问答系 统、基于问题答案对的问答系统。对这三大类系统的特点、面临的问题和相关的研究分别进行了叙述和总 结。最后, 讨论了问答系统未来可能的研究方向。 关键词:问答系统(QA); 传统问答系统(TQA); 基于社区的问答系统(CQA); 信息检索; 答案抽取
1.1 问答系统的定义
关于问答系统的内涵和外延, 很多的研究者 都给出了各自的定义。例如 Molla 等人[1]在 2007 年把问答系统定义为一个能回答任意自然语言形式 问题的自动机。虽然定义很多, 并且各种定义之间略 有不同, 但是一般都认为问答系统的输入应该是自 然语言形式的问题, 输出应该是一个简洁的答案 或者可能答案的列表, 而不是一堆相关的文档。例如 用户向问答系统提交一个问题, “电话是什么时候发 明的?”,系统应该返回一个精简的答案, “1876”。
随后, 网络上出现了常问问题(frequent asked questions, FAQ)数据, 特别是在 2005 年末以来大量 的社区问答(community based question answering, CQA)数据(例如 Yahoo!Answer)出现在网络上, 即 有了大量的问题答案对数据, 问答系统进入了开放 领域、基于问题答案对时期。
文献标识码:A 中图分简介
随着互联网的普及, 互联网上的信息越来越丰 富, 人们能够通过搜索引擎方便地得到自己想要的 各种信息。但是搜索引擎存在很多不足, 主要有两 个方面:一是返回结果太多, 导致用户很难快速准 确地定位到所需的信息; 二是搜索引擎的技术基础, 即关键字匹配, 只关注语言的语法形式, 没有涉及 语义, 同时用户采用简单的查询词很难准确地表达 信息需求, 使得检索效果一般。
Fig.1 The architecture of QA system based on structural data
图 1 基于结构化数据的问答系统的体系结构
构建一个基于结构数据的问答系统有两个关键 问题:一是需要构建一个特定领域的比较完备的结 构数据库; 二是准确、高效地把问题转化为查询语 言形式的查询。
由于各个阶段处理的数据格式和形式不同, 导 致各个阶段解决问答系统的三个基本问题的方法 和技术各不相同。本文将分别对这三个阶段各自的 问题进行叙述 1)。
3 基于结构化数据的问答系统
基于结构化数据的问答系统的主要思想是通过 分析问题, 把问题转化为一个查询(query), 然后在 结构化数据中进行查询, 返回的查询结果即为问题 的答案。从其基本思想可知, 这种方法一般只能用 在限定领域。
Abstract: Recently, question and answering systems have attracted lots of attention. Given a question, the goal of question and answering is to return a concise, exact answer. According to the format of data, question and answering can be divided into three categories: the structural data based question and answering, the free-text based question and answering, the question-answer pairs based question and answering. This paper describes and summarizes the characteristics and related researches of these three categories respectively. Then, it discusses the future work of question and answering. Key words: question and answering (QA); traditional question and answering (TQA); community-based question and answering (CQA); information retrieval; answer extraction
主要数据处理流程如下: (1) 根据问题特点来分析问题, 产生一个结构 数据的查询语言格式的查询(对应于问答系统的问 题分析部分)。 (2) 将产生的查询提交给管理结构数据的系统 (如数据库等), 系统根据查询的限制条件筛选数据 (对应于问答系统的信息检索部分, 即缩小答案可 能存在的范围)。 (3) 把匹配的数据作为答案返回给用户(对应 于问答系统的答案抽取部分, 由于数据库查询的精 确匹配特性, “抽取”的动作不明显)。 系统结构如图 1 所示。
进入 20 世纪 90 年代, 问答系统进入开放领域、 基于文本的新时期。由于互联网的飞速发展, 产生 了大量的电子文档, 这为问答系统进入开放领域、 基于文本的时期提供了客观条件。特别是在1999 年 TREC(text retrieval conference)的 QA track 设立以来, 极大地推动了问答系统的发展。
2012, 6(3)
涌现的时期:一是人工智能时期; 二是计算语言学 时期。下面分别对这两个时期进行叙述。
3.1 人工智能时期
在 20 世纪 60 年代左右, 由于人工智能领域的 蓬勃发展, 研究者试图通过问答系统来体现人工智 能, 导致很多的问答系统诞生, 最著名的问答系统 是 BASEBALL 和 LUNAR。BASEBALL 系统能回 答 关 于 美 国 篮 球 联 赛 一 个 赛 季 的 相 关 问 题 [2]; LUNAR 系统能回答关于阿波罗月球探测任务取回 的岩石样本分析结果的相关问题[5]。两个系统在各 自特定的领域取得了巨大的成功。特别是, LUNAR 系统曾在1967 年的一个月球科学会议上被展示, 在 没有提前告知可以允许的短语或者不允许的短语 的情况下, 它能够回答地理学家所提出的问题中的 90%[6]。LUNAR 和 BASEBALL 只是这个时期问答 系统中最突出的两个系统, 还有大量的类似系统。 Simmons 在一篇综述[7]中描述了早期各种这类形式 的问答系统。大多数的这类早期系统(包括 LUNAR 和 BASEBALL)都只是聚焦在非常局限的领域内的 “玩具系统”(toy system)。这些早期系统仅仅采用少 量的数据集合作为内在的信息源, 同时依赖人去消 除数据集合中的句子歧义, 或者转换这些句子为简 单的英语句子。
相关文档
最新文档