关于人机对话系统的思考
人机交互知识:人机交互的局限性与挑战性问题

人机交互知识:人机交互的局限性与挑战性问题人机交互(HCI)是一个跨学科领域,涉及心理学、人类行为学、设计和工程学等多个学科。
它旨在探究人类与计算机之间如何进行信息交互以及如何设计与开发更好的人机界面。
虽然人机交互已取得了一定的成就,但是它依然面临着许多局限性和挑战性问题。
一、局限性1.认知负荷过高人机交互的一个重要目标是设计出易用的界面,减少用户的认知负荷。
认知负荷是指人脑处理信息的能力,其大小与信息的量和复杂度有关。
如果人机交互界面设计过于复杂或信息过多,用户就很容易出现认知负荷过高的情况,甚至影响其对任务的完成。
所以,设计人机交互时必须注意降低用户的认知负荷。
2.界面设计过于单一界面设计不够灵活,难以满足不同用户的需求。
例如,某些用户可能需要使用较大的字体和按钮,而另一部分用户则需要更小的字体和按钮。
如果界面无法根据用户的要求进行改变,则会出现用户体验不佳的情况。
3.难以设计自然对话自然对话是人机交互的一个热门研究方向。
它的目标是实现像人与人之间的对话一样自然的对话交互。
但是,由于自然语言的复杂性以及识别和理解技术的限制,目前的人工智能系统仍难以实现自然对话。
4.信息不对称信息不对称是指用户了解不够清楚的情况下使用系统。
在某些情况下,用户假设系统的输出正确无误,但实际上输出并不准确。
这就意味着用户需要花费额外的时间和精力来纠正错误,并消除对任务完成的干扰。
二、挑战性问题1.多模态交互多模态交互是指使用多种不同的输入和输出模式进行交互。
例如,当在繁忙时,人们倾向于使用语音输入,而在更安静的环境下,则倾向于使用手写笔或键盘。
这要求我们设计交互系统能够适应不同的交互方式,并根据环境需求切换。
2.移动设备现代移动设备如智能手机、平板电脑等具有高效的计算能力和大量的传感器,因此成为了人机交互的一个重要研究领域。
由于移动设备具有不断变化的屏幕大小和分辨率,同时存在可靠性、安全性等问题,因此在设计移动设备的人机交互界面时需要考虑到这些复杂性。
人机交互的优势与不足

人机交互的优势与不足
一、人机交互的优势:
1、高效性:人机交互可以显著提高工作效率。
通过自然语言处理和机器学习技术,计算机可以理解人类语言,并快速地执行任务,处理数据,解决问题。
2、精度:由于计算机的精确计算和数据处理能力,人机交互可以提供高精度的结果。
例如,在医疗领域,通过人机交互,医生可以更精确地诊断疾病,制定治疗方案。
3、可扩展性:人机交互系统可以随着技术的不断发展而持续扩展和优化。
例如,通过人工智能技术,可以不断改进人机交互系统的性能,提高其智能化程度。
4、安全性:人机交互系统可以提供更高级别的安全性。
例如,在金融领域,通过人脸识别、声纹识别等技术,可以确保交易的安全性。
二、人机交互的不足:
1、依赖性:人机交互系统需要依赖外部硬件和软件设备,如果这些设备出现故障或性能下降,会影响到人机交互系统的正常运行。
2、复杂性:人机交互系统的设计和实施往往比较复杂,需要专业的技术人员进行开发和维护。
同时,对于用户来说,学习和使用这些系统也需要一定的时间和精力。
3、数据隐私:人机交互系统需要处理大量的数据,这可能会涉及到用户的数据隐私问题。
如果数据没有得到妥善的保护和管理,可能会被泄露或滥用。
4、技术局限性:虽然人机交互技术在不断进步,但仍存在一些技术局限性。
例如,自然语言处理技术还无法完全理解和模拟人类的所有语言和情感,机器学习算法也还存在一些偏差和歧视等问题。
人机对话原理

人机对话原理人机对话是指人与计算机之间进行的对话交互。
人机对话系统通常是一个软件程序,通过自然语言处理技术,能够自动理解人类提出的问题,并给出相应的答案。
人机对话系统是基于人工智能技术的一种应用,其主要目的是让人类更加方便地获取所需信息。
人机对话系统通常涉及多种技术领域,包括语言学、计算机科学、人机交互、机器学习、智能推理等,其中最核心的技术是自然语言处理。
自然语言处理是指计算机对自然语言进行处理和分析的一种技术。
它涉及文本处理、语音识别、语义理解、机器翻译等多个方面。
在人机对话中,自然语言处理的主要作用是将人类提出的自然语言问题转化为计算机可理解和处理的计算机语言问题。
这通常涉及词法分析、语法分析、语义分析等过程。
人机对话系统还需要应用智能推理技术来解决一些复杂的问题。
智能推理是指根据已有的知识和规则,通过推理运算得出一些新的知识或结论的一种技术。
在人机对话中,智能推理的主要作用是通过人类提出的问题,结合已有的知识和规则,得出正确的答案或者提供相应的解决方案。
人机对话系统需要具备良好的人机交互能力。
人机交互是指人类和计算机之间的通信和交流方式。
在人机对话中,良好的人机交互能力可以让用户更加方便、自然地进行对话。
这通常需要包括语音识别、语音合成和图形化交互等多个方面的技术。
最后,人机对话系统还需要具备一定的学习能力。
学习能力是指系统通过对已有的数据进行学习和分析,不断优化自身的性能和能力。
在人机对话中,学习能力可以使系统逐渐积累更多的知识和经验,提高其对人类提出问题的理解和回答能力。
总的来说,人机对话系统需要综合运用多种技术,包括自然语言处理、智能推理、人机交互和学习能力等,以达到更加人性化、智能化、高效化的目的。
未来,随着人工智能技术的不断发展,人机对话系统将会得到越来越广泛的应用和推广。
人类与机器:人机交互研究

人类与机器:人机交互研究随着科技的发展,人类与机器之间的交互日益频繁,人机交互研究成为了当今社会的热点课题。
本文将从以下几个方面探讨人机交互研究的重要性和发展方向。
一、人机交互的定义与意义人机交互是指人类与计算机系统之间的相互作用和信息传递过程。
在这个过程中,计算机系统不仅需要具备良好的功能性,还要考虑到用户的心理需求和情感体验。
人机交互研究旨在提高计算机系统的易用性、可用性和满意度,以实现人与机器之间的高效协作。
二、人机交互的研究框架人机交互研究可以从多个层面展开,包括认知心理学、社会心理学、人类行为学等领域。
在此基础上,构建了一个双过程框架,即互动媒体效应(TIME)理论。
该理论涵盖了象征性效应和使能性效应两个方面,为研究人工智能驱动的媒体对用户感知和体验的影响提供了有益的指导。
三、人机交互的应用领域人机交互技术在众多领域得到了广泛应用,如智能制造、社会服务、医疗健康、教育等。
在这些领域中,协作机器人作为一种新型工业机器人,具有轻质、安全等特点,能够在共享空间中与人类交互或在人类附近安全工作。
协作机器人的研究重点包括控制性能、传感器技术、智能控制方法等。
四、人机交互面临的挑战与未来发展方向尽管人机交互技术取得了显著进展,但仍然面临着一些挑战,如隐私保护、技术透明度、人类对机器操作的控制等。
为了应对这些挑战,研究人员需关注以下几个方向:1.提高交互的自然性和智能化水平:通过模仿人类交流方式,使机器更加符合用户的心理预期,提高交互效果。
2.关注用户个性化需求:利用大数据和机器学习技术,为用户提供个性化的人机交互体验。
3.加强人机协作:研究人类意图识别、技能学习等方法,提高机器在协作任务中的表现。
4.跨学科研究:结合心理学、社会学、认知科学等多学科知识,深入探讨人机交互的内在机制。
总之,人机交互研究是一个充满挑战和机遇的领域。
随着科技的不断进步,相信人类与机器之间的交互将更加紧密,为我们的生活带来更多便利和惊喜。
人机交互的思考与实践

人机交互的思考与实践随着科技的不断发展,人类对于机器的使用越来越多。
而人机交互则成为了人们与机器沟通的重要方式。
人机交互技术的发展可以说是近年来科技领域的热门话题之一。
那么,在人机交互技术中,我们应该考虑哪些方面?又该如何进行实践呢?一、人机交互的理念人机交互不仅仅是硬件和软件技术,更是一种理念。
人机交互的目的是使得计算机和人类之间达成有效的沟通和交互,从而帮助人类更方便快捷地完成各种任务。
而这种交互不仅仅局限于计算机软硬件本身,还包括了更深层次的人机交互过程中的心理学和认知科学。
因此,我们在进行人机交互时,不仅仅应该考虑技术的实现,更应该考虑更深层次的使用和用户体验。
二、人机交互的设计原则一个好的人机交互系统应当符合以下几个设计原则:一是易于使用;二是提供有价值的信息;三是提供积极的反馈;四是允许用户控制。
一个符合这几个原则的人机交互系统,可以让用户使用时更加方便,更加愉悦。
易于使用是最重要的原则之一。
好的人机交互设计应是必须简单、易于操作,让用户可以轻松地明白它的使用方法。
提供有价值的信息是指应该向用户提供有关最新信息,避免过度使用其中的一些,甚至有危险的信息的干扰。
人机交互系统必须向用户清楚地展示所需的信息,并将重要的信息呈现在用户眼前,以便供用户直接进行操作。
良好的信息呈现应该能够清晰地展示输入,输出和处理数据的过程,用途和原理。
提供积极的反馈是指人机交互系统应该向用户提供及时、正面、实用的反馈,以便用户作出较准确的决策。
反馈包括肢体感觉,视觉等各种手段的正面反馈,而负面提示则是规避的关键。
允许用户控制是指要尊重用户对信息的自由选择,而不是过度地掌握应用中所有的通道和信息。
让用户可以自由地执行自己的任务,而不会被限制或被监督。
三、人机交互的实践人机交互的实践主要包括三个方面:设计、测试、评价。
在设计中,我们应该注重用户的体验,考虑他们的需求,使用场景和行为。
在测试时,要提前检查人机交互系统的可用性、易用性和覆盖率。
智能人机交互系统设计与实现

智能人机交互系统设计与实现随着人工智能技术的飞速发展,智能人机交互系统在日常生活中得到了越来越广泛的应用。
智能人机交互系统是一种基于人工智能、计算机视觉、自然语言处理、机器学习等技术的智能交互系统。
其主要目的是建立起人机之间自然而便捷的交互模式,实现人机之间的智能交互和合作。
本文将探讨智能人机交互系统的设计与实现。
一、智能人机交互系统的设计思路智能人机交互系统的设计,需从用户需求、系统架构、算法模型等方面全面考虑。
在设计思路上,应尽可能地满足用户的个性化需求,使得系统可以与用户进行自然而便捷的交互。
用户需求方面,需充分了解用户的痛点和需求,并结合用户使用场景,设计出符合用户期望的交互模式和界面。
例如,如何在智能音箱中实现人机对话、如何在智能家居中实现人机交互等。
系统架构方面,应采用分布式架构,将不同的功能模块进行分离,降低系统的耦合性。
在架构设计上,应注重系统的可扩展性和灵活性,便于后期的系统优化和升级。
算法模型方面,应采用多种机器学习算法和深度学习模型,完成用户语音识别、自然语言处理、机器翻译等一系列的智能功能。
二、智能人机交互系统的实现智能人机交互系统的实现,需要基于以上的设计思路,完成系统架构和模型算法的实现。
系统架构实现方面,应采用微服务架构,将不同的功能模块进行分离,实现服务的松耦合,便于系统的升级和扩展。
在架构实现上,可以采用Spring Boot、Spring Cloud等微服务技术。
在模型算法的实现上,应根据不同的智能功能,选择相应的机器学习算法和深度学习模型。
例如,在语音识别方面,可采用DeepSpeech模型;在自然语言处理方面,可采用BERT模型;在机器翻译方面,可采用Transformer模型。
同时,还需采用配套的数据集和算法库。
三、智能人机交互系统的应用场景智能人机交互系统的应用场景非常广泛,涵盖了家居、医疗、金融、教育等多个领域。
在家居领域,智能人机交互系统可以实现智能音箱、智能家居、智能电视等设备之间的协同工作和交互。
关于“人机对话”的点滴思考

教 海 探 航
关于“ 人机对话” 的点滴思考
秦 允 灵
( 州市铜 山大许 中心 中学, 徐 江苏省 2 1 2 ) 2 1 4 摘 要: 口语教学是一个长期积 累的过程 , 因此我们教师要以音标、 单词作 为起 点 , 创设轻松愉快 的学 习氛 围, 开展各种形 式活
动, 给学生提供说的机会 , 提高交际能力。 关键词 : 中英语 ; 人机对话 ; 口语教学 初 中图分类号 : 2 .3 G6 3 1 文献标识码 : A 文章编号 : 0 6 3 1 ( 0 0)0 0 3 0 1 1 0 — 3 5 2 1 1 - 3 - 0
英语是 门语言 , 是我们交流 的工具 , 因此 , 不仅 要学懂 , 而且 要会用 , 会表达 自己的思想 。 江苏省 2 0 0 9年 中考改革 , 采用人机 对话形 式考查 口语 与听力 , 使英语 教学更趋 于人性化 、 实用性 , 同时也体现 ቤተ መጻሕፍቲ ባይዱ对英语这一语言功能 的重视 ,改变 了以往哑 巴英 语 的学 习状况 , 促进 了语言的应用 , 也迫使教学方 式有了巨大 的 转变 。经过初三一年的教学 , 我对此颇有感触 , 其在 口语训练 尤 上更是感想甚多 。 口语教学是一个长期积累的过程 , 不是一朝一夕 的事情 , 我 们的母语 , 它是从一 出生就听 , 岁左右开始模 仿 , 由一个个 一 再 简单的发音逐渐形成了一句话 , 积累一定的词汇量 , 随后才能表 达 自己的思想。英语的学习应用 比其更难 , 作为第二语 言 , 缺乏 必要的学习环境和应用环境 ,因此我们教师必须从学 生的入门 抓起 , 且要常抓不懈。 而
一
生 生 互 动 进 行 探 索 et yu a o ̄&se… ?ol ̄& h ] h cud se… . w e  ̄&se a tn最 后 以话题 形式结 束 , 说说你 会 、 hn h w s e ? “ 不会 做的事 , 你将来能做到的事 ,整堂课充满了激情异常 活跃 , ” 同学 们竞相发言 , 展现 自己。
基于云计算的智能语音交互与人机对话系统设计

基于云计算的智能语音交互与人机对话系统设计智能语音交互与人机对话系统是一种基于云计算的先进技术,它能够实现人与机器之间的高效沟通与交互。
本文将对基于云计算的智能语音交互与人机对话系统的设计进行探讨,并介绍其应用场景以及未来发展方向。
在设计智能语音交互与人机对话系统时,首先需要考虑的是语音识别技术。
语音识别技术是实现语音交流的基础,它能够将用户的语音输入转化为可理解的文本。
当前,基于云计算的语音识别技术已经取得了显著的进展,通过使用大数据和深度学习算法,系统可以准确地将用户的语音转化为文本,实现语音交互的自然性和高效性。
其次,对话管理是智能语音交互与人机对话系统设计的关键环节。
对话管理涉及到系统如何理解用户的意图和生成合适的回应。
基于云计算的系统可以通过分析大规模的语料库和对话数据,学习用户的习惯和行为模式,从而更好地理解用户的意图。
同时,系统还可以通过自然语言处理和机器学习的技术,生成恰当的回应,提供与人类对话类似的体验。
在实现智能语音交互与人机对话系统时,云计算技术起到了重要的作用。
云计算技术能够提供强大的计算和存储资源,能够支持系统处理大量的语音和文本数据。
同时,通过云计算,系统可以实现分布式处理和协同工作,提高系统的可靠性和可扩展性。
基于云计算的智能语音交互与人机对话系统在许多领域都有着广泛的应用。
在智能家居领域,用户可以通过语音与家居设备进行交互,实现智能控制和远程操控。
在智能助理领域,用户可以通过语音与助理进行对话,获取信息、执行任务等。
在智能客服领域,用户可以通过语音与机器人客服进行交流,获得即时的帮助和解答。
未来,基于云计算的智能语音交互与人机对话系统有着广阔的发展前景。
随着人工智能和深度学习技术的不断进步,系统将能够更准确地理解用户的意图和情感,进一步提升对话体验的自然度和人性化。
同时,云计算技术的发展也将为系统提供更强大的计算和存储能力,从而支持更复杂和智能化的对话应用。
在面对任务名称中提到的基于云计算的智能语音交互与人机对话系统设计时,我们可以借鉴当前的相关研究和应用案例,结合语音识别、对话管理和云计算等技术,设计一个具有高准确率和优质用户体验的智能语音交互系统。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于人机对话系统的思考作者:王小捷来源:《中兴通讯技术》2017年第04期摘要:提出了一系列非常重要、影响人机对话质量的问题,包括:如何面向自然语言理解(NLU)构建对话任务分析、深度推理,如何利用语言学尤其是互动语言学研究成果构建对话管理(DM),如何有效建模人机对话中不同任务间的关联约束来发展联合模型等。
认为尽管人机对话系统的基础模型已取得了长足进步,但如果不能有效地解决上述问题,就不可能获得高质量的人机对话系统,自然语言处理的水平也就难以得到实质性提升。
关键词:人机对话系统;NLU;DM;自然语言生成(NLG)人类社会的一个主要特征是人际交流,广泛深入的人际交流是促进合作,推动社会向前发展的重要动力。
人际交流的主要工具是包括汉语、英语在内的各种自然语言,基于自然语言的对话是人际交流的主要方式之一。
基于自然语言的对话也称为会话,可以是在两人之间进行,也可以在多人之间进行。
此外,自说自话的独白也常被语言学家归入会话。
近年来,随着技术日新月异的发展,各种人造机器成为人类的亲密伙伴,人与机器的交流变得越来越重要。
为了与机器交流,让机器明白人类需要它们做什么,人类发明了很多种机器语言。
开始,这些机器语言只是少数人使用,随着机器进入到普通人的日常社会生活,就需要机器能与普通人进行交流,发明越来越简单的机器语言或操作方式是一个途径,而让机器能懂得人类语言无疑是一个更自然、更令人向往的方式。
人机对话系统旨在实现这种方式,满足普通人与机器进行顺畅交互的需求。
人机对话系统经历了50多年的发展,取得了不少的进展,目前更是面临巨大的发展机遇。
如何抓住机遇,促成人机对话系统的进一步发展,是每位研究者都需要认真思考的问题。
1 人机对话系统简述20世纪60年代,Weizenbaum创建了ELIZA对话系统[1],试图模仿心理治疗师与人进行对话交流;90年代,Seneff 等人开发了自动机票预订系统(ATIS)[2],通过与用户进行多轮对话来获取用户需求(如出发地、出发日期、航班号等),以帮助用户预订机票。
这两个系统分别代表了两类不同的对话系统,后者属于目标驱动型对话,前者属于非目标驱动型对话。
目标驱动型人机对话系统通过与用户进行多轮基于自然语言的对话来逐步收集与目标相关的信息,辅助用户成功获得某种服务。
与ATIS系统类似的还有电信服务系统HMIHY[3]、天气信息查询系统JUPITER[4]、旅行计划制定系统DARPA Communicator[5]等。
目标驱动型的人机对话系统也称为面向任务的人机对话系统。
而以ELIZA系统为代表的非目标驱动型人机对话系统通常只是对用户输入进行基于自然语言的响应,而不完成特定信息服务任务,类似于闲聊似的对话,所以也称为聊天机器人。
与目标驱动型系统相比,这类系统对收集信息、自主确定对话行为等方面的要求都较弱。
一个典型的任务驱动型人机对话系统的技术模块如图1所示[6],系统主要包含自然语言理解(NLU)、对话管理(DM)、自然语言生成(NLG)3个部分。
用户输入可以是语音,也可以是文本,如果是语音,则NLU部分包含语音识别模块;而系统输出为语音时,NLG部分还需包含语音合成模块。
NLU部分进一步又分解为3个子任务:其一是领域识别,判定用户谈论的是什么领域的事情;其二是意图识别,识别用户话语的目的,比如是告知某个信息,还是确认某个信息;其三是语义分析,又称为槽填充,旨在标识用户话语中与目标有关的语义类别,比如预订机票时需要的出发地、目的地、时间等语义类别。
DM则进一步分解为对话状态追踪和动作选择两个子任务;对话状态追踪获取对话的当前状态;动作选择确定系统响应的动作。
DM模块负责控制整个对话过程,例如:决定系统在上一轮对话中获取了用户出发地信息之后,下一步该和用户说什么。
NLG模块则把决定要说什么具体转化为自然语言,通常也进一步分解为几个子任务。
非目标驱动的对话系统大致按此结构,但是大多没有显式的意图识别、语义标注等NLU 过程,也没有显式的DM。
在实际应用中,目标驱动与非目标驱动的划分也并不是绝对的,常常会需要目标驱动和非目标驱动混合出现。
比如:目前的个人助理系统Apple Siri、Microsoft Cortana等,有时可能要与用户闲聊,这时是非目标驱动的,有时可能要帮助用户订票,这时是目标驱动的。
这一系统框架经历了一系列的发展,其中的各个技术部分也在飞速发展中[7-9]。
2 自然语言理解人机对话系统中NLU的主要目标是识别输入话语的领域和意图,获得任务相关的语义信息。
例如:在订机票时,客户说“订1张5月10号去北京的票”,其领域是“航班信息服务”,意图是“订票”,与订票任务相关的语义信息包括作为“订票数量”的“1张”、作为“起飞时间”的“5月10号”,以及作为“目的地”的“北京”。
订票数量、起飞时间和目的地称为槽,句子中提供的这些槽的具体值称为槽值。
如何准确地进行领域、意图和槽值的识别或标注是当前针对人机对话的NLU研究中得到关注最多的方面。
近年来人们不断设计新的模型和算法来提升语言理解的性能[9],而另一个研究重点是当面对的对话任务发生变化时,如何快速准确地将模型推广到新的对话领域中,即模型的跨领域适应问题。
然而,笔者认为,目前的语言理解中还存在1个问题没有得到应有的重视,即:如何为NLU模块设定目标。
从前面的例子可以看到,目前的语言理解对于给定的用户输入通过分析获得什么信息都是基于对话任务而确定的。
比如:NLU算法只会在句子中去标注订票数量、起飞时间和目的地等槽的槽值,而不会去标注“运动类型”等无关的信息。
但是对话系统如何能知道它只应该去关注这些信息,而不应关注其他信息呢?目前的方法是完全由人预先基于对话任务来确定语言理解的目标,再基于这些目标来训练模型。
这种方法需要预先对任务有完整的分析,建立关于任务的完整意图和槽的体系。
这类似于软件工程中在构建一个软件时需要完整的需求分析一样。
对于软件工程,有一套需求分析技术,而对于人机对话系统,目前还并没有这样的任务分析技术,一般的人机对话系统的任务分析还停留在经验阶段,这给人机对话系统的普及带来了困难。
进一步,在目前的NLU中,对于语言的理解还停留在比较浅的层次。
例如:在槽标注时,大多数模型还只能在语言表层进行标注,在复杂情况下结合推理进行深入理解的能力还较弱或者基本没有。
例如,客户说“订一张端午节后一天的票,如果那天预报有大雾的话就往后推一天。
”这时简单地在语言表层标注时间槽已经不太可能,需要结合其他信息并通过推理得到正确的槽值。
语言推理不仅需要对语言本体的理解,其背后还需要更为丰富的关于现实世界对象、事件及其关系的知识进行支撑,并且有的知识是显式的,而有些知识是隐式的。
例如,上一句中的“端午节”“下雨”等是现实世界中的对象和事件,其中,端午节具体是哪一天可以直接查询获得。
但是其中还含有简介的、隐式的推理知识,比如在上句中人可能会依据如下的隐含逻辑去理解说话人:如果有大雾的话,飞机可能不能按时起飞,客户大概不希望延误,所以决定在这种情况下推迟一天,推迟的目的是为了等一个好天气。
如果知道存在这样一个隐含的推理,那么作为好的客服人员,可能就要再问客户:如果后一天还报有大雾怎么办?这类知识以及要基于这类知识进行的推理将导致对语言的理解更为复杂和困难。
3 对话管理DM追踪对话状态,并基于此决定系统的响应动作。
对话状态追踪和动作选择的研究已得到了广泛关注,取得了大量进展。
这些研究一方面由DM计算模型的发展所带来[79],例如,从马尔科夫决策过程(MDP)到部分可观马尔科夫决策过程(POMDP),从Q-Learning算法到深度Q网络(DQN);另一方面也离不开对语言学研究成果的有效借鉴,毕竟人机对话是希望建模人人对话,只有对人类对话的本质有了更深刻的理解,才有可能在人机对话的研究中取得相应的进展。
这方面,已有的借鉴包括会话分析研究中话轮、相邻对等概念,它们已成为目前计算模型的建模单元,此外,言语动作等语用学的概念也已成为DM的决策目标。
但是,更多、更深入的语言学研究成果还没能在计算模型中得到有效体现。
如格莱斯的对话合作原则、礼貌原则等还很少进入计算模型的考量范围。
近20年来,一些新兴的关于语言的理论也还几乎没有进入计算语言学家的视野,其中就包括笔者认为对于对话建模和DM具有重要借鉴价值的互动语言学。
互动语言学[10]考察和研究日常真实人类互动过程中的语言使用情况,探讨语言结构及其运用模式与互动交流是如何相互影响的,为互动参与者在真实、情景化的日常交往中完成互动与交流提供理论解释和支持。
互动语言学者从功能语言学、会话分析的成果以及对真实对话数据的研究出发,对传统的语言学有直接的批评。
传统的以乔姆斯基生成语言学为代表的语言学者认为以语言能力为基础的语言结构的理想形式是语言学研究的对象,语言行为是语言能力在具体使用情景中的实现。
互动语言学者则认为,语言的结构和意义是在情景互动过程中产生,并随互动的发展不断变化,是说话者和接受者共同协商的产物。
例如:形式语言学将句子这一语言单位作为单个说话者语言能力的产物;而互动语言学者则认为,句子的生成是说话者和接受者在交际过程中互动的产物,它不仅与说话者有关,还关系到接受者,因为说话者在互动中往往需要根据接受者的反应调整话语[11] 。
这种语言结构和意义可以基于互动而不断进行建构的观点如果能用于DM,帮助构建更好的对话结构,进行更好的对话言语行为决策,将是十分有价值的。
至于如何借鉴,则还需要深入了解互动语言学的相关成果,同时综合考虑在当前科学与技术发展水平下,构建其数学模型和计算模型的可行性。
笔者在此仅举一个可能的例子:交互语言学认为语言结构是在语言交互中通过互动而产生的,那么一个好的对话行为决策所基于的对话语言分析和理解可能不应仅局限在一个说话人话轮中进行。
在对话中,将对话双方的邻接话轮,即相邻对,作为一个分析单元可能更为可取。
目前的模型是可以基于多轮对话信息来进行对话行为选择。
但是,通常只是简单地拼接对话历史,而没有考虑对话历史中的结构信息。
而如果以相邻对为基础单元,在计算模型上可以构建关于对话的层次结构,有利于建模对话的语言结构,从而为对话行为提供更准确的决策信息。
4 系统构建传统上,一般采用分而治之的方式实现如图1所示的人机对话系统。
即:先分别构建NLU、DM和NLG等模块,这些子模块通常还要分解为更小的子任务分别建模,之后按序将这些模块连接起来。
这种方案的优势是简洁清楚,各部分的任务明确,可以分别开展研究,各自解决各自的问题。
但是这种研究方案的问题也很明显。
首先,各个子任务分别研究导致难以建模子任务之间的关联约束信息,而有时这种关联约束信息是非常有价值的。