机器人语音交互系统的设计

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

机器人语音交互系统的设计

作者:赵邦宇

来源:《电子技术与软件工程》2018年第15期

摘要

随着科学技术的发展和计算机研究力度的不断增大,人机语言通信技术成为目前最受关注的一项关键技术,随着语音技术研究力度的增强和快速发展,其对人们的日常生活还有计算机发展都产生了一定的影响作用,同时因为语音技术而研发出的各种产品也广泛应用到各个领域当中,例如军事监控、电话交换、信息网络查询、语音拨号系统、语音通信系统、家庭服务以及信息检索等等,可以说已经渗入到每一个行业当中。该项技术也可以很好地促进人机交互之间的自然友好关系,是未来人机交互领域的主要发展方向。

【关键词】机器人语音交互系统研究设计

1 智能机器人语音交互系统设计

我国当前对机器人语音交互系统的主要研究内容集中在对单独使用电脑相关硬件或者软件的语音交互载体,目前已经实现了语音交互的有效控制,但是在实际应用过程中仍然还是存在一定的局限性,只是能够满足已经下载好的几个系统功能,想要实现进一步扩展就存在一定的障碍。以下将对智能机器人语音控制系统最为例子对离线语音的识别以及云在线语音识别两项内容进行一定的分析和研究。

在计算机各种类型当中,RaspberryPI是一种新型的种类,其具有很好的音频和视频处理功能,这种类型的计算机配备了ARM的微型电脑主板,SD/MicroSD卡内存硬盘,4.14个USB接口,802.11nWi-Fi,一个10/100以太网接口,蓝牙还有网线和鼠标等,并且实现了HDMI高清视频输出接口和视频模拟信号的电视输出接口的同步拥有。和其他的单片机相比较而言,其具有一套非常完整的操作系统,而且自身携带有接口,可以利用相应的程序编程来实现对各种软件的有效应用。利用联网就可以实现对云开放识别技术和简单开关的智能语音交互,进一步实现对语音交互各种软件和硬件的有效控制,同时还有效实现了在线和离线的有效结合。

在具体操作过程中主要分为以下几个步骤:

(1)利用互联网语音识别、离线语音识别以及云开放语音识别等多个接口的有效连接对外界的语音信息还有一些比较简单的动作信息进行有效的采集,并将其传送到主板上进行一定的处理;

(2)经过处理之后的信息输出之后,利用简单的开关和扬声器对这些信息做出一定的反馈和互动,然后再次利用开关设备和联网连接实现对无线开关的有效控制。2离线语音识别

在离线语音识别系统当中主要采用的语音识别模块,另外还采用了Raspberry控制板一定的架构方案,并利用LD3320语音识别模块对语音进行有效的识别。在具体操作过程中可以利用相关的软件系统对关键字信息进行有效的识别。在工作过程中,该模块通常情况下只要捕捉到一些语音信息就会及时发出相应的字节,然后可以Raspberry嵌入控制面板来获取相应的字节来对其做出反应,例如可以让语音模块来播放相应的声音或者是做出相应的动作,以此来对机器人语音识别功能进行有效的体现,离线语音识别系统的框架如图2所示。

3 云在线语音识别

云在线语音识别一般情况下都是利用百度识别系统、百度云语音合成还有云聊天机器人三个主要的系统共同所组成。在机器人和人之前进行语音交互的过程中,机器人首先会利用麦克风对语音交互相关信息进行采集,然后利用PyAudio对其进行组件操作,同时也就提供了Python语言,最后在利用Python程序对其进行视频和音频的播放,并利用互联网将这些识别之后的文件传输到百度语音服务器上。

百度云语音服务器在对这些文件进行有效的识别之后,就可以将其转换成相应的文本形式,然后再次利用互联网将其发送到智能机器人的相关模块。这种百度云语音识别系统在使用过程中具有以下的特点:整个平添都采用的RESTAPI,而且为开发者提供了语音模型和顶级声学模型,这种模型可以适用于任何一个平台对语音的识别和控制,就我国目前的情况来看已经达到了35个左右的理解和定制,更好地满足用户的实际需求。

文本别有效的识别之后,就可以利用互联网将其发送到云在线聊天机器人,智能机器人就可以充分结合其前后语境对文本的内容进行很好地识别,然后在整个数据库当中找到与之最为相匹配的资料。图灵机器人是现如今最为高端的一种机器人大脑,在全球都是一种非常领先的计算和认知平台,其对中文语句的意思理解几乎可以达到90%以上的准确率,不但可以实现对中文语义和自然语言的分析和理解,而且还可以实现智能深度问答服务。在接受到云在线聊天机器人的问题之后,就可以及时在百度云语音系统当中搜索到与之相适应的文本数据或者是语音数据,然后以语音的格式发送给智能机器人,智能机器人就可以对这些语音进行播放。

总而言之,语音识别其实就是机器人利用自身的硬件或者是软件系统对所接受的信息进行有效的处理之后形成相应的语音或者是文件的一种高级技术,经过几十年的发展之后,证明其具有很大的潜在市场,在人机交互实现过程中体现出十分重要的意义,是网络时代最为方便的一种交流工具。本文主要对机器人交互语音交互系统进行了一定的分析和研究。

参考文献

[1]陈天雪.论我国智能语音机器人专利保护[D].广西师范大学,2016.

相关文档
最新文档