一种嵌入式语音识别模块的设计与实现

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

嵌入式系统结业（论文）

基于STM32的嵌入式

语音识别模块设计

学生姓名：

所在学院：信息技术学院

班级：电气

学号：

中国·大庆

2013 年12 月

摘要：介绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARM Cortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心，通过以LD3320芯片为核心的硬件单元实现语音识别功能，采用嵌入式操作系统μC/OS-II来实现统一的任务调度和外围设备管理。经过大量的实验数据验证，本文设计的语音识别模块具有高实时性、高识别率、高稳定性的优点。

关键词：ARM；语音识别；对话管理；LD3320；μC/OS-II

1 引言

服务机器人以服务为目的，因此人们需要一种更方便、更自然、更加人性化的方式与机器人交互，而不再满足于复杂的键盘和按钮操作。基于听觉的人机交互是该领域的一个重要发展方向。目前主流的语音识别技术是基于统计模式。然而，由于统计模型训练算法复杂，运算量大，一般由工控机、PC机或笔记本来完成，这无疑限制了它的运用。嵌入式语音交互已成为目前研究的热门课题。

嵌入式语音识别系统和PC机的语音识别系统相比，虽然其运算速度和内存容量有一定限制，但它具有体积小、功耗低、可靠性高、投入小、安装灵活等优点，特别适用于智能家居、机器人及消费电子等领域。

2 模块整体方案及架构

现有的语音识别技术按照识别对象可以分为特定人识别和非特定人识别。特定人识别是指识别对象为专门的人，非特定人识别是指识别对象是针对大多数用户，一般需要采集多个人的语音进行录音和训练，经过学习，达到较高的识别率。

基于现有技术开发嵌入式语音交互系统，目前主要有两种方式：一种是直接在嵌入式处理器中调用语音开发包；另一种是嵌入式处理器外围扩展语音芯片。第一种方法程序量大，计算复杂，需要占用大量的处理器资源，开发周期长；第二种方法相对简单，只需要关注语音芯片的接口部分与微处理器相连，结构简单，搭建方便，微处理器的计算负担大大降低，增强了可靠性，缩短了开发周期。

语音识别技术在国内外的发展十分迅速。目前国内在PC应用领域，具有代表性的有：科大讯飞的InterReco2.0、中科模式识别的Pattek ASR3.0、捷通华声的jASRv5.5；在嵌入式应用领域，具有代表性的有：凌阳的SPCE061A、ICRoute的LD332X、上海华镇电子的WS-117。

本文的语音识别方案是以嵌入式微处理器为核心，外围加非特定人语音识别芯片及相关电路构成。语音识别芯片选用ICRoute公司的LD33 20芯片。

3 硬件电路设计

3.1 语音识别电路

图3为语音识别部分原理图，参照了ICRoute发布的LD3320数据手册进行设计。LD3320的内部集成了快速稳定的优化算法，不需外接Fla-sh、RAM，不需要用户事先训练和录音而完成非特定人语音识别，识别准确率高。

图3 语音识别部分原理图

图中，LD3320采用并行方式直接与STM32F103C8T6相接，均采用1kΩ电阻上拉，A0用于判断是数据段还是地址段；控制信号，复位信号以及中断返回信号INTB与STM32F103C8T6直接相连，采用10kΩ电阻上拉，辅助系统稳定工作；和STM32F103C8T6采用同一个外部8 MHz时钟；发光二极管D1、D2用于复位后的上电指示；MBS(引脚12)作为麦克风偏置，接了一个RC电路，保证能输出一个浮动电压给麦克风。

3.2主控制器电路

本文的主控制器选用的是ST公司的STM32F103C8T6芯片。该芯片基于ARM Cottex-M3 32位的RISC内核，工作频率最高可达72 MHz，内置高速存储器（64 KB的闪存和20 KB的SRAM），丰富的增强I／O端口和联接到两条APB总线的外设。STM32系列提供了全新的32位产品选项，结合了高性能、实时、低功耗、低电压等特性，同时保持了高集成度和易于开发的优势，将32位MCU世界的性能和功效引向一个新的级别。

4 软件系统设计

软件系统的设计主要包括3部分：主控单元的嵌入式操作系统μC／OS-II移植、LD3320的语音识别程序设计、对话管理单元的设计。

4.1 嵌入式操作系统μC／OS-II移植

4.2 语音识别程序设计

语音识别程序的设计，参考了LD332X开发手册，本文中采用中断方式工作，其工作流程分为通用初始化一语音识别用初始化-写入识别列表-开始识别-响应中断。

4.3 对话管理单元设计

5 结语

本文讨论了基于STM32的嵌入式语音识别模块的设计和实现，对模块各个组成单元的硬件电路及软件实现进行了详细的介绍。大量实验及实际应用表明，本文设计的语音识别模块具有稳定性好、语音识别率高、抗噪声干扰能力强、结构简单和使用方便等特点。该模块实用性强，可广泛应用于服务机器人智能空间、智能家居和消费电子产品等多个领域。

参考文献

[1] 徐方,张希伟,杜振军.我国家庭服务机器人产业发展现状调研报告[J].机器人技术与应用,2009(2):14-19

[2] 孙艺红,刘媛.服务机器人语音交互解决方案[J].控制工程, 2004,11(2):184-186.

[3]柳春.语音识别技术研究进展[J].甘肃科技2008,24(5):41-45.

[4]陈景帅.智能空间下语音交互系统的研究与实现[D].济南:山东大学,2010.

[5]STM32F103x8/B增强型系列中容量产品数据手[EB/ OL].(200904)[201009].http://www. /stonline/mcu/MCU_Pages.htm.

[6]ICRoute.LD332X数据手册[EB/OL].[20100310].

/web_cn/DownLoad.html