设计和实现一个嵌入式自动语音识别

设计和实现一个嵌入式自动语音识别
设计和实现一个嵌入式自动语音识别

设计和实现一个嵌入式自动语音识别

系统

sujay Phadke Rhishikesh Limaye亚洲时报Siddharth维尔马

Kavitha Subramanian

孟买印度技术研究所

电机工程学系

个人所得税孟买Powai,孟买,400076,印度。

{sujay,rhishi,亚洲时报Siddharth kavitha}@ ee.iitb.ac.in

摘要

我们提出了一个新的嵌入式语音识别系统的设计。它结合了硬件和软件设计等方面实现依赖扬声器,孤立词,小词汇量语音识别系统。是基于规模的修正Mel频率倒谱系数(MFCC)特征提取和模板匹配采用动态时间规整(DTW)的。一种新的算法已经被用来改善一个字开始检测。围绕行业标准TMS320LF2407A的DSP硬件。作为一个通用的DSP24X系列的TI DSP 开发板电路板设计。据载,除了从DSP,外部SRAM,闪存,ADC接口的I / O接口模块和JTAG 接口。无论是硬件和软件已设计的同时,最小功率最大精度和便携式设备,以便实现高速识别。建议的解决方案是一个低成本,高性能,可伸缩的替代现有的其他产品。

1.介绍

语音识别一直是一个活跃的研究领域多年。随着超大规模集成电路技术,高性的

编译器的进步,它已成为可能纳入这些算法在硬件。在过去的几年中,各系统已开发,以满足各种应用。有许多的ASIC解决方案,提供小型,高性能系统。然而,这些患有低的灵活性和较长的设计周期。一个完整的基于软件的解决方案是为桌面应用程序的吸引力,但未能提供一个便携式,嵌入式解决方案。高端的公司如TI,ADI公司的数字信号处理器(DSP)的,提供一个理想的平台,在硬件的开发和测试算法。 C编译器,模拟器和调试器之类的先进的软件工具提供了一种简单的方法,优化算法和减少市场的时间。然而,为了获得最大的优势,硬件和软件都必须设计在手。语音识别是任何扬声器独立或依赖[1]。独立扬声器模式涉及提取讲话是在口语中所固有的那些特点。这一类的算法一般比较复杂,并利用统计模型和语言模型。另一方面,扬声器依赖模式涉及讲话中提取用户特定的功能。必须为每个用户创建一个词提取系数的模板进行匹配,以确定口语。此外,使用孤立的单词,而不是一个复杂连续的话,有助于提高准确性承认。我们的工作涉及扬声器依赖性,孤立词语音识别系统的发展。该系统是能够认识到口语词,从10-15字的模板。它具有较高的识别精度和适度抑制比。本文组织如下。第二节处理软件的一部分。它解释了背后的梅尔倒频谱系数提取和动态时间规整技术,应用的基础上形成的理论。第三节介绍了定制硬件开发此应用程序设计有关的各种问题。 C代码的DSP平台的软件优化和移植在第四节进行了讨论。结果和比较在部分解释五,最后,我们的结论第六节系统的应用潜力。

2。软件

本节介绍软件方面使用的语音识别引擎。 MFCC的理论是解释其实施。还提出了由作

者开发的一种新的开始检测和错一个字抑制算法。它的结论与动态规整(DTW),确认使用的模板匹配算法。

2.1。特征提取 - 梅尔规模的频率倒谱系数(MFCC)

特征提取涉及确定的共振峰在讲话中,代表扬声器的声道的变化。使用,即有许多方法。线性预测编码(LPC)规模的梅尔频率倒谱系数(MFCC),线性预测倒谱系数(LPCC的),反射系数(RCS)。其中,MFCC特征已被发现是在背景噪音的存在更强大,比其他算法[2]。此外,它提供了最佳的性能及尺寸要求(内存)之间的权衡。MFCC的有效性的首要原因是,模型的解析日志上规模的频率人耳的非线性听觉反应[3]。线性频率Mel频率映射的定义,

要捕捉有益的听觉频率内容,speechsignal最好是通过一个过滤器重叠的三角形过滤器,叫做梅尔过滤银行组成的银行。这些滤波器的中心频率对梅尔规模,线性间隔和带宽都是平等的。梅尔规模往往近似线性规模for__千赫和对数。因此,我们得到银行梅尔过滤器下面的近似

DFT域指数K在哪里,是带宽和C是在大小滤波器的中心频率。给予输入

信号帧的能量系数:

这些能量系数的大小的对数是考虑强度和响度的对数关系。这些日志的能量系数

这样获得,然后通过使用反DCT正交(IDCT)[3]。由此产生的参数被称为规模的梅尔频率倒谱系数(MFCC)。数学,这是如下:

我们使用16个滤波器(M= 16)和L= 15,这是每帧输入信号的系数最终夺取数量。

2.2。实施MFCC的

描绘图的特征提取的软件实现。 1。进一步解释说,在下面的文本中的每个步骤。

2.2.1。抽样检验。 8 kHz采样频率是足够的人力讲话。这个频率给出了125 _s

之间连续两个样本的窗口。因此可以做到实时处理的一个相当大的一部分。更高的频率会缩小这个窗口,也将要求更大的内存和更高的处理时间。为0.5秒的时间的话,在8

KHz的样本数为4000。与每个样本存储为16位值,它相当于约8 KB的存储空间。

2.2.2。开始检测。是不平凡的话语背景噪音的存在开始检测。有两个问题 - (i)

避免背景声音,和(二)准确把握单词的第一个音节引发的错误检测。这里提出一种新的计划,这是能够有效地解决这两个问题。该计划不断提取音频采样和保持了过去,在每一个时间点样品的滑动窗口。窗口的大小,是一家集设计参数。该计划采用基于滑动窗口的下面两个标准。

1。能源 - 运行窗口的能量含量平均保持不变。被视为公认的话语开始,这个平

均必须超过一个阈值,这是设置背景噪音。是一个可定制的参数,并可以调整套件

个别扬声器的特性。

2。零交叉 - 实证,它被发现,有极少数的噪音过零比正常讲话。这实际上是利用加强检测过程。类似的能源,在滑动窗口的输入信号的零口岸数量应该超过一个阈值,这是由预定的实验。这一标准有助于准确,即使它的能量含量是不充分履行能源标准检测单词的第一个音节。上述标准的组合导致一个简单而强大的开始计划,这是实现实时检测。噪声能量计算,平均频率进行系统启动,并定期

每当系统在空闲模式(即没有话语开始检测时)。因此阈值噪声环境的变化动态调整。

话语开始检测后,在滑动windowand的样品字缓冲存储在随后的样品。我们固定的时间为0.5秒,其中最典型的话足够的存储样本。理想的情况下,应该有一个最终的检测机制以及。但它是很难有一个准确的,因果的最终检测方案。在随后的文字中,我们提出我们自己的非因果的最终检测方案。

2.2.3。预处理。首先,输入信号的幅度正常化,以消除不同强度的效果。在更高的频率讲话的光谱特性制服的关系,以较低的频率。为了加强其在提取参数的重量,我们应用预加重滤波器是一阶高通滤波器描述:

2.2.4。清音的拒绝。虽然上述计划是非常有效的丢弃的背景声音,某些随机的声音(例如 - 点击,啁啾,空气吹)有足够的能量,也满足了startdetection标准。然而,这样的声音可以区分添加一些更多的检查。字缓冲区上执行这些检查。

结束检测 - 这是一种新型的,非因果关系的确定单词的末尾的技术。它基本上运行时间startdetection,算法落后,从字缓冲区年底开始。这种技术精确地修剪字缓冲区结束对沉默的一部分,决定了这个词的确切长度。如果长度是太小了,然后这个词被视为无效。这消除了单一的点击。过度沉默 - 字缓冲区划分成一组帧,每一帧的平均能量含量计算。如果一个框架的显着部分,具有相对较低的能量,那么它表明,它是由狭隘的孤立峰的声音 - 没

有一个有效的单词的特点。这消除了多次点击。

过多的能量 - 同样,如果帧的重要部分,具有较高的能量,那么它代表连续未调制的声音(例如 - 麦克或机械振动吹)。因此,这个词被宣告无效。同样重要的是限制幅度最大,以避免在后续加工的溢出错误。麦克的灵敏度进行调整,使正常的讲话没有给这个错误。上述的定性条件,实施定量参数的值进行调整,使正常讲话而被淘汰不需要的声音传递着。

2.2.5。取景和窗口。分为语音输入的重叠帧的数量 - 每一个大小为256 - 汉明窗函数,如下所述,通过对每一帧的最小化和纠察,围栏效果。

2.2.6. FFT的。在每一帧,我们将256磅的FFT[4]。该算法运行就地对内存的要求,从而节约。这转换成其帧帧DFT存储字。

2.2.7.梅尔过滤银行中的应用。在每一帧,梅尔过滤器银行申请在2.1节讨论。 IDCT 的是使用逆FFT算法[4]。我们得到的,每个20帧,一套15 MFC的系数。

2.3.模板匹配 - 动态时间规整

口语单词的特征提取后,我们得到了一个明智的框架序列的特征向量。下一步就是比较它与当前用户存储的模板集。我们使用一个普遍使用的技术称为动态时间规整(DTW)[5]。这是一个“扭曲”的时间轴检测给定两个序列之间的最佳匹配的技术。

对于口语,S表示帧的系数。对比和模板S字开始计算距离矩阵,其中每个条目给出一个大小为本地S,S字开始计算距离矩阵,其中每个条目给出一个大小为本地,

因此,当地的距离是话语的框架和模板字框相应的系数之间的矢量距离。然后,我们通过当地的距离矩阵中找到最小翘曲路径。相应的翘曲成本给DTW两个序列之间的距离[6]。有效地利用动态规划,有下列复发翘曲成本最低可以发现:

其中,是累积的距离,是距离。因此,DTW距离计算之间的口语和每个模板的话。采取正确的匹配模板字的最小距离,如果其距离小于预定的阈值。

3。硬件

软件上实现了TI的TMS320LF2407A的DSP周围建造了定制设计的电路板。本节介绍了硬件设计重要的设计考虑,这是实现最高的效率。

3.1。处理器

中央处理器TMS320LF2407A [7]定点DSP TMS320C2000平台的一部分。它提供了低成本,低功耗,高性能的处理能力增强TMS320x DSP的C2XX核心CPU的建筑设计。已集成多种先进的外设提供一个真正的单芯片DSP控制器。 TMS320LF2407A的之间的代码兼容的C24x DSP 控制器家族,提供最高的处理

性能(40 MIPS)和外设集成度更高。 JTAG兼容的基于扫描的仿真提供非侵入性的实时编程和调试能力。

高端的DSP像TI 6X家庭的使用是不必要的因为(i)的应用程序并不需要高处理能力,及(ii)系统的总成本保持最低。高端处理器将需要复杂的硬件和先进的印刷电路板制造技术。由于所有这些因素,TMS320LF2407A的是为我们的应用程序的理想选择。

3.2。记忆

TMS320LF2407A的采用哈佛架构与64K16个字中的每个程序,数据,I / O空间。处理器,内部有32K的闪存程序存储器,544字寄存器银行和2K字RAM。启用时,这片上存储器片内存空间占用。该板采用较低,在较低的程序空间和数据空间上的32K字的32K字外部的64K16的SRAM。 SRAM的方案领域可替代内部闪存程序。这是特别方便,代码开发和测试期间,在一次又一次燃烧内部FLASH是多余的。数据区的SRAMprovides一般数据存储器。董事会也有外部的16闪光64K,32k字被配置为在上层的程序空间。这提供了一个扩展到处理器的内部程序闪存。外置闪光灯也可以作为通用非易失性存储(例如 - 用户模板存储)。 Atmel的FLASH选择,具有便捷的可编程,小部门的规模和内置擦除 - 写

序列。片上存储器和外部SRAM的组合,FLASH的程序和数据存储器空间,最大限度地利用。从而使板适合一般用途的发展。

3.3。模拟到数字转换器(ADC)

TMS320LF2407A的有一个内置,高性能,10位模拟数字转换器(ADC),与最小转换时间为375 ns的。我们测试了不同的分辨率传入的原始样品识别精度。它被发现了9位A / D 提供足够的识别精度,没有任何不利影响的量化误差。音频信号的信号完整性问题的解决分离的模拟和数字电路板设计网。

3.4。电源管理电路

TMS320LF2407A的是与3.3 _主电源电压的低功耗芯片。一个单独的5 _供应isneeded 内部闪存编程。该板采用来自TI的两个低压降稳压器从外部9获得稳定的3.35。他们有1 _的电流容量。板上的双主管监控的电源电压保持电压的保真度。板resetted每当任何电源电压低于他们的预期值的98%。内存芯片工作在3.3。为了方便

接口用于与外部TTL外设,双向电平转换器(3.3-5)。

4。软件优化

使用TI C编译器的代码开发和测试。除了编译器优化,以达到最大的性能,多种技术用于在代码设计。这些解释在本节。

4.1。硬件API

处理硬件方面如数据采集,中断管理,和其他的外围控制代码被设计成隐藏这些细节,从主要算法,

从而使设计更加模块化。 API包含了一些实用功能和宏。

4.2。内存管理和变量分配

片上存储器的TMS320LF2407A的允许全速执行,但它是在规模较小。外部存储器提供更大的规模,但可能会降低性能。使用内部存储器,也降低了功耗。因此,变量有适当分配,根据他们的访问频率和规模的要求。C环境下的访问,这是在每个函数调用栈,是最访问的存储器的一部分。因此,它被保存在内部RAM。也可用于分配的堆栈局部变量功能,从而避免堆栈溢出,大型阵列保持全球。便签变量,例如: - 循环指数,都保存在内部寄存器

银行。大阵列,例如 - 字的缓冲区,必须保持在外部SRAM。但对于每帧中提取系数,帧首先被复制到内部RAM和该框架运行在整个提取过程。也在内部存储功能,为整个单词的最后一组。由于FFT需要使用三角函数,查找表,维持。表的大小是温和的,因为我们只需要一些特定的值。梅尔过滤器银行也存储静态尽管它可以分析计算。产生的内存开销以及补偿的性能提升。大田对比功能包括嵌套循环和内存访问非常频繁。因此,大田之间的口语和模板字开始前,模板字的功能复制到内部RAM。

4.3。使用整数数据类型

TMS320LF2407A的是最适合于16位的整数运算。因此,在整个数据流是适应工作的整数。在所有的地方,避免溢出精度没有影响。在错误变得不可接受的地方,用于浮点运算库。原始样本被缩小到8位,以避免溢出

在256点整数的FFT。三角查找表,滤波器也适当缩减。

4.4。功能,堆栈,堆

为了减少函数调用的开销,大部分功能被折叠成一个单一的功能。由于C环境使用的堆栈空间来存储返回值和指针,这种优化削减执行时间。静态数组的使用消除了需要大量的动态内存分配,从而切断对

堆的大小。

5。结果与比较

这里的技术提供的孤立词语音识别精度高。梅尔cepstrumbased技术大大提高了简单的能量为基础的方法。这是显示在图。 2,显示的字与模板的话,每年的“两会”的距离。距离在energybased方法,是不容易区分,因此,它是在这种情况下,难以接受阈值。的情况下ofMel为基础的技术,是一个尖锐的differencebetween“两化”与“两化”的模板,并与他人的距离。因此很容易在这种情况下,设置的门槛。我们这个系统的性能测试的用户用不同的词集的大型游泳池。男性和女性受试者使用的话被选为是在频域分离。(词,如“轻”“可能”,“视线”,只在第一个音节不同,不太好区分)。实验结果表明,常用词,如英语的数字 - “一”,“二”,“三化”),或像“光”,“扇区”,“管”等字尽量给予优异的成绩有关识别精度。

6。结论与应用

本文讨论了一种低成本,强大的嵌入式语音识别系统的实施。讨论的算法是高效,可扩展的内存,并提供足够的识别精度。开发定制的DSP板是一种力量,高效,灵活的设计,也可以用来作为一种通用的原型板。巧妙启动检测技术和优化的语音识别算法可以很容易地移植到各种嵌入式平台。系统的一些典型应用如下 - 为伤残人士提供一个语音功能的互动装置。低成本的声音,使住户的开关。单位安装到汽车,飞机可以作为语音激活接口。这种设计可以进一步改善,无论在硬件以及软件的水平。更快的DSP与浮点运算能力,扩展的内存寻址空间和音频编解码器(内置ADC)将增加系统的性能方面的速度和准确性。在软件方面,一些先进的算法存在,其中有一个更好的识别精度和废品率,同时还支持连续时间识别。其中最常见的是使用隐马尔可夫模型(HMMs),基于音素的语音模型和语言模型的算法。然而,这些都非常适合非常大的数据库(50000字以上),并要求精心培训。他们是在硬件上的要求更高,需要使用高端DSP

平台。

参考文献

[1] LR Rabiner和BH庄,语音基础第1版,SER。普伦蒂斯霍尔信号处理

系列。徒弟厅专业技术参考,4月1993年。

[2],戴维斯和P. Mermelstein,“比较的参数为单音节词识别的陈述在不断发言的句子“,硕士论文。声学,语音信号处理,第一卷。4,第

357-366,1980。

[3]。Combrinck和E.博塔,“关于规模的梅尔倒谱”电气与电子工程部门,

比勒陀利亚大学。

[4] WH出版社,BP弗兰纳里,SA Teukolsky,和WTvetterling,在C的数值方法 - 科学的艺术计算,第二版。剑桥大学出版社,1993年2月。

[5] M.布朗和L. Rabiner,“动态时间规整基于排列图的孤立词识别搜索技术,在国际机场。 CONF。上音乐器,语音,信号处理,ICASSP'82,第一卷。 1982年5月7日,第1255年至1258年。

[6] EJ基奥和MJ Pazzani,“衍生动态时间扭曲,“部门信息与计算机科学,加州大学欧文分校。

[7] TMS320LF2407A的DSP控制器数据(SPRS145I),德州仪器,2000年7月,修订2003年9月。 [在线]。可供选择:HTTP:/ / https://www.360docs.net/doc/925717873.html,/lit/ds/symlink/tms320lf2407a.pdf

一种嵌入式语音识别模块的设计与实现

嵌入式系统结业(论文) 基于STM32的嵌入式 语音识别模块设计 学生姓名: 所在学院:信息技术学院 班级:电气 学号: 中国·大庆 2013 年12 月

摘要:介绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARM Cortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320芯片为核心的硬件单元实现语音识别功能,采用嵌入式操作系统μC/OS-II来实现统一的任务调度和外围设备管理。经过大量的实验数据验证,本文设计的语音识别模块具有高实时性、高识别率、高稳定性的优点。 关键词:ARM;语音识别;对话管理;LD3320;μC/OS-II 1 引言 服务机器人以服务为目的,因此人们需要一种更方便、更自然、更加人性化的方式与机器人交互,而不再满足于复杂的键盘和按钮操作。基于听觉的人机交互是该领域的一个重要发展方向。目前主流的语音识别技术是基于统计模式。然而,由于统计模型训练算法复杂,运算量大,一般由工控机、PC机或笔记本来完成,这无疑限制了它的运用。嵌入式语音交互已成为目前研究的热门课题。 嵌入式语音识别系统和PC机的语音识别系统相比,虽然其运算速度和内存容量有一定限制,但它具有体积小、功耗低、可靠性高、投入小、安装灵活等优点,特别适用于智能家居、机器人及消费电子等领域。 2 模块整体方案及架构

现有的语音识别技术按照识别对象可以分为特定人识别和非特定人识别。特定人识别是指识别对象为专门的人,非特定人识别是指识别对象是针对大多数用户,一般需要采集多个人的语音进行录音和训练,经过学习,达到较高的识别率。 基于现有技术开发嵌入式语音交互系统,目前主要有两种方式:一种是直接在嵌入式处理器中调用语音开发包;另一种是嵌入式处理器外围扩展语音芯片。第一种方法程序量大,计算复杂,需要占用大量的处理器资源,开发周期长;第二种方法相对简单,只需要关注语音芯片的接口部分与微处理器相连,结构简单,搭建方便,微处理器的计算负担大大降低,增强了可靠性,缩短了开发周期。 语音识别技术在国内外的发展十分迅速。目前国内在PC应用领域,具有代表性的有:科大讯飞的InterReco2.0、中科模式识别的Pattek ASR3.0、捷通华声的jASRv5.5;在嵌入式应用领域,具有代表性的有:凌阳的SPCE061A、ICRoute的LD332X、上海华镇电子的WS-117。 本文的语音识别方案是以嵌入式微处理器为核心,外围加非特定人语音识别芯片及相关电路构成。语音识别芯片选用ICRoute公司的LD33 20芯片。 3 硬件电路设计 3.1 语音识别电路 图3为语音识别部分原理图,参照了ICRoute发布的LD3320数据手册进行设计。LD3320的内部集成了快速稳定的优化算法,不需外接Fla-sh、RAM,不需要用户事先训练和录音而完成非特定人语音识别,识别准确率高。

语音识别输入系统

IBM语音识别输入系统(ViaVioce) V9.1 简体中文光盘版| 用嘴巴控制电脑... sjyhsyj 2009-8-28 12:13:271# 软件大小:276.08MB 软件语言:多国语言 软件类别:国外软件 / 汉字输入 运行环境:Win9x/NT/2000/XP/ 软件介绍: 该系统可用于声控打字和语音导航。只要对着微机讲话,不用敲键盘即可打汉字,每分钟可输入150个汉字,是键盘输入的两倍,是普通手写输入的六倍。该系统识别率可达95%以上。并配备了高性能的麦克风,使用便利,特别适合于起草文稿、撰写文章、和准备教案,是文职人员、作家和教育工作者的良好助手。 IBM潜心研究26年,他领导了世界的语音识别技术,其语音识别产品在全球销售已达一百万套以上。使用语音输入方式,您的工作空间更加自由舒畅: *即使您不会打字,也可迅速准备好文稿; *只要集中精力思考问题,无须琢磨怎样拼音,怎样拆字; *当您疲劳时,闭上眼、伸伸腰,双手方在脑后,然后轻松地说:开始听写吧... ... 注:价值超数千元的IBM的中文语音录入工具,有耳麦的朋友可以试一试,也可以当作学习普通话的工具,没有理由不下载使用它。 IBM ViaVoice语音输入系统详解 作者: 艾寒出处: 天极网 目前汉字输入的方式主要有四种:键盘输入,手写输入,扫描输入和我们现在要谈到的语音输入。让我们先来了解一下这四种输入方式。 键盘输入:键盘输入基本上是基于各种输入法,主要又分为字形输入法和拼音输入法。实际上字形输入法是不符合人的写作思维习惯,因为人们在措辞时,头脑中首先反映出的是即将这个词语的语音,所以字形输入法更适合专业录入人员使用。拼音输入法也分两种,一种以词语为输入单位,另一种以语句为输入单位,而后者不符合写作的思维习惯,因为人们在写作时是以词为思考单位。键盘输入法在输入速度有要求的情况下对于键盘操作、指法要求比较高; 手写输入:手写输入是最容易上手的输入方法,但是同样由于手写输入的先天不足,很难达到较高的输入速度; 扫描输入:扫描输入对于硬件要求比较高,主要是适用于资料的整理; 语音输入:语音输入对输入人员的键盘操作能力、指法要求很低,几乎可以说你只要会说汉语,就可以进行语音输入。 语音输入尤其是汉字语音输入经历了很长时间的研究和应用,到目前已经达到了一个相

嵌入式实时操作系统

嵌入式实时操作系统 嵌入式实时操作系统(Embedded Real-time Operation System,RTOS)。 1 嵌入式实时操作系统概念 当外界事件或数据产生时,能够接受并以足够快的速度予以处理,其处理的结果又能在规定的时间之内来控制生产过程或对处理系统作出快速响应,并控制所有实时任务协调一致运行的嵌入式操作系统。 2 嵌入式实时操作系统特点 1)多任务; 2)有线程优先级 3)多种中断级别 3 嵌入式实时操作系统应用 在工业控制、军事设备、航空航天等领域对系统的响应时间有苛刻的要求,这就需要使用实时系统。 采用嵌入式实时操作系统(简称RTOS)能够支持多任务,使得程序开发更加容易,便于维护,同时能够提高系统的稳定性和可靠性。

4 实时操作系统的必要性: 首先,嵌入式实时操作系统提高了系统的可靠性。 其次,提高了开发效率,缩短了开发周期。 实时操作系统的优缺点: 在嵌入式实时操作系统环境下开发实时应用程序使程序的设计和扩展变得容易,不需要大的改动就可以增加新的功能。通过将应用程序分割成若干独立的任务模块,使应用程序的设计过程大为简化;而且对实时性要求苛刻的事件都得到了快速、可靠的处理。通过有效的系统服务,嵌入式实时操作系统使得系统资源得到更好的利用。但是,使用嵌入式实时操作系统还需要额外的ROM/RAM 开销,2~5% 的CPU 额外负荷,以及内核的费用。 5 实时系统与非实时系统的根本区别 实时系统与非实时系统的根本区别在于:实时系统具有与外部环境及时交互作用的能力。也就是说实时系统从外部获取信息以及系统得出结论要在很短的限制时间内完成。 它具有嵌入式软件共有的可裁剪、低资源占用、低功耗等特点;实时任务之间可能还会有一些复杂的关联和同步关系,如执行顺序限制、共享资源的互斥访问要求等。 实时操作系统所遵循的最重要的设计原则是:采用各种算法和策略,始终保证系统行为的可预测性(predictability)。可预测性是指在系统运行的任何时刻,在任何情况下,实时操作系统的资源调配策略都能为争夺资源(包括CPU、内存、网络带宽等)的多个实时任务合理地分配资源,使每个实时任务的实时性要求都能得到满足。与通用操作系统不同,实时操作系统注重的不是系统的平均表现,而是要求每个实时任务在最坏情况下都要满足其实时性要求,也就是说,实时操作系统注重的是个体表现。

PCM嵌入式软件概要设计V1.0

分布式能源箱变测控装置规约转换模块项目软件(系统/概要)设计说明书 项目令号: 承担部门:微网所 编制:亮 E-mail/Tel: 审核: 会审: 批准:

国电自动化股份

软件系统/概要设计文档修改记录

摘要 本文对分布式能源箱变测控装置规约转换模块(简称规约转换模块,PCM)的嵌入式软件的总体架构设计进行描述。PCM配套的配置工具主要牵涉到数据库设计和界面设计,不包含在本文档的叙述围。 PCM以数据采集、转发为核心功能,嵌入式软件在架构设计上采用了数据中心模式。为保证数据转发效率,采用共享存方式的实时数据库设计。 为减小系统模块的耦合,给系统扩展留有足够空间,系统采用多进程方式独立实现各子功能。各子功能模块通过进程访问接口(PAI)进行通信,通信方式包括信号量和共享存两种。 为提高软件的兼容性,系统设计了硬件抽象层(HAL)模块和数据库访问接口(DAI)模块,将硬件平台和数据库的操作进行了统一封装。 为提高系统的稳定性,设计了守护进程模块。守护进程通过信号量握手来监控实时数据库进程、通信规约进程等其他进程的运行状况,可以在被监视的进程发生异常时对其及时修复。

目录 第1篇概述 (3) 1.1 围 (3) 1.2 设计依据 (3) 1.3 术语、定义和缩略语 (3) 1.3.1 术语、定义 (3) 1.3.2 缩略语 (4) 第2篇系统总体设计 (4) 2.1 体系结构概述 (4) 2.2 系统体系结构 (5) 2.3 标准化设计 (6) 2.3.1 模块标准化设计 (6) 2.3.2 接口标准化设计 (6) 2.3.3 界面格式 (6) 2.3.4 编码约定 (7) 2.3.5 注释约定 (7) 2.4 系统版本规划 (8) 2.5 系统处理流程 (9) 2.6 子系统说明 (10) 2.6.1 实时数据库RDB (10) 2.6.2 历史数据库HDB (10) 2.6.3 通信规约模块 (11) 2.6.4 辅助模块 (11) 2.6.5 守护进程模块 (11) 2.6.6 网关模块 (12) 2.7 系统数据结构设计 (12) 2.7.1 逻辑结构设计要点 (12) 2.7.2 物理结构设计要点 (12) 2.7.3 数据与子系统关系 (12) 2.8 开发和运行环境 (12) 2.8.1 硬件环境 (12) 2.8.2 软件环境 (13) 2.8.3 外购件分析 (13) 2.9 可靠性设计 (13) 2.10 可测试性设计 (13) 2.11 安全性设计 (14) 2.12 出错处理设计 (14) 2.13 设计依据与需求跟踪 (14) 第3篇系统运行说明 (15) 3.1 配置说明 (16) 3.2 系统应用方式 (16) 3.3 代码目录说明 (16)

基于STM32的嵌入式语音识别模块设计实现

基于STM32的嵌入式语音识别模块设计实现 介绍了一种以ARM 为核心的嵌入式语音识别模块的设计与实现。模块的 核心处理单元选用ST 公司的基于ARM Cortex-M3 内核的32 位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320 芯片为核心的硬件单元实现语音识别功能,采用嵌入式操作系统μC/OS-II 来实现统一的任务调度和外围设备管理。经过大量的实验数据验证,本文设计的语音识别模块具有高实时性、高识别率、高稳定性的优点。 服务机器人以服务为目的,因此人们需要一种更方便、更自然、更加人性化的方式与机器人交互,而不再满足于复杂的键盘和按钮操作。基于听觉的人机交互是该领域的一个重要发展方向。目前主流的语音识别技术是基于统计模式。然而,由于统计模型训练算法复杂,运算量大,一般由工控机、PC 机或笔记 本来完成,这无疑限制了它的运用。嵌入式语音交互已成为目前研究的热门课题。 嵌入式语音识别系统和PC 机的语音识别系统相比,虽然其运算速度和内存容量有一定限制,但它具有体积小、功耗低、可靠性高、投入小、安装灵活等优点,特别适用于智能家居、机器人及消费电子等领域。 模块整体方案及架构 语音识别的基本原理如图1 所示。语音识别包括两个阶段:训练和识别。不管是训练还是识别,都必须对输入语音预处理和特征提取。训练阶段所做的具体工作是通过用户输入若干次训练语音,经过预处理和特征提取后得到特征矢量参数,最后通过特征建模达到建立训练语音的参考模型库的目的。而识别阶段所做的主要工作是将输入语音的特征矢量参数和参考模型库中的参考模型进行相似性度量比较,然后把相似性最高的输入特征矢量作为识别结果输出。这

基于单片机的语音识别系统 毕业设计

基于单片机的语音识别系统毕业设计 目录 摘要..................................... 错误!未定义书签。Abstract ................................. 错误!未定义书签。目录..................................................... I 前言.. (1) 1 方案介绍及设计简介 (2) 1.1小车的控制要求及设计方案 (2) 1.1.1小车的控制要求 (2) 1.1.2方案设计与论证 (2) 1.2SPCE061A 简介 (3) 1.2.1SPCE061A单片机概述 (5) 1.2.2SPCE061A的介绍 (7) 1.2.3SPCE061A的结构 (7) 1.3SPCE061A 单片机强大的语音功能 (7) 1.3.1语音识别的原理 (8) 1.3.2系统的结构框图 (9) 1.4语音控制小车设计要求 (10) 1.4.1功能要求 (10) 1.4.2语音控制小车的主要功能 (10) 1.4.3参数说明 (10) 1.4.4注意事项 (10) 2电路设计及程序设计 (11) 2.1电路设计基础知识 (11) 2.2电路方框图及说明 (13) 2.3各部分电路设计 (13) 2.3.1电机的选择 (14)

2.3.2继电器驱动电路的设计 (14) 2.3.3行驶状态控制电路设计 (15) 2.3.4麦克录音输入及AGC电路 (16) 2.3.5语音播报电路 (18) 3软件设计 (19) 3.1软件流程图及设计思路说明 (19) 3.1.1程序设计 (20) 3.2模块设计 (20) 3.2.1中断流程图部分 (20) 3.2.2语音识别部分 (22) 4连接和操作说明 (25) 4.1硬件模块连接图 (25) 4.1.1功能说明 (25) 4.1.2代码下载 (26) 4.1.3训练小车 (27) 4.1.4声控小车 (28) 4.1.5重新训练 (28) 总结 (30) 致谢 (31) 参考文献 (32) 附件1 系统程序说明 (33)

嵌入式软件开发流程图

嵌入式软件开发流程 一、嵌入式软件开发流程 1.1 嵌入式系统开发概述 由嵌入式系统本身的特性所影响,嵌入式系统开发与通用系统的开发有很大的区别。嵌入式系统的开发主要分为系统总体开发、嵌入式硬件开发和嵌入式软件开发3大部分,其总体流程图如图1.1所示。 图1.1 嵌入式系统开发流程图 在系统总体开发中,由于嵌入式系统与硬件依赖非常紧密,往往某些需求只能通过特定的硬件才能实现,因此需要进行处理器选型,以更好地满足产品的需求。另外,对于有些硬件和软件都可以实现的功能,就需要在成本和性能上做出抉择。往往通过硬件实现会增加产品的成本,但能大大提高产品的性能和可靠性。 再次,开发环境的选择对于嵌入式系统的开发也有很大的影响。这里的开发环境包括嵌入式操作系统的选择以及开发工具的选择等。比如,对开发成本和进度限制较大的产品可以选择嵌入式Linux,对实时性要求非常高的产品可以选择Vxworks等。

1.2 嵌入式软件开发概述 嵌入式软件开发总体流程为图4.15中“软件设计实现”部分所示,它同通用计算机软件开发一样,分为需求分析、软件概要设计、软件详细设计、软件实现和软件测试。其中嵌入式软件需求分析与硬件的需求分析合二为一,故没有分开画出。 由于在嵌入式软件开发的工具非常多,为了更好地帮助读者选择开发工具,下面首先对嵌入式软件开发过程中所使用的工具做一简单归纳。 嵌入式软件的开发工具根据不同的开发过程而划分,比如在需求分析阶段,可以选择IBM的Rational Rose等软件,而在程序开发阶段可以采用CodeWarrior(下面要介绍的ADS 的一个工具)等,在调试阶段所用的Multi-ICE等。同时,不同的嵌入式操作系统往往会有配套的开发工具,比如Vxworks有集成开发环境Tornado,WindowsCE的集成开发环境WindowsCE Platform等。此外,不同的处理器可能还有对应的开发工具,比如ARM的常用集成开发工具ADS、IAR和RealView等。在这里,大多数软件都有比较高的使用费用,但也可以大大加快产品的开发进度,用户可以根据需求自行选择。图4.16是嵌入式开发的不同阶段的常用软件。 图1.2 嵌入式开发不同阶段的常用软件 嵌入式系统的软件开发与通常软件开发的区别主要在于软件实现部分,其中又可以分为编译和调试两部分,下面分别对这两部分进行讲解。 1.交叉编译 嵌入式软件开发所采用的编译为交叉编译。所谓交叉编译就是在一个平台上生成可以在另一个平台上执行的代码。在第3章中已经提到,编译的最主要的工作就在将程序转化成运行该程序的CPU所能识别的机器代码,由于不同的体系结构有不同的指令系统。因此,不同的CPU需要有相应的编译器,而交叉编译就如同翻译一样,把相同的程序代码翻译成不同CPU的对应可执行二进制文件。要注意的是,编译器本身也是程序,也要在与之对应的某一个CPU平台上运行。嵌入式系统交叉编译环境如图4.17所示。

基于STM32单片机的嵌入式语音识别系统设计

基于STM32单片机的嵌入式语音识别系统设计 陈心灵1,钱宁博2,胡佳辉1,王战中1 (1.石家庄铁道大学机械工程学院,河北石家庄050043;2.石家庄铁道大学电气与电子工程学院,河北石家庄 050043) 摘要:设计了一款以STM32F103为核心的自然语言识别系统,为满足实时语音识别系统对内存资源和运算速度的要求,基于硬件资源合理 设计语音处理算法,在嵌入式平台上实现了对孤立词语的语音识别。首先根据背景噪声和语音信号的时域特征差异设定相应门限值,从而实现了对语音信号的端点检测。然后针对语音识别中传统梅尔倒谱系数对语音的高频信息敏感度较低,对语音信号分别提取梅尔倒谱系数(MFCC)与翻转梅尔倒谱系数(IMFCC),结合Fisher 准则构造混合特征参数。最后采用动态时间规整算法实现语音识别。因系统体积小、便携性好等特点,易于实现对不同设备的语音控制,有一定的市场前景。关键词:语音识别;梅尔倒谱系数;翻转梅尔倒谱系数;Fisher 准则;动态时间规整算法;STM32F103 中图分类号:TP391.4 文献标识码:A 文章编号:1009-9492(2019)06-0135-03 Embedded Speech Recognition System Design Based on STM32F103 CHEN Xin-ling 1,QIAN Ning-bo 2,HU Jia-hui 1,WANG Zhan-zhong 1 (1.College of Mechanical Engineering ,Shijiazhuang Tiedao University ,Shijiazhuang 050043,China ; 2.College of Electrical and Electronic Engineering ,Shijiazhuang Tiedao University ,Shijiazhuang 050043,China ) Abstract:A natural language recognition system is designed based on STM32F103.To meet the requirements of real-time speech recognition system for memory resources and computing speed ,the speech processing algorithm is designed based on hardware resources and speech recognition of isolated words is implemented on the embedded platform.Firstly ,the corresponding threshold is set according to the time domain characteristic difference of the speech signal and the background noise and thereby realizing the endpoint detection of the speech signal.Concerning the traditional Mel Frequency Cepstral Coefficient (MFCC)in speech recognition is less sensitive to high frequency signals of speech ,MFCC and IMFCC (Inverted MFCC)are extracted respectively for the speech signal and the Fisher criterion is used to construct the mixed feature parameters.Dynamic time warping algorithm is used in speech recognition process.Due to the small size of the system and good portability ,it is easy to implement voice control for different devices and has much marker potential. Key words:speech recognition ;MFCC ;IMFCC ;Fisher criterion ;DTW ;STM32F103 收稿日期:2018-12-22 DOI:10.3969/j.issn.1009-9492.2019.06.045 0引言 语音识别是人机交互很重要的模块,应用领域相当广阔。集成电路的快速发展使得将具有先进功能的语音识别系统固化到更加微小的芯片或模块上成为可能[1],更便于语音识别系统的推广与使用,嵌入式语音识别技术开发变得更加有价值。 本文设计一个基于STM32F103单片机的嵌入式语音识别系统,包括硬件设计和软件设计 [2-3] 。语音特征提取在传 统梅尔倒谱系数基础上,运用Fisher 比结合梅尔倒谱系数与翻转梅尔倒谱系数,构建了混合特征参数[4],识别算法采用动态时间规整算法。硬件设计上实现了语音信号采集、语音信号处理、语音信息存储、语音识别结果的显示等功能。 1系统硬件设计 本系统主要由电源部分(LDO )、主控(STM32F103)、语音采样电路、LCD 显示模块等组成,如图1所示。 1.1MCU 选择 STM32F103开发板基于Cortex-M3处理器,内置2个 12位模数转换器,2个DMA 控制器,共12个DMA 通道,其可以满足本系统中的语音处理需求。1.2采样电路 采样电路选用差分放大电路,抑制共模干扰,放大有用信号,有效地解决采样噪声硬件预处理的问题。其原理图如图2。 在设计过程中,其输出端(即Q1\Q2的C 极)静态工作点为1/2Vcc 最为适宜,能保障其最大动态输出范围。电路设计尽可能使Q1、Q2的静态工作参数一致,构成对 称电路。 图1系统硬件框图 Fig.1The system hardware block diagram · ·135

嵌入式控制系统平时作业

1、什么是嵌入式系统? 答:嵌入式系统(Embedded system),是一种“完全嵌入受控器件内部,为特定应用而设计的专用计算机系统”,根据英国电气工程师协会(U.K. Institution of Electrical Engineer)的定义,嵌入式系统为控制、监视或辅助设备、机器或用于工厂运作的设备。与个人计算机这样的通用计算机系统不同,嵌入式系统通常执行的是带有特定要求的预先定义的任务。由于嵌入式系统只针对一项特殊的任务,设计人员能够对它进行优化,减小尺寸降低成本。嵌入式系统通常进行大量生产,所以单个的成本节约,能够随着产量进行成百上千的放大。 2、举例说明嵌入式的应用。 答: 工业控制 基于嵌入式芯片的工业自动化设备将获得长足的发展,目前已经有大量的8、16、32 位嵌入式微控制器在应用中,网络化是提高生产效率和产品质量、减少人力资源主要途径,如工业过程控制、数字机床、电力系统、电网安全、电网设备监测、石油化工系统。就传统的工业控制产品而言,低端型采用的往往是8位单片机。但是随着技术的发展,32位、64位的处理器逐渐成为工业控制设备的核心,在未来几年内必将获得长足的发展。 交通管理 在车辆导航、流量控制、信息监测与汽车服务方面,嵌入式系统技术已经获得了广泛的应用,内嵌GPS模块,GSM模块的移动定位终端已经在各种运输行业获得了成功的使用。目前GPS设备已经从尖端产品进入了普通百姓的家庭,只需要几千元,就可以随时随地找到你的位置。

信息家电 这将称为嵌入式系统最大的应用领域,冰箱、空调等的网络化、智能化将引领人们的生活步入一个崭新的空间。即使你不在家里,也可以通过电话线、网络进行远程控制。在这些设备中,嵌入式系统将大有用武之地。 家庭智能管理 水、电、煤气表的远程自动抄表,安全防火、防盗系统,其中嵌有的专用控制芯片将代替传统的人工检查,并实现更高,更准确和更安全的性能。目前在服务领域,如远程点菜器等已经体现了嵌入式系统的优势。 POS网络 公共交通无接触智能卡(Contactless Smartcard, CSC)发行系统,公共电话卡发行系统,自动售货机,各种智能ATM终端将全面走入人们的生活,到时手持一卡就可以行遍天下。 环境工程 水文资料实时监测,防洪体系及水土质量监测、堤坝安全,地震监测网,实时气象信息网,水源和空气污染监测。在很多环境恶劣,地况复杂的地区,嵌入式系统将实现无人监测。 3、嵌入式操作系统的作用是什么? 答:嵌入式操作系统的主要好处就是屏蔽了底层硬件的差别,给上层应用提供统一的接口,并管理进程调度和资源(如CPU时间、内存)分配等。就跟windows操作系统一样,不管你是用华硕的电脑还是戴尔的电脑,只要装了windows操作系统,你都可以用office、词霸之类的软件。人机界面(MMI)是上层应用show出来的。 简单的嵌入式应用不需要嵌入式操作系统的支持,如单片机,直接用汇编程序就能实现特定的功能。要跑的应用多了,就需要操作系统来进行管理。

语音识别基本知识及单元模块方案设计

语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 1语音识别的基本原理 语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元,它的基本结构如下图所示: 未知语音经过话筒变换成电信号后加在识别系统的输入端,首先经过预处理,再根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义,通过查表就可以给出计算机的识别结果。显然,这种最优的结果与特征的选择、语音模型的好坏、模板是否准确都有直接的关系。2语音识别的方法 目前具有代表性的语音识别方法主要有动态时间规整技术(DTW)、隐马尔可夫模型(HMM)、矢量量化(VQ)、人工神经网络(ANN)、支持向量机(SVM)等方法。 动态时间规整算法(Dynamic Time Warping,DTW)是在非特定人语音识别中一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别技术中出现较早、较常用的一种算法。在应用DTW算法进行语音识别时,就是将已经预处理和分帧过的语音测试信号和参考语音模板进行比较以获取他们之间的相似度,按照某种距离测度得出两模板间的相似程度并选择最佳路径。 隐马尔可夫模型(HMM)是语音信号处理中的一种统计模型,是由Markov链演变来的,所以它是基于参数模型的统计识别方法。由于其模式库是通过反复训练形成的与训练输出信号吻合概率最大的最佳模型参数而不是预先储存好的模式样本,且其识别过程中运用待识别语音序列与HMM参数之间的似然概率达到最大值所对应的最佳状态序列作为识别输出,因此是较理想的语音识别模型。 矢量量化(Vector Quantization)是一种重要的信号压缩方法。与HMM相比,矢量量化主要适用于小词汇量、孤立词的语音识别中。其过程是将若干个语音信号波形或特征参数的标量数据组成一个矢量在多维空间进行整体量化。把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替。矢量量化器的设计就是从大量信号样本中训练出好的码书,从实际效果出发寻找到好的失真测度定义公式,设计出最佳的矢量量化系统,用最少的搜索和计算失真的运算量实现最大可能的平均信噪比。在实际的应用过程中,人们还研究了多种降低复杂度的方法,包括无记忆的矢量量化、有记忆的矢量量化和模糊矢量量化方法。 人工神经网络(ANN)是20世纪80年代末期提出的一种新的语音识别方法。其本质上是一

用于智能家居语音识别系统设计

仪器科学与电气工程学院 本科毕业论文(设计)开题报告题目:用于智能家居的语音识别系统设计 学生姓名:学号: 专业:电气工程及其自动化 指导教师:讲师 2015年1月3日

1. 选题依据 1.1选题背景 语言作为人类信息交流中最重要的和最方便的方式,人与机器的交流能否像人与人一样自如,是人们研究的问题。控制论创始人维纳在1950年就曾指出:“通常,我们把语言仅仅看作人与人之间的通信手段,但是,要使人向机器,机器向人以及机器向机器讲话,那也是完全办得到的”。 随着现代科学技术的进一步发展和人民生活水平不断的提高,人们对家庭住宅需求的概念也发生了彻底的改变。人们正在从以往追求房屋空间的宽阔和装饰的亮丽、豪华,向着追求品味、安全、舒适、便捷和智能方向发展。现在的家庭不仅要满足人们生活、工作、娱乐和交流的需要,同时还可以提供充分的安全防护、物业管理等手段。智能家居是建筑艺术、生活理念与信息技术、电子技术等现代高科技手段完美结合的产物,它的出现满足了人们对住宅高性能、智能化的要求21世纪信息时代的到来,IT产业的发展和人们生活水平的提高,“智能家居”、“家庭自动化”、“网络家电”、“家庭网络”等技术的推动,智能家居的生活已经近在咫尺。 在智能家居中传统的家用电器的控制,无外乎两种控制方式:手动或遥控。随着家用电器的增多,开关和遥控越来越多,使用极不方便。这时,我们可以釆用语音识别的方式控制,例如,在观看电视频道时,我们可以很方便地直接说出“中央一套”来,所以语音识别及控制在智能家居中尤其重要。 1.2国内外研究现况 1、语音识别技术的发展 就技术而言,目前国内外对语音识别理论及各种实用算法的研究是一热点。人们普遍关心的问题是不断提高语音识别的识别率、识别更多的词汇量、扩大语音识别的应用等研究。语音识别技术发展到今天,PC 机的语音识别系统己经趋于成熟,而且还出现了一些具有实用价值和市场语音识别前景的语音识别芯片。近几年来,个人消费类电子产品的广泛使用,使大量的识别系统从实验室 PC 平台转移到嵌入式平台设备中,现在嵌入式对特定人语音识别系统的识别精度己经达到 98%以上。嵌入式语音识别系统和 PC 机的语音识别系统相比,虽然其运算速度和内存容量有一些限制,但是它也有各自的特点。嵌入式系统体积小、可靠性高、耗电低、投入小、便于移动等优点,是嵌入式语音识别系统和 PC 机的语音识别系统相比的最大优势。而且嵌入式语音识别系统多为实时系统,当用户讲话后,系统能够立即完成词条识别并作出反应。这些特点决定了嵌入式语音识别系统的应用十分广泛。可以预测在近几年内,嵌入式语音识别系统的应用将更加广泛。各种语音识别系统将出现在市场上。根据美国专家预测,具有语音识别功能的产品可达 50 亿美元。在短期内还不可能具

嵌入式Linux应用软件开发流程

从软件工程的角度来说,嵌入式应用软件也有一定的生命周期,如要进行需求分析、系统设计、代码编写、调试和维护等工作,软件工程的许多理论对它也是适用的。 但和其他通用软件相比,它的开发有许多独特之处: ·在需求分析时,必须考虑硬件性能的影响,具体功能必须考虑由何种硬件实现。 ·在系统设计阶段,重点考虑的是任务的划分及其接口,而不是模块的划分。模块划分则放在了任务的设计阶段。 ·在调试时采用交叉调试方式。 ·软件调试完毕固化到嵌入式系统中后,它的后期维护工作较少。 下面主要介绍分析和设计阶段的步骤与原则: 1、需求分析 对需求加以分析产生需求说明,需求说明过程给出系统功能需求,它包括:·系统所有实现的功能 ·系统的输入、输出 ·系统的外部接口需求(如用户界面) ·它的性能以及诸如文件/数据库安全等其他要求 在实时系统中,常用状态变迁图来描述系统。在设计状态图时,应对系统运行过程进行详细考虑,尽量在状态图中列出所有系统状态,包括许多用户无需知道的内部状态,对许多异常也应有相应处理。 此外,应清楚地说明人机接口,即操作员与系统间地相互作用。对于比较复杂地系统,形成一本操作手册是必要的,为用户提供使用该系统的操作步骤。为使系统说明更清楚,可以将状态变迁图与操作手册脚本结合起来。

在对需求进行分析,了解系统所要实现的功能的基础上,系统开发选用何种硬件、软件平台就可以确定了。 对于硬件平台,要考虑的是微处理器的处理速度、内存空间的大小、外部扩展设备是否满足功能要求等。如微处理器对外部事件的响应速度是否满足系统的实时性要求,它的稳定性如何,内存空间是否满足操作系统及应用软件的运行要求,对于要求网络功能的系统,是否扩展有以太网接口等。 对于软件平台而言,操作系统是否支持实时性及支持的程度、对多任务的管理能力是否支持前面选中的微处理器、网络功能是否满足系统要求以及开发环境是否完善等都是必须考虑的。 当然,不管选用何种软硬件平台,成本因素都是要考虑的,嵌入式Linux 正是在这方面具有突出的优势。 2、任务和模块划分 在进行需求分析和明确系统功能后,就可以对系统进行任务划分。任务是代码运行的一个映象,是无限循环的一段代码。从系统的角度来看,任务是嵌入式系统中竞争系统资源的最小运行单元,任务可以使用或等待CPU、I/O设备和内存空间等系统资源。 在设计一个较为复杂的多任务应用系统时,进行合理的任务划分对系统的运行效率、实时性和吞吐量影响都极大。任务分解过细会不断地在各任务之间切换,而任务之间的通信量也会很大,这样将会大大地增加系统的开销,影响系统的效率。而任务分解过粗、不够彻底又会造成原本可以并行的操作只能按顺序串行执行,从而影响系统的吞吐量。为了达到系统效率和吞吐量之间的平衡折中,在划分任务时应在数据流图的基础上,遵循下列步骤和原则:

常见的四种嵌入式操作系统

(一)VxWorks VxWorks操作系统是美国WindRiver公司于1983年设计开发的一种嵌入式实时操作系统(RTOS),是Tornado嵌入式开发环境的关键组成部分。良好的持续发展能力、高性能的内核以及友好的用户开发环境,在嵌人式实时操作系统领域逐渐占据一席之地。 VxWorks具有可裁剪微内核结构;高效的任务管理;灵活的任务间通讯;微秒级的中断处理;支持POSIX 1003.1b实时扩展标准;支持多种物理介质及标准的、完整的TCP/IP网络协议等。 然而其价格昂贵。由于操作系统本身以及开发环境都是专有的,价格一般都比较高,通常需花费10万元人民币以上才能建起一个可用的开发环境,对每一个应用一般还要另外收取版税。一般不通供源代码,只提供二进制代码。由于它们都是专用操作系统,需要专门的技术人员掌握开发技术和维护,所以软件的开发和维护成本都非常高。支持的硬件数量有限。 (二)Windows CE Windows CE与Windows系列有较好的兼容性,无疑是Windows CE推广的一大优势。其中WinCE3.0是一种针对小容量、移动式、智能化、32位、了解设备的模块化实时嵌人式操作系统。为建立针对掌上设备、无线设备的动态应用程序和服务提供了一种功能丰富的操作系统平台,它能在多种处理器体系结构上运行,并且通常适用于那些对内存占用空间具有一定限制的设备。它是从整体上为有限资源的平台设计的多线程、完整优先权、多任务的操作系统。它的模块化设计允许它对从掌上电脑到专用的工业控制器的用户电子设备进行定制。操作系统的基本内核需要至少200KB的ROM。由于嵌入式产品的体积、成本等方面有较严格的要求,所以处理器部分占用空间应尽可能的小。系统的可用内存和外存数量也要受限制,而嵌入式操作系统就运行在有限的内存(一般在ROM或快闪存储器)中,因此就对操作系统的规模、效率等提出了较高的要求。从技术角度上讲,Windows CE作为嵌入式操作系统有很多的缺陷:没有开放源代码,使应用开发人员很难实现产品的定制;在效率、功耗方面的表现并不出色,而且和Windows一样占用过的系统内存,运用程序庞大;版权许可费也是厂商不得不考虑的因素。 (三)嵌入式Linux 这是嵌入式操作系统的一个新成员,其最大的特点是源代码公开并且遵循GPL协议,在近一年多以来成为研究热点,据IDG预测嵌入式Linux将占未来两年的嵌入式操作系统份额的50%。 由于其源代码公开,人们可以任意修改,以满足自己的应用,并且查错也很容易。遵从GPL,无须为每例应用交纳许可证费。有大量的应用软件可用。其中大部分都遵从GPL,是开放源代

【完整版】基于Matlab的语音识别系统的设计本科毕业论文设计

摘要 语音识别主要是让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息执行人的各种意图。语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。本文基于语音信号产生的数学模型,从时域、频域出发对语音信号进行分析,论述了语音识别的基本理论。在此基础上讨论了语音识别的五种算法:动态时间伸缩算法(Dynamic Time Warping,DTW)、基于规则的人工智能方法、人工神经网络(Artificial Neural Network,ANN)方法、隐马尔可夫(Hidden Markov Model,HMM)方法、HMM和ANN的混合模型。重点是从理论上研究隐马尔可夫(HMM)模型算法,对经典的HMM模型算法进行改进。 语音识别算法有多种实现方案,本文采取的方法是利用Matlab强大的数学运算能力,实现孤立语音信号的识别。Matlab 是一款功能强大的数学软件,它附带大量的信号处理工具箱为信号分析研究,特别是文中主要探讨的声波分析研究带来极大便利。本文应用隐马尔科夫模型(HMM) 为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语数字语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练、识别匹配算法;同时,提出利用Matlab图形用户界面开发环境设计语音识别系统界面,设计简单,使用方便,系统界面友好。经过统计,识别效果明显达到了预期目标。 关键词:语音识别算法;HMM模型;Matlab;GUI ABSTRACT Speech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of people.Speech recognition technology is not only an important internationally competed technology,but also an indispensable foundational technology for the national economic development.Based on the mathematical model from the speech signal,this paper analyze audio signal from the time

设计和实现一个嵌入式自动语音识别

设计和实现一个嵌入式自动语音识别 系统 sujay Phadke Rhishikesh Limaye亚洲时报Siddharth维尔马 Kavitha Subramanian 孟买印度技术研究所 电机工程学系 个人所得税孟买Powai,孟买,400076,印度。 {sujay,rhishi,亚洲时报Siddharth kavitha}@ ee.iitb.ac.in 摘要 我们提出了一个新的嵌入式语音识别系统的设计。它结合了硬件和软件设计等方面实现依赖扬声器,孤立词,小词汇量语音识别系统。是基于规模的修正Mel频率倒谱系数(MFCC)特征提取和模板匹配采用动态时间规整(DTW)的。一种新的算法已经被用来改善一个字开始检测。围绕行业标准TMS320LF2407A的DSP硬件。作为一个通用的DSP24X系列的TI DSP 开发板电路板设计。据载,除了从DSP,外部SRAM,闪存,ADC接口的I / O接口模块和JTAG 接口。无论是硬件和软件已设计的同时,最小功率最大精度和便携式设备,以便实现高速识别。建议的解决方案是一个低成本,高性能,可伸缩的替代现有的其他产品。 1.介绍 语音识别一直是一个活跃的研究领域多年。随着超大规模集成电路技术,高性的 编译器的进步,它已成为可能纳入这些算法在硬件。在过去的几年中,各系统已开发,以满足各种应用。有许多的ASIC解决方案,提供小型,高性能系统。然而,这些患有低的灵活性和较长的设计周期。一个完整的基于软件的解决方案是为桌面应用程序的吸引力,但未能提供一个便携式,嵌入式解决方案。高端的公司如TI,ADI公司的数字信号处理器(DSP)的,提供一个理想的平台,在硬件的开发和测试算法。 C编译器,模拟器和调试器之类的先进的软件工具提供了一种简单的方法,优化算法和减少市场的时间。然而,为了获得最大的优势,硬件和软件都必须设计在手。语音识别是任何扬声器独立或依赖[1]。独立扬声器模式涉及提取讲话是在口语中所固有的那些特点。这一类的算法一般比较复杂,并利用统计模型和语言模型。另一方面,扬声器依赖模式涉及讲话中提取用户特定的功能。必须为每个用户创建一个词提取系数的模板进行匹配,以确定口语。此外,使用孤立的单词,而不是一个复杂连续的话,有助于提高准确性承认。我们的工作涉及扬声器依赖性,孤立词语音识别系统的发展。该系统是能够认识到口语词,从10-15字的模板。它具有较高的识别精度和适度抑制比。本文组织如下。第二节处理软件的一部分。它解释了背后的梅尔倒频谱系数提取和动态时间规整技术,应用的基础上形成的理论。第三节介绍了定制硬件开发此应用程序设计有关的各种问题。 C代码的DSP平台的软件优化和移植在第四节进行了讨论。结果和比较在部分解释五,最后,我们的结论第六节系统的应用潜力。 2。软件 本节介绍软件方面使用的语音识别引擎。 MFCC的理论是解释其实施。还提出了由作 者开发的一种新的开始检测和错一个字抑制算法。它的结论与动态规整(DTW),确认使用的模板匹配算法。 2.1。特征提取 - 梅尔规模的频率倒谱系数(MFCC)

相关文档
最新文档