基于DSP的语音处理系统的设计

合集下载

基于DSP和ZigBee无线智能语音控制系统设计_边红昌

基于DSP和ZigBee无线智能语音控制系统设计_边红昌

基于DSP和ZigBee无线智能语音控制系统设计_边红昌Proceedings of the 26th Chinese Control ConferenceJuly 26-31, 2007, Zhangjiajie, Hunan, China基于DSP和ZigBee无线智能语音控制系统设计边红昌,程德福,祁玉林,张坤吉林大学-TI DSP联合实验室, 长春130026E-mail:***********************.cn摘要:介绍了以DSP为语音控制模块与以PIC单片机和无线传输芯片CC2420为核心构成的ZigBee无线传输模块建立的无线智能语音控制系统。

给出了系统硬件总体结构及各模块的具体设计方案,语音识别算法和系统软件的实现方法。

针对DSP对语音识别算法进行优化,且对ZigBee协议栈进行优化精简,最终实现了独立运行、识别率高及操作方便的家庭智能语音控制系统。

关键词:语音识别, DSP, ZigBee, 智能控制Design of Wireless Intelligent Speech Control SystemBased on DSP and ZigBeeBian Hongchang, Cheng Defu, Qi Yulin, Zhang KunJilin University-TI DSP Laboratory, Changchun 130026, P. R. ChinaE-mail:***********************.cnAbstract: Introduce a Wireless Intelligent Speech Control System based on DSP as Speech Control Model and PIC Micro-controller & wireless transmit chip CC2420 as the ZigBee Wireless Transmit Model. Hardware design, Speech Recognition Algorithm and Program design are given in this paper. Especially Speech Recognition Algorithm is optimized toward DSP and ZigBee Protocol Stack is reduced. Independent, high recognition rate and convenient operation family intelligent speech control system is realized in our system.Key Words: Speech Recognition, DSP, ZigBee, Intelligent Control1 引言(Introduction)随着智能设备微型化、人工智能化、多功能化等功能的发展,而通常的人机控制如按键、图形菜单等不再能满足用户的需求,因而本文提出了基于DSP 和ZigBee无线智能语音控制系统。

基于DSP的语音信号处理技术研究

基于DSP的语音信号处理技术研究

基于DSP的语音信号处理技术研究随着科技的迅速发展,人工智能逐渐成为人们非常关注的领域。

语音识别技术是其中最具代表性的方向之一。

从最初大家熟知的“语音输入”到现在智能语音助手的存在,语音识别技术的进步让我们感受到科技的力量。

而在语音识别技术的背后,基于DSP的语音信号处理技术,是不可或缺的一环。

DSP是数字信号处理技术的一种,其主要任务是将模拟信号转换成数字信号。

在语音信号处理中,我们可以用数字化的形式来表示、存储和传输语音信号,从而方便后续的信号处理和分析。

基于DSP的语音信号处理,主要包括信号增强、特征提取、语音识别和语音合成。

信号增强是在噪声环境下,通过信号处理的方法提高语音信号的信噪比,使得语音信号更加清晰、准确。

常见的信号增强方法包括滤波、谱减法、短时时域能量归一化等。

其中,滤波是基础中的基础。

通过滤波,可以将一些不需要的频率成分滤除,来提高语音信号的质量。

谱减法是一种减少噪声的方法,通过估计噪声频谱,将其从信号频谱中减去,来达到消除噪声的效果。

短时时域能量归一化,是一种对信号进行平滑处理的方法。

信号增强之后,我们需要对语音信号进行特征提取。

语音信号是一种时间序列信号,其在时间和频率上的变化,反映了不同的语音信息。

在语音信号处理中,目的就是从这些序列中提取有用的特征,来进行语音识别。

常见的特征提取方法包括短时能量、短时平均幅度差、梅尔倒谱系数等。

其中,梅尔倒谱系数是最常用的一种特征。

它是通过对语音信号在梅尔尺度上的测量,来提取与人耳感觉有关的重要声学特征。

特征提取之后,我们就可以进行语音识别。

语音识别是将语音信号转化为文本的过程。

在语音识别中,我们需要利用已有的语音模型、声学模型和语言模型。

语音模型是根据发音规律和声学信息建立的一种概率模型。

声学模型则是对语音信号的声学特征进行建模,包括将梅尔倒谱系数等特征提取出来,并计算其在不同音素上的后验概率。

语言模型是对语音对应的文本信息进行建模,其主要目的是根据语言习惯,预测下一个可能出现的词语。

基于DSP的数字语音信号处理系统的设计

基于DSP的数字语音信号处理系统的设计
参考 文献
【 1 ] 肖 瑛, 李振兴, 董玉华, 等. 基于压缩传递函数的神 经网 络盲均衡算法
弹箭与制导学报 , 2 0 0 9 , 2 9 ( 1 ) : 2 5 1 — 2 5 3 . 图 1数字语音信号处理系统硬件组成 3 F I R数字滤波器算法的 D S P实现 本设计中采用窗函数法设计 F I R滤波器 。T MS 3 2 0 v c 5 4 1 0在指令 2 0 0 9 , 3 8 ( 4 ) : 4 7 9 — 4 8 3 . 集和硬件结构上 , 对滤波器算法的实现 , 有专 门的考虑。首先是在指令 [ 4 】 肖瑛 , 冯长建. 组合窗函数的短时傅里叶变换时频表示方法 探 测与 中设置了 MA C D指令, 它的功能是将数据区的两个数相乘以后, 再与 累 控制学报 , 2 0 1 0 , 3 2 ( 3 ) : 4 3 - 4 8 . 加器中的值累加 , 运算结果仍保 留于累加器中, 而为下 一次操作准备 ; 【 5 】 肖瑛, 李振 兴. 差异进化算法初始化的小波神经网络盲均衡m电路 与 其次在硬件上, 设计了间接寻址时的循环寻址功能 , 即将滤波器系数保 系统学报 , 2 0 1 0 , 1 5 ( 4 ) : 2 2 — 2 6 . 存于—个可循环寻址的数据缓冲区, 寻址指针由低地址 自 动增长 , 当达 嘲 肖 瑛. 并联滤波的常数模 与判决 引导融合 盲均衡算 法 声学学报 , 到缓冲区顶部时 , 自动返回低地址重新寻址 , 这样 , 配合单指令重复指 2 0 1 2 , 3 7 ( 5 ) : 4 9 5 — 5 0 0 . 令R P T , 就可以快速实现卷积操作。程序设计流程图如图 2所示。 董玉华 , 张俊星. 修正的解相关前馈神经网络盲均衡算法研 究 大连 民族学院学报 , 2 0 1 2 , 1 4 ( 5 ) : 4 6 0 — 4 6 2 . [ 8 ] 董玉华 , 肖瑛. 基于¥ 3 C 2 4 4 0的温度采集 系统 的实现Ⅱ l 数 字通信 ,

毕业设计基于DSP的语音信号处理系统设计

毕业设计基于DSP的语音信号处理系统设计

毕业设计 [论文]题目:基于DSP‎的语音信号‎处理设计系别:电气与电子‎工程系专业:电子信息工‎程******学号:*****‎8151指导教师:***河南城建学‎院2010年‎5月23日‎摘要语音信号处‎理是研究用‎数字信号处‎理技术和语‎音学知识对‎语音信号进‎行处理的新‎兴的学科,是目前发展‎最为迅速的‎信息科学研‎究领域的核‎心技术之一‎。

通过语音传‎递信息是人‎类最重要、最有效、最常用和最‎方便的交换‎信息形式。

数字信号处‎理(Digit‎a lSig‎n alPr‎o cess‎i ng,简称DSP‎)是利用计算‎机或专用处‎理设备,以数字形式‎对信号进行‎采集、变换、滤波、估值、增强、压缩、识别等处理‎,以得到符合‎人们需要的‎信号形式。

Matla‎b语言是一‎种数据分析‎和处理功能‎十分强大的‎计算机应用‎软件,它可以将声‎音文件变换‎为离散的数‎据文件,然后利用其‎强大的矩阵‎运算能力处‎理数据,如数字滤波‎、傅里叶变换‎、时域和频域‎分析、声音回放以‎及各种图的‎呈现等,它的信号处‎理与分析工‎具箱为语音‎信号分析提‎供了十分丰‎富的功能函‎数,利用这些功‎能函数可以‎快捷而又方‎便地完成语‎音信号的处‎理和分析以‎及信号的可‎视化,使人机交互‎更加便捷。

信号处理是‎M a tla‎b重要应用‎的领域之一‎。

本设计针对‎现在大部分‎语音处理软‎件内容繁多‎、操作不便等‎问题,采用MAT‎LAB7.0综合运用‎G UI界面‎设计、各种函数调‎用等来实现‎语音信号的‎变频、傅里叶变换‎及滤波,程序界面简‎练,操作简便,具有一定的‎实际应用意‎义。

关键字:Matla‎b,语音信号,傅里叶变换‎,信号处理Abstr‎actSpeec‎h signa‎l proce‎s sing‎is to study‎the use of digit‎a l signa‎l proce‎s sing‎techn‎o logy‎and knowl‎e dge of the voice‎signa‎l voice‎proce‎s sing‎of the emerg‎i ng disci‎p line‎is the faste‎s t growi‎n g areas‎of infor‎m atio‎n scien‎c e one of the core techn‎o logy‎. Trans‎m issi‎o n of infor‎m atio‎n throu‎g h the voice‎of human‎i ty's most impor‎t ant, most effec‎t ive, most popul‎a r and most conve‎n ient‎form of excha‎n ge of infor‎m atio‎n..Digit‎a l signa‎l proce‎s sing‎(Digit‎a lSig‎n alPr‎o cess‎i ng, DSP) is the use of compu‎t er or speci‎a l proce‎s sing‎equip‎m ent, to digit‎a l form of signa‎l acqui‎s itio‎n, trans‎f orma‎t ion, filte‎r ing, estim‎a tion‎, enhan‎c emen‎t, compr‎e ssio‎n, recog‎n itio‎n proce‎s sing‎,in order‎to get the needs‎of the peopl‎e of the signa‎l form.Matla‎b langu‎a ge is a data analy‎s is and proce‎s sing‎funct‎i ons are very power‎f ul compu‎t er appli‎c atio‎n softw‎a re, sound‎files‎which‎can be trans‎f orme‎d into discr‎e te data files‎, then use its power‎f ul abili‎t y to proce‎s s the data matri‎x opera‎t ions‎, such as digit‎a l filte‎r ing, Fouri‎e r trans‎f orm, when domai‎n and frequ‎e ncy domai‎n analy‎s is, sound‎playb‎a ck and a varie‎t y of map rende‎r ing, and so on. Its signa‎l proce‎s sing‎and analy‎s is toolk‎i t for voice‎signa‎l analy‎s is provi‎d es a very rich featu‎r e funct‎i on, use of these‎funct‎i ons can be quick‎and conve‎n ient‎featu‎r es compl‎e te voice‎signa‎l proce‎s sing‎and analy‎s is and visua‎l izat‎i on of signa‎l s, makes‎compu‎t er inter‎a ctio‎n more conve‎n ient‎. Matla‎b Signa‎l Proce‎s sing‎is one of the impor‎t ant areas‎of appli‎c atio‎n.The desig‎n of voice‎-proce‎s sing‎softw‎a re for most of the conte‎n t are numer‎o us, easy to maneu‎v er and so on, using‎MATLA‎B7.0 compr‎e hens‎i ve use GUI inter‎f ace desig‎n, vario‎u s funct‎i on calls‎to voice‎signa‎l s such as frequ‎e ncy, ampli‎t ude, Fouri‎e r trans‎f orm and filte‎r ing, the progr‎a m inter‎f ace conci‎s e, simpl‎e, has some signi‎f ican‎c e in pract‎i ce.Keywo‎r ds: Matla‎b, Voice‎Signa‎l,Fouri‎e r trans‎f orm,Signa‎l Proce‎s sin1 绪论1.1课题的背景‎与意义通过语音传‎递信息是人‎类最重要、最有效、最常用和最‎方便的交换‎信息的形式‎。

基于DSP语音识别系统的设计

基于DSP语音识别系统的设计
的。 D S P的这 种 多 处 理 单 元 结 构 , 特别适用于 F I R和 I I R滤 波
器。
择是 :首先选 择 T L C 3 2 0 A D 5 0对语音信号进行 A / D 转换 , 再
选择 D S P芯片 T MS 3 2 0 C 5 5 1 0对信号进行滤 波 、 端 点检测 、 语 音信号增强 、 特征参数 提取等语音信号处理进而进行识别 , 并 通过 L E D检测识别结果进而报警 。
t h i s s y s t e m a d o p t t h e c o mb i n i n g o f s o f t w a r e a n d h a r d w a r e w i t h DS P a s t h e c o r e . Ke y wo r d s :T MS 3 2 0 VC 5 4 1 0 DS P ;A / D;s p e e c h r e c o g n i t i o n
p o s t - d i s a s t e r l i f e r e c o g n i t i o n t h r o u g h p r o c e s s i n g o f t h e s p e e c h s i g n a l ,t h e s y s t e m c o mp l e t e c o n v e r s i o n o f mo d u l u s a n d d i g i f a x b y A / D a n d D/ A T L C3 2 0 A D5 0 .DS P c h i p TMS 3 2 0 VC 5 41 0 DS P c o u l d c o mp l e t e s p e e c h s i g n a l p r o c e s s i n g a n d r e c o g —

基于TMS320C5416DSP芯片的语音录放器的设计

基于TMS320C5416DSP芯片的语音录放器的设计

基于TMS320C5416DSP芯片的语音录放器的设计摘要DSP 技术在音频处理领域的应用越来越广。

目前,在很多语音处理系统中都用到了语音录放模块,采集现场的声音并存储起来供以后回放。

语音处理系统的实时性、功耗、体积、以及对语音信号的保真度都是很影响系统性能的关键因素。

因此,语音录放器的设计是非常必要的。

本设计采用的高速TMS320C5416DSP芯片,最高频率能达到160MIPS,能够很好的解决系统的实时性;采用的数字编解码芯片TLV320AIC23(以下简称AIC23)具有16~32位采样精度,录音回放模式下仅23mW的功耗。

因此,该音频编解码芯片与TMS320C5416DSP的结合是可移动数字音频录放系统、现场语音采集系统的理想解决方案。

本文首先介绍了基于TMS320C5416DSP芯片的语音录放系统的工作原理,给出了整体设计方案和工作框图,然后给出了系统的硬件设计方案;然后介绍了基于TMS320C5416DSP芯片的语音录放系统的软件设计。

在整个设计过程中,我们采用了TLV320AIC23DSP芯片为核心音频录放接口器件,结合TMS320C5416DSP芯片,语音数据存储FLASH存储器等进行了硬件设计。

软件部分则采用模块化的设计方法,用汇编语言来实现。

该语音录放器的设计能够完成语音采集,播放,存储,回放,基本实现了语音录放功能。

关键词:TMS320C5416,TLV320AIC23,DSP,语音录放THE DESIGN OF SPEECH RECORDING ANDPLAYING BASED ON TMS320C5416 DSP CHIPABSTRACTThe use of DSP technology in the field of audio processing is increasingly wider. At present, many speech processing systems are used in speech-recording module, acquisition scene speech and stored for later playback. Speech processing System with real-time, power consumption, size, and the speech signal fidelity is a key factor which is affecting system performance. Therefore, speech recording and playing design is very necessary.The design of high-speed chip used TMS320C5416 DSP, the maximum frequency can reach 160 MIPS,which is a good solution to the real-time system; the figures used in the codec chip TLV320AIC23 (hereinafter referred AIC23) is 16 ~ 32 Sampling precision, recording playback mode only 23 mw of power. Therefore, The Audio Decoder Chip and the combination TMS320C5416 DSP Mobile Digital Audio Recording and Playback System Speech Acquisition scene, is the ideal solution.This paper firstly introduces the Speech Recording and Playback System of principle based on TMS320C5416 DSP chip, given the overall design of the plan and diagram, and then gives the system hardware design program; Secondly V oice Recording and Playback System software design based on TMS320C5416 DSP chip .Throughout the design process, we used TLV320AIC23 DSP core chips for audio-recording device interface, TMS320C5416 DSP combination of chips, Speech Data Storage Flash memory, and so on the hardware design. Software is a modular design method, the assembly language to achieve.The speech recording of the design is to complete speech acquisition, broadcast, store, playback, the basic realization of the Speech Recording and Playback function.KEY WORDS:TMS320C5416,TLV320AIC23,DSP,Speech recording and playing目录前言 (1)第1章语音录放器的技术方案及硬件电路设计 (2)§1.1语音录放器的性能指标和硬件方案 (2)§1.1.1 语音录放器的主要性能 (2)§1.1.2 硬件设计方案 (3)§1.2 语音录放系统的硬件电路设计 (4)§1.2.1 TMS320C5416DSP数字信号处理接口电路模块 (5)§1.2.2 TLV320AIC23语音录放接口电路模块 (9)§1.2.3语音数据存储接口电路模块 (12)§1.2.4 音频接口电路模块 (13)§1.2.5 电源接口电路模块 (15)第2章语音录放器的应用软件设计 (17)§2.1 语音录放器应用软件系统的设计方案 (17)§2.2 主程序模块 (17)§2.3 语音录放模块程序设计 (20)§2.3.1 MCBSP的配置 (20)§2.3.2 AIC23的初始化 (22)结论 (26)参考文献 (27)致谢 (28)附录 (29)前言DSP处理速度快,功耗低,性能好,基于TMS320C5416DSP芯片的语音录放器存储容量大,语音录放时间长,具有很好的通信音质等特点,因此被广泛应用于很多领域中。

基于dsp的语音采集及滤波器设计

基于dsp的语音采集及滤波器设计

基于DSP的语音采集与FIR滤波器的设计与实现摘要: 介绍了一种基于TMS320C5402的语音采集与FIR数字滤波器的设计与实现, 采用TLC320AD50作为语音CODEC模块的核心器件, 简述了FIR数字滤波器的特点,以及其在DSP上实现的原理。

利用TMS320C5402对采集到的语音信号进行FIR滤波, 该系统具有较强的数据处理能力和灵活的接口电路,能够满足语音信号滤波的要求, 可以扩展为语音信号处理的通用平台.关键词: 语音采集; FIR滤波器; TMS320C5402数字信号处理是把数字或符号表示的序列, 通过计算机或专用处理设备, 用数字的方式去处理, 以达到更符合人们要求的信号形式。

而语音处理是数字信号处理最活跃的研究方向之一, 在IP电话和多媒体通信中得到广泛应用. 一个完备的语音信号处理系统不但要具有语音信号的采集和回放功能, 还要能够进行复杂的语音信号分析和处理。

通常这些信号处理算法的运算量很大, 而且又要满足实时的快速高效处理要求, 随着DSP技术的发展, 以DSP为内核的设备越来越多, 为语音信号的处理提供了优质可靠的平台. 软件编程的灵活性给很多设备增加不同的功能提供了方便, 利用软件在已有的硬件平台上实现不同的功能已成为一种趋势。

本文设计了一个语音处理系统, 采用定点DSP芯片TMS320C5402作为CPU, 完成对语音信号的采集和滤波处理.1 语音采集系统的设计1. 1 系统总体设计语音采集与处理系统主要包括3个主要部分: 以TMS320C5402 为核心的数据处理模块; 以TLC320AD50为核心的语音采集与编解码( CODEC)模块; 用户根据需要扩展的存储器模块. 系统硬件结构如图1所示.1. 1. 1 CODEC模块本设计选用TLC320AD50( 以下简称AD50) 完成语音信号的A/ D转换和D/ A转换. AD50是TI公司生产的一款集成有A/ D和D/ A的音频芯片, DSP与音频AD50连接后, 可使用一个缓冲串行口来同时实现语音信号的采集和输出, 从而可以节省DSP的硬件开销. AD50使用过采样技术提供从数字信号到模拟信号和模拟信号到数字信号的高分辨率低速信号转换. 该器件包括2个串行的同步转换通道, 分别用于各自的数据传输. 语音信号直接从AD50的模拟信号输入端输入, AD50对其进行采样, 并将采样后的数据传送至DSP. DSP应用相应的算法对数据进行处理, 并将处理后的数据传送到AD50的D/ A输入端. AD50再对DSP处理后的数据进行数模转换, 变为语音信号后输出到音响设备.本系统中TLC320AD50与TMS320C5402之间采用串行通信, 通过DSP芯片的MCBSP串口实现.接口电路如图2所示.1. 1. 2 MCBSP的工作原理TMS320C5402有2个McBSP 多通道缓存串行口. McBSP提供了全双工的通信机制, 以及双缓存的发送寄存器和三缓存的接收寄存器, 允许连续的数据流传输, 数据长度可以为8、12、16、20、24、32; 同时还提供了A律和L律压扩. 数据信号经DR和DX引脚与外设通讯, 控制信号则由CLKX、CLKR、FSX、FSR等4个引脚来实现[ 4]. CPU和DMA控制器可以读取DRR[ 1, 2] 的数据实现接收, 并且可以对DXR[ 1, 2] 写入数据实现发送. 串行口控制寄存器SPCR[ 1, 2] 和引脚控制寄存器PCR用来配置串行口; 接收控制寄存器RCR[ 1, 2] 和发送控制寄存器XCR[ 1, 2]用来设置接收通道和发送通道的参数; 采样率发生器寄存器SRGR[ 1, 2] 用来设置采样率. TMS320C5402芯片串口控制寄存器功能强大, 用户通过编程不但可以设置时钟信号的极性及输入输出方向, 还可以设置同步信号的极性及输入输出方向.1. 1. 3 AD50与DSP的同步通信在应用中, 将TLC320AD50C接至DSP的同步串口, 并将TLC320AD50设置在主动工作模式下, 即由TLC320AD50 提供帧同步信号和移位时钟,TMS320C5402的管脚电压为3. 3V, 可以与AD50直接相连. 串口的移位时钟SCLK由AD发出, 串行数据在SCLK的驱动下经DIN、DOUT 移进、移出, 在SCLK的下降沿采样DIN 数据, 在SCLK下降沿送出数据到DOUT. XF控制首次或二次通信, XF为低时是AD50的首次通信, 是正常的AD、DA的数据; XF为高时是AD50的二次通信, 这时可以读写AD50的4个寄存器. 进入二次通信有软件的方法, 即把AD50设为15+1位数据模式, 最后一位标记下一个数据是否为二次通信数据, 1表示是, 0表示否.一次通信格式的16位都用来传输数据. DAC的数据长度由寄存器1的D0位决定. 启动和复位时, 默认值为15+ 1模式, 最后一位要求二次通信. 如果工作在16位传输模式下, 则必须由FC产生二次通信请求. 二次通信格式则用来初始化和修改TLC320AD50C内部寄存器的值. 在二次通信中可通过向DIN写数据来完成初始化.二次通信格式如图3所示, D13= 1表示读DIN的数据, D13= 0表示向DIN 写数据.系统复位后, 必须通过DSP 的DX接口向TLC320AD50C的DIN 写数据, 因为采用一片TLC320AD50C, 只需初始化寄存器1、寄存器2、寄存器4. 由于通信数据长度为16位, 初始化是应通过RCR1和XCR1设置McBSP的传输数据长度为16.2 语音采集语音信号的采集, 是通过话筒经模拟放大输入到AD50, AD50作相应的低频滤波并进行A/ D转化, 再通过MCBSP通道输入DSP芯片. 语音信号采集程序包括以下几个部分:( 1) DSP初始化. 对DSP的寄存器以及缓冲串口进行初始化.( 2) AD50初始化. 通过DSP的缓冲串口和XF引脚对AD50进行初始化, 再设置AD50的4个控制寄存器; 确定AD50的4个控制寄存器设置正确后,AD50才能开始采集数据. 此时, 可以用示波器检测AD50的DOUT引脚, 能发现引脚是否有连续的信号输出.( 3) 设置DSP的中断, 从缓冲串口读取数据. 如果此时在缓冲串口连续读取数据, 就可以在仿真软件CCS中查看读取的数据是否正确.( 4) DSP存放数据. 可以将缓冲串口读取的数据存放到DSP的RAM单元, 连续存放, 可通过CCS的图形显示功能判断AD50采样的数据是否正确.3 语音滤波语音去噪在语音信号上应用较多, 在实质上和普通的数字信号去噪没有什么区别, 使用滤波器和各种算法均可以实现语音信号的去噪, 使得含有噪声的信号更加清晰. 但语音信号的去噪和一般的数字信号去噪又存在着很大的差别, 因为语音信号的频谱覆盖在100Hz~3. 4kHz, 较为丰富的信号主要集中在1kHz 附近, 所以一般的滤波去噪时必须考虑语音信号的自身特征.本系统中应用的AD50内置了低通滤波器, 可以通过设置来有效滤除信号中混杂的高频干扰信号, 而对于低于100Hz的干扰信号, 则无能为力. 因此, 要用DSP进行编程设计一个软件可实现高通滤波器, 由处理器来完成信号的去噪, 采用FIR滤波.3.1 FIR滤波器的基本结构及特点有限冲激响应( FIR)滤波器的基本结构是一个分节的延时线, 把每一节的输出加权累加, 得到滤波器的输出. 数学上表示为y(n) =EN-1n=0h(n)x(n-m), (0[ n[ N- 1) (1) 对(1)式进行Z变换, 整理后可得出FIR滤波器的传递函数为H(z) = EN-1n=0h(n)z-n, (0[ n[ N- 1) (2)由( 2)式可知FIR滤波器的一般结构如图1所示.图1 FIR数字滤波器直接实现形式3.2 FIR滤波器的DSP实现原理由( 1)式可知, FIR滤波器的冲激响应为h(0), h(1), ,, h(N- 1). x(n)表示滤波器在n时刻的输入, 则n时刻的输出为y(n) = h(0)x(n) +h(1)x(n- 1) + ,+ h(N- 1)x[ n- (N- 1) ],这是一个乘、加的过程, 可以使用DSP中的MAC 指令实现该运算. 图2说明了使用循环寻址实现FIR滤波器的方法. 为了能正确使用循环寻址, 必须先初始化BK, 块长为N. 同时, 数据缓冲区和冲激响应( FIR滤波器的系数)的开始地址必须是大于N的2的最小幂的倍数. 例如, 当N= 11时, 大于N的最小2的幂为16, 则数据缓冲区的第一位地址应该是16的倍数, 因此数据缓冲区起始地址的最低4位必须是0.在图2中, 滤波系数指针初始化时指向h(N- 1), 经过一次FIR滤波计算后, 在循环寻址的作用下,仍然指向h(N- 1). 而数据缓冲区指针指向的是需要更新的数据, 如x(n). 在写入新数据并完成FIR运算后, 该指针指向x(n- (N- 1)) , 所以, 使用循环寻址可以方便地完成滤波窗口数据的自动更新.4 FIR滤波器设计实例给定FIR数字带通滤波器的技术指标为: 2个通带截止频率分别为4kHz和6kHz, 2个阻带截止频率分别为3kHz和7kHz, 采样频率均为25kHz. 输入为一个混合信号f = [ cos(2000Pt) + cos(10000Pt) + cos(20000Pt)] /6,利用Matlab设计FIR带通滤波器的系数, 将得到的滤波器系数乘以32768(即215)后舍尾取整可得DSP中滤波器系数列表. 用. word汇编命令将各滤波器系数直接输入到DSP程序中; 模拟输入数据由C语言程序实现, 然后用. copy命令将C语言程序生成的数据文件firinput拷贝到DSP程序中. DSP程序实现读入数据、滤波、显示波形等方面的任务. 完成FIR滤波器的程序框图如图3所示, 可知FIR滤波器的DSP实现主要由以下4方面的内容组成.4.1 模拟输入数据的生成用C语言程序生成输入数据, 通过. copy汇编命令将生成的数据文件拷贝到汇编程序中, 作为FIR滤波器的输入数据. C语言程序运行后所生成的数据文件名为firinpu,t 生成firinput数据文件的C语言程序如下所示:#include"stdio. h"#include"math. h"main( ){int ;idouble f[ 256];FILE*fp;if( ( fp= fopen( "e: \ \ firinput", "wt") ) = =NULL){printf( "canct openfile! \n");}for( i=0; i< =255; i++ ){f[ i] =( cos( 2* 3. 14159265* *i 1000/25000) + cos( 2* 3. 14159265* *i 5000/25000) +cos( 2* 3. 14159265* *i 10000/25000) ) /6;fprintf( fp, " . word %ld\n", ( long) ( f[ i]* 32768) );}fclose( fp);}4.2 DSP初始化程序 DSP初始化程序包括了对堆栈指针( SP)、软件等待状态寄存器( SWWSR)、中断寄存器( IFR)、中断屏蔽寄存器( IMR)以及处理器工作状态寄存器( PMST)的初始化; 另外还对各变量赋值, 具体的程序如下: . def _c_int00. mmregsswcr . set 2bht_ar2 . set 066ht_ar3 . set 067hout_wave_buf . set 0d00hdata_in . set 0f00hN . set 51fir_coef_buf . set 100hfir_data . set 200h. textrs b_c_int00_c_int00:stm#2020h, pmstssbx intmssbx sxmssbx frctstm #10h, 26hstm #10h, 36hstm #0ffh, spld #0, dpstm #0ffffh, ifrstm #20h, imrstm #02492h, swwsrstm #0, swcr可看出, FIR滤波器的系数列表将存在100h开始的单元中, 输入数据将存在200h开始的单元中, 而输出数据将存在0d00h开始的单元中.4.3 滤波系数以及输入数据的调入由于滤波器系数一开始是存在程序存储器中, 输入数据则是存在程序外的文件中, 程序对这2组数据进行处理时, 需要把两者都调到数据存储器中, 具体实现程序如下:stm #fir_data, ar6rpt #255mvpd #inpu,t*ar6+stm #fir_coef_bu,f ar6rpt #N-1mvpdfir_coe,f*ar6+stm #fir_coef_bu,f t_ar2stm #fir_data, t_ar3这段程序实现的是把输入数据调到以200h开始的单元, 而把滤波系数调到从100h开始的单元.4.4 滤波子程序一次滤波的过程实质上就是对2组数进行有规律的乘加计算, 具体程序如下:fir:mvdm #t_ar2, ar2 ; 将起始滤波系数地址100h 赋给ar2mvdm #t_ar3, ar5 ; 将起始输入数据地址200h 赋给ar5stm #data_in, ar3 ; ar3=0f00hstm #255, brc ; 定义块循环次数rptbdloop-1 ; 定义块循环结束地址stm #N, bk ; 定义循环缓冲器大小ld *ar5+, a ; 将新数据读到累加器a中 stl a,*ar3+% ; 将新数据读入栈顶rptz a, #(N-1) ; 定义循环次数, 之前先将a累加器清0mac *ar2+0%,*ar3+0%, a ; a=ar2*ar3+a, 每完成一次计算ar2、ar3 ; 指针所对应地址+1sth a, * ar6+ ; 将计算结果保存输出loop这个程序段将重复执行256次, 从而实现对于数据的读入、处理、输出等功能.5 结语本文介绍了一个实时数据采集处理系统的设计和实现, 系统以DSP芯片和TLC320AD50芯片为核心,有很强的数据处理能力和灵活的外围接口电路, 实验证明, 可较好地实现语音的滤波. 该系统可扩展为3G手机语音识别系统, 也可以作为语音信号处理算法研究和实时实现的通用平台参考文献: :[ 1] 邹彦. DSP原理及应用[ M]. 北京:电子工业出版社, 2005.[2] 乔瑞萍, 崔涛,张芳娟. TMS320C54x原理及应用[M].西安: 西安电子科技大学出版社, 2005.[3] 黄海波, 蒋伟荣. 通用语音处理系统的DSP实现[ J] . 微计算机信息, 2006,22( 5) :173- 175.[4] 张勇, 曾炽祥,周好斌. TMS320C5000系列DSP汇编语言程序设计[M]. 西安:西安电子科技大学出版社, 2004.[ 5] 卢山, 田野,郭黎利. 利用DSP技术实现FIR滤波器[ J]. 应用科技, 2002, 29( 11): 19-21.[ 6] 张伟利, 朱煜. FIR滤波器在TMS320C5402中的实现[ J].微处理机, 2005( 2): 4- 6.。

一种基于DSP的语音处理系统软硬件设计

一种基于DSP的语音处理系统软硬件设计


种 基 于 D P的语 音 处 理 系统 软 硬 件 设 计 S
蒋 永生 , 雄伟 , 张 曾宏 辉
( 放 军 理 工 大 学 通 信 工 程学 院 , 苏 南 京 20 0 ) 解 江 10 7
摘要 : 语音 处理 系统广 泛地 应用 于许 多场 合 , 满足 了A 4 对 多媒体 业务 的 需求 。文章 设计 了一种 .I ' 1
采 用先 进 的 Sg —e a过 采 样 技 术 , 以在 采 样 i mad h 可
语 音 处 理 系 统 中 , L 3 0 I 2 B 芯 片 可 以 采 TV 2AC3
集语音 输 入 信 息 , 后 通 过 高 速 数 据 传 输 通 道 向 然
T 3 0 C 5 2传 输 语 音 数 据 。 主 处 理 器 的 D P MS 2 V 5 0 S
可 以根 据系统 的需 要 , 照 特 定 的语 音 处 理算 法 , 按
收稿 日期 :2 0 0 7—0 5—0 修 回 日期 :0 7—0 2; 20 6—0 4
语音 处理 系统 , 系统 采 用 T S2 V 50 该 M 3 0 C 5 2作 为 主 处 理 器 , 用 T V 2 A C 3 选 L 3 0 I 2 B作 为 C dc芯 oe
片 , 此基础 上 完成 系统 的硬 件 平 台搭 建 和软 件 编 程 。该 系统 充 分 利 用 D P处 理 器 的特 点 , 在 S 提
丽 一

l l
图 1 语 音 处 理 系 统 结 构
Fi 1 St uc ur fv c o e sng s t m g. r t e o oie pr c s i yse
能 、 功耗 的立 体 声 音频 C d c芯 片 , 低 oe 提供 4 H 8k z 带宽 、6 k z最 大 采样 率 , 9 H 内置 耳 机 输 出放 大 器 , 支 持麦 克 风输入 和立 体声 输 入 2种 输 入 方 式 以及 立体 声 输 出 , 入 和输 出都 可 通 过 编程 调 节 增 益 。 输 它 的模 数转 换 和 数 模 转 换 部 件 集 成 在 芯 片 内部 ,
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于D S P的语音处理系统的设计The Standardization Office was revised on the afternoon of December 13, 2020Cadence SPB基于DSP的语音处理系统的设计摘要近年来,随着DSP技术的普及和低价格、高性能DSP芯片的出现,DSP已越来越多地被广大的工程师所接受越来越广泛地被应用于各个领域,并且已日益显示出其巨大的优越性。

DSP是利用专门或通用的数字信号处理芯片,以数字计算的方法对信号进行处理,具有处理速度快、灵活、精确、抗干扰能力强、体积小及可靠性高等优点,满足了对信号快速、精确、实时处理及控制的要求。

本次设计基于TLV320AIC23和TMS320VC5416两种芯片设计并实现了一种语音录音、语音编码、语音解码、语音处理和回放的系统。

通过软件和硬件结合对该系统进行设计,使本次设计的语音处理系统具有强大的数据处理能力并配有灵活的接口电路,可以作为一种语音信号处理算法研究和实时实现的通用平台,对语音编码在DSP上的实时实现进行了简单的研究,从而掌握了算法移植的一般流程,为能够在高速DSP硬件平台设计及系统应用开发方面取得成功奠定基础。

关键词:DSP;数据采集; TLV320AIC23;TMS320VC5416。

目录摘要 I 第1章绪论 1 DSP的发展及应用 1 语音信号处理系统概述 2 第2章 DSP芯片介绍 3 TLV320AIC23简介 3 TMS320VC5416简介 3 第3章系统设计 4 系统硬件设计 4 系统结构框图 4 DSP处理器 5 A/D电路 5 D/A电路 7 系统软件设计 10 TMS320VC5416初始化 10 TLV320AIC23初始化 10 第4章总结 11 参考文献 12 致谢 13 附录 14 第1章绪论近年来,在数字信号处理领域有着绝对优势的DSP技术得到了迅速发展,不仅在通信计算机领域大显身手,并已逐渐渗透到人们日常消费领域。

正因为如此,DSP应用越来越得到普遍重视。

DSP作为可编程数字信号处理专用芯片是微型计算机发展的一个重要分支,也是数字信号处理理论实用化过程的重要技术工具。

DSP器件分为两大类:一类是专门用于FFT、FIR滤波、卷积等运算的芯片,称为专用DSP器件;另一类是可以通过编程完成各种用户要求的信息处理任务的芯片,称为通用数字信号处理器件。

DSP的发展及应用最初的DSP器件只是被设计用以完成复杂数字信号处理算法。

这可以追溯到20世纪50年代到60年代,那时数字信号处理技术刚刚起步。

由于一般的数字信号处理算法运算量大,因此,算法只能在大型计算机上进行模拟仿真,无法实现数字信号处理。

60年代中期,快速傅里叶算法的出现及大规模集成电路的发展,奠定了硬件完成数字信号处理算法和数字信号处理理论实用化的重要技术基础,从而促进了近40年来DSP技术与器件的飞速发展。

通用DSP器件的发展可分为三个阶段:第一阶段(1980年前后),DSP雏形阶段。

第二阶段(1990年前后),DSP的成熟阶段。

第三阶段(2000年以后),DSP的完善阶段。

目前,DSP的发展非常迅速。

硬件结构方面主要是向多处理器的并行处理结构、便于外部数据交换的串行总线传输、大容量片上RAM和ROM、程序加密、增加I/O驱动能力、外围电路内装化、低功耗等方面发展。

软件方面主要是综合开发平台的完善,使DSP的应用开发更加灵活方便。

目前,DSP芯片的价格越来越低,性能价格比日益提高,具有巨大的应用潜力。

DSP芯片的主要应用:①信号处理——数字滤波,自适应滤波,快速傅里叶变换,相关运算,频谱分析,卷积,波形产生等;②语音处理——语音编码,语音识别,语音合成,文本—语音转换等;③图象图形处理——三维图形转换,机器人视觉,图象转换及压缩,模式识别,图象增强等;④控制——司服控制,机器人控制,自适应控制,神经网络控制等;⑤军事——保密通信,雷达及声音信号处理,导航及制导,调制解调,全球定位,搜索与跟踪等;⑥仪器仪表——频谱分析,函数发生器,模态分析,暂态分析等;⑦通讯——回音相消,高速调制解调器,数字编码与解码,自适应均衡,移动电话,扩展通讯,噪音对消,网络通讯等;⑧消费电子——高清晰度电视,音乐合成器,智能玩具,游戏等;⑨医学——助听器,病员监控,超声波设备,自动诊断设备,胎儿监控等。

语音信号处理系统概述语音处理在现代通信中应用非常广泛,主要有语音编码、语音识别、语音合成、语音邮件、语音存储等。

典型的语音处理系统如下图所示:图典型的语音处理系统图中的输入信号可以有各种各样的形式。

例如,它可以是麦克风输入的语音信号或是电话线已调的数据信号,可以是编码后在数字链路上传输或存储在计算机里德摄像机图象信号等。

输入信号首先进行带限滤波和抽样,然后进行A/D变换将信号变成数字比特流。

根据奈奎斯特抽样定理,为保证信息不丢失,抽样频率至少是输入带限信号最高频率的2倍。

DSP芯片的输入是A/D变换后得到的以抽样形式表示的数字信号。

DSP芯片对输入的数字信号进行某种处理。

数字处理是DSP系统的关键,这与其它系统(如电话交换系统)有很大的不同。

在交换系统中,处理器的作用是进行路由选择,它并不对输入数据进行修改。

因此两者虽然都是实时系统,但两者的实时约束条件却有很大不同。

最后,经过处理后的数字样值再经D/A变换转换为模拟样值。

之后进行内插和平滑滤波就会得到连续的模拟波形。

上面给出的典型的DSP语音处理系统,根据不同的用途应有不同的变动。

第2章 DSP芯片介绍 TLV320AIC23简介TLV320AIC23(简称AIC23)是TI公司的一款高性能Codec芯片。

主要特性有:内置耳机输出放大器,支持MIC和LINE IN两种输入方式(二选一)。

且对输入和输出都具有可编程增益调节;芯片中的A/D转换器和D/A转换器采用多位的Sigma-Delta技术,数据传输字长为16、20、24、32bit,采样率为8kHz ~96kHz;在采样率为96kHz情况下A/D转换器信噪比达到90dB,D/A转换器达到100dB;回放模式下功率为23mW,省电模式下更是小于15uW;只占用25mm的面积。

基于上述优点,AIC23是可移动的数字音频播放和录音使用中的模拟输入输出等应用系统的理想选择,例如MP3播放器等。

TMS320VC5416简介 TMS320VC5416(以下简称VC5416)是TI公司的一款16bit定点高性能DSP,是TMS320VC54x系列中的第3代芯片。

主要特性有:速率最高达160MI/s;3条16bit数据存储器总线和1条程序存储器总线;1个40bit桶形移位器和2个40bit累加器;1个17×17乘法器和1个40bit专用加法器;最大8M×16bit的扩展寻址空间,内置128k×16bit的RAM和16k×16bit的ROM;3个多通道缓冲串口(McBSP);配有PCM3002,可对语音进行A/D 和D/A转换。

由于VC5416功耗低,性能高,其分开的数据和指令空间使该芯片具有高度的并行操作能力,在单周期内允许指令和数据同时存取,再加上高度优化的指令集,使得该芯片具有很高的运算速度并且该芯片本身具有丰富的片内存储器资源和多种片上外设,因此在工程界得到广泛应用,尤其是在语音编码和通信应用方面。

第3章系统设计系统硬件设计系统结构框图音频系统应该具有较宽的动态范围,选择16~24位的ADC和DAC能完全捕获或恢复高保真的音频信号。

系统的核心芯片(DSP)选用美国TI公司的TMS320VC5402[1](以下简称C5402)。

DSP芯片模块是整个实时语音处理系统的核心部分,它对经数字化的信号进行压缩,编解码等。

A/D转换模块功能是把模拟信号数字化,包括采集和量化,这部分为DSP处理语音数字信号做好了准备;D/A转换模块就是把数字信号转换为模拟的信号,输出音频信号。

SDRAM(动态随机存储器)存储器模块主要是为DSP处理器扩展存储容量,达到要求的存储容量;但要注意的是要与DSP处理器的速度相匹配,以便良好的运行。

电源模块是为内部芯片及周边系统电路提供能量的部分。

系统结构框图图如下所示:图系统结构框图 DSP处理器作为DSP家族高性价比代表的16位定点DSP芯片,C5402适用于语音通信等实时嵌入应用场合。

与其它C54X 芯片一样,C5402具有高度灵活的可操作性和高速的处理能力。

其性能特点如下:操作速率可达100MIPS;具有先进的多总线结构,三条16位数据存储器总线和一条程序存储器总线;40位算术逻辑单元(ALU),包括一个40位桶形移位器和两个40位累加器;一个17×17乘法器和一个40位专用加法器,允许16位带/不带符号的乘法;整合维特比加速器,用于提高维特比编译码的速度;单周期正规化及指数译码;8个辅助寄存器及一个软件栈,允许使用业界最先进的定点DSP C语言编译器;数据/程序寻址空间为1M×16bit,内置4K×16bit ROM 和16k×16bit RAM;内置可编程等待状态发生器、锁相环(PLL)时钟产生器、两个多通道缓冲串口、一个与外部处理器通信的8位并行HPI口、两个16位定时器以及6通道DMA控制器且低功耗。

与C54X系列的其它芯片相比,5402具有高性能、低功耗和低价格等特点。

它采用6级流水线,且当RPT(重复指令)时,一些多周期的指令就变成了单周期的指令;芯片内部RAM和ROM可根据PMST寄存器中的OVLY和DROM位灵活设置。

这些都有利于算法的优化。

C5402采用和电源供电,其中I/O采用电源供电,芯片的核采用电源供电。

而实际常用的只有5V电源,所以必须采用电源转换芯片。

选用TPS7301和TPS7333两块电源转换芯片(它们都是TI公司为配合DSP而设计的电源转换芯片),分别接上适当的外围电阻,构成电阻分压器,即可调整两块芯片的输出电压分别为和。

A/D电路 PCM1800是双声道单片Δ-Σ型20位ADC,单+5V电源供电,信噪比为95dB,动态范围为95dB,其内部嵌有高通滤波器,具有PCM音频接口和四种数据格式,分为主控和受控两种模式,采样频率可选为32kHz、和48KHz。

PCM1800构成音频信号采集系统时,主要涉及到BCK(位时钟信号)、LRCK(采样时钟信号)、FSYNC(帧同步信号)、DOUT(数字信号输出)、SYSCLK(系统时钟输入)这几个对时序有要求的引脚。

通过对引脚MODE0和MODE1进行编程,可让PCM1800工作于主控模式(Master Mode)。

相关文档
最新文档