说话人识别算法的定点DSP实现

合集下载

基于DSP的语音识别系统研究与实现

基于DSP的语音识别系统研究与实现

龙源期刊网
基于DSP的语音识别系统研究与实现
作者:孙爱中等
来源:《现代电子技术》2013年第09期
摘要:语音识别是人机语音通信的关键技术之一,也是难题之一。

介绍了一种语音识别系统,主要介绍了该系统的语音处理流程,阐述了系统使用Mel频标倒谱参数作为特征提取的方法,采用隐马尔科夫模型算法的测度估计技术。

通过严格测试,该系统达到实用化要求。

该语音识别系统较好的实现了在移动电子设备上资源有限条件下方便快捷的汉字语音输入,具有重大现实意义。

关键词:语音识别;特征提取;带通滤波;隐马尔科夫模型
中图分类号: TN911.7⁃34 文献标识码: A 文章编号: 1004⁃373X(2013)09⁃0076⁃03
语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。

作为专门的研究领域,语音识别又是一门交叉学科,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。

语音识别经过四十多年的发展,已经显示出巨大的应用前景。

本文从实现原理入手,介绍语音识别系统的实现方式。

1 概述
本汉语语音识别系统是一个非特定人的、孤立音语音识别系统。

其中孤立音至少包括汉语的400多个调音节(不考虑声调)以及一些常用的词组。

识别系统主要用于手持设备,如手机、掌上电脑。

这些设备的CPU一般是DSP,硬件资源十分有限,而且大多不支持浮点运算。

那么,对系统各个部分的设计首要考虑的是系统对硬件资源的开销必须尽量的小,不能超过这些设备的限制。

硬件资源的开销包括存储模型参数的开销,以及识别过程中对内存、DSP 的运行时间的开销。

孤立词语音识别系统的DSP实现

孤立词语音识别系统的DSP实现

孤立词语音识别系统的DSP实现
0 引言在孤立词语音识别中,最为简单有效的方法是采用动态时间规整(Dynamic Time Warping,DTW)算法,该算法解决了发音长短不一的模板匹配问题,是语音识别中出现最早、较为经典的一种算法。

用于孤立词识别,该算法较现在比较流行的HMM 算法在相同的环境条件下,识别效果相差不大,但HMM 算法要复杂的多,这主要体现在HMM 算法在训练阶段需要提供大量的
语音数据,通过反复计算才能得到模型参数,而DTW 算法的训练中几乎不需
要额外的计算。

所以在孤立词语音识别中,DTW 算法仍得到广泛的应用。


系统就采用了该算法。

1 系统概述语音识别系统的典型实现方案如图1 所示。

输入的模拟语音信号首先要进行预处理,包括预滤波、采样和量化、加窗、断点检测、预加重等。

语音信号经过预处理后,接下来重要的一环就是特征参数提取,其目的是从语音波形中提取出随时间变化的语音特征序列。

然后建立声学模型,在识别的时候将输入的语音特征同声学模型进行比较,得到最佳的识别结果。

2 硬件构成2.1 系统构成这里采用DSP 芯片为核心(图2),系统包括直接双访问快速SRAM、一路ADC/一路DAC 及相应的模拟信号放大器和抗混叠滤波器。

外部只需扩展FLASH 存储器、电源模块等少量电路即可构成完整系
统应用。

tips:感谢大家的阅读,本文由我司收集整编。

仅供参阅!。

基于DSP的语音识别技术研究ppt

基于DSP的语音识别技术研究ppt
设置步骤: 1.设置 MP /MC =0,使芯片工作在微计算机方式下。 2.设置 OVLY=1,使片内的 0x80-0x7FFF 既映射在程序区, 又映射在数据区。 3.设置 DROM=1,以便在数据区访问片内的 ROM 区。
外部存储器扩展:
本系统扩展了两块64K×16bit的SRAM(IS61LV12816) 和一块256K×16bit的FLASH(AM29LV400B)来增加系统存储 空间。IS61LV12816是ICSI公司推出的一款高性能CMOS静 态RAM,速度范围8~15ns,电源3.3V。 扩展命令:
基于DSP的语音识别
---何绍富(101) 蔡光明(101) 陈冉冉(100) 徐珍 (99) 何玲 (99)
目 录
1、实验内容 2、总体方案 3、硬件设计 4、软件设计 5、实验结果
1、实验内容
本次实验的主要内容是通过在语音信号分析 的基础上,对线性预测编码倒谱系数LPCC与MEL倒 谱系数MFCC进行详细说明及分析,计算欧氏距离 为识别算法。对程序进行仿真测试分析后,选择 TMS320C6416为系统的核心。
#pragma DATA_SECTION(buffer,".EXT_RAM")
数据采集与传送模块
C6416片内包含三个多通道缓冲串行接口 McBSP(Multi-channel Buffered SerialPort), 分别为McBSP0、McBSP1、McBSP2。它支持全双工 通信、双缓冲数据寄存器允许连续的数据流,支 持多种传输方式(如T1/E1帧协议、MVIP帧协议等 ),数据字长可为8、12、16、24和32bit,内置 μ-律和A-律的压缩扩展硬件,并可直接与工业标 准的编码器、模拟接口芯片(AISC)及串行 AD/DA 器件连接并进行通信。

基于定点DSP的实时语音命令识别模块

基于定点DSP的实时语音命令识别模块

基于定点DSP的实时语音命令识别模块
何强;张歆奕;张有为
【期刊名称】《电子技术应用》
【年(卷),期】2000(026)007
【摘要】介绍一种基于定点数字信号处理器ADSP2181的实时语音识别系统.该系统可以实现100词以内的特定人语音识别.识别的准确率超过97%.
【总页数】3页(P51-52,62)
【作者】何强;张歆奕;张有为
【作者单位】北京航空航天大学电子工程系203室,100083;北京航空航天大学电子工程系203室,100083;广东江门五邑大学信息科学研究所,529020
【正文语种】中文
【中图分类】TN91
【相关文献】
1.一种基于定点DSP的语音识别算法实现 [J], 吕涛;刘百芬;燕贤青
2.基于定点DSP芯片实现的极低码率实时语音编解码器 [J], 吴芸;徐超
3.小词表实时语音识别系统的定点DSP实现 [J], 曾日波
4.基于定点DSP的G.723.1语音编码器的实时实现 [J], 汪国有;段敏涛
5.连续数字语音识别系统的定点DSP实时实现 [J], 周燕;张友纯;王蕾
因版权原因,仅展示原文概要,查看原文内容请购买。

LPC-10e语音编解码器定点DSP实现

LPC-10e语音编解码器定点DSP实现

LPC-10e语音编解码器定点DSP实现
艾浩军;胡瑞敏;刘赟;李德仁
【期刊名称】《数据采集与处理》
【年(卷),期】2000(015)003
【摘要】LPC-10e即美国联邦标准FS1015,是一种在2.4 kb ps码率下评价较好的语音编解码器.它以较低的算法复杂度实现了电话话音的质量,同样可应用于低带宽网络.该文在简单介绍了LPC-10e编解码算法的基本原理和定点数字信号处理器TMS320C2xx后,着重讨论了这种低速率语音编解码器在TMS320C2xx上实现定点算法的难点和相应的关键技术.最后的仿真实验结果表明,解码与合成实时处理平均运算量为8.1 MIPS .
【总页数】6页(P345-350)
【作者】艾浩军;胡瑞敏;刘赟;李德仁
【作者单位】武汉测绘科技大学多媒体网络通信工程研究所,武汉,430079;武汉测绘科技大学多媒体网络通信工程研究所,武汉,430079;武汉测绘科技大学多媒体网络通信工程研究所,武汉,430079;武汉测绘科技大学多媒体网络通信工程研究所,武汉,430079
【正文语种】中文
【中图分类】TN912.3;TN919
【相关文献】
1.一种基于定点DSP的语音识别算法实现 [J], 吕涛;刘百芬;燕贤青
2.数字语音电力线载波通信装置语音编解码器的实现 [J], 王水刚
3.基于定点DSP芯片实现的极低码率实时语音编解码器 [J], 吴芸;徐超
4.ITU-T G.723.1双速率语音编解码器定点DSP实现 [J], 王仁华;徐超;戴礼荣
5.定点DSP上双通道G.726语音编解码器 [J], 顾益芳;金伟正;辛庆勋
因版权原因,仅展示原文概要,查看原文内容请购买。

基于dsp的语音识别与合成技术

基于dsp的语音识别与合成技术

基于DSP的语音识别与合成技术摘要 (II)Abstract (III)一.概述 (1)1.语音识别 (1)2.语音合成 (1)3.国内研究历史及现状 (1)4.语音识别的流程 (1)5.语音信号分析方法分类时域特征 (1)6.基于Mel频率的倒谱MFCC (2)6.1 音框化(Frame blocking) (2)6.2 汉明窗(Hamming window) (2)6.3 快速傅利叶转换(FFT) (2)6.4 三角带通滤波器组(Triangular Bandpass Filters) (2)二.芯片概况介绍 (3)三.系统总体设计 (5)3.1 语音识别系统结构示意图 (5)系统结构示意图 (5)3.2 内部系统构成 (5)3.2.1 DSP (6)3.2.2 MCU (6)3.2.3 数据FLASH存储器 (6)3.3 系统内主要芯片的互联互控 (6)3.3.1 MCU与DSP (6)3.3.2 DSP与数据FLASH锁存器 (7)3.3.3 DSP与数据FLASH存储器 (7)四.结论 (7)参考文献: (8)六.课程总结: (8)第一章:离散时间信号与系统 (8)第二章离散傅里叶变换(DFT) (8)第三章快速傅里叶变换 (9)第四章 (9)第六、七章 IIR 、FIR数字滤波器的设计 (9)第八章硬件 (9)在如今信息社会,随着微电子的迅速发展,DSP芯片性能不断提高,用数字化的方法可以让语音的传送、储存识别、合成、增强成为整个数字化通信网中最重要、最基本的组成部分之一,随着信息科学技术的飞速发展,语音信号处理的研究也日益显示出它的要性,并取得了重大进展。

大体上说,语音信号处理技术可以分为以下四个面:即语音编码,语音合成、说话人识别和语音识别等。

以DSP芯片TMS320C5410为核心,制作了一个能实现语音识别的功能。

本设计主要包括DSP(TMS320C5410)、MCU(Intel 8031)模块、FLASH Intel 8031模块、液晶显示屏模块、蜂鸣器报警模块和供电模块等,系统由MCU实现总线控制,接收外界键盘输入,并在显示屏上显示信息。

基于定点DSP的数字对讲机语音编解码的研究

基于定点DSP的数字对讲机语音编解码的研究

基于定点DSP的数字对讲机语音编解码的研究随着社会经济的发展和科学技术的进步,当今社会对信息量的需求大大增加,需要处理和传输的信息量也就越来越大,对通信的要求也就越来越高,如安全保密性、多业务性、便捷性、无线终端低功耗性等。

因此,在尽可能少的频带上传输更多的信息在无线通信中显得更为重要。

为了实现高效率、高质量、高安全保障地传输信息这一目标,需要在发送端对信源信号做变换处理或在传输信号时做调制处理。

而在对讲机领域,业务也同样越来越多样化,但是频带资源又是非常宝贵的,因此占用过多带宽的模拟对讲机已经无法满足要求,未来的对讲机领域将是数字对讲机的天下。

目前全国正在积极进行研制自主知识产权的数字对讲机及相关协议的工作。

语音信号处理是数字对讲机的关键技术之一,能否在规定的带宽上实现语音通话,取决于能否对语音信号进行实时编解码处理。

本课题通过对语音信号处理的分析和研究,选用混合激励线性预测(MELP,Mixed Excitation LinearPrediction)算法来处理数字对讲机的语音信号。

在具体实现过程中,首先用Matlab(Matrix Laboratory)软件对MELP算法实现结构
进行了仿真和验证分析;然后,在德州仪器(TI,Texas Instruments)公司的DSP(Digital Signal Processor)硬件平台(TMS320VC5510DSK)上实现该算法结构的硬件验证实验;最后,对DSP硬件验证的实验数据与Matlab仿真的实验数据进行比较分析。

实验数据对比分析结果表明此算法能有效地实现对讲机中的语音压缩编码
与解压缩译码功能。

基于DTW算法语音识别系统的仿真及DSP实现

基于DTW算法语音识别系统的仿真及DSP实现

基于DTW算法语音识别系统的仿真及DSP实现
陈锡锻;王瑞;肖雄;洪涛
【期刊名称】《电声技术》
【年(卷),期】2013(037)012
【摘要】DTW(Dynamic Time Warping)算法的实现简单有效,在孤立词语音识别系统中得到了广泛的应用.采用谱减法进行前端去噪处理,利用Matlab对语音识别系统进行了仿真,并设计了一种以16位数字信号处理器TMS320VC5509为核心的孤立词语音识别系统.实验结果表明,系统能满足实时性能要求,识别效果良好.
【总页数】4页(P66-69)
【作者】陈锡锻;王瑞;肖雄;洪涛
【作者单位】浙江工业大学信息工程学院,浙江杭州310014;浙江工业大学信息工程学院,浙江杭州310014;浙江工业大学信息工程学院,浙江杭州310014;浙江工业大学信息工程学院,浙江杭州310014
【正文语种】中文
【中图分类】TN912
【相关文献】
1.基于DTW/SVM的语音识别系统在DSP中的实现 [J], 李攀;杨玮龙;厉剑
2.基于语音识别系统中DTW算法改进技术研究 [J], 陈立万
3.基于DTW和HMM算法的语音识别系统对比研究 [J], 王苏敏;廖晶晶;赵秀鸟
4.基于非线性取值DTW算法的鲁棒性语音识别系统 [J], 张宇昕;丁岩
5.基于DTW算法的语音识别系统实现 [J], 吴晓平;崔光照;路康
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图 3 MF C 特 征 提 取 过 程 C
说 话 人 识 别 建 模 的方 法 主 要 有 矢 量 量 化 ( VQ) 高 斯 、
混合模 型 ( GM M) 支 持 向 量 基 ( VM ) 人 工 神 经 网 络 、 S 、
( ANN) 以及 动 态 时 间 规 整 ( , DTW ) ] 等 。综 合 考 虑 嵌 入 式 系 统 上 算 法 的 识别 率 和 计 算 量 , 文 采 用 DTW 方 法 实 本 现 文 本 相 关 的 说话 人 识 别 。
1 系 统 组 成
说 话 人 识 别 系统 是 一 个 模 式 识 别 的过 程 , 体 上 分 为 总
两个 步 骤 : 一 个 步 骤 是 训 练 说 话 人 模 型 , 二 个 步 骤 是 第 第
通过 比对 模 型库 对 输 入 的信 号 进 行 说 话 人 识 别 。其 识 别 过程 如 图 1所 示 。
3 定 点 算 法 实 现 和 优 化
图 1 模 式 识 别 过 程
TDS DM6 2是 TI 司推 出 的定 点 DS 4 公 P芯 片 , 有 性 具 价 比高 、 运算 速 度快 的优 点 , 是 定 点 D P对 于 浮 点 运 算 但 S 比较 困难 , 此在 系 统实 现 时需 要 对 算 法 进 行 浮 点 到定 点 因 的 移植 。同 时 , 了使 D P上 的代 码 获 得 最 好 的 性 能 , 为 S 还 应该 根 据 TD DM6 2芯 片 片 内资 源 的特 征 进 行 优 化 。优 S 4
集 、 型 训 练 、 配 识 别 3个 任 务 。本 文 采 用 TDS 模 匹 DM6 2 4 E VM 平 台实 现 说 话 人 识 别 系 统 , 结 构 框 图如 图 2所 示 。 其 该 系 统 通 过 AI 3实 现 语 音 信 号 采 集 和 播 放 的 功 能 , C2 输
可 以 明 显 提高 代 码 执 行 速 度 , 减 小 代 码 尺寸 。 并
说 话 人 识 别 当 中 , 算 耗 时 最 长 的是 MF C参 数 的 计 C 提取 和参 数 模 型 Mco o t l r irc nr l s& E e d dS se s oe mb d e y tm
过 程 如 图 3所 示 。
为 数 字 处 理专 用 芯 片 在 复 杂 数 学 算 法 的实 现 上 起 着 越 来 越 重要 的作 用 。参 考 文 献 [ 3 DS 2在 P上 实 现 了 说 话 人 确
认 , 应用 于 汽 车声 纹 锁 。本 文 以 TI 司 的 TD DM6 2 并 公 S 4 E VM 为 平 台 , 现 了 实 时 的 说话 人 身 份识 别 系统 。 实
2 0 第3期 1 7年
WWW. s e . o c me n tc m. n
化 的方 法 有 编 译 优 化 、 件 流 水 、 软 内联 函 数 等 。通 过 优 化
在 训 练 注 册 阶 段 , 统 主 要 完 成 说话 人 的 特 征 提 取 以 系 及 模 型 特 征 库 的建 立 。在 识 别 阶 段 , 统 根 据输 入 的 语 言 系
信 号 提 取 相 应 的 特 征 , 后 再 与模 型 库 中 的模 型 进行 匹 配 然 判 决 , 后 给 出识 别 结 果 。 最 说 话 人 识 别 在 嵌 入 式 系 统 中 实 现 时 主 要 完 成 语 音 采
特 征 提 取 , 到模 型 建 立 , 说 话 人 识 别 中 涉 及 的 主 要 算 再 对
图 2 说 话 人 识 别 系 统 结构 框 图
法 进 行 了 详 细 的综 述 , 比 较 了各 种算 法 的优 劣 。 并
实 现 基 于 嵌人 式 的 实 时 说 话 人 识 别 系 统 是 说 话 人 识
别走 向应 用 的 关 键 步 骤 。 随 着 DS P技 术 的发 展 , P作 DS
2 系统 算 法描 述
说 话 人 识 别 的算 法 主 要 包 括 特 征 提 取 和 模 式 识 别 两 个 方 面 。MF C特 征 参 数 是 从 频 率 域 提 取 语 音 信 号 的 特 C 征 参 数 , 根 据 人 耳 的 听 觉 特 性 进 行 降 维 , 可 减 小 计 算 并 既 复杂 度 , 能 获 得 良好 的 识 别 效 果 。 MF C 特 征 提 取 又 C
进 行 身 份 认 证 的 一 种 生 物 特 征 识 别 技 术 。说 话 人 识 别 经 过 6 0多 年 的研 究 , 已经 逐 步 应 用 到 法 律 、 行 等 各 个 领 银
域 。说 话 人识 别 通 过 对语 音 信 号进 行 处 理 , 提取 说 话 人 语
音 当 中 的 生 物 学个 性 特 征 , 在特 征 空 间建 立 不 同个 体 的 特 征 模 型 , 而 实 现说 话 人 的 识别 。识 别 的关 键 算 法 包 括 特 从 征 提 取 和 建立 模 型 两 个 方 面 , 考 文 献 [ ] 基 本 概 念 到 参 1从
入 的 语 音 信 号 经 过 TDS DM6 2处 理 后 , 过 LE 显 示 识 4 通 D 别 结 果 。ROM 中包 含 说 话 人 识 别 程 序 和 训 练 出 的模 型 数
据 , 可 以 实 时 更新 。 S 并 DRAM 则 提 供 了 系 统 运 行 时所 需 的 内存 。
说 话 人 识 别 算 法 的定 点 D P实 现 S
申志 生 ’ 于 明 ,
( .河 北 工 业 大 学 信 息 工 程 学 院 , 津 3 0 0 ;2 1 天 0 4 1 .河 北工 业 大 学 计 算 机 科 学 与 软件 学 院 )
引 言
说 话 人识 别 又 称 声 纹识 别 , 通 过说 话 人 的 声音 特 征 是
相关文档
最新文档