基于小波神经网络的嵌入式语音识别系统

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键 词 :小波 ;神 经 网络 ;语 音识 别 ;嵌入 式 系统
中图分类号:T 3 1 2 P 1. 5( 1) 9 02 — 2 07 99 2 2 0 — 08 0 0

引言
语音识别是将人类语音信号进行预处理、特征提取 ,然后和 测试 、训练 后存 储在 计 算机 中 的标准 模型 进行 比较 ,得 出判 定和 识别结果。从本质上讲,语音识别是通过先进的计算机 、信号处
摘要 :本 文介绍 了基 于嵌 入 式操作 系统 W idws E和 A no C RM 平 台的语 音识 别 系统 ,该 系统使 用 了小 波神 经网络 技 术。 系统 使 用 ¥C 40芯 片进 行控 制和语 音识 别 ,使 用 S C 0 1 片 完成训 练算 法 、语 音信 号特 征提 取 ,具有 较好 的 可移植 3 21 P E 6A芯 性 ,在 小波神 经 网络 算 法的帮 助下 ,系统有较 高的识 别率 。
理技 术将 语音 信号 转变 为计 算机 可 以识别 的 二进 制编码 ,并进行 处理 的技 术 。语音 识别 技术 在智 能家 电、工 业现场 控制 、机 器人
等领 域有 广 阔的应 用前 景 。
早期 的 语音 识别技 术 多基 于线 性系 统理 论 ,但人 的发 音是 复
杂 的非线 性过 程 , 以线 性 系统 理论 为基 础 的语音 识别 技术 局 限性 较大 。近 年 来 ,非线 性技 术逐渐 运 用 到了语 音识 别领 域 ,国 内外 学者 研 究较 多的 理论 有人工 神经 网络 、 小波变 换 等非线 性技 术 。 小波 变 化具 有时 频局部 性等 特 点 , 经 网络具有 自适 应性 好 、 神 容错 性 强等 优 点,结 合 以上两 种技 术 的优 点 ,本 文介 绍 了一种 基 于小 波变 换 神经 网络 的嵌 入式 语 音识别 系统 ,该系统 是智 能轮 椅 的组 成 部分 ,可 以让 轮椅 使用 者通过 语 音直 接控 制轮椅 的行 动 。
( 四)系 统工 作原 理
蕞 礞 瘦 歪 致 童 占
天 童 _ 毪坦加霉 . 』 日嚣 聋_ _ 字 喧提 他_羹 ¨ + + 特 刀

智能 轮椅 语音 识别 系统 的工 作分 为语 音训 练 、语 音识 别两 个 过程 。系 统工 作原 理如 图 3 示 。 所
的开 发难 度 。
对于 意 本 : 尸 XP, 任 样 P 1 2 , …,

)期 输 、望出

( , , 1 …, 2
) 该 习 法 能 步 行, 到 ,学算都按执 直
l I
三 、语 音识 别算法 研 究 ( )小波技 术 一 噪声 是语 音 识别 的重 要 问题 ,噪 声将造 成 训练 环境 和 识别环 境 不 匹配 , 降低语 音识 别 系统 的可 靠 性 ,在本 文 介绍 的系统 中, 使 用 小波 变换 实现 对信 号 的 降噪处 理 。小波 变 换具 有低 熵 、多 分 辨 率 、去 相关 性 、选基 灵活 等优 点,适 合用 于对 语 音信 号进 行 降
噪。
满 足输 入输 出要求 。
四 、系统 软件 设计 软 件系 统 在微 软 Mi oot m edd i a c+ c sfE b de s l + 环境 下完 成 。 r vu c+ + 包含 有 Widw E专用 开 发工 具 , 以方便 的创 建 、 改 和 no s C 可 修 测 试 应 用 程 序 , 编 译 后 的 程 序 可 以 通 过 JA 接 口 下 载 到 TG
其中 f ) 有用 , k是 信号,e ) ( ( 是噪声,s ) k ( 是含有噪 信 k 声的
号 , 以该模 型 为例 ,小 波 阈值去 噪主 要有 下面 3个步骤 : 1 号小波 分 解 。 . 信 选择 小 波并 确定 分解 层数 N, 对信 号 进行 N
层 小波 分解 ; 2高频 系数 阈值 量化 。对 各分 解尺度 下 的 高频 系数选 择 阈值 , .
的提 取 提供 了保 障 。 ( )神经 网络 技 术 二 模 式 匹配是 语音 识 别的 重点 ,本 文介 绍 的系统 采用 了 B P神 经 网络 作为 训练 模型 ,依次 训练 样本 特 征矩 阵 、待测 特征 矩 阵,
如下:
图 5系 统主 流程 图
五 、实验
系统 软 、硬件 联调 通 过后 ,将 语音 识 别系 统安 装在 智 能轮椅 上 ,正常 工作 状态 下 ,通 过话 筒下 达 “ 进 ” 向后退 ” 向左 前 、“ 、“
语 加 l语 忙 4 立 、 圆 毒 端 日

障碍物 、轮椅 电量 不足 时 ,系 统 以语 音方 式及 时提 醒主 人 。语 音 交互 功能 要求 系统可 以识别 主人 的语 音指 令 ,实现 前进 、 后退 、 转 向等 功 能 。本文 主要介 绍语 音交 互 功能 的实现 。
( )语音 识别 原理 概述 一
现 有技 术条 件下 ,语 音 识别 一般 分为 两个 步骤 ,第 一步 是系
统 训练 , 二步 是语 音识 别 。 系统 训练 阶段 , 心任 务是基 于选 第 在 核 定 的识 别方 法 ,建立 基本 语音 单 元的 声学模 型 ,进 而得 到语 音特 征 参数 ,这 一过 程也 称 为 “ 学习 ” 。在 语音 识别 阶段 ,系统使 用特 定 算法 提取 语音 信 号 的特 征 参数 ,根 据一 定判 别准 则和 系统 模型 进行 比较 ,得 出识别 结果 。语 音识 别 的原理 如 图 1 示 。 所
计 算机 光盘 软件 与应 用
21 年第 0 02 9期
C m u e DS f w r n p l c t o s o p t rC o ta ea dA p ia in 工 程 技 术
基于小波神经网络的嵌入式语音识别系统
贾晶
( 江西农业 大学,南昌 30 3 ) 3 0 8
件 结构 如 图 2 示 。 所

图 3 系 统工 作原 理
语 音训练 时,S C 0 1 芯片使用 神经 网络算法对 话筒传 来 的 P E 6A 语音信 号进行模 板训练 , 训练 结果保存在 Wi o S E特定 目录下 , n WC d
作 为语 音识别 的参考样 本 。进行 语音识 别时 ,S c 0 1 芯片首 先 P E 6A 对采集 到的语音 信号进行 处理 ,然后将 结果传送 给 Wi o E n WS , d C 嵌入式 操作系 统将待 识别信 号和 参考样 本进行 比较 , 出最 接近 的 找
二 、 系统设 计
图 2 系 统硬 件结 构 图 ¥ C 4 0处 理 器 使用 A 3 21 RM9 O 内核 , 内部 时钟 可 以达 到 2T 2 0 z 可 以实现 复杂 的控 制算 法 。 3 2 1 有 17 I 接 口 0 MH , ¥C 4 0 1个 / O 和2 4个外 部中 断源 ,内置 U B控制 器 、 MA 控制 器 、 AR S D U T控 制 器 、I I 制器 等 ,可 以有效 简化 外 围电路 。 C控 S C 0 1 芯片 是 l P E 6A 6位微 控制 器 ,芯片集 成 了 MC U、AD、 / D A、 AM 和 R M , / R O 具有较 高运 算速 度 , 可支 持 1 中断 向量 、 0个 1 4中断源 , 中断处 理 能力较 强 , 用其 进行 实 时语音 处理 比较 合 适 。 S C 0 1 支 持带 自动 增益 控制 功 能( G ) P E 6A A c 的麦 克风 输 入方 式 , 可 以有 效减 小 系统硬 件复 杂度 。 ( )系 统功 能 三 根 据 智能轮 椅 的功 能 ,嵌入式 语 音识 别系 统需 要实 现语 音提 示和语 音 交互 两类 功能 。其 中 ,语音 提示 功能 要求 当轮 椅检 测 到
转 ”等 命 令 ,系统 可 以正 确 的进行 预处 理 、编码 等 ,并 根据 经神 再 比较 两次 训练 的权 值 ,实现 对 语音 信 号的识 别 ,算 法具 体 步骤 经 网络 算 法得 出语 音识 别 结果 ,通 过控制 ¥ C 4 0的 I 口驱 动 3 21 / O
智 能轮 椅 完成 相应 动作 。经过 7 实验 ( 组 5 组 每 0次 ) ,系 统正 确 置 较 小 的非 零 随机 数 ,其 中
并 进行 软 阈值 量化 处理 ;
3一维 小 波重 构 。根 据 小波 分解 后 的底 层低 频 系 数 、各 层高 .
频 系数 ,进 行一 维小 波重 构 ; 在 以上 步骤 中,阈值 的选择 、如何 进行 阈值 量化 是 关键 因素 ,
决 定着 信号 降 噪的效 果 。 本文 所述 系统 使用 S m 小波 进 行 4层分 y 解 ,采 用 H usr er e阈值选 取 法 ,只对 小 波分 解第 一 层的 阈值 进行 u 调整 ,经过 实验 ,该方 法获 得 了 比较 好 的去 噪效 果 ,为特 征 参数


把 } 刚 I 弱 圳
— —
图 1语音 识别 原理 在 本 文介 绍 的系统 中 ,信号 预处 理后 得 到的特 征参 数将 在神 经 网络 中进 行 处理 。进行 语 音识 别 时,话 筒采 集 的实 时信 号经过 滤 波 、预加 重等 处理 后将 进 行特 征提 取 ,然后 和语 音库 中 的特征 参 数进 行模 式 匹配 ,最接 近 的模 式将成 为语 音 识别 的结 果 。 ( )系统 硬件 设计 二 系 统 以凌 阳公 司 s C 0 1 芯片 、 P E6A 三星 公 司 ¥ C 40处理 器 32 1 为核心 , 置接 口电路 、存 储 电路 、控 制 电路 ,¥C 4 0 现识 别 外 3 21 实 和控 制 功 能,S C 0 1 完成信 号特 征提 取 和训 练算 法 。系统 硬 P E 6A
21 第 O 0 2年 9期 C m u e D S fw r n p lc t o s o p t rC o t a ea dA p i a i n 工 程技 术
化 的硬 件 驱动 接 口,它让 开 发者 不必 关心 设 备工 作 的细节 ,通 过 标 准 化 的系 统调用 就 可 以控制 特 定硬 件设 备 ,降低 了嵌入 式系 统
用 子程序 ,实现 相应 的控 制 ,子 程序 包括 识别 子程 序 、播 放子 程 序 、功 能子程 序 等 。图 4为系 统软 件主 程序 流程 图。
声 强随 时 间变化 的一 维信 号 ,可 以用 数学 模 型表 示为 :
S ) f )£e ) = ,…n 1 ( = ( + .kk 0,,一, k k (, 1
AR S C 4 0芯片 中进 行调 试 。 M9 3 2 1



系 统软 件 由主 程序 和子 程序 组成 ,主程序 协 调整 个系 统 并调
在 小波 去 噪 的各类 方法 中, 阈值 去 噪 实现相 对 简单 ,去 噪效 果 也 比较好 。阈值 去噪 的基 本原 理 是对 小波 分解 后各 层 系数 中模 大 于 阈值 、小 于 阈值 的系数 分别 进行 处 理 ,再对 处理 完 的小 波系 数进 行 反变 换 ,重构 出的信 号 噪声会 得 到有 效 降低 。语 音信 号是
指令作 为识别 结果 ,最 后 由 Wi O E调用 函数 ,控制 ¥C 4 0 n WS d C 3 2 1 的 I 口,完成相 应 的功能 ,如 前进 、转 向等 。 / O
Wid ws E拥 有 丰富 的设 备驱动 程序 , no C 为开发 者提 供 了标 准
28 一
计算 机 光盘 软件 与应 用
相关文档
最新文档