数字语音处理及MATLAB仿真[张雪英]第一章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

18
数字语音处理及MATLAB仿真 张雪英编著
1. 说话人识别技术的应用
在电话与通信系统中, 在电话与通信系统中 , 智能语音接口正在把 电话机从一个单纯的服务工具变成为一个服务的 提供者”和生活“伙伴” “提供者”和生活“伙伴”。 目前, 自动口语分析 、 用户交换机 、 电话机 、 目前 , 自动口语分析、 用户交换机、 电话机、 手机已经包含了语音识别拨号功能, 手机已经包含了语音识别拨号功能,还有语音记事 本、语音智能玩具等产品也包含了语音识别与语音 合成功能。 合成功能。人们可以通过电话网络用语音识别口语 对话系统查询有关的机票、旅游、银行信息。 对话系统查询有关的机票、旅游、银行信息。
16
数字语音处理及MATLAB仿真 张雪英编著
1.3 语音信号处理的应用及新方向
一:语音信号处理的应用
语音技术的应用领域 包括语音识别、 说话人的鉴别和确认、 语种的鉴 包括语音识别 、 说话人的鉴别和确认 、 别和确认、关键词检测和确认、语音合成、 别和确认 、 关键词检测和确认 、 语音合成 、 语音 编码等。 编码等。 但其中最具有挑战性和最富有应用前景的为语音 但其中最具有挑战性和最富有应用前景的为 语音 识别技术。 识别技术。
语音编码与文本到语音转换两个主要区别 一、前者是人与人之间的话音交流,要保留 前者是人与人之间的话音交流, 说话人的声音特征。 说话人的声音特征 。 后者是文本到声音的转换即 计算机发声。它可以是标准播音员或其它声音。 计算机发声。它可以是标准播音员或其它声音。 二、前者不仅对压缩率和音质有要求,而且 前者不仅对压缩率和音质有要求, 要求较低的编、解码延迟。 要求较低的编 、 解码延迟 。 而后者对处理帧长没 有什么太严格的限制。 有什么太严格的限制。
wenku.baidu.com14
数字语音处理及MATLAB仿真 张雪英编著
1.2.3 语音识别
研究如何使计算机能够听懂人类的语言。 研究如何使 计算机能够听懂人类的语言。以 计算机能够听懂人类的语言 汉语语音为例:汉语约有400个音节, 400个音节 汉语语音为例:汉语约有400个音节,加上声调约 1200个音调节 个音调节, 1200 个音调节 , 把这些语音信号的特征存储到计 算机内,并与计算机接收到的汉语发音进行比较, 算机内, 并与计算机接收到的汉语发音进行比较, 找到特征相同的音节或音调节, 找到特征相同的音节或音调节 , 这个过程就是语 音识别。将识别出的音节序列转换成文字, 音识别 。 将识别出的音节序列转换成文字 , 就是 语言理解。 语言理解 。 许多算法将理解过程溶入到识别中来 提高识别的准确性。 提高识别的准确性 。 因此可以将语音识别与理解 归入同一类应用。 归入同一类应用。
1.1 概述
语音信号处理是一门新兴的边缘学科, 语音信号处理是一门新兴的边缘学科 , 是语音 学与数字信号处理两个学科相结合的产物。 学与数字信号处理两个学科相结合的产物 。 它和认 知科学、心理学、语言学、计算机科学、 知科学 、 心理学 、 语言学 、 计算机科学 、 模式识别 和人工智能等学科有着紧密的联系。 和人工智能等学科有着紧密的联系。 语音信号处理的目的: 语音信号处理的目的: 得到某些语音特征参数以便高效地传输或存储; 得到某些语音特征参数以便高效地传输或存储; 以便高效地传输或存储 通过某种处理运算以达到某种用途的要求。 通过某种处理运算以达到某种用途的要求。
19
数字语音处理及MATLAB仿真 张雪英编著
2. 语音合成的应用
公交汽车上的自动报站、 公交汽车上的自动报站、各种场合的自动报 自动报警、 时、自动报警、手机查询服务和各种文本校对中 的语音提示、在电信声讯服务:如股票、 的语音提示、在电信声讯服务:如股票、售后服 车站查询等信息; 务、车站查询等信息;也可用于基于微型机的办 教学、娱乐等智能多媒体软件, 公、教学、娱乐等智能多媒体软件,例如语言学 教学软件、语音玩具、语音书籍等; 习、教学软件、语音玩具、语音书籍等;也可与 语音合成技术与机器翻译技术结合, 语音合成技术与机器翻译技术结合,实现语音翻 译等。 译等。
8
数字语音处理及MATLAB仿真 张雪英编著
语音信息的交换大致上可以分为三大类: 语音信息的交换大致上可以分为三大类: (1)人与人之间的语言通信: )人与人之间的语言通信: 包括语音压缩与编码、语音增强等。 包括语音压缩与编码、语音增强等。 (2)第一类人机语言通信问题: )第一类人机语言通信问题: 语音合成,机器讲话、人听话的研究。 语音合成,机器讲话、人听话的研究。 (3)第二类人机语言通信问题:语音识别和理解 )第二类人机语言通信问题: 语音识别和理解:人讲话、机器听话的情况。 语音识别和理解:人讲话、机器听话的情况。
无法显示图像。计算机可能没有足够的内存以打开该图像,也可 能是该图像已损坏。请重新启动计算机,然后重新打开该文件。 如果仍然显示红色“x” ,则可能需要删除该图像,然后重新将其插 入。
课程总括
1 2 3 4
课程性质 课程目的和任务 课程重点 课程难点
2
2
数字语音处理及MATLAB仿真 张雪英编著
课程性质
9
数字语音处理及MATLAB仿真 张雪英编著
1.2 语音信号处理的发展
1 1876年 年 贝尔电话 的发明 2 1939年 年 第一个 声码器
3
19世纪 年代 世纪60年代 世纪
用声学方法对元音和 歌唱进行了研究
世纪40年代 世纪 4 20世纪 年代 5 语谱图仪问世
7
1948年 年 6 语谱图 系统论述语言 语音, 语音,语音合成 产生的声学理论 计算机 基础研究方面 技术应用领域
6
数字语音处理及MATLAB仿真 张雪英编著
第1章 绪论
1 2 3 4 5
1.1 概述 1.2 语音信号处理的发展 1.3 语音信号处理的应用及新方向 1.4 语音信号处理过程的总体结构 1.5 MATLAB在数字语音信号处 在数字语音信号处 理中的应用
7
数字语音处理及MATLAB仿真 张雪英编著
数字语音处理及MATLAB仿真 张雪英编著
数字语音处理及MATLAB仿真 仿真 数字语音处理及
太原理工大学信息工程学院 张雪英编著 College of Information Engineering, Taiyuan University of Technology
1
数字语音处理及MATLAB仿真 张雪英编著
17
数字语音处理及MATLAB仿真 张雪英编著
1. 说话人识别技术的应用
安全加密、 安全加密、银行信息电话查询服务 公安机关破案和法庭取证方面 在声控应用中,识别输入的语音内容, 在声控应用中 ,识别输入的语音内容, 并根据内容来执行相 应的动作,这包括了声控电话转换、声控语音拨号系统、 应的动作,这包括了声控电话转换、声控语音拨号系统、声 控智能玩具、信息网络查询、家庭服务、宾馆服务、 控智能玩具、信息网络查询、家庭服务、宾馆服务、旅行社 服务系统、医疗服务、股票查询服务和工业控制等。 服务系统、医疗服务、股票查询服务和工业控制等。
语音信号处理是通信、 语音信号处理是通信、电子信息专业的选 修课程,主要用于现代通信和电子信息领域, 修课程,主要用于现代通信和电子信息领域, 其主要前修专业基础课程为信号与系统和数字 信号处理。 信号处理。
3
数字语音处理及MATLAB仿真 张雪英编著
课程目的和任务
通过本课程的学习理解语音发声和听觉机理 及其数字模型;掌握语音信号处理的基本概念、 及其数字模型 ; 掌握语音信号处理的基本概念 、 原理和方法,为以后的学习提供理论依据; 原理和方法 , 为以后的学习提供理论依据 ; 掌握 语音信号的短时时域分析和频域分析方法, 语音信号的短时时域分析和频域分析方法 , 并且 能够用Matlab Matlab语言编程实现对实际语音信号进行 能够用 Matlab 语言编程实现对实际语音信号进行 的处理;熟悉语音信号处理的应用领域, 的处理 ; 熟悉语音信号处理的应用领域 , 并了解 该领域的新理论、新技术和发展趋势, 该领域的新理论 、 新技术和发展趋势 , 为今后的 进一步学习和工作打下坚实的基础。 进一步学习和工作打下坚实的基础。
10
突破进展
数字语音处理及MATLAB仿真 张雪英编著
1.2 语音信号处理的发展
1 2 3
语音合成
语音编码 语音编码
语音识别
11
数字语音处理及MATLAB仿真 张雪英编著
1.2.1
语音合成
以语言信息压缩、 以语言信息压缩、存储为主要目的对语音信 号数字模型进行研究,同时研究音素、音节、 号数字模型进行研究,同时研究音素、音节、词 组与句子的发音规则。 组与句子的发音规则。最终恢复出自然流畅的语 音来。例如文语转换系统(Text-to-speech)。语音 音来。例如文语转换系统 。 分析与合成将赋予计算机说话的功能。 计算机说话的功能 分析与合成将赋予计算机说话的功能。也是进行 话音编码、语音识别研究的基础。 话音编码、语音识别研究的基础。
5
数字语音处理及MATLAB仿真 张雪英编著
课程难点
语音信号的产生和激励、 语音信号的产生和激励 、 端点检测和基音周 期的估计、 期的估计 、 用数学公式来证明短时频谱是如何反 映整个语音信号的频谱的、 方程组解法、 映整个语音信号的频谱的 、 LPC方程组解法 、 自 方程组解法 适应预测编码原理、 适应预测编码原理 、 LBG算法以及实验中的分帧 算法以及实验中的分帧 和基音周期检测。 和基音周期检测。
15
数字语音处理及MATLAB仿真 张雪英编著
语音识别研究领域包括: 语音识别研究领域包括:
根据对说话人说话方式的要求, ( 1) 根据对说话人说话方式的要求 , 可以分 为孤立字语音识别系统, 为孤立字语音识别系统 , 连接字语音识别系统以 及连续语音识别系统。 及连续语音识别系统。 ( 2) 根据对说话人的依赖程度可以分为特定 人和非特定人语音识别系统。 人和非特定人语音识别系统。 根据词汇量大小,可以分为小词汇量、 ( 3) 根据词汇量大小 , 可以分为小词汇量 、 中等词汇量、 中等词汇量 、 大词汇量以及无限词汇量语音识别 系统。 系统。
4
数字语音处理及MATLAB仿真 张雪英编著
课程重点
语音信号的产生和语音信号数字模型。 语音信号的产生和语音信号数字模型。短时 能量、平均过零率、自相关的意义, 能量、平均过零率、自相关的意义,以及这些特 征参量在语音信号中的应用,并且会用 MATLAB 实现 MATLAB实现 。 短时频域分析的两种解释以及 实现。 实现、 的基本原理以及与语音模型的关系、 实现、LPC的基本原理以及与语音模型的关系、 的基本原理以及与语音模型的关系 自适应量化的PCM, 自适应预测编码原理以及 自适应量化的 , 前馈和反馈的主要区别, 前馈和反馈的主要区别,另外增量调制中所造成 的失真以及失真补偿。矢量量化原理、 的失真以及失真补偿。矢量量化原理、LBG算法 算法 以及实验。 以及实验。
12
数字语音处理及MATLAB仿真 张雪英编著
1.2.2 语音编码
语音编码的目的: 语音编码的目的: 在保证一定语音质量的前提下, 在保证一定语音质量的前提下 , 尽可能降低 编码比特率,以节省频率资源。 编码比特率,以节省频率资源。
13
数字语音处理及MATLAB仿真 张雪英编著
1.2.2 语音编码
20
数字语音处理及MATLAB仿真 张雪英编著
3. 语音编码的应用
在移动通信、卫星通信、军事保密通信、 在移动通信、卫星通信、军事保密通信、信息 高速公路和IP电话通信中的应用 电话通信中的应用。 高速公路和 电话通信中的应用。 在个人移动通信、语音存储、多媒体通信、 在个人移动通信、语音存储、多媒体通信、数 字数据网(DDN)中的应用。 中的应用。 字数据网 中的应用 未来的ISDN、 卫星通信 、 移动通信 、 微波接 、 卫星通信、 移动通信、 未来的 力通信和信息高速公路以及保密电话等中的应用。 力通信和信息高速公路以及保密电话等中的应用。
21
数字语音处理及MATLAB仿真 张雪英编著
二、语音信号处理的新方向
相关文档
最新文档