《语音信号处理》期末试题总结
(完整)《语音信号处理》期末试题总结,推荐文档

2011-2013学年《语音信号处理》期末考试试题适用班级:时量:120分钟闭卷记分:考生班级:姓名:学号:注:答案全部写在答题纸上,写在试卷上无效!一、填空题:(每空2分)1、矢量量化系统主要由编码器和译码器组成,其中编码器主要是由搜索算法和码书构成。
P1012、基于物理声学的共振峰理论,可以建立起三种实用的共振峰模型:级联型、并联型和混合型。
P183、语音编码按传统的分类方法可以分为波形编码、参数编码和混合编码。
P1374、对语音信号进行压缩编码的基本依据是语音信号的冗余度和人的听觉感知机理。
P137-1385、汉语音节一般由声母、韵母和声调三部分组成。
P106、人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉的掩蔽效应。
P227、句法的最小单位是词,词法的最小单位是音节,音节可以由音素构成。
P98、复倒谱分析中避免相位卷绕的算法,常用的有微分法和最小相位信号法。
P629、语音信号处理也可以简称为语音处理,它是利用数字信号处理技术对语音信号进行处理的一门学科,包括语音编码、语音合成、语音识别、说话人识别和语音增强等五大分支。
P310、语音信号处理也可以简称为语音处理,它是以数字信号处理和语音学为基础而形成的一个综合新的学科,包括发音语音学、声学语音学、听觉语音学和心理学等四大分支。
P2,611、语音的四大要素:音质、音调、音强和音长。
P912、人类发音过程有三类不同的激励方式,因而能产生三类不同的声音,即浊音、清音、和爆破音。
P813、元音的一个重要声学特性是共振峰,它是区别不同元音的重要参数,它一般包括共振峰频率的位置和频带宽度。
14、语音信号的倒谱分析就是求取语音倒谱特征参数的过程,它可以通过同态信号处理来实现。
P56二、判断题:(每小题2分)√×1、预测编码就是利用对误差信号进行编码来降低量化所需的比特数,从而使编码速率大幅降低。
(×)P1432、以线性预测分析-合成技术为基础的参数编码,一般都是根据语音信号的基音周期和清/浊音标志信息来决定要采用的激励信号源。
语音信号处理总复习资料

Ch1 绪论§1.1 语音信号处理概述一、语音、语音信号处理的名词解释1、语音:是语言的声学表现,是声音和意义的结合体,是相互传递信息的重要手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。
2、语音信号处理:是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及很广的交叉学科。
二、语音学的名词解释(集中备课)语音学:是研究言语过程的一门科学,它包括三个研究内容:发音器官在发音过程中的运动和语音的音位特性;语音的物理特性;以及听觉和语言感知。
§1.2 语音信号处理的发展概况一、语音编码、语音合成、语音识别名词解释(参见大纲)1、语音编码:语音编码技术是伴随着语音信号的数字化而产生的,目前主要应用在数字语音通信领域。
2、语音合成:语音合成的目的是使计算机能像人一样说话。
3、语音识别:语音识别是使计算机判断出所说的话得内容。
Ch2 基础知识§2.2 语音产生的过程一、语音、清音、浊音1、语音:声音是一种波,能被人耳听到,振动频率在20Hz-20kHz之间。
语音是声音的一种,它是由人的发音器官发出的、具有一定语法和意义的声音。
语音的振动频率最高可达15kHz左右。
2、人类生成语音过程可分为神经和肌肉的生理学阶段和产生语音波、传递语音波的物理阶段。
3、浊音、清音:语音由声带振动或不经声带振动来产生,其中由声带振动产生的音统称为浊音,而不由声带振动产生的音统称为清音。
浊音中包括所有的元音和一些辅音,清音包括另一部分辅音。
二、语音的产生过程:空气从肺部排出形成气流。
空气通过声带时,如果声带是紧绷的,则声带将产生张弛振动,即声带周期性地开启和闭合。
声带开启时,空气流从声门喷射出来,形成一个脉冲;声带闭合时相应于脉冲序列的间歇期。
三、基音周期、基音频率基音周期:声带开启和闭合一次的时间即振动周期称为音调周期或基音周期。
基音频率:基音周期的倒数称为基音频率,简称为基频。
语音信号的考试部分知识点

语音信号处理复习资料一、名词解释:1、基音周期:声带开合一次的时间为基音周期(pitch period)。
它的倒数称为基频。
2 、音色:也叫音质;由混入基音中的倍音决定。
3 、音高:声音的高低;主要用基频反映。
基频值越大,反映出的音高越高。
4、音强:发音的轻重;可以用声压或声强来表示声音的强度,一般用相对声压或相对声强表示。
5、音长:声音的长短,取决于发音持续时间的长短。
6、响度:是一种主观心理量,主观感觉到的声音强弱的一种衡量标准,它与频率有关。
一样的音强,不一样的频率,则响度也会有所不同。
7、听觉掩蔽效应:一个更响的音调可以将其频率附近的较低的音调掩蔽。
可以分为同时掩蔽和异外时掩蔽。
8、临界频带:一个纯音可以被以它为中心频率,且具有一定带宽的连续噪声所掩蔽,如果在这一频带内噪声功率等于该纯音的功率,这时该纯音处于刚好能被听到的临界状态,即称这一带宽为临界带宽。
临界带宽有许多近似表示,一般在低于500 Hz的频带内,临界带宽约为100Hz,在高于500Hz 时,临界带宽约为中心频率的20% 。
人耳的基底膜具有与频谱分析仪相似的作用。
频率群的划分相应地将基底膜分成许多小的部分,每一部分对应一个频率群。
掩蔽效应就是在这些频率群内发生,这是因为对应的那一频率群的基底膜部分的声音,在大脑中似乎是叠加在一起来评价的,如果这时同时发声,可以互相掩蔽。
9、采样的基础知识:对于一个有限带宽的模拟信号,其频谱的最高频率为F0,在对其进行采样时,其采样频率在Fs>2F0时,采样后的信号才能保证信息不丢失。
语音信号中人耳可以感知的最大频率在3.4KHz左右采样频率在8KHz~16KHz之间短时分析:内平稳语音信号是一种随时间而变化的信号,可能是浊音激励也可能是清音激励,浊音的基音周期以及信号幅度等语音特性也都随时间变化,但这种变化是缓慢的,在一小段短时间内10~30ms,语音信号近似不变。
于是,我们把变化的语音信号分成一些相继的短时间段来处理。
语音信号处理_考试参考题(修订版)(1)

语⾳信号处理_考试参考题(修订版)(1)⼀、填空题:(每空1 分,共60分)1、语⾳信号的频率范围为(300-3400kHz),⼀般情况下采样率为(8kHz )。
书上22页2、语⾳的形成是空⽓由(肺部)排⼊(喉部),经过(声带)进⼊声道,最后由()辐射出声波,这就形成了语⾳。
书上11页。
肺中的通过(稳定)的⽓流或声道中的⽓流激励(喉头⾄嘴唇的器官的各种作⽤)⽽产⽣。
当肺中的⽓流通过声门时,声门由于其间⽓体压⼒的变化⽽开闭,使得⽓流时⽽通过,时⽽被阻断,从⽽形成⼀串周期性脉冲送⼊声道,由此产⽣的语⾳是(浊⾳)。
如果声带不振动,声门完全封闭,⽽声道在某处收缩,迫使⽓流⾼速通过这⼀收缩部位⽽发⾳,由此产⽣的语⾳是(清⾳)。
3、语⾳信号从总体上是⾮平稳信号。
但是,在短时段(10~30)ms中语⾳信号⼜可以认为是平稳的,或缓变的。
书上24页4、语⾳的四要素是⾳长,⾳强,⾳⾼和⾳质,它们可从时域波形上反映出来。
其中⾳长特性:⾳长(长),说话速度必然慢;⾳长(短),说话速度必然快。
⾳强的⼤⼩是由于声源的(震动幅度)⼤⼩来决定。
5、声⾳的响度是⼀个和(振幅)有密切联系的物理量,但并不就是⾳强。
6、⼈类发⾳过程有三类不同的激励⽅式,因⽽能产⽣三类不同的声⾳,即(浊⾳)、(清⾳)和(爆破⾳)。
7、当⽓流通过声门时声带的张⼒刚好使声带发⽣较低频率的张弛振荡,形成准周期性的空⽓脉冲,这些空⽓脉冲激励声道便产⽣浊⾳如果声道中某处⾯积很⼩,⽓流⾼速冲过此处时⽽产⽣湍流,当⽓流速度与横截⾯积之⽐⼤于某个门限时(临界速度)便产⽣摩擦⾳,即(清⾳)。
8、如果声道某处完全闭合建⽴起⽓压,然后突然释放⽽产⽣的声⾳就是(爆破⾳)。
9、在⼤多数语⾳处理⽅案中,基本的假定为语⾳信号特性随时间的变化是(平稳随机)的。
这个假定导出各种(线性时不变)处理⽅法,在这⾥语⾳信号被分隔为⼀些短段再加以处理。
10、⼀个频率为F。
的正弦形信号以Fs速率抽样,正弦波的⼀周内就有(Fs/F0)个抽样。
东南大学语音信号处理期末考试复习总结(全面)

语音信号处理是研究数字信号处理技术对语音信号进行处理的一门科学语音:是声音和语言的结合体,是一连串的音组成的语言的声音。
人的说话过程:想说,说出,传送,接收,理解。
句法的最小单位是单词,词法的最小单位是音节。
语音特征:音色,音调,音强,音长。
语音音素:元音和辅音。
辅音包括浊音(声带振动)和清音共振峰:元音激励进入声道时引起共振特性,产生一组共振频率。
基音频率:浊音的声带振动的基本频率。
汉语是一种声调语言,声调具有辩义作用。
声调的变化就是浊音基音周期的变化。
汉语音节的一般结构:声带,韵母,声调对发音影响最大的是声带。
基音周期:声带每开启和闭合一次的时间,倒数就是基音频率。
语音听觉系统:耳:内耳(将机械信号转化为神经信号),中耳(声阻抗变换),外耳(声源定位和声音放大)。
掩蔽效应:在一个强信号附近,弱信号将变得不可闻。
被掩蔽掉的不可闻信号的最大声压级称为掩蔽门限或掩蔽阈值。
掩蔽效应:同时掩蔽和短时掩蔽。
同时掩蔽:存在一个弱信号和一个强信号频率接近,强信号会提高弱信号的听阀,当弱信号的听阀被升高到一定程度就会导致这个弱信号弱不可闻。
短时掩蔽:当A声和B声不同时存在时也存在掩蔽作用,称为短时掩蔽。
语音信号生成的数学模型:激励模型(一般分为浊音激励和清音激励),声道模型(一般分为声管模型和共振峰模型,共振峰模型又分为三种:级联,并联,混合型),辐射模型。
浊音激励模拟成是一个以基音周期为周期的斜三角脉冲串。
可以把清音模拟成随机白噪声。
完整的语音信号的数学模型的传输函数H(z) = AU(z)V(z)R(z).一阶高通形式的R(z)=R0(1-z^(-1)) 把和时序相关的傅里叶分析的显示图形称为语谱图。
语谱图是一种三维频谱,它是表示语音频谱随时间变化的图形。
第三章:语音信号分析1.参数性质不同:时域,频域,倒频域。
分析方法:模型分析法(根据语音信号产生的数学模型来分析和提取表征这些模型的特征参数)和非模型分析法(时域,频域,倒频域)。
语音信号处理复习题

语音信号处理复习题1 由下面的WAV文件读出语音的编码信息:52 49 46 46 A4 9A 7B 01 57 41 56 45 66 6D 74 20 10 00 00 00 01 00 02 00 44 AC 00 00 10 B1 02 00 04 00 10 00 64 61 74 61 80 9A 7B 01 42 FF 35 FC E2 FE 07 00 E7 FE AF 03 5F FF 65 01.....................176,40004 004Block align =(0004) 16= 410 0016Bits/sample = (0010) 16= 16编码(Code)内容(Contents)批注(Notes)数据子区块(datasub_chunk)64 61 74 61d a t a80 9A 7B0124,877,696Size:(017B9A80) 16 = 24,877,69642 FF 35 FC L= 65,346,R=64,565(FF42) 16= 65,346(FC35) 16= 64,565E2 FE 07 00L= 65,250,R= 7(FEE2) 16= 65,250 (0007) 16=7E7 FE AF 03L= 65,255,R=943(FEE7) 16= 65,255 (03AF) 16=9435F FF 65 01L= 65,375,R= 357(FF5F) 16= 65,375 (0165 ) 16=3572 画出语音信号的产生模型,简述语音的产生过程。
语音的形成过程—空气由肺部排入喉部,经过声带进入声道,最后由嘴辐射出声波,形成语音。
3 为生么语音信号要进行“短时”分析。
答:语音信号特性是随时间变化的,是一个非平稳的随机过程,但在一个短时间范围内其特性基本保持不变,即语音信号具有“短时平稳性”,因而可将语音信号看成准平稳过程,对其进行短时分析.4 语音信号的时域分析方法有那些?答:短时能量,短时平均过零率,短时自相关函数5 语音信号频率范围是多少?答:语音信号的频率大约在20Hz~20KHz。
语音信号处理复习

自相关法
基音检测
倒谱法
简化逆滤波法(SIFT)
共振峰估值
1. 带通滤波器法 2. DFT法
3. 倒谱法
4. LPC法
第9章思考题
1.基音检测的自相关法中的中心削波处理的思路 及实现过程? 2.用倒谱法实现基音检测和共振峰检测的原理及 实现框图?
•语音编码的概念、应用和分类等 •语音信号的压缩编码原理 • 语音通信中的语音质量 •脉冲编码调制(PCM)及其自适应
时变线性 系统
语音取样值
时变参数
第2章思考题:
1. 什么叫语言?什么叫语音? 2. 人类的发音器官包括哪些?在发音时各起了什
么作用? 3. 解释以下概念:基音频率、共振峰、浊音、清
音。 4. 语音信号模型包括哪些子模型?激励模型和辐
射模型各属于什么性质的滤波器?
第3章语音信号的时域分析
•语音处理的目的 •语音信号分析方法
1.什么叫做隐马尔可夫过程?为什么说语 音信号可以看成隐马尔可夫过程?
2. HMM模型的结构主要有哪两种?它们 的特点是什么?
3.隐马尔可夫模型有哪些模型参数?请 叙述这些参数的含义和定义式。
根据某状态HMM模型,每一种路 径输出某某符号的概率计算。
语音检测分析——语音特征参数的提取和分析。
主要包括:基音检测和共振峰参数的估值。
NT
•短时傅里叶变换的取样率 •语音信号的短时综合 滤波器组求和法
•语谱图
可同时在时间和频率上显示语音频谱随 时间的变化。
第4章思考题:
1. 短时傅里叶变换的定义式是什么?短时傅 里叶变换的两种解释是什么? 如何提高短 时谱的频率分辨率?
2. 在求语音信号的短时谱时,对窗函数有什 么要求? 对语音信号频谱分析采用海明窗 和矩形窗各有什么特点?
《语音信号处理》期末试题总结

《语音信号处理》期末试题总结语音信号处理期末试题总结在本学期的《语音信号处理》课程中,我们学习了很多有关语音信号处理的基本理论和方法。
本文将对这门课程的期末试题进行总结和回顾,以便加深对所学知识的理解和掌握。
一、语音信号处理的基本概念1. 语音信号的特点和基本原理在语音信号处理的学习中,我们首先了解了语音信号的基本特点。
语音信号是一种时间变化的连续信号,具有频谱特性和时域特性。
我们学习了频域分析和时域分析方法,如快速傅里叶变换(FFT)和数字滤波器的设计等。
2. 语音信号的采样和量化在语音信号处理中,我们需要对语音信号进行采样和量化,以便能够进行数字信号处理。
我们学习了采样定理和抽样频率的选择,以及量化误差和比特率的计算方法。
3. 语音信号的预处理在语音信号处理中,预处理是非常重要的一步。
我们学习了语音信号的预加重和去噪等预处理技术,它们可以提高语音信号的质量和可靠性。
二、语音信号处理的主要方法和技术1. 语音信号的特征提取为了能够对语音信号进行识别和分析,我们需要抽取出其特征。
我们学习了语音信号的短时能量、过零率、梅尔频率倒谱系数(MFCC)等常用的特征提取方法。
2. 语音信号的基本模型为了对语音信号进行建模和分析,我们学习了基于线性预测编码(LPC)的声道模型和声源模型。
这些模型可以帮助我们理解语音信号的生成过程,并对其进行分析和处理。
3. 语音信号的合成和变换在语音信号处理中,我们不仅关注对语音信号的分析,还关注对语音信号的合成和变换。
我们学习了基于线性预测编码的语音合成方法和语音变换方法,例如声码器的设计和声音的转换等。
三、语音信号处理的应用领域1. 语音识别语音识别是语音信号处理的一个重要应用领域。
我们学习了基于隐马尔科夫模型(HMM)的语音识别方法,以及声学模型和语言模型的训练和应用技巧。
2. 语音合成语音合成是将文本转换为语音信号的过程。
我们学习了基于拼音的语音合成方法和基于声道模型的语音合成方法,它们可以用来生成自然流畅的语音。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2011-2013学年
《语音信号处理》期末考试试题
适用班级:时量:120分钟闭卷记分:
考生班级:姓名:学号:
注:答案全部写在答题纸上,写在试卷上无效!
一、填空题:(每空2分)
1、矢量量化系统主要由编码器和译码器组成,其中编码器主要是由搜索算法和码书构成。
P101
2、基于物理声学的共振峰理论,可以建立起三种实用的共振峰模型:级联型、并联型和混合型。
P18
3、语音编码按传统的分类方法可以分为波形编码、参数编码和混合编码。
P137
4、对语音信号进行压缩编码的基本依据是语音信号的冗余度和人的听觉感知机理。
P137-138
5、汉语音节一般由声母、韵母和声调三部分组成。
P10
6、人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉的掩蔽效应。
P22
7、句法的最小单位是词,词法的最小单位是音节,音节可以由音素构成。
P9
8、复倒谱分析中避免相位卷绕的算法,常用的有微分法和最小相位信号法。
P62
9、语音信号处理也可以简称为语音处理,它是利用数字信号处理技术对语音信号进行处理的一门学科,包括语音编码、语音合成、语音识别、说话人识别和语音增强等五大分支。
P3
10、语音信号处理也可以简称为语音处理,它是以数字信号处理和语音学为基础而形成的一个综合新的学科,包括发音语音学、声学语音学、听觉语音学和心理学等四大分支。
P2,6
11、语音的四大要素:音质、音调、音强和音长。
P9
12、人类发音过程有三类不同的激励方式,因而能产生三类不同的声音,即浊音、清音、和爆破音。
P8
13、元音的一个重要声学特性是共振峰,它是区别不同元音的重要参数,它一般包括共振峰频率的位置和频带宽度。
14、语音信号的倒谱分析就是求取语音倒谱特征参数的过程,它可以通过同态信号处理来实现。
P56
二、判断题:(每小题2分)√×
1、预测编码就是利用对误差信号进行编码来降低量化所需的比特数,从而使编码速率大幅降低。
(×)P143
2、以线性预测分析-合成技术为基础的参数编码,一般都是根据语音信号的基音周期和清/浊音标志信息来决定要采用的激励信号源。
(×)P181
3、自适应量化PCM就是一种量化器的特性,能自适应地随着输入信号的短时能量的变化而调整的编码方法。
(×)P142
4、线性预测法正是基于全极点模型假定,采用时域均方误差最小准则来估计模型参数的。
(×)P72
5、波形编码是依赖模型假定的语音编码方法。
(×)P137
6、掩蔽效应是使一个声音A能感知的阀值因另一个声音B的出现而提高的现象,这时A叫
掩蔽声,B叫被掩蔽声。
(√)P22
三、单项选择题:(每小题3分)
1、下列不属于衡量语音编码性能的主要指标是(B)。
(A)编码质量(B)矢量编码(C)编码速率(D)坚韧性
2、下列不属于编码器的质量评价的是(D)P172
(A)MOS (B)DAM(C)DRT(D)ATC
3、有限词汇的语音合成技术已经比较成熟了,一般我们是采用(A)作为合成基元。
P9
(A)词语(B)句子(C)音节(D)因素
4、标量量化和矢量量化在概念上是相互对应的,那么标量量化中的量化值对应着矢量量化中的(C)P94
(A)胞腔(B)量化矢量
(C)码书(D)量化区间
5、矢量量化器大致可以分为无记忆矢量量化器和有记忆矢量量化器两类,下列不属于无记忆矢量量化器的为(D)。
P104
(A)全搜索矢量量化器(B)树搜索矢量量化器
(C)多极矢量量化器(D)自适应矢量量化器
6、下列波形编码中属于频域编码的是(C)。
P170
(A)PCM (B)ADM(C)SBC(D)APC
四、画图分析题:(每小题12分)
1、画出矢量量化器的基本结构,并说明其各部分的作用。
P95
2、试画出一卷积同态系统的模型,并把它分解为三个子系统进行分析,要有相应的表达式说明。
P57
3、试画出语音信号产生的离散时域模型的原理框图,并说明各部分的作用。
P21
4、试画出语音合成模型(语音生成模型)的原理框图,并说明各部分的作用。
P16
五、简答题:(每题5分)
1、线性预测分析的基本思想是什么? P69
2、隐马尔可夫模型的特点是什么? P107-108
3、矢量量化器的所谓最佳码本设计是指什么? P99
4、针对短时傅里叶变换Ⅹn(e jw)的定义式,请从两个角度对其进行物理意义的分析。
P42的4.2.2和4.2.3
5、针对短时傅里叶变换的时间分辨率和频率分辨率的矛盾性,请给予分析说明。
P43
6、复倒谱和倒谱的特点和关系是什么? P58-59
7、预加重和去加重的思想和作用是什么? P26-27
六、计算题:(每小题6分)
1、已知一码本尺寸J=8的二叉树,它的码本中共包含有14个码字,见图一所示。
现采用全搜索法和二叉树搜索法来进行分析,计算它们的失真运算量、比较运算量和存储容量各为多少?(要有求解过程,无过程不得分) P102,表7.1
图一
2、PPT课件例子:
计算方法:【初始分布概率*a的概率*转移概率*a的概率*转移概率*b的概率】
P1:S1→S1→S1
0.8×0.8×0.3×0.8×0.3×0.2=0.00922
P2:S1→S1→S2
0.8×0.8×0.3×0.8×0.5×0.7=0.05376
P3:S1→S1→S3
0.8×0.8×0.3×0.8×0.2×0.5=0.01536
P4:S1→S2→S2
0.8×0.8×0.5×0.3×0.4×0.7=0.02688
P8:S1→S2→S3
0.8×0.8×0.5×0.3×0.6×0.5=0.0288
P6:S2→S2→S2
0.8×0.3×0.4×0.3×0.4×0.7=0.00806
P7:S2→S2→S3
0.8×0.3×0.4×0.3×0.6×0.5=0.00864
由于是隐HMM模型,不知输出aab时,到底是经过了哪一条不同状态组成的路径,因此,求aab的输出概率时,将每一种可能路径的的输出概率相加得到的总的概率值作为aab的输出概率:
P(O|λ)=0.00922+0.05376+0.01536+0.02688+0.0288+0.00806+0.00864=0.15072。