通信中的语音信号处理复习大纲

通信中的语音信号处理复习大纲
通信中的语音信号处理复习大纲

《通信中的语音信号处理》复习大纲

北科大版

1、了解语音信号处理的目的、实质和发展历史;

实质:是研究用数字信号处理技术对语音信号进行处理的一门学科

目的:通过处理得到一些反映语音信号重要特征的语音参数以便高效地传输或储存语音信号所包含的信息。

通过对语音信号进行某种运算以达到某种要求。

发展历史:1876年电话的发明,贝尔(Bell);

1939年声码器的研制成功—声源+声道;

1947年贝尔实验室发明语谱图仪—语音识别研究的开始;

50年代第一台口授打字机和英语单词语音识别器;

60年代出现了第一台以数字计算机为基础的孤立词语音识别器和有限连续语音识别器;

70年代动态规划技术、隐马尔可夫模型、线性预测技术和矢量量化码书生成方法用于语音编码和识别;

80、90年代语音处理技术产品化—IBM Tangora-5和Tangora-20英语听写机,Dragon Dictate 词汇翻译系统(70000),汉语听写机。

CMU语音组研制成功SPHINX系统(997,95.8%);

国内,清华大学、中科院声学所和中科院自动化所在汉语听写机研究方面有一定成果。

(除了属于这种LPC[线性预测分析法]的方法外,还开发了各种数字语音处理方法。到目前为止,相继实现了语音编码、语音分析、语音合成、语音修正、语音识别、说话者识别等各种具体应用系统。)

2、理解和掌握语音信号的表示和处理方法,常用的语音编码的采样率和相应的数字语音信号的速率;

1.语音表示方法的选择:要保存语音信号中的消息内容;表示形式要便于传输和存储、变换和处理,不至于严重损害消息的内容,

有用信息更易于被提取;

2. 语音信号数字表示的优点:

数字技术能完成许多很复杂的信号处理工作;

语音可以看成是音素的组合,具有离散的性质,特别适合于数字处理;

数字系统具有高可靠性、价廉、紧凑、快速等特点,很容易完成实时处理任务;

数字语音适于在强干扰信道中传输,易于和数据一起在通信网中传输,也易于进行加密传输。

3. 语音信号的数字表示方法:波形表示—采样和量化,保持波形;参数表示—激励源和模型参数(第二章)

语音信号的特点—短时平稳性

4. 处理方法:短时时域处理方法—短时能量、短时平均过零率以及短时自相关函数计算

短时频域分析—短时傅立叶分析

线性预测技术—本质上属于时域分析方法,但其结果可以是频域参数

倒谱和同态分析、矢量量化和隐马尔可夫模型

5. PCM编码:采样率:8000次/second,均匀量化:采样率12bps信号速率96kbps,非均匀量化:采样率8bps信号速率64kbps

ADPCM:采样率:8khz速率:32kbps

3、理解语音信号的产生过程、发生机理和语音信号的声学特性;

产生过程:语音是说话人和听者之间相互传递的信号,传递的媒介是声波,说话人的发音器官做出发声动作,接着空气振动形成声波,声波传到听者的耳朵里,立刻引起听者的听觉反应

发生机理:

声学特性:频率:与音高有关;振幅:与响度有关。

4、理解和掌握语音信号浊音的基音频率、共振峰,及共振峰的计算方法;

浊音的基音频率(F0):由声带的尺寸、特性和声带所受张力决定,其值等于声带张开和闭合一次的时间的倒数。人类基音频率的范围在60Hz至450Hz左右。

共振峰(formant):声道是一个谐振腔,当激励的频率达到至声道的固有频率,则声道会以最大的振幅振荡,此时的频率称之为共振峰或共振峰频率。声道具有的一组共振峰,声道的频谱特性主要反映出这些共振峰的不同位置以及各个峰的频带宽度。共振峰及其带宽取决于声道某一瞬间的形状和尺寸,因而不同的语音对应于一组不同的共振峰参数。实际应用中,头三个共振峰最重要。

理想状态下共振峰的计算:假设声道截面是均匀的(此时可把声道看作一个粗细均匀的圆筒),从喉到唇的距 离L=17 cm ,音速c=340 m/s ,则共振峰将发生在:

5、 理解语音信号的时域、频域以及语谱图的表示方法; 时域波形:时间、振幅。频域波形-频谱:频率、分贝。

语谱图:用横坐标表示时间,纵坐标表示频率,每个像素的灰度值大小反映相应时刻和相应频率的能量

在频域上,能量集中处就是共振峰(formant)之所在,在语谱图上就是颜色较深的位置。语谱图能提供有关不同时间不同频率的相对音强的有价值的信息,如共振峰频率和基音周期。

在发元音时,音强较大,声带振动而呈现出基频及其谐振频率,也可以明显看到共振峰,能量集中在低频。

如果是发辅音,而且声带不振动,就看不到谐振频率。通常辅音的音强小,颜色看来就比较淡,而且能量较集中在高频。

若是在没有语音的空档,则语谱图上呈现的,就是有一段空白。

6、 (建立一个离散时域的语音信号产生的数字模型)理解和掌握语音信号的线性产生模型:激励模型、声道模型

和辐射模型(由于人类语音的频率范围主要集中在300Hz~3400Hz ,数字模型中的信号取样率一般为8KHz 。) 由此模型框图,我们可将语音信号看成准周期序列或随机噪声序列作为激励的线性非移变系统的输出,此模型可分为三个部 分:(1)激励模型2)声道模型3)辐射模型

浊音激励模型U(z):发浊音时声带绷紧,声带不断张开和关闭产生的脉冲波,类似于斜三角波

清音激励模型:声带不发生振动,气流通过声门直接进入声道,气流被阻碍形成湍流,相当于随机白噪声(此处用均值为0,方差为1并在幅值上为平稳分布的序列)

声道模型V(z):两种建模方法:

(a)声管模型:

(b)共振峰模型:共振峰模型将声道视为一个谐振腔,按此原则导出。

基于各种音素发音的不同谐振特点可建立起三种实用的共振峰模型: (a)级联型(适用于一般单元音,认为声道是一组串联的二阶谐振器,谐振中心频率值等于共振峰,若把语音的各个共振峰所对应的二阶系统级联起来就形成了一个完整的级联型声道模型,且具有明显的谐振特性。)

(b)并联型(适用于鼻音、复合元音及大部分辅音,发这些音时发音腔体具有反谐振特性,必须在模型中加入零点以减弱谐振强度,故要考虑用零、极点模型)

级联或并联的级数取决于声道的长度,一般成人取3到5级。

(c)混合型

辐射模型R(z):在发音腔道内形成的气流经由嘴唇端辐射出来,到达听者耳朵的这段过程,声音信号会衰减,而且有高通滤波的特性。常用一个一阶的数字高通滤波器模拟这个现象 7、 理解语音信号的短时特性的理解,以及语音信号平稳性的理解;

语音信号从整体上来看表征其本质特征的参数都是随时间变化的,这一点可以从语音信号的时域幅度波形上看出,故语音信号是一个非平稳随机过程,不能用处理平稳随机信号的技术对其进行分析处理。

由于语音信号是由人的口腔内一系列肌肉运动构成的发声模型产生的,而口腔肌肉的这种运动相对于语音频率来说是非常缓慢的,故在一个短时间范围内(一般认为10~30ms ),其特性基本保持不变,可以将其看作“准稳态随机过程”,这就是语音信号的“短时平稳性”。

任何语音信号的分析处理都必须建立在短时平稳的基础上,即进行“短时分析”:将语音信号分为一段一段来分析其特征参数。其中每一段称为一帧(frame ),帧长一般取10~30ms 。这样对于语音信号的整体而言,分析出的就是每一帧参数组成的特征参数Hz L c c F Hz L c c F Hz L c c F 前三个共振峰:n 为第n个共振峰的波长L

c n c F n n n 250045,150043500101743404计算,2,1)(4)12(3322211=======??====-==-λλλλλ 处的大小在一帧信号的傅立叶变换点为中心的

表示在时域以的窗函数

+是长度为=其中,ωωωωωωn n X n w e k n w k x n X n X N n P k k j x ),(12N ][][][),(|),(|121),(2∑∞-∞=--+=)()()()(z R z V z U z H =1()(1),1,1

R z rz r r -=-<≈

时间序列。

8、掌握语音信号的采样和量化过程,如何计算量化器中每个比特字长对信噪比的贡献,以及通过动态范围计算量

化字长;

采样:一个数字信号取样之后,变成离散时间信号,接下来就是要用数字方式来表示这个离散时间信号上的每个取样值。

量化:一个电位波形会有固定的电压范围,一个取样值可以是在此电压范围内的任何电位。如果只能用固定数目的位来表示这些取样值,那么这些二进数字就只能代表固定的几个电位值,这个转换就是量化(quantization),而转换之后只允许存在的几个电位值就是量化阶数(quantization level)。执行量化转换的硬件电路,就是量化器(quantizer)。

均匀量化的缺点:对于小信号,其信噪比太低

量化器中每个比特字长对信噪比的贡献大约为6dB。当量化字长为7bit时,信噪比为35dB,此时量化后的语音质量能满足一般通信系统的要求。如需要更大的动态范围,例如55dB,则语音信号的量化字长为10bit以上

9、理解短时加窗中的矩形窗和汉明窗;

用一个固定长度的窗口(window)套上去,只看窗口内的信号,对这些信号做计算,用以求出在这窗口内的语音特征(speech features)。这样的处理方式,就叫加窗(windowing),而套上去的这一段语音即称为语音帧(frame)。

通常窗口的长度是取10~40 毫秒(ms),窗口的移动距离,大约会取5~20 ms,让前后的语音帧有部分重叠,这样能观察到语音特征改变的延续性以保证分析的准确性。

矩形窗:

汉明窗:

汉明窗的第一个零值频率位置比矩形窗大一倍左右,即,汉明窗的带

宽大约是同样宽度矩形窗带宽的两倍。同时,在通带外,汉明窗的衰

减较相应的矩形窗大得多。

10、理解短时能量分析、短时平均过零率和短时相关的定义;

信号{x(n)}的短时能量定义:

En表示在信号的第n个点开始加窗函数时的短时能量,可以看作语音信号的平方经过一个线性滤波器。作用:反映出语音的能量或语音振幅随时间缓慢变化的规律。(浊音段能量比清音段大的多)

1)区分清音段和浊音段—浊音能量高。2)对声母和韵母分界3)区分无声和有声的分界(信噪比较高的信号)。4) 区分连字的边界5)用于语音识别

En的缺点:对高电平过于敏感,给加窗宽度的选择带来了困难。扩大了振幅不相等的任何两个相邻取样值(此处

的取样值是指某语帧的短时平均能量值)之间的幅度差别,必须用较宽的窗函数才能平滑能量幅度的起伏。为了使En能准确反映语音能量的时变规律:-数据窗w(n)或滤波器h(n)函数形式和宽度的选择相当重要

过零:信号波形穿越时间轴或零值线;对于离散时间信号而言就是相邻的取样值符号改变。平均过零率:单位时间(或单位样本)内

过零的次数。

计算一个语音帧内单位时间(或单位样本)越过零线的平均次数,可以得出其短时平均过零率(zero crossingrate)或短时平均过零数。声带振动时,是在发浊音,所以过零率低,声带不振动时,是在发清音,所以过零率就高,没有声音时若有噪音存在,也会有较高的过零率。(浊音、清音过零率的高低不是绝对的,分布有交叉的情况,多种工具同时用)

实际应用——区分清、浊音在背景噪声较大的情况下,从噪声信号中找出语音信号,判断出语音的起点和终点。(语音的端点检测)相关函数可用于测定两个信号在时域内的相似

性。

自相关函数:用于研究信号本身。例如,信号波形的同步性、周期性等。

互相关函数:用于研究不同信号之间的差异。例如,两个信号完全不同,则互相关函数

接近于零。

语音信号处理的相关分析:短时自相关函数应用:分析语音信号的同步性和周期性。

短时自相关函数的缺陷:由于公式的求和上限是随

-可看出浊音信号的周期性;

-清音没有周期性,其性质类似于噪声;

-浊音的周期性在采用矩形窗时明显一些;

-窗宽对浊音短时自相关周期性的影响。

解决缺陷:

11、

(同第六题)声道模型两种建模方法:(a)声管模型(b)共振峰模型

共振峰模型将声道视为一个谐振腔,按此原则导出。基于各种音素发音的不同谐振特点可建立起三种实用的共振峰模型:(a)级联型(b)并联型(c)混合型

12、理解短时傅立叶谱的定义、性质;

短时谱的特点:1)时变性:既是角频率ω的函数又是时间n的函数2)周期性:是关于ω的周期函数,周期2π

短时谱与短时功率谱及短时自相关函数的关系:

13、理解解卷、同态滤波、复倒谱和倒谱和相位卷绕的定义;

一帧语音信号= 声门激励信号* 声道冲激响应

为了求得语音信号的共振峰,必须知道声道的传递函数;为了判断语音信号是清音还是浊音,以及求得浊音情况下的基音频率,必须知道声门激励序列;为了提取反映声道特性的谱包络,必须通过解卷积去掉激励信息。

第一类:参数解卷方法。采用的模型可以分为全极点模型(AR模型)和零极点模型(ARMA模型),如果采用最小均方误差准则对AR模型进行估计,就得到线性预测编码算法(LPC)。

第二类:非参数解卷,即同态解卷。对语音信号进行同态分析后,将得到语音信号的倒谱参数。只需要用十几种倒谱参数就能较好地描述语音信号的声道参数

同态信号处理法就是设法将非线性问题转化为线性问题来处理的一种方法。按照被处理的信号来分类,大体上可以分为乘积同态信号处理和卷积同态信号处理(语音信号可以视为声门激励信号和声道响应信号的卷积结果)

分离非加性组合(如乘性或卷积性组合)信号,常采用同态滤波技术(利用广义叠加原理对同态系统进行滤波)。非线性问题变换为线性的问题来解决

对信号进行分析得出它的倒谱参数的过程称为同态处理

复倒谱定义:倒谱定义:

与复倒谱不同的是,在倒谱情况下一个序列经过正逆两个特征系统变换后,不能还原成自身,因为c(n)中只有幅值信息而无相位信息。倒谱等于复倒谱的偶对称部分,故有着与复倒谱相同的特性,且为偶函数。

清音情况下,具有噪声特性,因而其复倒谱也没有明显的峰起点,且分布范围很宽,从低时域延伸到高时域。浊音的复倒谱仍然只分布在低时域中。

相位卷绕:求复倒谱中的取对数运算存在的相位多值性问题,我们称之为相位卷绕。它的不确定性将使复倒谱恢复语音的运算产生错误。三种避免相位卷绕的方法(非取相位主值的方法):微分法,最小相位法,递推法。

14、掌握语音信号线性预测法(LPC)的基本原理,3种模型,LPC声码器的概念以及莱文逊-杜宾递推算法;

语音样本之间存在相关性,一个语音信号(现在或是将来)的样本可以用过去若干个样本的线性组合来逼近

依据信号的短时平稳特性这一基础

基于参数模型的谱估计方法和系统辨识有三种情况:

AR 模型:只有极点没有零点的情况,称为自回归模型。

线性预测法正是基于AR 模型的假定,采用时域均方最小误差准则来估计模型参数的。

MA 模型:只有零点没有极点的情况,称为滑动平均模型。

ARMA 模型:既有零点也有极点的情况,称为自回归滑动平均模型。 LPC 声码器:通过使线性预测到的采样在最小均方误差意义上逼近实际语音采样,可以求出一组唯一的预测系数。这种线性预测分析最早应用在语音编码中,因此,通常称为LPC 。(声码器用来实现电子化的人声效果)

LPC 方程两种解法:自相关法,协方差法

15、 理解语音编码的分类,以及各种语音编码的优缺点;

保证语音音质和可懂度的条件下,采用尽可能少的比特数来表示语音

波形编码(PCM 编码)预测编码及其自适应(APC )自适应差分脉冲编码调制(ADPCM)及自适应增量调制(ADM)子带编码(SBC) 从数码率的角度分类:高速率(32Kbps )中高速率(16~32Kbps )中速率(4 8~16Kbps )4.8 低速率(1.2~4.8Kbps )极低速率(1.2Kbps 以下)

据编码方式分为:波形编码(PCM 、ADM 、ADPCM 、APC );参数编码(LPC 线性预测编码);混合编码(子带编码);

波形编码:特点:利用抽样定理,恢复原始信号的波形(用于较高的码率,并且具有高质量的语音)

优点:抗噪性能力强,重建语音质量好。缺点:编码速率较高16~64Kbps

参数编码:提取语音的一些特征信息进行编码,在接收端利用这些特征参数合成语音。(用于甚低码率,语音质量不太好,类似合成语音,在任何码率下都无法给出自然语音。)

优点:编码速率低,速率通常是在4.8kbit/s 以下

缺点:语音的音质和自然度较差,辨别说话人是其研究难题。(有一定的可懂度)

混合编码:介于波形编码和参数编码的一种编码。即在参数编码的基础上引入了波形编码的一些特征。

可在4-16kb/s 范围内达到良好的语音质量(:综合采用波形编码和信源编码技术,在中等码率下具有较好的语音质量。)

子带编码的优点:对低频段采用较多的比特数来表示样值,高频段则采用较少的比特数。子带编码的另一个优点是各个子带内的量化噪声相互独立,可以避免输入电平较低的子带信号被其他子带的量化噪声所淹没

子带编码存在的问题是:编解码的延时比较长,约在几10~100ms 之间,这主要是滤波器组的延时造成的, 16、 理解和掌握语音合成和语音识别的定义。

语音合成:让计算机象人那样讲话。研究目标是:可懂、清晰、自然、具有表现力

两类方法:“分析-存储-合成”;参数合成法(线性预测系数、线谱对参数或共振峰参数等有限个参数,节约存储量);

语音识别:与机器进行语音交流,让机器明白你说什么

(孤立单词识别、连续语音识别)(特定人语音识别、非特定人语音识别)(有限词汇识别、无限词汇识别)

语音处理应用:压缩编码、语音合成、识别、增强、说话人识别

语音文件的参数:采样率、数码率(bps: Bits per second or Bits per sample )

语音通道数:语音通道的个数表明语音产生的波形数,一般分为单声道和立体声道。单声道产生一个波形,立体声道则产生两个波形。采用立体声道声音丰富,但存储空间要占用很多。由于语音的保真与节约存储空间是有矛盾的,因此要选择平衡点。

取样精度:即每次取样信息量。取样通过模数转换器(AD转换器)将每个波形垂直等分,若用8位AD转换器,可把取样信号分为256等份;若用16位AD转换器,则可将其分为65536等份。显然后者比前者音质好。

语音信号的特点—短时平稳性

短时时域处理方法—短时能量、短时平均过零率以及短时自相关函数计算

短时频域分析—短时傅立叶分析

线性预测技术—本质上属于时域分析方法,但其结果可以是频域参数

倒谱和同态分析、矢量量化和隐马尔可夫模型

音频信号经过数字化后产生的数据量相当大:

(每秒)数据量=抽样频率×量化比特数声道数/8 (单位:字节)

存储一段时间的数字化音频所需的存储容量

存储容量=(每秒)数据量×声音持续时间

语音分析的三种方法:

(1)时域分析法——时域波形图。

三种常用的时域分析方法:(1)过零分析(2)幅度分析/能量分析(3)相关分析

(2)频域分析法——频谱图。

频域分析包含:语音信号的频谱、功率谱、倒频谱、频谱包络、短时间谱等。

常用的频域分析方法有:a.带通滤波器组法。b.傅里叶变换法。c.线性预测法等。

(3)语谱分析法——语谱图。

语谱图可以在二维(时间及频率)图上表示音强的关系,提供了有关不同时间不同频率的相对音强的有价值的信息。

语音段起止端点判断-两级判决法——短时能量+短时平均过零率

基音周期的估计-短时自相关函数是区分清、浊音和估计基音周期的有效方法,但其包含的信息对基音周期的估计来说有许多是多余的;

-先对语音信号进行低通滤波,再计算自相关函数;-中心削波技术;-用短时平均幅度差代替短时自相关函数;

自相关函数常用来作以下两种语音信号特征的估计:

a.区分语音是清音还是浊音。

b.估计周期性语音信号的周期。

广义上,语音信号的频域分析包括:1)、频谱2)、功率谱3)、倒谱——对数功率谱取傅里叶变换4)、自相关函数

三种常用的频域分析方法:1)、滤波器组法2)、傅里叶频谱分析3)、线性预测

频率分辨率Δf、取样周期T、加窗宽度N三者关系:

窗形状对短时傅立叶变换的影响-矩形窗——主瓣窄,衰减慢;-汉明窗——主瓣宽,衰减快;

窗宽对短时频谱的影响-窗宽长——频率分辨率高(对应时间分辨率低),能看到频谱快变化;

-窗宽短——频率分辨率低(对应时间分辨率高),看不到频谱的快变化;

我们通常使用汉明窗进行短时谱分析

对语音信号解卷的好处:

1) 可对激励源进行研究,因而可以了解语音段是属于浊音还是清音,及确定浊音的基音频率

2) 可对声道冲激响应进行研究,因而可以了解声道特性及共振峰

数字通信课程设计

吉林工程技术师范学院 信息工程学院 《数字通信系统》 课程设计报告 题目:基于MATLAB数字基带调制 专业:电子信息工程 班级:电子信息1041班 姓名:唐欢 学号: 25 号 指导教师:范珩王冬梅 时间: 2013/11/25----2013/12/13

目录 第一章绪论 (1) 1.1通信的发展史简介 (1) 1.2设计的目的及意义 (2) 第二章数字基带信号 (3) 2.1数字基带调制原理 (3) 2.2单极性不归零波形 (4) 2.3双极性不归零波形 (4) 2.4单极性归零波形 (5) 2.5双极性归零波形 (6) 第三章载波调制的数字传输 (7) 3.1载波调制的原理 (7) 3.2 二进制2ASK的调制与解调仿真 (8) 3.3二进制2FSK的调制与解调仿真 (15) 3.4二进制2PSK的调制与解调仿真 (20) 第四章总结 (25) 参考文献.............................................. I 附录:................................................ I

第一章绪论 1.1通信的发展史简介 随着数字通信技术和计算机技术的快速发展以及通信网与计算机网络的相互融合,信息科学技术已成为21世纪和世界的新的强大推动力。信息是一种资源,只有通过广泛的传播与交流,才能产生利用价值,而欣喜的传播与交流,是依靠各种通信方式与技术来实现的。学习和掌握现代通信原理与技术是信息社会每一位成员,尤其是未来通信工作者的迫切需求。 通信就是从一地向另一地传递消息。通信的目的是传递消息中所包含的信息。人们可以用语言、文字、数据、图片或活动图像等不同形式的消息来表达信息。信息是消息的内涵,即消息中所包含的人们原来不知而待知的内容于传输含有信息的消息,否则,就失去了通信的意义。实现通信的方式很多,如手势、语言、旌旗、消息树、烽火台、金鼓和译码传令,以及现代社会的电报、电话、广播、电视、遥控、遥测、因特网、数据和计算机通信等,这些都是消息传递方式和信息交流的手段。随着社会的进步和科学技术的发展,目前使用最广泛的通信方式是电通信。由于电通信迅速、准确、可靠且不受时间、地点、距离的限制,自然科学领域凡是涉及“通信”这一术语时,一般均值“电通信”。 通信系统就是传递信息所需要的一切技术设备和传输媒质的总和,包括信息源、发送设备、信道、接收设备和信宿(受信者) ,它的一般模型如图1-1所示。

现代通信系统复习题

名词解释 1、通信:信息的传递和交换过程。 2、消息:指报道事情的概貌而不讲述详细的经过和细节,以简要的语言文字迅速传播新近事实的新闻体裁,也是最广泛、最经常采用的新闻基本体裁。 3、信息:以适合于通信、存储或处理的形式来表示的知识或消息 4、信号:信号是运载消息的工具,是消息的载体。 5、离散消息:指消息在时间上是不连续的 6、连续消息:指消息在时间上是连续的。 7、离散信号:指信号的波形在时间上是离散的。 8、模拟信号:指信息参数在给定范围内表现为连续信号。 9、光纤:光纤,是光导纤维的简写,是一种利用光在玻璃或塑料制成的纤维中的全反射原理而达成的光传导工具。 10、光缆:一种由单根光纤、多根光纤或光束加上外套制成,满足光学特性、机械特性和环境性能指标要求的缆结构实体 简答题

1、数字通信的特点有哪些 1、抗干扰能力强。 2、数字信号通过差错控制编码, 可提高通信的可靠性。3、可使用计算机对信号进行处理4、在系统中对数字信号传输情况的监视信号、控制信号及业务信号都可采用数字信号。5、数字信号易于加密处理保密性强。 2、请画出数字通信系统的模型,并说明各部分的功 能。 3、发送终端:把原始信息变换成原始点信号。 信源编码:把模拟信号变换成数字信号,即完成模、数变换的任务。提高信号传输的有效性。 信道编码:完成自动检错和纠错功能。 调制器:对基带数字信号进行频率搬移。 信道:指传输信号的通道 接受终端:用来接收电信号 4、怎样把模拟信号转换为数字信号 把模拟信号转换成数字信号,首先对模拟信号进行采样,然后根据采样到的信号的幅度对应一个二进制值,这个过程即为量化。然后输出这样的二进制BIT流,即数字信号。 5、什么是复用技术它包括哪几类各自又是如何定义的 复用技术是指一种在传输路径上综合多路信道,然

《通信原理课程设计》

信息工程学院 2014 / 2015学年第一学期 课程设计报告 课程名称:通信原理课程设计 专业班级:统本电信1201 学生学号:12610304152213 12520527151362 学生姓名:陈钰康 夏涛 指导教师:田亚楠

摘要 8PSK(8 Phase Shift Keying,8移相键控)是八进制相移键控,它是一种相位调制算法。相位调制(调相)是频率调制(调频)的一种演变,载波的相位被调整用于把数字信息的比特编码到每一词相位改变(相移)。 8PSK中的“PSK”表示使用移相键控方式,移相键控是调相的一种形式,用于表达一系列离散的状态,8PSK对应8种状态的PSK。如果是其一半的状态,即4种,则为QPSK,如果是其2倍的状态,则为16PSK。因为8PSK拥有8种状态,所以8PSK每个符号(symbol)可以编码3个比特(bits)。8PSK抗链路恶化的能力(抗噪能力)不如QPSK,但提供了更高的数据吞吐容量。本次课程设计过程中,利用了MATLAB7.1仿真实现了8PSK信号的调制与解调,并仿真8PSK载波调制信号在高斯白噪声信道下的误码率及误比特率性能,并用MATLAB仿真出了调制信号、载波信号及已调信号的波形图和频谱图。并在高斯白噪声下,讨论了8PSK 误码率及误比特率性能。 关键字:8PSK;载波的调制;解调;

目录 一.设计内容及要求(PSK信号的仿真) (1) 二.相关理论知识的论述分析 (1) 2. 1.1、8PSK的概念 (1) 2. 1.2、8PSK的特点 (1) 2.2.1、 PSK的调制 (2) 2.2.2、调制的概念 (2) 2.2.3、调制的种类 (2) 2.2.4、调制的作用 (3) 2.2.5、调制方式 (3) 三.系统原理框图及分析(8PSK的原理) (3) 四.完整的设计仿真过程 (4) 五.仿真结果输出及结论 (6) 六.仿真调试中出现的错误、原因及排除方法 (7) 七.总结本次设计,指出设计的核心及应用价值,提出改进意见和展望 (7) 八.收获、体会 (7) 九.参考文献 (8)

语音信号处理复习华南理工

语音信号处理复习 第二章语音信号处理基础知识 1,定义: (1)语音是指人们讲话时发出的话语,它是一种声音,具有声学特征的物理特性。而它又是一种特殊的声音,是人们进行信息交流的声音,是组成语言的声音。因此语音是语言和声音的组合体。 (2)语音是由人的发声器官发出的一种声波,它具有音色、音调、音强和音长。 ①音色:是一种声音区别于另一种声音的基本特征 ②音调:指声音的高低,取决于声波的频率 ③音强:指声音的强弱,取决于声波的振幅 ④音长:指声音的长短,取决于发音时间的长短 (3)任何语言都有语言的元音和辅音两种音素: 元音:当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出去时,这些声腔完全开放,气流顺利通过。一个重要的声学特性是共振峰。 辅音:由于通路的某一部分封闭起来或者受到阻碍,气流被阻不能畅通。包括清音和浊音。 ①浊音:声带振动 ②清音:声带不振动 (4)人的听觉系统有两个重要的特性: ①时频分析特性:人的耳蜗就像一个频谱分析仪,将复杂的信号分解成各种频率分量。 ②听觉掩蔽效应:心理声学中的听觉掩蔽效应指在一个强信号附近,弱信号将变得不可闻,被掩蔽掉了。掩蔽效应分为同时掩蔽和短时掩蔽。 2,语言信号生成的数学模型: ①激励模型:在声门(声带)以下,称为“声门子系统”,它负责产生激励振动,是激励系统 ②声道模型:从声门到嘴唇的呼气通道是声道,是声道系统 ③辐射模型:语音从嘴唇辐射出去,则嘴唇以外是辐射系统 3,语音信号的特性分析: (1)语音信号的时域波形和频谱特性: ①时域波形:周期性,周期对应声带振动的频率,即基音频率。 ②频谱特性:共振峰特性。元音频谱有明显的几个凸起点,它们出现的频率就是共振峰频率。清辅音频谱 峰点之间的间隔是随机的,没有周期分量。 (2)语谱图: 语谱图是一种三维图谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。语谱图中显示了大量的与语音的语句特性相关的信息,它综合了频谱图和时域波形的特点,明显地显示出语音频谱随时间的变化情况,或者说是一种动态的频谱。记录这种谱图的仪器就是语谱仪。 语谱图中的花纹有横杠、竖直条和乱纹等。 ①横杠:与时间轴平行的几条深黑色带纹,它们相应于短时谱中的几个凸点,也就是共振峰。 ②竖直条:与时间轴垂直的一条窄黑带,每个竖直条相当于一个基音,条纹间的距离表示基音周期。 ③乱纹:清擦音从语谱图上看表现为乱纹,乱纹的深浅和上下限反映了噪声能量在频域中的分布。 4,语音信号的统计特性: 语音信号的统计特性可以用它的波形振幅概率密度函数和一些统计量(如均值和自相关函数)来描述。 第三章语音信号分析

语音信号处理复习题

1 研究语音信号处理的目的是什么?人类的通信有哪三种方式,从而说明语音信号处理有哪三个学科分支? 它的目的一是要通过处理得到一些反映语音信号重要特征的语音参数以便高效的传输或储存语音信号信息;二是要通过处理的某种运算以达到某种用途的要求。 1.什么叫做语言学?什么叫做语音学?言语过程可分为哪五个阶段? 语音中各个音的排列由一些规则所控制,对这些规则及其含义的研究学问称为语言学;另一个是对语音中各个音的物理特征和分类的研究称为语音学。人的说话过程如图2-1所示,可以分为五个阶段: (1)想说阶段: (2)说出阶段: (3)传送阶段: (4)接收阶段: (5)理解阶段: 3、有哪几种描述声道特性的数学模型?请说明声管模型流图是如何得出的?有几种共振峰模型?各有什么特点和适用情况? 声道的数学模型有两种观点: 1)声管模型 将声道看为由多个不同截面积的管子串联而成的系统。在“短时”期间,声道可表示为形状稳定的管道。 另一种观点是把声道视为一个谐振腔,按此推导出的叫“共振峰模型”。 共振峰模型,把声道视为一个谐振腔。共振峰就是这个腔体的谐振频率。由于人耳听觉的柯替氏器官的纤毛细胞就是按频率感受而排列其位置的,所以这种共振峰的声道模型方法是非常有效的。一般来说,一个元音用前三个共振峰来表示就足够了;而对于较复杂的辅音或鼻音,大概要用到前五个以上的共振峰才行。基于物理声学的共振峰理论,可以建立起三种实用的共振峰模型:级联型、并联型和混合型。 (1)级联型声道模型

这时认为声道是一组串联的二阶谐振器。从共振峰理论来看,整个声道具有多个谐振频率和多个反谐振频率,所以它可被模拟为一个零极点的数学模型;但对于一般元音,则用全极点模型就可以了。它的传输函数可分解表示为多个二阶极点的网络的串联: N=10,M=5时的声道模型如下图所示: (2)并联型声道模型 对于非一般元音以及大部分辅音,必须考虑采用零极点模型。此时,模型的传输函数如下: 通常,N>R ,且设分子与分母无公因子及分母无重根,则上式可分解为如下部分分式之和的形式: 这就是并联型的共振峰模型。如图2-21所示(M=5)。 (3)混合型声道模型 上述两种模型中,级联型比较简单,可以用于描述一般元音。当鼻化元音或鼻腔参与共振,以及阻塞音或摩擦音等情况时,级联模型就不能胜任了。这时腔体具有反谐振特性,必须考虑加入零点,使之成为零极点模型。采用并联结构的目的就在于此,它比级联型复杂些,每个谐振器的幅度都要独立地给以控制。但对于鼻音、塞音、擦音以及塞擦音等都可以适用。正因为如此,将级联模型和并联模型结合起来的混合模型也许是比较完备的一种共振峰模型。 22 12112cos(2)()12cos(2)k k k k B T B T M k B T B T k k e F T e V z e F T z e z ππ------=-+=-+∏∑∑=-=--= N k k k R r r r z a z b z V 1 1)(∑ =----=M i i i i z C z B A z V 12 11)(

现代通信系统 复习提纲

现代通信系统 复习提纲 一、填空 1、已知某消息A 出现概率为 128 1,则该消息能带来的信息量为( )比特。 2、某信源有3个消息,分别以概率21,41,41传送,每一消息的出现是相互独立的,则该信源携带的平均信息量为( )。 3、一数字通信系统传送六十四进制信号码元,传码率为1000Baud ,各符号等概率出现,则该系统的信息传输速率为( )s bit /。 4、某十六进制数字通信系统的传信率为4000s bit /,在接收端2分钟内共测得12个错误码元,则该系统的误码率为( )。 5、衡量通信系统性能的指标是( )性和可靠性。 6、信道容量是完全描述信道特性的参量,是指信道在单位时间所能传送的信息量的( )。 7、信道的幅频失真是一种( )失真,可以用一个( )网络进行补偿,对模拟通信影响较大,会导致( )下降。 8、信道的相频失真是一种( )失真,可以用一个( )网络进行补偿,对数字通信的影响较大,会引起严重的( ),造成( )。 9、编码信道的模型可以用数字信号的( )来描述。 10、信道容量是指信道在单位时间内所传送的( )信息量,也就是信道的( )传信率。 11、公共通信网的三大支撑网络NO.7公共信道信令网、( )以及电信管理网。 12、时分复用(TDM )是建立在( )定理基础上利用各路信号的( )在时间上占据不同的( ),以实现在同一信道中传输多路信号而互不干扰的一种方法。 13、PCM30/32制式中,抽样频率为8000Hz ,帧周期为( ),每一帧内包含( )时隙。 14、调制必须具备基带信号和载波两个对象,其实质是进行( )搬移,把携带消息的( )的( )搬移到较高的频率范围。 15、电路交换是最早出现的一种交换方式,主要用于( )业务,采用的是( )分配物理信道,在通信前要先建立物理连接,在通信过程中一直维持这一物理连接,只要用户不发出( ),即使通信暂停,物理连接仍然保持。 16、T 接线器由语音存储器和( )存储器组成,前者用来暂时存储( ),后者用于存储( )。 17、S 接线器由( )和控制存储器组成,其功能是实现不同复用线之间( )时隙内容的交换。 18、交换系统中实际需要的公用设备数量一般都是根据所承担的( )计算出来的。 19、根据交换系统处理接续请求的方法,分为呼损工作制和待接工作制,前者主要应用于( )交换中,后者主要应用在( )交换中。 20、X.25协议采用分层的体系结构,自下而上分为( )、数据链路层和分组层。其中数据链路层传送信息的最小单位是( ),分组层传送信息的最小单位为( )。 21、虚电路是端到端之间建立的一种( ),并不独占线路和交换机的资源,是多个( )串接而成的。 22、ATM 交换全称为( )交换,适用于局域网和( ),以固定长度( )字节的( )为基本处理单位,其基本任务就是完成( )交换和( )交换。

现代通信网络复习资料

1-1概述 1.现代通信网的结构 水平视图(根据用户接入网络的实际物理连接来划分) ?用户驻地网、接入网、核心网 垂直视图(根据功能划分) ?应用层、业务网、传送网、支撑网 ?Customer Premises Network ?CPN是用户自有网络,指用户终端至用户驻地业务集中点之间所包含的传输及线路等相关设施。小至电话机,大至局域网。 ?实现用户和业务的集中,信息的变换与适配、复用与交换、寻址与选路等功能。 ?Core Network ?核心网是电信网的骨干,由现有的和未来的宽带、高速骨干传输网和大型中心交换节点构成。 ?发展:统一的IP核心网 ?所有的业务,从传统电话、移动通信漫游、新一代综合业务VoIP,到电子商务、综合应用服务,乃至交互式电视业务全部都由统一的核心IP网来完成,差别仅 仅在于接入网。 ?统一的IP核心网用统一的设备代替了原来各系统的独立设备,可以大大降低开发和运营成本。 应用层: ?业务 ?模拟与数字视音频业务:电话/IN/IP Phone etc. ?数据通信业务:电子商务/email ?多媒体通信业务:分配型/交互型 ?终端技术 ?音频通信终端:电话/数字电话/手机 ?图形图像通信终端:传真机 ?视频通信终端:显示器/视频监视器 ?数据通信终端:MODEM/可视电话 业务网技术: ?电路交换技术 ?分组交换技术 ?如X.25分组交换网、帧中继网、数字数据网、综合业务数字网、Internet等。 ?智能网技术 ?移动通信网技术 传送网技术: ?传输媒介 ?电缆、微波、通信卫星、光纤 ?传输系统 ?传输设备 ?光端机、微波收发信机、卫星地面站收发信机等 ?传输复用设备 ?频分复用、时分复用、统计时分复用、波分复用 支撑网技术: ?信令网

燕山大学_数字通信计算机仿真_课设模板1

《数字通信计算机仿真》 课程设计论文 班级:通信工程三班 姓名:郭利霞 学号:100104030068 时间: 2013年7月15日 - 1 -

一、课程设计目的 通过本次课程设计使学生深入理解和掌握调幅通信系统的各个关键环节,包括调制、解调、滤波、传输、噪声对通信质量的影响等。在数字信号处理实验课的基础上更加深入地掌握数字滤波器的设计原理及实现方法。使学生对系统各关键点的信号波形及频谱有深刻的认识。 二、课程设计意义 通讯技术的发展日新月异,本专业的学生不但需要掌握扎实的基础理论,而且还应特别注意实践能力的培养。本次设计是对学生综合能力的检验,它涉及三门主干课程,包括《通信原理》、《数字信号处理》、《C/C++语言程序设计》。通过本次设计对学生的综合运用专业基础知识及软件设计能力也会有较大提高。 三、系统简介及说明 数字通信的基本特征是,它的消息或信号具有“离散”或“数字”的特性,从而使数字通信具有许多特殊的问题。在模拟通信中强调变换的线性特性,即强调已调参量与代表消息的基带信号之间的比例特性;而在数字通信中,则强调已调参量与代表消息的数字信号之间的一一对应关系。 - 2 -

- 3 - 另外,数字通信系统中还存在以下突出问题:第一,数字信号传输时,信道噪声或干扰所造成的差错,原则上是可以控制的。这是通过所谓的差错控制编码(如:2FSK )来实现的。于是,就需要在发送端增加一个基带信号形成器(编码器) ,而在接收端相应需要一个相干解调器。第二,由于数字通信传输的是一个接一个按一定节拍传送的数字信号,因而接收端必须有一个与发端相同的节拍,否则,就会因收发步调不一致而造成混乱。另外,为了表述消息内容,基带信号都是按消息特征进行编组的,于是,在收发之间一组组的编码的规律也必须一致,否则接收时消息的真正内容将无法恢复。所以在数字通信系统抽样判决中,要注意同步问题。 四、设计内容和理论依据 1、 设计内容 本次设计的主要内容是用软件模拟一套数字通信系统。原理 如下所示: 图例 信源信号: 信宿信号: 信道信号: LPF 信号输入 BPF LPF 信号输出 cos(2πf c t ) 白噪声

语音信号处理考试题(综合)

语音信号处理重点、考点、考试题 一、填空题:(共7小题,每空2分,共20分) A卷 1、矢量量化系统主要由编码器和组成,其中编码器主要是由搜索算法和构成。 2、基于物理声学的共振峰理论,可以建立起三种实用的共振峰模型:级联型、并联型和。 3、语音编码按传统的分类方法可以分为、和混合编码。 4、对语音信号进行压缩编码的基本依据是语音信号的和人的听觉感知机理。 5、汉语音节一般由声母、韵母和三部分组成。 6、人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉的效应。 7、句法的最小单位是,词法的最小单位是音节,音节可以由构成。 二、判断题:(共3小题,每小题2分,共6分) 1、预测编码就是利用对误差信号进行编码来降低量化所需的比特数,从而使编码速率大幅降低。() 2、以线性预测分析-合成技术为基础的参数编码,一般都是根据语音信号的基音周期和清/浊音标志信息来决定要采用的激励信号源。() 3、自适应量化PCM就是一种量化器的特性,能自适应地随着输入信号的短时能量的变化而调整的编码方法。() 三、单项选择题:(共3小题,每小题3分,共9分) 1、下列不属于衡量语音编码性能的主要指标是()。(A)编码质量(B)矢量编码(C)编码速率(D)坚韧性 2、下列不属于编码器的质量评价的是()(A)MOS (B)DAM(C)DRT(D)ATC 3、限词汇的语音合成技术已经比较成熟了,一般我们是采用()作为合成基元。 (A)词语(B)句子(C)音节(D)因素 四、简答题:(共2小题,每小题12分,共24分) 1、画出矢量量化器的基本结构,并说明其各部分的作用。 2、试画出语音信号产生的离散时域模型的原理框图,并说明各部分的作用。 五、简答题:(共5小题,前三小题,每题5分,后两小题,每题10分,共35分) 1、线性预测分析的基本思想是什么? 2、隐马尔可夫模型的特点是什么? 3、矢量量化器的所谓最佳码本设计是指什么? 4、针对短时傅里叶变换Ⅹn(ejw)的定义式,请从两个角度对其进行物理意义的分析。 5、针对短时傅里叶变换的时间分辨率和频率分辨率的矛盾性,请给予分析说明。 六、计算题:(共1小题,每小题6分,共6分) 1、已知一个简单的三状态HMM模型的图形,如图一所示。求该HMM模型输出aab的概率为多少?(要有求解过程,无计算过程不得分)

现代通信网络系统复习题

现代通信网络系统复习题 一、选择题。 1、一座大楼的一个计算机网络系统,属于( B )。 A. PAN B. LAN C. MAN D. WAN 2、计算机网络中可以共享的资源包括( A )。 A. 硬件、软件、数据、通信信道 B. 主机、外设、软件、通信信道 C. 硬件、程序、数据、通信信道 D. 主机、程序、数据、通信信道 3、计算机网络是计算机技术和通信技术相结合的产物,这种结合开始于( A )。 A. 20世纪50年代 B. 20世纪60年代初期 C. 20世纪60年代中期 D. 20世纪70年代 4、世界上第一个计算机网络是( A )。 A. ARPANET B. ChinaNet C. Internet D. CERNET 5、星形. 总线形. 环形和网状形是按照( B )分类。 A.网络跨度 B. 网络拓扑 C. 管理性质 D. 网络功能 6、计算机互联的主要目的是( D )。 A. 确定网络协议 B. 将计算机技术与通信技术相结合 C. 集中计算 D. 资源共享 7、计算机网络建立的主要目的是实现计算机资源的共享。计算机资源主要指计算机( C )。 A. 软件与数据库 B. 服务器、工作站与软件 C. 硬件、软件与数据 D. 通信子网与资源子网 8、以下的网络分类方法中,哪一组分类方法有误( B )。 A. 局域网/广域网 B. 对等网/城域网 C. 环型网/星型网 D. 有线网/无线网 9、局部地区通信网络简称局域网,英文缩写为( B )。 A. WAN B. LAN C. SAN D. MAN 10、在OSI模型中,NIC(网络接口卡)属于( B )。 A. 物理层 B. 数据链路层 C. 网络层 D. 运输层 11、在OSI模型中,为网络用户间的通信提供专用程序的层次是( D )。 A. 运输层 B. 会话层 C. 表示层 D. 应用层 12、在OSI模型中,为实现有效、可靠的数据传输,必须对传输操作进行严格的控制和管理,完成这项工作的层次是( B )。 A. 物理层 B. 数据链路层 C. 网络层 D. 运输层 13、在OSI模型中,物理层存在四个特性。其中,通信媒体的参数和特性方面的容属于( A )。 A.机械特性 B. 电气特性 C. 功能特性 D. 规程特性 14、在OSI七层结构模型中,处于数据链路层与运输层之间的是( B )。 A. 物理层 B. 网络层 C. 会话层 D. 表示层 15、完成路径选择功能层次是在OSI模型的( C )。 A. 物理层 B. 数据链路层 C. 网络层 D. 运输层 16、TCP/IP协议簇的层次中,解决计算机之间通信问题是在( B )。 A. 网络接口层 B. 网际层 C. 传输层 D. 应用层 17、网络协议主要要素为( C )。 A. 数据格式、编码、信号电平 B. 数据格式、控制信息、速度匹配 C. 语法、语义、同步 D. 编码、控制信息、同步 18、Internet的网络层含有四个重要的协议,分别为( C )。 A. IP,ICMP,ARP,UDP B. TCP,ICMP,UDP,ARP

数字通信课程设计

目录 一、课程设计目的 (1) 二、设计任务书 (1) 三、进度安排 (1) 四、具体要求 (2) 五、课程设计内容 (2) 5.1数字频带传输系统 (2) 5.2二进制振幅键控(2ASK) (3) 5.2.1调制实验原理框图: (3) 5.2.2 调制实验步骤 (4) 5.2.3 解调的原理框图 (7) 5.3二进制频移键控(2FSK) (8) 5.3.1 2FSK调制原理 (8) 5.3.2 调制实验步骤 (8) 5.3.3 2FSK解调的原理框图: (12) 5.4二进制移相键控(2PSK) (12) 5.4.1 2PSK调制原理 (12) 5.4.2 2PSK调制的实验步骤 (13) 5.4.3 2PSK解调的原理框图 (16) 5.5二进制差分相位键控(2DPSK) (17) 5.5.1 2DPSK调制原理 (17) 5.5.2 2DPSK调制的实验步骤 (17) 5.5.3 2DPSK的解调原理框图 (21) 5.6 二进制数字信号的功率谱密度 (21) 5.6.1.2ASK 信号的功率谱密度 (21) 5.6.2 2FSK 信号的功率谱密度 (22) 5.6.3 2PSK 及 2DPSK信号的功率谱密度 (22) 六、运行程序过程中产生的问题及采取的措施 (23) 七、总结和展望 (23) 八、参考文献 (24)

一、课程设计目的 本课程是为通信工程专业本科生开设的专业必修课,结合学生的专业方向的理论课程,充分发挥学生的主动性,使学生掌握应用MATLAB或者SYSTEMVIEW 等仿真软件建立通信系统,巩固理论课程内容,规范文档的建立,培养学生的创新能力,并能够运用其所学知识进行综合的设计。 通信系统原理的课程设计是对通信系统仿真软件、课程学习的综合检验,配合理论课的教学,让学生亲自参加设计、仿真、验证通信系统的一般原理、调制解调原理、信号传输及受噪声影响等方面的知识点。 二、设计任务书 设计选题:数字频带传输系统的设计 a.利用所学的《通信原理及应用》的基础知识,分别设计2ASK、2FSK、2PSK、2DPSK数字调制器。完成对各种二进制数字已调信号的的调制器与解调器的电路设计与程序仿真,并对其仿真结果进行分析。要求理解2ASK信号的产生,掌握2ASK 信号的调制原理和实现方法并画出实现框图。 b.利用MATLAB、SystemView、C等语言进行,软件不限。要求给出2ASK、2FSK、2PSK、2DPSK 各种已调信号的调制、解调的原理框图、仿真电路图,给出信号的频谱图、调制前与解调后数据波形比较覆盖图,加噪前后相关波形。 三、进度安排

通信中的语音信号处理复习大纲

《通信中的语音信号处理》复习大纲 北科大版 1、了解语音信号处理的目的、实质和发展历史; 实质:是研究用数字信号处理技术对语音信号进行处理的一门学科 目的:通过处理得到一些反映语音信号重要特征的语音参数以便高效地传输或储存语音信号所包含的信息。 通过对语音信号进行某种运算以达到某种要求。 发展历史:1876年电话的发明,贝尔(Bell); 1939年声码器的研制成功—声源+声道; 1947年贝尔实验室发明语谱图仪—语音识别研究的开始; 50年代第一台口授打字机和英语单词语音识别器; 60年代出现了第一台以数字计算机为基础的孤立词语音识别器和有限连续语音识别器; 70年代动态规划技术、隐马尔可夫模型、线性预测技术和矢量量化码书生成方法用于语音编码和识别; 80、90年代语音处理技术产品化—IBM Tangora-5和Tangora-20英语听写机,Dragon Dictate 词汇翻译系统(70000),汉语听写机。 CMU语音组研制成功SPHINX系统(997,95.8%); 国内,清华大学、中科院声学所和中科院自动化所在汉语听写机研究方面有一定成果。 (除了属于这种LPC[线性预测分析法]的方法外,还开发了各种数字语音处理方法。到目前为止,相继实现了语音编码、语音分析、语音合成、语音修正、语音识别、说话者识别等各种具体应用系统。) 2、理解和掌握语音信号的表示和处理方法,常用的语音编码的采样率和相应的数字语音信号的速率; 1.语音表示方法的选择:要保存语音信号中的消息内容;表示形式要便于传输和存储、变换和处理,不至于严重损害消息的内容, 有用信息更易于被提取; 2. 语音信号数字表示的优点: 数字技术能完成许多很复杂的信号处理工作; 语音可以看成是音素的组合,具有离散的性质,特别适合于数字处理; 数字系统具有高可靠性、价廉、紧凑、快速等特点,很容易完成实时处理任务; 数字语音适于在强干扰信道中传输,易于和数据一起在通信网中传输,也易于进行加密传输。 3. 语音信号的数字表示方法:波形表示—采样和量化,保持波形;参数表示—激励源和模型参数(第二章) 语音信号的特点—短时平稳性 4. 处理方法:短时时域处理方法—短时能量、短时平均过零率以及短时自相关函数计算 短时频域分析—短时傅立叶分析 线性预测技术—本质上属于时域分析方法,但其结果可以是频域参数 倒谱和同态分析、矢量量化和隐马尔可夫模型 5. PCM编码:采样率:8000次/second,均匀量化:采样率12bps信号速率96kbps,非均匀量化:采样率8bps信号速率64kbps ADPCM:采样率:8khz速率:32kbps 3、理解语音信号的产生过程、发生机理和语音信号的声学特性; 产生过程:语音是说话人和听者之间相互传递的信号,传递的媒介是声波,说话人的发音器官做出发声动作,接着空气振动形成声波,声波传到听者的耳朵里,立刻引起听者的听觉反应 发生机理: 声学特性:频率:与音高有关;振幅:与响度有关。 4、理解和掌握语音信号浊音的基音频率、共振峰,及共振峰的计算方法; 浊音的基音频率(F0):由声带的尺寸、特性和声带所受张力决定,其值等于声带张开和闭合一次的时间的倒数。人类基音频率的范围在60Hz至450Hz左右。 共振峰(formant):声道是一个谐振腔,当激励的频率达到至声道的固有频率,则声道会以最大的振幅振荡,此时的频率称之为共振峰或共振峰频率。声道具有的一组共振峰,声道的频谱特性主要反映出这些共振峰的不同位置以及各个峰的频带宽度。共振峰及其带宽取决于声道某一瞬间的形状和尺寸,因而不同的语音对应于一组不同的共振峰参数。实际应用中,头三个共振峰最重要。

语音信号处理复习纲要

Ch1 绪论 §1.1 语音信号处理概述 一、语音、语音信号处理的名词解释 1、语音:是语言的声学表现,是声音和意义的结合体,是相互传递信息的重要手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。 2、语音信号处理:是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及很广的交叉学科。 二、语音处理技术的应用领域 语音处理技术的应用领域包括:工业、军事、交通、医学、民用等。 三、语音信号采用数字处理的原因(数字语音的优点) 语音信号均采用数字处理,是因为数字处理与模拟处理相比具有许多优点: 1、数字技术能够完成许多很复杂的信号处理工作; 2、通过语音进行交换的信息本质上具有离散的性质,语音可以看做是音素的组合,适合数字处理; 3、数字系统具有高可靠性、廉价、快速等优点,容易完成实时处理任务; 4、数字语音适合在强干扰信道中传输,也易于加密传输。 四、语音学的名词解释 语音学:是研究言语过程的一门科学,它包括三个研究内容:发音器官在发音过程中的运动和语音的音位特性;语音的物理特性;以及听觉和语言感知。 §1.2 语音信号处理的发展概况 一、语音信号处理的发展史 1、1874年:电话的发明时现代语音通信的开端; 2、1939年:通道声码器技术; 3、40年代后期:语谱仪; 4、50年代初:第一台口授打字机和英语单词语音识别器; 5、60年代:Fant发表《语音产生的声学理论》; 6、70年代初:Flanagan著作《语音分析、合成和感知》; 7、90年代以来:语音识别的研究由实验室走向实用化。 二、语音编码、语音合成、语音识别名词解释 1、语音编码:语音编码技术是伴随着语音信号的数字化而产生的,目前主要应用在数字语音通信领域。 2、语音合成:语音合成的目的是使计算机能像人一样说话,它是一种人机语音通信技术,应用领域广泛。 3、语音识别:语音识别是使计算机判断出所说的话得内容,和语音合成一样也是一种人机语音通信技术。 为了实现人机语音通信,必须具备语音识别和语音理解两种功能 Ch2 基础知识 §2.2 语音产生的过程 一、现代语音学发展的三个分支:发音语音学、声学语音学、听觉语音学。 二、语音、清音、浊音的名词解释及语音的产生过程(名词解释、简答,集中备课) 1、语音:声音是一种波,能被人耳听到,振动频率在20Hz-20kHz之间。语音室声音的一种,它是由人的发音器官发出的、具有一定语法和意义的声音。语音的振动频率最高可达15kHz左右。 2、人类生成语音过程的第一阶段包括神经核肌肉的生理学阶段和产生语音波、传递语音波的物理阶段。 3、语音由声带振动或不经声带振动来产生,其中由声带振动产生的音统称为浊音,而不由声带振动产生的音统称为清音。浊音中包括所有的元音和一些辅音,清音包括另一部分辅音。

现代通信技术复习题与答案

一、填空题 1.一个频带限制在f m H Z以下的连续信号m(t),可以惟一地用时间每隔T__≤ ________秒的抽样值序列来确定。 2.PCM系统信道部分包括传输线路及_再生中继器___。 3.非均匀量化的宗旨是:在不增大量化级数N的前提下,利用降低大信号的信噪比来提高_小信号的量化信噪比。 4.ADPCM的主要特点是用自适应量化取代__固定量化。 5.为了提高通信信道的利用率,使信号沿同一信道传输而不互相干扰,称为__多路复用_。 6.为了保证在接收端能正确地接收或者能正确的区分每一路话音信号,时分多路复用系统中的收、发两端要 做到同步。 7.所谓时钟同步是使收端的时钟频率与发端的时钟频率__相同_。 8.数字复接的同步指的是被复接的几个低次群信号的数码率____相同_。 9.数字分接器的功能是把高次群分解成原来的__低次群_。 10.PCM信号脉冲经过信道传输,各中继站和终端站接收的脉冲信号在时间上不再是等间隔的,而是随时间 变动的,这种现象称为_相位抖动_。 11.SDH帧结构中安排有两大类开销:通道开销和___段开销__。 12.按字复接是每次复接各低次群的一个码字形成__高次群________。 13.SDH网同步通常采用__主从同步________方式。 14. PCM30/32系统中前方保护的前提状态是___同步状态____。 15.SDH网的基本网络单元有终端复用器、再生中继器、数字交叉连接设备和_分插复用器_。 16.抽样是将模拟信号在时间域上__离散化____的过程。 17.量化是将模拟信号在幅度上__离散化____的过程。 18.异步复接二次群1帧中信息码至少为__820____bit。 19.所谓PCM复用就是直接将多路信号__编码复用____。 20.SDH帧结构中包括段开销、信息净负荷和_管理单元指针_____三个区域。 21.SDH网的基本网络单元有再生中继器、分插复用器、数字交叉连接设备和_终端复用器(TM)_____。22.数字通信采用__时分____多路复用方式实现多路通信。 23.定时钟提取是____从接收到的信息码流中提取时钟成份__。 24.采用环形网实现自愈的方式称为__自愈环____。 25.具有误码的码字被解码后将产生幅值失真,这种失真引起的噪声称为__误码噪声____。 26.数字信号传输中再生中继系统的两个特点是:无噪声积累和__有误码率的积累____。 27.码速调整技术可分为正码速调整、正/负码速调整和__正/零/负码速调整____。 28.数字复接器的功能是把四个支路(低次群)合成_高次群_____。 29.使多路信号沿同一信道传输而互不干扰,称为__多路复用____。 30.数字复接系统包括数字复接器和__数字分接器____。 31.数字通信系统模型中调制的作用是_进行频谱的搬移______。 32.量化信噪比的公式为_(S/D)dB=10lg Ps/D Q(dB)_______。 33.在低通型信号中f0与信号带宽B的关系为__f0

数字通信课程设计报告

课程设计报告 课程设计名称:《数字通信》 系别: 学生姓名: 班级: 学号: 成绩: 指导教师: 开课时间:2011-2012 学年第2学期

目录 一.设计题目 (4) 二.具体要求 (4) 三.主要内容 (4) 第一节:基本原理 (4) 第二节:流程图 (13) 四.进度安排 (13) 五.成绩评定 (13) 第一节:课程设计报告要求 (14) 第二节:正文 (14) 六.心得体会 (18) 七.参考资料 (19)

一.设计题目:模拟信号数字化PCM 编码设计 二.具体要求: 1.模拟信号数字化的处理步骤:抽样、量化、编码 2.PCM 编码的压缩和扩张原理; 3.用MATLAB 或其它EDA 工具软件对PCM 编码进行使用A 律和μ律的压缩和扩张进行软件仿真; 4.对仿真进行分析比较。 5.PCM 的8位编码C 1C 2C 3C 4C 5C 6C 7C 8 三.主要内容 第一节:基本原理 下图是模拟信号数字传输的过程原理图: 1. 抽样 (1)定义: 所谓抽样,就是对模拟信号进行周期性扫描,把时间上连续的信号变成时间上离散的信号。该模拟信号经过抽样后还应当包含原信号中所有的信息,也就是说能无失真的恢复原模拟信号。它的抽样速率的下限是由抽样定理确定的。 (2)抽样定理 设一个频带限制的(0,fH )Hz 内的时间连续信号m (t )如果它不少于2fH 次每秒的速率进行抽样,则m(t)可以由抽样值完全确定。 抽样定理指出,由样值序列无失真恢复原信号的条件是f S≥2 f h ,为了满足抽样定理,要求模拟信号的频谱限制在0~f h 之内(fh 为模拟信号的最高频率)。为此,在抽样之前,先设置一个前置低通滤波器,将模拟信号的带宽限制在fh 以下,如果前置低通滤波器特性不良或者抽样频率过低都会产生折叠噪声。抽样频率小于2倍频谱最高频率时,信号的频谱有混叠。抽样频率大于2倍频谱最高频率时,信号的频谱无混叠。 另外要注意的是,采样间隔的 周期要足够的小,采样率要做够的大,要不 ) (s t f D /A ) (n f ) (n g A /D ) (t g )(t p ) (t f 量化编码 数字 滤波器

语音信号处理复习资料

8预加重和去加重的理解7线性预测编码特点和定义 5隐马尔可夫差数特点计算 以上三题没有 老师画的其他的重点为红色标记的(注意:仅供参考) 一、语音、语音信号处理的名词解释 1、语音:是语言的声学表现,是声音和意义的结合体,是相互传递信息的重要手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。 2、语音信号处理:是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及很广的交叉学科。它与语音学、语言学、声学、认知科学、生理学、心理学有密切关系。 二、语音学的名词解释 语音学:是研究言语过程的一门科学,它包括三个研究内容:发音器官在发音过程 中的运动和语音的音位特性;语音的物理特性;以及听觉和语言感知。 §.2语音信号处理的发展概况 1、语音编码:语音编码技术是伴随着语音信号的数字化而产生的,目前主要应用在数字语音通信领域。 2、语音合成:语音合成的目的是使计算机能像人一样说话。 3、语音识别:语音识别是使计算机判断出所说的话得内容。 §.2语音产生的过程 一、语音、清音、浊音 1、语音:声音是一种波,能被人耳听到,振动频率在20Hz-20kHz之间。语音是声音的一种,它是由人的发音器官发出的、具有一定语法和意义的声音。语音的振动频率最高可达15kHz左右。

2、浊音、清音:语音由声带振动或不经声带振动来产生,其中由声带振动产生的音统称为浊音,而不由声带振动产生的音统称为清音。浊音中包括所有的元音和一些辅音,清音包括另一部分辅音。 二、语音的产生过程:空气从肺部排出形成气流。空气通过声带时,如果声带是紧绷的,则声带将产生张弛振动,即声带周期性地开启和闭合。声带开启时,空气流从声门喷射出来,形成一个脉冲;声带闭合时相应于脉冲序列的间歇期。 语言交际:通过连接说话人大脑的一连串心理、生理、和物理的转换过程实现的。这个过程包括:发音-传递-感知。因此现代语音的三个分支:发音语言学、声学语言学、听觉语言学。 三、基音周期、基音频率 基音周期:声带开启和闭合一次的时间即振动周期称为音调周期或基音周期。基音频率:基音周期的倒数称为基音频率,简称为基频。 四、浊音、清音、爆破音的激励源 对于浊音、清音和爆破音来说,激励源是不同的,浊音语音是位于声门处的准周期脉冲序列,清音的激励源是位于声道的某个收缩区的空气湍流,而爆破音的激励源是位于声道某个闭合点处建立起来的气压及其突然释放。 五、共振峰的概念(参见大纲) 1、共振峰名词解释:声道是一个分布参数系统,它是一个谐振腔,有许多谐振频率, 称为共振峰,它是声道的重要声学特征。 2、共振峰的公式:Fn=(2 n-1)c/4L (会运用公式进行计算,填空、选择) 3、谐振点间的间隔不同,但平均仍然大约为每1KHz有一个谐振点。 4、声道的共振峰特性决定所发声音的频谱特性(音色)。 5、头三个共振峰最重要。 §.3语音信号的特性 一、语音的物理属性(集中备课) 语音的物理性质包括音质、音调、音强、音长等特性。语音是人的发音器官发出的一种声波,具有声音的物理属性。音质是一种声音区别于其他声音的基本特征;音调指声音的高低,取决

现代通信系统 复习提纲

第1章动通信系统概述 ★★1、移动通信的基本概念和主要特点 2、移动通信系统的分类和组成结构 ★3、典型的移动通信系统 4、移动通信的发展历史、发展现状及未来 ★★★★5、移动通信的基本技术 信道传播特点、调制解调、抗干扰措施、多址技术、组网技术 习题 1.移动通信定义是什么? 2.简述移动通信系统的组成及各部分的作用。3.移动通信系统的特点有哪些? 4.简述单工、双工和半双工方式的区别。 5.根据移动通信的特点,设计移动通信系统有哪 些技术要求? 6.2G和3G系统有何不同?

7.简述移动通信的发展。 第2章移动通信电波传播与传播预测模型★★★电波的自由空间传播 ★移动信道中电波的传播机制——直射、反射、绕射、散射 ★★★★移动信道对信号传输的影响 移动信道的传播损耗与传播模型 第2章重要知识点: 直射、反射、绕射、散射 自由空间损耗、近地点求远地点传播损耗、绕射损耗 接收机灵敏度、dBW、dBm、dBu 快衰落、慢衰落、阴影衰落、多径衰落 多普勒频移、多径时散、rms时延扩展 相关时间、相关带宽 时间选择性衰落、频率选择性衰落 第2章作业

课本58-59页 2.2、2.4、2.5、2.6 补充作业: 1.在自由空间参考距离d0=50m处接收功率有10 mW,若小区半径为5km,则最小接收功率多大? 2.某数字移动系统工作频率900 MHz,移动台运动速度不大于每小时80公里,则产生的最大多普勒频移为多少?相干时间为多少?符号速率为300 kbit/s的蜂 窝系统(频带利用率1bit/s/Hz)能否满足正常工作 的要求? 3. 某数字移动系统的多径信号时延扩展为2μs,则 相干带宽有多大?带宽为250kHz的蜂窝系统在此信 道下是否需要均衡? 第3章重点 ★语音编码的目的、分类及具体应用 ★★MSK和GMSK信号产生、功率谱特性 ★★QPSK、OQPSK和π/4-DQPSK星座图特点、产生、功率谱特性、星座图分析。

相关文档
最新文档