声音信号的特征检测

声音信号的特征检测
声音信号的特征检测

摘要

语言是人类最为重要的交流工具,它具有简易方便,准确自然等其他工具所无法替代的特点。随着信息社会的迅速发展,计算机已经渗透进人类生活工作的每一个角落,因此人机交互显得尤其重要。在人机交互的各种通信方式中,语音通信又是最好的交流方式,而声音信号的特征参数的精确度就会直接影响着语音通信的质量和准确度。因此,声音信号的特征检测在语音信号处理中是一项非常重要的工作。

本文利用MATLAB软件检测声音信号的特征参数,以语音信号为主,首先讨论了声音信号的基本特性,包括声音信号的产生,传播,声学特性等等。然后又分别讨论了声音信号在时域,变换域的特征参数。最后详细研究了声音信号的特征参数的检测提取。

第一章声音信号的基本特征

1.1声音信号的产生

声音是一种波,它是由物体振动产生的,能被人耳听到,它的振动频率在20~20000Hz之间。自然界中有各种各样的声音,如雷声,树叶被风吹时发出的“飒飒”声,大海波涛汹涌的翻滚声,机械工作时发出的声音等等。语音也是声音的一种,它是由人的发声器官发出的,语音的振动频率最高可达15000Hz。

语音信号的产生过程分为如下几个阶段:首先,说话人在头脑中产生想要用语言表达的信息;然后将这些信息转换成语言编码,即将这些信息用其所包含的音素序列、韵律、响度。基音周期的升降等表示出来。一旦对这些信息编码完成后,说话人会用一些神经肌肉命令在适当的时候控制声带震动,并塑造声道的形状以便发出编码中指定的声音序列。神经肌肉命令必须同时控制调音运动中涉及的各个部位:唇、腭、舌头以及控制气流进入鼻腔的软腭。一旦产生了语音信号,并将这些信息传递到听者时,语音的感知过程也就开始了。听者内耳的基底膜对语音信号进行动态的频谱分析,神经传感器将基底膜输出的频谱信号转换成对听觉神经的触动信号,这一过程和后面将要介绍的特征提取过程有些类似。作用在听觉神经上的活动信号,在大脑更高层的中枢转化成语言编码,并由此产生具有语义的信息。

人类的语音是由人体发声器官在大脑控制下的生理运动产生的。人的发声器官包括肺、气管、喉、咽、鼻腔和口腔等,如图1-1所示。喉以上的部分称为声道,发出声音的不同会导致其形状的变化,所以

听到的声音也不同;而喉(包括声带)的部分称为声门,呼吸时左右两声带打开,讲话时则合拢。声带每开启和闭合一次的时间即振动周期称为音调周期或者基音周期,其倒数称为基因频率,简称基频。基因频率取决于声带的尺寸和特性,也决定于它所受的张力。声带振动的频率决定了声音频率的高低,频率快则音频高,频率慢则音调低。基音的范围约为80-500Hz左右,它随发音人的性别、年龄及具体情况而定,老年男性偏低,小孩和青年女性偏高。

现在我们来讨论一下声音的产生过程。其原理图如图1-2所示。根据声带是否震动,语音又分为浊音和清音。在发声的过程中,肺当声带处于收紧状态时,流经的气流使声带振动,这时产生的声音成为浊音,没有声带振动的音称为清音。当声带处于松弛状态时,有两种方式能发出声音:一种方式是通过舌头,在声道的某一部分形成狭窄部位,也称为收紧点,当气流经过这个收紧点时会产生湍流,形成噪声型声音。这时对应的收紧点的位置不同及声道形状的不同,形成不同的摩擦音。另一种方式是声带处于松懈状态,利用舌头和嘴唇关闭声音,暂时阻止气流。当气流压力非常高时,突然放开舌与唇,气流被突然释放产生短暂脉冲音。对应于声道闭紧点的不同位置和

声道的形状,形成不同的爆破音。

综上所述,声道是气流自声门之后最为重要的器官,它是一个具有分布参数系统的谐振腔,因而有许多谐振频率。谐振频率由瞬态的声道外形所决定。人在说话的时候舌和唇连续运动,使得声道发生外形和尺寸上的改变,随即改变了谐振频率。谐振频率发生在

c,n=1,2,3,...

F n=(2n?1)

4L

C为声速,空气中c=340m/s。L为声道长度,n表示谐振频率的序号。这些谐振频率称为共振峰频率,简称为共振峰,它是声道的重要声学特性。声道对于一个激励信号的响应,可以用一个含有多对极点的线性系统来近似描述。每对极点都对应一个共振峰频率。这个线性系统的频率响应特性称为共振峰特性,它决定信号频谱的总轮廓或者谱包络。声音的频率特性也主要是由共振峰决定的。其中共振峰特性和元音的音色密切相关。

1.2声音信号的特征

1.2.1声音信号的基本特性

声音是一种波,它具有以下几种物理特征:○1音质。它是一种声音区别于其他声音的基本特征。○2音调。就是声音的高低。音调取决于声波的频率,频率快音调就高,频率慢音调就低。○3响度。响度表示声音的强弱,它是由声波振动幅度决定的。○4音长。它表示声音的长短,是由发音持续时间的长短决定的。

除了有物理特征外,它还具有另一个重要的性质,这就是声音总是能表达一定的意义和思想内容。而且不仅如此,它还能表达出一定的语气、情感。因此,声音中所包含的信息是丰富多彩的。

我们平时说话的时候很自然地一次发出来的、有一个响亮的中心的、听的时候也很自然地感到是一个小的语音片段的,称为音节。音节是构成语音的最小单位,是发声的最小单位。而一个音节又是由一个或若干个音素构成,音素是语音的最小、最基本的组成单位。各种音素组合到一起构成了不同的音节,各种音节组合到一起又构成了更大的单位——词,词是文章的基础,是有意义的语言的最小单位。

任何语音都有元音和辅音两种音素。一个音节由元音和辅音构成。元音是由声带的振动发出的声音,它是一个音节的主要部分。每个元音的特点是由声道的形状和尺寸决定的。所有元音都是浊音。辅音则是由呼出的气流克服发音器官的阻碍而产生的。发辅音时如果声带不振动,称为清辅音;发辅音时如果声带振动,则称为浊辅音。

1.2.2声音信号的时域波形及特性

在进行声音信号数字化处理时,能最为直观的了解声音信号的方式便是看它的时域波形。下面我们利用计算机声卡录音,看一下这段声音的时域波形。要求采样频率为8kHz,每个采样点用16位进行量化,录音时间为1s,内容为“你好”。图中横轴为时间,纵轴为信号的幅度。从图1-3(a)中可以看出声音能量的起伏,以及声音信号随时间变化的过程。图1-3(b)是将“好”的元音部分/ao/拉长后的形状。图1-3(c)是“好”的辅音/h/的波形图。

图1-3(a )语音信号“你好”的时域波形

图1-3(b )元音部分/ao/的波形

010002000300040005000600070008000

-2-1.5

-1

-0.5

0.5

1

1.5

4语音波形

010002000300040005000600070008000-3-2.5

-2

-1.5

-1

-0.5

0.5

1

1.5

2

4语音波形

图1-3(c )辅音部分/h/的波形

可以看出,元音/ao/的波形具有很强的准周期性并且有较强的振幅。它的周期对应的就是基音频率。而/h/的波形类似于白噪声,并且振幅也弱一些。

1.2.3声音信号的频域波形及特性

前面我们所研究的时域波形虽然简单直观,但是对于一些复杂的声音信号 ,一些特性只有在频域中才能体现出来 ;并且频谱是表征语音特征的基本参数 。共振峰即是一个典型的频域参数,它决定了信号频谱的包络。在声音的发音过程中,声道通常都处于运动状态,但是这个运动状态的时变过程同振动过程相比要缓慢得多,因此我们研究声音信号的时候都要假设其为一种短时平稳信号,一般都假定在10ms~30ms 之内是相对平稳的,但在长时间的周期中声音信号的特性会发生变化,这种变化的不同决定了声音的不同。根据声音信号这种短时平稳的特点,在每一时刻都可以用该时刻附近的一短段语音信号分析得到一个频谱。图1-4给出了“你好”的频谱特性。

010002000300040005000600070008000

-2500-2000

-1500

-1000

-500

500

1000

1500

2000

2500

语音波形

图1-4 “你好”的频谱

1.2.4语谱图

前面的频谱分析只能反映出信号的频率变化,而不能表示信号的时间变化特性。由于语音信号是一种短时平稳信号,可以在每个时刻用其附近的短时段语音信号分析得到一种频谱,将语音信号连续地进行这种频谱分析,可以得到一种二维图谱,横坐标表示时间,纵坐标表示频率,每个像素的灰度值大小反映相应时刻和相应频率的能量。这种视频图称为语谱图。能量功率谱的表达式为

Px n,ω =12N+1|X n,ω |2

其中,X(n, ω)= x k ω n ?k e ?j ωk ∞k=?∞; ω[n]是一个长度为2N+1的窗函数,X(n, ω)表示在时域以n 点为中心的一帧信号的傅里叶变换在ω处的大小。在实际情况下,一般不用对每个可能的频率和时间计算相应的能量。对于频率轴,一般计算2N+1点就足够;对于时间轴,取N 个点也足够了。

图1-5给出了一段语音的语谱图。图中横轴表示时间,纵轴表示频率,颜色的深浅表示该处能量的大小,一般用能量的对数表示。

图1-5 一段语音的语谱图

第二章声音信号的特征分析

对于声音信号的分析所采用的主要技术是“短时分析技术”。声音信号的特征是随时间变化的,是一个非稳态的过程。但即便如此,由于发声时人的口腔肌肉运动频率相对于语音频率来讲是相对缓慢的,所以在一个短时间范围内,它的基本特征是可以被认为是保持不变的,那么我们就可以将其视为一个准稳态过程。因此,对于一段较长的语音我们必须将其分为一段一段的“帧”进行处理,帧长一般取10ms~30ms。

对声音信号进行特征分析之前,首先需要对信号进行数字化处理,这一部

分我们只做简单讨论。

2.1声音信号的数字化

2.1.1采样与量化

声音信号在时间和幅度上都是连续变化的模拟信号,如果想在计算机上对其处理必须先进行采样和量化,将它变成在时间和幅度上都离散的数字信号。所谓采样,就是把模拟信号在时域上进行等间隔抽样,其中两相邻抽样点之间的间隔称为采样周期,倒数为采样频率。根据奈奎斯特采样定理,采样频率必须大于声

音信号最高频率的2倍,只有这样,在恢复信号的时候才能确保原始信号被完整地重构。在实际语音信号处理中,采样频率一般为8kHz~10kHz.

采样后的信号在时间上是离散的,但在幅度上仍然保持连续,所以要进行量化处理。量化就是将信号的幅度分成若干个有限的区间,并且把同一区间的样本点都用一个幅度值表示,这个幅度值称为量化值。量化有3种方式:零记忆量化、分组量化和序列量化。其中零记忆量化是最简单的一种,它的输入-输出特性采用阶梯型函数的形式。

信号经过量化后,一定存在一个量化误差。其定义为

e n=x1(n)-x(n)

式中,e(n)为量化误差;x1(n)为量化后的采样值,即量化的输出;

x(n)为未量化的采样值,即量化的输入。

经过采样和量化后,一般还要对信号进行预加重。其实质就是提升高频部分,使信号的频谱变得平坦,便于进行频谱分析或声道参数的分析。预加重滤波器一般是一阶的形式如下

H(z)=1-u z?1

式中,u值接近于1,一般取值在0.94~0.97之间。预加重后的信号在分析处理后,需要进行去加重处理。

2.1.2短时加窗处理

为了得到短时声音信号,要对声音信号进行加窗处理。窗函数在声音信号上滑动,将声音信号分成帧。分帧可以连续,也可以采用交叠分段的方法,交叠部分称为帧移,一般为窗长的一半。在加窗的时候,不同的窗口选择将会得到不同的分析结果。在选择窗函数时,需要考虑两个问题。

(1)窗函数形状

窗函数可以选择矩形窗,其表达式为

ωn=1, 0≤n≤N?1

0,其他

也可以选择汉明窗,表达式为

ωn=0.54?0.46cos2πn

N?1

,0?n≤N?1

0,其他

或汉宁窗

ω(n)= 0.5[1?cos ?(2πn N ?1],0≤ n ≤N ?1

0,其他

式中,N 为窗口长度。

虽然这些窗函数的频率响应都具有低通特性,但不同的窗函数形状将影

响分帧后短时特征的特性。我们拿矩形窗和汉明窗作比较。图2-1(a )给出了N=51时的矩形窗及其频率响应的对数幅度。51点汉明窗的频率响应如图2-1(b )所示。可以看出,汉明窗的第一个零值频率位置比矩形窗要大一倍左右,也就是说,汉明窗的带宽大约是同样宽度矩形窗带宽的两倍。从两个图中也可以看出在通带外,汉明窗的衰减比矩形窗大得多。

图2-1(a)矩形窗

00.2

1-100-80

-60

-40-20

归一化频率 p i 20l o g 10|W (e j )|/d B 矩形窗的傅里叶变换

图2-1(b)汉明窗

(2) 窗函数长度

窗函数长度对能否反映声音信号的幅度变化其决定性的

作用。如果N 特别大,即等于几个基音周期量级,则窗函数等效于很窄的低通滤波器,此时信号短时信息将和慢地变化,因而也就不能充分反映波形变化的细节;反之,如果N 特别小,即等于或小于一个基音周期的量级,则信号的能量将按照信号波形的细微状况而很快地起伏。如果N 太小,滤波器的通带变宽,则不能得到较为平滑的短时信息,因此窗函数的长度要选择合适。窗函数的衰减基本上与窗的持续时间无关,因此当改变宽度N 时,只会使带宽发生变化。 综上所述,矩形窗的频谱平滑性较好,但波形细节容易丢失,并且矩形窗会产生泄露现象;而汉明窗可以有效地克服泄漏现象,应用更为广泛。

2.2声音信号的时域参数分析

2.2.1短时能量分析

声音信号的能量分析是基于声音信号能量所时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多这一特性。声音信号的短时能量分析给出了反映这些幅度变化的一个合适的描述方法。对于信号x(n),短时能量的定义如下:

00.2

1-100-90

-80

-70

-60

-50-40-30

-20

-10

归一化频率 p i 20l o g 10|W (e j )|/d B Hamming 的傅里叶变换

E n = [x m ω n ?m ]2∞m=?∞= h(n ?m)x 2∞m=?∞(m)=x 2?h(n)

式中,h(n)=ω2(n), E n 表示在信号的第n 个点开始加窗函数时的短时能量。根据定义式可以看出,窗函数加权的短时能量相当于声音信号的平方经过一个线性滤波器的输出,该线性滤波器的单位冲击响应为h(n)。冲激响应h(n)的选择,或者说窗函数的选择决定了短时能量表示方法的特点。为了反映窗函数选择对短时能量的影响,假设h(n)非常长,且为恒定幅度,那么E n 随时间的变化将变为很小,这样的窗就等效为很窄的低通滤波器。我们要求的是对声音信号进行低通滤波,但还不是很窄的低通滤波,至少短时能量应能反映声音信号的幅度变化。因此出现了窗长选取上的矛盾,这种矛盾将在声音信号的短时表示方法的研究中反复出现。即希望有一个短时窗(冲激响应),以响应快速的幅度变化。但是,太窄的窗将得不到平滑的能量函数,并且窗函数的形状和长短直接影响着短时能量的性质。如果用x ω(n)表示x(n)经过加窗处理后的信号,窗函数的长度为N ,则短时能量可表示为

E n = x ω2n+N ?1m=n (m)

短时能量E n 反映了声音能量随着时间缓慢变化的规律,它的主要用途有:首先可以从清音中区分出浊音来,因为浊音的能量要比轻音的能量大得多;其次可以用来确定声母与韵母,无声与有声,连字等的分界。除此之外短时能量还可以作为一种超音段信息用于语音识别。

短时能量由于是对信号进行平方运算,因而人为增加了高低信号之间的差

距,在一些应用场合不太适用。解决这个问题的简单方法是采用短时平均幅值来表示能量的变化,其公式为

M n = x m ω n ?m = |n+N ?1m=n ∞m=?∞x ω(m)|

这里用加窗后的信号的绝对值之和代替平方和,使运算进一步简化。

图2-2(a )加矩形窗的声音文件“你好”的短时平均能量

图2-2(b)加矩形窗的声音文件“你好”的短时平均幅度

2.2.2短时平均过零率

短时平均过零率是声音信号时域分析中最简单的一种特征,它是指每帧内信号通过零值的次数。对于连续声音信号,可以考察其时域波形通过实践轴的情况。而对于离散时间信号,如果相邻的取样值改变符号则称为过零,由此可计算过零率。过零率就是样本改变符号的次数。单位时间内的过零率称为平均过零率。如果信号是正弦信号,它的平均过零率就是信号的频率除以两倍的采样频率,采样频率是固定的,因此过零率在一定程度上可以反映出频率的信息。因为声音信号不是简单的正弦序列,所以平均过零率的表示方法就不那么确切。然而短时平均过零率仍然可以在一定程度上反映其频谱性质,可以通过短时平均过零率获得谱特性的一种粗略估计,短时平均过零率的公式为

Z n=1

2

|sgn[x m?sgn[x m?1]|ωn?m=∞

m=?∞

1 2

|sgn[xω

n+N?1

m=n(m)]-sgn[xω(m-1)]|

式中,sgn[x(n)]是符号函数,即sgn[x(n)]=?1,x(n)<0 1,x(n)≥0

根据公式可以看出,首先对声音信号序列x(n)进行成对处理,检查是否有过零现象,若有符号变化,则表示又一次过零现象;然后进行一阶差分计算,取绝对值;最后进行低通滤波。

短时平均过零率可以用于声音信号分析。发浊音时,声带振动,因而声门激励是频率为基频的声压波,它在经过声道时产生共振。尽管声道由若干个共振峰,但由于声门的影响,其能量分布主要集中在3kHz频率范围内;反之,在发清音时,声带不振动声道的某部分收到阻塞产生类白噪声的激励,该激励通过声道后能量集中在比浊音时更高的频率范围内。因此,浊音时的能量集中于低频段,而轻音的能量集中在高频段。由于短时平均过零率可以在一定程度上反映频率的高

低,因此在浊音段,一般具有较低的过零率,而在清音段具有较高的过零率,这样可以用短时平均过零率来初步判断清音和浊音。然而这种高低仅是相对而言的,没有精确的数值关系。

另外,可以讲短时平均过零率和短时平均能量结合起来判断语音起止点的位置,即进行端点检测。在背景噪声较小的情况下,短时能量比较准确,但当背景噪声较大时,短时平均过零率可以获得较好的检测效果。因此一般的识别系统,其前端的端点检测过程都是将这两个参数结合用于检测语音是否真的开始。短时平均过零率的另一个用途是作为声音频域分析的一个中间步骤,方法是不用窗口型的低通滤波器来处理过零,而改用多通道的带通滤波器,这时的输出就是频域的短时平均过零率,如果再加上用带通滤波器的短时能量输出,就可以得到声音信号的频域分析结果。

用上面定义计算的短时平均过零率容易受到低频的干扰。解决这个问题的一种方法是对上述定义做一个简单的修改,即设立一个门限T ,将过零率的定义修改为跨过正负门限的次数。于是有

Z n =1/2 sgn x m ?T ?sgn x m ?1 ?T + sgn x m +T ?∞m=?∞sgn x m ?1 +T ω(n ?m)

这样计算的短时平均过零率就有一定的抗干扰能力。即使存在小的随机噪声,只要它不超过正、负门限所构成的带,就不会产生虚假过零率。

图2-2(c )加矩形窗的声音文件“你好”的短时平均过零率

2.2.3短时相关分析

相关分析是一种常用的时域分析方法,一般情况下,相关函数用于测定两个信号在时域内的相似程度,它分为自相关和互相关两种,分别由自相关函数和互相关函数来定义。自相关函数主要研究信号本身的同步性、周期性。而互相关函数主要讨论两个信号之间的相关性,如果两个信号完全不同,相互独立,则互相关函数接近于零;如果两个信号波形相同,则在超前、滞后处出现峰值,由此可求出两个信号的相似程度。

第四章《声现象》单元测试题

第四章《声现象》单元测试题 一、选择题(共40分) 1. 将敲响的鼓面用手一按,声音马上消失,这是因为() A. 声音传播的速度小了 B. 所有传到人体中去了 C.声音传播的速度变大了 D. 鼓面停止了振动 2. 古代侦察兵为了及早发现敌人骑兵活动,常把耳朵贴在地面上听,以下解释正确的是() A.马蹄踏在地面时,使土地振动而发声 B.马蹄声可以沿土地传播 C.马蹄声不能由空气传到人耳 D.土地传播声音的速度比空气快 3. 下列四个成语中都涉及声音,其中不强调声音响度这一特征的是() A. 如雷贯耳 B. 余音绕梁 C. 声如洪钟 D. 轻声细语 4.关于声现象,下列说法中正确的是() A.“闻其声而知其人”主要是根据声音的响度来判断的 B.“不敢高声语,恐惊天上人”中的“高”指声音的音调高 C.中考期间学校周围路段禁鸣喇叭,这是在声音传播的过程中减弱噪声 D.用超声波能粉碎人体内的“小石头”,说明声波具有能量 5.如图1所示,四个相同的玻璃瓶里装水,水面高度不同.用嘴贴着瓶口吹气.如果能分别吹出“dou(1)”“ruai (2)”“mi(3)”“fa(4)”四个音阶,则与这四个音阶相对应的瓶子的序号是() A.丙、乙、甲、丁 B.乙、丙、甲、丁 C.甲、乙、丙、丁 D.丁、丙、乙、甲 6.医生用听诊器能够清楚地听到病人胸腔内的声音,是因为听诊器可以() A.提高声音的音调 B.减少声音的分散,提高响度 C.降低声音的音调 D.增强音色 7.声波既传递“信息”也传递“能量”.下面事例中,主要利用声波传递的“能量”的是() A.用超声波碎石 B.用声纳探海深 C.利用B超做体检 D.利用回声定位 8.兰兰做有关声现象的实验时,将一个正在发声的音叉贴近面颊,目的是为了() A.感受发声音叉的振动 B.体验发声音叉的温度 C.估算发声音叉的质量 D.判断声音的传播速度 9.喇叭里响起“我和你,心连心……”的歌声,小凡说:“是刘欢在演唱.”他的判断是根据声音的() A.音调不同 B.响度不同 C.音色不同 D.频率不同 10.如图2所示,用一张硬卡片先后快拨和慢拨木梳的齿,会听到卡片声音发生变化.这个实验用来探究() A.音调是否与声源振动频率 B.声音能否在真空中传播 C.声音能否在固体中传播 D.声音传播是否需要时间 11.往保温瓶里灌开水的过程中.听声音就能判断壶里水位的高低,因为() A.随着水位升高,音调逐渐升高 B.随着水位升高,音调逐渐降低 C.灌水过程中音调保持不变,音响越来越大 D.灌水过程中音调保持不变,音响越来越小 12.吉它在演奏前,需要调整琴弦的松紧程度,这样做的目的是调节琴弦发声时的() A.振幅 B.响度 C.音调 D.音色 13.施工人员正在为紧邻居民区的轻轨轨道安装全封闭的隔音屏,尽量将列车产生的噪声降低到最低限度.这种控制噪声的方法是() A.防止噪声产生 B.阻断噪声的传播 C.防止噪声进入人耳 D.采用了上述三种方法 14.下列措施中不能达到减弱噪声目的的一项是() A.把大音箱改成小音箱埋在草坪中 B.控制播放音乐的时间 C.种草植树 D.保持环境整洁 15. 百米赛跑时,终点的计时裁判员正确的计时方法是() A.听到发令员的枪声开始计时 B.看到发令员的发令枪冒烟开始计时 C.听到发令员的最后一声口令开始计时 D.看到最先起跑的运动员起跑开始计时 16. 2010年5月,世博会在上海顺利举行,为向全世界充分展示“城市,我们的美好生活”这一主题,上海建设越来越注重以人为本.如:城区汽车禁止鸣笛,主干道路面铺设沥青,住宅区道路两旁安装隔音板等.这些措施的共同点是() A.绿化居住环境 B.缓解“热岛效应” C.降低噪音污染D.减少大气污染 17. 下面关于声现象的配对中,错误的是() A.“闻其声,知其人”------发声体不同,音色不同 B.“长啸一声,山鸣谷应”-----次声波传播很远 C.“隔墙有耳”------固体也能传声 D.用超声波清洗眼镜-----声波可以传播能量 18.如图3所示,主要描述声音能够传递能量的是() 19. 大礼堂的四周墙壁都做成凹凸不平的像蜂窝似的,这是为了() A.减弱回声 B.增强回声 C.增加声音响度 D.使墙壁更美丽 20. “呼麦”是蒙古族的一种高超演唱形式,演唱者运用技巧,使气息猛烈冲击声带,形成低音,在此基础上调节口腔共鸣,形成高音,实现罕见的一人同时唱出高音和低音的现象.下列说法正确的是() A.“呼麦”中高音、低音指声音的响度 B.“呼麦”中的声音是振动产生的 C.“呼麦”中高音是超声波、低音是次声波 D.“呼麦”中高音和低音在空气中的传播速度不等 二、填空题(共31分) 21.小明在表演二胡时,用弓拉动琴弦,使琴弦而发声;小明右手拉弓,左手不断用手指去控制琴弦长度,这样做的目的是为了改变声音的. 22.运用声呐系统可以探测海洋深度.在与海平面垂直的方向上,声呐向海底发射超声波.如果经4s接收到来自大海底的回波信号.则该处的海深为______m(海水中声速是1500m/s).但是,超声波声呐却不能用于太空测距(比如地球与月球的距离).这是因为_____________________________________________. 23.将一把钢尺紧按在桌面上,一端伸出桌面适当的长度,拨动钢尺,就可听到钢尺振动发出的声音.逐渐增加钢尺伸出桌面的长度,钢尺振动发出声音的音调会逐渐变.当钢尺伸出桌面超过一定长度时,虽然用同样的力拨动钢尺振动,却听不到声音,这是由于. 24.渔民可以利用电子发声器把鱼吸引到网里来,表明能传声;“土电话”表明能传声.25.医生给孕妇做B超,说明声波能够传递;医生用超声波粉碎人体内的结石,说明声波能够传递. 26.声速跟介质的种类有关,还跟介质的_____有关,15 ℃时空气中的声速是_____ m/s. 27.现代城市里常常在主要街道上设置噪声监测设备.若某一时刻该装置的显示屏显示90的数据,这个数据的单 图2 C.回声定位D.超声波探查 B.敲瓶底,火焰摇动 橡皮膜 A.探测海深 图3 甲乙 图4 1

基于MATLAB 的声音信号采集系统(论文)

基于MATLAB 的声音信号采集系统 野龙平 (陕西师范大学电子信息科学与技术,陕西) 摘要: 声音是各种信号传递与交流最直接的体现,因此对声音信号的研究有十分重要的意义。本文主要针对Matlab指令系统对声音信号的采集,作者利用Matlab 提供的数据采集工具箱, 介绍了倆种采集方法,简单分析并比较其优缺点。基于matlab的数据采集系统, 具有实现简单、性价比和灵活度高的优点。 关键词: Matlab; 数据采集 0 引言 随着科技的发展,对于语音信号的采集已经有很多种方法,如基于单片机技术、VC,C++等编程、纯硬件电路,本文介绍的方法主要通过一款软件MATLAB。它是MathWorks 公司推出的一种面向工程和科学运算的交互式计算软件, 其中包含了一套非常实用的工具-- 数据采集工具箱。使用此工具箱更容易将实验测量、数据分析和可视化的应用集合在一起。数据采集工具箱提供了一整套的命令和函数, 通过调用这些命令和函数, 可以直接控制数据采集设备的数据采集。 作者简单介绍了一种用声卡进行语音信号采集和MATLAB 的数据采集工具箱进行分析处理的语音信号采集系统。经实验证明, 该系统可实现在线连续采集语音信号并进行分析和处理, 具有实现简单、性价比和灵活度高的特点。 1 语音数据采集系统设计 MATLAB 中提供了强大的数据采集工具箱( DAQ- Data Acquisition Toolbox) , 可满足控制声卡进行数据采集的要求。用户通过调用MATLAB 命令, 可对采集的数据进行分析和处理, 为用户带来了极大的方便。 语音数据采集过程如图1 所示。

图1 声卡采集声音信号有两种方式: 传输线输入方式(LineIn) 和麦克风输入( MicIn) 方式。LineIn 方式是通过传输线把其他声音设备, 如录音机等设备的音频输出信号连接到声卡, 通过声卡记录数据存入计算机。 本系统采用MicIn 方式, 即用麦克风接收语音通过声卡将音频信号存入计算机。利用MicIn 方式通过声卡采集数据有两种方法: 方法一是采用对声卡产生一个模拟输入对象进行采集, 方法二是直接利用MATLAB 数据采集箱中提供的的函数命令进行采集。 1. 1 方法1 本系统是以声卡为对象利用MATLAB 数据采集工具箱提供的环境完成数据采集过程, 麦克风成为数据采集系统中的传感器。数据采集过程与其他硬件设备无关, 只与声卡有关, 因此应对声卡产生一个模拟输入对象(AI) 。 数据采集过程的具体实现: 1) 初始化: 创建设备对象。 ai= analoginput(‘ winsound ’ ) 2) 配置: 根据数据采集硬件设备的特性, 增加通道和控制数据采集的行为。为AI 添加1 个通道, 设置采样频率和采样时间。 addchannel( ai, 1) freq= 8000; % 采样频率fs8000Hz set( AI, sampleRate, freq) %为模拟输入设备设置采样频率 duration= 2; %采样时间为2 秒 set (AI, SamplesPerTriffer, duration* freq) ; % 为模拟输入设备设置触发时间 3) 执行: 启动设备对象, 采集数据。 start( ai) ; %启动设备对象 data= getdata( ai) ; % 获得采样数据 4) 终止: 删除设备对象。 stop( ai) ; % 停止设备对象 语音信号输入 声卡 Matlab 数据采集箱 计算机

声音质量的评价

声音质量的评价 默认分类2007-02-26 10:00:19 阅读6 评论0 字号:大中小订阅 音质标准 所谓声音的质量,是指经传输、处理后音频信号的保真度。目前,业界公认的声音质量标准分为4级,即数字激光唱盘CD-DA质量,其信号带宽为10Hz~20kHz;调频广播FM质量,其信号带宽为20Hz~15kHz;调幅广播AM质量,其信号带宽为50Hz~7kHz;电话的话音质量,其信号带宽为 200Hz~3400Hz。可见,数字激光唱盘的声音质量最高,电话的话音质量最低。除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音质标准。对模拟音频来说,再现声音的频率成分越多,失真与干扰越小,声音保真度越高,音质也越好。如在通信科学中,声音质量的等级除了用音频信号的频率范围外,还用失真度、信噪比等指标来衡量。对数字音频来说,再现声音频率的成分越多,误码率越小,音质越好。通常用数码率(或存储容量)来衡量,取样频率越高、量化比特数越大,声道数越多,存储容 量越大,当然保真度就高,音质就好。 声音的类别特点不同,音质要求也不一样。如,语音音质保真度主要体现在清晰、不失真、再现平面声象;乐音的保真度要求较高,营造空间声象主要体现在用多声道模拟立体环绕声,或虚拟双声道3D环绕声等方法,再现原来声源的一切声象。音频信号的用途不同,采用压缩的质量标准也不一样。如,电话质量的音频信号采用ITU-TG·711标准,8kHz取样,8bit量化,码率64Kbps。AM广播采用ITU-TG·722标准,16kHz取样,14bit量化,码率224Kbps。高保真立体声音频压缩标准由ISO和ITU-T联合制订,CD11172-3MPEG音频标准为48kHz、44.1kHz、32kHz取样,每声道数码率32Kbps~448Kbps,适合CD-DA光盘用。对声音质量要求过高,则设备复杂;反之,则不能满足应用。一般以"够用,又不浪费"为 原则。 音质评价方法 评价再现声音的质量有主观评价和客观评价两种方法。例如: 1.语音音质 评定语音编码质量的方法为主观评定和客观评定。目前常用的是主观评定,即以主观打分(MOS)来度量,它分为以下五级:5(优),不察觉失真;4(良),刚察觉失真,但不讨厌;3(中),察觉失真,稍微讨厌;2(差),讨厌,但不令人反感;1(劣),极其讨厌,令人反感。一般再现语音频率若达7kHz 以上,MOS可评5分。这种评价标准广泛应用于多媒体技术和通信中,如可视电话、电视会议、语音电子 邮件、语音信箱等。 2.乐音音质 乐音音质的优劣取决于多种因素,如声源特性(声压、频率、频谱等)、音响器材的信号特性(如失真度、频响、动态范围、信噪比、瞬态特性、立体声分离度等)、声场特性(如直达声、前期反射声、混响声、两耳间互相关系数、基准振动、吸声率等)、听觉特性(如响度曲线、可听范围、各种听感)等。所以,对音响设备再现音质的评价难度较大。通常用下列两种方法:一是使用仪器测试技术指标;二是凭主观聆听各种音效。由于乐音音质属性复杂,主观评价的个人色彩较浓,而现有的音响测试技术又只能从某些侧面反映其保真度。所以,迄今为止,还没有一个能真正定量反映乐音音质保真度的国际公认的评价标准。但也有报道,国际电信联盟(ITU-T)近期已批准一种客观评价音质的被称之为电子耳的新型测量方法,可对任何音响器材的音质进行客观听音评价,也可用于检测电话通讯语音编码系统的缺陷。 现将乐音音质评价方法综述如下: (1)主观听判音效 通常,据乐音音质听感三要素,即响度、音调和愉快感的变化和组合来主观评价音质的各种属性,如低频响亮为声音丰满,高频响亮为声音明亮,低频微弱为声音平滑,高频微弱为声音清澄。下面结合声源、 声场及信号特性介绍几种典型的听感。

信号处理实验七音频频谱分析仪设计与实现

哈尔滨工程大学 实验报告 实验名称:离散时间滤波器设计 班级:电子信息工程4班 学号: 姓名: 实验时间:2016年10月31日18:30 成绩:________________________________ 指导教师:栾晓明 实验室名称:数字信号处理实验室哈尔滨工程大学实验室与资产管理处制

实验七音频频谱分析仪设计与实现 一、 实验原理 MATLAB 是一个数据分析和处理功能十分强大的工程实用软件,其数据采集工具箱为实现数据的输入和输出提供了十分方便的函数命令。本实验要求基于声卡和MTLAB 实现音频信号频谱分析仪的设计原理与实现,功能包括: (1)音频信号输入,从声卡输入、从WAV 文件输入、从标准信号发生器输入; (2)信号波形分析,包括幅值、频率、周期、相位的估计、以及统计量峰值、均值、均方值和方差的计算。 (3)信号频谱分析,频率、周期的统计,同行显示幅值谱、相位谱、实频谱、虚频谱和功率谱的曲线。 1、频率(周期)检测 对周期信号来说,可以用时域波形分析来确定信号的周期,也就是计算相邻的两个信号波峰的时间差、或过零点的时间差。这里采用过零点(ti)的时间差T(周期)。频率即为f = 1/T ,由于能够求得多个T 值(ti 有多个),故采用它们的平均值作为周期的估计值。 2、幅值检测 在一个周期内,求出信号最大值ymax 与最小值ymin 的差的一半,即A = (ymax - ymin)/2,同样,也会求出多个A 值,但第1个A 值对应的ymax 和ymin 不是在一个周期内搜索得到的,故以除第1个以外的A 值的平均作为幅值的估计值。 3、相位检测 采用过零法,即通过判断与同频零相位信号过零点时刻,计算其时间差,然后换成相应的相位差。φ=2π(1-ti/T),{x}表示x 的小数部分,同样,以φ的平均值作为相位的估计值。 频率、幅值和相位估计的流程如图1所示。 4、数字信号统计量估计 (1) 峰值P 的估计 在样本数据x 中找出最大值与最小值,其差值为双峰值,双峰值的一半即为峰值。 P=0.5[max(yi)-min(yi)] (2)均值估计 i N i y N y E ∑== 1 )( 式中,N 为样本容量,下同。 (3) 均方值估计 () 20 2 1 ∑== N i i y N y E (4) 方差估计 ∑=-=N i i Y E y N y D 0 2))((1)(

(完整版)声现象单元测试习题(答案)

. 《声现象》专题训练 一、填空题 1.下列与声有关的语句中,所表达的物理含义是: (1)节日里的锣、鼓声“震耳欲聋”,说明锣鼓声的 大。 (2)歌唱家的歌声“悦耳动听”,说明歌唱家的歌声的 好。 (3)小女孩的讲话“脆如银铃”,说明小女孩说话声的 高。 2.东林书院名联“风声、雨声、读书声,声声入耳”表明声音可以在 中传播;用小提琴和二胡演奏“二泉映月”乐曲时,我们可以根据声音的 不同来加以辨别。 3.声音在介质中以___ 的形成向远处传播。声音传播过程中能引起别的物体发生_____,超声波还能粉碎人体内的结石,说明声音具有___________。 4.科学工作者为了探测海底某处的深度,向海底垂直发射超声波,经过3s ,收到回波信号,海洋中 该处的深度为 m (声音在海水中传播的速度是1531 m/s ),这种方法能不能用来测量月亮到地球的距离?为什么? 5.在百米赛跑中,甲、乙两个记时员,分别从看到发令枪冒烟和听到枪声开始记时同一运动员的成绩,则 记录的成绩较准确;若甲记录的成绩为11.3s ,则乙记录的成绩约为 s 。 6.某汽车以10m /s 的速度匀速驶向一座陡峭的高山,司机按了一下嗽叭,经4s 钟听到回声。听到回声时,车与前面高山的距离是 m 。 7.频率为 Hz 以下的声音为次声波;频率为 Hz 以上的声音为超声波。 8.噪声强度如果在 dB 以上,会影响人的正常学习和休息,如果在 dB 以上,长时间会造成对人的听力的伤害。 9.2005年春节晚会上,聋哑人表演的“千手观音”震撼了所有观众。她们是怎样训练的呢?听不见声音,她们将身体紧贴在音箱上,感受音乐的节奏,因为声音是由 产生的。 10.我们生活在声音的海洋里,鸟语、流水潺潺、琴声悠悠。这些声音是由于物体的____ ____而产生的。物体的 停止,发声也停止。悦耳动听的笛声是靠管子里的空气 产生的。我们能够分辨出鸟语和琴声是根据声音的____ ____不同(填“音调”、“音色”或“响度”)。蚊子和牛叫声的区别是:牛叫声音的音调比蚊子 ,而响度比蚊子 。 11. 在图所示的实验中,李明发现硬纸片在木梳上划得快时音调高,划得慢时音调低。这表明: 。 12.2011年 7月14日12时10分,广东省兴宁市罗岗镇福胜煤矿发生透水事故,救援工作迅速展开。下午,事故矿井下发现有生命迹象,原来是被困人员通过敲击钻杆,发出“当当”的求救信号,这是因为 。 13.人在野外说话,为了使声音传得更远一些,通常将手或者一本书合成喇叭状围在嘴边,其目的是1 图8

labview声音采集系统

虚拟仪器技术 姓名:史昌波 学号:2131391 指导教师:孙来军 院系(部所):电子工程学院专业:控制工程

目录 1、前言 (3) 2、声卡的硬件结构和特性 (3) 2.1声卡的作用和特点 (3) 2.2声卡的构造 (5) 3、LABVIEW中与声卡相关的函数节点 (5) 4、LABVIEW程序设计 (6) 4.1程序原理 (6) 4.2程序结构 (7) 4.3结果分析 (9) 5、结束语 (9) 6、参考文献 (10)

基于声卡的数据采集与分析 1、前言 虚拟仪器技术是利用高性能的模块化硬件,结合高效灵活的软件来完成各种测试、测量和自动化的应用。在虚拟仪器系统中,硬件解决信号的输入和输出,软件可以方便地修改仪器系统的功能,以适应不同使用者的需要。其中硬件的核心是数据采集卡。目前市售的数据采集卡价格与性能基本成正比,一般比较昂贵1。 随着DSP(数字信号处理)技术走向成熟,计算机声卡可以成为一个优秀的数据采集系统,它同时具有A/D和D/A转换功能,不仅价格低廉,而且兼容性好、性能稳定、灵活通用,驱动程序升级方便,在实验室中,如果测量对象的频率在音频范围,而且对指标没有太高的要求,就可以考虑使用声卡取代常规的DAQ设备。而且LABVIEW中提供了专门用于声卡操作的函数节点,所以用声卡搭建数据采集系统是非常方便的2。 2、声卡的硬件结构和特性 2.1声卡的作用和特点 声卡的主要功能就是经过DSP(数字信号处理)音效芯片的处理,进行模拟音频信号的与数字信号的转换,在实际中,除了音频信号以外,很多信号都在音频范围内,比如机械量信号,某些载波信号等,当我们对这些信号进行采集时,使用声卡作为采集卡是一种很好的解决方案。 声卡的功能主要是录制与播放,编辑与合成处理,MIDI接口三个部分3。 (1)录制与播放

音质标准音质标准与音质评价方法

音质标准音质标准与音质评价方法 ●音质标准 所谓声音的质量,是指经传输、处理后音频信号的保真度。目前,业界公认的声音质量标准分为4级,即数字激光唱盘CD-DA质量,其信号带宽为10Hz~20kHz;调频广播FM质量,其信号带宽为20Hz~15kHz;调幅广播AM质量,其信号带宽为50Hz~7kHz;电话的话音质量,其信号带宽为200Hz~3400Hz。 可见,数字激光唱盘的声音质量最高,电话的话音质量最低。除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音质标准。 对模拟音频来说,再现声音的频率成分越多,失真与干扰越小,声音保真度越高,音质也越好。如在通信科学中,声音质量的等级除了用音频信号的频率范围外,还用失真度、信噪比等指标来衡量。对数字音频来说,再现声音频率的成分越多,误码率越小,音质越好。通常用数码率(或存储容量)来衡量,取样频率越高、量化比特数越大,声道数越多,存储容量越大,当然保真度就高,音质就好。 声音的类别特点不同,音质要求也不一样。如,语音音质保真度主要体现在清晰、不失真、再现平面声象;乐音的保真度要求较高,营造空间声象主要体现在用多声道模拟立体环绕声,或虚拟双声道3D环绕声等方法,再现原来声源的一切声象。 音频信号的用途不同,采用压缩的质量标准也不一样。如,电话质量的音频信号采用ITU-TG·711标准,8kHz取样,8bit量化,码率64Kbps。AM广播采用ITU-TG·722标准,16kHz取样,14bit量化,码率224Kbps。高保真立体声音频压缩标准由ISO和ITU-T联合制订,CD11172-3MPEG音频标准为48kHz、44.1kHz、32kHz取样,每声道数码率32Kbps~448Kbps,适合CD-DA光盘用。 对声音质量要求过高,则设备复杂;反之,则不能满足应用。一般以“够用,又不浪费”为原则。 ●音质评价方法 评价再现声音的质量有主观评价和客观评价两种方法。例如:

matlab频谱分析仪

频谱分析仪 摘要频谱分析仪是研究电信号频谱结构的仪器,用于信号失真度、调制度、谱纯度、频率稳定度和交调失真等信号参数的测量,是一种多用途的电子测量仪器。随着软硬件技术的发展,仪器的智能化与虚拟化已成为未来实验室及研究机构的发展方向。虚拟仪器技术的优势在于可由用户定义自己的专用仪器系统,且功能灵活,很容易构建,所以应用面极为广泛。本文介绍了一种使用GUI工具箱用matlab实现的简易虚拟频谱分析仪的设计方法。 关键词matlab,频谱分析仪,时域分析,频域分析

目录 1概述 (3) 2技术路线 (4) 3实现方法 (5) 3.1搭建GUI界面 (5) 3.2信号输入 (6) 3.2.1选择信号输入 (6) 3.2.2声卡输入 (7) 3.2.3读取wav文件 (7) 3.2.4信号发生器输入 (7) 3.3时域分析 (8) 3.4频域分析 (9) 3.5仿真 (10) 3.5.1声卡输入 (10) 3.5.2读取wav文件 (10) 3.5.3信号发生器 (11) 4存在的问题 (15) 5致谢...................................................................................................... 错误!未定义书签。参考文献 (15)

1概述 MATLAB是矩阵实验室(Matrix Laboratory)的简称,是美国MathWorks公司出品的商业数学软件。可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。图形用户界面(Graphical User Interface,简称GUI,又称图形用户接口)是指采用图形方式显示的计算机操作用户界面。与早期计算机使用的命令行界面相比,图形界面对于用户来说在视觉上更易于接受。MATLAB自带了强大的GUl工具[1]。在本文中,将利用MATLAB的GUI工具,设计出数字频谱分析仪。 频谱分析仪是研究电信号频谱结构的仪器,用于信号失真度、调制度、谱纯度、频率稳定度和交调失真等信号参数的测量,可用以测量放大器和滤波器等电路系统的某些参数,是一种多用途的电子测量仪器。它又可称为频域示波器、跟踪示波器、分析示波器、谐波分析器、频率特性分析仪或傅里叶分析仪等。现代频谱分析仪能以模拟方式或数字方式显示分析结果,能分析1赫兹以下的甚低频到亚毫米波段的全部无线电频段的电信号[2]。目前已经有许多较成熟的频谱分析软件,如SpectraLAB、RSAVu、dBFA等[3]。本文将给出的则是通过MATLAB软件实现的基于FFT的数字频谱分析仪。 FFT(Fast Fourier Transformation),即为快速傅氏变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。它对傅氏变换的理论并没有新的发现,但是对于在计算机系统或者说数字系统中应用离散傅立叶变换,可以说是进了一大步[4]。 通过此次设计,能进一步掌握MATLAB软件开发过程的基本理论、基本知识和基本技能,熟悉基于MATLAB平台的若干信号处理系统开发及调试方法,且成本低,易于实现,容易修改,并可以进行仿真。该设计的进行可以为我们以后的学习工作奠定一定的基础。

声音信号的获取与处理

实验一声音信号的获取与处理 声音媒体是较早引入计算机系统的多媒体信息之一,从早期的利用PC机内置喇叭发声,发展到利用声卡在网上实现可视电话,声音一直是多媒体计算机中重要的媒体信息。在软件或多媒体作品中使用数字化声音是多媒体应用最基本、最常用的手段。通常所讲的数字化声音是数字化语音、声响和音乐的总称。在多媒体作品中可以通过声音直接表达信息、制造某种效果和气氛、演奏音乐等。逼真的数字声音和悦耳的音乐,拉近了计算机与人的距离,使计算机不仅能播放声音,而且能“听懂”人的声音是实现人机自然交流的重要方面之一。 采集(录音)、编辑、播放声音文件是声卡的基本功能,利用声卡及控制软件可实现对多种音源的采集工作。在本实验中,我们将利用声卡及几种声音处理软件,实现对声音信号的采集、编辑和处理。 实验所需软件: Windows录音机(Windows98内含) Creative WaveStudio(Creative Sound Blaster系列声卡自带) Syntrillium Cool Edit 2000(下载网址:https://www.360docs.net/doc/5c8185934.html,) 进行实验的基本配置: Intel Pentium 120 CPU或同级100%的兼容处理器 大于16MB的内存 8位以上的DirectX兼容声卡 1.1 实验目的和要求 本实验通过麦克风录制一段语音信号作为解说词并保存,通过线性输入录制一段音乐信号作为背景音乐并保存。为录制的解说词配背景音乐并作相应处理,制作出一段完整的带背景音乐的解说词。 1.2 预备知识 1.数字音频和模拟音频 模拟音频和数字音频在声音的录制和播放方面有很大不同。模拟声音的录制是将代表声音波形的电信号转换到适当的媒体上,如磁带或唱片。播放时将纪录在媒体上的信号还原为波形。模拟音频技术应用广泛,使用方便。但模拟的声音信号在多次重复转录后,会使模拟信号衰弱,造成失真。 数字音频就是将模拟的(连续的)声音波形数字化(离散化),以便利用数字计算机进行处理,主要包括采样和量化两个方面。 2.数字音频的质量 数字音频的质量取决于采样频率和量化位数这两个重要参数。采样频率是对声音波形每秒钟进行采样的次数。人耳听觉的频率上限在2OkHz左右,根据采样理论,为了保证声音

《声现象》全章检测题

八年级物理单元测试题 第一章声现象 一. 填空题(共26分) 1.为了解开物理之谜,在探究物理现象中,我们要做到以下三点:①勤于______________ , 勤于__________ ;②勤于___________ ,重在 ___________ ;③联系__________ ,联系_________ . 2. ___________________________ 一切发声的物体都在 _______________ ,拨动的琴弦发声靠的是琴弦的 ______________________ ,鼓发声时 用手按住鼓面,鼓声就消失了,这是因为 ___________________ . 3?渔民可以利用电子发声器把鱼吸引到网里来,表明______________ 能传声;“土电话”表明 能传声?声音不能在________ 中传播? 4.用大小不同的力弹同一个琴键,发出声音的不同;用大小相同的力弹不同的 琴键,发出声音的 _______ 不同;用大小相同的力在不同的乐器上弹奏同一个音,发出声音 的________ 不同. 5.超低空飞行的战斗机有时会把附近的居民家的窗户玻璃震碎,说明战斗机飞行时会 产生很大的_______ ,同时声波还可以传递______________ ? 6.我们感知声音的基本过程:外界传来的声音引起_________ 振动,这种振动经过听小骨及 其组织传给_______ , _________ 把信号传给大脑,这样人们就听到了声音?7?下面各种情形都无法听到声音,其原因有: A.振动频率过低;B.没有介质传播;C.能 量太小?请将代号填入下列空格中: 太阳表面的巨大的太阳风_________________ ;远处的朋友的悄悄话_________ ;振动的 手________________ ? &为了保护听力,声音不能超过_______________ dB;为了保证工作和学习,声音不能超过 __________ d B;为了保证休息和睡眠,声音不能超过______________ dB. 二、选择题(每小题2分,共30分) 1 .下列说法中正确的是() A .我们可能听不到正在振动的物体发出的声音 B .声音的传播速度一定是340 m / s C.声音可以从地球传到其它星球 D .吹哨子是靠声带振动发声的 2.1999年8月17日凌晨,在土耳其发生了一场大地震,致使一万多人丧生?有关人士 指出,地震发生后缺乏必要的自救知识,是丧生人数增多的一个原因?以下是关于被埋在废 墟里的人自救的一些措施,请指出切实可行的是() A .大声呼救 B .静等救援人员来营救 C.用硬物敲击预制板或墙壁,向营救人员求救 D .见缝就钻,从废墟中爬出来 3.下列说法中正确的是() A .人耳听不到的声音都是超声波 B .超声波传播的能量大,能沿直线传播

音频信号的种类及其质量特性

音频信号的种类及其质量特性 作者:辽宁广播电视传输发射中心二O三台赵军 数字技术的发展突飞猛进,电视伴音的数字技术也有了长足发展,现就声音方面所涉及的技术知识做一简要介绍。 目前,大部分使用的电声器件都是以模拟方式工作的。传声器输出的是模拟音频信号,扬声器需要的激励信号同样是模拟音频信号。器件的客观情况,决定了音频信号的数字化只能是其传输系统的中间环节。但由于其具有极好的保真度和极强的抗干扰性,所以在数字音频没有进入数字电视之前,就开始了探索研究,并取得了一定成果,已经在传统的音响系统领域得到了广泛应用。现就两方面做一介绍: 一、音频信号的种类 1.按声音传递信息内容区分 人耳可以听到的声波信号的频率范围为20~20KHZ。按声音传递信息的内容不同,音频信号可分为3种类型。 (1)波形声音 波形声音是指声波振动产生的声音。显然,波形声音实际上已经包含了所有的声音形式。 它可以成为人们理解声音的最一般形态,就好像可以把各种类型图像都理解成像素点阵图一样。 (2)语音 语音就是指人讲话的声音,特点就是包含有丰富的语言内涵。传送语音信号的基本要求是既能听清语音的内容,又能辨认出讲话者是谁。 (3)音乐 音乐与语音相比内容更丰富、所占频带更宽,同时表现形式更为规范,也可以说是符号化了的声音,乐谱就是音乐的规范表达形式。也就得出,传输音乐信号对系统的要求有多高,难度有多大。也是最高、难度最大的。 2.按声音所占的频带区分 从音频信号所占的频带、数字化时的抽样频率及量化的比特数不同,音频信号可以分为4类。 (1)窄带语音 窄带语音又称电话频带语音,信号频带为300~3.4KHZ,带宽为3.1KHZ,既能听清语音的内容,也能分辨出讲话人是谁,主要用于各类电话通信。数字化时抽样频率常用8KHZ,每个样值以8bit量化,数码率为64bit/s。 (2)宽带语音 信号频带为54~7KHZ,能提供比窄带语音更好的音质,常用于电话会议、视频会议等。 数字化时抽样频率多为16KHZ。 (3)数字音频广播(DAB)信号 信号频带为20~15KHZ,有较好的音质,主要用于声音广播和电视伴音广播。数字化时抽样频率常用32KHZ。 (4)高保真立体声音频信号 信号频带为20HZ~20KHZ,为人耳听觉的全部频带故称为高保真,用于DVD、VCD、CD、HDTV伴音等。数字化时抽样频率用44.1KHZ或48KHZ,每个样值16bit量化,

Adobe-Audition-系列教程(二):频谱分析仪

Adobe Audition系列教程(二):频谱分析仪 频谱分析仪是研究信号频谱特征的仪器,在电子技术一日千里的今天,是研究、开发、调试维修中的有力武器。现代频谱分析仪都趋向于智能化,虚拟仪器技术广泛应用,有些就是以专用的计算机系统为核心设计的。其结果是结构大大简化、性能飞速提高。当然专业的频谱分析仪就比示波器更加昂贵了,业余爱好者更难用上。不过不必灰心,我们可以充分利用AdobeAudition的频谱分析功能,让你拥有精确频谱分析仪的美梦成真!? 1. 频谱显示模式? Adobe Audition本身有一种“频谱显示”模式。先打开一段波形,或用《妙用Adobe Audition:数字存储示波器》一文介绍的方法录制一段波形,即可进行频谱分析。这里我们新建一段20秒的对数扫频信号(本文大多选用直接建立的波形,以便了解信号原始波形的标准频谱特征),然后选择“View=>Spectral View”(视图=>频谱),如图1,或点击快捷工具栏的“Toggle between Spectral and Waveform views”(切换频谱视图/波形视图)按扭,即可将波形以频谱显示的方式显示出来,如图2。扫频的频谱显示见图3。 图1

图2 图3 可以看到,横轴为时间,纵轴为频率指示。每个时刻对应的波形频谱都被显示出来了,可以看到扫描速度是指数增加的,即将频率轴取对数时扫描速度是线性的。如图中光标处18秒处频谱指示约11KHz。实际上频谱指示的颜色是代表频谱能量的高低的,颜色从深蓝到红再到黄,指示谱线电平由低到高的变化。这实际上跟地图的地形鸟瞰显示是比较相似的,看图4频谱复杂变化的声音频谱就更容易理解这点了。 图4

音频信号分析与处理

实验三音频信号的分析与处理1 一、实验目的 1.掌握音频信号的采集以及运用Matlab软件实现音频回放的方 法; 2.掌握运用Matlab实现对音频信号的时域、频谱分析方法; 3.掌握运用Matlab设计RC滤波系统的方法; 4.掌握运用Matlab实现对加干扰后的音频信号的进行滤波处理 的方法; 5.锻炼学生运用所学知识独立分析问题解决问题的能力,培养学 生创新能力。 二、实验性质 设计性实验 三、实验任务 1.音频信号的采集 音频信号的采集可以通过Windows自带的录音机也可以用专用的录制软件录制一段音频信号(尽量保证无噪音、干扰小),也可以直接复制一段音频信号,但必须保证音频信号保存为.wav的文件。 2.音频信号的时域、频域分析 运用Matlab软件实现对音频信号的打开操作、时域分析和频域分析,并画出相应的图形(要求图形有标题),并打印在实验报告中(注意:把打印好的图形剪裁下来,粘贴到实验报告纸上)。 3.引入干扰信号 在原有的音频信号上,叠加一个频率为100KHz的正弦波干扰信号(幅度自定,可根据音频信号的情况而定)。 4.滤波系统的设计 运用Matlab实现RC滤波系统,要求加入干扰的音频信号经过RC滤波系统后,能够滤除100KHz的干扰信号,同时保留原有的音频信号,要求绘制出RC滤波系统的冲激响应波形,并分析其频谱。

% 音频信号分析与处理 %% 打开和读取音频文件 clear all; % 清除工作区缓存 [y, Fs] = audioread('jyly.wav'); % 读取音频文件 VoiceWav = y(300000 : 400000, 1); % 截取音频中的一段波形 clear y; % 清除缓存 hAudio = audioplayer(VoiceWav, Fs); % 将音频文件载入audioplayer SampleRate = get(hAudio, 'SampleRate'); % 获取音频文件的采样率KHz T = 1/SampleRate; % 计算每个点的时间,即采样周期SampLen = size(VoiceWav,1); % 单声道采样长度 %% 绘制时域分析图 hFig1 = figure('Units', 'normalized', 'Position', [0 0.05 0.49 0.85]); t = T: T: (SampLen* T); subplot(2, 1, 1); % 绘制音频波形 plot(t, VoiceWav); % 绘制波形 title('音频时域波形图'); axis([0, 2.3, -0.5, 0.5]); xlabel('时间(s)'); ylabel('幅值(V)'); % 显示标题 %% 傅里叶变换 subplot(2, 1, 2); % 绘制波形 myfft(VoiceWav, SampleRate, 'plot'); % 傅里叶变换 title('单声道频谱振幅'); % 显示标题 xlabel('Frequency (Hz)'); ylabel('|Y(f)|'); play(hAudio); % 播放添加噪声前的声音 pause(3); %% 引入100KHz的噪声干扰 t = (0: SampLen-1)* T; noise = sin(2 * pi * 10000 * t); % 噪声频率100Khz,幅值-1V到+1V hFig2 = figure('Units', 'normalized', 'Position', [0.5 0.05 0.5 0.85]); subplot(2, 1, 1); % 绘制波形 plot(t(1: 1000), noise(1: 1000)); title('100KHz噪声信号'); % 显示标题 noiseVoice = VoiceWav+ noise'; % 将噪声加到声音里面 hAudio = audioplayer(noiseVoice, Fs); % 将音频文件载入audioplayer subplot(2, 1, 2); % 绘制波形 [fftNoiseVoice, f] = myfft(noiseVoice, SampleRate, 'plot'); title('音乐和噪声频谱'); % 显示标题 play(hAudio); % 播放添加噪声后的声音 pause(3);

八年级物理《声现象》单元测试题(含答案)

八年级第一学期第二单元物理测试 班级:姓名:座号:评分: 一、选择题(每题3分,共33分) 1.关于声音的发生和传播,下列说法正确的是() A.一切正在发声的物体都在振动 B.不振动的物体也能发声 C.声音可以在真空中传播 D.在空气中,声音的传播与光的传播一样快 2.下列说法中错误的是() A.演奏二胡时,弦在振动 B.鸟鸣是靠鸣膜的振动而产生的 C.收音机发声时,喇叭在振动 D.宇航员在月球上声带不能振动,所以不能发声 3.弦乐队在演奏前,演奏员都要调节自己的乐器—拧紧或放松琴弦,这样做主要是改变乐器发出声音的() A.响度 B. 音调 C. 音色 D. 传播方向 4.下面形容声音的“高”,指音调的是() A.引吭高歌 B. 高声喧哗 C.这首歌声音太高,唱不上去 D. 听不见,声音高些 5.小虹同学是校乐队的小提琴手,上物理课时,物理老师请小虹给同学们演奏了一首曲子,并请同学听粗琴弦与细琴弦发出声音的不同,以下说法中正确的是() A.粗琴弦发出声音的音调比细琴弦的高 B.粗琴弦发出声音的音调比细琴弦的低 C.粗琴弦发出声音的音调与细琴弦的一样高 D.无法比较音调的高低 6.狗、猫能听到人不能听到的声音,原因是() A.狗、猫的耳朵比人更灵敏

B.狗、猫的听觉范围比人的听觉范围小 C.狗、猫的听觉范围与人的听觉范围不同 D.狗、猫的耳廓能转动 7.我们生活在声音的世界里。下列声音:(1)工厂车间里机器的轰鸣声;(2)剧场里京剧表演的演奏声;(3)清晨公园里小鸟的鸣声;(4)装修房子时的电钻声;(5)婚庆时的爆竹声;(6)山涧小溪潺潺的流水声,其中属于噪声的是() A.(1)(3)(4) B.(1)(2)(5) C.(1)(4)(5) D.(1)(4)(5)(6) 8.比较声音在海水,铁管和空气中的传播速度,从大到小的排列顺序正确的是(B ) A.海水、铁管、空气 B.铁管、海水、空气 C.空气、铁管、海水 D.铁管、空气、海水 9.雷雨季节,有些小孩害怕雷声,是因为雷声的() A.频率很高 B.振幅很大 C.音调很高 D.响度很大 10.医生用听诊器诊病是因为(c ) A.听诊器能使振动的振幅增加,使响度增大 B.听诊器能改变发声体的频率,使音调变高 C.听诊器能减小声音分散,使传入人耳的响度更大些 D.听诊器能缩短听者距发声体间的距离,从而使传入人耳的响度变大些11.声音在传播过程中,下列说法正确的是() A. 响度会逐渐改变 B.音调会逐渐改变 C. 音色会逐渐改变 D.声音的音色、音调和响度都不会改变 二、填空题(每空2分,共44分) 1.吹奏笛子时,笛子发出的声音是由振动引起的;锣发声的时候,用手按住锣面,锣声就消失了,这是因为。答案:空气,锣停止了震动 2.声音在不同介质中的传播速度是(选填“相同”或“不同”)的;声音在15℃空气中的传播速度是 m/s,在雷雨天,人们总是先看到闪电,后听到雷声。如果看到闪电3s后才听到雷声,那么闪电处距人约 m 答案:不同,340,1020

光纤声音采集系统

摘要:科技的发展带来许多电磁干扰或射频干扰的恶劣环境,要想解决电磁干扰问题的,必须从本质上改变麦克风的工作模式。文章提出了利用激光的传输频带宽、通信容量大和抗电磁干扰能力强等优点,研制一种基于光相位干涉的高灵敏度声音采集系统。光纤声音采集能够传送非常高的声音质量,适用于多种恶劣环境下的声音采集。 关键词:光纤声音采集、干涉型光纤传感器 引言: 麦克风在声场和电场中起着重要的沟通界面,它可将声音信号传至任何地方或者记忆装置。传统型的使用电磁场或静电场来产生动作,外部的强电磁场影响会阻绝这些装置的功能。本项目研制的光纤声音采集系统是一种新颖的声音信号传感器,在反射式强度型光纤传感器的原理基础上,利用激光来采集声音信号,由于它与传统的麦克风有着本质的区别,所以在使用方面具有很大的优越性。系统由非导磁材料制成,其主要工作本体是光,即使在强电磁场或高射频环境中也能正常工作。把光纤应用于麦克风,充分利用了光纤传感器体积小、结构简单、灵敏度高、抗电磁干扰且光纤本身低损耗、耐腐蚀、安全可靠等优良特性。 1、系统结构 本系统利用干涉型光纤传感器的原理,开发基于光相位干涉的高灵敏度声音采集系统,由光纤传感探头、光路系统、光信号调制解调器等部分组成。 干涉型光纤传感器通常将被测量转化为光信号的相位,因此,相位测量是该类型传感器信号处理的基本要求。若直接对相位进行测量,那么有两个问题将限制系统的性能:一是系统受到环境的干扰时被测相位会产生随机漂移,从而引入测量误差,此外,相位漂移还会导致信号衰减;二是直接测相意味着直流检测,信号处理易受电路直流漂移的影响。针对这两个问题引出了相位生成载波技术。相位生成载波调制是在被测信号带宽以外的某一频带之外引入大幅度的相位调制,被测信号则位于调制信号的边带上,这样就把外界干扰的影响转化为对调制信号的影响,且把被测信号频带与低频干扰频带分开,以利于后续的噪声分离。 项目研制的光纤声音采集系统,在对传统michelson干涉仪加以改进的基础上,通过构造由光纤耦合器和振动膜组成的动态michelson干涉光路,能够将外界声压对振膜的作用转化为对光路相位的调制,得到的干涉光信号直接光电转换后即可解调还原声音信号。在多种干涉型光纤传感器的解调方法中,相位生成载波解调技术(pgc)由于是一种无源解调技术,并具有高灵敏度、大动态范围和好的线性度而得到广泛的应用。 2、系统原理 2.1光纤传感探头原理: 激光器发出的激光经耦合器到达传输光纤,由光纤出射的光束照射到振动膜上,传输光纤出射端面m1与振动膜构成一个干涉腔,从两表面反射回的光进行干涉,干涉光再经耦合器由光电探测器接收,外界声音信号通过改变干涉腔的光纤出射端面m1和振动膜之间的距离对光相位进行调制。系统中半导体激光器发出的光源光频随输入的调制电流线性变化,振动膜采用硅微技术进行研制。 2.2解调原理: 光纤声音采集系统中的调制解调器是由光源,光电转换器,高增益微弱信号放大电路,背景噪声消除器等组成。 光源向光纤传感头发射一稳定的激光,传感头内的振动薄膜被周围声音振动信号带动,从而对发射到振动薄膜上的激光进行相位调制后再反射回去,被调制的激光在光路系统里发生干涉,形成携带微弱声音强度的激光信号,光电转换系统的探测器将此激光信号转换成电信号,再经高增益微弱信号放大,pgc解调,噪声滤除,后将解调后的电信号还原成声音信号输出。

相关文档
最新文档