数字音频产品中基于人耳听觉感知特性的水印嵌入系统设计

数字音频产品中基于人耳听觉感知特性的水印嵌入系统设计
数字音频产品中基于人耳听觉感知特性的水印嵌入系统设计

 第26卷 第5期南京邮电大学学报(自然科学版)

Vol .26 No .5 2006年10月Journal of Nanjing University of Posts and Telecommunicati ons (Natural Science )Oct .2006

文章编号:167325439(2006)0520056209

数字音频产品中基于人耳听觉感知特性的水印嵌入系统设计

高银秋,邓宗元,杨 震

南京邮电大学信号与信息处理研究所,江苏南京 210003

摘 要:针对数字音频作品特别是语音录音(如朗诵、讲话)和歌曲,基于新的信息隐藏理论,设计将作品购买

者的身份信息隐藏进入数字音频作品中,以实现知识产权保护,并设计了可以自动将用户身份信息嵌入到音频作品中的方法,开发了相应的实现软件。在对语音录音添加水印信息时,主要是根据人耳对相位不敏感的原理,通过对字或者词进行180度反相来嵌入用户身份信息。在对歌曲添加水印时,给出了基于变换域(DCT )系数量化的水印嵌入方案。信息被嵌入后,将带水印作品在专业消声室里做了听觉试验,证实了作品的主观听觉效果未受到影响,也就是说嵌入的信息表面上是透明的,用户无法察觉。并且嵌入的信息必须采用特殊的手段才能提取。并对所提水印嵌入方法进行了各种加噪、编码等抗干扰实验,以验证技术的通用性。经过实验测试,证明本文所提方案具有更好的鲁棒性、安全性和透明性。关键词:信息隐藏;数字水印;鲁棒性;透明性;端点检测;线性预测中图分类号:T N912.3;T N915.08 文献标识码:A

Desi gn of Water mark E mbeddi n g Syste m for

D i git al Audi o Products Based on HAS

GAO Y i n 2q i u ,D ENG Zong 2yuan ,YANG Zhen

I nstitute of Signal and I nf or mati on Pr ocessing,Nanjing University

of Posts and Telecommunicati ons,Nanjing 210003,China

Abstract:Based on the ne w theory of infor mati on hiding,this paper p r oposes a novel app r oach f or e mbedding the I D s of the buyers int o digital audi o p r oducts,es pecially the records of s peeches and s ongs is realized in this pa 2per .And a s oft w are is designed t o carry out the app r oach aut omatically .W hen we add water marks int o the s peech records,the polarity of s ome syllables or words is inverted according t o the users’I D s,which is mainly based on the theory that the human audit ory system cannot distinguish s peech signals with positive and negative polarity .To deal with s ongs we adop t a method of inserting water marks by quantizing the coefficients of its DCT.W e have als o made s ome hearing experi m ents in an anechoic cha mber,and the experi m ents show that all p r oducts are not affected after e mbedding inf or mati on of the users .Moreove,the e mbedded infor mati on can not be extracted without using s ome s pecial measures .Some anti 2ja mm ing experi m ents such as adding s ome noises,coding and decoding and s o on have been done t o validate that our methods are universal .Based on the experi m ent results,we confir m that the app r oa 2ches in this paper have better perf or mances in ter m s of r obustness,security and invisibility .

Key words:I nf or mati on hiding;Digital water marking;Robustness ;I nvisibility;Endpoint detecti on;L inear predicti on

收稿日期:2006201209;修回日期:2006203206

基金项目:江苏省自然科学基金项目资助(BK2004150)

1 引 言

随着数字技术和因特网的发展,各种形式的多媒体数字作品(图像、视频、音频等)纷纷以网络版本形式发表,其版权保护成为一个迫切需要解决的

问题。由于数字水印(digital water marking)是实现版权保护的有效办法,因此如今已成为多媒体信息安全研究领域的一个热点,也是信息隐藏技术研究领域的重要分支。该技术即是通过在原始数据中嵌入秘密信息———水印(water mark)来证实该数据的所有权。这种被嵌入的水印可以是一段文字、标识、序列号等,而且这种水印通常是不可见或不可察的,它与原始数据(如图像、音频、视频数据)紧密结合并隐藏其中,并可以经历一些不破坏原数据使用价值或商用价值的操作而能保存下来。因此,数字水印技术必须具有较强的鲁棒性、安全性和透明性[1-2]。

本文实现了将购买者的身份信息隐藏到数字音频作品中的水印嵌入系统的设计,并开发了相应的实现软件。信息被嵌入后,作品的主观听觉效果未受到影响,并且嵌入的信息必须采用特殊的手段才能提取,也就是说嵌入的信息在表面上是透明的,用户无法察觉。

2 基本原理

2.1 语音

一般发音时,由肺部收缩送出一股直流空气,经气管流至喉头声门处(声门即声带开口处)。空气通过声带时,如果声带是绷紧的,则声带将产生张驰振动,即声带周期性地启开和闭合。声带开启时,空气流从声门处喷射出来,形成一个脉冲;声带闭合时相应于脉冲序列的间歇期。这种情况下在声门处产生出一个准周期性脉冲序列的空气流,该空气流经过声道后最终从嘴唇辐射出声波,这便是浊音语音。如果声带是完全舒展开来,则肺部发出的空气流将不受影响地通过声门。空气流通过声门后在不同情况下还有可能形成“摩擦音”、“清音”或“爆破音”[3]。由此可看出,声门气流在发声时是单方向性的,从而导致语音时域波形中存在确定极性。同时,众所周知,人耳听觉系统一般是无法辨认该极性的改变的,这就为通过改变极性而嵌入隐蔽信息提供了有效途径[4]。

2.2 歌曲

在为歌曲添加水印信息时所依据的原理是:依据正常人可听声音的频率范围,以及人耳在各频率分量处的灵敏度的不同,通过修改歌曲的DCT系数[5]来隐藏信息,提取时按同样方法确定隐藏信息。

3 基于相位翻转的语音水印嵌入

3.1 水印嵌入系统模型

信息隐藏必须保证透明性,即当在语音信号中添入水印信息后不能被人耳感知。根据人耳掩蔽效应,我们对各种语音录音进行听觉实验后,发现人耳对信号相位并不敏感,因此我们试图通过对某部分语音信号是否进行极性翻转来嵌入隐藏信息。

实验中我们首先将一整段语音录音在时域内翻转,发现人耳感觉不到音质受损;再将部分字或词整体翻转后,人耳亦感觉不到音质受损。由此,我们可以通过以下方法进行信息隐藏,达到嵌入用户身份信息的目的。首先,自动检测出可翻转的语音段的始末位置,也就是我们后面所说的端点检测;然后,设计用户身份信息嵌入方案,控制需要作翻转的语音段的位置。

据上所述,我们可以得到如图1所示的干净语

音的水印嵌入模型:

图1 干净语音的水印嵌入系统模型

3.2 模型解释

(1)端点含义

在实验中,首先我们在不同采样率下录制了青年男女的语音,然后通过手动翻转寻求可翻转语音段的始末位置及特点。该始末位置即为我们所说的端点,始末端点之间的语音段称之为可嵌入信息语音段。并将各语音文件及与之对应的端点载入语音库,作为标准以便检测后面用程序实现自动检测端点结果的性能。

通过实验,我们得出如下结论:

?单对语音信号的浊音部分翻转,不会影响人耳的听觉质量;

?对单个字(清音和浊音)翻转,不会影响人耳的听觉质量;

?对字字之间相对较长的间歇部分(有可能是清音也有可能是环境噪声)翻转,不会影响人耳的听觉质量;

?当两个字在波形上无明显间隔时,即前字结束处与后字辅音开端接壤,对两个字整体翻转,不会

75

 第5期 高银秋等:数字音频产品中基于人耳听觉感知特性的水印嵌入系统设计

影响人耳的听觉质量;

图2为在采样率为8kHz 时,一青年女声录音“单脉冲LPC 声码”。对图中依次相邻黑线所标识之间的部分进行翻转,不会影响人耳的听觉质量

图2 青年女声“单脉冲L PC 声码”

(2)用户身份信息

用户身份信息是用来标识购买者身份信息的秘密信息,根据人耳听觉系统可以利用可嵌信息语音

段的翻转来传递用户的身份信息。

3.3 模型实现原理

从广泛意义上说,上面所列的4种语音段均可作为信息嵌入段。但是,为了使所嵌信息有较强的抗噪性并且能通过基于LPC 盲检测提取出来,以便于版权拥有者在无法获得原文件的任何信息时,仅根据嵌入规则便能找出原文件中被翻转的部分,从而决定原先嵌入的用户的身份信息,则用来标识用户身份信息的可嵌入信息语音段必需含浊音段。

根据语音信号产生的离散时域模型,我们可认为一个语音序列是由一个周期脉冲序列或一个高斯白噪声序列激励一个全极点模型所产生的。当激励信号为周期脉冲序列时,该帧语音信号处于浊音段,此时线性预测残差也近似于周期脉冲序列,即每隔相同周期处会出现一个正向峰值。事实上,几乎在所有的语音信号中,基本的能量源是从肺中将气流排出的呼吸系统,气流从肺泡通过气管进入喉咙,此处气流在音腔中穿行。如果这些音腔是分离的,这种情况在呼气的时候是很正常的,气流将有一个相对自由的通道进入喉咙。语音通常是在呼气的时候产生的。因此,声门气流在发音期间是单一方向的,这导致了语音激励脉冲波形恒定的极性。而当激励信号为高斯白噪声序列时,该帧语音信号处于非浊音段,此时线性预测残差只是随机分布在0左右的小数据,无上述的明显的正向峰值特性。

图3为对应于图4语音信号的线性预测残差信号,可以看出其残差每隔一个基音周期会出现一个峰值

图3 

原始浊音信号的线性预测残差信号

图4 原始浊音信号

将原始语音信号在时域里翻转后再做线性预测分析,易得如下结论:当语音信号处于浊音段时,线性预测残差也近似于周期脉冲序列,只是每隔相同周期处会出现一个负向峰值;而当语音信号处于非浊音段,此时线性预测残差只是随机分布在0左右的小数据,无明显峰值特性。

综上所述,基于极性翻转嵌入水印的语音信号中是否隐藏了水印信息,可根据相应信号段的线性预测残差峰值的极性来判断。因此,为了可以实现盲检测,我们规定仅将含有浊音段的语音段作为可嵌信息语音段。这样,可以采用LPC 技术求取带水印文件的线性预测残余误差,然后根据对应语音段残差峰值的极性来提取所嵌用户身份信息。这种水印嵌入方案,与现有的其它音频水印方案,如回波

法、LS B 法、变换域法[1,2,6-8]

等相比,由于采用的是波形整体翻转方式,所以透明性更好,鲁棒性也更强,并且容易实现。

3.4 端点检测算法

3.4.1 新的端点检测算法

端点检测的目的是从包含语音的信号中找出可嵌信息语音段的起点以及终点。有效的端点检测不仅能使处理时间减到最小,而且可保证所嵌水印信息有很好的透明性。只要能准确地检测出本文中所定义的端点,人耳一般便无法感知带水印声音与原始声音的差别。这说明端点检测的成功与否在某种程度上直接决定了整个水印嵌入系统的成败。

基于本课题中端点的特殊含义,我们在传统端点检测算法基础上提出了新的自动检测可嵌信息语音段端点的算法,具体步骤如下:

(1)对语音录音分帧处理,帧长20m s,帧重叠10m s,加矩形窗;

(2)对语音数据作归一化处理;

(3)计算每帧短时能量,根据平均能量值定出两个门限值,高门限值为平均能量的一半,低门限值为平均能量的千分之四;

(4)根据高门限值初步判定可嵌信息语音段的起点和终点,即找出浊音段;

(5)根据低门限值将步骤4中的起点前移直至能量值低于该低门限值,此处变为新的起点。若起点前移过程中,能量均高于该低门限值,则当该点到

85南京邮电大学学报(自然科学版) 2006年 

达前一起点时,不再向前搜索,并将该点去除。然后根据同样规则,后移确定新的终点。

图5为8kHz 采样率下青年女声“词中还”的发音图形。下面标识了经过高低门限判决所得起点、终点(帧号已经转为样点的序号)的变化情况。经过修改(步骤5),去除了翻转后有可能带来噪声的端点,最终将“词中还”作为一个整体,充分保证了嵌入水印信息的透明性

图5 端点检测算法演示

3.4.2 与传统端点检测算法的比较

基于本课题中端点的特殊含义,我们无需检测

出单个字或词的开始和结束的位置。对连续的在波形上不易分离的两个字或多个字,可以将它们看作一个整体。如图2中,可将“单脉冲”看作一个大的可嵌入信息语音段。然而,传统的端点检测算法旨在利用短时能量(或幅度)大致判定清音变为浊音或浊音变为清音的时刻,从而确定一个输入语音(字或词)的起点、终点。即先用一个较高的门限粗略地标记出浊音部分,然后再用一个低门限值及其它短时参数微调获得端点。对图2中所示语音,利用传统端点检测算法时,会在“单脉冲”之间获得一个端点标志。而通过听觉实验,若该语音在“单脉冲”之间翻转,会引入噪声。因为此处信号幅度值较高,翻传后导致相位的突变,从而带来噪声。

在新的端点检测算法中,高低门限值的选取控制着端点检测的效果。根据实验,本文最终选取高门限值为平均能量的一半,低门限值为平均能量的千分之四。高门限的选取只需满足将清浊音区分开来(至少应不低于平均能量的百分之一),如果高门限选得太低,很有可能将能量稍高的清辅音误判成浊音。而低门限应尽量低(大约为平均能量的千分之四左右),以排除有可能会引入噪声的端点。3.4.3参数选择的依据

(1)高低门限的选择

实验中所用的语音录音均是在CS L (Computer Speech Lab )语音工作站录制的。我们分别在8k,16k,44100k 采样率下录制了几十位青年男女的声音。通过VC 程序计算了所获录音的信噪比大致

分布在30—50d B 。下面是一采样率为8kHz 的青年女声“单脉冲LPC 声码”,帧长为20m s,即每帧有160个样值,帧重叠为0,图6为归一化的声音波形。图7为直角窗下的短时幅度曲线。从其短时幅度曲线可以看出,短时幅度可以区分清音段与浊音段,因为浊音时短时幅度值比清音时大得多,图7中幅度值大的对应于浊音段,而幅度值小的对应于清音段

图6 

青年女声时域波形图

图7 短时幅度曲线

由图上幅度值的变化,可大致判定浊音变为清音或

清音变为浊音的时刻。事实上,短时能量相当于对短时幅度作平方运算,故其亦能区分出浊音和清音,但能量曲线在清浊音转变时刻较幅度曲线有更明显的变化。当然,理论依据也是明显的,即各种不同信号的幅度和分布不同。根据多次试验结果,调整高低门限,最终选择了最佳的门限值。

(2)窗型的选择

在上述端点检测算法中,计算短时能量时采用了直角窗。若用哈明窗,由于其带外衰减比较大,故增大了语音结束或开始时幅值的衰减,导致所检测到的语音段长度略小于手动找出的可翻转的区间长度。由图8可见,直角窗下根据能量所检测到的可嵌信息语音段弥补了海明窗的缺陷,准确地检测到了可翻转区间的起点和终点

图8 海明窗和直角窗下的端点检测比较

3.5 水印信息的嵌入方案

将检测得到的语音段排列顺序,给每个语音段标

上段号。用户身份信息用0、1序列表示,序列中每个码按照一定规则对应于可嵌入信息语音段的段号。“1”表对其对应的语音段在时域内作180度反相,“0”表对其对应的语音段不作任何变动。在试验中,我们

9

5 第5期 高银秋等:数字音频产品中基于人耳听觉感知特性的水印嵌入系统设计

的对应规则为第一个语音段对应第一个用户代码,第二个语音段对应第二个用户代码,依此类推。实践中为了抗不正当提取,我们可以打乱该顺序,如仅利用段号为偶数的语音段或是改变水印编码嵌入规则等。

鉴于我们试验中所用语音录音时长大约为10—20s,可嵌入信息语音段数目有限,故将水印序

列长度设为10,这样可以标注1024个不同用户。一般音频产品录音时间至少几十分钟,此时可将序列长度增加,以标识更多的购买用户。

3.6 水印信息的提取

3.6.1 非盲提取

非盲提取是有原文件的情况下提取水印信息。可以直接利用声音处理软件比较带水印文件和原文件在时域内的波形,并结合语音分段及嵌入规则便可提取出用户代码信息。也可以根据波形在时域内翻转前后,其DFT 系数实部虚部均变为原来的相反数,故可利用频谱的这一特性,提取所嵌水印信息。3.6.2 盲提取在某些场合,没有原始语音文件,那么需要进行盲检测。由水印嵌入模型的实现原理可知,可以根据带水印文件线性预测残差峰值的极性提取用户代码信息。其步骤可简述如下:

(1)按端点检测算法,找出带水印文件的任何可嵌信息语音段;

(2)对带水印文件作12阶的线性预测残差,观察每个可嵌信息语音段浊音部分残差脉冲峰值的极性。若是正峰则判定对应该段的用户代码为0,若是负峰则判定对应该段的用户代码为1,如此直到完成对第10个代码的提取(试验中我们所选用户序列长度为10)。如果是其它情形,则根据3.5节中所规定的水印编码嵌入规则在相应的带水印处检测从而提取水印信息。

3.7 修正的水印信息嵌入方案

(1)改进方案

实验中发现,通过对各个未经处理的语音录音线性预测残差的分析,并非所有对应于浊音位置的残差所有峰值都具有正向性,有时隔一基音周期会出现正负相当的峰,如图9所示,对此段不能根据峰值极性来判决有无翻转

图9 残差峰值特例

为了能根据残差特性提取所嵌的用户代码信息,必须保证原可嵌信息语音段的浊音处的线性预测残差峰值有很好的方向性。为解决此问题,下面提出了一种修正的水印嵌入规则。

修正方法为,在添加用户身份信息之前,求原文件的线性预测残差。然后根据残差的峰值特性决定原先的可嵌信息语音段是否能嵌入信息。根据对不同语音文件的残差的大量分析可知,对一般由端点检测算法获得的语音段,所存在负峰值的比例不可能超过70%。我们可预设一个峰值比例门限70%。因此,可以规定若残差峰值中,正负峰数目较大的峰在峰的总数目中所占比例不到该门限时,则舍弃该信息段,即不对该语音段做任何处理。同理,在信息提取时,若遇到残差峰值中正负峰数目较多的峰在峰的总数目中所占比例达不到比例门限的语音段,则跳过该语音段,对下一语音段进行研究,直至检测完10个真正可嵌信息的语音段。该修正方案,保证了仅根据残差峰值极性提取用户信息的准确性。更为保守的嵌入方案是统计所有帧中负峰的比例,若负峰所占最大比例超过70%则修正比例门限为此最大的比例值,然后按照上述方法处理,否则比例门限仍按70%计算。

(2)峰值比例门限70%的确定根据对不同语音文件的残差的大量分析可知,对一般由端点检测算法获得的语音段,所存在负峰值的比例不可能超过70%。具体算法如下:根据峰值出现的位置一般相隔一个基音周期,为了准确的检出各语音段残差正、负峰值的数目,首先根据短时能量判断语音段中属于浊音的帧号,然后估计浊音帧的基音周期,接着根据基音周期找出相应残差帧中正负峰数目,最后统计该段语音中正负峰的数目从而决定是否在该信息段嵌入用户代码。

对16kHz 采样下青年男声(时长14.650s )经上述分析所得数据如下:共17个可嵌信息语音段,每段的正负峰数目如表1所示。表中数据说明即使出现负峰,负峰的比例不会占主导地位。作者对其他众多语音也作了相似实验,充分说明负峰的比例一般不会超过整体的70%。

表1 正负峰数目对照表

段号

1

2

3

4

5

6

7

8

91011121314151617

正峰数5530261632204816772210820211107215负峰数29128

5158152306

6

2

81034174

负峰比例(%)

3529242432292411282175202932241921

理论上,声门气流在发音期间的单一方向性导

致了语音激励脉冲波形恒定的向上的极性。

06南京邮电大学学报(自然科学版) 2006年 

3.8 性能分析

?透明性

本文衡量水印嵌入方案透明性的主要性能指标是比较原文件和带水印文件对人耳的听觉影响。如果人耳听不出两者的差别,即带水印声音与原始声音差别无法感知,则可认为所嵌水印信息达到了透明性的要求。我们将带水印作品在专业声音消声室里做了听觉试验(消声室可以保证没有任何回波的存在,避免听觉干扰),证实了人耳感觉不到带水印作品与原作品的差异。

我们请了6位听众。图10为听觉测试时,听者及其扬声器的平面布局图

图10 布局图

我们准备了8个青年男女的原始录音及添加水印后的文件,听觉试验过程如下:

(1)播放原始语音;

(2)随机播放两个文件,可能是添加过水印的,也可能是原始语音。让听者判决是否原始语音。

我们分别让6位听者对上述16个文件作判决,仅有一位听者觉得加入水印的声音

。这充分证实了我们添加的水印信息的透明性。

?无攻击情况下的性能

在无攻击情况下,通过盲提取和非盲提取出的水印信息即用户代码序列可以得到100%的正确率。?抗压缩测试

抗压缩能力是衡量算法鲁棒性的重要指标,也是网络环境对实用信息隐藏技术的要求。将带水印文件经DV I/I M A ADPC M 编码进行压缩,并将压缩文件直接解码(不经过信道传输)后所得声音文件仍能通过盲检测和非盲检测提取出嵌入水印信息。

?抗噪性

通过极性翻转的水印作品有着很强的抗噪能力,以白噪声为例。若在带水印作品上叠加一个高斯白噪声,则只要该噪声强度未将信号全部掩蔽,仍能明显从波形上看出经过翻转的部分。

4 带噪语音的水印嵌入

4.1 带噪语音端点检测

一些语音在录制时具有背景噪声,这时嵌入水

印时由于端点检测受到噪声影响,可能出现误差,因此需要进行研究测试;而还有一些语音嵌入水印后由于某种外界原因(如通信传输等),使得嵌入水印后的语音叠加了噪声,也可能破坏水印或者影响水印的提取,也需要研究噪声影响。本节详细讨论了嵌入水印前语音录音存在噪声的情况下,如何检测到可添加水印信息的语音段,以保证水印信息的透明性。

鉴于高斯白噪声的存在,可翻转的语音段数目增多了,因为该噪声在一定程度上可屏蔽掉强语音信号翻转造成相位突变而带来的噪声。经过试验分析,可以大致认为一段带噪语音的终点为接下来开始的一段语音的起点,故检测时只要检测出起点或是终点即可。我们提出了有噪音时的端点检测算法(检测终点)如下:

(1)对带噪信号作预处理(分帧、加窗等),计算每帧短时幅度,方法同对干净语音的操作;

(2)计算出白噪声的平均幅度值。根据语音出现处短时幅度会有明显提升,当后帧短时幅度超过前帧的1.5倍时,我们认为开始出现语音。据此可算出白噪声的平均幅度值;

(3)从每帧平均短时幅度中减去白噪声的平均幅度值,作为新的帧短时幅度,并根据此设定门限值;

(4)设定高门限值为平均帧短时幅度的一半,低门限为平均帧短时幅度的千分之一;

(5)当相邻两帧输入信号前帧短时幅度值超过高门限,而后帧短时幅度低于高门限时,该帧可看作为一输入语音的结束处。然后根据低门限将帧后移,尽量囊括整个语音,准确地找到语音真正结束的地方。

注意:此时语音段中已不存在无声段(叠加了高斯白噪声),无需区分清音和噪声。

4.2 水印嵌入

按照检出的终点划分语音段,从检测到的第一个终点起,第一个至第二个终点之间的语音段的段号记作1,依此类推。同处理干净语音所用规则一样,将语音段号和代码序列号对应,然后进行信息的嵌入。

4.3 性能分析

由于待添加水印文件本身就存在噪声,只要找

到的端点接近一个输入语音的真正结束或开始处,对其之间的部分翻转,人耳是觉察不到两者的差别的。即水印信息的透明性很容易得到保证。

1

6 第5期 高银秋等:数字音频产品中基于人耳听觉感知特性的水印嵌入系统设计

5 歌曲中的水印嵌入

5.1 分析

首先对纯音乐而言,其波形的幅度曲线较稳定,不像录制的语音信号的幅度曲线在清浊音处有明显的变化。且原始波形无明显分段,即不会出现说话时所出现的能量极低的情况。结合我们在语音中所检测到的端点均为能量相对较低处,这在音乐信号中难以找到,若在信号中间翻转,必然会引起相位的突变。实验发现,当在语音上叠加上背景音乐时,当背景音乐强度不是很大时,可以从时域或幅度波形上分辨出其中输入语音的开始和结束位置。我们根据语音的端点对其翻转,在翻转处会出现尖锐听觉噪音,显然这是由背景音乐造成的。

综上试验分析,对音乐或者歌曲,在时域内寻求可翻转端点来嵌入水印信息的方案不可行,因此考虑在频域里隐藏信息。这里我们研究了在数字音频信号的离散余弦变换域中嵌入水印的算法并给出了基于变换域系数量化的水印嵌入方案[5]

及实现

软件。

5.2 量化算法

假设待量化的系数为f ,嵌入水印比特为

w (0或1),量化步长为Δ,量化处理后含有水印比特信息的系数为f ′。基于量化系数f 嵌入水印比特的原理如图11所示

图11 量化系数嵌入水印的原理

量化系数的过程及其表示式如下:(1)分割区间

按照量化步长Δ将系数所在的坐标轴分割成如图11所示的A 区间集和B 区间集。

(2)确定区间集内坐标值的两重含义

如果用于计算,坐标值具有数量大小的实际意义;如果用于表示水印比特信息,则不管该坐标的数值大小,凡属于A 区间集的坐标都代表二进制数“1”,属于B 区间集的坐标都代表二进制数“0”。

(3)取模和取余数运算

用量化步长Δ对待量化系数f 进行取模和取余数运算。假设所求得的模值为m ,余数为r ,则有

m =f mod Δ

(1)r =f -m

(2)

(4)量化系数

对系数f 量化处理与水印比特w 的取值密切相关:当w =1时,使量化结果f ′等于与f 最接近的A 区间集中某一区间的中间坐标值:当w =0时,使f ′等于与f 最接近的B 区间集中某一区间的中间坐标值。

5.3 水印嵌入方案

根据图12水印嵌入算法框图,我们设计水印嵌入的具体步骤如下

:

图12 水印嵌入算法框图

(1)用户代码序列获得

暂规定用户代码为0、1序列,即水印信息可记为

V ={v (i ),0≤i

(3)

(2)音乐信号的分段处理原始数字音频信号可分成两部分:与水印嵌入有关部分和与水印嵌入无关部分,即s =s e +s r ,式中,s e 是与水印嵌入相关的部分,它里面将包含水印信息,s r 是与水印嵌入无关的部分,它在水印嵌入前后保持不变。

(3)分帧离散余弦变换

对需要嵌入水印的第k 帧(L 个样点)音频数据段s e (k )分别作离散余弦变换。

D e =DCT (s e )={D e (k )=DCT (s e (k ))}(4)式中,D e (k )={d e (k )(i ),0≤i

k 帧音频数据段s e (k )的离散余弦变换D e (k )中的

第i 个系数。

(4)在DCT 域内确定水印的嵌入区域

由5.2节可知,在DCT 域内通过量化DCT 系数可以实现水印信息的嵌入。假设第k 帧音频数据段

s e (k )的DCT 系数d e (k )(t )用于嵌入水印信息序列V 中的第m 个元素V (m ),量化处理结果为d ′e (k )(t ),其它DCT 系数保持不变。

注意:(1)步长Δ的值越大,嵌入水印的稳健性越好;但是Δ的取值过大,则会使含水印的数字音频信号失真严重,降低了实用价值。因此量化步长Δ的取值要根据嵌入水印的稳健性和数字音频信号的具体应用背景折衷考虑确定;(2)由于音频数据段S e (k )的数据个数为L ,其离散余弦变换结果

26南京邮电大学学报(自然科学版) 2006年 

D e (k )中含有L 个DCT 变换系数,其中第0个DCT

系数d e (k )(0)为直流分量,其他的L -1个DCT 系数是由低频到高频的交流分量。一般选取频率较低的交流分量(d e (k )(1)除外)作为水印嵌入的位置。通常把水印信息嵌入在离散余弦变换的低中频系数上,这样做的好处有:第一,音频信号遮盖了水印的影响,使其不易被发觉;第二,如果这一部分音频信号受到较大影响,还原出的音频信号音质将严重下降,所以一般的信号处理操作(如滤波、压缩、变换等),影响的是信号的高频部分,即使音质受到一定程度的破坏,只要音频信号有一定的可懂度,水印信号就可以检测出来。

(5)含水印音频信号的生成

对嵌入水印后的音频信号做分段离散余弦反变换,得到时域中含有水印信息的音频信号。

s ′e =I D CT (D ′e )={I D CT (D ′e (k ))}(5)将s ′e 代替s e ,最终得到含水印的数字音频信

号:s =s ′e +s r 。

5.4 水印提取

假设s s 是待检测的数字音频信号,提取水印的

过程如下:

(1)对待检测数字音频信号作分帧处理,分帧规则同嵌入水印时一样;

(2)对待检测的数字音频信号中含水印部分作离散余弦变换(在此必须事先知道含水印信息的帧号);

(3)根据DCT 系数在图11中所处的位置,提取水印序列V s 。

在基于量化的水印嵌入算法中,水印信息由DCT 系数d se (k )(t )所属的区间集表示的,因此提取

水印信息的方法可表示为

V s (k )=

1, d se (k )(t )∈A

0, d se (k )(t )∈B

(6)V s 即恢复出的用户代码序列。

需要注意的是,经过上述变换过程后,水印信息可能将与原来稍有不同。因为中间经过了DCT 系数的量化、量化后的系数反变换再正变换。为了解决此问题,我们采用连藏的方法,来减轻这种微小的改变。这在下节的仿真试验中详细阐述。

5.5 仿真试验

在水印的提取过程中无需使用原始音频信号,是一种盲水印检测方案。在仿真试验中,采用16bit/sa mp le,44.1kHz 采样,3.183s (140370个样点值)长的流行音乐(网络歌曲“老鼠爱大米”中的一

段)作为原始的数字音频信号。在水印的嵌入过程

中,若规定音频数据段的长度为28,每段嵌入一个比特信息,则所选音乐段可嵌入5000位0、1代码序列。在试验中,我们采用连续5帧隐藏一个比特信息的方案,即对连续5帧的第二个DCT 系数进行相同的量化操作,这有利于提高所嵌代码的抗噪性。

归一化量化步长Δ=0.05,嵌入位置为

DCT 系数的D e (k )(2)。图13为原始数字音频信号,图14为含水印的数字音频信号,比较原始数字音频信号和含水印的数字音频信号的波形图,它们几乎没有差别,证明本文方法透明性良好。

图13 原始的数字音频信号

图14 含水印的数字音频信号

根据水印提取算法,提取出的水印序列正确率为96.96%.当增大量化步长△后,提取水印序列正确率提高,但音乐音质受损也变大。当△增大到0.1时,正确率可达98.70%,但此时含水印的音频信号质量严重受损(出现噪声了)。若嵌入位置为DCT 系数的D e (k )(3),则相同量化步长下,提取水印正确率提高,代价是音质下降较大。

试验中我们所嵌代码为0、1相间序列,即010101……。在采用连藏5位隐藏方法时,所嵌信息即为00000111110000011111……。在提取信息时,从第一位开始,每5位作为一个信息段,统计每个信息段中0和1个数,其中数量超过半数的代码即为所嵌水印代码。如若提取出的信息为00011/01111/01000/……,则相应的水印代码为010……。

6 结论与展望

信息隐藏技术是近年来国际学术界的一个研究热点,而音频数据中的信息隐藏技术也受到了越来越多的关注,成了这个研究热点中的一个重点。随着研究的深入和应用的日益普及,新的问题也在不断的涌现。

本论文对音频数据中的信息隐藏技术做了研

3

6 第5期 高银秋等:数字音频产品中基于人耳听觉感知特性的水印嵌入系统设计

究,论文主要包括了以下工作:

(1)对信息隐藏技术的理论前提、系统构成、技术分类、应用领域及其研究现状进行了归纳和总结,分析了其研究中的重点和难点;

(2)作者对语音录音提出了基于相位翻转的水印嵌入技术,并详细分析了实现算法以及系统性能;

(3)作者采用了在频域里隐藏信息的算法,实现了在歌曲中隐藏信息。

鉴于时间和精力,以及信息隐藏技术所涵盖的领域较多。本论文仅讨论了在时域里实现语音录音的水印嵌入,以及频域里实现歌曲的水印嵌入。作者认为本论文以下方面还有待改进:

(1)对语音录音而言,我们在10—20s时长里,仅嵌入了10比特的用户信息,虽然很好地保证了水印信息的透明性,但隐藏的信息量很少,即载体利用率不高。在现阶段,关于音频数据中进行信息隐藏的理论基础还没有完善起来,如果能取得关于隐藏容量能方面理论上的突破,将对催生新的信息隐藏技术具有重要的指导意义。

(2)我们所取说话人录音信号一般仅为10-20S,说话人在这段时间内语音幅度大小比较稳定。但若取较长时间内的录音,语音幅度有可能或大或小,若仍用原先对整体数据归一化后所求得的短时参数来进行端点检测肯定会有错误。因为有的能量较小的浊音处经归一化可能就被忽略了。我们可以采用自适应的门限值,即隔一段时间根据语音幅度自动调节门限值。

(3)我们仅实现了对wav格式的单声道声音的信息隐藏,而一般歌曲为mp3或是wma格式且是双声道的。在处理此问题时,我们利用声音处理软件将这些格式转为wav格式的单声道声音再作处理。参考文献:

[1]钮心忻.信息隐藏与数字水印[M].北京:北京邮电大学出版

社,2004.

[2]K ATZE NBE I SSER S,PETI T COLAS F A P.信息隐藏技术———

隐写术与数字水印[M].吴秋新,钮心忻,杨义先,等译.北京:人民邮电出版社,2001.

[3]杨行峻,迟惠生.语音信号数字处理[M].北京:电子工业出版

社,1995.

[4]S AK AG UCH I S,ARA I T,MURAHARA Y.The Effect of Polarity

I nversi on of Speech on Human Percep ti on and Data H iding as an

App licati on[C]//Pr oc of I nternati onal Conf on Acoustics,Speech, and Signal Pr ocessing(I EEE).2000.

[5]黄俊波.音频数字水印技术的算法研究[D].武汉:武汉理工大

学图书馆,2004.

[6]刘振华,尹萍.信息隐藏技术及其应用[M].北京:科学出版

社,2002.

[7]吴志军,钮心忻,杨义先.语音隐藏的研究及实现[J].通信学

报,2002,3(4):99-104.

[8]贾艳阳.语音信息隐藏技术的研究[D].南京:南京邮电学院信

息工程系,2003.

[9]PETI TCOLAS F A,ANDERS ON R,K UHN M G.I nfor mati on H id2

ing2A Survey[J].Pr oceedings of the I EEE,s pecial issue on p r otec2 ti on of multi m edia content,1989,87(7):1062-1078.

[10]CHOU J,RAMCHANDRAN K.Audi o Data H iding with App lica2

ti on t o Surr ound Sound[C]//I CASSP.2003:337-340.

作者简介:

高银秋(1982-),女,江苏南通人。南京邮电大学信号与信息处理专业研究生。(见本刊本期第26页)

邓宗元(1983-),男,江苏南京人。南京邮电大学信号与信息处理专业研究生。(见本刊本期第26页)

杨 震(1961-),男,江苏苏州人。南京邮电大学校长,教授,博士生导师。(见本刊本期第26页)

46南京邮电大学学报(自然科学版) 2006年 

语音信号数字水印技术

数字信号处理课程设计报告 题目:语音信号水印技术系统设计 系(院): 专业: 班级: 学号: 姓名: 指导教师: 学年学期: 2013 ~ 2014 学年第学期 2013年月日

摘要 随着网络和信息技术的发展,越来越多的数字多媒体信息通过网络进行传播,与传统的模拟媒体相比,数字媒体产品的编辑、复制和传播都很方便,它一方面促进了社会的进步与发展,另一方面正是这些优点突出了版权问题。由于数字多媒体信息很容易被未经授权的用户复制,且采用传统密码方法加密,不能完全解决盗版问题。 数字水印技术正是应运而生的信息隐藏技术,它通过特定的水印算法把版权信息嵌入在数字产品中,被嵌入的可以是一段文字、标识、序列号等等,人们无法从表面上感知水印的存在,只有专用的检测仪器或计算机软件才可以检测出隐藏的数字水印,从而达到了保护数字作品的所有者利益的目的,并促进了数字产品的开发与使用。在数字产品中,音频数据产品的版权保护也显得越来越重要,因为随着数字化音像制品和音乐制品的大量制作与发行,一个令人关注的突出问题是网上下载音乐对传统CD 业的巨大冲击。音频水印技术主要利用了人类听觉模型,在不影响音频信号质量的前提下,将水印信息隐藏在人耳不能感知的位置,来隐藏水印数据。本文主要研究语音信号水印技术,利用小波变换的优点和特性对音频信号嵌入水印,并提取。使嵌入水印音频想好具有良好的安全性,鲁棒性和不可感知性。 关键词数字水印嵌入提取小波变换

目录 1 课题综述 (1) 1.1 数字水印技术的介绍 (1) 1.2 数字水印设计原理 (2) 2 系统分析与设计 (3) 2.1 涉及基础知识 (3) 2.2 算法的流程图 (5) 2.3 算法实现 (5) 3 代码编写 (7) 3.1 主要代码 (7) 3.2 程序调试 (10) 3.3 程序运行与测试 (10) 结论 (14) 致谢 (16) 参考文献 (17)

科学:1.3《耳和听觉》教案(3)(浙教版七年级下)

1.3耳和听觉 教学目标 1、了解耳的结构,知道耳的各部分功能,能说出听觉的形成过程。 2、了解乐音的三个特性。 3、认识噪声的危害和防止噪声的途径。 重点难点分析 从耳的结构分析听觉的形成 乐音的三个特性 噪声污染的网络调查,从产生的三个条件进行防止。 教学过程 一、耳的结构与听觉的形成 在生活中可以听到各种声音,学生举例………………P11第一段 那么,我们是怎么听到这些声音的呢?今天我们就来研究一下 1、我们是用耳朵来听声音的,所以,先来认识一下我们的耳朵。【课件,模型】 【读图P11】学生自己完成书上填空中耳,外耳,内耳 【思考】耳的各个部分有什么功能? 2、按听觉产生的过程,逐个介绍耳的各个部分的功能。P12第二段 耳廓(收集空气中的声波)——>外耳道(声音进入中耳)——>鼓膜(产生振动)——>鼓室内听小骨(把振动的声音放大)——>耳蜗(通过耳蜗把声音传到听神经)——>听神经(把声音传给大脑)——>大脑(产生听觉) 以上的介绍过程中,可以一边让学生猜测,一边进行的方法,尽量让学生自己来,最后按课件老师总结一遍,再让学生复述。 3、听觉的损失 (1)年龄增大,听觉不敏感,可以戴助听器解决。——自然原因 (2)讨论:根据听觉形成的过程,谈谈“失聪”的原因有哪些? 先解释失聪,再小组讨论5分钟,交流,老师总结。 A.鼓膜,听小骨损伤或发生障碍,导致听力下降,产生传导性耳聋。 B.耳膜破裂造成失聪,声音不能振动传入内耳。 原因:1、患极性中耳炎没有及时治疗 2、巨声式打耳光形成耳膜内外压力差 3、浅水过深 C.听神经,神经性耳聋,有关的神经损伤引起,药物影响。

(3)体验失去听力的感觉 让学生尽可能地罩住双耳,听不到声音,体会失去听力人的痛苦。 4、耳朵保持身体平衡的作用 内耳中有感受头部位置变动的感受器。敏感的人就会有很多反应。 P12,说明耳朵是个位听器官。 5、保护耳朵的方法。 让学生举例说明遇到一些场合或问题时该怎么做,如遇到巨大的响声时,耳朵进水时,甚至爬进虫时。洗头挖耳不专业等等 二、乐音的三个特性:音调、响度、音色 概念:各种乐器发出的声音悦耳动听,叫乐音。 1、音调 音调乐音调子有高低,叫音调。 【实验】1、P13图1-18 演示:快速从木梳上划过时声音的调子比慢慢划过时的调子高! 2、P14图1-19 学生:得出,物体振动越快,音调越高。 频率:物体在1秒内振动的次数,单位是:赫兹(赫)(h) 振动越快,频率越大,音调越高。 音调的高低一般用音阶表示: 【思考题】人能够听到的声音频率范围大约是20h——2000h 蝴蝶飞行时,振翅的频率低于20h,人就听不见…… 【实验】阅读表格:利用音频发生器测人耳收到声音频率范围。 由f=10h开始,慢慢增大频率,开始听到声音,记录f低,继续增大至开始听不到声音,记录f高 (1)超声波 f>20000h:B超检查人体内部(检查孕妇婴儿的动态影片),超生探伤仪(金属),声纳及回声探测仪。 原因:利用超声波传播,反射定向效果好;穿透力强;传播时产生巨大的作用力。 (2)次声波:传播衰减慢,传播很远。 建立接收站,探知核爆炸和导弹发射情况,预报地震,海啸,台风等,因为它们速度小于声速。 2、响度:

数字水印基本原理

介绍了数字水印技术的基本原理 随着信息技术和计算机网络的飞速发展,人们不但可以通过互联网和CD-ROM方便快捷地获得多媒体信息,还可以得到与原始数据完全相同的复制品,由此引发的盗版问题和版权纷争已成为日益严重的社会问题。因此,数字多媒体产品的水印处理技术已经成为近年来研究的热点领域之一。 虽然数字水印技术近几年得到长足发展,但方向主要集中于静止图像。由于包括时间域掩蔽效应等特性在内的更为精确的人眼视觉模型尚未完全建立,视频水印技术的发展滞后于静止图像水印技术。另一方面,由于针对视频水印的特殊攻击形式的出现,为视频水印提出了一些区别于静止图像水印的独特要求。 本文分析了MPEG-4视频结构的特点,提出了一种基于扩展频谱的视频数字水印改进方案,并给出了应用实例。 1视频数字水印技术简介 1.1数字水印技术介绍 数字水印技术通过一定的算法将一些标志性信息直接嵌入到多媒体内容当中,但不影响原内容的价值和使用,并且不能被人的感知系统觉察或注意到。与传统的加密技术不同,数字水印技术并不能阻止盗

版活动的发生,但可以判别对象是否受到保护,监视被保护数据的传播,鉴别真伪,解决版权纠纷并为法庭提供认证证据。为了给攻击者增加去除水印的难度,目前大多数水印制作方案都采用密码学中的加密体系来加强,在水印嵌入、提取时采用一种密钥,甚至几种密钥联合使用。水印嵌入和提取的一般方法如图1所示。 1.2视频数字水印设计应考虑的几个方面 ·水印容量:嵌入的水印信息必须足以标识多媒体内容的购买者或所有者。 ·不可察觉性:嵌入在视频数据中的数字水印应该不可见或不可察觉。·鲁棒性?押在不明显降低视频质量的条件下,水印很难除去。 ·盲检测:水印检测时不需要原始视频,因为保存所有的原始视频几乎是不可能的。 ·篡改提示:当多媒体内容发生改变时,通过水印提取算法,能够敏感地检测到原始数据是否被篡改。 1.3视频数字水印方案选择 通过分析现有的数字视频编解码系统,可以将目前MPEG-4视频水印的嵌入与提取方案分为以下几类,如图2所示。

数字水印综合实验系统的设计与实现--灰度图像水印的嵌入与提取.

数字水印综合实验系统的设计与实现--灰度图像 水印的嵌入与提取 目录前言11 概述21.1 相关知识21.2 数字水印的定义及分类31.3 数字水印技术的原理及实现的典型算法41.4 水印技术的要求,常受到的攻击71.5 水印的主要应用领域81.6 数字水印技术的国内外研究现状92 相关理论知识112.1 小波变换112.1.1 小波变换的含义112.1.2 提出小波变换的原因112.1.3 小波变换数字水印算法及其优点122.1.4 2维信号的Mallat的算法122.2 视觉系统特性研 究132.2.1 人眼的构造132.2.2 人眼的视觉特性152.3 图像的纹理特征163 水印图像预处理183.1 引言183.2 约瑟夫图像置乱193.3 置乱度与图像质量214 水印的嵌入方案244.1 水印嵌入算 法254.2 水印提取算法265 实验及实验结果275.1 水印的嵌入实 验275.2 水印的提取实验285.3 攻击实验295.3.1 缩放295.3.2 噪声295.3.3 压缩305.3.4 剪切315.4 试验结果分析总结336 软件的详细介绍346.1 功能介绍346.2 登录窗口界面346.3 主要菜 单366.4 运行实例387 结论40参考文献41致谢42数字水印综合实验系统的设计与实现----灰度图像水印的嵌入与提取摘要:随着计算机和网络技术的飞速发展,数字图像、音频和视频产品愈来愈需要1种有效的版权保护方法。数字水印技术便是解决上述问题的关键技术之1。为了让更多 的人熟悉并快速掌握数字水印技术的基本理论和算法设计过程,设计1个数字水印综合实验系统是1个很好的解决方案。本文首先介绍了数字水印技术及其原理、特点、以及目前的应用状况,然后介绍如何利用约瑟夫置乱对水印图像进行置乱处理以加强水印的安全性,最后设计了1种水印嵌入与提取方案,并在此基础上设计1个水印图像和宿主图像都采用灰度图像的数字水印实验子系统。该系统主要完成灰度水印嵌入、灰度水印提取及灰度水印鲁棒性检测等实验。关键词:数字水印;图像置乱;离散小波变换;实验 Design and realization of digital watermark synthetic experiment system-----embedding and extracting of gray-scale image watermark Abstract: With the advent of the rapidly development of computer and network technology, many media, such as digital image, audio or video etc, need an effective solution urgently. Digital watermarking is a vital technology to solve foregoing problems. In order to let more people to master this technology rapidly, a perfect solution is to design a digital watermark synthetic experiment system. This thesis first introduce the theory, characteristic and application of digital watermarking, then present how to disorder the gray-scale image watermark using Josephus disorder algorithm for enhancing the security of watermark. At last this thesis brings forward a solution of watermarking embedding and extracting and designs a digital watermark experiment subsystem, in which both watermark image and host image are gray-scale image. This subsystem mainly realizes three experimentations: gray-scale watermark embedding, gray-scale

基于MATLAB的数字音频水印技术程序

基于MATLAB的数字音频水印技术****************************水印生成程序**************************** %读取声音文件 FILE='D:\audio\in\1.wav'; [y,Fs,bits]=wavread(FILE); %绘制出原始声音信号图 figure(1); subplot(3,1,1);plot(y); %用db4小波对读入的声音文件进行3级小波分解 [c,l]=wavedec(y,3,'db4'); %提取3级小波分解的低频系数和高频系数 ca3=appcoef(c,l,'db4',3); cd3=detcoef(c,l,3); cd2=detcoef(c,l,2); cd1=detcoef(c,l,1); x=ca3; lx=length(x); subplot(3,1,2);plot(x); s=max(abs(x))*0.2; i=find(abs(x)>s); %插入位置 lx=length(x(i)); %产生水印信号,sin mark=[0.001:0.001:7.901]; mm=[0.01:0.01:79.01]; mark=sin(mm); randn('seed',10); mark=randn(1,lx); figure(2); subplot(3,1,1);plot(mark); ss=mark; rr=ss*0.02; %水印信号嵌入 x(i)=x(i).*(1+rr'); %小波重构,生成加入了水印信号的声音信号 c1=[x',cd3',cd2',cd1']; s1=waverec(c1,l,'db4'); figure(1);

浙教版七年级科学下第二章第三节耳和听觉同步练习

浙教版七年级下第二章第三节耳和听觉同步练习 姓名:________ 班级:________ 成绩:________ 一、选择题 1 . 我们知道蝙蝠蒙住眼睛,在黑夜也能飞行,这个事实能说明 A.蝙蝠是用耳朵来辨别方向的 B.蝙蝠不是用眼睛来辨别方向 C.蝙蝠的眼睛是没有用处的 D.蝙蝠的耳朵特别发达 2 . 关于声音的传播,下列说法中正确的是 A.声音借助介质以波的形式传播 B.声音在真空中以很小的速度传播 C.声音在介质中传播的速度随温度的降低而增大 D.声音的传播速度只与介质有关,介质不同,传播速度一般不同 3 . 300年前,意大利科学家做了这样的一个实验:在房间里挂了许多铃铛,然后让蝙蝠在房间中自由飞翔,第一次未对蝙蝠有任何限制,铃铛未响;第二次蒙住蝙蝠的眼睛,铃铛也未响;第三次塞住蝙蝠的耳朵,房间中的铃铛响了。下列问题不是该实验所要研究的是() A.蝙蝠飞行靠什么躲避障碍物的 B.眼睛对蝙蝠飞行是否起作用 C.耳朵对蝙蝠飞行是否起作用 D.铃铛是怎样发声的 4 . 控制噪声污染应从防止噪声产生、阻断噪声传播和防止噪声进入人耳三个方面着手,下列事例中属于阻断噪声传播的是() A.中考期间考场周边工地停止施工 B.飞机场附近居民采用双层真空窗 C.工人工作时戴防噪声耳罩 D.汽车驶入市区禁止鸣喇叭 5 . 老师给小敏一个纸板做的方盒子,问小敏,里面是什么?小敏拿过盒子轻轻摇晃一下,回答说:里面可能是一个苹果。从科学探究的角度分析,小敏的回答是() A.提出问题B.猜想假设C.事实证据D.检验评价 6 . 若把正在收看的电视机放在真空罩内,我们会发现() A.图像和声音一样正常 B.图像和声音同时消失 C.可以看见图像但听不见声音 D.可以听见声音但看不见图像 7 . 下列有关声现象的实验中,能用来探究声音的传播需要介质的是() A.手指蘸水摩擦杯口发声,同时增加杯中的水量

音频数字水印报告+matlab程序

音频数字水印 目录 1课题背景与现状 (2) 2研究的目的和意义 (4) 3方案设计和实施计划 (8) 4研究的主要内容 (10) 5创新点和结论 (10) 6成果的应用前景 (11) 7附录:个人工作总结 ................................................................................................ 错误!未定义书签。

1课题背景与现状 数字时代的到来,多媒体数字世界丰富多彩,数字产品几乎影响到每一个人的日常生活。信息媒体的数字化为信息的存取提供了极大的便利,同时也显著地提高了信息表达的效率和准确度。计算机网络通信技术特别是互联网的蓬勃发展,使得数据的交换和传输变成了一个相对简单且快捷的过程。人们借助于计算机、数字扫描仪、打印机等电子设备可以方便、迅速地将数字信息传达到世界各地,在国际互联网上发布自己的作品,传递重要的信息,进行各种学术交流和电子商务活动等等。如何保护这些与我们息息相关的数字产品,如版权保护、信息安全、数据认证以及访问控制等等,已受到日益重视并变得迫切需要了,因此数字水印在今天的计算机和互联网时代大有可为。 数字水印技术是近十年才发展起来的,它是信息隐藏学的一个分支。随着国内信息化程度的提高和电子商务逐渐走向实用,数字水印技术将会拥有更加广阔的应用前景。鉴于信息隐藏与数字水印技术的应用前景,众多知名研究机构如麻省理工学院的多媒体实验室、剑桥大学的多媒体实验室、IBM数字实验室、日立、NEC、SONY,PHILIPS、微软等都加入到信息隐藏和数字水印技术的研究和应用并取得了一定的成果。1996年5月,第一届国际信息隐藏学术研讨会(CIHW)在英国剑桥牛顿研究所召开,至今该研讨会已举办了四届。另外,在IEEE

浙教版七年级科学下册《耳和听觉》教案

浙教版七年级科学下册《耳和听觉》教案 浙教版七年级科学下册《耳和听觉》教案 教学目标: l知识与技能: 1.初步认识耳朵的结构,能说出各结构的功能; 2.结合图片,能描述出听觉的形成过程; 3.了解声音的特性——音调,理解音调的高低由频率决定; 4.知道频率的概念,了解人耳听到的频率范围; 5.能区分超声波和次声波,了解其在生产生活中的应用; l过程与方法: 1.结合耳的模型与图片,初步认识耳朵的结构; 2.通过利用身边的物品,感受音调的高低和影响因素; 3.通过视频,聆听感受音调与频率的关系,了解人能听到的声音频率范围; 4.通过自学的方式,了解超声波和次声波以及它们在生产生活中的应用; l情感、态度与价值观:

1.通过活动探究,激发学习科学的兴趣,培养动手实践的良好习惯; 2.通过学习,培养图片分析能力,养成良好的科学习惯; 3.通过小组合作学习,培养合作和互相帮助的精神; l科学、技术、社会与环境: 了解超声波和次声波在生产生活中的应用; 重点: 能描述听觉的形成过程,了解音调高低的影响因素; 难点: 知道频率的概念,理解音调的高低由频率决定; 教学准备:PPT、耳的模型、梳子、钢尺、音叉 教学过程: 一、创设情境,引入新课 【聆听】《苔》 【引入】我们是怎样听到这么好听的歌声呢? 二、合作交流,探究新知——板书:2.3.1耳的结构 (一)耳的结构 【提问】耳是人的听觉器官,你都知道它有哪些结构吗? 【读图】图2-19《耳的结构》,从这张图中你获得了哪些信息? 答:耳可以分为外耳、中耳和内耳; 外耳包括:耳廓、外耳道; 中耳包括:鼓膜、鼓室、听小骨、咽鼓管; 内耳包括:耳蜗、前庭、半规管;

数字水印技术概论

数字水印技术概论 【摘要】本文就数字水印科学保护技术展开探讨,通过原理定义论述、领域背景介绍与应用探讨,明晰了技术核心应用价值。对促进数字水印技术的继续深化拓展,发挥对电子信息相关数据产品的可靠安全保护职能,有积极有效的促进作用。 【关键词】数字水印;应用;保护 0.前言 信息时代,各类信息化数字技术扩充发展,针对丰富数字信息的安全保护需求也日益扩充。基于数字文档可方便快捷的复制、篡改与盗取,因而令其产权保护面临一定困难。同时数字图像具有一定适应性特征,可供用户任意设计更新并为己所用。为此应科学探究一种良好的数据可靠加密保护技术,进而有效应对不良信息篡改、窃取、盗用问题。本文基于这一目标引入水印数字技术探讨,该技术通过印记图形加密有效保护版权信息,形成印记图形同原始保持一致,基于一定标准形成水印图像,进而探究非法复制信息、相关违规产品的不良流通应用。该技术核心特征在于潜入模式,是通过视觉设想推理阐释实效的科学方式。 1.数字水印技术概述 1.1数字水印技术原理内涵 数字水印技术是一类进行数据产品安全保护、信息内容科学检测,通过嵌入模式将相关序列代码或用户定义标识引入信息中,并可基于相关算法进行水印提取,进而实施保护信息版权检验的科学技术方式。可有效维护产权人享有的产品版权利益,杜绝非法盗版问题。数字水印技术所保护的对象可以是媒体,数据文档、工具软件、视频音频资料、信息图像等丰富内容,包括生成水印、相关嵌入过程、综合信息测试与提取水印等实践环节。 数字水印核心原理在于通过针对宿主进行标识信息嵌入形成水印,令其具备无法感知的良好属性,进而确保信息数据安全性。同时需要遵循相应感知规则,令水印信息具有充分冗余性,即可通过分段数据实现恢复。 1.2数字水印具体类别 数字水印基于出发点各异性,令其种类划分各不相同,并体现了一定的联系渗透属性。依据水印特征,可将其划分成健壮与脆弱水印。前者可服务于数字作品资源中进行著作权相应表述,通过水印嵌入可满足综合编辑实践需求。后者则可实现数据完整统一保护,基于对更新信号的敏锐反映性,可依据其水印状况进行数据信息安全程度分析判别。依据水印媒体,可将其分为图像、视频、音频水印、文本与网格水印形式。而基于检测流程,数字水印则包括明文与盲水印等。前者检测进程要利用原始信息,后者则应利用密钥。 基于水印不同内容,可将数字水印定义为有意义以及无意义形式。前者即水印自身同时代表数字图像或音频数据编码,而后者则仅仅代表序列号。 1.3数字水印技术服务应用领域 数字水印技术基于优质属性、科学原理,在数字化、信息化社会建设与市场经济发展中体现了较大的应用潜能,可在电子商务领域、多媒体技术服务、广播媒介中发挥综合优势。数字水印技术具备良好的版权保护功能,基于来源信息与版权内容嵌入,有效预防不良侵权行为,体现良好安全的版权保护能效,当然其实践应用对数字水印提出了显著的鲁棒性要求。同时,数字水印技术科有效实现

同步音频水印算法的实现

第28卷 第4期 吉首大学学报(自然科学版)Vol.28 No.4 2007年7月J ournal of J ishou University(Natural Science Edi ti on)Jul.2007 文章编号:1007-2985(2007)04-0074-04 同步音频水印算法的实现 张国武,曾巧明 (中南大学信息科学与工程学院,湖南长沙 410008) 摘 要:目前的音频水印算法缺乏有效的同步技术,笔者应用通信网同步方法,提出了一种快速重同步音频有意义音频水印算法.该算法利用时域水印技术嵌入同步信息,从而对抗音频在时间轴上可能受到的攻击,借助变换域基于小波变换增强音频的鲁棒性,水印为一幅二值图像.仿真实验表明该算法产生的水印在对抗加性Gaussian噪声、MP3压缩和裁剪等方面具有良好的稳健性,可用于数字音频产品的版权保护. 关键词:同步;小波变换;稳健性 中图分类号:TP301.6 文献标识码:A 数字水印技术是把数据(水印)嵌入到多媒体文件中去,以保护所有者对多媒体所拥有的版权.当所有者权益被侵犯时,可通过对水印的检测来得到证明.由于人的听觉系统(HAS)要比视觉系统(HVS)敏感,相对于静止图像和视频信号,在音频信号中嵌入数字水印更为困难[1].通常,音频数字水印应具有以下3个特性.(1)不可觉察性.加入水印后的语音信号比起原语音信号对人耳来讲应该是听起来无差别的;(2)鲁棒性.未被授权的个人或团体企图通过一些处理方法,去除或修改嵌入的水印信息时,会引起原语音信号音质的明显下降;而对于常见的信号处理操作,如传输、过滤、重采样、有损压缩等,嵌入的信息应损坏很小,并在一定正确概率的基础上可以被检测到;(3)可靠性.水印嵌入和检测方法对未被授权的第3方而言,应是保密且不能被轻易破解的,而那些合法的所有者或使用者,通过水印的检测过程,来证实自己的合法行为,以达到版权保护的目的.目前常用的音频水印技术[2],按水印嵌入方式来分可以分为2类:时域法和变换域法.时(空)域算法的算法简单、运行速度快,但抗干扰能力差.变换域法有离散傅里叶变换(DFT)算法、离散余弦变换(DCT)算法、离散小波变换(DWT)算法等,该类算法复杂度较高,但鲁棒性好.由于小波变换具有良好的时频局部特性,因此成为目前频域法水印的主流技术.目前,一些主要的算法,由于缺乏一种有效的同步机制,无法抵抗音频裁剪等攻击,水印的稳健性不强. 笔者研究了一种结合时域和变换域的音频水印算法,这种算法借鉴无线语音传输系统的同步技术,在时域上嵌入了同步信号,实现了语音信号受裁剪等攻击后的快速重同步.为了在满足不可感知性的前提下获得良好的抗噪声、MP3和裁剪等攻击的稳健性能,嵌入的水印信号将水印作为一幅二值图像来处理与隐藏,利用小波变换将水印嵌入到音频信息中.在水印提取时,使用了同步码检测技术,能够知道水印嵌入的起始点. 1 算法原理 由于语音信号是时间轴上的函数,剪裁等攻击会引起严重的同步错误.为了在检测时保持水印的同步,笔者提出了在隐藏有意义水印的同时,在语音信号中嵌入同步信息.一般来说,同步信息的数据量远小于水印数据量.所提出算法结合了变换域和时域水印技术.由于变换域上的水印能量能较均匀地扩散到时域上,对水印的不可感知性和稳健性比较有利,占隐藏数据量大部分的水印采用变换域方法嵌入于原始语音信号中.而为了实现快速重同步,同步信号的隐藏则采用时域水印技术. 考虑到语音信息量一般比较庞大,如果进行全局DWT变换,计算量太大.因此笔者设计的算法对原始语音信号f(t)进行分段处理.在每个分段点处嵌入同步码.水印数据则嵌入到每段语音信号.隐藏了水印的语音信号受到各种攻击(MP3、噪声、低通滤波、剪裁等)后,从中检测的水印将不可避免地发生错误.为了降低检测水印的差错率,从而提高水印的稳健性, 收稿日期:2007-05-21 作者简介:张国武(1978-),男,湖南常德人,中南大学信息科学与工程学院硕士生,主要从事ERP的研究与应用.

数字音频水印技术研究综述

数字音频水印技术研究综述X 王向阳1o,杨红颖1 (1辽宁师范大学计算机与信息技术学院,116029,辽宁省大连市;o中国科学院软件研究所信息安全国家重点实验室,100039,北京市) 摘要:对数字音频水印技术的相关概念和现有各类算法进行了较为系统地描述与分析,并对数字音频水印技术的未来发展方向和前景进行了预测,以期进一步推动我国在此前沿领域的研究工作. 关键词:知识产权保护;数字音频水印;透明性;鲁棒性 中图分类号:TP391文献标识码:A文章编号:1001_5337(2005)04_0119_06 1前言 伴随着网络技术(特别是Internet技术)与多媒体技术的飞速发展,数字信息的传输与利用日益变得频繁与广泛.鉴于数字信息极易被无限制任意编辑、复制与散布,从而导致数字媒体作品的原创者蒙受巨大经济损失,数字作品的知识产权保护已经成为一个迫切需要解决的关键问题.而传统加密技术只能提供小范围保护,且具有安全性不足和流通性较差等弱点.数字水印(Digital Watermarking)作为一种潜在的解决方案受到了广泛关注,并成为国际学术界研究的一个热点[1].所谓数字水印技术,就是将一种特殊标志信息(伪随机序列或可识别图案文字)嵌入到数字媒体中,用以辨识数据的版权、合法使用者,从而认证或控制数据的使用.数字水印的分类方法多种多样.依据应用范围,通常可以把数字水印技术划分为图像水印技术、视频水印技术和音频水印技术. 近几年,对图像水印技术和视频水印技术(尤其是图像水印技术)的研究很多,而对于数字音频水印技术的研究却鲜有报道[2,3],这是由于:¥与图像和视频相比,音频信号在每个时间间隔内采样的点数要少得多,意味着音频信号中可嵌入的信息量要比可视媒体少得多.|人类听觉系统(HAS)要比人类视觉系统(HVS)灵敏得多,听觉上的不可知觉性实现起来要比视觉上困难得多.§数字音频水印对信号的同步有比较高的要求.然而,随着MP3、MPEG、AC-3等新一代压缩标准的广泛应用,对数字音频作品(例如音乐作品等)的知识产权保护显得越来越重要. 为了推动数字音频水印技术研究领域的发展,本文通过系统整理分析相关研究文献,对数字音频水印技术的相关概念、研究现状、未来研究方向进行了综述. 2数字音频水印技术简介 2.1典型数字音频水印系统模型 一般说来,完整的数字音频水印系统包括三个基本方面:水印的生成、水印的嵌入和水印的提取或检测.数字音频水印技术实际上是通过对原始数字音频的分析、水印信息的预处理、嵌入位置的选择、嵌入方式的设计、嵌入调制的控制等几个相关技术环节进行合理优化,寻求满足透明性、安全可靠性、鲁棒性等诸条件(参见2.2节)约束下的准最优化设计问题.而作为数字音频水印信息的重要组成部分)))密钥,则是每个设计方案的一个重要特色所在.往往可以在水印预处理、嵌入位置选择和调制控制等不同环节入手完成密钥的嵌入. 整个数字音频水印系统[4]的基本框架如图1和图2所示. 图1展示了数字音频水印的嵌入过程.该系统的输入是水印信息W、原始数字音频I和一个可选的私有公有密钥K.其中水印信息可以是任何形式 第31卷第4期2005年10月 曲阜师范大学学报 Journal of Qufu Normal University Vol.31No.4 Oct.2005 X收稿日期:2005-10-04 基金项目:辽宁省自然科学基金(20032100)和信息安全国家重点实验室开放基金(03-02)资助. 作者简介:王向阳,男,1965-,硕士,教授;主要研究方向:网络信息安全技术、多媒体信息处理技术.

七年级科学下册 2.3 耳和听觉练习题 浙教版

第三节耳和听觉 [基础知识与基本应用题 ] 巩固理解 一、选择题 1、耳的结构中,能接受声波并转化为振动的是() A、耳廓 B、鼓膜 C、听小骨 D、耳道 2.下列属于内耳结构的是 A.鼓膜 B.鼓室 C.听小骨 D.耳蜗 3、放爆竹和礼花时,若你在一旁观看,最好张开嘴或捂住耳朵、闭上嘴。这种做法主要是为了() A.保护耳蜗内的听觉感受器 B.保持鼓膜内外气压平衡 C.使咽鼓管张开,保护听小骨 D.防止听觉中枢受损伤 4、发生晕车、晕船等症状,其原因是() A、由于睡眠不足引起 B、小脑调节平衡的能力弱 C、躯体感觉中枢受到了过强的刺激 D、前庭和半规管受到过强或长时间的刺激 5、遇到巨大声响迅速张口的意义是 ( ) A.使咽鼓管口闭合,鼓膜内外气压保持平衡 B.使咽鼓管口张开,鼓膜内外气压保持平衡 C.使外耳道内气压迅速下降 D.使鼓室内气压下降 6、人的听觉形成于() A、耳蜗 B、听觉感受器 C、听神经 D、脑部听觉中枢 7、先轻敲一下大钟,然后再用力敲一下大钟,两次听到大钟发出的声音() A、音调改变了 B、响度改变了 C、音色改变了 D、声音传播的速度改变了 8、男同学一般总是比女同学发出的声音沉闷、浑厚,即音调一般比女同学的低。其原因是男学声带振动的频率与女同学的相比()A、较低 B、较高 C、一样 D、时高时低 9.2007年5月17日,“中华情·和谐海西”大型文艺晚会在闽江公园盛装上演。观众能区别出不同乐器发出的声音,主要是根据它们发出的声音有不同的 A.响度B.音色C音调D.三者皆有 10.以下减小噪音的措施中,属于在传播过程中减弱的是()A、建筑工地噪声的工作要限时 B、市区要种草植树 C、带上防噪声的耳塞 D、市区内禁鸣汽车喇叭 二、填空题 1、声波先到达外耳,外耳像漏斗一样接受声音,并把声音聚集起来,引向,使其产生振动。鼓膜振动带动了的振动,随即传到。耳蜗充满着液体和听觉感受器,听觉感受器便把这种信息沿听神经传到大脑,形成了听觉。 2.声音的高低叫做,它和有关。一般说来儿童说话的音调比成年人,女人的音调比男人。人的发声的频率大约是。不同的动物所发出的声波的频率范围(相同或不同)。接收声波频率的范围(相同或不同)。医生的“叩诊”和工人“听漏”都是通过比较声音的来判断的。 3、大多数人能够听到的频率范围是从_______Hz到_________Hz,高于___________ Hz的声

数字音频水印研究

数字音频水印研究 摘要:本文介绍了信息隐藏的理论知识。并且对数字水印中的音频水印进行了探讨。讨论了基于神经网络的数字音频水印的嵌入与提取。具有很好的鲁棒性效果。 关键词:数字音频水印;神经网络;数字水印;信息隐藏 背景 随着计算机和通信网技术的发展与普及,数字音像制品以及其他电子出版物的传播和交易变得雨来越便捷,但随之而来的侵权盗版活动也呈日益猖獗之势。为了打击盗版犯罪,一方面要通过立法来加强对知识产权的保护,另一方面必须要有先进的技术手段来保障法律的实施。 一信息隐藏 20世纪90年代早期,信息隐藏的各种应用引起不同的关注和重视。1996年5月第一次国际信息隐藏学术研讨会在英国剑桥召开,使这些独立的研究团体走到了一起,从而在信息隐藏的一些基本概念和术语上达成共识。信息隐藏(information hiding)有时也称数据隐藏(data hiding)。从广义上看,信息隐藏有多重含义:一是信息不可见,二是信息的存在性隐蔽,三是信息的接收方和发送方隐蔽,四是传输的信道隐蔽。信息隐藏就是将保密信息隐藏于另一非保密载体中,以不引起检查者的注意。这里的载体可以是图像、视频、音频,也可以使信道,甚至是某套编码体制或整个系统。广义上的信息隐藏包括隐写术、数字水印、数字指纹、隐蔽信道、阈下信道、低截获概率通信和匿名通信等等。从狭义上看,信息隐藏就是将某一机密信息秘密隐藏于另一公开的信息中,然后通过公开信息的传输来传递机密信息。狭义上的信息隐藏技术通常指隐写术与数字水印(以及数字指纹)。 信息隐藏学是一门新兴的交叉学科,在计算机、通信、保密学等领域有着广阔的应用前景。其研究涉及密码学、图像处理、模式识别、数学和计算机科学等领域。

浙教版七年级科学下册教案示例耳和听觉

教学重点 对结构与功能相适应的观念的理解。 教学难点 1.耳朵的结构与功能。 2.组织好实验探究人为什么要长两只耳朵? 教学方法 实验探究、观察归纳、讨论应用、实践活动 教学准备 1.学生准备 提前准备好棉花(或细软的纸、棉布等塞耳朵的物品)、蒙眼睛的物品。 2.教学器材 耳朵结构示意图、模型、助听器、木梳、塑料尺、鼓、鼓棰、有关挂图、课件教学流程设计

一、新课引入 人为什么能未见其人,先闻其声?我们是如何听到声音的?而鼻子要长在一起呢?在城市汽车为什么严禁喇叭?有的人为什么会晕车、晕船? 二、新课教学 耳的结构与听觉的形成 设问:你知道我们的耳朵为什么能听到声音吗?它里面的结构是什么样的? 引导观察:挂图、模型、课件,弄清结构,思考:各个部分的功能。 结构:外耳、中耳、内耳。 听觉的形成:声波(信息)——耳朵(鼓膜振动、听小骨振动)——刺激听觉感受器的听神经——大脑 讨论:耳朵的各部分有什么功能?鼓膜损伤、听小骨损伤或发生障碍会有什么影响?耳膜破损会造成什么结果?哪些原因会造成耳膜破损?我们应该怎样保护自己的耳朵?你还知道有哪些造成耳聋的原因?耳朵还有那些用途?耳朵的结构与功能有什么关系? 体验:完全失去听力的生活。先用两只空纸杯捂住耳朵,再用棉花或软布塞住耳朵,分别感受和体会失去听力后的痛苦。 讨论:平时对失去听力的人我们应该怎么办? 市汽车为什么严禁喇叭?有的人为什么会晕车、晕船? 设疑:人为什么长两只耳朵?这样有什么好处?为什么能耳听八方? 引导学生从提出问题,到交流与评价进一步科学探究的完整过程。 提出问题:为什么要提出用两只耳朵? 建立假设(大胆猜想):①……;②……;③……;④……; 设计实验方案:(目的、如何做、怎么做?控制变量) 实验检验:按方案去做。引导归纳出结论:根据声音到达两点的时间差,辨别声源的方向和位置。

语音信号的数字水印技术

DONGFANG COLLEGE,FUJIAN AGRICULTURE AND FORESTRY UNIVERSITY 课程名称:语音信号的数字水印技术 系别:计算机系 年级专业:10级电子信息工程二班 学号:1050302098 姓名:曾喜德 任课教师:罗志聪成绩: 2013 年月日

目录 一. 作品简介 (3) 二. 设计思想 (3) 三. 设计技术和方法 (5) 四. 课程设计总结 (9) 五. 设计体会和感想 (9) 六. 参考文献 (10)

一、作品简介 随着因特网在各个应用领域的蔓延,多媒体数字作品(图像、视频、音频等)纷纷以网络形式发表,这些作品的版权保护就成为一个迫切而又比较困难的问题。现在的版权保护系统可以采用密码认证技术,但是传统的加密方式对多媒体信息的保护有一定的局限性,不能够完全保证信息的安全性。一旦密码被破解,多媒体信息就可以被任意复制、篡改,并且在法庭上很难取证。数字水印(digital watermarking)是解决这一问题的有效办法。 在保密数据传递等应用中,有时采用将一句话或一段文字或一段音乐蕴藏在另一段音乐中,然后利用专门的算法来提取所传的信息,这种方法也称为数字水印技术。这种方法的好处是信息隐藏在极为平常的声音或其它媒介中,不易被察觉。 数字水印技术可以做为加密技术的补充,增强对多媒体信息的版权保护。为有效保护知识产权,人们发明了一种将公司标识、特定数字等放人多媒体信息中的方法,以此来标识公司信息或者媒体所有权等信息,这一技术就是信息隐藏技术中的一个分支——数字水印技术(但对于数字水印系统来说,隐藏信息的丢失,意味着版权信息的丢失,从而失去了版权保护的功能,因此,这样的系统是失败的)。 此次的课程设计利用一种基于LSB的数字图像水印算法,最后利用MATLAB 对这一算法进行了实现。 1、对水印图像进行编码置乱(可采用伪随机码,提高水印图像的隐蔽性); 2、对图像进行子图像分解(如8*8),对子块分别进行DCT变换; 对DCT系数按照zig-zag排序进行排列,选择一中频系数,对该中频系数相邻的系数进行水印嵌入 二、设计思想 数字水印技术通过一定的算法将一些标志性信息直接嵌入到多媒体内容当中,但不影响原内容的价值和使用,并且不能被人的感知系统觉察和注意到。与传统的加密技术不同,数字水印技术并不能阻止盗版活动的发生,但可以判别对象是否受到保护,监视被保护数据的传播,鉴别真伪,解决版权纠纷并为法庭提供证据。

音频不同频率对人耳的听觉的影响

音频不同频率对人耳的听觉的影响 16K~20KHz频率:这段频率范围实际上对于人耳的听觉器官来说,已经听不到了,因为人耳听觉的最高频率是15.1KHz。但是,人可以通过人体和头骨、颅骨将感受到的16~20KHz频率的声波传递给大脑的听觉脑区,因而感受到这个声波的存在。这段频率影响音色的韵味、色彩、感情味。如果音响系统的频率响应范围达不到这个频率范围,那么音色的韵味将会失落;而如果这段频率过强,则给人一种宇宙声的感觉,一种幻觉,一种神秘莫测的感觉,使人有一种不稳定的感觉。因为这些频率大多数是基音的不谐和音频率,所以会产生一种不安定的感受。这段频率在音色当中强度很小,但是很重要,是音色的表现力部分,也是常常被人们忽略的部分,甚至有些人根本感觉不到它的存在。 12K~16KHz频率:这是人耳可以听到的高频率声波,是音色最富于表现力的部分,是一些高音乐器和高音打击乐器的高频泛音频段,例如镲、铃、铃鼓、沙锤、铜刷、三角铁等打击乐器的高频泛音,可给人一种"金光四射"的感觉,强烈地表现了各种乐器的个性。如果这段频率成分不足,则音色将会会失掉色彩,失去个性;而如果这段频率成分过强,如激励器激励过强,音色会产生"毛刺"般尖噪、刺耳的高频噪声,对此频段应给予一定的适当的衰减。 10K~12KHz频率:这是高音木管乐器的高音铜管乐器的高频泛音频段,例如长笛、双簧管、小号、短笛等高音管乐器的金属声非常强烈。如果这段频率缺乏,则音色将会失去光泽,失去个性;如果这段频率过强,则会产生尖噪,刺耳的感觉。 8K~10KHz频率:这段频率s音非常明显,影响音色的清晰度和透明度。如果这频率成分缺少,音色则变得平平淡淡;如果这段频率成分过多,音色则变得尖锐。 6K~8KHz频率:这段频率影响音色的明亮度,这是人耳听觉敏感的频率,影响音色清晰度。如果这段频率成分缺少,则音色会变得暗淡;如果这段频率成分过强,则音色显得齿音严重。 5K~6KHz频率:这段频率最影响语音的清晰度、可懂度。如果这段频率成分不足,则音色显得含糊不清;如果此段频率成分过强,则音色变得锋利,易使人产生听觉上的疲劳感。 4K~5KHz频率:这段频率对乐器的表面响度有影响。如果这段频率成分幅度大了,乐器的响度就会提高;如果这段频率强度变小了,会使人听觉感到这种乐器与人耳的距离变远了;如果这段频率强度提高了,则会使人感觉乐器与人耳的距离变近了。 4KHz频率:这个频率的穿透力很强。人耳耳腔的谐振频率是1K~4KHz所以人耳对这个频率也是非常敏感的。如果空虚频率成分过少,听觉能力会变差,语音显得模糊不清了。如果这个频率成分过强了,则会产生咳声的感觉,例如当收音机接收电台频率不正时,播音员常发出的咳音声。 2K~3KHz频率:这段频率是影响声音明亮度最敏感的频段,如果这段频率成分丰富,则音色的明亮度会增强,如果这段频率幅度不足,则音色将会变得朦朦胧胧;而如果这段频率成分过强,音色就会显得呆板、发硬、不自然. 1K~2KHz频率:这段频率范围通透感明显,顺畅感强。如果这段频率缺乏,音色则松散且音色脱节;如果这段频率过强,音色则有跳跃感

浙教版科学七年级下学期2.3耳的结构与听觉的形成(第1课时)同步练习(I)卷

浙教版科学七年级下学期 2.3 耳的结构与听觉的形成(第1课时)同步练习(I)卷姓名:________ 班级:________ 成绩:________ 一、基础题 (共9题;共11分) 1. (1分)随着手机的广泛普及,随处可见“低头族”,长期用耳机听音乐可能会损伤对声波敏感的细胞,使听力下降;长期玩手机可能会损伤对光敏感的细胞,使视力下降,上述两类细胞分别位于() A . 外耳道、虹膜 B . 鼓膜、视网膜 C . 耳蜗、视网膜 D . 咽鼓管、瞳孔 2. (1分)如图为耳的结构,下列叙述正确的是() A . ①听小骨上有听觉感受器,可以传递声波 B . ②耳蜗内有听觉感受器,可接受刺激产生神经冲动 C . ③是听神经,与口腔相连,使儿童易患中耳炎 D . ④鼓膜有听觉感受器,可以感受声波 3. (1分)中耳的组成() A . 耳郭和外耳道 B . 耳蜗、前庭和半规管 C . 耳蜗和听小骨 D . 鼓膜、鼓室和听小骨

4. (1分)猫自高处跳下时,头后仰;一着地,头便前倾。猫的这些姿势变化是() A . 耳蜗受到刺激引起的 B . 鼓膜受到刺激引起的 C . 半规管受到刺激引起的 D . 听小骨受到刺激引起的 5. (1分)外界物体反射来的光线,依次经过哪些结构到达视网膜?() A . 瞳孔、晶状体、角膜、玻璃体 B . 瞳孔、角膜、晶状体、玻璃体 C . 角膜、瞳孔、晶状体、玻璃体 D . 角膜、瞳孔、玻璃体、晶状体 6. (1分)“孔子闻韶音,三月不知肉味”中的“闻韶音”和“知肉味”分别属于人的() A . 嗅觉和听觉 B . 听觉和视觉 C . 听觉和味觉 D . 触觉和味觉 7. (1分)声波传入人耳的顺序是() A . 外耳道---- 鼓膜-----听小骨-----耳蜗-----听神经 B . 外耳道----耳蜗----听小骨-----鼓膜-----听神经 C . 外耳道----鼓膜--- 耳蜗-----听小骨----听神经 D . 外耳道---耳蜗----鼓膜----听小骨-----听神经 8. (1分)晕车、晕船与下列哪些结构有关() A . 耳蜗

相关文档
最新文档