掩蔽效应的基本概念
掩蔽效应

如果在同一地点,声压随时间的变化都是正弦形式的,那么这声音是只含有单一频率的纯音。
实际上,只有音叉、音频振荡器等少数声源才能发出纯音,一般的声音,尤其对于噪声都是由许多频率声波组成的复合声。
不同的声音,其含有的频率成分及各个频率上的能量分布是不同的,这种频率成分与能量分布的关系称为声的频谱。
声音的频率特性,常用频谱来描述,各个频率或各个频段上的声能量分布绘成的图形称为频谱图。
在噪声控制等声学问题中,频谱图的构成通常是以频率为横坐标,以频率的对数为标度,用声压级(或声强级、声功率级)做纵坐标,单位是分贝。
实际中有几种典型噪声频谱,如宽频率连续谱、窄频率连续谱和不连续线状谱,也有连续谱中杂有能量较高的纯音频率(线状)的复合频谱,这些频谱反映了噪声能量在各个频率上的分布特性。
另外,由1.4节可知,频率不同的声波是不相干的,所以即使这些不同频率成分的声波是由同一个声源发出的,也不会形成相干干涉,因此,总的声能量是各个频率分量上的能量叠加之和。
对噪声作频谱分析时,一般并不需要每一个频率上声能量的详细分布。
为方便起见,常在连续频率范围内把它划分为若干个相连的小段,每一小段叫做频带或频程,每个小频带内的声能量被认为是均匀的,然后研究不同频带上的分布情况。
根据不同的要求,声学量的分析频率带宽的选择也不一样。
若分析精度要求高时,分析频带应选用窄频带宽;若是简单测量,则频率分析带宽可以放宽。
实际测量中最为常用的频率分析带宽为窄频带宽、倍频程和1/3倍频程带宽。
窄频带宽是恒定频率分析带宽,它的大小由频谱分析仪类型和分析频率上限值确定。
倍频程带宽和l/3倍频程带宽为百分比带宽,其频率带宽总是中心频率的恒定百分比,中心频率与带宽上、下限截止频率和的关系为(2.4.1)(2.4.2)式中n可以为任何值。
对于倍频程带宽,,对于1/3倍频程带宽,。
表2.3.1是倍频程和1/3倍频程带宽中各中心频率值与其上、下限截止频率值的对应关系。
声音掩蔽效应在生活中的应用_概述及解释说明

声音掩蔽效应在生活中的应用概述及解释说明1. 引言1.1 概述声音掩蔽效应是指在环境中存在其他声音的情况下,某一特定声音能够通过遮蔽或干扰其他声音而显得更加突出或不易被察觉的现象。
这种现象在生活中普遍存在,并且对我们的日常生活产生着重要的影响。
1.2 文章结构本文将首先介绍声音掩蔽效应的定义和解释,包括其概述、原理以及影响因素等方面内容。
之后,我们将详细探讨声音掩蔽效应在现实生活中的实际应用,包括店铺音乐选择与运用、居住环境中隔音设施的应用以及职场中声音掩蔽技术的运用等。
接着,我们将通过具体案例研究分析声音掩蔽效应在生活场景中的具体应用,并围绕交通噪声对人体健康、医院环境中的音乐治疗以及办公室噪声对工作效率和员工健康等方面展开论述。
最后,我们将进行总结回顾,并展望声音掩蔽效应的重要性和前景,并探讨声音掩蔽效应对个人与社会的意义和启示。
1.3 目的本文旨在全面介绍声音掩蔽效应及其在生活中的应用,并通过实例分析和案例研究,探讨声音对人们健康和生活质量产生的影响。
通过深入理解声音掩蔽效应的原理和重要性,我们可以更好地利用声音掩蔽效应来改善不同场景下的环境品质,并为个人以及社会提供有益的建议和启示。
2. 声音掩蔽效应的定义与解释:2.1 声音掩蔽效应概述:声音掩蔽效应是指在特定环境中,一个声音可以通过另一个较响亮的声音而被忽略或降低听觉感知。
当两个声音同时存在时,较强的声音会使较弱的声音变得不易察觉。
2.2 声音掩蔽效应的原理:声音掩蔽效应基于听觉系统对声源方向和频率特征的处理能力。
较高级别的声源通常更容易吸引我们的注意力,因此,当两个或多个声源同时出现时,我们会倾向于关注较明显的声源。
这一现象主要是由听觉选择性过程和听觉遮蔽机制导致的。
听觉选择性过程指当多个声源同时发生时,大脑通过自动筛选和集中注意力,优先处理重要或者突出的听觉刺激。
这意味着某些频率范围内的较弱声音可能会被忽略或者被认知上降低。
而听觉遮蔽机制则指当接收到相似频率范围内连续发生的声音时,早期听觉处理会压制那些不相关的较弱声音,以避免干扰对当前有用信号的感知。
《数字音频广播》各章小结(陈柏年)

《数字音频广播》各章归纳小结陈柏年(浙江传媒学院)第一章数字音频广播概述一、数字音频广播DAB概念:将传送的模拟音频信号经过脉冲编码调制(PCM)转换成二进制数代表的数字式信号,然后进行音频信号的处理、传输、存储,以数字技术为手段,传送高质量的声音节目。
数字音频广播除传送声音信号外,还传送数据信号。
它是继调幅广播、调频广播以后的第三代广播。
两个基本的数字音频广播:尤里卡147-DAB (Eureka147- DAB)和带内共信道(IBOC)广播。
二、DAB的工作频段:30MHz~3GHz。
DAB的技术要点:以数字技术为基础,采用先进的音频数字编码、数据压缩、纠错编码及数字调制技术,在接收端可获得与原始发送信息相同质量的节目内容。
三、DAB的五项关键技术:(1)信源编码:掩蔽型自适应通用子频带综合编码与复用(MUSICAM)(2)信道编码:①卷积编码,②循环冗余校验码CRC,③交织技术(3)传输方法:编码正交频分复用(COFDM)(4)插入保护间隔:使彼此相继的符号即使在有反射时也相互独立。
(5)同步网技术:通过同步网实现覆盖。
四、DAB系统结构框图DAB发送过程:(1)音频信源编码:采用MSICAM算法,得到的音频压缩数据;(2)信道编码:采用可删除型卷积编码和时间交织;(3)多路复用器:将多路音频数据送入多路复用器与数据业务一起复用,进行频率交织;(4)OFDM基带调制:复用信号以包的形式进行OFDM基带调制,其中还加入FIC、同步信号等;(5)发射机:OFDM基带调制信号经I/Q 正交调制器后产生I/Q两路模拟基带信号,进行中频调制后,送入射频部分进行载波调制、功率放大并发射。
五、音频压缩标准(一)MPEG-1音频压缩标准1、三种取样频率:32、44.1、48kHz2、数据率:32kbps~384kbps3、四种工作模式:单声道、双声道、立体声、联合立体声4、编码算法:(1)MUSICAM-掩蔽型通用子频带集成编码与频分复用。
电台节目制作重要名词概念讲解

音色:又称音品,是人民在主观感觉上区别具有相 同响度和音调的两个声音有所不同的特性,由声 音波形的谐波频谱和包络决定。
4、双耳效应:人的两个耳朵接收声音在时间、 相位和强度三个方面的差别。
5、掩蔽效应:一个较弱的声音(被掩蔽音) 的听觉感受被另一个较强的声音(掩蔽音) 的现象称为人耳的掩蔽效应。
32、数字音频格式:可称为数字音频的编码 方式,大多数音频工作站软件对所存储的 声音文件采取了压缩技术,目前广播电台 音频工作站的音频文件格频工作站的基本组成:计算机、音频 软件和音频接口、CD刻录机、信号转换器、 话筒等。
34、常见音频文件格式及转换:1、WAV格式:微软公司开 发的一种声音文件格式,是最早的数字音频格式。支持许 多压缩算法,支持多种频率位数,采样频率和声音,采用 44.1kHz的采样频率,16位量化位数,WAV的音质与CD 相差无几,但对存储空间需求太大不便于交流和传播。2、 s48:采用MPEG-1(简称MP1、 Mp2)声音压缩格式, 由于其易于编辑、剪切,所以在广播电台应用较广。3、 MIDI:又称乐器数字接口,是数字音乐/电子合成乐器的 统一标准。4、CD音乐格式:16位量化位数,是一种近似 无损的格式。
15、DAT格式:数字音频磁带,是现代广播 电台编辑与制作中重要的辅助设备之一。
16、广播编辑系统:由语言录制系统、文艺录制系统和 复制系统构成。
17、调音台:是任何录音编辑系统的革新,它统管着信 号的放大、部分处理、输出、输入、返回、预听、监 听、监测、混合、编组、跳线等功能。
18、MD录音机:是90年代产品,它的音质接近CD唱 盘,它采用了建立在声音的幅度掩蔽与时间掩蔽效应 上的自适应变换听觉编码,去除因掩蔽效应而无实际 听音意义的冗余和不相关信息,信息量可压缩为原来 的1/5。
人因工程学总结试题及答案

一名词解释1。
掩蔽效应:不同的声音传到人耳时,只能听到最强的声音,而较弱的声音就听不到了,即弱声被掩盖了。
这种一个声音被其它声音的干扰而听觉发生困难,只有提高该声音的强度才能产生听觉,这种现象称为声音的掩蔽。
被掩蔽声音的听阈提高的现象,称为掩蔽效应2. 人机界面:人与机之间存在一个互相作用的“面”,所有人机交流的信息都发生在这个作用面上,通常称为人机界面。
3. 大小编码:以相同形状而不同大小来区别控制器的功能和用途,这种形式的编码应用范围较小,通常在同一系统中只能设计大、中、小三种规格。
4. 局部照明:是指增加某一指定地点的照度而设置的照明。
5. 强度效应:是指光的刺激强度只有达到一定数量才能引起视感觉的特性.因此,可见光不仅可以用波长来表示,也可以用强度来表示。
光的强度可用照射在某平面上的光通量,即照度来表示,其单位是勒克司1.作业空间:人体在作业时或进行其他活动时(如进出工作岗位、在工作岗位进行短暂的放松与休息等),人体自由活动所需要的范围。
2。
视野:指人眼能观察到的范围,一般以角度表示。
视野按眼球的工作状态可分为:静视野、注视野和动视野三类.3. 局部照明:为满足某些部位(通常限定在很小范围,如工作台面)的特殊需要而设置的照明.4。
反应时指从刺激呈现,到人开始作出外部反应的时间间隔,也称为反应潜伏期。
5。
感觉阈值外界刺激都要达到一定的强度才能被人感受到,这一强度下的刺激量值称为该种感觉的感觉阈值.1安全人机工程学:是从安全的角度和着眼点,运用人机工程学的原理和方法去解决人机结合面的安全问题的一门新兴学科.2、人机结合面:就是人和机在信息交换和功能上接触或互相影响的领域(或称“界面”)。
3、人机功能分配:对人和机的特性进行权衡分析,将系统的不同功能恰当地分配给人或机,称为人机的功能分配.(或“对人和机的特性进行权衡分析,将系统的不同功能恰当地分配给人或机,称为人机的功能分配。
”)4、反应时间:人从接收外界刺激到作出反应的时间,叫做反应时间.它由知觉时间(ta)和动作时间(tg)两部分构成,即 T=ta+tg 。
人体工程学课堂笔记

人体工程学课堂笔记一、增加房间的宽阔感1、利用镜子产生宽阔感,将屏风作为房间的间隔,从两个方向反射,宽阔感增强。
在室内面对窗户的墙上,安挂一面大小适当的镜子一经反射,室内分外明亮,并显出两个窗户,宽阔感大增。
2、利用照明产生宽阔感。
间接照明虽不太亮,但可产生宽阔感,有些阴暗部分使人想到另有空间。
3、室内的统一可产生宽阔感。
用橱柜将杂乱的物件收藏起来,装饰色彩有主有次,统一感明显,看起来房屋就宽阔的多。
4、(扩大家具空间感)在家具上动脑经,家具的颜色可以就用壁面的色彩,使房间空间有开拓感。
选用具有多元用途的家具,或折垒式家具,或低矮的家具,或适当缩小整个房间的比例,都会产生扩大空间的感觉。
5、利用配色增加空间感,可以以白色作为主要的装饰色,墙、天花板、家具都用白色,稍加淡色的花纹。
生活用品也选用浅色,最大限度的发挥浅色产生宽阔感的效果。
在适当用些鲜明的绿色,黄色,可使宽阔效果更好。
二、听觉1、人的听觉系统可分辨声音的高低,强弱也可以判断环境中声音的方位2、掩蔽:一个声音被另一个声音说掩盖的现象。
3、掩蔽效应:一个声音的听閥因另一个声音的掩蔽作用而提高到效应。
4、听閥:在最佳听闻频率范围内,一个听力正常的人刚刚能听到给定各种频率的正弦式纯音的最低声强度。
5、痛閥:对于感受给定的各种正弦式纯音,开始产生疼痛感的极限声强度。
6、由于人的听閥复原需要经历一段时间,掩蔽声去掉以后,掩蔽效应并不应立即消除,这个现象被称为残余掩蔽或听觉残留。
其最值量可用来表示听觉疲劳。
掩蔽声对人耳刺激的时间和强度直接影响人耳的疲劳程度,刺激时间越长则疲劳越严重。
(噪声防护)1、减少防护设计(选用消声、吸声的建筑材料)、2、减少噪声源(离噪声源远)、3、组织噪声传播(合理布置房间)4、个人防护措施三、肤觉1、肤觉是靠皮肤表面感受器接受外来刺激而产生的感觉。
2、肤觉并非单一的感觉,包括触觉、痛觉、温觉、冷觉等感觉。
3、触觉也称压觉或触压觉,是皮肤表面承受承受压力或触及物体时,所产生的一种感觉,触觉的产生因情形不同而分为两种:被动触觉(因外界的压力引起的感觉)、主动触觉(它是人以肢体主动接触物体时产生的感受。
声学参数理论
1.A 计权声压级声压有效值定义为一定时间间隔中,瞬时声压对时间的均方根值,用p e表示:将声压有效值p e与基准量p0之比的对数乘以20 便可以得到声压pe的声压级,用L p 表示:A 计权声压级(简称A 声级)用以模拟55dB以下低强度噪声特性,对1000Hz 以下的低中频段衰减,其结果与人对声音的感知相近。
2.响度响度(Loudness)是基于人耳对声音频谱掩蔽特性的反映人耳对声音强弱感知程度的心理声学参数,单位为宋(sone),规定1000Hz纯音的声压级为40dB时的响度为1宋。
国际标准ISO532 规定了A、B 两种计算稳态噪声响度的计算方法:a)Stevens方法(ISO532A):详细内容参见标准ISO532-A-1975 和ANSIS3.4-1980。
其数学表达式为:b)Zwicker方法(ISO532B)(本文所采用方法):Zwicker 法适用于自由声场或混响声场的计算,在通常情况下一般采用Zwicker 法的响度计算模型。
Zwicker 法以1/3倍频程频谱为依据,引入了特征频带和特征响度的概念,首先计算每个特征频带特征响度,再由此来得到总响度值。
根据Zwicker 的响度理论,通过激励E可以计算得到特征响度,其计算公式:式中:E TQ为绝对听阈下的激励(安静状况下),E0为基准声强下的激励,被计算声音的特征频带声压级作为激励级E。
对特征响度在0-24 Bark域上积分,即可得到总响度:注:掩蔽效应是指由于一个声音的存在而使另一个声音听阈提高的现象。
人类的听觉系统具有滤波特性,即频率选择性。
为了描述人耳的频率选择特性和掩蔽效应,Zwicker假设人的听觉系统将声音信号分量分成24个频带,当确定了一个声音的频率时,能够产生掩蔽效应的另外一个声音的频率范围称为“特征频带”,单位是Bark。
在Zwicker 模型中,特征频带Bark 数z和频率f(Hz)的对应关系可近似表达为:3.尖锐度尖锐度(Sharpness)是描述高频成分在声音频谱中所占比例的物理量,主要反映人们主观上对高频段声音刺耳程度的感受,单位为acum。
人机
1.论述眩光对作业的不利影响以及针对其所应该采取的主要措施。
眩光对作业的不利影响:主要是破坏视觉的暗适应,产生视觉后像,使工作区的视觉效率降低,产生视觉不舒适感和分散注意力,造成视觉疲劳。
应该采取的主要措施:1.限制光源亮度;2.合理分布光源;3.改变光源或工作面的位置;4.合理的照度2.轨迹交叉论:在一个系统中,人的不安全行为和物的不安全状态的形成过程中,一旦发生时间和空间的运动轨迹交叉,就会造成事故。
3.掩蔽效应:一个声音被另一个声音所掩盖的现象,成为隐蔽。
一个声音的听阈因另一个声音的掩蔽作用而提高的效应,成为掩蔽效应。
4.什么是百分位数?工程上常以正态分布的某个百分位a处的人体尺寸数值Xa作为设计用人体尺度的一个界值,以控制设计的适应范围,该界值称为百分位数。
人体测量的数据常以百分位数来表示人体尺寸等级,最常用第5%、第50%、第95%三种百分位数来表示。
其中第5百分位数是代表“小”身材,是指有95%的人群身材尺寸均大于此值;第50百分位数表示“中”身材,是指大于和小于此人群身材尺寸的各为50%;第95百分位数代表“大”身材,是指有95%的人群身材尺寸均小于此值,而有5%的人群身材尺寸大于此值。
5.人误:指在规定的时间和规定的条件下,人没有完成分配给它的功能。
或人为的使系统发生故障或发生机能不良事件,是违背设计和操作规程的错误行为。
*6.疲劳发生的机理:疲劳物质累积机理、力源耗竭机理、中枢变化机理与生化变化机理、局部血流阻断机理。
*7.安全防护装置的设计原则?(1)坚持以人为本的设计原则(2)坚持装置的安全可靠原则(3)坚持安全防护装置与机械装备的配套设计原则(4)坚持简单、经济、方便的原则(5)坚持自动组织的设计原则*8.人机功能分配的原则是什么?笨重的、快速的、精细的、规律性的、单调的、高阶运算的、支付大功率的、操作复杂的、环境条件恶劣的作业以及需要检测人不能识别的物理信号的作业,应分配给机器承担;而指令和程序的安排,图形的辨认或多种信息输入时,机器系统的监控、维修、设计、创造、故障处理及应付突然事件等工作,则由人承担。
试述感知编码
试述感知编码近年来,随着现代通信的发展,数字化日益渗透人们的日常生活,人们对各种多媒体业务的需求日益增长,我们正享受着数字化带来的方便和快捷,卫星电视、数字电视、各种数码音乐产品正改变着我们的生活。
于是便要求得到更多更好的音频产品和服务。
数字声音作为一种存储、处理和传输高保真声音的方法,在消费电子、专业声音等众多领域已得到广泛应用。
但是如果没有通用有效的高质量音频编解码方案,数字存储和传输技术的进一步发展将会受到严重的束缚。
在当前所有的音频数字压缩技术中,比较成功的编码方式被称为“感知型编码(Perceptual Coding)”,现在比较常用的MP3、MD等都是感知编码原理。
一般来说,数据压缩有两种方法。
一种方法是利用信号的统计性质,完全不丢失信息的高效率编码法,称为平均信息量编码或熵编码。
第二种方法是利用接收信号的人的感觉特性,省略不必要的信息,压缩信息量,这种方法称为感觉编码。
因为熵编码可通过解码完全再现编码前的数据,故应用范围广泛,例如可用于磁盘压缩、文件压缩等,在保存信息方面,完全不用担心劣化。
不过遗憾的是,仅依靠熵编码不能将音频信号进行大幅度的数据压缩。
这是因为在音频信号中会有白噪声信号,这种完全随机的信号,根据信息论是决不能用熵编码进行压缩的。
因此在音频压缩中,必须同时采用感知编码。
感知编码是利用人耳听觉的心理声学特性(频谱掩蔽特性和时间掩蔽特性)、人耳对信号幅度、频率、时间的有限分辨能力,凡是人耳感觉不到的成分不编码,不传送,即凡是对人耳辨别声音信号的强度、音调、方位有贡献的部分(称为不相关部分或无关部分)都不编码和传送。
对感觉到的部分进行编码时,允许有较大的量化失真、并使其处于听阈以下,人耳仍然感觉不到。
简单的说感知编码是建立在人类听觉系统的心理声学原理为基础,只记录那些能被人的听觉所感知的声音信号,从而达到减少数据量而又不降低音质的目的。
目前音频压缩编码已成为标准的是MPEG-1(ISO/IEC11172-3)、MPEG-2 (ISO/IEC13818-3)和美国大联盟的AC-3。
掩蔽效应及其应用
掩蔽效应及其应用我们都有过这样的体验:当两种或两种以上的声音同时存在,人耳对声音的感觉与仅有一种声音单独存在时的感觉是不同的。
例如,在一个安静的环境中,我们的耳朵能分辨出轻微的声音,但是在嘈杂的环境中,轻微的声音就完全被淹没掉了。
要想听到原来轻微的声音,就必须使它增强才行。
一个较弱的声音的听觉感受被另一个较强的声音影响的现象,我们就称之为人耳的“掩蔽效应”。
“掩蔽效应”在实际声学应用中有很重要的作用。
我们假设安静的环境下,听清楚声音A的阈值为30dB,若此时又能同时听见声音B,这时由于B的影响,使得A的阈值提高到了40dB,即比原来提高了10dB。
此时,我们就称B 为掩蔽声,A为被掩蔽声。
被掩蔽声听阈提高的分贝数称为掩蔽量,即上述10dB为掩蔽量,40dB称为掩蔽阈。
掩蔽可分成频域掩蔽和时域掩蔽。
频域掩蔽事实上,掩蔽效应并不仅仅是个音量问题,因为当掩蔽音与被掩蔽音的频率不相同的时候,掩蔽作用并不那么严重。
但一个响亮的纯音很容易就把另一个频率更高的纯音给掩蔽掉。
一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽(simultaneous masking),如图1所示。
从图1中可以看到,声音频率在300 Hz附近、声强约为60 dB的声音掩蔽了声音频率在150 Hz附近、声强约为40 db的声音。
又如,一个声强为60 dB、频率为1000 Hz的纯音,另外还有一个1100 Hz的纯音,前者比后者高18 dB,在这种情况下我们的耳朵就只能听到那个1000 Hz的强音。
如果有一个1000 Hz的纯音和一个声强比它低18 dB的2000 Hz的纯音,那么我们的耳朵将会同时听到这两个声音。
要想让2000 Hz的纯音也听不到,则需要把它降到比1000 Hz的纯音低45 dB。
一般来说,弱纯音离强纯音越近就越容易被掩蔽。
图1 声强为60 dB、频率为1000 Hz纯音的掩蔽效应在图2中的一组曲线分别表示频率为250 Hz,1 kHz和4 kHz纯音的掩蔽效应,它们的声强均为60 dB。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7 770 920 150 20
6400 7700 1300
8 920 1080 160 21 7700 9500 1800
9 1080 1270 190 22
9500 12000 2500
10 1270 1480 210 23 12000 15500 3500
11 1480 1720
240 24 15500 22050 6550
固定比特率和可变比特率
我们假定这里讨论的 mp3编码使用的是固定比特率的编码方式 ,也就是说编码产 生的文件在任何一个时间段内输出的比特率都是你指定的那个数值。固定比特率编 码的缺点是,绝大部分声音文件中的信息量并不是固定不变的 。使用乐器较多,或者
有很多人同时说话的音频片断中,信息量就大,反之就小:类似这样影响音频文
则不明显。
由于声音频率与掩蔽曲线不是线性关系,为从感知上来统一度量声
音频率,引入了“临界频带(criticalband)”的概念。通常认为,在20Hz 到16kHz 范围
内有24个临界频带,如表 12-01所示。临界频带的单位叫 Bark(巴克),
1Bark=
一个临界频带的宽度。
f( 频 率 )<500Hz 的 情 况 下 , 1Bark≈f/100 。
另 外 一 些 数 据 较 少 、因 而 有 剩 余 空 间 的 帧 内 。注 意 多 出 来 的 空 间 ,是 别 的 帧 里 多 出 来
的富余空间,而不是特别开辟出来的额外空间。
编辑本段视觉的掩蔽效应
空间域中的掩蔽效应
视觉的大小不仅与邻近区域的平均亮度有关 ,还与邻近区域的亮度在空间上的变 化(不均匀性)有关。假设将一个光点放在亮度不均匀的背景上 ,通过改变光点的亮 度 测 试 此 时 的 视 觉 ,人 们 发 现 ,背 景 亮 度 变 化 越 剧 烈 ,视 觉 越 高 ,即 人 眼 的 对 比 度 灵 敏度越低。这种现象称为空间域中的视觉的掩蔽效应( Masking)。
12 1720 2000 280
时域掩蔽
除了同时发出的声音之间有掩蔽现象之外 ,在时间上相邻的声音之间也有掩蔽现 象 , 并 且 称 为 时 域 掩 蔽 。 时 域 掩 蔽 又 分 为 超 前 掩 蔽 (pre-masking) 和 滞 后 掩 蔽 (post-mask ing) ,如 图 12- 05 所 示 。产 生 时 域 掩 蔽 的 主 要 原 因 是 人 的 大 脑 处 理 信 息 需 要 花 费 一 定 的 时 间 。一 般 来 说 ,超 前 掩 蔽 很 短 ,只 有 大 约 5~ 20ms,而 滞 后 掩 蔽 可 以 持 续50~200ms。这个区别也是很容易理解的。
编辑本段听觉的掩蔽效应
综述
掩蔽效应指人的耳朵只对最明显的声音反应敏感 ,而对于不敏感的声音 ,反应则
较不为敏感。例如在声音的整个频率谱中,如果某一个频率段的声音比较强 ,则人就
对其它频率段的声音不敏感了 。应用此原理,人们发明了 mp3等压缩的数字音乐格式 ,
在这些格式的文件里,只突出记录了人耳朵较为敏感的中频段声音 ,而对于较高和较
编
码过程中,信号中的“无用分量”被拿来和人类心理声学的数学模型 ,以及压缩使用的
彼特率作比较,以决定要扔掉哪些数据 。当前 mp3压缩使用的比特率一般是 128kbps。
编码器在输出每一帧数据的时候都会考虑到这个数字,如果比特率比较低,那么 “无
关”和“冗余”数据的定义就会被放宽,导致大量的数据被认为是无用数据,此时压缩
掩蔽效应
百科名片
同步掩蔽
同步掩蔽(英文名称: Masking Effects,也称为声响掩蔽),要描述同步掩蔽效应,最好是 通过一个类比。想象一只在太阳前面飞翔的小鸟。你看到小鸟从左边飞到你和太阳之间,然 后小鸟消失,因为太阳光线的亮度太高。当小鸟移出太阳区域,你就又能看到它了。就像在 一个安静的环境中,吉他手的手指轻轻滑过琴弦的响声都能听到,但如果同样的响声在一个 正在播放摇滚乐曲的环境中,一般人就听不到了。
1000Hz 的纯音低45dB。一般来说,弱纯音离强纯音越近就越容易被掩蔽。
一
组曲线分别表示频率为 250Hz,1kHz 和4kHz 纯音的掩蔽效应 ,它们的声强均为 60dB。
从图14-04中可以看到:①在250Hz,1kHz 和4kHz 纯音附近,对其他纯音的掩蔽效
果最明显,②低频纯音可以有效地掩蔽高频纯音 ,但高频纯音对低频纯音的掩蔽作用
比特率的 mp3文件的时候也要读取全部的帧头部。
编码过程中输出任何一帧的
时 候 都 必 须 考 虑 到 ,不 能 超 过 指 定 的 比 特 率 。由 于 声 音 数 据 的 复 杂 ,经 常 会 看 到 一 些
帧的数据,不能在满足指定的比特率的前提下 ,同时达到既定的声音质量 。对这样的
情 况 ,Mp3标 准 允 许 编 码 器 “拆 东 墙 补 西 墙 ”,也 就 是 把 这 一 帧 里 放 不 下 的 数 据 ,放 到
f( 频
பைடு நூலகம்
率)>500Hz 的情况下,1Bark≈9+4log(f/1000)。
以上我们讨论了响度 、音高和掩
蔽效应,尤其是人的主观感觉。其中掩蔽效应尤为重要,它是心理声学模型的基础。
表12-01 临界频带[16]
临界
低端 高端 宽度 低端 高端 宽度
频带 频率 (Hz) 临界
频带 频率 (Hz)
0 0 100 100 13 2000 2320 320
我们逐渐增加第二个正弦波的频率 ,但保持它的音量不变 ,直到我们能听到它。假定
它的频率增加到4000赫兹的时候我们就能听到这个声音了 。当两个正弦波的频率差别
逐渐变大,第二个正弦波逐渐可以听得到 ,直到它的频率增高到某一点之后 ,绝大多
数人都可以听到两个互不相同的音调了 ,一个比较大声 ,另一个比较小声。 这个过 程 就 是 心 理 声 学 所 说 的 “同 步 掩 蔽 ”现 象 。 两 个 频 率 相 近 , 但 是 音 量 相 差 很 多 的 声 音 , 很难被人类感知为两个不同的声音 。考虑到这种现象,mp3在编码过程中尽量丢弃那 些无法被感知的声音,或者分配尽可能少的比特给这些声音。
时间掩蔽
同步掩蔽效应和不同频率声音的频率和相对音量有关 ,时间掩蔽则仅仅和时间有
关。如果两个声音在时间上特别接近 ,人类在分辨它们的时候也会有困难 。例如如果
一个很响的声音后面紧跟着一个很弱的声音 ,后一个声音就很难听到。但是如果在第
一个声音停止后过一段时间再播放第二个声音 ,后一个声音就可以听到。到底应该间
mp3的时候无法确定当前解码(播放)到了什么位置,播放器上显示的 “当前播放时
间”是不准的。
对一个固定比特率压缩的 mp3文件来说,每一帧的头部中的信息
都是相同的,但是对可变比特率 mp3编码来说就不是 。但是解码的时候 ,可变比特率
编码并不比固定比特率的文件需要更多的计算能力 ,因为 mp3解码器即使在播放固定
后的音频会丢失大量细节,导致音质下降。相反,如果使用较高的比特率编码, “无
关”和“冗余”的标准就会被限定的更严格 ,细节会被保留,但是文件更大。
注意,
mp3文件的比特率指的是所有被编码 声道的总比特率 。也就是说一个128kbps 立体声
mp3文件,和两个同样时间的 64kbps 的单声道 mp3文件加起来的大小相同。但是一
目录
同步掩蔽的定义 1 听觉的掩蔽效应综述 1 频域掩蔽 1 时域掩蔽 1 时间掩蔽 1 固定比特率和可变比特率
1 视觉的掩蔽效应空间域中的掩蔽效应 1 时间域中掩蔽效应 1 彩色的掩蔽效应
人耳的掩蔽效应
展开
编辑本段同步掩蔽的定义
Mp3编解码器只关心频率之间和音量之间的相互关系 。用 mp3编解码器能够处理
编辑本段人耳的掩蔽效应
一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象
低的频率的声音则简略记录,从而大大压缩了所需的存储空间。在人们欣赏音乐时,
如果设备对高频响应得比较好,则会使人感到低频响应不好,反之亦然。
一种
频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应 。前者称为掩蔽
声音(maskingtone),后者称为被掩蔽声音 (maskedtone)。掩蔽可分成频域掩蔽和时
彩色的掩蔽效应
在亮度变化剧烈的背景上 ,例如在黑白跳变的边沿上,人眼对色彩变化的敏感程 度 明 显 地 降 低 。类 似 地 ,在 亮 度 变 化 剧 烈 的 背 景 上 ,人 眼 对 彩 色 信 号 的 噪 声( 例 如 彩 色信号的量化噪声)也不易察觉。这些都体现了亮度信号对彩色信号的掩蔽效应。
域掩蔽。
频域掩蔽
一个强纯音会掩蔽在其附近同时发声的弱纯音 ,这种特性称为频域掩蔽 ,也称同
时 掩 蔽 (simultaneousmasking),如 图 12-03 所 示 。 从 图 12-03 可 以 看 到 , 声 音 频 率 在
300Hz 附近、声强约为60dB 的声音掩蔽了声音频率在150Hz 附近、声强约为40db
件信息量的因素还有很多。可变比特率编码就是为了适应音频文件的这一特点开发
的。可变比特率编码,会根据音频数据的动态特性随时调整编码使用的比特率。
多数情况下,可变比特率编码能用更小的文件达到和固定比特率编码基本相同的音
质。但是可变比特率编码也有其自身的缺点 。首先,一些比较古老的播放器根本支持
对可变比特率 mp3文件的解码,不能播放这样的文件 。第二,解码器播放可变比特 率
时间域中掩蔽效应
影响时间域中掩蔽效应的因素比较复杂 ,对它的研究还处于初始阶段 。这里仅介 绍一些实验结果,这些结果可能在数据压缩方面具有潜在的应用价值。实验表明 ,当 电 视 图 像 序 列 中 相 邻 画 面 的 变 化 剧 烈( 例 如 场 景 切 换 )时 ,人 眼 的 分 辨 力 会 突 然 剧 烈 下 降 ,例 如 下 降 到 原 有 分 辨 力 的 1/10。也 就 是 说 ,当 新 场 景 突 然 出 现 时 ,人 基 本 上 看 不清新景物,在大约0.5秒之后,视力才会逐渐恢复到正常水平 。显然,在这0.5秒内, 传送分辨率很高的图像是没有必要的 。研究者还发现,当眼球跟着画面中的运动物体 转动时,人眼的分辨率要高于不跟着物体转动的情况 。而通常在看电视时,眼睛是很 难跟踪运动中的物体的。