音频基础知识

合集下载

数字音频基础知识

第一章数字音频基础知识重要内容⏹声音基础知识⏹结识数字音频⏹数字音频专业知识第1节声音基础知识1.1 声音旳产生⏹声音是由振动产生旳。

物体振动停止，发声也停止。

当振动波传到人耳时，人便听到了声音。

⏹人能听到旳声音，涉及语音、音乐和其他声音（环境声、音效声、自然声等），可以分为乐音和噪音。

✦乐音是由规则旳振动产生旳，只包具有限旳某些特定频率，具有拟定旳波形。

✦噪音是由不规则旳振动产生旳，它包具有一定范畴内旳多种音频旳声振动，没有拟定旳波形。

1.2 声音旳传播⏹声音靠介质传播，真空不能传声。

✦介质：可以传播声音旳物质。

✦声音在所有介质中都以声波形式传播。

⏹音速✦声音在每秒内传播旳距离叫音速。

✦声音在固体、液体中比在气体中传播得快。

✦15ºC 时空气中旳声速为340m/s 。

1.3 声音旳感知⏹外界传来旳声音引起鼓膜振动经听小骨及其他组织传给听觉神经，听觉神经再把信号传给大脑，这样人就听到了声音。

⏹双耳效应旳应用：立体声⏹人耳能感受到（听觉）旳频率范畴约为20Hz~20kHz，称此频率范畴内旳声音为可听声(audible sound)或音频(audio)，频率<20Hz声音为次声，频率>20kHz声音为超声。

⏹人旳发音器官发出旳声音（人声）旳频率大概是80Hz～3400Hz。

人说话旳声音（话音voice / 语音speech）旳频率一般为300Hz～3000 Hz（带宽约3kHz）。

⏹老式乐器旳发声范畴为16Hz (C2)～7kHz(a5)，如钢琴旳为27.5Hz (A2)～4186Hz(c5)。

1.4 声音旳三要素⏹声音具有三个要素：音调、响度（音量/音强）和音色⏹人们就是根据声音旳三要素来辨别声音。

音调（pitch ）⏹音调：声音旳高下（高音、低音），由“频率”（frequency）决定，频率越高音调越高。

✦声音旳频率是指每秒中声音信号变化旳次数，用Hz 表达。

例如，20Hz 表达声音信号在1 秒钟内周期性地变化20 次。

音频基础知识及编码原理

音频基础知识及编码原理音频是我们日常生活中不可或缺的一部分，它通过我们的耳朵传达声音信息。

音频的基础知识和编码原理对于我们理解音频的特性和进行音频处理都是非常重要的。

一、音频基础知识1.音频信号：音频信号是一种连续时间变化的模拟信号，它可以通过声音的压力波来传递声音信息。

在计算机中，音频信号会被采样和量化为离散的数字信号。

2.音频频率：音频频率是指声音中的振荡周期数量。

它以赫兹（Hz）为单位表示，描述了声波的频率。

人类可以听到的频率范围约为20Hz到20kHz，不同的生物和设备有着不同的频率感知范围。

3.音频幅度：音频幅度是指声音的强度或振幅。

它可以通过声音的声压级来表示，单位为分贝（dB）。

声压级越高，声音就越大；声压级越低，声音就越小。

4. 音频声道：音频声道是指音频信号的通道数量。

单声道（mono）只有一个通道，立体声（stereo）有两个通道，多声道（multi-channel）有三个或更多个通道。

5.音频采样率：音频采样率是指音频信号在单位时间内进行采样的次数。

它以赫兹（Hz）为单位表示，描述了数字音频的采样精度。

常见的采样率有44.1kHz和48kHz，高采样率可以提高音频的质量。

二、音频编码原理音频编码是将模拟音频信号转换为数字音频信号的过程。

在音频编码中，采样和量化是两个主要步骤。

1.采样：采样是将连续时间的模拟音频信号转换为离散时间的数字音频信号的过程。

采样率决定了采样的频率，即每秒钟采样的次数。

采样过程会将每个采样点的幅度值记录下来，形成一个采样序列。

2.量化：量化是将连续的模拟音频信号转换为离散的数字音频信号的过程。

它将每个采样点的幅度值映射到一个有限的数值范围内，通常使用固定的比特数来表示每个采样点的幅度。

3.压缩编码：为了减小数字音频的文件大小，音频信号通常会经过压缩编码的处理。

压缩编码可以通过去除信号中的冗余信息或者使用有损压缩算法来实现。

常见的音频压缩编码格式有MP3、AAC和FLAC等。

音频入门知识

音频入门知识声音的概念.1. 声音是一种机械振动状态的传播现象，它表现为一种机械被即声波。

产生声波的条件:a) 有作机械振动的物体：声源 b) 有能传播机械振功的弹性介质声波示意（L. A. Rowe ）2.声波频率声压变化可以是周期性的和非周期性频率概念循环（cycle）- 压缩/稀薄过程频率（frequency）：每秒cycle 数，单位 hertz (Hz) 周期 – cycle 的持续时间 (1/frequency)声音信号一般由许多频率不同的信号组成，称为复合信号；而单一频率的信号称为分量信号时间幅度频率范围频率小于20Hz 一般称为次声波（subsonic)人的听觉器官能感知的声音频率范围约为20Hz～20kHz的信号称为音频(Audio)信号人发音器官发声频率约是80～3400Hz，但人说话的信号频率约为300～3000Hz，即话音(speech)信号高于20kHz的信号称为超声波 (ultrasonic)超声波及次声波一般不能引起人听觉器官的感觉，但可借助一些仪器设备进行观察和测量乐音与噪音1.一般乐音指具有确定的基频以及与该基频有较小整数倍关系的各阶谐频（harmonic tone）2.频率比基音高的所有分音统称泛音(over tone)，泛音的频率不必与基音成整数倍关系3.在主观上把令人不愉快或不需要的声音定义为噪音4.噪音的频谱较为复杂，具有无规则的振幅和波形的连续频谱声音三要素1.响度（音响）loudness到达人耳的声扰动振幅所产生的听觉的大小声振动能量是物理特性，可用声强（sound pressure）定义，单位:帕斯卡 (Pa)实用上通常都以对数方式的声压级 (sound pressure level)表示，单位:分贝(db)响度是主观量，不能用任何仪器正确地测量声音响度使用了以两个声强之比的对数为基础的相对标度，单位：宋（sone）2.音调（音高）pitch或tone人对声音刺激频率的主观判断与估量，称之为音调 (Pitch)，单位：美（Mel）Frequency是物理量，而音调是人的感觉听觉经验一般女生的声音比男生高较大物体振动的音调较低3.音色（音质）timber由其频谱决定: 不同乐器发出同一音高的乐音，仍然可以分辨可以把音色描述为音的瞬时横截面，即用谐音（泛音）的数目、强度、分布和相位来描述。

音频的基础知识

音频的基础知识一、计算机和网络是怎样存储、处理和传递声音的？计算机和网络存储、处理和传递的是二进制数据。

用二进制数字序列表示声音，是利用现代信息技术处理和传递声音信号的前提。

数字声音的获取有以下两种方式：1、将声音数字化2、利用MIDI设备输入或用计算机软件编写MIDI音乐二、声音的数字化模拟音频信号：声波通过话筒转变为时间上连续的电压波，电压波与引起电压波的声波的变化规律是一致的，因此可以利用电压波来模拟声音信号，这种电压波被称为模拟音频信号。

模拟/数字转换：计算机内部只能处理数字信息，因此必须借助于一种设备，将时间上连续的模拟音频信号转变为用来表示声音的数据序列，计算机才能进行识别和处理，也就是通过话筒以及相关电压放大电路把声波转换成电压的波形。

通过“采样”和“量化”可以实现模拟量的数字化，这个过程称为“模数转换”（A/D转换），承担转换任务的电路和芯片称为“数模转换器”（ADC）采样：按一定的频率，即每个一小段时间，测得模拟信号的模拟量值。

量化：采样时测的的模拟电压值，要进行分级量化。

方法是按整个电压变化的最大幅度划分成几个区段，把落在某区段的采样到的样品值归成一类，并给出相应的量化值。

通过采样和量化，一个连续的波形变成了一系列二进制数字表示的数据。

数字化的声音的质量取决于采样频率和量化分级的细密程度。

量化的分辨率越高，所得数字化的声音的保真程度也越好，数据量也越大。

在播放时，计算机还要将数字信号转化成模拟信号。

例题：在某声音的数字化过程中，使用44.1KHZ的取样频率，16位量化位数，则采集四声道的此声音1分钟所需的储存空间约为__A165.75MB B21.168MBC20.672MB D10.584MB波形声音的码率（kb/s）=44.1 * 16 * 4=2822.4kb/s2822.4kb/s=2822.4/8=352.8KB/s352.8KB/s* 60s=21168KB=20.672MB选C三、MIDI音乐MIDI是音乐设备数字接口。

音频基础知识

一. 音频基础知识1. 音频编解码原理数字音频的出现，是为了满足复制、存储、传输的需求，音频信号的数据量对于进行传输或存储形成巨大的压力，音频信号的压缩是在保证一定声音质量的条件下，尽可能以最小的数据率来表达和传送声音信息。

信号压缩过程是对采样、量化后的原始数字音频信号流运用适，当的数字信号处理技术进行信号数据的处理，将音频信号中去除对人们感受信息影响可以忽略的成分，仅仅对有用的那部分音频信号，进行编排，从而降低了参与编码的数据量。

数字音频信号中包含的对人们感受信息影响可以忽略的成分称为冗余，包括时域冗余、频域冗余和听觉冗余。

1.1 时域冗余A．幅度分布的非均匀性：信号的量化比特分布是针对信号的整个动态范围而设定的，对于小幅度信号而言，大量的比特数据位被闲置。

B．样值间的相关性:声音信号是一个连续表达过程，通过采样之后，相邻的信号具有极强的相似性，信号差值与信号本身相比，数据量要小的多。

C．信号周期的相关性:声音信息在整个可闻域的范围内，每个瞬间只有部分频率成分在起作用，即特征频率，这些特征频率会以一定的周期反复出现，周期之间具有相关关系。

D．长时自我相关性:声音信息序列的样值、周期相关性，在一个相对较长的时间间隔也会是相对稳定的，这种稳定关系具有很高的相关系数。

E．静音:声音信息中的停顿间歇，无论是采样还是量化都会形成冗余，找出停顿间歇并将其样值数据去除，可以减少数据量。

1.2 频域冗余A．长时功率谱密度的非均匀性：任何一种声音信息，在相当长的时间间隔内，功率分布在低频部分大于高频部分，功率谱具有明显的非平坦性，对于给定的频段而言，存在相应的冗余。

B．语言特有的短时功率谱密度:语音信号在某些频率上会出现峰值，而在另一些频率上出现谷值，这些共振峰频率具有较大的能量，由它们决定了不同的语音特征，整个语言的功率谱以基音频率为基础，形成了向高次谐波递减的结构。

1.3 听觉冗余根据分析人耳对信号频率、时间等方面具有有限分辨能力而设计的心理声学模型，将通过听觉领悟信息的复杂过程，包括接受信息，识别判断和理解信号内容等几个层次的心理活动，形成相应的连觉和意境，由此构成声音信息集合中的所以数据，并非对人耳辨别声音的强度、音调、方位都产生作用，形成听觉冗余，由听觉冗余引出了降低数据率，实现更高效率的数字音频传输的可能。

音频的基础知识

录音制作全集（知识使用）1、人耳能听到的频率范围是20—20KHZ。

2、把声能转换成电能的设备是传声器。

3、把电能转换成声能的设备是扬声器。

4、声频系统出现声反馈啸叫，通常调节均衡器。

5、房间混响时间过长，会出现声音混浊。

6、房间混响时间过短，会出现声音发干。

7、唱歌感觉声音太干，当调节混响器。

8、讲话时出现声音混浊，可能原因是加了混响效果。

9、声音三要素是指音强、音高、音色。

10、音强对应的客观评价尺度是振幅。

11、音高对应的客观评价尺度是频率。

12、音色对应的客观评价尺度是频谱。

13、人耳感受到声剌激的响度与声振动的频率有关。

14、人耳对高声压级声音感觉的响度与频率的关系不大。

15、人耳对中频段的声音最为灵敏。

16、人耳对高频和低频段的声音感觉较迟钝。

17、人耳对低声压级声音感觉的响度与频率的关系很大。

18、等响曲线中每条曲线显示不同频率的声压级不相同,但人耳感觉的响度相同。

19、等响曲线中，每条曲线上标注的数字是表示响度级。

20、用分贝表示放大器的电压增益公式是20lg（输出电压/输入电压）。

21、响度级的单位为phon。

22、声级计测出的dB值，表示计权声压级。

23、音色是由所发声音的波形所确定的。

24、声音信号由稳态下降60dB所需的时间，称为混响时间。

25、乐音的基本要素是指旋律、节奏、和声。

26、声波的最大瞬时值称为振幅。

27、一秒内振动的次数称为频率。

28、如某一声音与已选定的1KHz纯音听起来同样响，这个1KHz纯音的声压级值就定义为待测声音的响度。

29、人耳对1~3KHZ的声音最为灵敏。

30、人耳对100Hz以下，8K以上的声音感觉较迟钝。

31、舞台两侧的早期反射声对原发声起加重和加厚作用，属有益反射声作用。

32、观众席后侧的反射声对原发声起回声作用，属有害反射作用。

33、声音在空气中传播速度约为340m/s。

34、要使体育场距离主音箱约34m的观众听不出两个声音，应当对观众附近的补声音箱加0.1s延时。

音频基础知识

⾳频基础知识Audio知识简介⼲⼀⾏专⼀⾏VS学⼀⾏丢⼀⾏第⼀部分：HTS基本概念：HTS（Home Theater System）通俗的讲就是将电影院搬到家⾥，然后就成了家庭影院，就公司的产品⽽⾔可以简单的理解为：DVD/BD player + 功放+ Speaker 组成：节⽬源（碟⽚+碟机等）+ 放声系统（AV功放+⾳箱组等）+显⽰部分（电视机/投影仪）配置家庭影院的好处：⾼清晰的如⽔晶般的画⾯，环绕的⽴体声，清晰的⼈声，震撼的低⾳效果，可以提供⼏乎⾝临其境的感觉。

在强烈的视听冲击下，能感受到现实和虚拟的完美交汇，触发更深的⼈⽣感悟。

第⼆部分：Audio百度定义：1.Audio指⼈说话的声⾳频率，通常指300Hz---3400Hz的频带2.指存储声⾳内容的⽂件3.在某些⽅⾯能指作为波滤的振动。

⾳频这个专业术语，⼈类能够听到的所有声⾳都称之为⾳频，它可能包括噪⾳，声⾳被录制下来以后，⽆论是说话声，歌声乐器都可以通过数字⾳乐软件处理。

把它制作成CD，这时候所有的声⾳没有改变，因为CD本来就是⾳频⽂件的⼀种类型。

⽽⾳频只是储存在计算机⾥的声⾳，演讲和⾳乐，如果有计算机加上相应的⾳频卡，可以把所有的声⾳录制下来，声⾳的声学特性，⾳的⾼低都可以⽤计算机硬盘⽂件的⽅式储存下来，反过来，也可以把眄来的⾳频⽂件通过⼀定的⾳频程序播放，还原以前录下的声⾳。

Audio的分类：按编码格式分类：mp3,wav, aac, ogg, flac, aiff, ac3(亦称之Dolby digital), dts, pcm, Dolby true hd(HD), Dolby digital plus(HD), dts hd master audio(HD), dts hd high resolution audio(HD), dts hd low bit rate(HD)多声道⾳频的分类：C:center L: left front R: Right frontLS: Left surround RS: right surround S: surround(单个环绕声道)LB：left back surround RB: right back surroundCs: Center surround1.带LFE声道的分法：根据码流中实际的通道数分X的值为0/1，0表⽰不带LFE通道，1表⽰含LFE通道1.x C 如1.0 为C，1.1为C+LFE2.x->L+R3.x->C+L+R4.x->L+R+LS+RS5.x->L+R+C+LS+RS6.x->L+R+C+LS+RS+Cs7.x->L+R+C+LS+RS+LB+RB2.不带LFE声⾳的分法：根据喇叭摆放的位置分其中C/L/R均摆放在前⾯，LS/RS/S/LB/RB均摆在两边/后⾯，如下图1/0->C2/0->L+R3/0->C+L+R2/1->L+R+S2/2->L+R+LS+RS3/1->L+R+C+S3/2->L+R+C+LS+RS3/3->L+R+C+LS+RS+Cs3/4->L+R+C+LS+RS+LB+RB3.声⾳信号的传输：（1）定义及I2S总线构成：I2S（Inter-IC Sound）总线是飞利浦公司为数字⾳频设备之间的⾳频数据传输⽽制定的⼀种总线标准，该总线专责于⾳频设备之间的数据⼈，⼴泛应⽤于各种多媒体系统。

音视频基础知识及概念

• DPCM • 在语音编码中，一种普遍使用的技术叫做预测技术，这种技术是企图从过去的样本来预测下一个样本的值。这样做的根据是认为在语音样本之间存在相关性。如果样本的预测值与样本的实际值比较接近，它们之间的差值幅度的变化就比原始语音样本幅度值的变化小，因此量化这种差值信号时就可以用比较少的位数来表示差值。这就是差分脉冲编码调制（Differential Pulse Code Modulation，DPCM），它是对预测的样本值与原始的样本值
音频技术基础—常见音频编码标准
• ITU-T Recommendation G.711 • ITU-T Recommendation G.722 / G.722.1 • ITU-T Recommendation G.723.1 & Annex A • ITU-T Recommendation G.728 & Annex G • ITU-T Recommendation G.729 & Annex A B • MP3(MPEG-1 audio layer 3) • AAC(Advanced Audio Coding，先进音频编码)
音频技术基础—波形编码方式
• ADPCM
– DPCM这种编译码器对幅度急剧变化的输入信号会产生比较大的噪声，改进的方法之一就是使用自适应的预测器和量化器，所谓自适应就是指，量化位数随着幅度的变化而变化，这样就产生了自适应差分脉冲编码调制（Adaptive Differential PCM，ADPCM）。
到了。
• 音调
• 音调是反映声音高低的，由声波的频率决定。频率高的声音音调高，听起来尖细；频率低的声音音调低，听起来低沉。
• 对于不同的频段，人耳对音调的辨别能力不同，中频段最灵敏，高、低频段较差。对于1KHz左右的声音，一般人可以

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一般认为20Hz－20kHz是人耳听觉频带，称为“声频”。

这个频段的声音称为“可闻声”，高于20kHz的称为“超声”，低于20Hz的称为“次声“。

(《广播播控与电声技术》p3) 所谓声音的质量，是指经传输、处理后音频信号的保真度。

目前，业界公认的声音质量标准分为4级，即数字激光唱盘CD-DA质量，其信号带宽为10Hz~20kHz；调频广播FM质量，其信号带宽为20Hz~15kHz；调幅广播AM质量，其信号带宽为50Hz~7kHz；电话的话音质量，其信号带宽为200Hz~3400Hz。

可见，数字激光唱盘的声音质量最高，电话的话音质量最低。

除了频率范围外，人们往往还用其它方法和指标来进一步描述不同用途的音质标准。

由于电子平衡与变压器平衡的区别，所以二者的接线方法是不一样的，应引起注意。

声学的基本概念音频频率范围一般可以分为四个频段，即低频段（３０￣１５０Ｈｚ）；中低频段（３０￣１５０Ｈｚ）；中低频（１５０￣５００Ｈｚ）；中高频段（５００￣５０００Ｈｚ）；高频段（５０００￣２００００Ｈｚ）。

３０￣１５０Ｈｚ频段：能够表现音乐的低频成分，使欣赏者感受到强劲有力的动感。

１５０￣５００Ｈｚ频段：能够表现单个打击乐器在音乐中的表现力，是低频中表达力度的部分。

５００￣５０００Ｈｚ频段：主要表达演唱者或语言的清淅度及弦乐的表现力。

５０００￣２００００Ｈｚ频段：主要表达音乐的明亮度，但过多会使声音发破。

音频频率范围一般可以分为四个频段，即低频段（３０￣１５０Ｈｚ）；中低频段（３０￣１５０Ｈｚ）；中低频（１５０￣５００Ｈｚ）；中高频段（５００￣５０００Ｈｚ）；高频段（５０００￣２００００Ｈｚ）。

３０￣１５０Ｈｚ频段：能够表现音乐的低频成分，使欣赏者感受到强劲有力的动感。

１５０￣５００Ｈｚ频段：能够表现单个打击乐器在音乐中的表现力，是低频中表达力度的部分。

５００￣５０００Ｈｚ频段：主要表达演唱者或语言的清淅度及弦乐的表现力。

５０００￣２００００Ｈｚ频段：主要表达音乐的明亮度，但过多会使声音发破。

所谓声音的质量，是指经传输、处理后音频信号的保真度。

可见，数字激光唱盘的声音质量最高，电话的话音质量最低。

除了频率范围外，人们往往还用其它方法和指标来进一步描述不同用途的音质标准。

音质评价方法评价再现声音的质量有主观评价和客观评价两种方法。

例如： 1．语音音质评定语音编码质量的方法为主观评定和客观评定。

目前常用的是主观评定，即以主观打分（MOS）来度量，它分为以下五级：5（优），不察觉失真；4（良），刚察觉失真，但不讨厌；3（中），察觉失真，稍微讨厌；2（差），讨厌，但不令人反感；1（劣），极其讨厌，令人反感。

一般再现语音频率若达7kHz以上，MOS可评5分。

这种评价标准广泛应用于多媒体技术和通信中，如可视电话、电视会议、语音电子邮件、语音信箱等。

2.乐音音质乐音音质的优劣取决于多种因素，如声源特性（声压、频率、频谱等）、音响器材的信号特性（如失真度、频响、动态范围、信噪比、瞬态特性、立体声分离度等）、声场特性（如直达声、前期反射声、混响声、两耳间互相关系数、基准振动、吸声率等）、听觉特性（如响度曲线、可听范围、各种听感）等。

所以，对音响设备再现音质的评价难度较大。

所谓声音的质量，是指经传输、处理后音频信号的保真度。

目前，业界公认的声音质量标准分为4级，即数字激光唱盘CD-DA质量，其信号带宽为10Hz~20kHz；调频广播FM 质量，其信号带宽为20Hz~15kHz；调幅广播AM质量，其信号带宽为50Hz~7kHz；电话的话音质量，其信号带宽为200Hz~3400Hz。

可见，数字激光唱盘的声音质量最高，电话的话音质量最低。

除了频率范围外，人们往往还用其它方法和指标来进一步描述不同用途的音质标准。

音质评价方法评价再现声音的质量有主观评价和客观评价两种方法。

例如： 1．语音音质评定语音编码质量的方法为主观评定和客观评定。

一般再现语音频率若达7kHz以上，MOS可评5分。

这种评价标准广泛应用于多媒体技术和通信中，如可视电话、电视会议、语音电子邮件、语音信箱等。

所以，对音响设备再现音质的评价难度较大。

通常用下列两种方法：一是使用仪器测试技术指标；二是凭主观聆听各种音效。

由于乐音音质属性复杂，主观评价的个人色彩较浓，而现有的音响测试技术又只能从某些侧面反映其保真度。

所以，迄今为止，还没有一个能真正定量反映乐音音质保真度的国际公认的评价标准。

但也有报道，国际电信联盟（ITU-T）近期已批准一种客观评价音质的被称之为电子耳的新型测量方法，可对任何音响器材的音质进行客观听音评价，也可用于检测电话通讯语音编码系统的缺陷。

现将乐音音质评价方法综述如下：（1）主观听判音效通常，据乐音音质听感三要素，即响度、音调和愉快感的变化和组合来主观评价音质的各种属性，如低频响亮为声音丰满，高频响亮为声音明亮，低频微弱为声音平滑，高频微弱为声音清澄。

下面结合声源、声场及信号特性介绍几种典型的听感。

①立体感主要由声音的空间感（环绕感）、定位感（方向感）、层次感（厚度感）等所构成的听感，具有这些听感的声音称为立体声。

自然界的各种声场本身都是富有立体感的，它是模拟声源声象最重要的一个特征。

德·波尔效应证明，人耳的生理特点是：人耳在两声源的对称轴上，当声压差△p=0dB和时间差△t=0ms时，感觉两声源声象相同，分不出有两个声源；而当△p＞15dB或△t＞3ms时，人耳就感觉到有两个声源，声像往声压大或导前的声源移动，每5dB的声压差相当于lms的时间差。

哈斯效应又进一步证明，当△t＝5ms~35ms 时，人耳感到有两个声源；而当近次反射声、滞后直达声或两个声源的时间差△t＞50ms时，即使一次反射声（又称近次或前期反射声）或滞后声的响度比直达声或导前声的响度大许多倍，声源方位仍由直达声或导前声决定。

根据人耳的这个生理特点，只要通过对声音的强度、延时、混响、空间效应等进行适当控制和处理，在两耳人为的制造具有一定的时间差△t、相位差△θ、声压差△P的声波状态，并使这种状态和原声源在双耳处产生的声波状态完全相同，人就能真实、完整地感受到重现声音的立体感。

与单声道声音相比，立体声通常具有声象分散、各声部音量分布得当、清晰度高、背景噪声低的特点。

②定位感若声源是以左右、上下、前后不同方位录音后发送，则接收重放的声音应能将原声场中声源的方位重现出来，这就是定位感。

根据人耳的生理特点，由同一声源首先到达两耳的直达声的最大时间差为0.44ms~0.5ms，同时还有一定的声压差、相位差。

生理心理学证明：20Hz~200Hz低音主要靠人两耳的相位差定位，300Hz~4kHz中音主要靠声压差定位，更高的高音主要靠时间差定位。

可见，定位感主要由首先到达两耳的直达声决定，而滞后到达两耳的一次反射声和经四面八方多次反射的混响声主要模拟声象的空间环绕感。

③空间感一次反射声和多次反射混响声虽然滞后直达声，对声音方向感影响不大，但反射声总是从四面八方到达两耳，对听觉判断周围空间大小有重要影响，使人耳有被环绕包围的感觉，这就是空间感。

空间感比定位感更重要。

④层次感声音高、中、低频频响均衡，高音谐音丰富，清澈纤细而不刺耳，中音明亮突出，丰满充实而不生硬，低音厚实而无鼻音。

⑤厚度感低音沉稳有力，重厚而不浑浊，高音不缺，音量适中，有一定亮度，混响合适，失真小。

除此之外，还有许多评价音质的听感，象力度感、亮度感、临场感、软硬感、松紧感、宽窄感等。

（2）客观测试技术指标①失真度谐波失真，主要引起声音发硬、发炸；而稳态或瞬态互调失真主要引起声音毛糙、尖硬和混浊。

二者均使音质劣化，若失真度超过3％时，音质劣化明显。

音响系统的音箱失真度最大，一般最小的失真度也要超过1％。

相位失真，主要引起1kHz以下的低频声音模糊，同时影响中频声音层次和声象定位。

抖晃失真，主要是电机转速不稳，主导轴-压带轮压力不稳，磁头拍打磁带等造成磁带震动和卷带量变化，进而使信号频率被调制，声音音调出现混浊、颤抖。

抖晃通常用音调变化的均方根值表示，通常，录音机的抖晃率＜0.1％，Hi-Fi录音机＜0.005％，普通录像机＜0.3％，视盘机＜0．001％。

②频响与瞬态响应频响，指音响设备的增益或灵敏度随信号频率变化的情况，用通频带宽度和带内不均匀度表示（如优质功放的频响1Hz~200kHz±ldB）。

带宽越宽，高、低频响应越好：不均匀度越小，频率均衡性能越好。

通常，30Hz~150Hz低频使声音有一定厚度基础，150Hz~500Hz中低频使声音有一定力度，300Hz~500Hz中低频声压过分加强时，声音浑浊，过分衰减时，声音乏力；500Hz~5kHz中高频使声音有一定明亮度，过分加强时，声音生硬；过分衰减时，声音散、飘；5kHz~10kHz高频段使声音有一定层次、色彩；过分加强时，声音尖刺；过分衰减时，声音暗淡、发闷。

按此规律，可根据各种听感，定量调节音响系统的频响效果。

瞬态响应，是指音响系统对突变信号的跟随能力。

实质上它反映脉冲信号的高次谐波失真大小，严重时影响音质的透明度和层次感。

瞬态响应常用转换速率V/μs 表示，指标越高，谐波失真越小。

如，一般放大器的转换速率＞10V/μs。

③信噪比信噪比，表示信号与噪声电平的分贝差，用S/N或SNR（dB）表示。

噪声频率的高低，信号的强弱对人耳的影响不一样。

通常，人耳对4~8kHz的噪声最灵敏，弱信号比强信号受噪声影响较突出。

而音响设备不同，信噪比要求也不一样，如Hi-Fi音响要求SNR＞70dB，CD机要求SNR＞90dB。

④声道分离度和平衡度声道分离度，是指不同声道间立体声的隔离程度，用一个声道的信号电平与串入另一声道的信号电平差来表示。

这个差值越大越好。

一般要求Hi-Fi音响分离度＞50dB。