心理声学(Psychoacoustic Facts and Models )第一章
fdk-aac编码原理

fdk-aac编码原理
fdk-aac是一种开源的、高性能的AAC(Advanced Audio Coding)音频编码库。
以下是fdk-aac编码的基本原理:
1.AAC编码概述:AAC是一种先进的音频编码标准,旨在提供更高的音频质量和更低的比特率。
它采用了基于子带的编码技术,通过对音频信号进行频域分析和量化来实现高效的压缩。
2.Psychoacoustic Model(心理声学模型):AAC编码使用心理声学模型分析音频信号,模拟人耳的感知特性。
这包括对音频信号的掩蔽效应进行建模,以便更有效地分配比特率给对人耳更敏感的信号部分。
3.MDCT(Modulated Discrete Cosine Transform):AAC使用MDCT作为频域变换技术,将音频信号从时域变换到频域。
这种变换有助于提取信号的频域特征,为后续的量化和编码提供基础。
4.Quantization and Coding(量化和编码):MDCT输出的频域系数经过量化和编码,以减少数据量。
AAC使用了一系列的编码技术,如Huffman编码和熵编码,来进一步压缩数据。
5.Bit Allocation(比特分配):根据心理声学模型的分析结果,AAC对每个频带分配适当的比特率,以确保对人耳敏感的频段获得更多的比特,从而提高音质。
6.码率控制:AAC编码器通常具有码率控制功能,以确保生成的编码流满足指定的比特率要求。
这对于网络传输和存储空间的有效利用非常重要。
fdk-aac是一个高度优化的AAC编码库,它在实现这些基本原理的同时,通过一系列的技术手段和算法来提高编码效率和音频质量。
6心理声学

• 心理声学(psychoacoustics)是心理物理学 的一个部分。心理物理学是研究物理刺激 的参数(如:声音的强度,光的波长)和心理 量(如:响度,颜色)之间关系的科学。 • 在心理声学中,刺激信号为声音(物理量), 而感觉则为听觉(心理量)。确定物理量的单 位比较容易,而确定心理量的单位就比较 困难。
• 二、双耳声源定位 • 双耳声源的定位是基于双耳听到声音的时 间差(低频)和强度差(高频)。 • 领先效应
江苏省人民医院(南京医科大学附属第一医院)
WHO预防聋和听力减退合作中心
• 三、双耳听觉融合和双耳听觉偏向 • 如果把同样的声音经由两个耳机同时送人 两个耳朵,听觉系统可将此两个声音融合 为一个声音,其位置在头部的中央。 • 四、双耳掩蔽级差
江苏省人民医院(南京医科大学附属第一医院)
WHO预防聋和听力减退合作中心
第四节 频率的选择性与音调的感受
• 音调 • 音色
江苏省人民医院(南京医科大学附属第一医院)
WHO预防聋和听力减退合作中心
第五节 双耳听觉
• 一、双耳听觉的累积作用
• 阈值、响度、双耳声音的融合、声源的定位、声源位置的 鉴别、双耳听觉的特殊效应、助听 • 双耳节律
江苏省人民医院(南京医科大学附属第一医院)
WHO预防聋和听力减退合作中心
江苏省人民医院(南京医科大学附属第一医院)
WHO预防聋和听力减退合作中心
第三节 响度的感觉பைடு நூலகம்
• 一、生理基础 • 神经冲动的速率 • 发生冲动的神经的数量 • 二、 频度对响度的影响s • 三、强度和响度的关系 响度的单位:方,宋 • 四、时值对响度的影响 适应和疲劳 TTS 异常响度:病理性适应和重振 • 五、强度变化的察觉
心理声学在心理治疗中的应用

心理声学在心理治疗中的应用心理声学是一门研究声音对人类心理和情绪的影响的学科。
它探索了声音对人类认知、情感和行为的作用,以及如何利用声音来促进健康和治疗心理问题。
在心理治疗中,心理声学被广泛应用,它可以通过音乐疗法、声音放松和声音刺激等方式来帮助人们改善心理健康。
音乐疗法是心理声学在心理治疗中最常见的应用之一。
音乐具有独特的情感表达和情感诱发的能力。
通过选择适当的音乐,治疗师可以帮助患者表达和释放情感,缓解焦虑和压力。
音乐还可以激发人们的创造力和想象力,帮助他们探索和理解内心的冲突和问题。
此外,音乐还可以帮助患者建立积极的情感体验和情感联系,提高自尊和自信心。
声音放松是另一种常见的心理声学应用。
声音放松利用声音的特定频率和节奏来诱导身心放松。
通过听取自然环境中的声音,如海浪的声音、鸟鸣声等,人们可以放松身心,减轻压力和焦虑。
声音放松还可以通过音乐、冥想和呼吸练习等方式来帮助人们进入放松状态。
这种放松状态不仅可以改善心理健康,还可以提高注意力和集中力,增强学习和工作效率。
声音刺激是心理声学在心理治疗中的另一个重要应用领域。
声音刺激可以通过改变声音的频率、音量和节奏等方式来影响人们的情绪和行为。
例如,快速节奏的音乐可以提高人们的兴奋和活力,而缓慢节奏的音乐可以帮助人们放松和入睡。
声音刺激还可以通过声音的空间分布和立体声效果来创造身临其境的体验,增强人们对环境的感知和情感体验。
这种声音刺激不仅可以用于治疗焦虑和抑郁症,还可以用于改善注意力和认知功能。
除了上述应用外,心理声学还在其他领域展现出潜力。
例如,虚拟现实技术结合心理声学可以创造出逼真的虚拟环境,帮助人们面对和克服恐惧和创伤。
声音诱导幻觉可以通过声音的特定频率和节奏来改变人们的意识状态,帮助他们进入冥想、放松和集中注意力的状态。
此外,心理声学还可以应用于人机交互和游戏设计领域,通过声音的设计和应用来提高用户体验和情感参与。
尽管心理声学在心理治疗中的应用已经取得了显著的进展,但仍然存在一些挑战和限制。
windows声音应用程序开发指南 张新宇 第4章 MP3文件格式

第4章 MP3文件格式
所有的数据划分为小的数据段,每一个数据段称为 一帧(Frame),通常一帧存储1秒的数据。
对声音数据进行分析,得到其光谱能量分布,即 得到声音频率的光谱图,根据整个光谱的能量分布确 定表示这些数据需要的最合适的位数(bit)。 根据比特率以确定每一帧能够存储的最大比特 (bit)。 分布在每一帧中的频率数据与一个生理心理声学 模型中的数据(这些数据存储在一个CODEC参考表中) 进行比较,以决定这些数据的取舍。
第4章 MP3文件格式
4.3.2 与感觉有关的压缩解压器
总体来看,MP3分两步进行压缩: (1) 有损压缩:舍弃那些人们根本听不到的声音数据。 (2) 无损压缩:对认为重要的数据进行高效压缩处理。 其中有损压缩部分最复杂,也是MP3编码的重点。因
为与感觉有关的CODEC只是提供了一种原理,并没有提
与音调1的正弦波的频率就有较大的区别。如图4-3:
通常正常的人在点A时刻只能听到音调1,而听不到音
第4章 MP3文件格式
调2,因为此时音调2的频率与音调1非常相似;在点B 时刻就能听到音调1和音调2,因为此时音调1的频率与 音调2的频率不相似。另外我们注意到,在整个过程中, 音调2的音量并没有发生变化。
第4章 MP3文件格式
1 000 Hz 音调 1 0dB
1 000 Hz
1 100 Hz 音调 2 -10dB A
4 000 Hz
B
音量
时间
图4-3 两个频率非常相近的声音和两个频率不相近的 声音产生的不同效果
第4章 MP3文件格式
2) 时间遮蔽效应
一种基于空气信道的音频伪装模型

一种基于空气信道的音频伪装模型摘要:音频伪装作为一种寄生通信技术,使用需满足两个条件:一是要有能够携带隐藏信息的音频载体;二是音频载体要有冗余,能够容纳额外的隐藏信息而不显著降低自身的通信性能。
本文对空气信道的信息隐藏技术展开研究,提出了一种基于空气通道的音频伪装模型,该模型包括信息伪装通信模型、听觉系统模型、音频伪装模型等三个部分。
关键词:信息隐藏;空气通道;音频伪装;信息干扰;听觉系统1 概述空气信道是对无线通信中发送端和接收端之间通路的一种形象比喻,对于无线电波而言,它从发送端传送到接收端,其间并没有一个有形的连接,它的传播路径也有可能不只一条,为了形象地描述发送端与接收端之间的工作,可以想象两者之间有一个看不见的道路衔接,科研人员把这条衔接通路称为信道。
通信系统由发信机、发信天线、收信机、收信天线和各种终端设备组成。
发送机主要由话筒、音频处理器、调制器、混频、功率放大器组成。
它功能主要是对信号进行变换,对原始的电信号进行变换成适合在无线信道中传输的信号将信号放大后,再通过天线送往无线信道。
收信机从混有噪声的信号中恢复出原信号。
音频在空气信道中传输在其输入输出过程中难免会产生噪音的干扰。
随着工业发展,大气和工业无线电噪声干扰日益严重,工业电器辐射的无线电噪声干扰平均强度非常高,加上大气无线电噪声和电台间的干扰,在之前,几瓦发射功率就能实现的远距离短波无线电通信,而如今,几十倍于这样的功率也不一定能够保证可靠的通信。
大气和工业无线电噪声主要集中在无线电频谱的低端,随着频率的升高,强度逐渐降低。
这类噪声的强度很高,严重影响着空气通信的可靠性,尤其是脉冲型突发噪声,经常会使数据传输出现突发错误,十分影响通信质量。
基于此,本文特提出了一种基于空气信道的音频伪装模型。
该模型面向空气信道传播,音频伪装算法除了满足不可感知性外,还能够同时抵抗空气信道中噪声的干扰因素,具备很强的鲁棒性。
2基于空气信道的音频伪装模型2.1 信息伪装通信模型信息伪装通信系统与传统的通信系统较大的区别在于,在其发送端存在一个已知的强信号,即载体也可以视作信息伪装通信系统中的“边信息”(side information)。
心理声学名词解释

心理声学名词解释
心理声学是研究声音在人类心理和认知过程中的作用、效应和机制的学科。
在心理声学中,有许多重要的名词需要解释,下面是其中一些常见的名词解释:
1. 声音感知:指人类对声音的感知和认知过程。
它涉及到感觉器官接收声音刺激、通过感觉信息传递到大脑、大脑对声音进行处理和解释等一系列过程。
2. 听觉注意:指人类在感知声音时所选择和集中注意力的能力。
听觉注意可以通过选择性注意和分配注意来控制,它对声音的感知和理解起到重要作用。
3. 声音记忆:指人类对声音的记忆能力。
声音记忆可以进一步分为短时记忆和长时记忆两种,短时记忆用于短期的声音信息存储,而长时记忆用于长期的声音记忆存储。
4. 声音感情:指声音在情感表达上的作用和效果。
声音可以通过音调、音高、音色等特征来传递情感信息,如高音调可能表达兴奋或愤怒,低音调可能表达平静或悲伤等。
5. 声音恐惧症:指对声音产生过度恐惧或焦虑的心理疾病。
声音恐惧症可以由不同因素引起,如过去的负面经验、感知问题等,会导致对特定声音或一般声音的过度恐惧。
6. 声音干扰:指不相关声音对目标声音感知和理解的干扰。
声音干扰可以使人们难以注意到、理解或记忆目标声音,影响声
音的有效传达和处理。
7. 声音注意死角:指听觉系统对声音的感知存在的一些局限性。
例如,人类的注意力往往更容易被突然和重要的声音吸引,而忽略或忽视一些低频或不重要的声音。
这些是心理声学中一些重要的名词解释,它们帮助我们更好地理解声音在人类心理和认知过程中的作用和效应。
心理声学在语音识别技术中的应用探索

心理声学在语音识别技术中的应用探索语音识别技术是一种将语音信号转化为文字的技术,近年来得到了广泛的应用。
然而,在实际应用中,语音识别技术还存在一些问题,例如在嘈杂的环境下,识别率较低;对于不同人的语音特征,识别准确度也有所不同。
为了解决这些问题,心理声学作为一门研究人类声音感知和语言处理的学科,开始在语音识别技术中得到应用。
心理声学研究了人类对声音的感知和认知过程,包括声音的音高、音量、音色等特征。
在语音识别技术中,心理声学可以帮助识别系统更好地理解和处理语音信号。
例如,通过分析人类对不同音高的感知差异,可以对语音信号进行音高调整,使得在嘈杂环境中的语音识别更加准确。
此外,心理声学还可以研究人类对不同音色的感知偏好,从而优化语音合成技术,使得合成的语音更加自然流畅。
除了对声音特征的研究,心理声学还可以研究人类对语音的认知过程。
在语音识别技术中,人类的语言模型是非常重要的一部分。
通过研究人类对语言的理解和记忆过程,可以优化语音识别系统的语言模型,提高识别准确率。
例如,通过研究人类对不同语法结构的理解能力,可以设计更加准确的语音识别模型,使得系统能够更好地理解和解析复杂的语音输入。
心理声学在语音识别技术中的应用还可以帮助解决说话人识别的问题。
在实际应用中,不同人的语音特征存在较大的差异,这对于语音识别系统来说是一个挑战。
通过研究人类对不同说话人的声音特征的感知差异,可以设计更加准确的说话人识别算法,提高系统的准确率。
此外,心理声学还可以研究人类对不同情感的声音特征的感知,从而实现情感识别的功能,为语音识别技术的应用场景进一步拓展。
尽管心理声学在语音识别技术中的应用已经取得了一些成果,但仍然存在一些挑战和问题。
首先,心理声学研究的结果往往是针对个体或者小样本的,如何将这些研究结果应用到大规模的语音识别系统中,仍然需要进一步的研究和探索。
其次,心理声学研究往往是基于实验室环境下的数据,如何将这些研究结果应用到实际的应用场景中,也是一个需要解决的问题。
心理声学模型在音频质量评估中的应用

心理声学模型在音频质量评估中的应用音频质量评估是指对音频信号的感知质量进行评估和分析的过程。
在过去,人们主要依靠主观评价来判断音频质量,但这种方法存在主观性强、耗时长等问题。
随着科技的发展,心理声学模型逐渐应用于音频质量评估中,为我们提供了一种更为客观、高效的评估手段。
心理声学模型是一种模拟人类听觉系统的数学模型,通过模拟人耳的听觉特性和心理感知过程,来预测人们对音频质量的感知。
它可以将音频信号转化为与人耳听觉特性相关的特征参数,进而通过这些参数来评估音频质量。
心理声学模型的应用使得音频质量评估更加客观、准确。
心理声学模型主要包括两个方面的内容:听觉特性建模和心理感知建模。
听觉特性建模主要研究人耳对音频信号的感知特性,包括音频信号频谱、响度、韵律等方面。
心理感知建模则研究人们对音频信号的主观感知,包括音频质量、清晰度、舒适度等方面。
通过对这两个方面的建模,心理声学模型可以较为准确地预测人们对音频质量的感知。
在音频质量评估中,心理声学模型可以应用于多个方面。
首先,它可以用于音频编码算法的优化。
音频编码算法是将音频信号压缩以减小文件大小的过程,但压缩会导致音频质量的损失。
通过心理声学模型,我们可以评估不同编码算法对音频质量的影响,从而选择最优的编码算法。
其次,心理声学模型可以用于音频设备的优化。
不同的音频设备对音频信号的处理方式不同,如均衡器、压缩器等。
通过心理声学模型,我们可以评估不同设备对音频质量的影响,从而选择最适合的设备。
此外,心理声学模型还可以用于音频场景的优化。
音频场景是指音频信号在特定环境中的传播和感知过程。
不同的场景会对音频质量产生不同的影响,如噪声、混响等。
通过心理声学模型,我们可以评估不同场景对音频质量的影响,并采取相应的措施进行优化。
心理声学模型在音频质量评估中的应用不仅提高了评估的客观性和准确性,还大大提高了评估的效率。
传统的主观评价需要耗费大量的时间和人力,而心理声学模型可以在短时间内自动完成评估,极大地节省了成本。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
心理声学:事实和模型第一章 刺激和过程在这一章中,简要回顾了声音的光谱特性和时间之间一些基本的相关性。
对扬声器和耳机将电信号转换成声音进行了阐述。
此外,还提到一些心理物理学方法和程序。
最后,对刺激和一般听觉感受之间的关系和心理声学中的原始数据的处理进行了讨论。
1.1声音的时间和频谱特性在心理声学经常使用的声音的一些时间和频谱特性如图1.1。
声音很容易通过声压随时间的变化P (t )进行描述。
和大气压力的大小相比,声源所造成的声压的时空变化是非常小的。
声压的单位是帕斯卡(Pa )。
在心理声学中,经常涉及声压值10-5帕(绝对阈值)到102帕(痛阈)。
为了解决涉及范围很大的量值的处理,通常使用声压级L ,声压和声压级有关方程20log()p L dB p = (1.1) 式中,基准声压020p Pa μ=。
除了声压和声压级,声强I 和声强级在心理声学中也很重要。
在平面行波,声压级及声强级相关方程如下:0020log()10log()p I L dB p I == (1.2) 式中,基准声级-122010 W/m I =。
特别是在处理噪声时,与直接使用声强相比,使用声强密度更方便。
例如,虽然定义不是很确切,但“1 Hz 带宽的声音强度”也可用来表达“噪声功率密度”。
对声强密度取对数即为声强密度级,通常缩短密度级l 。
对于密度级与频率无关的白噪声,L 和L 相关方程如下:[10log(/)]L l f Hz dB =+∆ (1.3)其中,f ∆表示赫兹(Hz )衡量问题的声音带宽。
图1.1 心理声学常用刺激的时间功能和相关的频谱在图1.1中,图“1-KHz tone”显示了连续正弦振荡的声压p的时间函数,和1ms时间内的最大值,对应频谱只用一个中心频率1 kHz时的谱线。
“beats”图是最容易解释的谱域,显示了两个振幅相同的纯音的组合。
相应的时间功能清楚地显示一个包络的强烈变化。
“AM tone”图,描绘了一个正弦调幅中心频率为2 kHz的音调的时间功能和频谱。
时间函数显示随调制频率变化的包络的正弦振荡。
相应的频谱说明,一个调幅音调需要三条线来描述。
水平的差异,ΔL,一方面在2kHz之间的中线,要么较低或其他上侧线,都涉及到调制,M的程度,由方程(1.4)L m dB20log(/2)]6ms期间的包络波动表明,对应的调制频率为167赫兹,在谱域中,上部和下部线路与中心线之间的频率差,称为载波。
“音频脉冲”图显示纯音的时间函数和频谱,即固定间隔矩形门。
音频率是2KHz,选通间隔为6 ms。
在谱域,线之间的间距对应的选通频率为167Hz。
“直流脉冲”图显示了类似的情况。
只是在这种情况下,是一个直流电压,而不是一个周期的纯音门控。
直流脉冲的持续时间是1ms,间隔为8ms。
相应的频谱显示,8毫秒的倒数分离线,即125 Hz 。
在频率对应于1/1ms,2/1ms,3/1ms等时,谱线的幅度显示不同的最小值。
最后一个例子是产生离散或谱线的“调频”。
描述了一个频率为2 kHz音调在1~3 kHz 频率范围内,调制频率为200 Hz的正弦调频。
相关频谱的振幅关于2 kHz对称,并遵循其包络的一个贝塞尔函数。
如果调制指数(即频率偏差和调制频率之间的比率)小到使大多数贝塞尔频谱线消失,那么由此得到的频谱类似于具有一条中心线和两侧线的调幅音调的频谱。
然而,相对于调幅音调,调制指数小的调频音调的侧线相位差为90°。
图1.1中的“短纯音”图是描述一系列连续产生的声音而非谱线的第一个例子。
函数描述了频率2 kHz ,宽度2ms 的单个短纯音。
相应的频谱最大值可达2 kHz ,与最小值相差500 Hz 。
因此,单个短纯音的频谱相当于音脉冲或直流脉冲的频谱。
尽管音脉冲和直流脉冲产生的是谱线,单个短纯音产生的是一个连续的频谱。
白噪声是产生连续频谱的声音的一个重要例子。
在心理声学中,出于实际考虑,白噪声的带宽通常限制在20 Hz~20 kHz 。
从图1.1中的“白噪声”图可以看出,频谱密度在0~20 kHz 整个范围不受频率影响。
应该提到的是,这适用于长期频谱的白噪声,而瞬时频谱的白噪声可能会出现一定的频率相关性。
白噪声的时间函数的振幅呈现高斯分布。
如果白噪声的带宽受到滤波器的限制,我们可以得到带通噪音。
图1.1中“带通噪声”图是中心频率为1 kHz ,带宽为200 Hz 的带通噪声的时间函数ΔF 的一个典型例子。
时间函数表明,它是没有周期性的单一现象。
对于白噪声,带通噪声的规则是,在一个特定的时刻,振幅只能按一定的概率给出;其概率函数呈现高斯分布。
包络波动的速度取决于滤波器的带宽。
第一近似理论,带通噪声的时间函数可以被视为一个1kHz 的音调经随机的幅度(和相位)调制。
通常情况下,每秒包络的极大值n 可近似等于如下公式0.64.n f =∆ (1.5)因此,“有效”的调制频率*mod f 与带通噪声带宽f ∆,可近似等于如下公式*mod 0.64.f f =∆ (1.6)在带通噪声的带宽为200 Hz 时,这意味着包络的极大值平均间距约8ms 出现一次。
在图1.1“带通噪声”图中的时间函数表明,这种近似是有效的。
“窄带噪声”图显示讨论了带通噪声的相同功能。
然而,在这种情况下,带宽只有20Hz ,包络波动非常缓慢,并且包络极大值的时间间距平均增大到约80ms 。
时间函数的变化表明,窄带噪声可以第一近似为一个1 kHz 的纯音经过随机调幅。
图的“高斯-直流脉冲”显示了一个高斯状包络的直流脉冲的时间函数和频谱。
高斯形状代表时间包络变化的速度和相关的频谱带宽之间的最佳交换,本图中的带宽和持续时间所产生的即为一个最小的高斯形状。
例如,时间1p t ms =是矩形窗函数在相同的声压下在曲面上截取同样大的面积,即高斯直流脉冲。
在这种情况下,持续时间p t 测量出的声压是最大声压值的一半以下,正好是0.456倍的最大声压。
本例中,在谱域的相应带宽接近500Hz 。
图的“高斯形短纯音”显示了一种门控音的时间函数和频谱,由于其时间包络相对陡峭的斜坡以及其相对狭窄的频谱分布成为心理声学的首选。
在图1.1中给出的例子描述的是一个单一的高斯形音脉冲的情况。
如果脉冲以1 Hz 的频率重复,并且频谱包络保持不变,那么将会生成间距为1Hz 的线谱。
图1.2 高斯噪声的声压超过一个规定声压的概率归一于其均方根如上所述,噪声信号不能给出它们的最大振幅,因为高斯噪声振幅按高斯分布变化。
这意味着,只能用概率来表示其声压超过给定值。
在图1.2,这个概率作为一个实际的声压函数,归一于其长期的均方根(RMS )值。
实际声压在RMS 值以上的概率随实际声压与RMS 的比值的减小而减小。
如果一个削波噪声信号可以容忍1%的时间,这意味着一个声压振幅以2.6倍的RMS 值的不失真传输。
对于心理声学实验,更严格的限制是必要的,因为削峰可容忍的只有0.1%的时间。
因此,因此,声压超过RMS 值的3.4倍无失真传输。
出于实用的目的,这意味着噪声信号的读数与纯音每米要降低10dB ,以避免噪声信号的严重失真。
1.2扬声器和耳机的声音介绍心理声学实验中,通常通过扬声器或耳机将电磁波转变成声波。
在这两种情况下,频率响应和由传感器产生的非线性失真是非常重要的。
图1.3显示的包含低频、中频电动式扬声器和高频压电喇叭三个扬声器的机壳的频率响应。
这个组合体在暗室中进行测量时的频率响应(1L 为一倍f 时)在35Hz~16kHz 范围内是水平的,上下波动不超过±2 dB 。
在图3中也给出了频率响应产生的二次失真2L (2f )和三次失真3L(3f ),但从零点上移了20dB 。
图 1.3 在暗室中音箱的频率响应1L 和频率响应产生的二次失真2L (2f )和三次失真3L(3f ),上移了20dB 。
图1.4 a ,b 图(a )一个扬声器在正常客厅(密集)和在暗室(分散的)中的频率响应,图(b )显示了在客厅中很大频率范围内的频率响应。
在心理声学应用中,只有0.1%或更低的失真系数被允许,对应于60dB 的水平差异。
考虑到1L 平均为85dB , 2L 和3L 趋向于零,这就意味着,规模使用时相应的失真水平分量不应超过45dB 。
在整个频率范围内的结果清楚地绘于图1.3,失真系数很难低于0.1%。
然而,在一个频率范围约150Hz ,失真系数平均约为0.3%,,这是一个比较好的扬声器代表图。
如果声音不是在暗室而是在一个“正常”的房间,如客厅,通过扬声器再现的话,将会增加其复杂性。
房间的频率特性是叠加在扬声器的频率特性上的。
图1.4就是一个例子。
在左侧图中的虚线代表在暗室中测量扬声器的频率特性,实线代表在客厅中相同的扬声器的频率特性。
图 1.4a数据显示,房间的共振明显改变与之相结合的频率响应变得清晰。
图1.4b显示大频率范围的扬声器加上房间的部分频率响应。
此图显示出非常尖锐,窄的凹陷处的频率响应。
如果纯音的频率只是在这样的凹陷处轻微变化,那么小的频率变化就转化成一个大的振幅变化,这会导致清晰可闻的响度差异。
如果声音通过耳机呈现,这些问题大多是可以被克服的。
一个优势是,耳机在心理声学中通常用于表示在感兴趣的频率范围内非常小的非线性失真(小于0.1%或-60dB)。
耳机的频率响应被用来衡量真正的耳朵,因为目前的耦合器可以产生误导的结果。
因此,耳机的频率响在暗室中通过由扬声器或耳机再现的音调的主观响度比较进行测量。
在DIN 45619 T.1中描述了此过程的具体细节。
由于衡量真正的耳朵时,耳机的频率响应通常在心理声学中显示一个带通特性,均衡器得到了的发展。
耳机和均衡器的结合提供了一个自由场的等效频率响应,频率响应曲线在± 2 dB的范围内是水平的。
为DT 48和TDH 39耳机开发的自由场均衡器的衰减特性如图1.5。
这些衰减特性也说明了各自的耳机的自由场等效频率响应(DT 48如图a,TDH 39如图b)。
此外,给出了为认识包含无源和有源元件的均衡器的电路图。
当均衡器输入1V电压时,均衡器和耳机的结合产生了声压级80dB的自由场。
如果在没有均衡器的情况下使用耳机,那么就必须牢记它们会像带通滤波器一样改变声音。
这意味着,无论是音色和响度都受到很大影响,特别是宽频带的声音。
1.3方法和程序在下面的部分,将讨论心理声学中经常使用的几种方法。
这些方法之间的主要区别是:它们是专为不同类型的心理声学任务设计的,而且它需要不同的时间到达有关的结果。
调整方法。
在此方法中,受控主体是刺激。
例如,主体是改变一个纯音直到刚好能被听到。
在另一项实验中,主体可能是改变一个声音的频率直到其尖锐度等于参考音的尖锐度,或在另一的情况下,直到其尖锐度关于参考音的尖锐度的间距一个八度音程。