语音清晰度的客观评测
声音质量评价

通过对声音的强度,延时,混响,空间效应等 进行适当控制和处理,在两耳人为的制造具有 一定的时间差△t,相位差△θ,声压差△P的 声波状态,并使这种状态和原声源在双耳处产 生的声波状态完全相同,人就能真实,完整地 感受到重现声音的立体感
2,空间感 一次反射声和多次反射混响声虽然滞后直达声, 对声音方向感影响不大,但反射声总是从四面 八方到达两耳,对听觉判断周围空间大小有重 要影响,使人耳有被环绕包围的感觉,这就是 空间感. 空间感比定位感更重要.
通常用下列两种方法:一是使用仪器测试技术指标; 二是凭主观聆听各种音效.由于乐音音质属性复杂, 主观评价的个人色彩较浓,而现有的音响测试技术 又只能从某些侧面反映其保真度.所以,迄今为止, 还没有一个能真正定量反映乐音音质保真度的国际 公认的评价标准.
三, 主观听判音效(听感) 通常根据乐音音质听感三要素,即响度,音调 和音色的变化和组合来主观评价音质的各种属性, 如低频响亮为声音丰满,高频响亮为声音明亮, 低频微弱为声音平滑,高频微弱为声音清澄. 1,立体感 主要由声音的空间感(环绕感),定位感 (方向感),层次感(厚度感)等所构成的听感, 具有这些听感的声音称为立体声.自然界的各种 声场本身都是富有立体感的,它是模拟声源声象 最重要的一个特征.
二,频响与瞬态响应 1,频响,指音响设备的增益或灵敏度随信号 频率变化的情况,用通频带宽度和带内不均匀 度表示(如优质功放的频响1Hz~200kHz±ldB). 1Hz~200kHz ldB 带宽越宽,高,低频响应越好:不均匀度越小, 频率均衡性能越好.
30Hz~150Hz低频使声音有一定厚度基础, 150Hz~500Hz中低频使声音有一定力度, 300Hz~500Hz中低频声压过分加强时,声 音浑浊,过分衰减时,声音乏力; 500Hz~5kHz中高频使声音有一定明亮度, 过分加强时,声音生硬;过分衰减时,声音散飘; 5kHz~10kHz高频段使声音有一定层次,色彩; 过分加强时,声音尖刺;过分衰减时,声音暗淡 发闷.
音频客观测量指标概念(全)

音频客观测量指标概念音频指标简介及测试原理方法音频指标测试均是针对有输入和输出的设备而言,就是声音信号经过了一个通道以后,输出与输入之间的差别。
两者差别越小那么性能越好,而且在一般情况下声音经过某一个通道或某一系统后,一般都有对原信号的放大和衰减。
信噪比、失真率、频率响应这三个指标是音响器材的“基础指标”或“基本特性”,我们在评价一件音响器材或者一个系统水准之前,必须先要考核这三项指标,这三项指标中的任何一项不合格,都说明该器材或者系统存在着比较重大的缺陷1、信噪比SNR(Signal to Noise Ratio):(1)简单定义:狭义来讲是指放大器的输出信号的电压与同时输出的噪声电压的比,常常用分贝数表示,设备的信噪比越高表明它产生的杂音越少。
一般来说,信噪比越大,说明混在信号里的噪声越小,声音回放的音质量越高,否则相反。
信噪比一般不应该低于70dB,高保真音箱的信噪比应达到110dB以上。
音频信噪比是指音响设备播放时,正常声音信号强度与噪声信号强度的比值(2)计算方法:信噪比的计量单位是dB,其计算方法是10LG(PS/PN),其中Ps和Pn 分别代表信号和噪声的有效功率,也可以换算成电压幅值的比率关系:20LG(VS/VN),Vs和Vn分别代表信号和噪声电压的“有效值”。
(3)测量方法:信噪比通常不是直接进行测量的,而是通过测量噪声信号的幅度换算出来的,通常的方法是:给放大器一个标准信号,通常是0.775Vrms或2Vp-p@1kHz,调整放大器的放大倍数使其达到最大不失真输出功率或幅度(失真的范围由厂家决定,通常是10%,也有1%),记下此时放大器的输出幅Vs,然后撤除输入信号,测量此时出现在输出端的噪声电压,记为Vn,再根据SNR=20LG(Vn/Vs)就可以计算出信噪比了. 或者是10LG(PS/PN),其中Ps和Pn分别代表信号和噪声的有效功率计权:这样的测量方式完全可以体现设备的性能了。
语音能力评估实验报告(3篇)

第1篇一、实验背景随着社会的发展,语音交流已成为人们日常生活和工作中不可或缺的一部分。
语音能力评估对于语言障碍患者的康复、语言教学以及语音合成技术的研究具有重要意义。
本实验旨在通过一系列语音能力评估方法,对参与者的语音能力进行全面评估,为后续的研究和教学提供数据支持。
二、实验目的1. 探讨不同语音能力评估方法在语音能力评估中的应用效果;2. 分析参与者的语音能力特点,为语音障碍患者的康复提供参考;3. 为语音教学提供依据,提高语音教学质量。
三、实验对象与方法1. 实验对象:选取30名年龄在18-25岁之间的健康志愿者作为实验对象。
2. 实验方法:(1)构音语音能力评估:采用重庆南坪惠耳听力助听器验配服务中心提供的构音语音能力评估工具,对参与者的声母音位、韵母音位和声调进行评估。
(2)普通话儿童语言能力临床分级评估表(MCELF):对参与者的词语理解能力、词语命名能力、句子理解能力、句式仿说能力、看图叙事能力等进行评估。
(3)语音障碍评估:采用语音障碍评估工具,对参与者的连续语音能力、语音轮替能力等进行评估。
四、实验结果与分析1. 构音语音能力评估结果:(1)声母音位:参与者声母音位习得情况良好,其中b、p、m、f、d、t、g、k等声母习得率较高。
(2)韵母音位:参与者韵母音位习得情况良好,其中i、u、ü、ai、ei、ao、ou等韵母习得率较高。
(3)声调:参与者声调习得情况良好,其中阴平、阳平、上声、去声习得率较高。
2. MCELF评估结果:(1)词语理解能力:参与者词语理解能力较好,能够准确理解词语的含义。
(2)词语命名能力:参与者词语命名能力较好,能够快速准确地命名词语。
(3)句子理解能力:参与者句子理解能力较好,能够准确理解句子的含义。
(4)句式仿说能力:参与者句式仿说能力较好,能够准确模仿句式。
(5)看图叙事能力:参与者看图叙事能力较好,能够根据图片内容进行连贯的叙述。
3. 语音障碍评估结果:(1)连续语音能力:参与者连续语音能力较好,能够流利地朗读句子。
tts的评估标准

tts的评估标准
TTS的评估标准包括多个方面,具体如下:
1.发音准确性:以正确发音的用例数占总用例数的比例来衡量,可
以通过计算欧式距离等参数来评估。
2.韵律准确性:以停顿可接受用例数占总用例数的比例来衡量,可
以通过众测主观判断合成语音是否可接受来评估。
3.字典覆盖率:检查语音合成系统对汉字的覆盖程度,通过TTS前
端输出工具检查是否能正常处理,并统计字典覆盖率。
4.实时率:评估合成系统工程上的测试,包括实时率(合成耗时/
语音时长)、首包响应时间(用户发出请求到用户感知到的第一包到达时间)、内存占用、CPU占用、3×24小时crash率等参数。
总的来说,TTS的评估标准是综合性的,包括多个方面,如发音准确性、韵律准确性、字典覆盖率、实时率等。
评估标准的制定和实施应根据不同的应用场景和需求进行优化和调整。
声品质的评价指标

声品质的评价指标声品质是指声音的质量和特点,是衡量声音好坏的标准之一。
在音频领域,声品质的好坏直接关系到音频设备的性能和用户体验。
声品质的评价指标主要包括音质、音色、音量、音准和音场等方面。
下面将分别介绍这些指标。
一、音质音质是指声音的质感和纯净度。
好的音质应该有丰富的音色层次、清晰的音频细节、自然的音色还原。
音质好的音频产品能够给人带来极致的听觉享受,让人感受到音乐的魅力。
二、音色音色是指声音的独特特点和个性。
不同乐器、不同人声都有各自独特的音色。
好的音色应该有层次感,能够让人分辨出不同乐器的声音,同时也要有足够的温暖感和自然感,让人感觉舒适。
三、音量音量是指声音的大小和强度。
好的音量应该能够满足不同场景下的需求,既要有足够的储备力量,又不能过大过小。
此外,音量的调节应该平稳细腻,不应有明显的跳跃感或失真。
四、音准音准是指音频的准确度和精确度。
好的音准应该能够准确还原音频信号,不产生失真、杂音或频率偏差。
音准好的音频产品能够让人感受到音乐的精彩和细腻。
五、音场音场是指声音的空间感和定位感。
好的音场应该有宽广的声场,能够让人感受到音乐的立体感和层次感。
音场好的音频产品能够为用户带来身临其境的听觉体验。
除了以上几个主要指标外,声品质的评价还可以从音频的动态范围、失真程度、信噪比等方面进行考量。
动态范围是指声音的强弱差异范围,大的动态范围可以带来更丰富的音乐表现力;失真程度是指声音失真的程度,好的声音应该尽可能还原原始音频信号;信噪比是指声音信号与噪声信号之比,高的信噪比可以提高声音的纯净度。
总结起来,声品质的评价指标包括音质、音色、音量、音准、音场等方面。
好的声品质应该具备丰富的音色层次、清晰的音频细节、自然的音色还原,同时还要有适当的音量、准确的音准和宽广的音场。
对于音频设备的用户来说,选择具有好声品质的产品可以提升音乐的欣赏体验,让人更好地享受音乐的魅力。
因此,在购买音频设备时,除了关注功能和性能外,声品质的评价指标也是需要考虑的重要因素。
心理学基本概念系列文库:言语清晰度

心理学基本概念系列——言语清晰度形而上是人类区别于动物的重要文明之一,情志,即现在所说的心理学,在人类医学有重要地位。
本文提供对心理学基本概念“言语清晰度”的解读,以供大家了解。
言语清晰度言语感知效果指标。
言语接收者正确接收的言语单位数与言语发送者发出的言语单位数的比值。
如,让被试听100个词,听对60个,言语清晰度为60%。
评价言语传递系统工作质量最直接的参数。
在两种情形下使用:(1)言语单位间的上下关系对接收者的理解不起重要作用;(2)统计的言语单位为意义不连贯的言语单位,如语音清晰度、音节清晰度等。
在汉语中,单词可懂度与音节清晰度密切相关。
主要受以下因素影响。
(1)语音强度。
强度为5分贝时,可感受到语音,但无法辨别。
随着强度的增加而增加。
强度增至20分贝~30分贝时,约为50%;增至50分贝~60分贝时,达90%~95%;从50分贝增至140分贝时,变化不大。
(2)振幅畸变。
语音波形的波峰对其影响很小,波形的中间段对其影响很大。
当语音波形的波峰缺失而中间段完好时,损失很小;但若中间段缺失,言语清晰度则严重损失。
(3)声音干扰。
噪声对语音的感知有掩蔽作用,在噪声情境下,要达到一定的清晰度,语音的强度必须增加。
一般而言,当语音强度与噪声强度相等时,言语清晰度为0.5。
(4)其他因素。
如言语的复杂程度、频率、速度、听话人的主观条件(辨音能力和注意力)等。
上述因素相互间存在复杂的协同和颉颃作用。
言语清晰度的分析用于临床,可测定人的感知阈限、超阈限的言语辨别率及听力受损、欠缺的实际程度。
参见“言语可懂度”。
语音压缩算法测评及质量评估

语音压缩算法测评及质量评估1.语音压缩的基本依据从信息保持的角度讲,只有当信源本身具有冗余度,才能对其进行压缩。
根据统计分析的结果,语音信号中存在着多种冗余度m,主要有以下几个方面:1. 幅度非均匀分布语音中小幅度样本比大幅度样本出现的概率要高。
又由于通话必然会有间隙,更出现了大It的低电平样本。
此外,实际语音信号的功率电平也趋向于出现在编码范围的较低电平端。
因此,语音信号的幅值分布是非均匀的。
2. 样本之间的相关性对语音信号的波形分析表明to,采样数据的最大相关性存在于邻近样本之间。
当采样速率为8KHz时,相邻采样值之间的相关系数大于0.85,甚至在相距十个样本之间,相关系数还有0.3左右的数it级。
如果采样速率提高,样本间的相关性将更强。
3. 周期之间的相关性虽然电话语音信号的频率分布在300-3400Hz的频带内,但在特定的瞬间,某一声音却往往只是该频带内的少数频率分I起作用。
当声音中只存在少数几个基本频率时,就会像某些振荡波形一样,在周期与周期之间存在着一定的相关性。
4. 基音之间的相关性语音可以分为清音和浊音两种基本类型.浊音是由声带振动产生,每一次振动使一股空气从肺部流进声道。
激励声道的各股空气之间的间隔称为基音周期。
浊音的波形对应于基音周期的长期重复波形。
因此,对语音浊音部分编码的有效方法之一是对一个基音周期波形进行编码,并以它作为其它基音段的模板。
此外,电话通信中还有很大的话音间隙。
通话分析表明,语音间隙约占通话时间的60%。
这本身也是一种冗余。
正是由于语音信号具有以上特点,对语音的压缩编码才成为可能。
在现今的通信系统当中,各种语音压缩编码得到了广泛的应用,并形成了一系列的语音编码标准。
语音压缩编码技术大大缓解了信道紧张的状况。
2.语音压缩技术的发展概况语音编码器的主要功能就是把用户语音的PCM(脉冲编码调制)样值编码成少量的比特(帧)。
这种方法使得语音在链路产生误码、网络抖动和突发传输时具有健壮性。
【音视频专题】音频质量评估方法那些事

【⾳视频专题】⾳频质量评估⽅法那些事今天参加了声⽹ Agora 的《实时语⾳质量监控系统的过去、现在与未来》,结合之前⼯作时⾳频处理的⼀些经验,分享⼀些⾃⼰的理解。
⾳频(泛指⼈能听到的⾃然界的所有声⾳,⼈⽿能听到声⾳的频谱范围⼀般为 20~20000HZ)和语⾳ (语⾳是指⼈说话的声⾳,⼈说话的声⾳频谱能量范围⼤部分分布在 300~3400HZ)两者是不同的,可以看出⼈是可以听到⽐⼈说话更⼴范围的声⾳的;这就是⼈可以听到像乐器,⾃然界,尖鸣声这些声⾳,但是⼈并不能发出来。
为什么要做质量评估,原因有⼏个⽅⾯,⽐如⼤家除了⾯对⾯交流,在通话,刷视频,听⾳乐等等活动中的⾳频是经过了编解码压缩处理的,是为了便于更⼩代价的传输和存储;像原始声⾳中掺杂噪声的去除,原始说话声⾳的增强处理等;可以看出不管是编解码处理还是其他语⾳处理,⽬的都是让⼈听起来更舒服,因此质量评估⽅法就是评估在对于声⾳进⾏处理后的⼈听起来的感受度情况。
⾳频评估⽅法分为主观评价和客观评价。
主观评价其实就是⼈凭借听觉感受对语⾳进⾏打分,常见的有 MOS、CMOS 和 ABX Test;像 AB TEST 在我早期的⼯作中经常使⽤到,⽐如对语⾳增强算法做了⼩的优化,想得到实际听觉的感受改善情况,就会把原始算法和优化后算法处理后的语⾳进⾏编组,让⼩伙伴们帮忙测试打分,以此判断是变优还是变差。
国际电信联盟(ITU)将语⾳质量的主观评价⽅法做了标准化处理,代号为 ITU-T P.800.1。
其中收听质量的绝对等级评分(Absolute Category Rating, ACR)是⽬前⽐较⼴泛采⽤的⼀种主观评价⽅法。
参与评测的⼈员对语⾳整体质量进⾏打分,分值范围为 1-5 分,分数越⼤表⽰语⾳质量最好。
这种 MOS 值分数后来也应⽤于客观质量评价。
⼀般 MOS 应为 4 或者更⾼的,会被认为是⽐较好的语⾳质量,⼀旦 MOS 低于 3.6,则这个语⾳质量基本不太能接受。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语言传输指数STI的简化算法
❖ 限制条件: ▪ 无明显非线性失真;环境噪声无脉冲;混响时间频率特 性平滑;宽带语言传输系统;
❖ 1)RASTI (Rapid STI or Room acoustic STI) ▪ 适用于不包括扩声系统的厅堂语音传输质量的评价 ▪ 选取了语言谱中比较有代表性的频带和调制频率
5.0Hz 5.0Hz 3.15Hz 1.0Hz 6.25Hz 4.0Hz 12.5Hz
❖ 《公共广播系统工程技术规范》 ❖ STIPA作为评价公共广播语言传输质量的重要指标
分类
业务广播 (一级)
业务广播 (二级)
业务广播 (三级)
STIPA
≥0.55 ≥0.45 ≥0.35
分类
紧急广播 (一级)
❖ 实验室录音、模拟测试的方法 ❖ 参照《声学 语言清晰度测试方法》GB-T 15508-2019 ❖ 采用了全频带白噪声和中心频率为250Hz,500Hz,1KHZ
,2KHz,4KHz,8KHz的倍频带噪声作为干扰噪声,各频 带噪声分别设置4~5种信噪比。
❖ 1) 信噪比与清晰 度、STIPA的关系 (以白噪声为例)
❖ 计算98个MTF结果 ❖ 类似AI计算中的加权平均最终得
STI [0,1] ❖ 根据房间脉冲响应可以直接计算
MTF
STI与语音清晰度
❖ 不论是噪声、带通限制、 削峰、混响等干扰因素, STI与语音清晰度得分之间 始终有着良好的一致性。
❖ 客观可测的物理参量STI能 良好的反映和预测真实的 语音清晰度水平。
0.25 0.5 1
2
4
8
噪声的中心频率/KHz
0.8
0.7
清晰度0.8
可懂度100%
0.6
0.5 清晰度0.6 可懂度95%
0.4 清晰度0.5 可懂度88%
0.3
清晰度0.4 可懂度80%
清晰度0.2
可懂度55%
0.2
0.25 0.5 1
2
4
8
噪声的中心频率/KHz
❖ 工作是在实验室条件下进行的,考虑到实际的应用情况, 可能还有一些不完善的地方,比如房间冲击响应的结构是 否会对STI-PA与清晰度的关系有明显的影响还需要探讨。 实际环境中的噪声种类多样,频率范围丰富,由于条件限 制无法一一进行测试。每个频带噪声的信噪比取值区间可 以更加细致以获得更为全面的结果。另外本次实验只是在 65dBA(标准说话声压级)的噪声水平下进行的,其它噪声 水平下的语言清晰度和STI-PA、信噪比的关系是否同本次 实验结果一致还需要进一步的研究。
LOGO
语音清晰度的客观评测
中国传媒大学 传播声学研究所 章斯宇
2019.5.21
主要内容
1 语音清晰度评测的发展概况 2 混响作用下STIPA与清晰度的关系 3 噪声环境下STIPA与清晰度的关系 4 总结与展望
1. 语音清晰度的评测
❖ 语音的清晰度或可懂度是音质评价的重要指标—反映 厅堂或扩声系统的声音传输质量
实验方法
❖ 实验室录音、模拟测试的方法 ❖ 参照《声学 语言清晰度测试方法》GB-T 15508-2019
单音节词表
混响处理器 Reveber4000
录音间
录音、控制、处 理、回放中心
测听室
Ivie IE-35 STI-PA
❖ 混响时间:0.5 s~6.0 s,步长0.5 s,共12种混响条件; ❖ 发音人2名,听音人11名;声场中心声压级65dBA; ❖ 中、后音节受混响作用更明显;
❖ French & Steinberg(1947),Fletcher(1953), Kryter(1962) ▪ 1) 测量或估计语言频谱和听音人处的噪声有效掩蔽谱计算 得到各频带的“有效信噪比”; ▪ 2) 对各频带信噪比进行线性转化至[0,1]得“贡献值”; ▪ 3) 基于不同频带对清晰度的贡献率加权平均得AI;
❖ 实验结果也揭示出汉语普通话单音节清晰度受混响的影响 与英语清晰度受混响的影响程度有明显的不同。启示我们 在实际工程应用中,在涉及到普通话语音清晰度的评测问 题时,对直接引用已有的国际标准或基于外语的研究结果 要十分慎重。
themegallery
3.噪声条件下STIPA与汉语清晰度的关系
❖ 在实验室条件下分析了不同频带范围、不同信噪比的噪声 环境下语音清晰度、STI-PA与信噪比的关系,并根据单音 节清晰度与语言可懂度的关系,估计了在满足一定可懂度 条件下的最低信噪比及相应的STI-PA。
▪ 根据大量的实地测量和清晰度主观评价测试的结果, Peutz发现%ALcon与房间的声学特性相关。
Peutz 公式(经验推导)
%ALcon(200D V2T602a)% DDc
(9T60a)%
DDc
D—听音处距声源的距离。单位m。
➢注意: SNR>25dB; 单个无指向性的 点声源(Q=1);
T60—混响时间(1400Hz)。单位s。 V—房间的体积。单位m3。
(9T60a)%
DDc
虽然提高扬声器的Q值有助 于改善语音清晰度,但Q值 与清晰度之间是否成简单 的线性关系并没有实际的 实验数据支持。 Jacob(1985)认为语音清晰 度与Q并无直接的关联。
辅音损失率%ALcon的不足
▪ 根据实验结果的经验推导, 物理基础不够;
▪ 对于信噪比低于25dB的情况 估计不足,不能充分反映噪 声和混响联合作用时的影响;
500Hz 1Hz 2Hz 4Hz 8Hz
2KHz 0.7Hz 1.4Hz 2.8Hz 5.6Hz 11.2Hz
❖ 2)STIPA (STI for public address) ▪ 适用于包括扩声系统的厅堂或电声系统的语音传输质量 评价 ▪ 选取了7种倍频带载波,每种载波对应2中调制频率
125Hz 250Hz 500Hz 1KHz 2KHz 4KHz 8KHz 1.0Hz 1.0Hz 0.63Hz 2.0Hz 1.25Hz 0.8Hz 2.5Hz
1.00
0.80
0.60
前Hale Waihona Puke 中0.40后
0.20
0.00 声母
韵母
声调
音节
实验结果
❖ 混响时间与清晰度、STIPA的关系
0.650 0.600 0.550 0.500 0.450 0.400 0.350 0.300 0.250 0.200 0.150
0.0 1.0 2.0 3.0 4.0 5.0 6.0 RT sec.
STI-PA Clarity
❖ STIPA与普通话单音节清晰度的关系
Clarity
1
0.9
0.8
0.7
0.6
0.5
0.4
C0.43S7 2 60.56S2
0.3
0.2
0.1
0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 STI-PA
❖ 在实验结果的基础上归纳导出了STI-PA与普通话单音节清 晰度之间的关系,此关系对制定扩声系统的STI-PA指标具 有实用意义。
❖ 主观评价: 组织测试队伍实地测试(articulation test) ▪ 优点: 直接、真实 ▪ 缺点: 耗费人力物力
❖ GB-T 15508-2019 《声学 语言清晰度测试方法》
语音清晰度的客观评价方法
主观 测试
AI
❖ 尽可能反映真实 的清晰度水平
%ALcon
STI
清晰度指数 AI (Articulation Index)
ɑ—校准值。针对不同水平的听者。1.5%~12.5%。
Dc—临界距离。单位m。
Dc 0.20
V T60
Klein对Peutz公式的补充
❖ 当房间声学特性难以改善时,采用电声手段提高语音清晰度。 ❖ 声源个数n;声源指向性因子Q;
Dc 0.20
V Q T60 n
%ALcon(200VD2Q T602na)% DDc
▪ 没有考虑早期反射声,单次 回响的作用,且结果仅给出 某个频带的清晰度水平,未 考虑参数的频率特性的影响;
Jacob(1985)
语言传输指数STI (speech transmission index)
❖ Hougast & Steeneken (1973\1980\1985) ❖ IEC Std. 60268-16 ❖ 充分反映声传递系统性能质量的优劣
❖ ANSI Std. S3.5-1969\1986\2019 ❖ 特点:特别适用于评价诸如噪声干扰、有限带通等频域失真引
起的语音清晰度恶化程度,不能反映混响、回声或削峰等时域 或非线性失真的影响。
辅音损失率 %ALcon (articulation loss of consonants)
❖ 能不能根据测量房间内的某些物理量估计语音清晰度? ❖ Knudsen(1932), Peutz(1971), Klein(1971)
紧急广播 (二级)
紧急广播 (三级)
STIPA
≥0.55 ≥0.45 ≥0.40
2.混响作用下STIPA与汉语清晰度的关系
❖ 对于“声韵调”结构语言—汉语,情况是怎样的?
❖ 目的:在实验室条件下对无噪声纯混响作用下STI-PA与普 通话单音节清晰度之间的关系进行实验研究。以期对搞清 楚在纯混响作用下普通话单音节清晰度与语言传输指数 STI-PA的具体关系有所贡献和帮助。对汉语语音清晰度客 观评测方法的发展有着积极的意义。
清晰度和STI-PA 清晰度和STI-PA
实验结果
男声
女声
1
1
清晰度
清晰度
0.9
清晰度与信噪比拟合
0.9
清晰度与信噪比拟合
STI-PA