不同情感的语音声学特征分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语音的共振峰频率特征、共振峰走向特征、音节的过渡特征、基频曲线特征以及振幅曲线特征,分析比对不同情感的语音声学特征的
相似性和差异性。分析结果表明,同一说话人在不同情感下的语音声学特征的共振峰走向特征相似度高,共振峰频率、基频曲线及
振幅曲线特征存在非本质差异,是个体自身的差异。对不同情感的语音进行声学特征分析可以为语音情感识别奠定基础。
(Criminal Investigation Police University of China, Shenyang 110854, China)
Abstract: The influence of speaker's emotional factors on speech features is studied. The speech features of the same person such as voice formant frequency characteristics, formant trend characteristics, syllable transition characteristics, fundamental frequency curve characteristics and amplitude curve characteristics under six emotions such as anger, fear, happiness, neutrality, surprise and sadness are chosen. The similarities and differences of voice acoustic characteristics of different emotions are analyzed and compared. The results show that the similarity of for⁃ mant orientation characteristics of the same person's speech acoustic characteristics under different emotions is high, and there are some differences in formant frequency, fundamental frequency curve and amplitude curve char⁃ acteristics, which are non-essential differences, and are individual differences. Acoustic characteristics analysis of speech with different emotions can lay a foundation for speech emotion recognition.
选择 CASIA 汉语情感语料库中生气、害怕、高 兴、中性、惊讶、悲伤六种情感语音的共振峰频率特 征、共振峰走向特征、音节间的过渡特征、音节内的 过渡特征、基频曲线特征以及振幅曲线特征进行语 音声学特征分析。通过对同一人的相同文本在不 同情感下的语音进行声学特征差异性分析,得出不 同情感下语音的共振峰动态走向特征、音节内过渡 特征和音节间过渡特征稳定性较高,共振峰频率特 征、基频曲线特征和振幅曲线特征稳定性较低的 结论。
第 34 卷第 5 期 2019 年 10 月
·信号与信息处理·
光电技术应用
ELECTRO-OPTIC TECHNOLOGY APPLICATION
Vol.34,No.5 October,2019
不同情感的语音声学特征分析
任 杰,郭 卉,姜 囡
(中国刑事警察学院,沈阳 110854)
摘 要:针对说话人情感因素对语音特征的影响进行研究分析,选择同一个人在生气、害怕、高兴、中性、惊讶、悲伤六种情感下
Key words: acoustic characteristics; variation analysis; emotion; formant
在生活中,人类的情感表达主要通过表情、语 音、动作等方式,语音作为其中直观获取情感信息 的载体,人们在交流过程中通过言语传递的信息, 可以将说话人当时所处情感状态表达出来。语音 情感识别技术将成为未来人机智能交互系统中不 可或缺的一部分,随着语音情感识别技术的发展, 语音情感识别的相关理论研究也不断成熟。但是 在进行语音情感识别时,特征的选择直接影响了识
32
光电技术应用
第 34 卷
峰构造的特征和平静时期的语音特征比对,发现所 选择的特征在分辨情感语音有着明显的作用,频 谱、能量、基音频率对于分辨悲伤情感效果很好。 文献[4-6]提出语音特征和韵律特征相结合才能表 达情感,韵律特征参数的变化是语音信号中情感信 息的主要体现,语音信号情感特征的参数,包括韵 律特征的参数、韵律特征结合语音学特征的参数; 张雪英等认为语音声学特征包括韵律学特征、基于 谱的特征和音质特征,其中梅尔倒谱系数(MFCC)在 情感识别中表现的性能最优[7]。文献[8]将语音特征 分为韵律特征和基于谱特征的基础上,提出将语音 情感特征分为个性化特征和非个性化特征。
别的效果,对于不同情感的语音声学特征分析可以 对特征进行更好的筛选[1-2]。
目前对于语音情感理论的研究不断进步,国内 语音情感特征研究处于起步阶段,没有具体标准, 选用语音信号中的情感特征包括:时间构造、振幅 构造、基频构造和共振峰构造的特征,分析了不同 语音情感特征的分布规律[3]。张立华等人进行情感 分析时选择时间构造、能量构造、基频构造和共振
收稿日期:2019-07-19 基金项目:辽宁省教育厅科学研究项目(L2015198);辽宁省自然科学基金项目;中国刑事警察学院博士科研启动项目(D2017022);中国刑警警 察学院教研项目(2018QNZX19) 作者简介:任杰(1995-),男,陕西黄陵人,硕士研究生,主要研究方向为视听资料检验技术.
关键词:声学特征;变异分析;情感;共振峰中图分类号:TP391
文献标识码:A
文章编号:1673-1255(2019)-05-0031-06
Analysis of Speech Acoustic Characteristics of Different Emotions
REN Jie, GUO Hui, JIANG Nan