面向智能机器人的Teager语音情感交互系统设计与实现

合集下载

智能语音交互系统设计及其实践

智能语音交互系统设计及其实践

智能语音交互系统设计及其实践随着人工智能技术的发展,智能语音交互系统已经成为了我们日常生活中普及的一种方式。

我们通过各种智能设备来和语音交互系统进行交互,让我们的生活变得更加便利和智能。

在智能语音交互系统的设计和实践中,主要涉及到以下几个方面。

一、语音识别技术作为智能语音交互系统的核心技术,语音识别技术的准确率和速度对整个系统的正常运转起着决定性的作用。

目前,国内外的厂商和研究机构已经发展出了各种不同的语音识别技术,比如基于深度学习的语音识别技术、基于语言模型的语音识别技术等等。

在实际应用中,我们需要根据实际场景和需求来选择不同的语音识别技术,并不断进行优化和改进,提高系统的准确率和速度。

二、语音合成技术语音合成技术是将计算机生成的文字转化为语音的技术,它的实现过程包括语音合成引擎的设计和语音库的搭建。

在语音合成技术的研究和实践中,我们需要考虑到不同语言和方言的差异,以及语音合成引擎的自然度和可读性等问题。

在实际应用中,我们可以根据不同的需求和场景来选择不同的语音合成技术,并进行定制化的开发和优化。

三、语音交互设计语音交互设计是指将语音识别和语音合成技术应用于实际场景中,让人机交互更加自然和便捷的设计过程。

在语音交互设计中,我们需要考虑到用户的习惯和需求,采用合适的语音交互方式和交互模式,保证系统的易用性和用户体验。

四、场景应用智能语音交互系统的实践过程中,我们需要将系统应用于不同的场景中,比如家庭智能、智能客服、智能驾驶等等。

在不同场景中,我们需要设计不同的交互方式和交互模式,以便实现更好的用户体验和用户满意度。

综上所述,智能语音交互系统的设计和实践过程是一个复杂的系统工程,需要相关技术的综合应用和不断的优化改进。

在未来的发展中,智能语音交互系统将成为我们日常生活中不可或缺的一部分,为人们带来更多的便利和智能化的服务。

基于人工智能的语音交互系统设计与实现

基于人工智能的语音交互系统设计与实现

基于人工智能的语音交互系统设计与实现一、绪论随着人工智能技术的快速发展,人工智能在语音交互领域也得到了广泛应用。

基于人工智能的语音交互系统能够更加方便、快捷、智能地与用户交互,解决了传统交互方式中需要手动操作的局限性,也使得人与计算机之间的交互更加自然。

本文旨在讨论如何基于人工智能技术设计和实现语音交互系统。

二、语音自然语言处理技术语音自然语言处理技术是基于人工智能技术和计算机语言学技术的交叉学科,它将计算机语言学与语音信号处理相结合,实现自然语言的语音输入和输出。

主要技术包括语音识别、语音合成、情感分析、实体识别等。

2.1 语音识别语音识别技术是将语音转换为文字的过程。

它需要通过分析声波信号的波峰和波谷,并将之转换为数字信号,通过计算机算法判断最有可能的文字输出。

语音识别技术的应用场景很广,如智能家居、智能客服等。

2.2 语音合成语音合成技术是通过计算机算法将文字转换成语音的过程。

它需要依靠自然语言处理技术,将文本进行断句、分词等处理,然后根据文本内容进行音色、语速等参数的设置。

语音合成技术的应用场景很广,如朗读笔、智能机器人等。

2.3 情感分析情感分析技术是通过分析语音中的情感信息,进行情感分类和情感程度分析的过程。

它需要依靠自然语言处理技术,将语音信号转换为文本,并识别文本中的情感标识。

情感分析技术的应用场景很广,如客户服务、情感识别等。

2.4 实体识别实体识别技术是通过自然语言处理技术,识别并提取语音信号中的命名实体。

命名实体可以是人名、地名、组织名等,通过识别命名实体可以实现更加精准的语音交互。

三、语音交互系统的设计与实现基于人工智能技术的语音交互系统主要包括语音输入、语音处理、语音输出三个环节。

下面将分别介绍这些环节的细节问题。

3.1 语音输入语音输入是语音交互系统的第一环节,它需要采用语音识别技术,将语音信号转换为文本输入。

语音识别技术必须准确性高、对各种语音信号都能够适应,并能够自适应用户的模式。

智能语音智能交互系统设计与实现

智能语音智能交互系统设计与实现

智能语音智能交互系统设计与实现随着人工智能技术的逐渐成熟,人类与智能机器的交互也变得更加智能化,智能语音交互系统也应运而生。

智能语音交互系统能够通过人类语音的输入来实现与人的交互,实现智能家居、智能机器人、智能客服等各种智能场景下的应用。

本文将着重探讨智能语音交互系统的设计与实现。

一、智能语音交互系统设计1.需求分析在进行智能语音交互系统的设计前,首要的任务是进行需求分析,确定系统的应用场景和主要功能模块。

例如,对于智能家居,智能语音交互系统需要支持语音控制家电、监控安全等功能;对于智能机器人,智能语音交互系统需要支持语音指令控制机器人的移动、工作等操作;对于智能客服,智能语音交互系统需要支持正确识别用户的意图,提供精准的答案等功能。

通过需求分析,可以明确系统的基本需求,为接下来的设计和实现提供指导和依据。

2.语音识别智能语音交互系统的核心在于语音识别技术。

语音识别技术是将人类的语音信号转化成计算机可以识别和处理的数字信号。

在设计智能语音交互系统时,需要选取合适的语音识别引擎,并进行语音信号的预处理(如语音增强、噪声抑制等),以提高语音识别的准确率。

此外,为了提高系统的语音识别能力,还需要进行语音数据库的搜集和建模。

3.自然语言处理智能语音交互系统还需要支持自然语言处理技术,以理解人类的语言表达。

自然语言处理技术主要包括语言模型、分词、词性标注、句法分析、语义分析、情感分析等。

这些技术可以对用户的语音指令进行深度解析,并转化成计算机可以识别和处理的指令,实现语音交互的目的。

4.对话管理智能语音交互系统还需要支持对话管理技术,即对话历史的记录、情境的分析和选择、答案的生成和分发等。

在对话管理中,还需要考虑到系统的用户体验,提供友好、自然的对话界面,从而提升用户的满意度和系统的使用率。

二、智能语音交互系统实现1.语音识别模块语音识别模块是智能语音交互系统的核心模块。

常见的语音识别引擎有讯飞语音、百度语音、腾讯AI等。

机器人语音交互系统设计与实现

机器人语音交互系统设计与实现

机器人语音交互系统设计与实现随着科技的不断发展,机器人技术也得到了越来越广泛的应用。

机器人不仅可以用于生产制造、医疗保健等领域,还能够广泛应用于日常生活中。

机器人语音交互系统是机器人应用的重要组成部分之一,因为它能够提高机器人与人类交互的效率和实用性。

本文将探讨如何设计和实现机器人语音交互系统。

一、机器人语音交互系统的基本原理机器人语音交互系统是指机器人通过语音识别、语音合成等技术与人类进行语音交互的系统,其主要原理是将人类的语音输入转换为机器能够识别的数字信号,并且将机器的输出转换为人类能够理解的声音信号。

为了实现这个目标,机器人语音交互系统需要有很多复杂的技术支持。

二、机器人语音交互系统的技术架构机器人语音交互系统的技术架构主要包括以下几个方面:1. 语音输入模块:该模块包括麦克风、录音机等设备,它们能够将人类的语音输入转换为机器可以识别的数字信号。

2. 语音识别模块:该模块是机器人语音交互系统的核心技术之一。

它能够将数字信号转换为机器可识别的语音信号,并且通过语音识别算法将语音信号转化为文字或命令,以实现机器人的控制。

3. 对话管理模块:该模块包括对话管理器、对话策略生成器等,能够根据用户输入的命令和语句,对机器人进行指令执行和反馈信息的管理。

4. 语音合成模块:该模块是将机器的输出转换为人类可以理解的声音信号的重要组成部分。

它能够通过文本转语音技术,将机器人的反馈信息转化为语音信号,从而进行语音交互。

5. 数据存储模块:该模块主要用于存储用户数据和系统数据,通过数据处理技术可以提高机器人语音交互系统的智能化和个性化。

三、机器人语音交互系统的关键技术机器人语音交互系统的关键技术主要包括语音识别、语音合成、自然语言处理等。

这些技术能够使机器人与人类之间的语音交互更加顺畅、便利和智能化。

1. 语音识别技术语音识别技术是机器人语音交互系统的核心技术之一,是将人类的语音输入转换为机器可以识别的数字信号的重要技术。

智能语音交互系统设计与实现

智能语音交互系统设计与实现

智能语音交互系统设计与实现智能语音交互系统是一种可以使机器和人类进行自然、无缝对话的技术。

它通过语音识别、自然语言理解和语音合成等技术,实现人机之间的智能交互。

本文将为您介绍智能语音交互系统的设计与实现原理。

一、智能语音交互系统的设计原理智能语音交互系统的设计过程主要包括以下几个步骤:1. 语音输入:用户通过麦克风或其他语音输入设备向系统输入语音指令、问题或对话内容。

2. 语音识别:系统使用语音识别技术将语音输入转化为文字形式,从而使计算机能够理解用户的语音指令。

3. 自然语言理解:系统使用自然语言处理技术对语音识别结果进行分析和理解,将用户的语音指令转化为计算机能够理解的命令或问题。

4. 信息检索和推理:系统根据用户的指令或问题,通过信息检索和推理技术获取相应的信息或提供相应的答案。

5. 语音合成:系统使用语音合成技术将计算机生成的文字结果转化为语音输出,从而使用户能够听到计算机的回答或反馈。

6. 交互界面设计:系统设计人机交互界面,使用户可以通过界面与系统进行交互,如通过按键、手势等方式。

二、智能语音交互系统的实现步骤以下是智能语音交互系统的具体实现步骤:1. 数据准备:收集并整理大量的语音训练数据和语料库数据,包括不同口音、音频质量、语言风格等。

2. 语音识别模型训练:使用机器学习技术,基于准备好的语音数据训练语音识别模型,使其能够准确地将语音转化为文字。

3. 自然语言理解模型训练:使用自然语言处理技术,基于准备好的语料库数据训练自然语言理解模型,使其能够理解用户的语义意图。

4. 信息检索和推理模块设计:根据用户的不同需求,设计相应的信息检索和推理模块,使系统能够根据用户的指令获取相关信息或提供正确答案。

5. 语音合成模块设计:根据语音合成技术,设计合适的语音合成模块,使系统能够将文字结果转化为自然流畅的语音输出。

6. 交互界面设计与开发:根据用户需求和系统功能,设计直观、友好的交互界面,并进行相应的开发工作,实现用户与系统之间的交互。

基于人工智能的情感服务系统设计与实现

基于人工智能的情感服务系统设计与实现

基于人工智能的情感服务系统设计与实现人工智能的发展已经让许多传统行业焕发出新的生机,其中,基于人工智能的情感服务系统是近年来备受关注的一个重要领域。

这一系统可以通过机器学习和自然语言处理等技术,帮助用户更好地了解自己的情绪变化,并提供针对性的情感支持与建议,对于提高人们的情感健康,具有十分重要的意义。

首先,人工智能情感服务系统的设计需要考虑到用户的需求和情感特征。

为了达到这一目的,系统需要采集用户的情感信息,包括情感表达、语言语调、语言节奏等方面,并对这些数据进行挖掘和分析。

在此基础上,系统可以通过深度学习等技术,建立用户情感状态的模型,增强情感识别与分类的准确率,为用户提供更为精准的情感支持。

其次,基于人工智能的情感服务系统在实现过程中需要注意到一系列技术问题。

首先,情感数据的采集、存储与处理需要保护用户隐私,因此需要采用安全的技术手段。

其次,系统的算法需要不断进行迭代和更新,以适应用户的情感变化和多样性需求。

最后,情感服务系统的推广需要考虑到多方面的因素,包括价值主张的明确、情感支持的有效性证明、用户反馈的持续改进等。

在基于人工智能的情感服务系统中,人工智能技术的应用不仅可以提高情感支持的精准度,还可以扩大服务的范围与深度。

例如,在此系统中,可以加入情感支持交流社区,让用户互动交流、分享经验,增强情感共鸣和互助。

此外,系统也可以与其他情感支持机构或医疗资源进行衔接,为用户提供更为全面和系统性的情感支持,从而更好地照顾到用户的健康需求。

综合来看,基于人工智能的情感服务系统的设计与实现需要充分考虑情感特征和用户需求,并把握好技术和推广的平衡。

随着人工智能技术越来越成熟,这一系统的应用也必将达到愈加广泛和深入的程度,为我们改善情感体验和生活品质带来更多的可能性。

面向智能机器人的 Teager 语音情感 交互系统设计与实现

面向智能机器人的 Teager 语音情感 交互系统设计与实现

第34卷第8期2013年8月仪器仪表学报Chinese Journal of Scientific InstrumentVol.34No.8Aug.2013收稿日期:2013-01Received Date :2013-01*基金项目:机器人技术与系统国家重点实验室开放基金项目(SKLS-2009-MS-10)资助面向智能机器人的Teager 语音情感交互系统设计与实现*李翔1,李昕1,2,胡晨1,卢夏衍1(1.上海大学机电工程与自动化学院上海200072;2.哈尔滨工业大学机器人技术与系统国家重点实验室哈尔滨150001)摘要:自从Maragos 首先提出了Teager 能量算子(TEO )后,该算子得到了一系列应用。

Teager 能量算子的非线性特性,使之能在抑制背景噪声的同时进行信号特征的有效提取。

它还保留了倒谱分析方法中的准稳态假设,因而更能有效地表征语音信号的复杂性。

探索了基于Teager 能量算子的非线性特征对于区分情感语音的有效性,并且进一步将其和普通的声学参数和音质参数相结合,以应用于语音情感的识别中。

以HMM 和GMM 为分类器,选取7种情感设计了4组对比实验,达到最高85%的识别正确率。

实验结果表明,将传统的语音情感特征和Teager 能量算子的非线性特征相结合,能显著地提高语音情感识别系统的性能。

在此基础上,提出了智能情感机器人进行情感交互的框架,设计实现了智能服务机器人的情感交互系统,经过实时情感交互实验验证,该智能服务机器人可以很好地与交互对象进行简单的情感交流。

关键词:Teager 能量算子;非线性特征;智能机器人;语音情感交互系统中图分类号:TP391.42文献标识码:A国家标准学科分类代码:520.20Design and implementation of speech emotion interactionsystem based on Teager for intelligent robotLi Xiang 1,Li Xin 1,2,Hu Chen 1,Lu Xiayan 1(1.School of Mechatronic Engineering &Automation ,Shanghai University ,Shanghai 200072,China ;2.State Key Laboratory of Robotics and System ,Harbin Institute of Technology ,Harbin 150001,China )Abstract :Since Maragos firstly put forward the Teager energy operator (TEO ),the operator has got a series of appli-cations.The nonlinear characteristics of the Teager energy operator can effectively extract signal feature while inhibi-ting background noise at the same time.It also retains the quasi steady state assumption in cepstrum analysis method ,and can more effectively represent the complexity of the speech signal.This paper discusses the validity of distinguis-hing emotional speech based on the nonlinear features of Teager energy operator ,and combines the nonlinear featureswith traditional acoustic parameters and voice quality parameters ,which are applied to speech emotion recognition.The HMM and GMM were used as the classifiers ,seven kinds of emotion status were selected to design 4groups of comparative experiments ,and the highest recognition rate of 85%was achieved.The experimental results indicate that combining the nonlinear characteristic of the Teager energy operator with traditional emotional speech features can improve the performance of speech emotion recognition system remarkably.On this basis ,this paper puts forward the framework of intelligent emotional robot making emotional interaction ,designs and realizes the intelligent service robot emotional interaction system.Through real-time emotional interaction experiment verification ,this intelligentservice robot can make simple emotional communication with interactive objects.Keywords :Teager energy operator ;nonlinear feature ;intelligent robot ;emotional speech interaction system第8期李翔等:面向智能机器人的Teager语音情感交互系统设计与实现18271引言随着机器人技术日臻成熟,智能服务机器人取得令人鼓舞的成就。

智能语音交互系统的设计和实现

智能语音交互系统的设计和实现

智能语音交互系统的设计和实现近年来,智能语音交互系统已成为人工智能领域的热门研究方向。

这种系统能够通过人与机器之间的语音交互,进行信息检索、任务完成、设备控制、语音合成等多种功能。

本文将探讨智能语音交互系统的设计和实现。

一、智能语音交互系统的基本原理智能语音交互系统的核心是语音识别技术。

该技术通过将语音信号转换为文本,以便计算机能够理解和处理。

常用的识别方法包括模板匹配、统计模型和神经网络。

其中,神经网络技术在语音识别领域中表现优异,在大规模语音数据上进行训练,能够取得高精度。

在语音识别的基础上,智能语音交互系统还需要进行自然语言理解与生成。

自然语言理解是指将自然语言转换为与计算机交互的符号语言,而自然语言生成则是将计算机生成的符号语言转换为自然语言,供人类理解。

这些技术的综合应用,才能实现真正的智能语音交互。

二、智能语音交互系统的应用智能语音交互系统的应用非常广泛。

举个例子,大家熟知的智能音箱,就是其中一种应用。

通过语音交互,用户可以实现音乐播放、天气查询、闹钟设置、智能家居控制等多种功能。

除此之外,智能语音交互系统还可应用于医疗领域、教育领域、金融领域等多个领域。

在医疗领域,可以通过语音交互实现病历记录、诊断辅助、病情监测等功能;在教育领域,可以设计语音交互学习应用,帮助学生学习和记忆;在金融领域,智能语音交互可以实现理财投资、自动客服等功能。

三、智能语音交互系统的设计与实现智能语音交互系统的设计与实现,包含以下几个关键步骤:1.语音采集:采集用户的语音输入,可以使用单麦克风、双麦克风和阵列麦克风等不同类型的麦克风。

2.信号预处理:对采集到的语音信号进行去噪、语音分割和特征提取等处理,以便进行后续的语音识别。

3.语音识别:通过对语音信号进行分析和匹配,将其转换为文本,可以使用语音识别引擎。

4.自然语言理解:将转换后的文本进行解析和分析,以识别用户的意图和需求。

可以使用自然语言处理技术实现。

5.应答生成:根据用户的意图和需求,生成相应的回答,可以使用自然语言生成技术实现。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

等…1语音学特征,使得韵律学特征与语音学特征结合识 别情感。虽然世界各国的研究人员在语音情感研究的领 域取得了许多研究成果,但是如果将所有的这些成果放 在一起比较,可以发现大部分的研究人员都是采用韵律 特征或者韵律特征的线性组合与变换作为研究对 象¨。“1。不过,还是有少数研究人员提出了一些新的特 征参数作为研究对象,比如Guojun Zhou等人¨副就基于 能量的基础上,提出了基于Teager能量算子(teager
to
with traditional acoustic parameters and voice quality parameters,which are applied The HMM and GMM
were
speech emotion
to
recognition.
used
as
the classifiers,seven kinds of emotion
采样点用式(2)计算TEO,然后计算FFTr,进而求得功率 谱。对谱值进行Mel频域带通滤波(滤波器个数为24); 对Mel频域滤波器组的输出求自然对数和离散余弦变 (DCT),从而得到12阶的TEO非线性MFCC特征参数
interaction,designs
and realizes the intelligent service
robot emotional interaction system.Through real-time emotional interaction experiment verification,this intelligent service robot
can
make simple emotional communication with interactive
objects.
Keywords:Teager energy operator;nonlinear feature;intelligent robot;emotional speech interaction system
在使用汉语语音的条件下,识别悲伤和生气、平静、欢快 4种情绪。结果证实结合非线性TEO的识别特征NFD—来自万方数据1828
仪器仪表学报
第3 4卷
调幅(AM)信号的幅包络和调频(FM)信号的瞬时频率 的变化非常敏感,而且对不同类型的信号能清晰显示不 同的'lEO结果瞄o。Teager和Kaiser提出了非线性能量 算子的连续形式:
coefficient,MFCC)等
共几百个特征。Murray等人总结了基频、能量、时长等韵 律特征,得出了语音音质特征与情感之间的定性关 系¨…,使得韵律学特征成为语音情感识别的常用特征。 此后,研究者加入共振峰参数来表征语音音质特征,利用 线性预测编码(1inear
predictive coding,LPC)、Mel MFCC
第34卷第8期 2013年8月






V01.34 No.8 Aug.2013
Chinese Joumal of Scientific Instrument
面向智能机器人的Teager语音情感 交互系统设计与实现
李翔1,李 昕1”,胡晨1,卢夏衍1
(1.上海大学机电工程与自动化学院上海200072;2.哈尔滨工业大学机器人技术与系统国家重点实验室哈尔滨150001)
extract
signal feature while inhibi—
at
the same time.It also retains the quasi steady
state
assumption in cepstrum
analysis
method,
more effectively represent the complexity of the speech
摘要:自从Maragos首先提出了Teager能量算子(TEO)后,该算子得到了一系列应用。Teager能量算子的非线性特性,使之 能在抑制背景噪声的同时进行信号特征的有效提取。它还保留了倒谱分析方法中的准稳态假设,因而更能有效地表征语音信 号的复杂性。探索了基于Teager能量算子的非线性特征对于区分情感语音的有效性,并且进一步将其和普通的声学参数和音 质参数相结合,以应用于语音情感的识别中。以HMM和GMM为分类器,选取7种情感设计了4组对比实验,达到最高85%的 识别正确率。实验结果表明,将传统的语音情感特征和Teager能量算子的非线性特征相结合,能显著地提高语音情感识别系统 的性能。在此基础上,提出了智能情感机器人进行情感交互的框架,设计实现了智能服务机器人的情感交互系统,经过实时情 感交互实验验证,该智能服务机器人可以很好地与交互对象进行简单的情感交流。 关键词:Teager能量算子;非线性特征;智能机器人;语音情感交互系统 中图分类号:TF391.42 文献标识码:A 国家标准学科分类代码:520.20



德祥等人H引利用Teager能量算子计算语音信号本征模
态函数的瞬时能量,并对本征模态函数进行系数——峭
随着机器人技术日臻成熟,智能服务机器人取得令 人鼓舞的成就。本田公司开发的ASIMO机器人,可以行 走自如,并可以随着音乐翩翩起舞。日本东京大学研制 的“HRP-2”智能家庭服务机器人可以为人们端茶递水。 在工业及日常生活中,机器人也被广泛地应用,如照顾伤 残人士及老弱病人。随着智能服务机器人的发展,人机 交互(human—robot interaction,HRI)已经成为机器人科学 和机电一体化领域的重要研究课题’1…。语音交流作为 人机交互的主要方式之一,不但能表达语义,还能传递情 感信息。在消除人与机器人之间的障碍,实现智能服务 机器人的智能化研究过程中,语音的情感识别变成关键 技术,这也成为智能服务机器人领域的研究课题之一。 智能服务机器人的人机交互系统有很大的应用潜 力,语音交互在其中发挥了巨大的作用p’4,,例如家庭管 家机器人u1、佣人机器人Srikandi∞1、移动机器人"…。它 们只需用语音命令操作就能实现控制,以便对机器人或 者计算机了解很少的人使用。 语音情感识别是人机交互和情感计算∽o两大研究方 向的重要领域之一。大量研究显示,语音包含了大量体 现情感信息的特征参数,包括基频、能量、共振峰频率、频 率倒谱系数(Mel
收稿日期:2013-01
Received Date:2013-01
+基金项目:机器人技术与系统国家重点实验室开放基金项目(SKLS-2009-MS一10)资助
万方数据
第8期
李翔等:面向智能机器人的Teager语音情感交互系统设计与实现
M el、AF_M el、DAF M
1827
el可有效提高情绪识别性能。张
on
signal.This
paper discusses the validity of distinguis—
hing emotional speech based
the nonlinear features of Teager energy operator,and combines the nonlinear features
2情感特征参数的选取
2.1传统的声学参数及音质参数 情感特征的优劣直接影响到情感最终识别结果的好 坏。Tato从“激发维(Arousal)一评价维(Valence)一强度维 (Power)”的三维空间情感模型指出,如果提取出反映的 情感维数越多的情感特征信息,那么就越能更好地区分 情感。Pereira等人¨引的研究表明语音信号的韵律特征 同3个情感维度之间具有一定的相关性,其中唤醒度和 韵律特征之间的相关性明显。Gobl、Johnstone、Pereira等 人Ⅲ。的研究证明语音信号中的音质特征在能够很好地 表达三维中的“评价维”信息的基础上,还能够部分地反 映三维空间情感模型中的“强度维”信息。在证实了 Pereira的研究成果的基础上,赵艳等人口u对共振峰等音 质类特征进行进一步的研究,发现共振峰等音质类特征 与效价维的相关性较强。因此,根据Cowie等人m’的研 究结果,为了更好地识别情感,在提取基本的韵律特征参 数的同时,本文也考虑与语音的音质特征参数相结合。
2.State Key Laboratory
ofRobotws
and System,Harbin Institute
ofTechnology,Harbin 150001,China)
Abstract:Since Maragos firstly put forward the Teager energy
gY
enev
提取短时能量(E)、过零率(r)、基频(册)及其1、2阶差
分、MFCC及其1、2阶差分作为韵律参数,第1、第2、第3 共振峰(F1、F2、F3)作为音质参数,将其结合用于TEO 非线性特征的对比实验中。
2.2
operator,TEO)的特征在非线性领域的研究,他们的实
TEO的非线性特征参数 传统的线性声学理论认为来自声带的气流在声道内
frequency cepstrM
度计算,提取信号的统计特征信息用于语音信号的端点 检测,取得了良好的效果。但是目前还没有基于Teager 能量算子的非线性特征和普通的声学参数和音质参数相 结合的专门研究,因此还不足以说明TEO非线性特征对 于情感识别的效果。 本文在TEO基频和基于时域TEO的Mel倒谱系数 的基础上,加入了对于频域TEO的Mel倒谱系数的研 究,并且将TEO的非线性特征和普通的情感特征相结 合,以探索在多特征向量下基于TEO的非线性特征对语 音情感识别的有效性。
operator(TEO),the
can
operator has got

series of appli-
cations.The nonlinear characteristics of the Teager energy operator ting background noise and
相关文档
最新文档