基于情感特征分类的语音情感识别研究

合集下载

基于情感计算的情感分类模型研究

基于情感计算的情感分类模型研究

基于情感计算的情感分类模型研究情感计算是人工智能领域中的一个重要研究方向,旨在通过计算机自动分析文本或语音中的情感信息。

情感分类是情感计算中的一个关键任务,它的目标是将给定的文本或语音数据分类为积极、消极或中性等情感类别之一。

本文将探讨基于情感计算的情感分类模型的研究进展和应用。

在过去的几年中,随着自然语言处理技术的不断发展,基于情感计算的情感分类模型逐渐成为研究热点。

这些模型通常利用机器学习算法从大量标注好的数据中学习情感分类的规律,并用于对新的未标注数据进行情感分析。

其中,深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)和注意力机制(Attention)等模型在情感分类任务中取得了显著效果。

卷积神经网络是一种广泛应用于图像识别中的深度学习模型,近年来也逐渐应用于文本分类任务中。

在情感分类中,卷积神经网络通过自动学习文本中的局部特征和语义信息,能够较好地表达文本的情感倾向。

其基本结构包括输入层、卷积层、池化层和全连接层。

卷积层利用多个不同尺寸的卷积核对文本进行特征提取,池化层通过降采样操作减少特征维度,最后将提取到的特征输入到全连接层进行分类。

循环神经网络是一种能够捕捉文本序列信息的深度学习模型。

通过循环神经网络中的隐藏层状态,模型能够记忆之前的信息并预测当前的情感类别。

循环神经网络的主要组成部分是循环单元,如长短时记忆网络(LSTM)和门控循环单元(GRU)等。

这些循环单元能够有效地处理文本中的长距离依赖关系,对于情感分类任务具有较好的表现。

另外,注意力机制是一种能够学习文本中重要部分的深度学习模型。

在情感分类中,注意力机制通过学习对于情感分类决策最有帮助的文本片段进行加权,从而提高模型的性能。

通过引入注意力机制,模型能够更加关注文本中与情感相关的关键信息,提升情感分类的准确性。

除了深度学习模型,传统的机器学习算法如支持向量机(SVM)、朴素贝叶斯(Naive Bayes)和随机森林(Random Forest)等在情感分类中也有一定的应用。

《情感语音识别与合成的研究》范文

《情感语音识别与合成的研究》范文

《情感语音识别与合成的研究》篇一一、引言情感语音识别与合成技术是人工智能领域中的一项重要研究内容,它通过捕捉和模拟人类情感,使得机器能够更好地理解和表达人类的情感需求。

本文旨在探讨情感语音识别与合成的研究现状、方法及未来发展趋势,以期为相关研究提供参考。

二、情感语音识别的研究情感语音识别是指通过分析语音信号,判断出说话人的情感状态。

目前,情感语音识别的研究方法主要包括基于规则的方法、基于机器学习的方法和深度学习方法。

1. 基于规则的方法基于规则的方法主要依靠语言学和语音学的专业知识,设计一套规则系统来分析语音信号。

该方法需要根据不同语言的发音规则、音调、语调等特征进行细致的规则设计,实现过程相对复杂。

2. 基于机器学习的方法基于机器学习的方法利用大量标注的语音数据训练分类器,通过分类器对未知情感的语音信号进行分类。

该方法需要大量的标注数据,且对于不同情感的表现形式需要设计不同的特征提取方法。

3. 深度学习方法深度学习方法在情感语音识别中取得了较好的效果。

该方法通过构建深度神经网络模型,自动提取语音信号中的特征,进而判断说话人的情感状态。

深度学习方法在处理复杂情感和多种语言方面具有较大优势。

三、情感语音合成的研究情感语音合成是指根据输入的情感信息,生成具有相应情感的语音信号。

目前,情感语音合成的方法主要包括基于规则的合成方法和基于深度学习的合成方法。

1. 基于规则的合成方法该方法主要依靠预设的规则和模板,通过调整语音参数来生成具有特定情感的语音信号。

该方法需要设计较为复杂的规则系统,且生成的语音缺乏自然度。

2. 基于深度学习的合成方法基于深度学习的情感语音合成方法可以生成更加自然、逼真的语音信号。

该方法通过构建神经网络模型,学习大量语音数据中的特征和规律,进而生成具有相应情感的语音信号。

近年来,循环神经网络(RNN)和自编码器等深度学习模型在情感语音合成中得到了广泛应用。

四、研究挑战与展望尽管情感语音识别与合成技术取得了一定的研究成果,但仍面临诸多挑战。

基于深度学习的语音情感识别技术研究

基于深度学习的语音情感识别技术研究

基于深度学习的语音情感识别技术研究第一章:引言1.1 研究背景语音是人类表达情感的重要方式之一。

随着智能手机和智能音箱的普及,语音情感识别技术日益受到关注。

通过识别语音中包含的情感信息,可以实现智能客服、情感分析等应用。

而深度学习作为一种强大的机器学习方法,已经在图像识别、自然语言处理等领域取得了巨大成功。

本文将探讨基于深度学习的语音情感识别技术的研究进展和应用前景。

1.2 研究目的和意义语音情感识别技术能够帮助人工智能更好地理解人类情感,提供更加智能化的服务。

通过深入研究基于深度学习的语音情感识别技术,可以提高情感识别的准确率和稳定性,为智能客服、智能助手等应用提供更好的用户体验。

此外,对于心理学研究也具有重要意义。

第二章:相关技术介绍2.1 语音情感识别的方法2.1.1 特征提取语音情感识别的第一步是对语音信号进行特征提取。

常用的特征包括语音的基频、共振峰频率等。

此外,还可以使用声学特征提取技术,例如短时能量、过零率等。

这些特征能够反映语音信号的时域和频域特征,为后续的情感分类提供依据。

2.1.2 情感分类算法情感分类算法是语音情感识别的核心技术。

传统的机器学习算法,如支持向量机、随机森林等,已经在情感分类任务上取得一定的成绩。

然而,由于语音情感识别任务的复杂性,这些传统算法在解决大规模和复杂情感分类问题上存在局限性。

因此,引入深度学习算法成为了近年来的研究热点。

2.2 深度学习算法在语音情感识别中的应用2.2.1 卷积神经网络(CNN)卷积神经网络在图像分类领域取得了巨大的成功,其特点是能够通过卷积层捕捉到数据的局部特征,通过池化层提取关键特征。

近年来,研究者们开始尝试将CNN应用于语音情感识别中,并取得了一定的成果。

2.2.2 循环神经网络(RNN)循环神经网络是一种特殊的神经网络结构,能够对序列数据进行建模。

由于语音信号具有时序性,循环神经网络在语音情感识别中具有很强的优势。

通过引入长短时记忆(LSTM)单元和门控循环单元(GRU),循环神经网络能够更好地处理长时间依赖关系,提高情感分类的准确率。

《基于语音和文本的情感识别研究》范文

《基于语音和文本的情感识别研究》范文

《基于语音和文本的情感识别研究》篇一一、引言情感识别是人工智能领域中的一个重要研究分支,主要用于对人类情感的智能分析和处理。

近年来,随着互联网技术和大数据的迅速发展,情感识别在多个领域得到广泛应用,包括智能问答系统、人机交互、社交媒体分析等。

情感识别的研究方法主要分为基于文本和基于语音两种方式。

本文将重点探讨基于语音和文本的情感识别研究。

二、语音情感识别语音情感识别主要依赖于计算机技术和音频处理技术。

它通过对人类语音的分析和解释,推断出语音中所蕴含的情感信息。

在语音情感识别中,关键技术包括语音信号的采集、预处理、特征提取和分类器设计等。

(一)语音信号的采集与预处理在语音情感识别的过程中,首先要进行语音信号的采集和预处理。

语音信号采集的准确性和清晰度直接影响着情感识别的准确度。

因此,需要通过合适的音频设备和专业的预处理方法,保证信号的质量。

常见的预处理方法包括去噪、归一化等。

(二)特征提取特征提取是语音情感识别的关键步骤。

通过对语音信号进行频谱分析、声学特征提取等手段,提取出反映情感的关键特征,如音调、语速、音色等。

这些特征对于后续的情感分类具有重要的指导意义。

(三)分类器设计分类器设计是实现语音情感识别的核心环节。

常用的分类器包括支持向量机(SVM)、神经网络等。

通过训练大量的情感样本,建立分类模型,进而实现情感的自动识别。

三、文本情感识别与语音情感识别不同,文本情感识别主要通过对文本内容进行分析,挖掘其中的情感信息。

在文本情感识别中,关键技术包括文本预处理、特征提取和情感分析等。

(一)文本预处理文本预处理是文本情感识别的第一步。

主要包括去除无关信息、分词、去除停用词等操作,为后续的情感分析提供基础数据。

(二)特征提取特征提取是文本情感识别的关键环节。

通过词频统计、词性标注、语义分析等方法,提取出文本中与情感相关的关键特征,如词语的语义倾向、句子的情绪表达等。

(三)情感分析情感分析是对提取出的特征进行综合分析和判断的过程。

语音情感识别技术研究与应用

语音情感识别技术研究与应用

语音情感识别技术研究与应用近年来,随着互联网的普及,人们使用语音交互的频率越来越高。

但是,人们的情感表达并不仅仅停留在语言上,而是往往通过语音来表现出来。

在这种情况下,语音情感识别技术的开发和应用就变得尤为重要。

本文将会涉及语音情感识别技术的研究与应用情况。

一、语音情感识别技术的研究现状语音情感识别技术是一项基于人工智能和机器学习的技术,它能够通过动态分析语音信号中的声学特征,自动判断说话人的情感状态。

当前研究中,语音情感识别技术主要有以下几种:1.基于情感语料库的方法情感语料库是由完整的语音信号组成的数据集。

通常情况下,利用情感语料库可以获取到每个语音信号的基本情感特征,包括音频文件中的波形,功率谱、基音周期和线性变化。

这些特征被用来训练一个过程化的分类模型,以进行情感识别。

2.基于语音特征向量的方法基于语音特征向量的情感识别方法需要从语音信号中提取关键的语音特征。

这些特征可以是谐波、基音周期、语速、能量、频率和线性预测系数等。

基于这些特征向量,可以使用机器学习算法来对语音进行情感识别。

二、语音情感识别技术的应用场景语音情感识别技术在众多应用场景中,得到了广泛的关注和研究。

在这种情况下,我们就能看到许多应用场景发展出来,包括:1.客服语音助手随着人们对智能家居的需求不断增加,智能客服也成为了越来越重要的领域之一。

语音情感识别技术可以用来识别客服工作人员和用户之间的情感状态,进而提高工作人员的工作效率。

2.教育领域在教育领域,语音情感识别技术也得到了广泛的应用。

例如,在英语教育领域中,语音情感识别技术能够识别学生发音方面的问题,从而及时纠正,提高英语学习的效率。

3.医疗领域在医疗领域中,语音情感识别技术也有着很大的应用空间。

例如,在提高自闭症患者社交能力方面,语音情感识别技术可以通过识别患者的情感状态来引导患者进行相关的训练。

三、存在的问题尽管语音情感识别技术在应用方面已经取得了一定的成就,但目前仍然存在一些问题:1. 数据集问题在使用语音情感识别技术时,获取大量的情感语音数据集也是至关重要的。

语音情感识别中的特征提取与分类算法

语音情感识别中的特征提取与分类算法

语音情感识别中的特征提取与分类算法引言近年来,随着人工智能技术的迅速发展,语音情感识别作为一种重要的人机交互技术,受到了广泛的关注和研究。

语音情感识别的目标是通过分析语音信号,准确地识别出说话者的情感状态,这对于提高人机交互的体验和效果具有重要意义。

在语音情感识别的研究中,特征提取和分类算法是非常关键的环节,本文将结合实际案例,对语音情感识别中的特征提取与分类算法进行探讨。

一、语音情感特征提取1.1 声学特征提取声学特征是指从语音信号中提取出来的与个体发音特点、语言习惯以及情感状态等相关的特征。

常见的声学特征包括基频、声道特征和共振峰等。

基频是指语音信号的周期性振动频率,与说话者的性别和情感状态密切相关。

声道特征反映的是声音通过口腔和鼻腔等共鸣腔体时的频率响应情况,可以通过声道模型进行提取。

共振峰是指声音信号谱中的共振峰频率,与发音部位、声音的共振特性以及语音的清晰度等有关。

1.2 语音情感特征提取方法为了提取语音情感特征,研究人员提出了多种方法。

一种常用的方法是基于时域的特征提取,例如短时过零率、短时能量和短时自相关系数等。

短时过零率可以反映语音信号的频率变化情况,短时能量反映了语音信号的整体强度,而短时自相关系数可以表示语音信号的周期性相关性。

此外,还可以使用频域特征提取方法,例如基频、谐波比、频谱熵等。

基频用于表示声音的音高,谐波比可以反映声音的富谐波特性,频谱熵则用于度量频谱的均匀性。

二、语音情感分类算法2.1 传统机器学习算法在语音情感分类算法中,传统机器学习算法被广泛运用。

常用的算法包括支持向量机(SVM)、K最近邻算法(KNN)和决策树等。

SVM算法通过不同的核函数将语音情感特征向量映射到高维空间,并在高维空间中构造一个最优的超平面来实现情感分类。

KNN算法采用最近邻搜索的方式,将未知语音特征向量与已有的标记样本进行比对,并将其分类到离他最近的K个样本所在的类别中。

决策树算法则通过构建一个树状的决策模型,根据特征向量的不同取值来进行分类。

基于语音识别的情感分析技术的研究

基于语音识别的情感分析技术的研究一、引言随着智能手机、智能音箱等智能设备的普及,语音交互技术的重要性越来越受到关注。

语音情感分析技术是其中的一个重要分支,通过对语音数据进行分析,可以识别出语音背后所表达的情感信息,从而提供更加智能化的服务。

基于语音识别的情感分析技术是最近几年来的热门研究方向之一,本文将介绍该领域的相关技术和应用进展。

二、相关技术2.1 语音识别技术语音识别技术是语音情感分析技术的基础。

其核心思想是将语音信号转换为数字信号,并对其进行分析和处理。

语音识别技术的发展已经取得了长足进展,目前已经广泛应用于智能设备、语音助手等领域。

2.2 情感分析技术情感分析技术是一种通过自然语言处理技术,对文本或语音等数据进行分析,从中提取出对应的情感信息的技术。

它通常包括情感分类、情感极性判断等方面。

情感分析技术能够帮助企业分析用户反馈、舆情等信息,提高服务质量和品牌知名度。

2.3 基于语音识别的情感分析技术基于语音识别的情感分析技术是将语音识别技术和情感分析技术进行结合,通过对语音数据进行分析和处理,来提取其中的情感信息。

它可以分为两个部分,一是语音信号的采集和预处理,二是情感分析模型的搭建和训练。

三、相关应用3.1 语音客服随着各行各业对语音交互的需求不断增加,语音客服已经成为了语音情感分析技术的一个重要应用方向。

通过对用户的语音进行情感分析,可以更加智能地为用户提供服务,从而增强用户体验。

3.2 语音助手语音助手是另一个重要的应用方向。

通过对用户的语音进行情感分析,可以更好地理解用户的需求和意图,从而提供更加智能化的服务。

例如,当用户的语音表达不够清晰或者情绪较为激动时,语音助手可以自动调整系统的回应速度和语音输出等参数,以提高交互效果。

3.3 情感分析情感分析是另一个重要的应用方向。

通过对用户反馈等语音数据进行情感分析,企业可以更好地了解用户的需求和意见,从而改进产品和服务,提高企业品牌的知名度和口碑。

基于语音的情感识别技术研究

基于语音的情感识别技术研究近年来,随着人工智能技术的快速发展,基于语音的情感识别技术也日益成熟。

这项技术可以通过分析说话人的语音特征,推断出其情感状态,为人工智能应用提供更为智能化的服务。

一、技术原理基于语音的情感识别技术主要利用音频信号处理和机器学习技术来分析音频特征,探测人的情感状态。

首先,需要把音频信号进行预加重、分帧、加窗、FFT变换等基本处理,然后提取出频域和时域特征参数。

这些参数包括基音频率、共振峰频率、能量、过零率等,都能反映语音信号中包含的情感信息。

接着,利用相关算法,如支持向量机、神经网络等,对这些特征进行学习和分类,从而实现情感识别。

二、应用领域基于语音的情感识别技术可以广泛应用于多个领域。

在语音交互技术中,情感识别可以实现智能语音助手更智能化的服务,使其能够了解用户的情感需求,更好地为用户提供服务。

在医疗健康领域,情感识别技术可以帮助医生了解患者的情感状态,有助于更好地为患者提供治疗方案。

在广告营销领域,情感识别可以分析客户的情感需求,制定更具吸引力、切实可行的营销方案。

此外,在教育、娱乐等领域也有着广泛的应用。

三、技术进展和挑战目前,基于语音的情感识别技术已经较为成熟,一些商业应用已经陆续推出。

然而,仍然存在不少技术挑战。

首先,由于人的语音表达情感相对复杂,情感识别的准确度一直是技术研究的难点。

其次,虽然机器学习技术对语音信号进行分类可以提高准确度,但所需的训练数据规模较大,数据获取和标注也是较大的工作量。

此外,语音信号受到环境噪声和说话人口音的影响,也会影响情感识别的准确度。

四、未来展望随着技术的不断发展和研究的深入,基于语音的情感识别技术将会朝着更加精准、高效的方向发展。

同时,更好的数据标注和获取工作也会促进情感识别技术的发展。

未来,无论是在智能语音助手、医疗健康、广告营销等领域,还是在娱乐、教育等领域,情感识别都将成为人工智能技术的重要应用之一。

也许,将来即使人距离彼此越来越远,但基于语音的情感识别技术也能帮助我们更好地理解对方,并实现更为智能化的互动。

语音情感识别技术研究及其应用

语音情感识别技术研究及其应用随着人工智能技术的发展,语音识别技术已经成为当前人工智能领域的研究热点。

其中一个重要的方向就是语音情感识别技术。

语音情感识别技术可以帮助人们识别自然语言或语音中所包含的情感信息,从而更加深入地理解人类交流方式,拓展人机交互技术的应用领域,具有广泛的应用前景。

一、语音情感识别技术的研究现状语音情感识别技术是一门涉及语音处理、自然语言处理、机器学习等多个领域的交叉学科。

近年来,随着深度学习等技术的发展,语音情感识别技术取得了长足的进展。

目前,最常用的情感分类模型是基于深度神经网络的模型,如卷积神经网络(CNN)、长短时记忆网络(LSTM)等。

同时,传统的特征提取方法如梅尔倒谱系数(MFCC)等也仍然有其应用的空间。

近年来,语音情感识别技术在多个领域得到广泛应用,如教育、医疗、智能客服、智能家居等。

具体来说,语音情感识别技术可以帮助教师和学生更好地互动,帮助医生更全面地了解患者的情感变化,提升客服质量,智能家居也可以通过语音情感识别技术了解用户的情感需求,实现更加便捷的智能控制。

这些领域的应用推广也进一步促进了语音情感识别技术的发展和研究。

二、语音情感识别技术的应用前景语音情感识别技术的应用前景非常广阔。

未来,随着智能家居、智能医疗、汽车智能驾驶等领域的不断拓展,语音情感识别技术的应用场景也会越来越多样化。

下面,本文将分别从教育、医疗、智能客服等三个方面探讨语音情感识别技术的应用前景。

1.教育领域在教育领域,语音情感识别技术可以应用于教师和学生之间的交流。

在日常教育中,学生的情感状态也会直接影响到学习效果。

因此,通过语音情感识别技术可以更好地了解学生的情感变化,及时发现学生的疑惑或焦虑情绪,从而更好地调整教学策略,提升教学效果。

此外,语音情感识别技术也可以帮助评估学生的情感状态,更好地促进学生的学习兴趣和积极性。

2.医疗领域医疗领域是另一个语音情感识别技术的应用领域。

通常情况下,患者的情感状态也会直接影响到疗效和康复时间。

语音情感识别的特征提取与分类方法研究

语音情感识别的特征提取与分类方法研究随着智能技术的快速发展,语音情感识别作为人机交互的重要领域之一,受到了广泛关注。

从语音中识别和分析情感状态对于实现自然、智能的人机交互具有重要意义。

本文将就语音情感识别中的特征提取与分类方法展开研究,为实现更准确、高效的语音情感识别技术提供参考和指导。

一、特征提取方法研究对于语音情感识别来说,特征提取是非常关键的一步。

有效的特征提取方法可以从语音信号中提取出与情感状态相关的信息,为后续的分类和识别工作提供有力支持。

下面介绍几种常用的特征提取方法:1. 基于声学特征的提取方法声学特征是通过对语音信号进行分析和处理得到的一些数值指标,常用的声学特征包括声调、音频强度、频率变化等。

通过使用声学特征可以有效地表达语音信号的基本特征,从而提取出与情感状态相关的信息。

常用的声学特征提取方法包括短时能量、过零率、频谱质心等。

2. 基于语音基元的提取方法语音基元是语音信号的最小单位,通过对语音信号进行分割和建模,可以提取出与情感状态相关的信息。

常用的语音基元包括音素和声韵母等。

通过对语音基元进行建模和分类,可以得到更加准确的语音情感识别结果。

3. 基于深度学习的特征提取方法深度学习是一种模仿人脑神经网络的机器学习方法,近年来在语音情感识别领域取得了很大的进展。

深度学习可以自动地学习和提取语音信号中的特征,不需要手工设计特征提取算法。

常用的深度学习模型包括卷积神经网络(CNN)、长短时记忆网络(LSTM)和双向循环神经网络(BiRNN)等。

二、分类方法研究在特征提取的基础上,选择合适的分类方法对提取到的特征进行分类和识别是语音情感识别的关键。

下面介绍几种常用的分类方法:1. 支持向量机(SVM)支持向量机是一种常用的机器学习算法,可以有效地解决二分类和多分类问题。

在语音情感识别中,SVM可以通过训练样本建立决策边界,将不同情感状态的语音信号进行分类。

2. 隐马尔可夫模型(HMM)隐马尔可夫模型是一种常用的时间序列建模方法,可以对语音信号的时间演化进行建模和预测。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第1 0 期
周晓凤, 等: 基于情感特征分类的语音情感识别研究
·3 6 4 9 ·
D S 证据理论是建立在一个完备集合的识别框架 U上的, 其中 U包含了某个问题的所有可能答案且元素之间是互不相交的 基本命题, 即识别结果只能取 U中的某一个基本命题。 D S 证 来为该框架的 据理论通过基本概率分配函数( 通常为 m函数) # # <(66 参数的提取 L P C C是在 L P C ( 线性预测系数) 的基础上得到的。线性 预测分析认为, 语音信号样点之间存在相关性, 可以用过去的 若干个样本点或它们的线性组合预测现在或将来的样本值。 它可以提供一个很好的声道模型, 而且只要十几个倒谱特征参 数就能很好地反映出语音信号的共振峰特性。一般倒谱分析 6左右就能较好地表征语音的特征参数, 本文对 L P C 阶数取 1 的阶数取 1 4 、 1 5 、 1 6 、 1 7时, 分别进行识别实验, L P C阶数为 1 4 时, 效果最佳, 因此本文 L P C的阶数取 1 4 。 # $ 其他特征参数的提取 短时能量和短时过零率特征能够用来很好地区分清音段 和浊音段。清音的短时能量明显小于浊音的短时能量, 而清音

M F C C n x ′ ( k ) c o s [ ( k - 0 5 ) n / M] n = 1 , 2 , …, L ( 1 ) π n =∑ l
k = 1
其中: x ′ ( k ) 为第 k 个滤波器的输入功率谱。
收稿日期:2 0 1 2 0 3 0 6 ;修回日期:2 0 1 2 0 4 0 8 基金项目:国家自然科学基金资助项目( 6 1 1 7 1 1 4 1 ) 作者简介:周晓凤( 1 9 8 7 ) , 女, 河北石家庄人, 硕士研究生, 主要研究方向为家庭服务机器人、 语音情感识别( w o . j i u s h i @1 6 3 . c o m ) ; 肖南峰 ( 1 9 6 2 ) , 男, 江西南昌人, 教授, 博导, 博士, 主要研究方向为仿人机器人;文翰( 1 9 7 7 ) , 男, 湖南益阳人, 博士研究生, 主要研究方向为机器学习.
R e s e a r c ho f s p e e c he m o t i o nr e c o g n i t i o nb a s e do ne m o t i o nf e a t u r e s c l a s s i f i c a t i o n
Z H O UX i a o f e n g ,X I A ON a n f e n g ,WE NH a n
2 ] 的过零率却高于浊音的过零率。基音频率 [ 反映的是整个语
S证据理论一个关键和重要的 各个基本命题分配信任度。 D 问题就是如何为各个基本命题分配初始信任度, 即初始概率密 度。由于证据之间的信息有可能有交叉和冲突的情况, 在利用 传统 D S 证据理论时, 若存在高冲突的证据则会产生不合理的 结果。本文在基本概率赋值方法上对该问题进行了改进。 则A , 则 m满足 若 A为 U中的一个元素, ∈U
# 特征提取及分类
[] # " :/; 倒谱系数的提取 "
M F C C自 1 9 8 0年由 D a v i s 等人提出以来, 在语音识别领域
" 情感识别语音语料库的建立
目前汉语语音情感识别尚未有统一的公开数据库可供研 究, 因此普遍采用两种方式获得情感语音资料: a ) 通过具有丰 富情感表达能力的人, 利用录音软件采集其在各种模拟情感状 态下的语音数据作为识别用的语料; b ) 是通过剪辑影视剧作 品中的相关情节得到识别用的语料。方法 a ) 由于主观影响比 较大, 对情感状态的理解和表达因人而异, 所以本文采用方法 b ) 。考虑语音的三音子因素, 选择合适且尽量无噪声的语音
m ( 0 )= 0 ( A ) , ≤m ≤1 A UA U{ຫໍສະໝຸດ 据的焦元。( 5 )
( A )= 1 ∑m
其中: m ( 表示 A为空集时初始概率密度为 0 , 且 A的幂集 )
A 2 中元素初始概率密度总和为 1 。如果 m ( A )> 0 , 则称 A为证
假设识别框架 U中包含 n 个证据, 且任意两个证据 i 、 j 的 、 m , 焦元分别为 A 、 A , 由文献[ 6 ] , 证据 i 基本概率密度为 m i j i j 和j 之间的距离为
随着计算机技术的蓬勃发展, 人机交流也变得越来越普 遍, 情感理解能力日渐成为衡量一个机器是否具有智能的关键 因素。目前已经出现能够根据人类特定的命令去执行特定动 作的产品, 但是要实现人机的自然交互, 机器必须能够更准确 地理解和区分人类的情感。作为人类日常情感交流的主要方 式, 人类话语中所携带的情感信息越来越受到人们的重视。本 文在建立语音情感数据库的基础上, 提取语音信号的基音、 共 振峰、 L P C C和 M F C C等情感特征组成语音情感特征集, 并将情 感特征集分为两类, 针对现有 D S 证据理论融合技术在基本概 率赋值方法上的缺陷, 提出改进方法。在此基础上, 对恐惧、 愤 怒、 悲哀、 高兴、 惊奇和平静六种情感进行识别。
第2 9卷第 1 0期 2 0 1 2 年1 0月
计 算 机 应 用 研 究 A p p l i c a t i o nR e s e a r c ho f C o m p u t e r s
V o l 2 9N o 1 0 O c t 2 0 1 2
基于情感特征分类的语音情感识别研究
A b s t r a c t :B e c a u s e t h e s p e e c hs i g n a l s w e r e h i g h l y r e a l t i m e u n c e r t a i n t y , t h i s p a p e r p r o p o s e de v i d e n c e s ’t r u s t e n t r o p y a n dd y n a m i c p r i o r w e i g h t s t oi m p r o v et h e b a s i cp r o b a b i l i t yf u n c t i o no f t r a d i t i o n a l D St h e o r y .A s t h ee m o t i o nr e c o g n i t i o nr e s u l t w a s ,i t p r e s e n t e da c l a s s i f i c a t i o nm e t h o do f e m o t i o nf e a t u r e s .I no r d e r t o r e n o t t h es a m eb ye m o t i o nf e a t u r e s i nd i f f e r e n t e m o t i o n s , i t u s e d t h e r e c o g n i t i o n d a t a o f d i f f e r e n t c l a s s i f i c a t i o n a n d t h e i m p r o v e dD S t h e a l i z e t h e f i n e g r a i ns p e e c he m o t i o n r e c o g n i t i o n o r y t o r e a l i z e t h ee m o t i o nr e c o g n i t i o nb a s e do nm u l t i c l a s s i f i c a t i o ne m o t i o nf e a t u r e s .T h e i m p r o v e dD St h e o r yi s p r o v e dt ob e e f f e c t i v e b ys i m u l a t i o n .A n dc o m p a r i n g s i m u l a t i o nr e s u l t s s h o wt h a t t h em u l t i c l a s s i f i c a t i o ne m o t i o nf e a t u r e s a r ee f f e c t i v ea n d s t a b i l i t y . K e yw o r d s :s p e e c he m o t i o nr e c o g n i t i o n ;e m o t i o nf e a t u r e s c l a s s i f i c a t i o n ;i m p r o v e dD St h e o r y ;e v i d e n c e s ’t r u s t e n t r o p y ;d y ;d a t a f u s i o n n a m i c p r i o r w e i g h t s
应用广泛, 是语音情感识别比较常用的短时光谱特征。它通过 构造人的听觉模型, 以语音通过该模型的输出为声学特征, 直 接通过 D F T ( 离散傅里叶变换) 进行变换。提取 M F C C的步骤 如图 1所示。由于 M F C C特征反映的是语音信号的静态特征, 而其一阶及二阶差分反映的是语音信号的动态特征, 因此本文 还提取了 M F C C的一阶和二阶差分。
周晓凤,肖南峰,文 翰
( 华南理工大学 计算机科学与工程学院,广州 5 1 0 0 0 6 ) 摘 要:针对语音信号的实时性和不确定性, 提出证据信任度信息熵和动态先验权重的方法, 对传统 D S 证据 理论的基本概率分配函数进行改进; 针对情感特征在语音情感识别中对不同的情感状态具有不同的识别效果, 提出对语音情感特征进行分类。利用各类情感特征的识别结果, 应用改进的 D S证据理论进行决策级数据融 合, 实现基于多类情感特征的语音情感识别, 以达到细粒度的语音情感识别。最后通过算例验证了改进算法的 迅速收敛和抗干扰性, 对比实验结果证明了分类情感特征语音情感识别方法的有效性和稳定性。 关键词:语音情感识别;情感特征分类;改进 D S 证据理论;证据信任度信息熵;动态先验权重;数据融合 中图分类号:T P 3 8 9 1 文献标志码:A 文章编号:1 0 0 1 3 6 9 5 ( 2 0 1 2 ) 1 0 3 6 4 8 0 3 d o i : 1 0 3 9 6 9 / j i s s n 1 0 0 1 3 6 9 5 2 0 1 2 1 0 0 1 2
相关文档
最新文档