基于深度卷积神经网络模型的文本情感分类

合集下载

基于深度学习的文本情感分析方法研究

基于深度学习的文本情感分析方法研究

基于深度学习的文本情感分析方法研究随着社交媒体的兴起以及用户生成内容的爆炸增长,对大规模文本数据进行情感分析的需求与日俱增。

文本情感分析是一种将自然语言处理和机器学习相结合的技术,旨在自动识别和理解文本中的情感倾向。

近年来,深度学习模型在文本情感分析领域取得了显著的进展,并且成为了研究和应用的热点之一。

本文将就基于深度学习的文本情感分析方法进行综述,并对其研究现状和未来发展进行讨论。

一、基础知识介绍1.1 文本情感分析概述文本情感分析,又称为情感倾向分析,是指通过计算机技术对文本进行情感判断和分类的过程。

其目标是将文本分类为积极、消极或中性等情感类型。

情感分析可应用于情感监测、品牌舆情分析、用户评论情感分析等领域,对于企业决策和社会舆情分析起着重要作用。

1.2 深度学习简介深度学习是一种基于神经网络模型的机器学习方法,通过多层神经网络的构建和训练来解决复杂的模式识别和数据分析问题。

与传统机器学习方法相比,深度学习模型以其强大的非线性拟合能力和自动特征学习能力在文本情感分析任务中表现出色。

二、基于深度学习的文本情感分析方法2.1 卷积神经网络(CNN)卷积神经网络是一种常用的深度学习模型,具有一定的自然语言处理能力。

在文本情感分析领域,卷积神经网络通过卷积操作来捕捉文本中的局部特征,进而通过全连接层进行分类。

该方法在文本分类任务中取得了很好的效果。

2.2 循环神经网络(RNN)循环神经网络是一类具有记忆能力的神经网络,对于处理序列数据的任务特别有效。

在文本情感分析中,循环神经网络通过序列建模,能够较好地捕捉上下文信息,对于理解文本中的情感趋势非常有帮助。

然而,长时依赖问题限制了RNN模型的准确性。

2.3 长短期记忆网络(LSTM)为了解决长时依赖问题,研究者提出了长短期记忆网络。

LSTM模型通过引入记忆单元和门控机制,能够有效地记忆长期依赖关系,并且在文本情感分析中取得了较好的效果。

LSTM模型在多层结构的基础上,能够更好地处理文本中的复杂情感信息。

基于深度学习的文本情感分析算法设计

基于深度学习的文本情感分析算法设计

基于深度学习的文本情感分析算法设计1. 前言文本情感分析是一项重要的自然语言处理任务,其目标是识别和分类文本中的情感倾向,如正面、负面或中性。

深度学习是一种强大的方法,在文本情感分析中已经取得了良好的效果。

本文将介绍基于深度学习的文本情感分析算法设计,包括数据预处理、模型设计和性能评估等方面的内容。

2. 数据预处理在进行深度学习之前,需要对原始数据进行一系列的预处理工作,以便为模型的训练提供合适的数据。

首先,需要对文本进行分词,将原始的句子或段落划分为一个个的词汇单位。

接下来,可以使用词向量技术将词汇转换为向量表示,例如Word2Vec或GloVe。

这样可以将文本转化为机器可以理解的数值形式。

另外,还可以进行去除停用词、词形还原、删除特殊字符等常见的文本预处理操作,以减少噪音的影响。

3. 模型设计深度学习的模型选择对于文本情感分析任务至关重要。

在这里,我们将介绍两种经典的深度学习模型:卷积神经网络(CNN)和长短期记忆网络(LSTM)。

3.1 卷积神经网络(CNN)卷积神经网络是一种特别适合处理局部相关性的数据的深度学习模型。

对于文本情感分析任务,可以将文本序列看作是一个二维的矩阵,其中每一行表示一个词向量。

通过应用一维卷积操作,在不同的窗口大小下,从输入序列中提取出不同长度的特征。

接着,可以使用全局最大池化操作将特征序列转化为固定长度的向量,然后通过全连接层进行情感分类。

3.2 长短期记忆网络(LSTM)长短期记忆网络是一种专门用于处理时序数据的深度学习模型。

在文本情感分析任务中,每个词向量可以看作是一个离散的时间步,LSTM网络能够有效地捕捉序列中的长距离依赖关系。

通过将LSTM单元堆叠在一起,可以构建深层的LSTM模型。

最后,通过添加全连接层将LSTM模型的输出进行情感分类。

4. 性能评估为了评估基于深度学习的文本情感分析算法的性能,可以使用一些常见的评估指标,如准确率、召回率、F1值等。

基于神经网络的文本分类及情感分析研究

基于神经网络的文本分类及情感分析研究

基于神经网络的文本分类及情感分析研究概述:在信息爆炸时代,海量的文本信息使得对文本进行分类和情感分析展现出了巨大的研究和应用价值。

神经网络作为一种强大的机器学习方法,在文本分类和情感分析中取得了很大的成功。

本文将重点探讨基于神经网络的文本分类和情感分析的研究领域。

一、神经网络在文本分类中的应用1.1 神经网络基本原理神经网络是基于生物神经系统的思维方式和信息处理机制,模拟人脑中的神经元和突触间的连接进行信息处理和学习。

常用的神经网络模型有多层感知器(MLP)、卷积神经网络(CNN)和循环神经网络(RNN)。

1.2 文本分类任务文本分类是将一段文本分配到预定义的类别或标签中的任务。

它可以用于情感分析、垃圾邮件过滤、新闻分类等领域。

神经网络通过学习文本的特征和模式,在文本分类任务中取得了显著的成果。

1.3 神经网络在文本分类中的应用神经网络在文本分类中具有许多优势,包括强大的非线性表达能力、自动提取特征和模式的能力、能够处理上下文信息等。

常见的应用包括基于词向量的文本分类、基于卷积神经网络的文本分类和基于循环神经网络的文本分类等。

二、神经网络在情感分析中的应用2.1 情感分析概述情感分析是指从文本中识别和提取情感信息的过程。

情感分析可以分为情感极性分析和情感强度分析。

其中,情感极性分析旨在判断文本的情感倾向,如积极、消极或中性;情感强度分析则是评估情感的强度大小。

2.2 神经网络在情感分析中的应用神经网络在情感分析中有着广泛的应用,能够从海量数据中提取有关情感的特征和模式。

情感分析的神经网络模型可以包括卷积神经网络、长短时记忆网络(LSTM)和门控循环单元(GRU)等。

2.3 神经网络在情感分析中的性能评估为了评估神经网络在情感分析中的性能,常用指标包括准确率、精确率、召回率和F1值等。

此外,还可以采用交叉验证和混淆矩阵等方法进行评估。

三、神经网络在文本分类与情感分析中的应用案例3.1 社交媒体情感分析社交媒体中的用户评论和推文等包含大量的情感信息。

基于深度学习的文本情感分析技术研究

基于深度学习的文本情感分析技术研究

基于深度学习的文本情感分析技术研究一、引言文本情感分析技术是自然语言处理领域的一个重要研究方向。

深度学习作为一种新兴的机器学习技术,具有学习能力强、预测准确度高等优点,能够提高文本情感分析技术的精度与效率。

本文将介绍基于深度学习的文本情感分析技术的发展历程、研究现状、核心算法以及应用前景。

二、深度学习在文本情感分析中的应用深度学习在文本情感分析中的应用,通过构建深度神经网络,实现对文本情感的自动识别。

典型的深度学习算法包括卷积神经网络、循环神经网络以及深度递归神经网络等。

下面我们将逐一介绍这些算法在文本情感分析中的应用。

1.卷积神经网络卷积神经网络在图像处理领域得到广泛应用。

在文本情感分析中,卷积神经网络同样可以实现对文本情感的分类。

具体来说,卷积神经网络将文本分解为若干个关键字(如单词或者词组),然后通过卷积运算提取文本中的特征信息,最后通过全连接层将特征转化为情感分类结果。

2.循环神经网络循环神经网络通过建立长短时记忆单元(LSTM)等结构,可以处理长序列数据。

在文本情感分析中,循环神经网络主要用于解决文本中长距离依赖关系的问题。

具体来说,对于一个文本序列,循环神经网络会将其展开成一个图形,并依次传递每个位置的信息进行情感分类。

3.深度递归神经网络深度递归神经网络在处理树形结构数据时表现优异。

在文本情感分析中,深度递归神经网络可以将文本依赖关系转化为树形结构,并对其进行分类。

具体来说,深度递归神经网络会对文本中词之间的依赖关系进行建模,并自动提取其中的特征,最后通过树形结构的分类器实现情感分类。

三、基于深度学习的文本情感分析中的核心算法基于深度学习的文本情感分析中,核心算法主要包括词向量模型、卷积神经网络、循环神经网络和深度递归神经网络等算法。

1.词向量模型词向量模型是一种将单词转化为向量表示的技术。

通过将每个单词映射为一个固定维度的向量,可以实现对文本的深度学习处理。

在文本情感分析中,词向量模型可以通过对文本中单词的表示进行优化,提高情感分类的准确度。

基于深度神经网络的文本情感分类方法研究和实现

基于深度神经网络的文本情感分类方法研究和实现

基于深度神经网络的文本情感分类方法研究和实现概述:随着社交媒体和互联网的普及,大量的文本数据被产生和共享。

这些数据的情感分类对于舆情分析、营销策略、舆论引导等应用来说都非常重要。

深度神经网络作为一种利用机器学习和人工智能技术进行文本情感分类的方法,具有很大的潜力。

本文将探讨基于深度神经网络的文本情感分类方法的研究和实现。

一、深度神经网络简介深度神经网络(Deep Neural Network, DNN)是一种模拟人脑神经元的机器学习模型。

它的主要特点是可以通过多个隐藏层来学习和提取抽象的特征。

对于文本情感分类任务,可以使用深度神经网络来自动学习和分析文本中的情感特征。

二、文本情感分类问题文本情感分类是将文本数据分为积极、中性或消极的情感类别的任务。

传统的方法主要基于词袋模型和机器学习算法,但这些方法往往无法捕捉到文本的语义信息和上下文关系。

深度神经网络通过学习单词或词组的分布式表示,可以克服这些问题,提高情感分类的准确性。

三、深度神经网络在文本情感分类中的应用1. 词嵌入词嵌入是深度神经网络在处理文本数据中的关键步骤。

它通过将单词映射到一个低维向量空间中,使得单词的语义和上下文信息可以通过向量计算得到。

常用的词嵌入方法有Word2Vec和GloVe。

在进行文本情感分类时,可以为每个单词对应一个词向量作为输入。

2. 循环神经网络(Recurrent Neural Network, RNN)循环神经网络是一种能够处理序列数据的深度神经网络。

在文本情感分类中,可以使用RNN来捕捉上下文关系和长期的依赖关系。

通过建立一个记忆单元来传递信息,RNN可以有效地处理变长的文本输入,从而提高情感分类的性能。

3. 卷积神经网络(Convolutional Neural Network, CNN)卷积神经网络是一种通过局部感受野和权值共享来提取局部特征的神经网络模型。

在文本情感分类中,可以使用CNN来提取文本中的局部特征并进行分类。

基于卷积神经网络的文本情感分类研究

基于卷积神经网络的文本情感分类研究

基于卷积神经网络的文本情感分类研究近年来,随着社交媒体、网络论坛等网络社交平台的兴起,人们越来越多地在网络上交流、发表自己的意见和看法。

这些海量的用户生成的文本数据,为文本情感分类研究提供了宝贵的资源。

文本情感分类是指自动将一段或一篇文本分为积极、消极或中立等情感类别的过程。

基于卷积神经网络(Convolutional Neural Network,CNN)的文本情感分类研究,是近年来文本情感分类领域的热点之一。

CNN是一种深度学习模型,以卷积层为基础,通过多个卷积层和池化层来提取高层次的特征,进而对数据进行分类。

在文本情感分类任务中,CNN可以输入一段文本,提取出其中的特征,再通过全连接层等组件进行分类,从而对该文本的情感进行判断。

文本情感分类任务的实现过程主要包括以下几个步骤:首先根据语言学知识对文本进行预处理,比如去除停用词、分词等;然后将每个单词表示成向量的形式,建立词向量矩阵;接着将文本中的每个单词的向量作为输入,经过卷积层、池化层等处理,最后通过全连接层输出分类结果。

文本情感分类算法有很多,但是CNN算法因其良好的性能和较为高效的训练速度,被广泛应用于文本情感分类任务中。

CNN算法结合了卷积操作和池化操作的优势,可以有效地提取文本的特征,避免了传统文本分类算法中需要手动进行特征提取和选择特征等繁琐步骤的问题。

在具体实现中,文本经过卷积层和池化层后形成的特征矩阵,被送入全连接层进行分类。

在网络的训练过程中,CNN会通过反向传播算法进行权重更新,让网络逐渐调整权重,达到与实际情感标签最为接近的分类效果。

此外,CNN还可以使用Dropout等技术,来防止过拟合的问题。

文本情感分类算法中,数据集的选择和标注是至关重要的环节。

目前,主流的文本情感分类数据集有Movie Review、Twitter Sentiment Analysis Dataset等。

这些数据集中的文本来自于电影评论、新闻、社交媒体等网站,具有较高的代表性和真实性。

基于深度学习的情感分类模型研究

基于深度学习的情感分类模型研究

基于深度学习的情感分类模型研究近年来,随着机器学习技术的飞速发展,深度学习技术成为了自然语言处理领域的重要研究方向之一。

情感分类作为一项自然语言处理的基础任务,对于产品评论分析、舆情监测等应用具有重要的实际应用价值。

本文将重点探讨基于深度学习的情感分类模型研究,包括情感分类的定义、深度学习模型构建、评价指标以及应用展望等方面。

一、情感分类的定义情感分类是指将文本按照情感的分类进行归纳和处理的一项任务。

情感分类可以分为两类:极性分类和细粒度分类。

极性分类是将情感划分为正面、负面或中性。

而细粒度分类则是在极性的基础上更加细分,如将正面情感划分为喜爱、满意、感激等不同类别。

在情感分类任务中,文本的预处理是非常关键的步骤。

通常情况下,要将文本进行分词、去停用词、词性标注等处理操作,并提取出文本的特征,如词频、词向量等,作为输入模型的特征向量。

二、深度学习模型构建基于深度学习的情感分类模型中,常用的模型有卷积神经网络(CNN)、循环神经网络(RNN)和注意力机制模型(Attention)。

这些模型在处理自然语言处理任务时,具有良好的特征提取能力、层次结构特性以及处理长依赖关系的优势。

1.卷积神经网络模型卷积神经网络模型是通过卷积操作来提取文本特征信息的一种神经网络模型。

在情感分类任务中,CNN模型可以通过卷积操作提取出文本的局部特征,有效解决文本特征不同步的问题。

同时,通过池化操作对特征进行压缩,降低模型的复杂度。

2.循环神经网络模型循环神经网络模型通过重复使用网络结构来处理序列信息,具有处理长依赖关系的能力。

在情感分类任务中,常用的循环神经网络模型为长短时记忆网络(LSTM)和门控循环单元(GRU)。

这两种模型在长文本处理和语义理解等方面,表现优于传统的浅层神经网络模型。

3.注意力机制模型注意力机制模型是在提升模型的可解释性和模型性能上的一种重要模型。

该模型通过给不同的特征点加权来实现对于不同特征的重视程度。

基于深度学习的自然语言处理与文本情感分析

基于深度学习的自然语言处理与文本情感分析

基于深度学习的自然语言处理与文本情感分析自然语言处理(Natural Language Processing, NLP)是计算机科学和人工智能领域的一个重要分支,它致力于让计算机能够理解、处理、生成和与人类语言进行交互。

随着深度学习技术的发展,基于深度学习的自然语言处理成为了当前NLP领域的主流方法。

本文将介绍深度学习在自然语言处理中的应用,并重点讨论文本情感分析这一重要的任务。

首先,让我们了解一下深度学习。

深度学习是一种模拟人脑神经网络的机器学习方法,在处理NLP任务时表现出色。

其核心思想是通过多个神经网络层级的非线性变换和特征学习,从输入数据中自动地学习到高层次的抽象表示,从而实现对复杂数据的建模与分析。

在NLP领域,深度学习已经广泛应用于很多任务,如机器翻译、语言模型、命名实体识别等。

其中,文本情感分析是深度学习在NLP领域的一个重要应用方向。

文本情感分析旨在通过分析文本中的情感倾向,判断文本的情感极性(如正面、负面、中性)或情感类别(如喜怒哀乐等)。

它在社交媒体分析、舆情监测、投资决策等领域具有广泛的应用价值。

在深度学习的框架下,文本情感分析任务通常可分为两个主要的子任务:情感分类和情感回归。

情感分类是将文本划分为不同的情感类别,例如正面、负面、中性。

而情感回归更加细粒度,它通过预测文本所对应的连续值来表示情感强度。

为了实现文本情感分析任务,常见的深度学习模型包括卷积神经网络(Convolutional Neural Networks, CNN)、循环神经网络(Recurrent Neural Networks, RNN)和注意力机制(Attention Mechanism)等等。

这些模型在自然语言处理领域具有很高的表现力和可解释性,并且能够充分挖掘文本中的信息,并捕捉到与情感相关的特征。

以情感分类为例,卷积神经网络被广泛应用于该任务。

卷积神经网络通过引入卷积运算和池化操作,能够自动地提取出句子中的局部特征,并捕捉到不同长度的文本信息。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第45卷第$期V o l.45 N o.3计算机工程C o m p u te r E n g in e e rin g2019年3月M a rc h2019•开发研究与工程应用•文章编号:1000#428(2019)0$-0$00-09文献标志码:A中图分类号:TP183基于深度卷积神经网络模型的文本情感分类周锦峰,叶施仁,王晖(常州大学信息科学与工程学院,江苏常州213164)摘要:为高效提取不同卷积层窗口的文本局部语义特征,提出一种深度卷积神经网络(C N N)模型。

通过堆叠多个卷积层,提取不同窗口的局部语义特征。

基于全局最大池化层构建分类模块,对每个窗口的局部语义特征计算情感类别得分,综合类别得分完成情感分类标注。

实验结果表明,与现有C N N模型相比,该模型具有较快的文本情感分类速度。

关键词:情感分析;情感分类标注;深度学习;卷积神经网络;词向量中文引用格式:周锦峰,叶施仁,王晖.基于深度卷积神经网络模型的文本情感分类[J].计算机工程,2019,45(3):300-308.英文引用格式:Z H O U J in fe n g,Y E S h ire n,W A N G H u i. T ext sentim ent classification based on deep con volution al neuralnetw ork m o d e l*J].Com puter E n g in e e rin g,2019,45 (3) :300-308.Text Sentiment Classification Based on Deep Convolutional Neural Network ModelZ H O U J in fe n g,Y E S h ire n,W A N G H u i(School of Inform ation Science and E ngineering,Changzhou Universit;^,C hangzhou,Jiangsu 213164,C hina)[A b s tr a c t]This paper proposes a d e e p C o nvo lutio na l N eural N e tw ork(C N N)m odel to e ffic ie n tly extract semantic features o f d iffe re n t con volution al layer w indow s fo r te x t.The m odel avoids m anually specifying m u ltip lew indo w sizes and retains local semantic features o f diffe re n t w indow s by stacking a n u m b e r o f con volution al l C lassification m odules are b u ilt based on t he G lobal M a x P ooling(G M P)layer to calculate the category score f local semantic features o f each w in d o w.The m odel synthesizes these category scores to com plete the sentiment classification annotation.E xperim ental results show that the m odel has faster text sentim ent classificat o f other C N N m odels.[K e y w o r d s]sentim ent analysis;sentim ent classification a n n o ta tion;deep le a rn in g;C o nvo lutio na l N eural N e tw ork(C N N) ;w ord vectorD O I:10.19678/j.issn.1000-3428.0050043〇概述情感分析主要通过人类书写的文本分析和研究 人的意见、情感、评价、态度和情绪,是自然语言处理 (N a tu ra l La ng ua ge P ro c e ss in g,N L P)中最热门的研究 领域之一,并在数据挖掘、W e b挖掘和文本挖掘等应 用范畴得到广泛研究[16]。

例如,分析电商平台上对 已购商品的点评,群众对政府新颁布的政策法规的 讨论以及消费者对新产品或服务的反馈等。

每天数 以亿计的用户文本信息包含了丰富的用户观点和情 感极性,从中可以挖掘和分析出大量的知识和模式。

深度学习为经典数据挖掘任务提供了新的手 段。

卷积神经网络(C o n v o lu tio n a l N e u ra l N e tw o rk,C N N)是一种用于处理具有网状拓扑结构数据的深度神经网络(D eep N e u ra l N e tw o r k,D N N)。

C N N 通过卷积操作,组合低层特征形成更加抽象的高层特 征,使模型能够针对目标问题,自动学习特征。

在文 本情感分类应用中,C N N能够有效避免传统机器学 习方法所面临的样本特征表达稀疏、计算复杂等问题[4]。

目前,以C N N为基础的文本情感分类方法多数 是通过学习文本的一种窗口或多种窗口局部语义信 息,然后提取文本最大语义特征进行情感划分。

此 类方法在文本情感分类标注领域已取得较好的效 果。

但是目前在文本情感分类标注领域[56],甚至在 N L P的其他分类问题中[860],使用的C N N模型多数 采用一个或多个卷积层并行的结构。

C N N模型解 决情感分类标注问题时,为了充分捕捉语义的距离基金项目:国家自然科学基金(61272367);江苏省科技厅项目(BY2015027-12)。

作者简介:周锦峰(1978—),男,硕士,主研方向为机器学习、自然语言处理;叶施仁,副教授、博士;王晖(通信作者),讲师、博士。

收稿日期:2018-01-10修回日期:2018-02-27E-m a i l:zhouzhou9076@ 第45卷第3期周锦峰,叶施仁,王晖:基于深度卷积神经网络模型的文本情感分类301依赖[11],需要提取不同上下文窗口的局部语义信息,增强情感分类能力。

但是,卷积层并行的C N N 模型使用超参数设定有限种窗口大小,而且随着窗 口增加,模型计算量会大幅增加,训练效率和预测速 度也随之降低。

为提高模型计算效率,本文提出一种应用于全 局最大池化(G lo b a l M a x P o o lin g,G M P)层的深度卷 积神经网络(G M P-C N N)模型,进行文本情感分类标 注。

堆叠的卷积层能够逐层深入地提取窗口更大、抽象度更高的局部语义特征。

由特殊的卷积层和 G M P层构成的分类模块为不同窗口的局部语义特 征计算情感类别得分,得到文本情感分类标注,并采 用斯坦福情感树库(S tan fo rd S en tim en t T re e b a n k,S S T b)数据集以验证G M P-C N N模型情感分类标注 的有效性。

1相关工作文献[3]采用朴素贝叶斯模型、最大熵模型和支 持向量机模型对文本进行情感分类。

此后,以传统 机器学习为核心的情感分析模型层出不穷。

为提高 分类正确率,传统机器学习方法使用大量文本特征。

随着特征变多,训练样本在每个特征上的描述会变 得稀疏,机器学习的计算复杂性成倍增加。

由于文 本特征需要人工构造,因此特征越多,人工成本越大。

文献[12]提出分布式表示词向量的概念,从大 量未标注的语料库中无监督地学习词向量,通过向 量空间上的相似度表示文本语义上的相似度。

由词 向量序列构成文本的原始表示形式将文本内容的处 理简化为?维向量空间中的向量运算。

分布式表示 词向量的出现有效解决了 P N N输入部分对人工的 依赖,并推动P N N发展出新模型用于文本情感分类。

文献[13 ]将C N N应用在文本分类任务,并通过 实验证明基于C N N的文本分类模型能够获得比传 统机器学习模型更高的正确率。

文本情感分类标注 任务也属于文本分类任务,因此,作者使用C N N模 型完成情感分类标注任务。

文献[5]基于单词的构 造(以构成单词的字母为单位),提出C h a rS C N N模 型。

以C N N为基础的C h a rS C N N模型,采用2个并 行的卷积层分别学习单词的构造特征和句子的局部 语义特征,充分体现C N N对文本局部特征的抽象和 提取能力。

该模型在短文本情感分类时展示了较好 效果,有效论证C N N模型在进行句子情感分类标注 时的可行性。

文献[6]在C h a rS C N N模型基础上,并 行多个卷积层,学习多种窗口的文本局部特征。

对 于中文语料,该模型有效地完成情感二分类标注任务。

文献[7]使用 W o rd2V e c、G lo V e 和F astT e xt 多种词向量形成C N N模型的多通道输入,同时使用a v g池化方法代替m a x池化方法,对于英文和韩文影评语料,均取得较好的标注正确率。

目前,多数用于情感分类标注任务的C N N模型,在基础结构上类似于文献[13 ]提出的C N N模型,具有以下特点:1) 与计算机视觉领域应用的深度C N N不同,一 般使用多种卷积层的并行结构,或者只有一个卷积层。

2) C N N卷积核的大小需要与词向量维度匹配,这使得卷积核至少在一个维度上比较大。

3) 通常使用全连接层作为分类器,将卷积层学 习到的语义特征表示映射到样本标记空间。

尽管上述C N N模型在处理情感分类标注时,特别是情感二分类标注任务,应用效果良好,但是此类模型存在2个问题:1)受并行结构的限制,多提取一种窗口类型的局部语义特征需要增加一种并行的卷积层,模型在训练和预测过程中的计算量会大幅增加;2)作为分类器的全连接层参数量过大,特别是以多种窗口的局部语义特征向量作为输入的全连接层,使模型的训练和预测计算量增大,降低了模型速度,还会造成过拟合。

针对以上问题,本文提出G M P-C N N模型对文本进行情感分类标注。

2 G M P-C N N 模型如图1所示,经典的C N N模型解决情感分类标注问题时,通常采用多个池化层并行的结构。

相关文档
最新文档