基于卷积神经网络的文本分类研究综述

合集下载

卷积神经网络研究综述

卷积神经网络研究综述

卷积神经网络研究综述一、引言卷积神经网络(Convolutional Neural Network,简称CNN)是深度学习领域中的一类重要算法,它在计算机视觉、自然语言处理等多个领域中都取得了显著的成果。

CNN的设计灵感来源于生物视觉神经系统的结构,尤其是视觉皮层的组织方式,它通过模拟视觉皮层的层级结构来实现对输入数据的层次化特征提取。

在引言部分,我们首先要介绍CNN的研究背景。

随着信息技术的飞速发展,大数据和人工智能逐渐成为研究的热点。

在这个过程中,如何有效地处理和分析海量的图像、视频等数据成为了一个亟待解决的问题。

传统的机器学习方法在处理这类数据时往往面临着特征提取困难、模型复杂度高等问题。

而CNN的出现,为解决这些问题提供了新的思路。

接着,我们要阐述CNN的研究意义。

CNN通过其独特的卷积操作和层次化结构,能够自动学习并提取输入数据中的特征,从而避免了繁琐的特征工程。

同时,CNN还具有良好的泛化能力和鲁棒性,能够处理各种复杂的数据类型和场景。

因此,CNN在计算机视觉、自然语言处理等领域中都得到了广泛的应用,并取得了显著的成果。

最后,我们要介绍本文的研究目的和结构安排。

本文旨在对CNN 的基本原理、发展历程和改进优化方法进行系统的综述,以便读者能够全面了解CNN的相关知识和技术。

为了达到这个目的,我们将按照CNN的基本原理、发展历程和改进优化方法的顺序进行论述,并在最后对全文进行总结和展望。

二、卷积神经网络基本原理卷积神经网络的基本原理主要包括卷积操作、池化操作和全连接操作。

这些操作共同构成了CNN的基本框架,并使其具有强大的特征学习和分类能力。

首先,卷积操作是CNN的核心操作之一。

它通过一个可学习的卷积核在输入数据上进行滑动窗口式的计算,从而提取出输入数据中的局部特征。

卷积操作具有两个重要的特点:局部连接和权值共享。

局部连接意味着每个神经元只与输入数据的一个局部区域相连,这大大降低了模型的复杂度;权值共享则意味着同一卷积层内的所有神经元共享同一组权值参数,这进一步减少了模型的参数数量并提高了计算效率。

卷积神经网络研究综述

卷积神经网络研究综述

卷积神经网络研究综述作者:李炳臻刘克顾佼佼姜文志来源:《计算机时代》2021年第04期摘要:回顾了卷积神经网络的发展历程,介绍了卷积神经网络的基本运算单元。

在查阅大量资料基础上,重点介绍了有代表性的AlexNet、VGGNet、GoogLeNet、ResNet等,对他们所用到的技术进行剖析,归纳、总结、分析其优缺点,并指出卷积神经网络未来的研究方向。

关键词:卷积神经网络; AlexNet; VGGNet; GoogLeNet; ResNet中图分类号:TP399 文献标识码:A 文章编号:1006-8228(2021)04-08-05Absrtact: This paper reviews the development of convolutional neural networks, and introduces the basic operation unit of convolutional neural networks. On the basis of consulting alarge amount of information, this paper focuses on the representative convolutional neural networks such as AlexNet, VGGNet, GoogLeNet and ResNet etc., analyzes the technologies they used,summarizes and analyzes their advantages and disadvantages, and points out the future research direction of convolutional neural networks.Key words: convolutional neural networks; AlexNet; VGGNet; GoogLeNet; ResNet0 引言卷積神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算并且含有深层次结构的深度前馈神经网络,是深度学习的代表算法之一[1-2],21世纪后,随着深度学习理论的提出和数值计算设备的改进,卷积神经网络得到了快速发展。

基于深度学习的大规模文本数据分类算法研究

基于深度学习的大规模文本数据分类算法研究

基于深度学习的大规模文本数据分类算法研究1. 前言在如今信息爆炸的时代,大量的文本数据被生成并存储,其中蕴含着海量的知识和价值。

如何高效地从这些文本数据中提取出有效的信息,成为了现代社会中重要的研究方向之一。

而文本分类技术,作为处理文本数据的基础技术之一,自然成为了研究的热点。

近年来,由于深度学习技术的发展和应用,深度学习方法在文本分类领域也取得了很大的成功,成为了一种热门的文本分类方法。

本文旨在介绍基于深度学习的大规模文本数据分类算法,着重探讨其原理、特点、应用等方面,以期为读者提供一个清晰的认识和了解。

2. 基本原理深度学习是一种基于神经网络的机器学习方法,具有自动学习和自适应能力。

而文本分类是指将文本数据划分为不同的类别,如正面评论、负面评论、新闻等。

在深度学习中,通常采用词向量表示文本,并通过多层神经网络将词向量映射到标签空间中进行分类。

具体地,基于深度学习的文本分类方法可以分为两类:(1)基于卷积神经网络(CNN)的文本分类方法卷积神经网络是一类神经网络模型,其主要用于处理具有网格化结构(如图像)的数据。

在文本分类中,通常将单词序列看作一种类似图像的结构,然后应用卷积运算提取特征,最后通过全连接层将提取到的特征映射到标签空间中进行分类。

(2)基于循环神经网络(RNN)的文本分类方法循环神经网络是一种具有记忆能力的神经网络,其特点在于可以处理不定长的序列数据。

在文本分类中,通过对文本序列进行循环神经网络以及LSTM(长短期记忆神经网络)等处理,将序列信息压缩成一个定长的向量表示,再通过全连接层进行分类。

3. 特点分析相较于传统的基于特征工程的文本分类方法,基于深度学习的文本分类方法具有如下优点:(1)自动学习特征:深度学习方法可以自动学习文本中的特征,不需要手动设计特征模板,大大提高了文本分类效率和准确率。

(2)最大程度保留文本信息:深度学习方法可以最大程度地保留文本信息,在处理长文本数据时,能够发挥更好的作用。

基于深度学习的文件分类与整理技术研究

基于深度学习的文件分类与整理技术研究

基于深度学习的文件分类与整理技术研究文件是我们日常工作和生活中不可避免的一部分,然而,由于文件数量的增长和种类的多样化,文件的分类、整理和管理变得越来越困难。

为了解决这一问题,人们开始利用技术手段来帮助我们自动化地分类和整理文件。

随着深度学习技术的发展,基于深度学习的文件分类和整理技术也开始受到人们的关注。

深度学习是机器学习的重要分支,通过对大量数据的学习和模式识别,可以实现自主学习和自适应。

基于深度学习的文件分类和整理技术,利用计算机自动学习文件特征和分类规则,实现自动化的整理和分类。

这种技术可以大大减轻人们的工作负担,提高效率,提高精确度,有效地解决了文件管理和分类的难题。

基于深度学习的文件分类和整理技术主要有以下几种:一、基于卷积神经网络的文件分类技术卷积神经网络是当前计算机视觉领域最先进的技术之一,可以处理图像、视频、语音等复杂数据。

利用卷积神经网络,我们可以将文件中的图像、文本等特征进行提取和学习,识别文件的类型和内容,并进行分类和整理。

这种方法可以应用于各种文件类型,如图片、音频、视频等,实现全面的文件整理和管理。

二、基于循环神经网络的文件分类技术循环神经网络是一种特殊的神经网络,可以对时序数据进行处理和学习,如语音、文本等。

在文件分类和整理中,我们可以利用循环神经网络对文件进行语义分析和分类。

通过对文件中的语义和内容进行分析,将文件分为不同的类别,如合同、报告、电子邮件等。

这种方法可以实现精准的文件分类和整理,提高工作效率。

三、基于深度学习的文本分类技术文本分类是文件分类和整理中的重要部分,很多文件都是由文本组成的,如电子邮件、报告、论文等。

基于深度学习的文本分类技术可以自动学习文本的特征和模式,实现快速和准确的文本分类。

该技术可以应用于各种文本类型,如电子邮件分类、报告分类等。

四、基于深度学习的图像分类技术基于深度学习的图像分类技术可以实现对文件中的图像进行分类和整理。

该技术可以学习图像的特征和模式,并将图像分为不同的类别,如照片、图纸、图表等。

基于深度学习的文本分析技术研究

基于深度学习的文本分析技术研究

基于深度学习的文本分析技术研究近年来,随着人工智能技术的发展,深度学习作为其中的一个重要组成部分,已经在很多领域中得到广泛的应用。

在自然语言处理领域中,基于深度学习的文本分析技术,也受到了越来越多研究者和企业的关注。

一、深度学习与文本分析技术深度学习是一种机器学习方法,通过建立多层神经网络模型,实现对于数据的高层次表达和抽象。

在文本分析领域中,深度学习算法能够有效地实现自然语言处理任务,例如文本分类、情感分析、语言模型等。

文本数据是指以文本形式呈现的信息,是互联网上最丰富的数据之一。

可以通过深度学习算法,对于这些文本数据进行分析和挖掘,实现对于信息的抽取和自动处理。

此外,在社交网络、电商平台、新闻传媒等领域中,对于大量的文本数据分析和处理,也需要基于深度学习的文本分析技术。

二、基于深度学习的文本分类技术文本分类是指根据文本的主题、内容、表达方式等,将文本进行分类和归纳。

基于深度学习的文本分类技术,主要有卷积神经网络(CNN)、长短时记忆网络(LSTM)、注意力模型等。

卷积神经网络是一种常用的深度学习模型,经常用于图像、视频等非结构化数据的分类任务。

在文本分类领域中,卷积神经网络可以通过卷积操作对于不同长度的文本进行特征抽取,并通过池化操作实现特征的压缩和综合。

基于卷积神经网络的文本分类模型,可以实现高精度和高效率的文本分类。

长短时记忆网络是一种常用于序列数据处理的深度学习模型,能够通过神经网络学习序列中的长时依赖关系。

在文本分类领域中,长短时记忆网络可以用于处理对于长文本的分类任务。

通过将文本数据转化为序列数据,将其输入到长短时记忆网络中,可以实现高精度的文本分类。

注意力模型是一种用于指导深度学习模型关注输入数据重要部分的方法。

在文本分类领域中,注意力机制可以通过动态地调整不同序列位置的权重,实现对于文本数据的重点关注和挖掘。

基于注意力模型的文本分类算法,在提高文本分类精度的同时,还能够实现对于文本内容的深入理解和挖掘。

基于卷积神经网络的手写文字识别技术研究

基于卷积神经网络的手写文字识别技术研究

基于卷积神经网络的手写文字识别技术研究一、引言手写文字识别技术是指将手写的文字图像数字化,并通过计算机程序对其进行识别和转换成计算机可以处理的文本。

随着人工智能技术的不断发展和卷积神经网络的崛起,手写文字识别技术在各个领域都得到了广泛的应用,尤其是在金融、教育和政府等领域中。

本文将介绍基于卷积神经网络的手写文字识别技术的研究进展,并分析其优势和不足之处。

二、手写文字识别技术的应用领域1.金融领域:手写签名验证、支票识别、汇票识别等。

2.教育领域:学生手写笔记数字化、自动批改考卷等。

3.政府领域:身份证、驾驶证、户口本等证件的信息识别和管理。

4.其他领域:邮政编码、手写邮件识别等。

三、基于卷积神经网络的手写文字识别技术原理1. 卷积神经网络卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,常用于识别图像和视频等数据。

卷积神经网络由多层卷积和池化层组成,其中卷积层负责提取输入数据中的特征,而池化层将卷积层输出的特征压缩成更小的维度。

2. 手写文字识别技术原理手写文字识别技术将一张手写文字的图像输入到卷积神经网络中,经过卷积层和池化层的处理后,将提取的特征输入到全连接层中进行分类识别。

手写文字识别技术的关键在于如何对手写文字进行数字化,一般采用灰度化处理、二值化处理、噪声去除等方法来提取手写文字特征。

四、基于卷积神经网络的手写文字识别技术的应用案例1. 阿里云的手写文字识别API阿里云的手写文字识别API可以识别手写中文、英文和数字,且支持批量识别和在线调试。

其采用深度学习技术,基于卷积神经网络,可以在保持准确性的同时提高识别速度。

2. Baidu OCRBaidu OCR是百度公司推出的一款OCR识别产品,支持对身份证、驾驶证、银行卡、名片、票据、手写文字等多种类型的图片进行识别。

其采用了卷积神经网络和循环神经网络相结合的方式,可以有效提高识别准确率。

基于神经网络的文本分类及情感分析研究

基于神经网络的文本分类及情感分析研究

基于神经网络的文本分类及情感分析研究概述:在信息爆炸时代,海量的文本信息使得对文本进行分类和情感分析展现出了巨大的研究和应用价值。

神经网络作为一种强大的机器学习方法,在文本分类和情感分析中取得了很大的成功。

本文将重点探讨基于神经网络的文本分类和情感分析的研究领域。

一、神经网络在文本分类中的应用1.1 神经网络基本原理神经网络是基于生物神经系统的思维方式和信息处理机制,模拟人脑中的神经元和突触间的连接进行信息处理和学习。

常用的神经网络模型有多层感知器(MLP)、卷积神经网络(CNN)和循环神经网络(RNN)。

1.2 文本分类任务文本分类是将一段文本分配到预定义的类别或标签中的任务。

它可以用于情感分析、垃圾邮件过滤、新闻分类等领域。

神经网络通过学习文本的特征和模式,在文本分类任务中取得了显著的成果。

1.3 神经网络在文本分类中的应用神经网络在文本分类中具有许多优势,包括强大的非线性表达能力、自动提取特征和模式的能力、能够处理上下文信息等。

常见的应用包括基于词向量的文本分类、基于卷积神经网络的文本分类和基于循环神经网络的文本分类等。

二、神经网络在情感分析中的应用2.1 情感分析概述情感分析是指从文本中识别和提取情感信息的过程。

情感分析可以分为情感极性分析和情感强度分析。

其中,情感极性分析旨在判断文本的情感倾向,如积极、消极或中性;情感强度分析则是评估情感的强度大小。

2.2 神经网络在情感分析中的应用神经网络在情感分析中有着广泛的应用,能够从海量数据中提取有关情感的特征和模式。

情感分析的神经网络模型可以包括卷积神经网络、长短时记忆网络(LSTM)和门控循环单元(GRU)等。

2.3 神经网络在情感分析中的性能评估为了评估神经网络在情感分析中的性能,常用指标包括准确率、精确率、召回率和F1值等。

此外,还可以采用交叉验证和混淆矩阵等方法进行评估。

三、神经网络在文本分类与情感分析中的应用案例3.1 社交媒体情感分析社交媒体中的用户评论和推文等包含大量的情感信息。

文本分类模型综述

文本分类模型综述

文本分类模型综述文本分类模型是自然语言处理领域的一个重要研究方向,其目标是根据文本内容将文档或句子划分到预定义的类别中。

在过去几年里,随着深度学习技术的发展,文本分类模型取得了显著的进展。

下面我将从几个方面对文本分类模型进行综述。

首先,传统的文本分类模型包括基于词袋模型的朴素贝叶斯分类器、支持向量机(SVM)、决策树等。

这些模型通常使用手工设计的特征来表示文本,例如词频、TF-IDF值等,然后将这些特征输入到分类器中进行训练。

虽然这些模型在某些任务上表现良好,但它们往往无法很好地捕捉词语之间的语义关系,因此在处理复杂的自然语言任务时表现不佳。

其次,随着深度学习的兴起,基于神经网络的文本分类模型逐渐成为主流。

其中,卷积神经网络(CNN)和循环神经网络(RNN)是两种常用的架构。

CNN在文本分类中被广泛应用,通过卷积操作可以捕捉局部特征,并且可以通过多层卷积层来学习不同层次的语义信息。

而RNN则擅长捕捉文本中的顺序信息,尤其适用于处理序列文本数据。

除此之外,长短时记忆网络(LSTM)和门控循环单元(GRU)等RNN的变种也被广泛用于文本分类任务中。

另外,近年来,预训练模型如BERT、GPT等的出现极大地推动了文本分类模型的发展。

这些模型在大规模语料上进行预训练,然后在特定任务上进行微调,取得了极好的效果。

通过预训练模型,模型可以学习到更加丰富和抽象的语义信息,从而在文本分类任务上取得了极大的突破。

总的来说,文本分类模型在传统机器学习和深度学习的推动下取得了长足的进步,未来随着技术的不断发展,相信会有更多更有效的模型被提出,为文本分类任务带来更好的解决方案。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第34卷第3期2019年5月内蒙古民族大学学报(自然科学版)Journal of Inner Mongolia University for NationalitiesVol.34No.3May2019基于卷积神经网络的文本分类研究综述裴志利1,阿茹娜2,姜明洋2,卢奕南3(1.内蒙古民族大学计算机科学与技术学院,内蒙古通辽028043;2.内蒙古民族大学数学学院,内蒙古通辽028000;3.吉林大学计算机科学与技术学院,吉林长春130012)[摘要]随着互联网及其相关技术的高速发展,网络数据呈现出井喷式的增长,其中主要以文本的形式大量存在,数据在这种增长趋势下,文本分类已经成为越来越重要的研究课题.如今,采用深度学习技术对文本进行表示受到研究者的极大关注.如采用卷积神经网络对文档进行表示和分类等自然语言处理.本文主要对基于卷积神经网络的文本分类方法进行了研究,介绍了几个具有代表性的卷积神经网络模型结构.最后提出了对基于该方法文本分类的展望.[关键词]卷积神经网络;文本分类;深度学习[中图分类号]TP393[文献标识码]A[文章编号]1671-0815(2019)03-0206-05Survey of Text Classification Research Based onConvolutional Neural NetworksPEI Zhi-li1,Aruna2,JIANG Ming-yang2,LU Yi-nan3(1.College of Computer Science and Technology,Inner Mongolia University for Nationalities,Tongliao028043,China;2.College of Mathematics,Inner Mongolia University for Nationalities,Tongliao028000,China;3.College of Computer Science and Technology,Jilin University,Changchun130012,China)Abstract:With the rapid development of the Internet and related technologies,network data has shown a spurt growthtrend,which mainly exists in the form of text.Under this growth trend,text classification has become an increasinglyimportant research topic.The use of deep learning technology to express the text has received great attention.For example,natural language processing such as convolutional neural network is used to represent and classify documents.The textclassification method based on convolutional neural network is investigated.Several representative convolutional neuralnetwork model structures are introduced.Finally,the prospect of text classification based on this method is proposed.Key wrrds:Convolutional neural network;Text classification;Deep learning0引言随着网络媒体的出现,用户生成的内容以飞快的速度填充数据资源,这些数据的自动处理引起了研究者的巨大关注.文本分类是自然语言处理领域的重要任务,包括情感分析、对话分析、文献综述、机器翻译等[1].文本分类具有多种方法,传统的机器学习分类算法有支持向量机算法(Support Vector Machine,SVM)[2]、朴素贝叶斯算法(Naive Bayesian Classifier,NBC)[3]、决策树算法(Decision Tree,DT)[4]、K-最近邻算法(K-Nearest Neighbor,KNN)[5]等,采用传统算法文本分类时需要人工进行特征提取,耗费时间和精基金项目:国家自然科学基金项目(61672301);内蒙古自治区“草原英才”工程产业创新人才团队(2017);内蒙古自治区科技创新引导奖励资金项目(2016);内蒙古民族大学特色交叉学科群建设项目(MDXK004);2019年度内蒙古自治区高等学校“青年科技英才支持计划”(NJYT-19-B18)作者简介:裴志利,内蒙古民族大学计算机科学与技术学院教授,博士.DOI:10.14045/ki.15-1220.2019.03.005第3期裴志利等:基于卷积神经网络的文本分类研究综述力,此外文本数据具有高维度、稀疏的特点.为了解决这些问题,2006年Hinton 提出深度学习(Deep learning )的概念[6].其中,卷积神经网络(Convolutional Neural Networks,CNN)是典型的深度学习技术,已在语音识别和图像识别等领域中成功应用且取得了很好的成果,使得很多国内外学者尝试利用CNN 对文本进行特征提取,去掉繁杂的人工特征工程[7].该方法不仅分类效果优于传统算法且使用方便,也是十分值得关注的一套框架.在CNN 应用拓展方面,如何合理充分利用该方法增强传统学习算法的性能仍是文本分类领域的研究重点[8].本文主要介绍了以下内容:卷积神经网络用于句子分类方法、动态卷积神经网络文本分类方法、基于卷积神经网络句子匹配模型、基于循环和卷积神经网络的文本分类研究方法等.1深度学习深度学习中的“深度”是相较于浅层机器学习方法而言的,是当前机器学习领域的研究热点.它的概念起源于人工神经网络,人工神经网络也算是基于深度学习方法的统一称呼,人工神经网络起始于上世纪40年代,主要是通过尝试模拟人脑视觉机理来解决各种机器学习问题[9].Hinton 提出的深度学习网络模型为基于非监督贪心逐层训练方法的深度置信网络,这种模型的训练方式解决了深度学习的优化问题[10].此外,Lecun 等人于1998年提出的CNN 是第一个真正意义上的多层结构学习算法[11].2卷积神经网络文本分类模型2.1CNN 概述在机器学习领域,CNN 是一种深度前馈神经网络,在分类和图像识别等领域已有显著成效,而且还成功应用于机器人和自动驾驶汽车的视觉模块,使其能够成功的识别人脸,物体和交通标志.CNN 是由多层感知机(MLP)变化而来的,基于生物学家休博尔和维瑟尔在早期对猫视觉皮层的研究,视觉皮层的细胞存在一个复杂的构造,这些细胞对视觉输入空间的子区域非常敏感,我们称之为感受野,以这种方式平铺覆盖到整个视野区域[12].CNN 作为目前最常用的深度模型之一,最初只适合做简单图片的识别,到现今已能够处理大规模数据,表明了CNN 所具有的潜力.2.2文本分类过程文本分类是指对给出的文本集按照一定的分类体系或标准进行分类和标记.文本分类过程主要包括文本预处理、文本表示、特征提取和数据分类[13].具体文本分类流程图如下:2.3CNN 文本分类经典结构CNN 基本结构主要包括输入层、卷积层、池化层、全连接层和输出层[14].(1)输入层:文本是以字或词为单位的向量集合,采用词向量作为输入层数据.为了将文本转化为可计算的数据类型,常用的词向量方法有word2vec、one-hot 或glove 等.向量表示层的主要任务就是将文本转化为向量矩阵,为卷积层提供完整数据.(2)卷积层:卷积层是整个CNN 的核心部分,主要的作用是提取文档矩阵的特征,通过设置卷积核的尺寸,可提取多种层次的特征,相比于全连接层,卷积层主要训练的是卷积核的各个参数.通过卷积运算可以使原信号特征增强,并且降低噪音[15].图1文本分类流程图Fig.1Flow chart of text classification207内蒙古民族大学学报2019年(3)池化层:池化层也称之为子采样层(pooling layer),主要的作用在于压缩由卷积层得到的矩阵尺寸,为下一层的全连接层减少训练参数,因此子采样层不仅可以有效的加速模型的训练,而且还在防止过饱和现象上有很大的作用.池化操作的原理较为简单,如果取某个矩阵块的最大值或平均值作为池化过程的输出值,则该过程被称之为最大池化(Max pooling)或平均池化层.实际上池化层也可以看作是一种特殊的卷积操作.(4)全连接:在许多分类任务中,网络经过卷积层和子采样层之后是一个或多个全连接层.全连接层与前一层所有神经元相连,以获取文本的局部信息,学习得到文本中具有类别区分的特征.最后一个全连接层与分类层相连,即输出层[16].(5)输出层:经过卷积层和池化层的操作后,已经提取了更高层次的特征,利用全连接的神经网络即可完成分类输出.输出层主要承接全连接层的输出,进一步用于分类,将输出层的值进行归一,并得到各个类别的概率分布[17].3几种CNN文本分类方法3.1CNN用于句子分类文献[18]提出了一种利用CNN完成句子分类的方法,采用的CNN结构比较简单.第一层均由一行行词向量矩阵组成,其次是卷积层,接着是Max-pooling最后一层是全连接的Softmax层,输出概率分布.通常一个卷积核只能提取一个特征,文献[18]中的模型是用多个卷积核(不同的大小)来获取多个特征.即使用长度不同的卷积核对文本矩阵进行卷积,然后使用Max pooling对每一个卷积核提取的向量进行操作,最后每一个卷积核对应一个数字,把这些卷积核连接起来,即得到了一个表示该句子的词向量,其输出是标签上的概率分布.该方法的最终目的是捕获最重要的特征,即一个具有最高价值的特征.作者通过该模型改善了情绪分析和问题分析等任务.该模型作为一个非常经典的模型,被很多其他CNN文本分类领域的论文作为实验参照.具体结构如图2所示.waitforthevideoanddotrentitFully connected layerwith dropout andsoftmax output n×k representation of sentencewith static of non-static channelsConvolutional layer with multiplefilter widths and feature mapsMax-over-time pooling图2例句中两个通道的模型体系结构Fig.2Model architecture with two channels for an example sentence3.2一种动态CNN文本分类模型文献[19]提出了一种动态卷积神经网络模型(Dynamic Convolutional Neural Network,DCNN),模型使用动态K-Max pooling,这是一种针对线性序列的全局池化操作.相比于文献[18]中的结构,文献[19]中的CNN结构更加复杂,模型中的卷积层使用了宽卷积,得到的特征图宽度比传统卷积的宽.卷积时用相同的汉语语言题型的卷积窗口在句子的每个位置进行卷积操作,这样可以根据位置独立地提取特征.池208209第3期裴志利等:基于卷积神经网络的文本分类研究综述化层使用了K-max pooling和动态K-Max pooling,K-Max pooling可以提取句子中活跃的特征(不止一个)同时保留它们的相对顺序.动态K-Max pooling是从不同长度的句子中提取出相应数量的语义特征信息,达到后续卷积层的统一性.该模型在小规模二元、多类情感预测、六项问题分类、双向情感检测四项实验中测试了DCNN,通过上述四项实验验证了高性能情感分类无需外部解析或提供其他资源的功能.具体结构如图3所示.K-max poolingFoldingWide convolution(m=2)Dynamic K-MaxWide convolution(m=2)Projected sentenceThe cat sat on the red mat图3动态k-max pooling操作的动态卷积神经网络结构Fig.3Dynamic convolution neural network structure for dynamic k-max pooling operation3.3一种基于CNN句子匹配模型文献[20]提出了适应于两个句子匹配的CNN模型,该模型将卷积与自然语言相结合.在文献[19]所采用的模型结构中,第一个卷积层后采用了简单的Max-Pooling方法,后面的池化层都是一种动态池化方法.模型不仅可以很好地表示句子的层次结构及其分层的位置,还可以通过它们的层次进行组合和池化,进而捕捉不同层次的匹配验证信息.该模型不需要自然语言的先验知识,因此可以应用于匹配不同性质和匹配不同语言的任务,实验研究表明了该模型的有效性及其相对于传统模型的优越性.3.4基于循环和CNN的文本分类研究文献[21]提出了结合循环网络和CNN的文本分类模型.该模型中使用词向量作为输入,用循环网络对文档进行表示,然后采用CNN对文档进行有效的特征提取,最后采用softmax回归进行分类.循环网络能够提取到词与词之间的关系,而CNN能够很好的提取出有用的特征.该模型在情感分类的电影评论数据集、包含主客观句子的情感分析数据集、二分类的情感分析数据集、问题分类任务数据集等六个文本分类任务中进行实验测试.作者通过上述实验证明了该模型能够很好的完成文本分类任务,且在分类任务上能够得到较好的性能.4未来展望通过上述研究方法,对基于CNN文本分类领域的展望如下:(1)CNN文本分类方面仍有大量工作需要研究,目前的关注点还是从机器学习领域借鉴一些可以在CNN使用的方法,特别是降维和词向量表示等.(2)尽管卷积神经网络在很多任务中有不错的表现,但还需要注意固定卷积核大小,如何最快的得到超参调节等繁琐的问题.210内蒙古民族大学学报2019年(3)目前应用于文本分类的算法有传统算法和其他深度学习的算法,以后研究学者会更加关注CNN 与这些算法的融合应用.5结束语本文首先给出了在解决文本分类任务中存在的问题,介绍了卷积神经网络的概念及其卷积神经网络文本分类的一般过程,说明了该网络在文本分类中的重要性;其次介绍了几种典型的用于文本分类的模型;最后给出了对基于CNN文本分类的展望.希望本文使读者对该领域有一个比较直观、清晰的认识,为以后的研究工作起到指引作用.参考文献[1]Yan Danfeng,Ke Nan,Gu Chao,et al.Multi-label text classification model based on semantic embedding[J].The Journal of China Universities of Posts and Telecommunications:1-11[2019-03-29].[2]尹旭东.基于并行SVM算法的中文文本分类方法研究[D].吉林:吉林大学,2018.[3]邹晓辉.朴素贝叶斯算法在文本分类中的应用[J].数字技术与应用,2017(12):132-133.[4]林炎钟.基于决策树分类算法的Web文本分类研究[D].苏州:江苏科技大学,2011.[5]闫晨.KNN文本分类研究[D].秦皇岛:燕山大学,2010.[6]Hinton G,Salakhutdinov R R.Reducing the dimensionality of date neural network[J].Science,2006,313,(5786):504-507.[7]Zhang Y,Wallace B.A sensitivity analysis of(and practitioners’guide to)convolutional neural network for sentence classification[J].Computer Research Repssitory,2015,16(1):105-119.[8]张曼,夏战国,刘兵,等.全卷积神经网络的字符级文本分类方法[J].计算机工程与应用,1-11[2019-05-05].[9]齐凯凡.基于卷积神经网络的新闻文本分类问题研究[D].西安:西安理工大学,2018.[10]Hinton G E,Osindero S,The Y W.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18(7): 1527-1554.[11]Lecun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to document recognition[J].Proceeding of the IEEE:1998(11):2278-2324.[12]孙璇.基于卷积神经网络的文本分类方法研究[D].上海:上海师范大学,2018.[13]侯小培,高迎.卷积神经网络CNN算法在文本分类上的应用研究[J].科技与创新,2019(4):158-159.[14]Qin P,Xu W,Guo,J.An empirical convolutional neural network approach for semantic relation classification.Neurocomputing,2016,190:1-9.[15]杨真真,匡楠,范露,等.基于卷积神经网络的图像分类算法综述[J].信号处理,2018,34(12):1474-1489.[16]马骁.基于深度卷积神经网络的图像语义分割[D].北京:中国科学院大学(中国科学院光电技术研究所),2018.[17]汪岿,费晨杰,刘柏嵩.融合LDA的卷积神经网络主题爬虫研究[J].计算机工程与应用,1-11[2019-03-15].[18]Kim Y.Convolutional Neural Networks for Sentence Classification[J].computer scien,2014,1408:5882.[19]Kalchbrenner N,Grefenstette E,Blunsom P.A convolutional neural network for modelling sentences[J].computer science,2014,1404:2188.[20]Hu B,Lu Z,Li H,et al.Convolutional neural network architectures for matching natural language sentences[C]// Advances in Neural Information Processing Systems,2014:2042-2050.[21]刘腾飞,于双元,张洪涛,等.基于循环和卷积神经网络的文本分类研究[J].软件,2018,39(1):64-69.[责任编辑郑瑛]。

相关文档
最新文档