微博短文本细粒度情感分析毕业设计论文

合集下载

微博情感分析技术的研究与应用案例分析

微博情感分析技术的研究与应用案例分析

微博情感分析技术的研究与应用案例分析近年来,随着互联网的普及和社交媒体的兴起,越来越多的人选择在微博上分享自己的生活、情感和观点。

随着微博使用者数量的不断增加,了解和分析微博用户的情感变得尤为重要。

微博情感分析技术的研究与应用不仅是对人类情感世界的一次探索,还具有广泛的实际应用价值。

一、微博情感分析技术的背景与意义微博情感分析技术旨在通过对微博用户的发言进行分析,自动判断用户在微博上表达的情感倾向。

这项技术的研究和应用,可以为广告营销、舆情监控、情感识别等领域提供支持。

例如,通过对用户对某个品牌的情感倾向进行分析,企业可以调整自己的营销策略以提升用户的好感度和忠诚度。

二、微博情感分析技术的研究方法微博情感分析技术的研究方法主要包括文本预处理、特征提取和情感分类三个步骤。

在文本预处理阶段,研究人员会通过分词、去除停用词等方式对微博文本进行处理,以便后续的特征提取和分类。

特征提取阶段通过词袋模型、TF-IDF等方法将文本特征转化为数值特征。

最后,在情感分类阶段,研究人员会使用机器学习算法如支持向量机、朴素贝叶斯等对微博情感进行分类。

三、微博情感分析技术的应用案例分析微博情感分析技术的应用案例丰富多样。

以下是一些实际应用案例的分析:1. 舆情分析舆情分析是微博情感分析技术最常见的应用领域之一。

通过对用户在微博上的发言进行情感分析,可以判断公众对某一事件或话题的情感倾向。

这对于政府、企业以及媒体等机构来说,可以及时了解和回应公众的需求和抱怨,从而改善形象或优化政策。

2. 情感营销微博情感分析技术也被广泛应用于情感营销。

通过分析用户在微博上对某个品牌的情感倾向,企业可以了解用户对产品或服务的喜好和不满之处,并根据分析结果调整自己的营销策略。

例如,某品牌的微博情感分析结果显示大多数用户对该品牌的评价较为负面,企业可以通过改善产品质量或推出促销活动来提升用户的满意度。

3. 情感监控微博情感分析技术还可以应用于情感监控。

微博情感分析方法与应用研究

微博情感分析方法与应用研究

微博情感分析方法与应用研究情感分析是一种通过计算机技术来分析文本所表达情感的方法。

随着社交媒体的兴起,人们在微博等平台上分享情感和观点的数量不断增加,使得情感分析成为了一个热门的研究领域。

本文将介绍微博情感分析的方法和应用,并对其研究现状进行总结。

一、微博情感分析的方法1.文本预处理在进行情感分析之前,首先需要对微博文本进行预处理,包括去除停用词、分词和词形还原等。

去除停用词可以提高算法的效率,并减少干扰因素。

分词将文本分解成单个词或短语,使得计算机能够理解和处理文本。

词形还原可以将词语还原为其原始形态,以便更好地捕捉文本的语义。

2.特征提取特征提取是情感分析的关键步骤之一。

常用的特征包括词频、TF-IDF、词向量等。

词频是指某个词在文本中出现的次数,可以用来表示该词对情感的贡献程度。

TF-IDF(Term Frequency-Inverse Document Frequency)则是一种用来衡量词语重要性的方法,它考虑了词语在文本中的频率以及在整个语料库中的重要程度。

词向量是一种将词语映射到向量空间的方法,通过计算词语之间的相似度来表征它们的语义关系。

3.情感分类算法情感分类是微博情感分析的核心任务,常用的分类算法包括朴素贝叶斯、支持向量机、决策树、神经网络等。

朴素贝叶斯算法是一种基于贝叶斯定理和特征条件独立性假设的分类算法,它在文本分类任务中表现出较好的效果。

支持向量机是一种通过在高维空间中构建超平面来进行分类的算法,它具有较强的泛化能力。

决策树是一种将数据集划分为多个子集,并根据特征的取值来决定分类的算法,它易于理解和解释。

神经网络是一种模仿人脑神经元网络结构进行学习和计算的算法,它可以通过多层非线性变换来学习微博文本的语义特征。

二、微博情感分析的应用1.舆情监测微博情感分析可以对用户发布的微博进行情感极性分类,以判断用户对特定事件、产品或服务的情感倾向。

舆情监测能够帮助企业、政府等实时了解公众对其品牌、政策等的看法和态度,从而及时调整战略和采取应对措施。

基于微博情感分析的分词方法的研究大学论文

基于微博情感分析的分词方法的研究大学论文

本科学生毕业设计基于微博情感分析的分词方法的研究系部名称:专业班级:学生姓名:指导教师:职称:黑龙江工程学院二○一五年六月摘要数十年来,我们从几台电脑发展到家家户户存在多台电脑,从没有渠道了解实事到评论各种社会新闻、明星八卦、微博、状态、说说、朋友圈等主客观文本信息。

微博,我个人认为是迷你日志,也就是公共可观赏的概括日记。

是一类关于交友任意时间任意地点发送迷你生活状态的动态网页。

微博共享和交流的信息,其更在意的是时刻和自变量。

这里的情感分析也叫做态度的提取,都指的是将训练数据中的情感、意见、爱恨提取出来。

主观的训练数据(也就是语义态度)在中国其研究情绪十分高涨,倾向于探究文本中包涵的情感是主观还是客观,褒义还是贬义的特点。

本文认为,微博的情感倾向性与所用的分词方法、褒贬义的强度、主客观的强度等因素有关。

所以本文提出了一个以几种分词方法为主要的微博情感分析研究,选择bi-gram、斯坦福、中科院、哈工大作为微博的特征,以逻辑回归的模型作为此系统的机器学习机制,利用标注为主、客观的微博训练数据获得基于逻辑回归模型的主客观分析模型。

这系统执行后,得出结论:总体来说,斯坦福中文分词,中科院中文分词,哈工大中文分词都是非常值得我们提倡的分词工具,但由于微博语言是一种非严肃的迷你日志,存在误导如表情符号、错别字等,这三种分词工具在微博语料上的分词效果并不理想,而n-gram分词在形势上对微博语料的分词更有效。

由于评测时间比较仓促,在评测过程中也出现了一些错误,经过和参加单位的不断讨论,也进行了及时的修正;同时,对于评测方法的制定、评测指标的选择、人工标注的质量等都存在值得商榷的地方,需要进一步分析和完善。

关键词:微博;情感分析;中文分词方法; 逻辑回归ABSTRACTFor decades, we have developed from several computers to families exist multiple computers, and channels to understand the practical work to no comments from all kinds of mini log, also is the generalization of the public can see the diary. Is a kind of dating to send any time anywhere mini life state of dynamic webpages.Weibo sharing and communication of information, it is more concerned moment and the independent variables.The extraction of sentiment analysis also called attitude here, is refers to the training data are extracted from the feelings, opinions, love and hate.he subjective training data (that is, the semantic attitude) sentiment is running high in China, its research, tend to explore the inclusion in the text of the emotional it is subjective or objective, the characteristics of good or derogatory.Think, weibo emotion tendentiousness and the strength of the segmentation method, used by praise or blame righteousness, such as the strength of the subjective and objective factors.So this paper puts forward a word segmentation methods as the main weibo emotional analysis, choose the bi - "gramm, Stanford, the Chinese academy of sciences, Harbin institute of technology as a feature of weibo in a logistic regression model as a machine learning mechanism in the system, using the annotation is given priority to, objective weibo training data to obtain the subjective and objective analysis model based on logistic regression models.Carried out with this system, draw the conclusion: in general, the Stanford Chinese word segmentation, Chinese word segmentation of Chinese academy of sciences, Harbin institute of technology in Chinese word segmentation is a very worthy of we advocate segmentation tool, but as a result of weibo language is a kind of serious mini log, misleading as emoticons, wrong character, etc., the three segmentation tools on weibo corpus segmentation effect is not ideal, and n - "gramm participle in the situation to the microblogging corpus segmentation is more effective.Because evaluation time is hasty, there have been some mistakes in the evaluation process, through the constant discussion, and to participate in the unit.Also conducted a timely correction;At the same time, for the formulation of evaluation methods, the choice of evaluation indexes, the quality of the manualannotation.Where there is questionable, need further analysis and improvement. Keywords: Weibo;Sentiment analysis;Chinese word segmentation method;Logistic regression目录第一章绪论1.1课题的背景1.2国内外分词研究的现状1.3本文讨论的情况(情感分析上的应用)第二章几种常用分词方法2.1 工大分词2.2 中科院分词2.3 斯坦福分词2.4 n-gram分词第三章常用的分类器3.1 LR3.2 SVM3.2.1 SVM概述3.2.2 线性SVM方法3.2.3 非线性SVM方法3.2.4 核函数3.2.5 lib-SVM(仿真平台)3.3 比较分析第四章分词方法的比较分析4.1 实验数据4.2 实验设计4.3 评价指标4.4 实验结果比较第五章结论与展望致谢参考文献第一章绪论1.1课题的背景数十年来,我们从几台电脑发展到家家户户存在多台电脑,从没有渠道了解实事到评论各种社会新闻、明星八卦、微博、状态、说说、朋友圈等主客观文本信息。

微博文本情感分析的算法研究──以贝叶斯分类器为例

微博文本情感分析的算法研究──以贝叶斯分类器为例

微博文本情感分析的算法研究──以贝叶斯分类器为例微博(Weibo)是一种基于网络的社交媒体平台,人们可以在上面分享自己的想法、感受和经历。

由于微博上的信息非常丰富,人们越来越需要对微博文本进行情感分析,以便更好地理解和利用这些信息。

本文通过以贝叶斯分类器为例,介绍微博文本情感分析算法的研究。

1. 什么是贝叶斯分类器贝叶斯分类器是一个基于贝叶斯定理的统计学分类器。

它使用各种特征在数据集中的先验概率和条件概率来确定最终的分类。

贝叶斯分类器可以用于文本分类、垃圾邮件过滤等任务中。

2. 如何进行情感分析情感分析是通过评估文本中的情感来确定文本的情感倾向和情感类型的过程。

这可以通过机器学习算法来完成。

情感分析在社交媒体分析、品牌管理和市场营销等领域中非常有用。

在微博文本情感分析中,研究人员首先需要构建一个标注好的数据集,其中每个微博都被标记为积极、消极或中性。

然后将这些数据分成训练集和测试集。

接着,使用特征提取技术从每个微博中提取特征。

这些特征可以包括词频、词性、情感词列表等。

最后,使用机器学习算法训练模型,并将其测试在测试集上。

3. 贝叶斯分类器在微博情感分析中的应用贝叶斯分类器是微博文本情感分析的一种常用算法。

以下是贝叶斯分类器在微博情感分析中的应用步骤:(1)首先,收集微博数据集并标记每个微博的情感倾向(积极、消极、中性)。

(2)接下来,使用分词工具将微博划分成单词。

(3)使用特征提取工具从每个微博中提取有用的特征。

这些特征可以包括词频、词性、情感词列表等。

(4)使用贝叶斯分类器对微博进行分类。

根据提取的特征,计算每个微博属于不同情感类别的条件概率,然后选择具有最高概率的类别作为微博的情感倾向。

(5)评估模型性能。

使用测试集评估模型性能,计算准确度、召回率和F1分数。

4. 贝叶斯分类器的优缺点贝叶斯分类器的主要优点是:(1)它在处理大规模分类问题时效率高。

(2)模型可以在不断收集新数据时不断更新,因此可以用于在线学习。

面向微博文本的情感分析模型研究

面向微博文本的情感分析模型研究

面向微博文本的情感分析模型研究随着互联网和移动通讯的飞速发展,人们参与网络活动越来越频繁,微博每天都产生了大量数据,其包含了用户对事物的情感表达和评论分析,如何从这些信息中挖掘出情感倾向有着巨大的价值。

因此,本文对微博文本展开了情感分析模型的研究。

通过调研国内外文献,目前对于情感分析模型的研究主要有情感词典方法、机器学习方法和深度学习方法。

本文通过爬取微博数据,对这三种方法进行对比实验,寻找最优的情感分析模型。

基于传统情感词典方法的研究。

利用波森情感词典,将文本数据分词后遍历词典并加权得到其情感极性,然后在此基础上利用添加情感副词的方式提升情感词典的效果。

情感词典方法的优点是速度快,易于判断主观情感比较明确的句子,但是其缺点是针对不同场景的迁移能力弱,并且人工构建针对某一领域的情感词典耗时耗力。

基于机器学习方法的研究。

首先对文本数据进行数据预处理,将经过预处理后的数据分词结果通过Word2vec中Skip-gram 方法转化为词向量,同时利用腾讯开源词向量进行对比输入,然后利用主流的机器学习分类方法(Logistic回归、随机梯度下降法、朴素贝叶斯、支持向量机、随机森林、XGBoost)进行有监督学习,最后对比每种模型的测试集混淆矩阵,发现腾讯开源词向量训练的模型效果均优于Word2vec方法训练出来的词向量。

在这些方法中,随机森林、XGBoost这类利用集成思想方法训练的模型效果远远优于单一的分类模型。

虽然机器学习方法模型的准确率对比传统情感词典有了很大的提升,但是不足之处是每个训练器都涉及到大量的调参,并对于不同业务场景的迁移能力不强,机器学习方法已经发展到了瓶颈。

基于深度学习方法的研究。

通过对经典的多层感知机神经网络、循环神经网络、卷积神经网络和自注意力机制进行对比实验,各类深度学习模型的准确率比情感词典和机器学习的准确率有了较大的提升,其中自注意力机制模型在测试集的准确率达到了91.12%。

基于微博话题的情感分析模型的研究

基于微博话题的情感分析模型的研究
基于微博话题的情感分析模型的研究
中文微博情感分析旨在提取网民对于热点时事的倾向、观点和看法。对社交平台文本进行的情感分析任务可以获得国内网民的情感状态,因此在政府舆情控制、公司产品营销、民意调查等许多方面发挥着重要作用。现如今随着互联网技术的发展,网民对于微博、微信为代表的社交平台变得愈发依赖,中文微博情感分析的现实意义也变得愈发重要。但在现在的网络大环境下,人们表达自己观点和情绪的新生网络词语越来越多,方式越来越丰富。可能一句话里面就同时包含了汉语、英语、网络流行语与表情符号。加之,网络流行语常常以反讽的语气居多。传统的情感分析模型已经不再能满足现微博环境下的情感分析需求了。本文将基于现微博环境,对传统情感分析模型做以改进,提出了一个基于微博话题的细粒度情感分析模型。本论文现有的工作主要有以下三个部分:1.基于传统中文微博情感分析模型,结合对象级情感分析思想,在原有模型基础上做了改进并提出了新模型。使其能够胜任针对微博话题词的情感分析任务。2.在文中提出新模型的基础之上,通过改进注意力机制策略和加入语言学知识两种方式对模型进行改进,提高模型的正确率。3.以文中提出的新模型为核心,结合现实应用环境计有相应的对比实验。通过实验结果表明,本文所提出的模型,在手动获取以及公开评测数据集上有着良好的表现,在基于微博话题词的情感分析任务中有着较高的性能。

基于深度学习的微博文本情感分析研究

基于深度学习的微博文本情感分析研究

基于深度学习的微博文本情感分析研究随着社交媒体的迅猛发展,微博作为其中的一种重要形式,成为了大众表达情感与观点的主要平台之一。

然而,海量的微博文本数据给人们分析其中的情感倾向与情感载体带来了很大的挑战。

为了更好地理解和应用这些信息,基于深度学习的微博文本情感分析研究应运而生。

微博文本情感分析是指通过计算机自动分析微博文本中蕴含的情绪、态度和情绪载体的过程。

它在舆情分析、市场营销、舆论导向等领域具有重要的实际应用价值。

传统的微博文本情感分析方法主要基于特征工程和机器学习模型,如SVM、朴素贝叶斯等。

这些方法在一定程度上能够解决情感分析问题,但是对于微博文本的复杂性和多样性处理效果有限。

深度学习作为一种基于人工神经网络的机器学习技术,由于其出色的特征学习和泛化能力,逐渐成为社交媒体文本情感分析的热门方法。

深度学习可以自动地学习和提取微博文本中的情感信息,无需人工提取特征,从而减少了特征工程的工作量。

具体而言,深度学习的微博文本情感分析方法主要包括卷积神经网络(CNN)、长短期记忆网络(LSTM)、注意力机制等。

卷积神经网络是一种广泛用于图像识别的深度学习模型,但近年来也被应用于文本处理领域。

在微博文本情感分析中,卷积神经网络对于提取局部特征和建模上下文信息有着很好的效果。

通过将微博文本转换为词嵌入矩阵,并利用一维卷积神经网络进行特征提取和情感分类,可以实现高效准确的情感分析。

长短期记忆网络是一种能够捕捉文本序列信息的递归神经网络,被广泛应用于自然语言处理任务。

在微博文本情感分析中,LSTM能够有效地解决词序对情感分析结果的影响。

通过将微博文本序列输入LSTM神经网络,网络能够自动学习和记忆文本中的长期依赖信息,从而提高情感分类的准确性。

注意力机制是一种能够自动学习文本中关键信息的机制,在微博文本情感分析中起到了重要作用。

通过对微博文本中的不同部分进行加权,注意力机制可以使神经网络更加关注对情感分析有贡献的信息。

微博数据情感分析研究

微博数据情感分析研究

微博数据情感分析研究随着社交网络的发展,微博作为一种典型的社交媒体平台,已经成为人们主动获取信息和表达情感的重要途径之一。

在微博平台上,用户可以发表自己的想法、分享照片、视频以及出现在生活中的点点滴滴。

这样一个巨大的信息交流平台,自然会吸引着大量的用户积极参与其中,同时也吸引着众多的研究者来挖掘其中蕴含的价值。

微博数据的情感分析研究可以从多个角度探究和分析人们的情感,从而了解当前社会所处的情感环境和民意倾向。

一、什么是情感分析情感分析是指从大量文本信息中,通过机器学习和自然语言处理等技术手段,对文本所表达的情感进行分类和分析的过程。

大致可以分为三类:1. 情感分类:在大量的文本信息中自动识别文本的情感色彩,将其划分为正面情感、负面情感和中性情感。

2. 情感倾向分析:通过对大量文本的情感分析结果进行比较,从而了解文本的情感倾向,如针对某个品牌或产品的用户情感态度。

3. 文本情感分析:对文本的不同维度的情感进行量化分析,如对不同领域的文本进行情感分析,了解不同领域的情感发展态势。

二、微博数据的情感分析应用微博平台是一个巨大的文本信息平台,用户可以自由的表达自己的情感、想法和看法。

因此,微博数据的情感分析有着广泛的应用场景。

1. 社会调查:针对社会事件的微博数据情感分析可以了解公众在该事件上的情感态度和倾向,从而了解全社会的舆论态势。

2. 政府监管:各级政府都对民意问题非常关注,因此,政府可以利用微博数据的情感分析技术来了解当前民意和情感走向,从而提高政府决策的科学性和民主性。

3. 品牌管理:对于品牌管理者来说,微博数据的情感分析可以了解公众对某个品牌或产品的情感态度,为品牌管理者提供调整品牌形象、提高品牌竞争力的科学依据。

4. 网络安全:通过微博数据的情感分析,可以发现和预防一些网络安全问题,如网络欺凌、网络谣言等,保障公众的网络安全。

三、微博数据情感分析技术特点微博数据情感分析技术有其独特之处,需要善于发掘其特点,从而更好地进行调查分析。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

摘要题目:微博短文本细粒度情感分析摘要微博作为是移动互联网起步最早也发展最快的业务之一,在经历了最初几年的高速增长和热捧之后,一度有些沉寂。

但是,伴随着4G网络、WiFi网络大规模覆盖,移动终端智能设备的极速增长,越来越多的人频繁地使用微博。

移动端用户的增长,让微博有了日活跃用户超过1亿的基础。

基于该庞大的用户群体,利用微博文本对用户进行情感分析,不仅有利于新生代商业模式探索、社会舆情监控与分析,而且对人工智能发展的积极意义也不容小觑。

文本情感分析为人工智能在人类情感领域的探索做出了积极的贡献。

微博具有典型的网络语言特点,语法规范性差、口语化、新词汇层出不穷、大量的表情符号和文本噪声等。

基于传统规范书面语言词典的微博情感分析效果差强人意。

为了解决这个问题,本文一方面通过对传统情感词典进行网络语言的扩充,构建了新的适用于微博文本分析的词典,并通过实验验证了词典的有效性;另一方面,使用对特殊情感词汇依赖性小的RAE网络模型,性能得到了提高。

含有否定词的文本情感判别较为复杂,否定词的加入可能使原文本情感极性发生转变,也可能极性保持不变,程度有所削弱。

传统本文传统的情感分析方法通常对文本模型进行简化,假设一个词语仅和其前一个词语有关,对含有否定词的文本的积极/消极判别较差。

RNTN模型没有进行类似简化,保持了词向量之间的强相关性。

本文通过对RNTN模型的训练,使其在含有否定词中文文本情感极性判别上有良好的表现。

RNTN模型对词语或短语级细粒度情感分析上表现出色,而且不需要大量的人工标注;RAE模型作为较为成熟的深度学习模型,抛弃了传统的词袋模型,利用层次结构和成分语义来进行情感分类;SVM作为传统机器学习方法,通用性强,适用范围广。

结合以上方法的特点以及情感分类的任务目标,本文设计了微博短文本的双极性、细粒度情感分类方案,首先使用SVM对微博篇章进行主客观分类,RAE和RNTN对判定为主观情感的文本的每一个句子进行正负极性判断,并选出极性最强的句子,该句子的情感极性即为整个微博的情感极性。

若RAE和RNTN评判结果一致,即为最终结果。

并通过实北京邮电大学硕士学位论文验证明了系统的可行性和高效性。

关键词:微博短文本机器学习神经网络AbstractFINE GRAINED SENTIMENT ANALYSIS ABOUTMICRO BLOG SHORT TEXTABSTRACTAs one of the earliest and fastest growing mobile Internet business, in the first few years of rapid growth and heat holding, once some quiet. However, with the 4G network, the WiFi network is a large scale, the rapid growth of mobile terminal intelligent devices, more and more people frequently use microblogging. The growth of mobile end users, so that microblogging has more than one hundred million active users in the day. Based on the huge user groups, the use of microblogging text sentiment analysis of the user, not only conducive to the new generation business model exploration, social public opinion monitoring and analysis and the positive significance to the development of artificial intelligence also should not be underestimated. Text sentiment analysis has made a positive contribution to the exploration of artificial intelligence in the field of human emotion.Micro blog has the typical characteristics of network language, such as poor grammar, spoken language, new vocabulary, a large number of expression symbols and text noise. The traditional standard written language dictionary based on the analysis of the effect of micro-blog emotion just passable. In order to solve this problem, this paper constructs a new dictionary which is suitable for micro blog text analysis. On the other hand, the performance of the RAE network model is improved.The emotional judgment of text containing the negative words is more complex, and the addition of the negative word may cause the original emotional polarity to change, and it may remain unchanged. In this paper, the traditional method of sentiment analysis is usually simplified to the text model, assuming that one word is only related to the北京邮电大学硕士学位论文former one, and the positive / negative discrimination of the negative words is poor. The RNTN model does not have a similar simplification, and the strong correlation between the word vector is maintained. In this paper, the training of RNTN model, which makes it a good performance in the Chinese text of the negative words.RNTN model is a good performance in terms of words and phrases, and does not require a lot of manual labeling; RAE model as a more mature deep learning model, abandoned the traditional word bag model, the use of hierarchical structure and composition semantics to carry out emotional classification; SVM as a traditional machine learning method, universal strong, wide range of application. Based on the characteristics of the above methods and the task of sentiment classification, this paper designs the bipolar and fine-grained sentiment classification scheme. Firstly, SVM is used to classify the micro blog text, RNTN and RAE are positive and negative polarity. If the RAE and RNTN evaluation results are consistent, that is the final result. The reliability and stability of the system are verified by experiments.KEY WORDS:Micro blog short text,Machine Learning ,Neural Network目录目录第一章引言 (1)1.1 背景 (1)1.2 情感分析在人工智能上的意义 (2)1.3 细粒度情感分析 (4)1.4 文章结构 (5)1.5 本章小结 (6)第二章细粒度情感分析方法 (7)2.1 微博及短文本 (7)2.1.1 微博短文本特征 (7)2.1.2 语料库 (8)2.2 微博短文本情感分析理论基础 (10)2.2.1 统计语言模型 (10)2.3 文本机器学习方法 (13)2.3.1 隐含马尔科夫模型 (13)2.3.2 K近邻算法 (16)2.3.3 支持向量机 (18)2.3.4 贝叶斯分类方法 (19)2.4递归神经网络 (20)2.4.1 深度学习的复兴 (20)2.4.2 神经网络的定义和基本知识 (21)2.5本章小结 (23)第三章微博文本准备与处理 (24)3.1 细粒度情感分析概述 (24)3.1.1情感分析研究层次 (24)3.1.2情感信息分类 (25)3.2 数据清洗 (26)3.2.1繁体转换 (26)3.2.2 去除多余标志 (26)3.3 词典构建 (27)3.3.1中文分词 (27)3.3.2词向量 (28)3.3.3 Word2vec词向量模型 (30)北京邮电大学硕士学位论文3.3.4误差反向传播训练 (32)3.3.5 微博文本词典构建 (34)3.4 本章小结 (36)第四章基于递归神经网络的细粒度情感分析 (37)4.1基于RNTN的双极性情感分析 (37)4.1.1 RNTN的网络模型训练 (37)4.1.2 实验1:n-gram细粒度情感分类与结果分析 (39)4.1.3 实验2:转折句情感分类与结果分析 (40)4.1.4 实验3:否定句情感分类与结果分析 (40)4.2基于RAE的多类别情感分类 (42)4.2.1 RAE的网络模型训练 (42)4.2.2 实验1:RAE模型参数调整结果与分析 (43)4.3微博细粒度情感分类 (43)4.3.1 方案设计 (44)4.3.2 实验1:基于不同语料库的实验结果分析 (46)4.3.3 实验2:基于不同情感分析方法的实验结果分析 (47)4.3.4 实验总结和相关工作 (48)4.4本章小结 (49)第五章总结与展望 (50)5.1 论文总结 (50)5.2 下一步工作 (50)参考文献 (52)缩略词 (54)致谢.............................................................................................. 错误!未定义书签。

相关文档
最新文档