基于Python的微博情感分析系统设计

合集下载

基于Python的情感分析系统设计与实现

基于Python的情感分析系统设计与实现一、引言情感分析是自然语言处理领域的一个重要研究方向，它旨在识别和理解文本中所包含的情感色彩，帮助人们更好地了解他人的情感倾向和态度。

随着社交媒体的普及和大数据技术的发展，情感分析在舆情监控、产品推荐、舆情分析等领域有着广泛的应用。

本文将介绍基于Python的情感分析系统的设计与实现过程。

二、系统架构设计1. 数据收集在构建情感分析系统之前，首先需要准备训练数据集。

可以利用公开的情感标注数据集，如IMDb电影评论数据集、Twitter情感分析数据集等。

通过爬虫技术也可以从互联网上收集相关文本数据。

2. 文本预处理对于原始文本数据，需要进行一系列的预处理操作，包括去除停用词、分词、词性标注、去除特殊符号等。

这些预处理操作有助于提取文本特征，为后续的情感分析建模做准备。

3. 情感分析模型常用的情感分析模型包括基于机器学习的模型和基于深度学习的模型。

在本系统中，我们将采用深度学习模型，如卷积神经网络（CNN）或长短时记忆网络（LSTM）来构建情感分类器。

4. 模型训练与评估利用训练数据集对构建的情感分类模型进行训练，并通过验证集进行模型调优。

在训练过程中，需要选择合适的损失函数和优化算法，并监控模型在验证集上的性能指标，如准确率、召回率等。

三、系统实现1. Python库选择在实现情感分析系统时，我们将使用Python编程语言及其相关库来完成各个模块的开发。

主要涉及到的库包括：Numpy、Pandas、NLTK（Natural Language Toolkit）、TensorFlow或PyTorch等。

2. 数据预处理首先，我们需要加载原始文本数据，并对其进行预处理操作，如分词、去除停用词、文本向量化等。

这些操作可以通过NLTK库和Scikit-learn库来实现。

3. 情感分类模型搭建我们将使用TensorFlow或PyTorch来构建深度学习模型，定义神经网络结构，并选择合适的激活函数和损失函数。

基于Python的情感分析算法在社交媒体平台中的应用研究

基于Python的情感分析算法在社交媒体平台中的应用研究一、引言随着社交媒体的普及和发展，人们在日常生活中越来越多地通过社交媒体平台表达自己的情感和观点。

然而，海量的社交媒体数据也给情感分析带来了挑战和机遇。

情感分析是一种通过自然语言处理技术来识别和提取文本中的情感信息的方法，它可以帮助我们更好地理解用户在社交媒体上的情感倾向和态度。

本文将探讨基于Python的情感分析算法在社交媒体平台中的应用研究。

二、Python在情感分析中的优势Python作为一种简洁、易学、功能强大的编程语言，在自然语言处理领域得到了广泛应用。

在情感分析任务中，Python具有以下优势：丰富的库支持：Python拥有丰富的第三方库，如NLTK、TextBlob、VADER等，这些库提供了丰富的自然语言处理工具和情感分析算法，极大地简化了情感分析任务的实现过程。

易于扩展和定制：Python具有良好的可扩展性和灵活性，可以方便地进行算法定制和功能扩展，满足不同场景下情感分析任务的需求。

社区支持和文档完善：Python拥有庞大活跃的开发者社区，用户可以轻松获取到丰富的教程、文档和案例，快速上手并深入学习情感分析算法。

三、基于Python的情感分析算法1. 自然语言工具包（NLTK）NLTK是Python自然语言处理领域最为知名的库之一，提供了丰富的文本处理工具和数据集。

在情感分析中，NLTK可以用于文本预处理、特征提取和模型训练等任务，帮助用户构建情感分类器。

2. TextBlobTextBlob是一个简单易用的Python库，内置了对文本情感分析的功能。

通过TextBlob，用户可以快速对文本进行情感极性判断，并获取文本中各个词语的情感得分。

3. VADERVADER（Valence Aware Dictionary and sEntiment Reasoner）是一种基于规则和词典的情感分析工具，专门针对社交媒体文本进行情感极性判断。

基于Python的社交媒体情感分析系统设计与实现

基于Python的社交媒体情感分析系统设计与实现一、引言随着社交媒体的普及和发展，人们在日常生活中越来越多地通过社交媒体平台表达自己的情感和观点。

对于企业和个人而言，了解社交媒体用户的情感倾向对于制定营销策略、改进产品和服务具有重要意义。

因此，基于Python的社交媒体情感分析系统应运而生。

二、社交媒体情感分析的意义社交媒体情感分析是指利用自然语言处理、文本挖掘等技术，对社交媒体上用户发布的文本进行情感倾向的分析和判断。

通过社交媒体情感分析，我们可以了解用户对某一话题、产品或事件的态度和情感倾向，帮助企业和个人更好地把握舆论动向，及时调整策略。

三、基于Python的社交媒体情感分析系统设计1. 数据采集首先，我们需要选择合适的社交媒体平台作为数据来源，如Twitter、微博等。

利用Python编写爬虫程序，从指定平台上获取用户发布的文本数据，并保存到本地数据库中。

2. 数据预处理在进行情感分析之前，需要对采集到的文本数据进行预处理，包括去除停用词、分词、词性标注等操作。

Python中有丰富的自然语言处理库可供选择，如NLTK、jieba等。

3. 情感分析模型选择选择合适的情感分析模型对文本数据进行情感倾向判断。

常用的情感分析模型包括基于机器学习的模型（如朴素贝叶斯、支持向量机）和基于深度学习的模型（如LSTM、BERT）。

根据实际需求和数据规模选择合适的模型进行训练。

4. 系统架构设计设计基于Python的社交媒体情感分析系统架构，包括数据流程图、模块设计等。

确保系统具有良好的扩展性和可维护性。

四、基于Python的社交媒体情感分析系统实现1. 数据采集模块实现利用Python编写爬虫程序，实现对指定社交媒体平台上用户发布文本数据的采集，并将数据存储到数据库中。

2. 数据预处理模块实现使用Python中的自然语言处理库对采集到的文本数据进行预处理，包括去除停用词、分词、词性标注等操作。

3. 情感分析模型训练与实现选择合适的情感分析模型，在已标注好情感倾向的数据集上进行训练，并将训练好的模型应用到实际数据上进行情感分析。

微博情感分析系统的设计与情感分类算法研究

微博情感分析系统的设计与情感分类算法研究随着社交媒体的快速发展，微博已成为一种重要的信息发布和传播平台。

通过分析微博用户的情感倾向，可以了解大众的态度和观点，对政策制定、舆情分析等领域具有重要的意义。

因此，设计一个高效的微博情感分析系统，并研究可靠的情感分类算法，对于挖掘和分析微博数据具有重要的价值。

一、微博情感分析系统设计1. 数据收集与预处理微博情感分析的第一步是收集和获取微博数据。

可以使用微博开放平台提供的API进行实时数据的获取，或者通过爬虫技术从公开的微博页面进行数据爬取。

获取到的微博数据需要进行预处理，包括去除重复数据、去除停用词、分词等。

同时，需要过滤掉不影响情感分析的信息，如广告、链接等。

2. 特征提取为了进行情感分类，在数据预处理后，需要对文本进行特征提取。

常用的特征包括词袋模型、TF-IDF、Word2Vec等。

这些特征提取方法可以把微博文本转化为数字特征向量，便于后续的情感分类。

3. 情感分类算法情感分类是微博情感分析的核心任务，它可以将微博文本分为积极、中性和消极三类，从而帮助我们了解用户的情感倾向。

常用的情感分类算法包括朴素贝叶斯分类器、支持向量机（SVM）、逻辑回归等。

这些算法可以通过训练一个情感分类模型来实现微博情感的自动分类。

4. 模型评估与调优建立情感分类模型后，需要对其进行评估和调优。

可以使用交叉验证和指标评估方法（如准确率、召回率、F1-score等）来评估模型的性能，并根据评估结果对模型进行调优，提升分类的准确率和性能。

二、情感分类算法研究1. 朴素贝叶斯分类器朴素贝叶斯分类器是一种简单且高效的分类算法，它基于条件独立性假设。

在微博情感分析中，可以将朴素贝叶斯分类器应用于特征向量的训练和预测。

通过统计特征在不同情感类别中的出现频率，可以计算出特征的条件概率，并根据概率大小进行情感分类。

2. 支持向量机（SVM）支持向量机是一种常用的机器学习算法，在情感分类中也取得了较好的效果。

基于Python的情感分析与舆情挖掘系统设计

基于Python的情感分析与舆情挖掘系统设计一、引言随着互联网的普及和社交媒体的发展，人们在网络上产生的海量数据中蕴藏着丰富的情感信息和舆情内容。

情感分析和舆情挖掘成为了重要的研究领域，能够帮助政府、企业和个人更好地了解公众情绪、产品口碑以及社会热点话题。

本文将介绍基于Python的情感分析与舆情挖掘系统设计，旨在帮助读者深入了解如何利用Python语言构建一个高效的情感分析与舆情挖掘系统。

二、系统架构设计1. 数据采集模块数据采集是情感分析与舆情挖掘系统的第一步，通过网络爬虫技术从各大社交媒体平台、新闻网站等获取原始数据。

Python中常用的库如Requests、BeautifulSoup等可以帮助我们实现数据的抓取和解析。

2. 文本预处理模块在进行情感分析和舆情挖掘之前，需要对原始文本进行预处理，包括去除HTML标签、特殊符号、停用词等操作。

Python中的NLTK、jieba等库可以帮助我们进行文本预处理工作。

3. 情感分析模块情感分析是对文本中蕴含的情感倾向进行判断和分类的过程，常用的方法包括基于规则的方法、机器学习方法和深度学习方法。

Python中的TextBlob、NLTK、Scikit-learn等库提供了丰富的工具和算法来实现情感分析功能。

4. 舆情挖掘模块舆情挖掘旨在从海量数据中发现热点话题、关键事件以及舆情走势，可以通过文本聚类、主题模型等技术来实现。

Python中的Gensim、Scikit-learn等库提供了强大的文本挖掘工具，帮助我们实现舆情挖掘功能。

5. 可视化展示模块为了更直观地展示情感分析结果和舆情挖掘信息，可以利用Python中的Matplotlib、Seaborn等库进行数据可视化处理，生成各种图表和报告。

三、系统实现步骤数据采集：使用Requests库编写网络爬虫程序，获取目标网站上的文本数据。

文本预处理：利用NLTK或jieba库对原始文本进行分词、去除停用词等预处理操作。

Python中的情感分析实战

Python中的情感分析实战情感分析是指通过自然语言处理技术，对文本中表达的情绪进行分类和识别的过程。

在当今社交媒体和在线评论广泛存在的背景下，情感分析成为了一项重要的任务，可以帮助企业了解用户对产品、服务或事件的看法和情感倾向，从而作出相应的决策。

Python作为一种简单易用且功能强大的编程语言，为开展情感分析提供了丰富的工具和库。

本文将介绍Python中常用的情感分析库和一些实战案例，让你快速上手情感分析。

一、Python中的情感分析库在Python中，有多个库可供使用进行情感分析。

其中，最常用的包括NLTK（自然语言工具包）、TextBlob、VADER以及PyTorch等。

这些库提供了不同的算法和模型，可以根据具体需求选择使用。

1. NLTK（自然语言工具包）NLTK是Python中最常用的自然语言处理工具包，它提供了大量用于文本处理和情感分析的功能。

通过使用NLTK，你可以进行文本预处理、特征提取和情感分类等操作。

此外，NLTK还包含了一些经典的情感分析数据集，如Movie Reviews数据集，可用于模型训练和评估。

2. TextBlobTextBlob是一个建立在NLTK之上的文本处理库，它提供了一些简单且易用的接口，封装了情感分析模型和功能。

通过TextBlob，你可以轻松地进行情感分类、情感打分和单词词性标注等操作。

它的简洁和易用性使得初学者能够快速上手情感分析任务。

3. VADERVADER是一种基于规则和词典的情感分析工具，专门用于处理社交媒体和互联网文本。

VADER通过分析文本中的词汇、语法结构和情感强度等特征，对文本进行情感分类并给出相应的情感得分。

VADER 以其高效和准确的表现受到了广泛的关注和应用。

4. PyTorchPyTorch是一个流行的深度学习框架，也可以用于情感分析。

通过使用PyTorch深度学习库，你可以构建和训练自己的情感分类模型，实现更精细和灵活的情感分析任务。

基于Python的社交网络情感分析系统设计与实现

基于Python的社交网络情感分析系统设计与实现社交网络已经成为人们日常生活中不可或缺的一部分，人们在社交网络上分享自己的生活、观点、情感等内容。

然而，随着社交网络的快速发展，海量的信息给用户带来了信息过载的问题，用户往往需要花费大量时间和精力去筛选有用的信息。

因此，如何利用计算机技术对社交网络中的情感信息进行分析和挖掘，成为了一个备受关注的研究领域。

1. 研究背景社交网络情感分析是指通过对社交网络中用户发布的文本内容进行分析，从中提取出用户的情感倾向，包括积极情绪、消极情绪或中性情绪。

这种分析可以帮助人们更好地了解社会舆论、产品口碑、用户喜好等信息，对舆情监控、市场营销、个性化推荐等方面具有重要意义。

2. 技术路线基于Python语言的社交网络情感分析系统设计与实现主要包括以下几个步骤：2.1 数据采集首先需要从社交网络平台上获取用户发布的文本数据，可以通过API接口或者爬虫技术进行数据采集。

常见的社交网络平台包括微博、Twitter、Facebook等。

2.2 文本预处理获取到原始文本数据后，需要进行文本预处理工作，包括分词、去除停用词、词干提取等操作，以便后续的情感分析模型能够更好地理解文本内容。

2.3 情感分析模型构建情感分析模型是整个系统的核心部分，常用的方法包括基于规则的方法、基于机器学习的方法和基于深度学习的方法。

可以选择合适的模型对文本数据进行情感分类。

2.4 结果展示最后，将情感分析的结果可视化展示给用户，可以采用图表、词云等形式呈现用户在社交网络上的情感倾向，帮助用户更直观地了解自己和他人在社交网络上的情感表达。

3. 实现步骤3.1 数据采集以微博为例，可以使用Python中的第三方库weibo-sdk来获取用户发布的微博内容，并保存到本地数据库中。

示例代码star：编程语言：pythonimport weibo_sdk# 使用weibo_sdk获取微博数据weibo_data = weibo_sdk.get_weibo_data(user_id='123456')示例代码end3.2 文本预处理使用jieba库对微博内容进行分词处理，并去除停用词。

基于Python的舆情分析与情感识别系统开发

基于Python的舆情分析与情感识别系统开发一、引言随着互联网的快速发展，人们在网络上产生的海量数据中蕴藏着丰富的信息和情感。

舆情分析与情感识别系统作为一种重要的数据挖掘技术，可以帮助企业、政府等机构更好地了解公众舆论和情感倾向，从而做出更明智的决策。

本文将介绍基于Python的舆情分析与情感识别系统的开发过程及关键技术。

二、数据收集与预处理在舆情分析与情感识别系统的开发中，首先需要进行数据的收集和预处理工作。

数据可以来源于社交媒体、新闻网站、论坛等各种网络平台。

在数据预处理阶段，需要进行文本清洗、分词、去除停用词等操作，以便后续的情感分析和建模工作。

三、情感分析技术情感分析是舆情分析与情感识别系统中的核心技术之一，它可以帮助我们判断文本中所包含的情感倾向，如积极、消极或中性。

在Python中，常用的情感分析工具包括NLTK、TextBlob、VADER等。

这些工具可以帮助我们快速准确地对文本进行情感分析，并提取关键信息。

四、机器学习模型建立除了基于规则和词典的方法外，机器学习模型在舆情分析与情感识别系统中也扮演着重要角色。

常用的机器学习算法包括朴素贝叶斯、支持向量机（SVM）、深度学习等。

通过构建合适的特征向量和训练模型，我们可以实现对文本情感的准确分类和预测。

五、可视化与结果展示为了更直观地展示舆情分析与情感识别系统的结果，我们可以利用Python中的数据可视化工具如Matplotlib、Seaborn等进行结果展示。

通过绘制词云图、情感趋势图等可视化效果，可以使用户更加清晰地了解舆情信息和情感倾向。

六、系统集成与部署在完成模型训练和结果展示后，我们需要将舆情分析与情感识别系统进行集成和部署，以便用户能够方便地使用该系统进行舆情监测和分析。

可以选择将系统部署在Web平台上，也可以设计相应的API接口供其他应用调用。

七、应用案例与展望舆情分析与情感识别系统在金融、电商、政府等领域都有着广泛的应用前景。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2019年第6期信息与电脑China Computer & Communication软件开发与应用基于Python 的微博情感分析系统设计王欣周文龙（武汉工程大学邮电与信息工程学院，湖北武汉 430073）摘要：微博是当今公众传播信息的主要媒介之一，获取和分析微博数据能帮助研究者及时了解舆情信息。

笔者以Python 语言在网络爬虫和情感分析中的应用为基础，提出了一种微博情感简易分析方案，并建立了一个完整的微博情感分析过程。

首先，应用Python 语言采集微博中需要调查的相关关键词；其次，使用SnowNLP 包对该数据进行情感分析并转换为数值和图像；最后，得出相关关键词之间的支持情况。

关键词：情感分析；微博；Python；SnowNLP中图分类号：TP393.092；TP181 文献标识码：A 文章编号：1003-9767（2019）06-076-03Design of Micro-blog Emotion Analysis System Based on PythonWang Xin, Zhou Wenlong(The College of Post and Telecommunication of WIT, Wuhan Hubei 430073, China)Abstract: Microblog is one of the main media for the public to disseminate information nowadays. Obtaining and analyzingmicroblog data can help researchers understand public opinion information in time. Based on the application of Python language in web crawler and emotional analysis, the author puts forward a simple emotional analysis scheme of micro-blog, and establishes a complete emotional analysis process of micro-blog. Firstly, we use Python language to collect the relevant keywords in microblog.Secondly, we use SnowNLP package to analyze the data and convert it into data and images. Finally, we get the support among the relevant keywords.Key words: emotional analysis; micro-blog; Python; SnowNLP0 引言文本情感分析（又称意见发掘、倾向分析等）指分析、处理、归纳和推理带有情感色彩的主观性文本的过程[1]。

按照处理文本的类别不同，可分为基于新闻评论的情感分析和基于产品评论的情感分析。

其中，前者多用于分析舆情和预测信息，后者可帮助用户了解大众对某一产品或公司的情绪。

目前，人们已步入“互联网+”和大数据时代，网络中的数据量日益庞大。

其中，微博中拥有大量用户对关键词的各种态度和观点。

分析微博用户所产生的信息，可以更好地了解公众对某产品和公司的态度[2-3]。

针对微博上公众对各家快递公司的情绪和态度，可以了解到哪个快递公司的口碑更好，帮助消费者选择快递公司。

鉴于此，本文收集了微博上关于顺丰、中通、圆通和申通四家公司的微博和点赞数量，进行文本分析和挖掘，以了解大众对这四家公司的态度和观点。

1 微博情感分析流程第一步，使用Web 网络爬虫采集微博页面数据；第二步，对采集到的微博数据进行情感分析并得到相应数值；第三步，利用情感分析数值进行加权处理，利用统计图象进行数据分析。

图1 微博情感分析流程2 微博数据采集分析微博数据首先要从微博上获取微博数据。

使用基基金项目：2018年院级大学生创新创业项目“微博情绪简易分析系统”（项目编号：CXCY1812）。

作者简介：王欣(1985—)，女，湖北武汉人，硕士研究生，讲师。

研究方向：自动控制与电力电子应用技术。

2019年第6期信息与电脑China Computer & Communication软件开发与应用于Python 的网络爬虫采集数据。

软件运行环境主要基于Windows 操作系统、Python2.7。

本文以顺丰、中通、圆通和申通为关键词，收集2018年2月份的微博数据。

本文的微博爬虫应用Requests 库和BeautifulSoup 库。

Requests 是采用Python 语言编写，基于Urllib，应用Apache2 Licensed 开源协议的HTTP 库。

BeautifulSoup 是用Python 语言编写的一个HTML/XML 解析器，可以处理不规范标记并生成剖树。

爬虫的整体运行流程如下。

第一，程序从用户的输入中获取关键字，并与搜索URL 组合。

第二，使用Requests 把要访问的搜索页面的URL 封装成一个请求，访问服务器端并获得网页的源代码（使用Requests 访问URL 时，修改Headers 参数中的Cookie 参数和User-Agent 参数，实现模拟登陆）。

第三，通过BeautifulSoup 库解析数据，确认当前搜索的URL 是否存微博和下一页。

（如果存在微博，则使用BeautifulSoup 库筛选中文文本所在的位置，并去除、存储JS 脚本标签、CSS 代码和HTML 标签等内容；如果存在下一页，则抓取下一页的URL）。

3 基于文本的情感分析和数据处理目前，情感分析方法主要分为基于词典、基于弱注信息、基于机器学习和基于深度学习等四种方法。

基于词典方法的核心模式是“词典+规则”，即以情感词典作为判断情感极性的主要依据，同时，兼顾评论数据中的句法结构，设计相应的判断规则。

基于弱信标则是从用户产生的数据中挖掘有助于训练情感分类器的信息，如评论的评分、微博中的表情符号等。

特征工程是机器学习的核心。

基于深度学习则是学习数据中的语义词向量，并通过不同的语义用词向量得到特征表达[4-5]。

SonwNLP 主要可以实现中文分词、词性标注、情感分析、文本分类、转换拼音、繁体转简体、提取文本关键词、提取摘要、分割句子和文本相似等功能[6]。

其中，情感分析是将句子的情感程度表示为从0到1，即判断句子积极、消极的概率[7]。

每一条微博中的点赞数量会影响关键词在微博中的情绪。

因此，输出设置了当天赞数加权的0～1输出、当天情感直接两极化的赞数加权0或1的输出（情绪消极为0，积极为1）、当天赞数加权-1或1的输出（情绪消极为-1，积极为1）、当天总赞数输出、当天总微博量输出和当天赞数加微博量输出。

前三者的情绪总量输出用于判断关键词情绪的参考，后三者的总量输出作为热度参考。

最后，将所有的输出存入.csv 格式的文件中。

4 实验分析将当天赞数加权的0～1的所有值相加得到情感数值，并画出折线图，如图2所示。

图2 2018年2月情感分析曲线由图2可以看出微博网友对四家快递公司的情感倾向，但情感分析无法辨别哪一家公司或者哪几家公司更受微博消费者的欢迎。

为了了解微博网友对这四家公司的态度，本文比较了四家快递公司的总赞数、总微博量和赞数加微博量，如图3所示。

由图3可知，2018年2月，顺丰的微博评价最多且口碑较好，其他三家的微博评价数量近似但申通的口碑较好，选择快递时微博用户更倾向于顺丰。

赞数微博数量赞数加微博数顺丰74％顺丰52％顺丰69％申通6％申通12％申通8％中通10％中通16％中通11％圆通10％圆通20％圆通12％图3 2018年2月四家快递公司的微博统计信息（下转第80页）2019年第6期信息与电脑China Computer & Communication软件开发与应用PLC DCS SCADAAPPWEB手持终端电子看板三维可视化数据展示平台应用数据中心数据传输数据采集性能预测维护保养预测性维修数据建模远程监控故障告警数字化建模故障诊断知识库备品备件管理数据工程数据分析数据预处理及存储工业以太网/现场总线/无线传感网络/无线MESH网络工业现场设备设备智能运维服务平台图1 总体功能架构5 结语设备智能运维服务平台基于工业物联网和数字孪生智能监测替代周期性的人工巡检，以基于工业大数据的机器智能辅助人为的经验决策，为生产设备的运行维护提供信息支撑和辅助决策，现已在研发中形成产品和方案，并在某大型企业得到实际应用，能显著提高设备利用率，降低故障率，通过减员增效，节省运营费用，有效提升企业的设备运维水平。

参考文献[1]任工昌,宋延.基于三维仿真的制造业生产设备的虚拟展示设计[J].中国管理信息化,2017,20(22):76-77.[2]宁懿.支持OPC UA 功能的工业无线传感器网络设计与实现[D].北京:北京交通大学,2018:12.[3]谢添.基于物联网与大数据分析的设备健康状况监测系统设计与实现[D].北京:北京交通大学,2018:10.[4]杨恒占,张可,钱富才.基于模糊分层SDG 模型的故障推理方法[J].计算机系统应用,2017,26(4):104-109.[5]钟福磊.工业大数据环境下的混合故障诊断模型研究[D].西安:西安电子科技大学,2015:3.[6]李业顺,毕凯,赵世磊.基于知识发现和数据挖掘技术的诊断专家系统的研究[J].电子技术与软件工程,2018(1):141-142.5 结语本文通过BeautifulSoup 库的网络爬虫和SnowNLP 库，分析大众对四家公司的态度和观点，并得出一个简单的分析结果，为分析微博上的数据提供了一个简单的方案。

应用网络爬虫技术从微博上抓取网民的微博，利用SnowNLP 库对数据进行情感分析并得出数值，利用统计信息分析四家公司的口碑。

通过情感分析，可以得到大多数网民对四家快递的态度，从而达到市场调研的目的。

参考文献[1]杜洋.基于知乎数据的情感分析——以"头腾大战"为例[J].江苏科技信息,2018,35(31):38-40,69.[2]夏玉芹,单雪微.基于Python的简单文本情感分析[J].阴山学刊(自然科学版),2018,32(4):58-62.[3]杨立公,朱俭,汤世平.文本情感分析综述[J].计算机应用,2013(6):1574-1578,1607.[4]李华,储荷兰,高旻.中文网络评论观点词汇语义褒贬倾向性判断[J].计算机应用,2012,32(11):3023-3025,3033.[5]黄萱菁,张奇,吴苑斌.文本情感倾向分析[J].中文信息学报,2011,25(6):118-126.[6]崔连超.互联网评论文本情感分析研究[D].济南:山东大学,2015:64.[7]李慧,柴亚青.基于属性特征的评论文本情感极性量化分析[J].数据分析与知识发现,2017,1(10):1-11.（上接第77页）。