网络舆情分析技术的研究
基于大数据技术的网络舆情分析与研究

基于大数据技术的网络舆情分析与研究随着互联网的发展,网络已经成为了人们生活中不可或缺的一部分。
在网络上,我们可以获取各种各样的信息,发布自己的想法和观点,并与大家进行交流互动。
然而,网络上的信息繁杂,来源复杂,真假难辨。
在这样的背景下,网络舆情分析技术开始崭露头角,并在逐渐成为了网络中不可或缺的新生力量。
一、什么是网络舆情分析网络舆情分析是指通过大数据技术对网络上的信息进行收集、分析、处理,以获取对当前时事和热点话题的全面了解和分析。
它包括对网络用户的情感倾向、态度、情绪、行为等多个方面的分析,试图从中探究用户们的真正意图、需求、利益以及他们所关注的信息。
此外,网络舆情分析还有助于及时了解并准确把握网络上不良信息的流向和传播趋势,以及全面掌握网络舆情热点和趋势,构建起一个比较完整的网络舆情管理体系,能够更加准确地指导社会舆论,甚至对政府决策产生影响。
二、网络舆情分析的应用对于企业、政府、学术研究等领域,网络舆情分析都有着非常重要的作用。
1. 危机管理网络舆情分析技术可以帮助企业进行危机预警和预防,及时掌握网络上的风险事件,以便及时采取行动,规避危机。
2. 市场营销网络舆情分析可以帮助企业对市场行情进行了解和掌握,提高市场营销的效率,并制定相关的营销策略。
3. 社会管理网络舆情分析可以为政府相关部门提供精准的数据支持和建议,以指导政府的决策和政策制定。
4. 学术研究网络舆情分析技术可以为学者提供大量、丰富、广泛的数据支持,以支持学术研究和探究。
5. 教育培训网络舆情分析可以成为教育工作者的重要工具,以便他们更好地了解学生的心理状况、关注点和需求,制定更加有针对性的教育培训计划。
三、网络舆情分析技术的研究网络舆情分析是一门涉及多个学科领域的综合技术,需要用到知识库构建、语料库生成、文本自动分类、情感分析、数据挖掘等工具和技术的综合运用。
针对这些技术问题,研究人员已经提出了许多理论和算法,逐渐形成了一套完整有效的网络舆情分析技术体系。
媒体传播学中的网络舆情分析研究

媒体传播学中的网络舆情分析研究近年来,随着互联网和社交媒体的迅猛发展,网络舆情愈发成为媒体传播学领域的焦点研究。
网络舆情分析作为研究媒体传播学的一个重要方面,不仅关注网络信息的传播特点,更重要的是揭示舆情事件的发展规律和其对社会的影响。
本文将介绍网络舆情分析的研究方法和重要性,以及在媒体传播学中的应用。
首先,网络舆情分析研究具有重要的理论和实践意义。
通过对网络舆情的分析,可以揭示大众对某一事件或话题的态度和情绪变化,挖掘出潜在的社会问题和需求,为决策者提供决策参考。
同时,网络舆情分析也可以用于监测和评价媒体传播效果,了解新闻报道在社会上的影响力和传播效果。
其次,网络舆情分析的研究方法日趋成熟。
传统的舆情分析方法主要依靠媒体报道和口碑传播的收集,但在互联网时代,通过网络数据的采集和分析,可以获取更为全面和精确的舆情信息。
目前,网络舆情分析方法主要包括基于文本挖掘和情感分析的机器学习方法、基于社交网络和关系网络的网络结构分析、以及基于大数据技术的数据挖掘和网络可视化等。
这些方法的出现为研究者提供了更多的手段和角度,使得网络舆情分析能够更准确地揭示舆情事件的发展规律及其背后的影响因素。
在媒体传播学中,网络舆情分析的应用十分广泛。
一方面,网络舆情分析可以用于研究媒体传播的特点和规律。
通过分析社交媒体上的信息传播路径和传播速度,可以揭示媒体信息的传播模式和规律,并探究其对舆情事件的影响。
此外,还可以通过分析网络舆情对媒体报道的反馈作用,了解新闻报道对舆情发展的影响力和调控能力。
另一方面,网络舆情分析可以用于研究公共话题的演变和社会影响。
在当今信息爆炸的社会环境中,社交媒体成为大众表达观点和情绪的重要平台。
通过分析社交媒体上的网络舆情,可以洞察公众对社会事件和社会问题的关注程度和态度。
同时,网络舆情分析也可以揭示公众舆论对政府政策和组织决策的影响力,对社会决策与治理提供参考。
需要指出的是,网络舆情分析研究也面临一些挑战。
大数据与网络舆情分析研究报告

大数据与网络舆情分析研究报告在当今数字化的时代,互联网已经成为人们获取信息、表达观点和交流互动的重要平台。
随着网络的普及和社交媒体的兴起,网络舆情的影响力日益凸显。
大数据技术的发展为网络舆情分析提供了强大的支持,使我们能够更全面、深入地了解公众的意见和情绪。
一、大数据在网络舆情分析中的重要性大数据的特点在于其海量的数据规模、多样的数据类型、快速的数据流转和价值密度低。
这些特点使得大数据在网络舆情分析中具有不可替代的作用。
首先,大数据能够提供全面的舆情数据。
通过收集和整合来自各种网络平台的信息,包括社交媒体、新闻网站、论坛等,我们可以获得更广泛的公众意见和话题讨论。
其次,大数据能够实现实时监测。
网络舆情的发展变化迅速,实时的数据采集和分析可以帮助我们及时掌握舆情的动态,做出快速响应。
再者,大数据有助于发现潜在的舆情趋势。
通过对大量数据的挖掘和分析,可以发现一些隐藏在表面之下的规律和趋势,为预测舆情走向提供依据。
二、网络舆情的特点与传播机制网络舆情具有以下几个显著特点:一是传播速度快。
信息在网络上可以瞬间传播到全球各地,一个热点事件可能在短时间内引发广泛的关注和讨论。
二是传播范围广。
网络突破了地域和时间的限制,使得舆情能够在不同的地区和群体中迅速扩散。
三是参与主体多元化。
任何人都可以在网络上发表自己的观点和看法,舆情的来源非常广泛。
网络舆情的传播机制主要包括以下几个方面:首先是信息源的发布。
某个事件或话题的出现成为舆情的起点。
其次是社交媒体的推动。
社交媒体平台上的用户通过转发、评论等方式加速了舆情的传播。
再者是意见领袖的引导。
一些具有较高影响力和权威性的个人或组织的观点往往能够影响公众的看法。
三、大数据时代网络舆情分析的方法与技术在大数据时代,网络舆情分析主要采用以下方法和技术:数据采集技术,包括网络爬虫、API 接口等,用于获取各种网络平台上的舆情数据。
数据预处理技术,对采集到的数据进行清洗、去噪、分类等处理,以提高数据质量。
网络舆情分析研判调研报告

网络舆情分析研判调研报告网络舆情分析研判调研报告1. 研究背景随着互联网和社交媒体的普及,网络舆情监测和分析逐渐成为公共舆论研究的重要手段。
网络舆情分析研判通过对网络上涌现的舆情信息进行收集、整理、分析和判断,能够帮助政府、企业和组织更好地把握社会舆论动态,及时应对公共事件和媒体危机,提升公众形象和信任度。
2. 研究目的本次调研旨在了解网络舆情分析研判的现状和发展趋势,深入研究其在公共舆论研究中的应用和意义,为政府、企业和组织提供参考和借鉴。
3. 调研方法本次调研采用文献研究和案例分析的方法,通过收集相关文献资料和实际案例,对网络舆情分析研判进行全面的了解和综合分析。
4. 调研结果4.1 现状分析网络舆情分析研判在政府、企业和组织中已经得到广泛应用。
政府可以通过对网络舆情的监测和分析,及时掌握社会热点问题,开展舆论引导和宣传营销;企业可以通过对网络舆情的分析,了解消费者的需求和反馈,调整产品和服务策略,提升品牌形象;组织可以通过对网络舆情的研判,了解外部环境和竞争对手,制定正确的发展战略。
4.2 发展趋势随着人工智能技术和大数据分析的不断进步,网络舆情分析研判将朝着更智能化、更精准化的方向发展。
通过自动化算法和机器学习模型,可以实现对网络舆情的实时监测和情感分析,提供更准确的舆情预测和决策支持。
5. 案例分析以某企业为例,该企业通过建立网络舆情分析与研判系统,实时监测社交媒体上涉及企业品牌的言论和评论。
通过对网络舆情信息的情感分析和关键词提取,企业可以及时发现和回应消费者的问题和需求,提升品牌形象和用户满意度。
6. 结论网络舆情分析研判在公共舆论研究中具有重要意义,能够帮助政府、企业和组织了解社会舆论动态,及时应对公共事件和媒体危机。
随着人工智能技术的进步,网络舆情分析研判将进一步发展,提供更准确和精细的舆情预测和决策支持。
网络舆情分析研判应逐渐成为政府、企业和组织公共事务管理的重要工具。
总结:网络舆情分析研判调研报告通过对网络舆情分析研判的现状和发展趋势进行分析,以及对实际案例进行研究,提出了网络舆情分析研判在公共舆论研究中的重要意义和应用价值。
基于深度学习的网络舆情分析技术研究

基于深度学习的网络舆情分析技术研究第一章绪论随着网络的普及,网络舆情的分析和研究正变得越来越重要。
网络舆情分析是指通过对网络中的信息和用户评论进行收集、分类、分析、挖掘和预测,从而获取有关特定主题或问题的意见和态度。
这种分析可以帮助政府、企业、媒体和个人了解公众的思想和需求,为他们的决策和行动提供有关信息和建议。
在这个领域,深度学习技术由于其出色的性能而受到越来越多的关注。
本文旨在探讨基于深度学习的网络舆情分析技术的研究进展和应用前景。
第二章深度学习技术概述深度学习是机器学习的一种重要分支,它基于多层神经网络模型,利用反向传播算法训练神经网络,以获得更加准确和可靠的预测结果。
深度学习的主要优点包括:1. 自动提取特征:通过堆叠多个层,深度学习可以自动从原始数据中提取更高级别的特征,从而更好地表示复杂的模式和结构。
2. 更好的泛化能力:深度学习可以减少模型的泛化误差,从而在训练数据集以外的数据上获得更好的预测性能。
3. 端到端学习:深度学习可以直接从端到端进行学习,无需手工设计特征处理流程,从而大大简化了数据处理和模型开发的过程。
第三章深度学习在网络舆情分析中的应用深度学习在网络舆情分析中有许多实际应用,包括但不限于以下几个方面:1. 文本分类:深度学习可以将文本数据转换为向量或矩阵,然后通过堆叠多个全连接层和非线性激活函数,将文本数据分成多个类别。
2. 情感分析:深度学习可以通过训练基于循环神经网络(RNN)和长短时记忆(LSTM)的情感分类模型,以分析文本情感和观点。
3. 社交网络分析:深度学习可以分析社交网络中的结构和行为模式,从而挖掘用户关系、行为和兴趣爱好。
4. 事件检测:深度学习可以从网络数据中检测特定事件,例如自然灾害、政治事件和娱乐活动等。
第四章基于深度学习的网络舆情分析技术研究案例在实际应用中,基于深度学习的网络舆情分析技术已经被广泛研究和应用。
下面介绍一些相关的典型案例:1. 基于卷积神经网络(CNN)的微博情感分类:该研究通过使用中文自然语言处理工具,将微博用户的情感分为正、中、负三个类别。
论网络舆情分析的关键技术

论网络舆情分析的关键技术一、引言随着互联网的普及和社交媒体应用的广泛使用,网络舆情已经成为一个社会、政治、经济和文化等各方面的重要问题。
网络舆情分析就成为了一个热门的话题。
网络舆情分析是一种数据分析技术,可以帮助企业、政府和个人获取当前的网络形势,发现问题、评估品牌形象和掌握消费者心态等。
本文将围绕网络舆情分析的关键技术进行探讨。
二、网络舆情分析的关键技术分类2.1.文本挖掘技术在网络舆情分析中,文本挖掘技术是一项非常重要的技术,它可以从一堆文本数据中发现有用的信息,比如:主题、情感、个人姓名、地点和其他实体等。
文本数据来源包括新闻报道、社交媒体、博客、论坛、评论和其他形式的用户生成内容等。
与传统的文本分析不同的是,文本挖掘技术可以自动地处理大量的文本数据,并将它们转化为有用的信息。
主要的文本挖掘技术包括关键词提取、分类、聚类、信息提取、情感分析、自然语言处理和机器学习等。
2.2.数据挖掘技术与文本挖掘技术相似,数据挖掘技术也是一种在网络舆情分析中非常重要的技术。
它可以从各种类型的数据集中挖掘出有用的信息,比如:消费者行为的模式、趋势和关系等。
数据集可以包括网络上的用户生成内容、销售数据、消费者调查、新闻报道、社交媒体和博客等。
主要的数据挖掘技术包括聚类、分类、预测、关联规则和异常检测等。
2.3.舆情表达与可视化技术舆情表达与可视化技术是一种重要的技术,可以将文本挖掘和数据挖掘的结果进行展示。
该技术可以将分析结果以图表、地图等方式直观地展现,以帮助用户更好地理解分析结果。
舆情表达与可视化技术可以为用户提供多种展现方式,比如:热力图、折线图、散点图、雷达图和树状图等。
2.4.信息融合信息融合技术可以将来自不同数据源的不同类型的信息进行整合,以便更好地分析相关数据。
该技术可以帮助用户从多个角度理解舆情信息,更好地捕捉事态发展的动态趋势和发展变化。
主要技术方法包括基于规则的融合方法、基于概率的融合方法和基于贝叶斯网络的融合方法等。
网络舆情数据分析与舆情危机管理研究

网络舆情数据分析与舆情危机管理研究随着互联网的普及和发展,网络舆情在当今社会中扮演着不可忽视的角色。
了解和分析网络舆情数据,以及有效地进行舆情危机管理,对于维护良好的社会公共秩序和促进社会的可持续发展至关重要。
本文将就网络舆情数据分析及舆情危机管理进行研究。
一、网络舆情数据分析网络舆情数据分析是指通过对网络上涌动的海量舆情数据进行收集、整理、分析和挖掘,从中获取有价值的信息和洞察力,以指导决策和舆情预测。
网络舆情数据分析可以帮助我们了解社会热点话题、人们的情绪倾向和态度,并根据分析结果调整相应的公共政策和公司经营战略。
1.1 舆情数据收集与整理网络舆情数据的收集和整理是进行数据分析的前提和基础。
网络舆情数据收集的方式多种多样,可以通过网络爬虫、社交媒体API、在线调查等途径获得。
在收集数据时,需要注意数据来源的可靠性和合法性。
同时,对于获得的数据,还需要进行清洗和整理,剔除冗杂的信息,提取有用的数据,并将其进行分类和标记。
1.2 舆情数据分析方法舆情数据分析的方法主要包括文本分析、情感分析和网络关系分析。
文本分析主要是对舆情数据中的文本进行分词、向量化和聚类分析,以便为后续分析提供基础。
情感分析是对文本中的情感倾向进行判断和评估,从而把握舆情态势。
网络关系分析主要是通过分析网络转发、评论和关注关系,揭示意见领袖和舆论传播路径,从而帮助理解舆情的形成和演变过程。
1.3 舆情数据挖掘应用舆情数据挖掘是利用数据分析方法,从庞大的舆情数据中发现隐藏的模式、规律和趋势。
例如,可以通过数据挖掘找出具有重要影响力的舆论领袖,寻找特定事件或产品的热门话题,进行舆论焦点的预测等。
舆情数据挖掘的应用还包括信息推荐、舆情预警、品牌管理等方面。
二、舆情危机管理研究舆情危机管理是指在面临网络舆情危机时,有效地处理和应对危机,并最小化危机对组织或个人的负面影响。
舆情危机管理的研究主要涉及危机预警机制、危机应对策略和舆情危机处理案例研究等方面。
网络舆情分析研究

网络舆情分析研究网络舆情分析研究是指通过对网络上的言论和信息进行收集、整理和分析,从而了解和评估公众对其中一特定事件、话题或者个体的态度和情绪。
网络舆情分析研究具有重要的实际价值,可以帮助政府、企事业单位、媒体和个人更好地了解公众的声音和需求,从而更好地应对和引导舆论。
网络舆情分析研究需要依托大数据的技术和方法。
首先,需要通过网络爬虫等工具收集来自各个平台的言论和信息。
然后,通过文本挖掘和自然语言处理等技术对收集到的数据进行清洗、分类和统计,提取关键词、关联度等信息,以便进行分析。
最后,通过数据可视化的方式将分析结果呈现出来,使其更易于理解和应用。
网络舆情分析研究的意义在于可以使决策者更加了解公众的需求和意见。
首先,政府可以通过对网络舆情的分析,及时了解公众对政策措施的反应,避免盲目行动,更好地制定和调整政策。
其次,企事业单位可以通过对网络舆情的分析,了解公众对产品和服务的评价,及时改善产品质量和提高服务水平,增强企业的竞争力。
同时,媒体可以通过对网络舆情的分析,了解公众对新闻事件的看法和诉求,提供更客观、公正的报道,增加公众对媒体的信任度。
网络舆情分析研究还能够提供重要的信息安全保障。
随着信息技术的快速发展,网络上出现了大量的虚假信息和谣言,对社会稳定和公共安全造成了很大的威胁。
通过对网络舆情的分析,可以及时发现和辨别虚假信息,避免其对社会造成的负面影响。
然而,网络舆情分析研究也面临一些挑战和问题。
首先,数据的收集和分析需要耗费大量的时间和功夫。
其次,由于网络上的言论和信息具有匿名性和多样性,很难准确地判断其真实性和代表性。
此外,虽然网络舆情分析可以提供决策参考,但决策者还需要综合考虑其他因素,不可完全依赖网络舆情的结果。
综上所述,网络舆情分析研究在现代社会中具有重要的实际价值。
通过对网络上的言论和信息进行收集、整理和分析,可以更好地了解和评估公众对其中一特定事件、话题或者个体的态度和情绪,从而为政府、企事业单位、媒体和个人的决策和行动提供有力的参考和指导。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本工具可以抓取互联网上的任何网页,包括需要登录后才能访问的页面。对抓取到页面内容进行解析,得到结构化的信息,比如:新闻标题、作者、来源、正文等。支持列表页的自动翻页抓取,支持正文页多页合并,支持图片、文件的抓取,可以抓取静态网页,也可以抓取带参数的动态网页,功能极其强大。用户指定要抓取的网站、抓取的网页类型(固定页面、分页显示的页面等等),并配置如何解析数据项(如新闻标题、作者、来源、正文等),系统可以根据配置信息自动实时抓取数据,启动抓取的时间也可以通过配置设定,真正做到“按需抓取,一次配置,永久抓取”。抓来的数据可以保存到数据库中。支持当前主流数据库,包括:Oracle、SQL Server、MySQL等。本工具完全可以替代传统的编辑手工处理信息的模式,能够实时、准确、一天不间断为企业提供最新资讯和情报,真正能为企业降低成本,提高竞争力。系统功能结构图如下图所示:
1信息采集:互联网信息(新闻、论坛等)的实时监测、采集、内容提取及排重。
2信息处理:对抓取的内容进行自动分类聚类、主题检测、专题聚焦等。
3信息服务:将采集并分析整理后的信息直接为用户或为用户辅助编辑提供信息服务,如自动生成舆情信息简报、追踪已发现的舆论焦点并形成趋势分析,用于辅助各级领导的决策支持。
网络舆情表达快捷、信息多元,方式互动,具备传统媒体无法比拟的优势。网络的开放性和虚拟性,决定了网络舆情具有以下特点:1、直接性,通过BBS,新闻点评和博客网站,网民可以立即发表意见,下情直接上达,民意表达更加畅通;2、突发性,网络舆论的形成往往非常迅速,一个热点事件的存在加上一种情绪化的意见,就可以成为点燃一片舆论的导火索;3、偏差性,由于发言者身份隐蔽,并且缺少规则限制和有效监督,网络自然成为一些网民发泄情绪的空间。在现实生活中遇到挫折,对社会问题片面认识等等,都会利用网络得以宣泄。因此在网络上更容易出现庸俗、灰色的言论。
(3)技术特点
自然语言处理技术
据统计,当前数字化的信息中80%的信息以非结构化的形式存在,其中大部分信息以自然语言描述形式的文本。方正智思舆情预警辅助决策支持系统作为一个信息资讯分析应用系统,能够对自然语言描述文本形式进行深入的分析挖掘。
自动分词技术
自动分词技术是中文信息处理与分析的基础。错误的分词将导致完全错误的信息语义。方正智思舆情预警辅助决策支持系统中以词典和规则为基础,综合利用了基于概率分析的语言模型方法,使分词的准确性达到99%,并可根据不同的应用进行适合特定要求的分词。
特点二:生成智能舆情报告(包括舆情简板和舆情专报)
方正智思舆情预警辅助决策支持系统理技术、知识管理技术及互联网相关技术,能够对一段时间范围内新出现的社会舆论热点,生成智能舆情报告。舆情简报图文并貌,直观的体现互联网焦点和热点新闻主题。舆情专报对重要的热点新闻信息进行分析和追踪,对于突发事件引起的网络舆情,可以及时掌握舆情爆发点和事态发展趋势。
另外,运用该系统,能够有效的降低人工分析检测误差,通过对网络信息源的采集、整理、监测和分析,不仅有效降低人工分析监测误差,而且利于形成高标准高质量的监测报告,便于相关部门快速掌握社会思想动态,为制定相对应的执行方案提供了可信的分析依据。
特点三:辅助判断网络新闻和评论的正面和负面信息
方正智思舆情预警辅助决策支持系统支持人工判断标注信息属性,例如,紧急度、密级度、观点倾向等等。可按照信息属性排列信息,例如按照时间排列、观点倾向排列等等。通过系统的统计分析功能,对某社会突发事件的网络新闻和评论的正面负面信息做数据分析,用直观的图表反映网络新闻热点的发展趋势分析。
自动关键词与自动摘要技术
方正智思舆情预警辅助决策支持系统在篇章语义分析的基础上,综合考虑词频、词性、位置信息,实现准确的自动关键词与自动摘要。同时利用指代消解等技术使得摘要更具可读性。
全文检索技术
方正智思舆情预警辅助决策支持系统的全文引擎将传统的全文检索技术与最新的WEB搜索技术相结合,大大提高检索引擎的性能指标。同时融合了多种相关技术,提供丰富的检索手段以及同义词等智能检索方式。
(2)应用特点
方正智思知识管理平台软件是一款中文智能信息挖掘与处理的平台软件,它是以北京方正电子政务技术有限公司多年积累的中文信息处理技术、图形图像处理技术和中文自然语言处理技术为基础,融合了最新的人工智能、信息检索、文本数据挖掘和互联网技术的研究成果,实现了对海量文本、图片、视音频等数字化内容进行智能采集、智能处理、智能检索和智能分析的功能。方正智思舆情预警辅助决策支持系统是以北京方正电子政务技术有限公司自主研发的方正智思为基础,依据市场需求进行针对性的客户需求定制和开发而形成的应用系统,用以辅助用户解决在海量数据环境下所面临的难题,推动各级政府的宣传机构、大众传媒的信息化进程,助力信息传播。
网络舆情分析研究
舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。网络舆情形成迅速,对社会影响巨大,不仅需要各级党政干部密切关注,也需要社会各界高度重视。随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。网络环境下的舆情信息的主要来源有:新闻评论、BBS、聊天室、博客、聚合新闻(RSS)。
特点一:提高工作效率,扩大监控范围
方正智思舆情预警辅助决策支持系统针对互联网的信息进行收集和分析,以计算机智能处理技术辅助舆情信息汇集整理和分析,不仅有效的提高工作效率,改善人工舆情监测的弊端,而且通过本系统,能增加设置媒体舆情监测的数量,扩大舆情监测对像范围,做到了高品质,大范围的深入分析监测,搞高了监测结论的可信性和准确性,降低了人力成本。
二、中国舆情网PALAS(帕拉斯)网络舆情监控系统
中国舆情网()是由复旦大学舆情研究实验室共同主办的国内最大的专业化舆情研究与舆情监测数据平台,它涵盖日常舆情监测、舆情专题、地方舆情、舆情研究频道、舆情报告免费下载、舆情搜索等多个栏目,其首推的中国地方舆情排行榜,是国内唯一按照地方来进行的专业舆情排行榜,在业内形成了广泛的影响力。同时,它提供覆盖全网的舆情监测分析服务,包括:
一、方正互联网舆情分析平台
(1)方案特点
北京方正电子政务技术有限公司推出的方正智思舆情预警辅助决策支持系统,以整合互联网搜索技术及信息智能处理技术,通过知识管理的方法,对互联网海量信息进行自动抓取、自动分类、自动聚类、主题检测、专题聚焦,实现用户的网络舆情监测和新闻专题追踪等信息需求,形成简报、报告、图表等分析结果,为客户全面掌握群众思想动态,做出正确舆论引导,提供分析依据。
与国外相比,我国网络舆情还存在以下特殊情况:一是由于历史的原因,我国曾长期处于封闭状态,容易受到外来思想文化的冲击。二是目前我国正处于社会转型期,不可避免地存在诸多矛盾,容易使一些人出现情绪化冲动,以致不能明辨是非。三是少数社会管理者对于舆论习惯于回避或堵塞。因此,网络这把锋利的“双刃剑”在提供了下情上达的便捷方式的同时,也对我国政治安全和文化安全构成了严重威胁,具体表现在以下三个方面:一是西方国家利用网络对我国进行“西化”“分化”,网上思想舆论阵地的争夺战日趋激烈。二是传统的政治斗争手段,在网上将以更高效的方式实现,利用网络串联、造谣、煽动将比在现实中容易得多,也隐蔽得多。三是通过网络,西方的观念、生活方式可以便捷地渗透进来。对于网络舆情的这些特点,社会管理者应当了然于心。对现实中出现的各种网络舆论,社会管理者应能做出及时反馈,防微杜渐,防患于未然。因此必须利用现代信息技术对网络舆情予以分析,从而进行控制和引导。由于网上的信息量十分巨大,仅依靠人工的方法难以应对网上海量信息的收集和处理,需要加强相关信息技术的研究,形成一套自动化的网络舆情分析系统,及时应对网络舆情,由被动防堵,化为主动梳理、引导。
相似搜索与消重
相似搜索是在对象集合中,找到与指定的查询对象相似的对象实例或对象子集。例如:从WEB中找出与指定内容相似的页面、图片或其他信息。在实际应用中,找出舆情信息内容几乎相同的文章,实现对舆情信息的消重;根据文章主题相似性,形成专题报道,背景分析等等。
(4)市场意义
运用方正智思舆情预警辅助决策支持系统,宣传业务部门可以有效的规范互联网信息,引导健康有益的舆论导向。该系统对于促进加强互联网信息监管,组织力量展开信息整理和深入分析,应对网络突发的公共事件,全面掌握社情民意都有着积极的推动作用
自动分类与自动聚类
分类是通过对训练集的学习,得出每一分类的属性特征的模型,然后使用这一模型对未知分类情况的数据进行分类。典型的应用是系统通过对部分已知分类文档的学习训练后,对文档集进行自动分类。它区别于聚类的关键是它有个学习的过程。
聚类是将数据集合中的数据划分为具有一定意义的子集,使得不同子集中的数据差别(距离)尽可能大,而同一子集中的数据差别(距离)尽可能小。典型的应用例子是,在空间数据库中,根据数据点的空间分布情况,将数据点分成不同的簇。
这样的系统应该具备以下功能:首先是舆情分析引擎。这是舆情分析系统的核心功能,包括:1、热点话题、敏感话题识别,可以根据新闻出处权威度、评论数量、发言时间密集程度等参数,识别出给定时间段内的热门话题。利用关键字布控和语义分析,识别敏感话题。2、倾向性分析,对于每个话题,对每个发信人发表的文章的观点、倾向性进行分析与统计。3、主题跟踪,分析新发表文章、贴子的话题是否与已有主题相同。4、自动摘要,对各类主题,各类倾向能够形成自动摘要。5、趋势分析,分析某个主题在不同的时间段内,人们所关注的程度。6、突发事件分析,对突发事件进行跨时间、跨空间综合分析,获知事件发生的全貌并预测事件发展的趋势。7、报警系统,对突发事件、涉及内容安全的敏感话题及时发现并报警。8、统计报告,根据舆情分析引擎处理后的结果库生成报告,用户可通过浏览器浏览,提供信息检索功能,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。其次是自动信息采集功能。现有的信息采集技术主要是通过网络页面之间的链接关系,从网上自动获取页面信息,并且随着链接不断向整个网络扩展。目前,一些搜索引擎使用这项技术对全球范围内的网页进行检索。舆情监控系统应能根据用户信息需求,设定主题目标,使用人工参预和自动信息采集结合的方法完成信息收集任务。第三是数据清理功能。对收集到的信息进行预处理,如格式转换、数据清理,数据统计。对于新闻评论,需要滤除无关信息,保存新闻的标题、出处、发布时间、内容、点击次数、评论人、评论内容、评论数量等。对于论坛BBS,需要记录帖子的标题、发言人、发布时间、内容、回帖内容、回帖数量等,最后形成格式化信息。条件允许时,可直接针对服务器的数据库进行操作。舆情分析系统的核心技术在于舆情分析引擎,涉及的最主要的技术包括文本分类、聚类、观点倾向性识别、主题检测与跟踪、自动摘要等计算机文本信息内容识别技术。这些技术一向是国内外信息工作者关注的领域。文本检索会议(TREC)、情报检索专业组会议(SIGIR)、文本检测与跟踪会议(TDT)等都是展示此类技术最新研究成果的最主要的国际会议和论坛。其中基于关键词统计分析方法的技术相对比较成熟,但在其有效性方面还有很大的提高空间。近年来,专家学者一直在研究更加有效的方法,其中基于语义的内容识别方法是当前研究的重中之重,虽然也取得了较大进展,但仍存在很多问题和困难需要克服。为了增加我国网络信息控制能力,我们必须迎难而上加强相关技术的研究。