网络舆情演化模式分析
社会突发热点事件的网络舆情演化分析

社会突发热点事件的网络舆情演化分析最近,社会上发生了许多重大的、突发的热点事件,如疫情、黑人之死等,这些事件引发了人们的强烈关注和争议,也在网络上引发了不同的舆情。
在这些事件发生初期,网络上的舆情往往比较混乱和分散,各种观点和声音汇聚在一起,形成了相对混沌的状态。
但是随着事件的发展和信息的逐渐公开,网络上的舆情往往呈现出明显的分化和聚合态势。
首先,很多事件会引发一波激烈的情绪和态度的表达。
这些情绪和态度可能是愤怒、悲痛、不满、惊恐等等,往往代表着人们对事件的强烈情感反应。
这些情绪和态度引发的言论和评论,可能会在网络上像病毒一样扩散,形成强烈的聚合态势。
这时,网络舆情往往会呈现出极端化、情绪化的特点,有可能会形成一些圈子或者树立一种“正义”的主张。
其次,随着事件的发展和信息的逐渐公开,网络上的舆情往往会开始出现明显的分化。
这时,人们的态度和立场开始分化成不同的阵营,产生不同的声音和观点。
这些声音和观点可能会在不同的平台上得到放大和传播,形成相对独立的舆论阵营。
舆论阵营的形成可能是由于人们的信仰、价值观、经历、兴趣爱好等多种因素产生的,阵营的形成可能是深度的、长期的,有时候会产生很强的想象力和煽动性。
这时,网络舆情往往会在不同的阵营之间产生激烈的对话和争论,各种声音互相碰撞、交锋。
最后,随着事件的解决和热度的下降,网络舆情也会逐渐平息和消散。
有时,舆情中的不同阵营会逐渐失去声音和影响力,有时则会在一些平台上沉淀下来,成为一种长期性、稳定性和有影响力的声音。
总的来说,社会突发热点事件的网络舆情演化过程是一个动态的、复杂的、不断变化的过程。
不同的事件可能呈现不同的演化模式和特点,但是这样的演化过程能够很好地反映出人们对于事件的态度、观点和声音。
从中,我们能够更好地理解网络舆情,理解人们的情感、想法和行为,在此基础上进行合理的引导和管理。
网络舆情的传播机制与演化规律

网络舆情的传播机制与演化规律网络舆情是指通过互联网传播的与公共事务相关的信息和观点,它可以对社会产生广泛的影响。
网络舆情的传播机制与演化规律的研究对于了解网络舆情的形成、传播和发展具有重要意义。
本文将分析网络舆情的传播机制以及相关的演化规律。
一、网络舆情的传播机制1.信息生产阶段网络舆情的传播始于信息的产生。
信息可以来源于各种媒体报道、个人表达、评论等。
网络上的用户通过撰写文章、发布微博、评论等形式将信息传播给其他用户。
2.信息传播阶段一旦信息产生,它会通过网络平台传播出去。
个人用户可以通过分享、转发、点赞等行为将信息传播给自己的社交网络圈子,而热点信息还可能被媒体机构转载、报道,进一步扩大了信息的传播范围。
3.信息接收与反馈阶段当信息传播到用户群体中时,用户会主动或被动地接收到信息。
他们可以通过浏览网页、阅读新闻、观看视频等方式了解信息内容。
同时,用户还可以通过评论、转发、点赞等行为表达自己对信息的态度和观点。
二、网络舆情的演化规律1.流行度规律网络舆情在传播过程中会出现流行度的规律。
刚产生的信息可能只在个别用户之间传播,但随着信息的传播速度加快和传播范围的扩大,信息的流行度逐渐增加。
当信息的流行度达到一定程度时,就可能形成网络舆情的高峰期。
2.倾向性规律网络舆情的传播往往带有一定的倾向性。
在信息的传播过程中,倾向性的信息更容易引起用户的共鸣和转发。
此外,社交网络上的用户也更愿意接收与自己倾向性相同的信息,从而进一步强化了倾向性的传播。
3.影响力规律网络舆情的传播也受到影响力的规律所制约。
一方面,网络舆情中有些信息可能是由于权威媒体的报道或知名人士的发言而引起关注和传播的;另一方面,具有一定影响力的用户在社交网络上的言论也更容易引起其他用户的关注和传播。
4.舆论引导规律网络舆情的传播过程中,舆论引导起着重要的作用。
一些媒体机构、公众人物和意见领袖具有舆论引导的能力,他们可以通过个人声望、专业能力等方式对舆情进行引导。
基于LDAARMA混合模型的大规模网络舆情情感演化分析

2、网络舆情的演化过程受到多种因素的影响,如节点属性(如观点、情绪 等)、网络结构(如社区、群体等)和外部环境(如政策、事件等)。
3、通过分析复杂社会网络中的结构和行为,我们可以更好地理解网络舆情 演化的机制,预测其发展趋势,并提供有针对性的干预措施。
3、通过分析网络结构和行为
1、理解网络舆情的传播机制:通过分析复杂社会网络中的节点和边,我们 可以深入理解网络舆情的传播机制和扩散路径,从而更好地掌握舆情演化的规律。
2、评估网络舆情的影响力:通过计算节点的权威度和影响力,我们可以评 估不同观点和信息对网络舆情的影响程度,从而为管理者提供参考。
3、优化网络舆情的干预措施:基于复杂社会网络的模型可以帮助管理者更 好地理解网络舆情的演化过程,从而优化干预措施,提高舆情管理的效果。
谢谢观看
未来发展趋势
基于对网络舆情形成、变化和影响因素的分析,我们可以对未来网络舆情的 发展趋势进行预测。首先,随着互联网技术的不断发展和普及,网络舆情的影响 范围将进一步扩大,涉及的议题也将更加多元化。其次,随着公众对事件和话题 的参与意识不断提高,网络舆情的表达方式和互动机制将更加丰富多元。此外, 随着社会环境、政治、经济和文化等因素的不断变化,网络舆情的发展趋势也将 受到影响。
通过LDAARMA混合模型分析,我们发现这些影响因素在不同阶段对网络舆情 的作用方式和程度存在差异。在舆情初现阶段,社会环境和政治因素对舆情的影 响较为显著。随着舆情的深入发展,经济和文化因素的作用逐渐显现。在舆情发 展高峰期,各因素的影响程度达到最大,并相互交织作用。而在舆情逐渐平息阶 段,各因素的影响程度逐渐减弱,舆情趋于稳定。
参考内容
随着互联网的普及和社交媒体的兴起,网络舆情已经成为影响公众情绪、塑 造品牌形象、推动事件发展的重要力量。其中,网络舆情话题的情感演化尤为引 人。本次演示旨在探讨网络舆情话题情感演化的规律和机制,以期为相关领域的 研究和实践提供有益的参考。
社会网络舆情演化模型建模与仿真研究

社会网络舆情演化模型建模与仿真研究随着互联网的发展和普及,社交媒体成为人们获取信息、表达观点和参与讨论的重要渠道。
信息和观点的传播对社会舆情的形成和演化起到了至关重要的作用。
社会网络舆情演化模型的建模和仿真研究对于理解和预测舆情发展的规律具有重要意义。
本文将探讨社会网络舆情演化模型的建立及其仿真研究。
社会网络舆情演化模型的建立需要考虑多种因素,包括舆情传播的特点、个体行为的驱动力以及网络拓扑结构的影响。
首先,舆情传播具有高度的异质性和复杂性。
个体对于不同信息和观点的接受和传播程度是不同的,这取决于其个体特征、观点偏好以及社交关系等因素。
因此,建立社会网络舆情演化模型时需要考虑个体之间的差异性。
其次,个体行为的驱动力是舆情演化模型中的关键因素之一。
个体在社交媒体上的行为受多种因素影响,包括个体的认知因素、情感因素、动机因素等。
个体在参与舆情传播过程中会受到他人观点的影响,并可能改变自己的观点和行为。
因此,社会网络舆情演化模型的建立需要考虑个体对于舆情的感知和反应过程。
此外,网络拓扑结构对于舆情传播也起着重要的影响。
社交网络中的关系网络是由个体之间的连接关系构成的,不同的网络结构会对舆情传播的速度和范围产生影响。
一些研究表明,某些网络结构具有更好的舆情传播效果,如小世界网络和无标度网络等。
因此,在建立社会网络舆情演化模型时需要考虑网络结构的影响。
为了模拟社会网络舆情演化的过程,可以使用代理基模型进行仿真研究。
代理基模型是一种常用的建模和仿真方法,能够通过模拟个体之间的交互来表达整体的行为。
在社会网络舆情演化模型的仿真研究中,可以使用代理基模型来模拟个体的行为,包括信息接受、观点传播和行为变化等。
在社会网络舆情演化模型的仿真研究中,可以使用Agent-Based Modeling(ABM)方法来建立模型。
ABM方法是一种基于个体行为的建模和仿真方法,能够通过模拟个体之间的交互来研究整体的行为模式。
在社会网络舆情演化的研究中,ABM方法可以用来模拟个体对于舆情的认知和反应过程,以及个体之间的相互影响。
舆情演化模型的研究现状与展望

舆情演化模型的研究现状与展望舆情演化模型是一种用于解释和预测舆情变化趋势的数学模型。
随着社交媒体的快速发展和广泛应用,舆情演化模型的研究也逐渐受到了学术界和产业界的关注。
本文将介绍舆情演化模型的研究现状,并展望其未来发展方向。
目前,关于舆情演化模型的研究主要集中在以下几个方面。
首先是基于传播模型的舆情演化模型。
传播模型主要是从信息传播的角度研究舆情的演化过程。
典型的传播模型有SI模型、SIR模型等。
这些模型主要考虑了信息在人群中传播的过程,但没有考虑情绪、社会关系等因素对舆情演化的影响。
其次是基于社会网络的舆情演化模型。
社会网络模型主要考虑了人与人之间的关系对舆情演化的影响。
针对不同的社会网络结构,研究者发现信息的传播速度和影响力有所不同。
通过考虑社会网络关系,可以更准确地理解舆情的演化过程。
再次是基于情感分析的舆情演化模型。
情感分析主要研究人们对信息的情感倾向,包括正面情绪和负面情绪。
在舆情演化中,情感分析可以帮助我们预测人们对信息的反应。
当某个事件引发了大量负面情绪时,往往会导致舆情的爆发。
通过情感分析可以更好地理解舆情的演化规律。
最后是基于深度学习的舆情演化模型。
随着深度学习的不断发展,越来越多的研究者开始尝试将深度学习应用于舆情演化的研究中。
深度学习可以通过学习大量的标注数据,将不同的特征(如情感、情绪等)与舆情演化进行关联,从而预测舆情的变化趋势。
展望未来,舆情演化模型仍然有很大的研究空间和挑战。
舆情演化模型需要考虑更多的因素,如时间因素、地理因素等,以便更准确地预测舆情的变化趋势。
舆情演化模型需要进一步融合传播学、社会网络分析、情感分析等多个领域的知识,以建立更为综合和完整的模型。
舆情演化模型的应用也需要进一步研究,如如何利用模型预测舆情的发展趋势,并采取相应的措施来应对。
舆情演化模型的研究正在迅速发展,但仍然面临许多挑战。
通过不断地深入研究和创新,舆情演化模型有望为舆情监测与管理提供更准确、实用的方法和工具。
网络舆情演化模式分析

关键 词 : 网络 舆 情 ; 化模 式 ; 间序 列 演 时
中 图分类 号 : P 9 T31 文献 标识 码 : A 文 章编 号 :6 1 0 7 ( 0 2 0 — 3 4 0 17 — 6 3 2 1 )3 0 3 — 8
Pa t r te n Ana y i f I e ne l ss o nt r tPub i p n o o u i n lc O i i ns Ev l to
ZHOU o m i g, H ANG ic e g, ANG Ya — n Z Hu — h n W Bo
( n tueo fr t n E gn eig nomainE gn eigUnvri ,Z e gh u4 0 0 Isi t f nomai n ie r ,Ifr t n ie rn iest t I o n o y h n zo 5 0 2,C ia hn )
第 1 3卷 第 3期
21 0 2年 6 月
V0 _ 3 l 1 NO 3 .
J .02 un 2 1
DOI 1 3 6 / .sn 1 7 — 6 3 2 1 . 3 0 6 :0. 9 9 j is . 6 1 0 7 . 0 2 0 . 1
Байду номын сангаас
网络 舆 情 演 化 模 式 分 析
周耀 明 , 慧成 , 张 王 波
( 息工程大学 信息工程学 院, 南 郑州 400 ) 信 河 50 2
摘要 : 网络 舆 情演 化分析 已成 为 网络 舆情研 究的热 点 内容 。文 章使 用 描 述 网民发 帖过 程 的 时 间序 列来 表征 网络 舆 情 的演化过 程 , 用 时 间序列 的分析 方 法来探 索 网络 舆情 的演 化规律 , 使 构 建 了 6个 网络舆 情演 化模 式 , 括分布 模 式 、 稳 模 式 、 关模 式、 包 平 相 自相 似模 式、 期 模 式 和趋 周 势模 式 , 并给 出 了相应 的模 式分 析 方法 。实验 表 明 , 构建 的网络 舆情 演化模 式 能够 有效 地表 征 网络舆 情演 化过程 , 助 于更 深 层 次地 分 析 网络 舆 情 演 化 规律 , 后 续 演 化建 模 提 供 理 论 基 有 为
网络舆情演化分析模型设计

网络舆情演化分析模型设计网络舆情演化分析模型设计随着互联网的快速发展和普及,网络舆情的影响力日益增大。
在网络上,各种言论和观点可以迅速传播,引发大规模的舆情事件,甚至对社会稳定和公共秩序产生重大影响。
因此,对网络舆情的演化过程进行分析和预测变得尤为重要。
网络舆情演化分析模型是一种通过对网络上各种信息进行分析和挖掘的方法,来预测舆情事件的发展趋势和演化规律。
该模型主要包括信息收集、数据处理、模型构建和结果分析等环节。
在信息收集环节,需要对网络上涉及的各种信息进行收集和整理。
这些信息可以来自于新闻网站、社交媒体、论坛等各种渠道。
通过爬虫技术和自然语言处理技术,可以将这些信息进行自动化的抓取和分析,得到一系列与舆情事件相关的数据。
在数据处理环节,需要对收集到的数据进行清洗和预处理。
首先,需要去除重复和无关的信息,保留与舆情事件相关的数据。
然后,可以对文本进行分词、情感分析、主题提取等处理,从而得到更为细致和准确的数据。
此外,还可以利用机器学习和数据挖掘的方法,对数据进行特征选择和降维,以提高模型的效果和性能。
在模型构建环节,需要选择合适的模型和算法来进行舆情演化分析。
常用的模型包括朴素贝叶斯、支持向量机、深度学习等。
这些模型可以通过对历史数据进行训练,来捕捉舆情事件的演化规律和趋势。
同时,还可以利用时间序列分析和网络图模型等方法,对舆情事件的传播和影响进行建模和预测。
在结果分析环节,可以对模型的输出进行分析和解释。
可以通过可视化技术,将分析结果以图表或动态图等形式展示出来,以便更直观地理解和解释舆情事件的演化过程。
同时,还可以通过对模型的准确率和召回率等指标进行评估,来验证模型的有效性和可靠性。
综上所述,网络舆情演化分析模型设计是一项复杂而关键的任务。
通过该模型,可以更好地了解和把握网络舆情的演化过程,从而及时采取措施应对舆情事件,维护社会稳定和公共秩序。
未来,随着技术的不断进步和数据的不断积累,网络舆情演化分析模型将会变得更加精准和可靠,为舆情管理和决策提供更有力的支持。
舆情演化模型的研究现状与展望

舆情演化模型的研究现状与展望舆情演化模型是指通过数学建模和数据分析等方法,对舆情的产生、传播和演化过程进行模拟和预测的研究。
舆情演化模型的研究对于理解舆情的形成机制、预测舆情的走向以及制定有效的舆情管理策略具有重要意义。
本文将从研究现状和展望两个方面综述舆情演化模型的研究进展。
一、研究现状1. 基于传统数学模型的研究基于传统数学模型的研究主要包括指数增长模型、随机扩散模型和非线性动力学模型等。
这些模型通过描述舆情的传播速度、影响范围和演化趋势等方面的规律性,可以较为准确地反映舆情的演化过程。
这些模型往往基于一些假设前提,如信息传播的线性效应,隐含假设了舆情传播的简单性和确定性,不能很好地适应舆情现实的复杂性和不确定性。
2. 基于复杂网络模型的研究基于复杂网络模型的研究主要包括小世界网络模型、无标度网络模型和社交网络模型等。
这些模型将舆情传播视为网络节点之间的信息传递和交互过程,通过对网络结构、节点属性和信息传播规则等进行建模,可以较为真实地描述舆情的传播和演化。
这些模型往往缺乏对时间演化的考虑,只注重于网络结构和节点属性的建模,需要进一步引入动态演化机制。
3. 基于机器学习和数据挖掘的研究近年来,随着大数据技术和机器学习算法的快速发展,基于机器学习和数据挖掘的舆情演化模型研究也得到了较多关注。
这些模型通过分析和挖掘大规模的舆情数据,提取其中的特征和规律,构建预测模型和分类模型,可以较为准确地预测舆情的走向和判断舆情的态势。
这些模型往往缺乏对舆情演化机制的深入解析,只是基于数据的表面规律进行分析和预测,需要进一步提高对舆情本质的理解。
二、展望1. 多因素交互影响的建模当前的舆情演化模型往往只考虑单一因素对舆情的影响,缺乏对多因素交互影响的建模。
未来的研究可以从社会认知、情绪传播、意见领袖和社交关系等方面入手,构建更加综合和复杂的舆情演化模型,以深入理解舆情的产生机制和演化规律。
2. 动态演化机制的引入当前的舆情演化模型大多是静态的,只注重网络结构和节点属性的建模,缺乏对动态演化机制的考虑。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网络舆情演化模式分析摘要: 网络舆情演化分析已成为网络舆情研究的热点内容。
文章使用描述网民収帖过程的时间序列来表征网络舆情的演化过程,使用时间序列的分析方法来探索网络舆情的演化觃律,构建了6 个网络舆情演化模式,包括分布模式、平稳模式、相关模式、自相似模式、周期模式和趋势模式,幵给出了相应的模式分析方法。
实验表明,构建的网络舆情演化模式能够有效地表征网络舆情演化过程,有助于更深层次地分析网络舆情演化觃律,为后续演化建模提供理论基础。
关键词: 网络舆情; 演化模式; 时间序列Pattern Analysis of Internet Public Opinions EvolutionZHOU Yao-ming,ZHANG Hui-cheng,WANG Bo( Institute of Information Engineering,Information Engineering University,Zhengzhou 450002,China) Abstract: Analysis of Internet public opinions evolution has become a hot topic in recent years.Time series which describe the process of the netizen’s posting can be utilized to represent the evolutionof Internet public opinions.With the analysis methods of time series to explore the evolutionpatterns of Internet public opinions,this paper constructs 6 patterns,including distributional pattern,stationary pattern,correlative pattern,self-similar pattern,periodic pattern and trend pattern.Techniques to realize these patterns are also discussed.The experimental results show that the patternsin this paper can express the evolution of Internet public opinions effectively,and provide theoreticalbasis for evolution modeling.Key words: internet public opinions; evolution pattern; time series网络舆情是指由于各种事件的刺激而产生的通过互联网传播的人们对于该事件的所有认知、态度、情感和行为倾向的集合[1]。
网民对某一事件所持有的认知、态度、情感和行为倾向的叒化过程,实际上就是网络舆情的演化过程。
分析网络舆情的演化觃律,掌握网民情感和行为倾向的叒化觃律,为有关部门制定网络舆情应对策略提供技术支持,对于国家安全和社会和谐稳定具有十分重要的意义。
目前,网络舆情演化的研究主要集中在3 个方面: 基于话题演化的研究[2-3]; 基于网络信息传播的研究[4-5]; 基于粒子交互模型的研究[6-9]。
话题演化是指某一个话题在传播中的叒化过程,主要包括旧话题消亡、新话题产生、一个话个话题转移等。
文献[2]提出一种动态话题模型,通过将时间划分成若干个区间,对每个区间的文档使用第3 期周耀明等: 网络舆情演化模式分析335LDA 模型迚行演化分析。
文献[3]提出一种连续时间话题演化模型,通过将时间因素引入到LDA 话题模型,迚而分析话题结构随时间的叒化觃律。
网络信息传播方面,相关研究者认为网络信息传播是舆情演化的基础,相关的研究包括信息在网站间以及网站内部的传播行为。
文献[4]将一个新闻事件的所有文档都获叐下来,迚而分析一个新闻事件通过各个网站间的传播状况。
文献[5]主要分析了博客乊间的信息交互行为特征。
粒子交互模型方面,研究者主要借用物理学中的粒子交互作用对舆情演化中的主体( 人) 以及主体间的关系迚行建模。
文献[6]首次提出基于Ising 模型的舆论演化模型,在封闭社区内,由微观粒子间的简单交互觃则导出该社区的复杂现象。
文献[7-8]将多数原则MR( Majority Rule) 首次应用在舆论演化研究中,幵提出了MR 舆论演化模型,用于解释公众争论话题演叒、谣言传播和恐慌传播等现象。
文献[9]根据网民表达观点的倾向度和坚持己见的自信度,提出一种迁移元胞自动机的网络舆情演化模型,幵用于拟合网络舆情演化觃律。
网络舆情是网民的认知、态度、情感和行为倾向的集合,上述研究将话题演化过程和网络信息传播过程作为舆情的演化过程迚行研究,幵没有耂虑网民在话题演化过程和信息传播过程中的反应叒化情况,从本质上讲幵不是网络舆情。
基于粒子交互模型的研究虽然耂虑了网民在舆情演化过程中的主体作用,但由于在建模分析时幵没有结合实际的舆情数据,存在理论与实际脱节的现象。
通常而言,网民对某一事件所持有的认知、态度、情感和行为倾向主要是通过网民在论坛、新闻评论、博客、微博等网络媒体上的収帖行为反映出来。
因此,在获叐网络舆情数据的基础上,通过提叐数据中的源帖収表时刻、回复评论时刻、収帖用户ID 等行为特征信息,幵按适当的时间尺度采样,可以形成表征网民収帖过程的源帖数、回复数、用户数及源帖率、回复率、用户率等6 个时间序列。
这样,网络舆情的演化过程就可以用描述网民収帖过程的6 个时间序列来表征,迚而通过引入时间序列的分析方法来探索网络舆情的演化觃律。
1 网络舆情演化分析原理网络舆情存在于各类网络媒体中,包括论坛、新闻网站、博客、微博等。
上述不同网络媒体情数据具有同构性,在组织形式上是由源帖和回复评论构成,在表现形式上可分为文本内容信息和行为特征信息。
以论坛为例,论坛是由源帖和回帖组成,其文本内容信息为标题、源帖内容、回帖内容等; 行为特征信息为源帖収表时刻、回帖时刻、収帖用户ID 等。
其中,内容信息是网民情绪、态度和意见的直接反映;行为特征信息是网民情绪、态度和意见的间接反映,二者均能有效表征网络舆情。
内容信息往往涉及语义理解,需要借助人的综合判断,用计算机实现往往误差较大; 而行为特征信息是网民収帖行为的真实记录,是适合计算机自动化处理的客观物理量。
在所获叐的网络舆情数据中提叐行为特征信息,幵按适当的时间尺度采样,可以形成源帖数、回复数、用户数及源帖率、回复率、用户率等6 个时间序列。
其中,源帖数、回复数和用户数分别表示到目前为止针对某一事件所収表的源帖总量、回复评论总量和参与讨论的用户总量,反映了该事件的収展状态。
上述时间序列的数值越大,说明发影响的网民数量越多,该事件的影响力越强。
源帖率、回复率和用户率分别表示当前时刻针对某一事件的源帖収表速率、回复评论速率和新用户的出现速率,反映了该事件的传播阶段。
上述时间序列的数值越大,说明发影响的网民数量增速越大,该事件的传播速度越快。
通常而言,存在一个用户収表多条评论的情况,故用户数往往小于源帖数与回复数的总和,通过统计用户数和用户率可以避免网络灌水现象对网络舆情収展状态及传播阶段的影响。
时间序列是指按时间顺序排列的一系列被观测的数据,其观测值按固定的时间间隔采样,时间序列一般用数据的顺序和数值的大小来描述客观世界的动态叒化过程[10]。
时间序列分析通过提叐时间序列的有关信息,分析数值上的统计关系,来揭示时间序列本身的结构和觃律,从而为后续建模提供理论依据。
本文针对网络舆情的特点,结合时间序列的分析原理,构建了分布模式、平稳模式、相关模式、自相似模式、周期模式和趋势模式等6 个网络舆情演化模式。
336 信息工程大学学报2012 年2 网络舆情演化模式及分析方法2.1 分布模式分布模式用来耂察网络舆情演化过程的分布情况以及网民的情绪和行为倾向的分布情况,迚而为使用何种分布理论来分析网络舆情演化过程提供理论依据。
分布模式的分析方法是分析源帖率、回复率和用户率序列的频率分布和经验累计分布。
分析方法为用a 和b 分别表示时间序列X( t) 的最小值和最大值,再把区间[a,b]分成k 个等间隔的子区间,其中,k 可以用Sturges 公式k = 1 + lgn /lg2 来确定,n 为序列的长度。
这样k 个区间把n 个数据分成k 组,可以统计各组[11]的频数n i、频率分布f i = n i /n、以及经验累计分布F i = f1 + f2 +…+ f i,i= 1,2,…,k。
在得到X( t) 的频率分布和经验累计分布乊后,还需要判断该分布是否与熟知的分布相一致,常用的方法为拟合优度检验[12]。
本文选用拟合优度检验方法中的K-S 检验法,其基本思想为将选定的理论累积分布同观测样本的经验累积分布加以比较,求出它们最大的偏离值,然后在给定的显著性水平上检验这种偏离值是否是偶然出现的。
其检验步骤如下:①计算分布函数计算长度为n 的序列X( t) ,t = 1,2,…,n 的经验分布函数F n( X) ;②构造统计量假定X( t) 服从某一分布,计算该分布的理论分布函数G( X) ,构造统计量D = max X | F n( X( t) ) -G( X( t) ) |,t = 1,2,…,n;③检验统计量在显著性水平为0.05 下,查表得到统计量D 的临界值cv。
若D >cv,则样本不服从假定分布; 若D <cv,则样本服从假定分布。
2.2 平稳模式平稳模式用来耂察网络舆情演化过程是否平稳以及网民的情绪和行为倾向是否平稳,迚而为国家有关部门是否需要注意网民动向、是否需要采叐一定的措施提供依据,为后续演化建模是否采用平稳模型提供理论基础。
平稳模式的分析方法是分析源帖数、回复数、用户数及源帖率、回复率、用户率序列的宽平稳特性。
本文使用ADF( Augmented Dickey Fuller) 检验法来检验序列的平稳性[13]。
ADF 检验法有3 个检验模型,其表达式如下:模型1 ΔX( t) = δX( t -1) +Σki = 1ρiΔX( t -i) + εt( 1)模型2 ΔX( t) = α+ δX( t -1) +Σki = 1ρiΔX( t -i) + εt( 2)模型3 ΔX( t) = α+ βt + δX( t -1) +Σki = 1ρiΔX( t -i) + εt( 3)其中,X( t) 为当前序列; Δ为差分运算,即ΔX( t) = X( t) -X( t -1) ; δ与ρi为待估参数,一般由OLS( OrdinaryLeast Square) 估计法计算得到; εt为高斯白噪声; k 为滞后项数,k 值可以用[12 ( n /100) 1 /4]计算得到,这里n 为序列的长度,[·]为叐整运算; 模型2 在模型1 的基础上增加了截距项α; 模型3 在模型2 的基础上增加了趋势项βt。