2013话题演化研究现状基于 LDA 模型的网络舆情事件话题演化分析

收稿日期:2013-08-08 修回日期:2013-09-17

基金项目:国家自然科学基金 基于情景演化的数字化应急预案动态生成机制研究”(编号:71171117);江苏省教育厅哲学社会科学项目 基于环境演化的食品供应链安全风险转移机制研究”(编号:2012SJB 630051)三

作者介绍:林 萍(1977-),女,讲师,研究方向:网络舆情预警;黄卫东(1968-),男,教授,硕士生导师,研究方向:应急管理二数字化预案三

基于LDA 模型的网络舆情事件话题演化分析

*

林 萍 黄卫东

(南京邮电大学经济与管理学院 南京 210046)

摘 要 通过挖掘网络舆情事件话题演化,有助于在事件全面爆发之前的更早阶段釆取应急措施三本文基于网络舆情事件时间性强二话题与时间关联度单一的特征,选择网民关注度高的食品安全网络舆情事件新闻报道建立文本集,基于LDA 模型抽取话题,使用后离散时间型话题模型思路分析话题热度变化,用先离散时间型话题模型思路分析话题内容迁移三实验表明,此思路能够较全面体现话题演化路径,为网络舆情事件分析提供有效途径三关键词 网络舆情 LDA 模型 后离散时间型 先离散时间型 特征词 话题演化

中图分类号 C931.6 文献标识码 A 文章编号 1002-1965(2013)12-0026-05

Event Topic Evolution of Network Public Opinions :

An Analysis Based on LDA Model

Lin Ping Huang Weidong

(Department of Economics and Management ,Nanjing University of Posts and Telecommunications ,Nanjing 210046)

Abstract By exploring the event topic evolution of network public opinions ,it may help us to take effective measures timely in dealing with emergency cases.Since network public opinion of event is time -sensitive and the topic is closely associated with time ,we selected network public opinion of food safety incidents with high concern among netusers and extracted topics based on LDA model.The time post -discretized method was used to analyze the change of topic heat level and the time pre -discretized method was applied to analyze the

change of topic content.The proposed method was experimentally verified to be efficient for detecting the event topic evolution of network public opinions.

Key words network public opinion LDA model post -discretized method pre -discretized method feature word topic evolution 0 引 言

网络舆情是通过互联网表达和传播的,公众对自己关心或与自身利益紧密相关的各种公共事务所持有的多种情绪二态度和意见交错的总和[1]三当出现网络舆情时,舆情会在主体二情绪二强度方面出现涨落现象,随着时间的推移从无序状态过渡到有序状态,体现了不同个体二群体二阶级之间冲突,并随着人们关注度的变化逐步衰变[2],其发展阶段分为发生期二扩散前期二

扩散后期和平稳期[3],影响因素包括引发舆情的问题或事件本身及其变化发展二网民情绪二政府二媒体

等[4-5],而传播者之间的信任度亦会对舆情发展产生

重要影响[6]三舆情热度变化趋势是在1~3天时热度

急剧上升,第3天或第4天达到最大值,继而舆情热度开始逐步衰减,到第10天开始趋于平稳[5]三对于网络

舆情演化的研究为舆情的监测和预警提供了可能三

国内目前关于网络舆情演化的研究主要从网民关注度二媒体关注度等角度建立热度指标体系,将事件热度值作为网络舆情危机判断的阈值参考,却忽视了事件在发展过程中会由于各方面信息不断涌入出现关注热点的变化三比如 老酸奶事件”,舆情热度几经波动起伏,事件热点从老酸奶产品波及到工业明胶的使用,甚至出现工业明胶从破皮鞋中提取的言论,大家将目光从老酸奶产品的质量安全投射到所有乳制品的安全性,这对整个乳制品行业造成了巨大的负面效应三因此单纯关注舆情热度变化还不能够对舆情预警提供明

第32卷 第12期2013年12月 情 报 杂 志JOURNAL OF INTELLIGENCE

Vol.32 No.12

Dec. 2013

确的路径,只有准确识别事件热点并跟踪热点的变化,才能提高网络舆情监控效率三

1 话题模型研究

要把握事件关注热点及热点的变化,首先要从事件信息中准确提取话题三Juha[7]明确讨论了事件演化问题,认为一个事件可能演化发展成几个相关但独立的话题三普林斯顿大学的Blei[8]等提出了LDA模型,即语料库生成概率模型,是一个三级分层贝叶斯模型,其基本思想是:假设词由话题的概率分布混合产生,而每个话题是由词及其在话题上的概率分布表示;文档是潜在话题的概率分布的随机有限混合;针对每个文档从Dirichlet分布中抽样产生该文档包含的话题比例,结合话题和词的概率分布生成该文档中的每一个词,从而将文本由高纬词汇空间降到有限个K维空间以提取文本话题,此模型在话题识别和追踪工作中得到了广泛的应用三对于中文话题的提取,LDA模型也被证实能够有效进行文本分割提取特征词定义话题[9-10]三

为了更准确揭示话题随时间推移表现出的动态性二发展性和差异性,研究人员引入时间信息对LDA 模型进行扩展,提出TOT模型[11]二DTM模型[12]二DMM模型[13]二MTTM模型[14]二CTDTM模型[15]和OLDA模型[16]等三在国内,研究人员主要对某一时期的会议文本二科技文献或网络社区的文本集进行话题抽取,揭示热点话题的分布情况,在特征词相近前提下分析话题关联度并定义话题间的逻辑关系三比如楚克明等[17-18]通过计算同一主题中相邻时间段中任意2个话题的分布距离和话题的特征向量相似度实现话题的关联度分析,但是话题关联度并不意味着话题之间必然存在演化关系三崔凯等[19]从关键词角度使用Kullback Leibler(KL)相对熵来衡量话题之间的相似度,单斌等[20]通过引入种子文档研究关联话题及生成演化关系,胡艳丽等[21-22]基于OLDA思想建立不同时间片话题的关联,这些研究并没有将话题热度分布与话题演化结合研究三从目前研究来看,研究人员关注的是不同信息平台上的话题热点分布,并没有针对单个网络舆情事件的话题热度分布和话题内容迁移进行深入分析研究三我们认为网络舆情的监控一方面需要从海量文本中准确发现事件话题,另一方面需要基于网络舆情信息的继承性和延续性持续挖掘事件话题演化,从而准确把握事件发展动向二即时采取有效措施引导舆情方向,LDA模型可以较准确地提炼网络舆情事件话题三

2 网络舆情事件话题演化分析

 2.1 网络舆情事件话题提取 话题演化的前提是提取话题的文本信息具有时间上的连续性和内容上的继承性二延展性,因此网络舆情事件信息用时间序列上相互关联的文本集表示,记作D=d1, d i, d

{}

n,d i 作为网络舆情事件对应的一个文本,是潜在话题概率分布的随机有限混合;z表示由一组话题构成的话题向量,z=z1, z j, z

{}

k

k表示话题总数,z

j

作为网络舆情事件对应的一个话题,是一组词汇混合概率分布三V 是文本集对应的词汇集,w di表示由话题的概率分布混合产生的d文本中的第i个词汇三

本文选择LDA模型进行话题的抽取,具体工作思路是[8]:

对文集中的任一文本d i,生成文本长度N,其中N ~Poisson(ε);

对文集中的任一文本d i,生成多项式θd,其中θd~ Dirichlet(α);

文本d i中的词W d i的生成:首先,生成一个话题Z

d j

~Multinomial(θ);然后对话题Z

d j

生成一个离散变量φj~Dirichlet(β);最后生成使得P(W d i|φj)最大的一个词三

其中α和β分别表示文档 话题分布的先验参数和话题 词分布的先验参数三应用模型的参数推理方法Gibbs Sampling得到θ二φ的后验估计值,其公式为:

dj

=C DK dj+α

∑K j=1C DK dj+Kα^φij=C VK ij+β

∑V i=1C VK ij+Kβ(1)其中C DK dj表示第d篇文本中指派给第j个话题的词数目,∑K j=1C DK dj表示文本d中所有被分配了话题的词数目,C VK ij表示第i个词指派给第j个话题的次数,∑V i=1C VK ij 表示分配给第j个话题的所有词数目三

对于话题的数目K值,一般假设文档数目较大文集必然含有更多话题,根据贝叶斯模型选择方法,在确定W的情况下,P(W|K)近似计算公式为[23]:

P(W|z,K)=(Γ(Vβ)

Γ(β)V)K

∏K j=1∏VΓ(C VK ij+β)

Γ(∑i C VK ij+Vβ)(2)由式(2)计算,使得P(W|z,K)最大的K就是最佳的话题数目三

 2.2 网络舆情话题演化分析 话题的演化实际上由两个方面组成:一方面是话题在时间轴上的热度变化,热度一般通过话题与文本关联度表示;另一方面是话题在内容的变化,主要通过话题随时间变化呈现的内容迁移来表示三

由于话题热度变化需要保证话题数目和内容的一致性,因此在对话题热度进行分析时我们选择后离散

四72四

 第12期 林 萍,等:基于LDA模型的网络舆情事件话题演化分析

时间型话题演化模型,对整个文本集合基于LDA模型抽取话题,然后根据文本的发布时间将文本离散到各个时间窗口,最后利用文档 话题分布计算各个时间窗口内某一话题的热度均值,并且连接所有时间窗口上的强度均值来表示话题热度的变化三一般认为讨论某话题的文章数越多,说明该话题的热度越高,可以被认为是热门话题三根据LDA模型思想,话题在文本集中呈现的是多项式分布,也就是不同的话题与不同文本的关联度是有差异的,有些话题可能只是在文本中被提及但笔墨较弱,单纯计算话题的支持文本个数不能全面反映话题的热度三我们认为θdj较全面反映了话题Z j与文本d的关联度即关注度,可以作为话题热度的参考值,则话题Z j在t时间段内的热度值公式为:

δt j =

∑d∈D tθt dj

D t

(3)

对于话题内容迁移的分析,由于不同时间窗口话题的内容会受到各种因素影响而发生转移的,为了更准确反映给定时间窗口的话题内容,我们选择先离散时间型话题模型分析话题内容迁移三以天为时间粒度,首先将文本集合离散地分配到相应的时间窗口,然后依次处理各窗口内的文本并抽取话题,分析话题的内容迁移三具体演化分析思路见图

1三

图1 研究思路

3 实证分析

 3.1 样本选择 由于网络新闻在时效性与互动性上的优势使它对于社会重大事件的报道具有更为深远的影响力,成为人们获取新闻信息的主要来源,也是政府发布权威声明二涉事企业发布公告的正式渠道,在很大程度上主导网络舆情的发展方向,而食品安全网络舆情成为近年广受关注的话题,因此我们选择2012年4月发生的 立顿毒茶包”事件的新闻报道建立文本集三根据百度指数信息, 立顿毒茶包”舆情事件从发生到逐渐平息主要时间段为2012年4月24日 28日,以天为时间窗口划分标准,因为存在转载的情况,所以在进行新闻筛选时出现大量相同新闻,具体文本数量和词汇量如表1三

表1 立顿毒茶包”时间新闻文本统计

时间4.244.254.264.274.28

新闻数136382181379

有效文本2410363319

文集词数133034892200995439 3.2 话题热度变化分析 根据2.1算法,K的取值为4,但在提取话题内容时发现其中两个话题的前10个特征词与立顿毒茶包没有任何关联,结合θ二φ的后验估计值分析,发现文本集中部分新闻在讨论食品安全问题或一周要闻回顾中提及立顿毒茶包事件,并没有对事件本身做深入分析,因此人工重新调整话题个数为2个并通过模型求解抽取话题三根据特征词与话题关联度信息,由于前10个特征词较为近似,为了更准确区分话题关注热点的差异,每个话题取20个特征词(表2),各话题热度分布如图2三

表2 话题特征词

分类 特征词

话题1

农药,立顿,茶叶,种,绿茶,铁观音,标准,联合利华,产品,报告,

绿色和平,毒,茶树,欧盟,袋泡茶,样本,声明,系列,环保,硫丹

话题2

立顿,茶,标准,农药,茶叶,产品,品牌,国标,欧盟,消费者,毒,

食品安全,超市,种,袋泡茶,企业,质量,下架,环保,

报告

图2 立顿毒茶包”话题热度变化

从话题特征词分布可以看出:

a.话题1关注的点主要集中在三个方面三一是农药的使用导致立顿袋泡茶检测出包括硫丹在内的几种有毒物质;二是立顿之前曾经因为铁观音产品农药残留检测出现过类似问题;三是是否立顿的系列产品都存在农药残留超标的情况三如果增加特征词,还会出现人二男性生育能力二胎儿这样的词语,体现人们对于有毒农药残留对人体健康影响的担忧三

b.话题2关注的点也集中于三个方面三一是关于检测的国家标准二欧盟标准的差异,并由此引发了标准差异的争议;二是各大超市纷纷下架立顿的相关产品,消费者担忧食品安全性;三是由于产品质量问题造成

四82四 情 报 杂 志 第32卷

对立顿企业品牌的负面效应三如果关注到后续时期的报道,我们也会发现网络对于 茶叶集体涉毒”的讨论三

c.从话题的热度分布变化来看,话题1热度逐步下降,话题2热度逐步提高,反映媒体和广大网民从最初关心事件真相本身到之后对事件影响的深度忧虑,体现消费者对长期有效的食品安全保护的诉求,热度的变化符合人们从事件表面到内部问题挖掘的思考习惯三

 3.3 话题内容变迁分析 由于网络信息的不确定性,各时间窗口文本数量亦有所差异,包含的话题数是动态变化的,因此选择公式(2)确定各时间窗口的话题数,每个时间窗口的最佳话题数为(1,1,2,2,1)(表3),并通过参数估计求解得到各时间窗口的话题三

表3 每日话题特征词及关联度

语题特征词及关联度

24日农药立顿茶叶绿色和平毒绿茶铁观音种标准食品安全

0.5570.04570.02580.01840.01600.01520.01440.01290.01220.0122 25日立顿农药茶叶种标准绿茶铁观音产品茉莉花茶报告

0.04940.04730.02030.01810.01680.01630.01450.01390.01200.0115 26日1标准农药产品茶叶食品安全部门立顿欧盟质量环保

0.03640.02150.01400.01380.01300.01020.00860.00720.00540.0053 26日2立顿农药茶叶种毒产品标准绿茶铁观音绿色和平

0.05830.04400.02020.01690.01430.01430.01360.01270.01270.0114 27日1农药茶叶立顿公司茶农种标准联合利华环节基地

0.04020.03280.01920.01520.01460.01420.01230.00890.00850.0077 27日2立顿农药超市毒产品标准下架绿茶茶叶种

0.05850.03430.01910.01670.01420.01410.01170.01110.01110.0101 28日立顿农药标准联合利华品牌食品安全消费者种欧盟报告

0.03510.02790.02330.01370.01370.01070.00960.00930.00770.0075

从以上特征词在各个时间窗口的分布情况及其关联度值,以及特征词在不同时间窗口的排序(表3)可以分析出话题内容迁移情况(图

2)三

图3 话题内容迁移

首先是24日单一产品出现问题,到25日立即引起消费者对立顿系列产品的担忧,为了满足广大消费者对事实真相的诉求,26日相关部门二专家发表一系列声明及评论,并于27日集中体现在顺着食品供应链下架相关产品二溯源寻找问题缘起,最终是28日消费者对于高标准食品安全的诉求三这个话题演化符合食品安全网络舆情容易从涉事企业波及到所在行业及相关行业[24]的特点,也符合人们在求证事实真相后对更深层次的食品安全高标准的诉求以及获得有效保护措施的心理特征三

4 结 论

本文提出了基于LDA模型网络舆情事件新闻话题演化方法三其主要特点是:

a.话题热度的分析需要保证各时间窗口话题个数和内容的一致性,因此采用后离散时间型对整个网络舆情事件新闻文本进行话题抽取及热度分析,可以发现事件的关注焦点,适合于事件平息后的网络舆情分析,并且能够广泛应用于行业典型事件进行系列分析,以期发现不同行业网络舆情的话题演化特征,有助于建立有效的网络舆情预警系统三

b.网络舆情事件会随着问题的深入出现话题的分裂二转移或者合并,为准确表达话题,采用先离散时间型话题演化模型,先对文本按照时间粒点分隔,分别对每日新闻文本进行话题抽取,历史新闻文本及话题的干扰,有助于实时关注网络舆情事件的进展,发现话题内容的演化轨迹,有利于相关部门及时发布解答大众疑虑的声明,有效控制网络舆情发展三

c.最佳话题数量并不一定与文本数量呈正相关关系,而是与文本内容焦点集中度密切相关三

参考文献

[1] 刘 毅.网络舆情研究概论[M].天津:天津社会科学院出版

社,2007:53.

[2] 刘 毅.简析舆情变动规律[J].天津社会科学,2007(3):63-

65.

[3] 兰新月.突发事件网络舆情演进规律模型研究[J].情报杂志,

2011(8):47-50.

[4] 姜胜洪.网络舆情形成与发展规律研究[J].兰州学刊,2010

(5):77-79.

[5] 张一文,齐佳音,马 君,方滨兴.网络舆情与非常规突发事件

作用机制 基于系统动力学建模分析[J].情报杂志,2010

(9):1-6.

[6] 李 青,朱 恒.基于BA网络的互联网舆情观点演化模型研

究[J].情报杂志,2012,31(3):6-9.

[7] Juha M.Investigations on Event Evolution in TDT[C].Proceed?

四92四

 第12期 林 萍,等:基于LDA模型的网络舆情事件话题演化分析

ings of the 2003Conference of the North American Chapter of the Association for Computational Linguistics on Human Lan?guage Technology.Edmonton ,Canada ,2003.

[8] Blei D M ,Ng A Y ,Jordan M https://www.360docs.net/doc/f19749822.html,tent Dirichletal Allocation

[J ].Journal of Machine Learning Research ,2003(3):993-1022.

[9] 石 晶,胡 明,石 鑫.基于LDA 模型的文本分割[J ].计算

机学报,2008,31(10):1865-1873.

[10]石 晶,范 猛,李万龙.基于LDA 模型的主题分析[J ].自动

化学报,2009,35(12):1586-1592.

[11]Wang X R ,McCallum A.Topic Over Time :a Non -Markov Con?

tinuous -time Model of Topical Trends [C ].Proceedings of the

12th ACM SIGKDD International Conference on Knowledge Dis?covery and Data Mining ,Philadelphia ,PA ,USA ,2006:424-

433.

[12]Blei D M ,Lafferty J D.Dynamic Topic Model [C ].Proceedings

of the 23rd International Conference on Machine Learning ,Pitts?burgh ,Pennsylvania ,2006:113-120.

[13]Wei X ,Sun J ,Wang X.Dynamic Mixture Models for Multiple

Time Series [C ].Proceedings of the 20th International JointCon?ference on Artifical Intelligence ,Hyderabad ,India ,2007:2909-2914.

[14]Nallapati R M ,Cohen W ,Ditmore S ,et.al.Multi -scale Topic

Tomography [C ].Proceedings of the 13th ACM SIGKDD Inter?national Conference on Knowledge Discovery and Data Mining ,San Jose ,California ,USA ,2007:520-529.

[15]Wang C ,Blei D M ,Heckerman D.Continuous Time Dynamic

Topic Models [C ].Proceedings of the 24th Annual Conference on Uncertainty in Artificial Intelligence ,Corvallis ,Oregon ,2008:579-586.

[16]Alsumait L ,Barbara D ,Domeniconi C.On -line LDA :Adaptive

Topic Models of Mining text Streams with Applications to Topic Detection and Tracking [C ].Proceedings of the 8thIEEE Interna?tional Conference on Data Mining ,Washington ,DC ,USA :IEEE Computer Society ,2008:3-12.

[17]楚克明,李 芳.基于LDA 话题关联的话题演化[J ].上海交

通大学学报,2010,44(11):1496-1500.[18]楚克明,李 芳.基于LDA 模型的新闻话题的演化[J ].计算机软件与应用,2011(4):4-7.

[19]崔 凯,周 斌,贾 焰.一种基于LDA 的在线主题演化挖掘

模型[J ].计算机科学,2010,37(11):156-193.

[20]单 斌,李 芳.基于种子文档LDA 话题的演化研究[J ].现

代图书情报,2011(1):104-109.

[21]胡艳丽,白 亮,张维明.网络舆情中一种基于OLDA 的在线

话题演化方法[J ].国防科技大学学报,2012,34(1):150-154.[22]胡艳丽,白 亮,张维明.一种话题演化建模与分析方法[J ].

自动化学报,2012,38(10):1690-1697.

[23]Griffiths T L ,Steyvers M.Finding Scientific Topics [J ].Proceed?

ings of the National Academy of Sciences of the United States of

America ,2004,101(1):5228-5235.

[24]人民网舆情检测室.2012年中国企业网络舆情报告[R ],ht?

tp ://https://www.360docs.net/doc/f19749822.html,.

(责编:王平军

)

(上接第34页)

动,因此微博的生命长度由互动活动的截止日期决定,在整个活动期间微博都会保持高转发状态三在评价此类微博时,可以用整个活动期间的总转发数评价互动活动的整体影响;也可以用活动期间单位时间的平均转发数衡量互动活动对用户的吸引力三

5 结 论

本研究采用数据挖掘的方法,对330条样本微博的转发情况进行了整理和分析,通过绘制微博的生命轨迹曲线,形象地表现出信息在微博客网络中的动态传播过程,揭示了信息在微博客网络中的传播特点三研究表明大部分微博的生命周期服从三种典型的变化规律,分别是单点传播二接力传播和病毒传播三单点传播是一种最普遍的传播方式,即绝大部分转发都是从源微博发出的,不存在活跃转发点,微博的生命轨迹曲线符合幂律函数;接力传播可以视为多个单点传播的叠加,符合接力传播的微博在传播过程中出现了活跃转发点,活跃转发点带来了大量的转发数,从而使源微博的生命轨迹出现多个高峰;病毒式传播多见于鼓励用户转发参与活动的互动微博,由于转发成本低二收益大,大部分的用户看到之后都会转发,使得微博的转发

数一直保持在较高的水平,并与在线用户数量同步波

动三根据微博的传播特点,本研究提出了针对不同类型微博的质量评价指标,单点传播型微博可以从转发峰值二生命长度和消亡指数三个方面评价;接力传播可以用转发峰值二生命长度和活跃点数量三个指标衡量;病毒传播型微博可以采用总转发数和平均转发速率评价信息质量三

参考文献

[1] 中国互联网络信息中心(CNNIC ).中国互联网络发展状况统

计报告[R ].2012.

[2] Gilbert E N.Random Graphs [J ].The Annals of Mathematical

Statistics ,1959(30):1141-1144.

[3] Barabási A L ,Albert R.Emergence of Scaling in Ramdom Net?

works [J ].Science ,1999,286(5439):509-512.

[4] 汪小帆,李 翔,陈关荣.复杂网络理论及其应用[M ].北京:

清华大学出版社,2006:5.

[5] Watts D J ,Strogatz S H.Collective Dynamics of small -world ’

networks [J ].Nature ,1997,393:440-442.[6] 郭海霞.新型社交网络信息传播特点和模型分析[J ].现代情报,2012,32(1):56-59.

[7] 张彦超,刘 云,张海峰,等.基于在线社交网络的信息传播

模型[J ].物理学报.2011,60(5):60-66.

(责编:白燕琼)

03四 情 报 杂 志 第32卷

基于LDA模型的网络舆情事件话题演化分析

作者:林萍, 黄卫东, Lin Ping, Huang Weidong

作者单位:南京邮电大学经济与管理学院 南京 210046

刊名:

情报杂志

英文刊名:Journal of Intelligence

年,卷(期):2013(12)

参考文献(24条)

1.刘毅网络舆情研究概论 2007

2.刘毅简析舆情变动规律[期刊论文]-天津社会科学 2007(03)

3.兰新月突发事件网络舆情演进规律模型研究[期刊论文]-情报杂志 2011(08)

4.姜胜洪网络舆情形成与发展规律研究[期刊论文]-兰州学刊 2010(05)

5.张一文;齐佳音;马君;方滨兴网络舆情与非常规突发事件作用机制---基于系统动力学建模分析[期刊论文]-情报杂志 2010(09)

6.李青;朱恒基于BA网络的互联网舆情观点演化模型研究[期刊论文]-情报杂志 2012(03)

7.Juha M Investigations on Event Evolution in TDT 2003

8.Blei D M;Ng A Y;Jordan M I Latent Dirichletal Allocation 2003(03)

9.石晶;胡明;石鑫基于LDA 模型的文本分割[期刊论文]-计算机学报 2008(10)

10.石晶;范猛;李万龙基于LDA 模型的主题分析[期刊论文]-自动化学报 2009(12)

11.Wang X R;McCallum A Topic Over Time:a Non-Markov Con-tinuous-time Model of Topical Trends 2006

12.Blei D M;Lafferty J D Dynamic Topic Model 2006

13.Wei X;Sun J;Wang X Dynamic Mixture Models for Multiple Time Series 2007

14.Nallapati R M;Cohen W;Ditmore S Multi-scale Topic Tomography 2007

15.Wang C;Blei D M;Heckerman D Continuous Time Dynamic Topic Models 2008

16.Alsumait L;Barbara D;Domeniconi C On-line LDA:Adaptive Topic Models of Mining text Streams with Applications to Topic Detection and Tracking 2008

17.楚克明;李芳基于LDA 话题关联的话题演化[期刊论文]-上海交通大学学报 2010(11)

18.楚克明;李芳基于LDA模型的新闻话题的演化[期刊论文]-计算机应用与软件 2011(04)

19.崔凯;周斌;贾焰一种基于LDA 的在线主题演化挖掘模型[期刊论文]-计算机科学 2010(11)

20.单斌;李芳基于种子文档LDA 话题的演化研究[期刊论文]-现代图书情报技术 2011(01)

21.胡艳丽;白亮;张维明网络舆情中一种基于OLDA 的在线话题演化方法[期刊论文]-国防科技大学学报 2012(01)

22.胡艳丽;白亮;张维明一种话题演化建模与分析方法[期刊论文]-自动化学报 2012(10)

23.Griffiths T L;Steyvers M Finding Scientific Topics 2004(01)

24.人民网舆情检测室2012 年中国企业网络舆情报告

本文链接:https://www.360docs.net/doc/f19749822.html,/Periodical_qbzz201312005.aspx

相关文档
最新文档