基于数据挖掘的网络论坛话题热度趋势预报
基于创新型数据挖掘算法的热点事件预测研究

基于创新型数据挖掘算法的热点事件预测研究随着信息技术的快速发展,数据挖掘技术已经成为了当前热门的话题之一。
在各种应用场景中,研究者们开始利用数据挖掘技术来发掘数据之中隐藏的信息和规律,希望通过这些信息和规律来预测未来的发展趋势。
其中,基于创新型的数据挖掘算法的热点事件预测技术是一个备受研究者关注的领域。
一、数据挖掘算法在热点事件预测中的应用数据挖掘算法主要是通过对数据进行模型建立、模型分析、模型评估来进行数据分析和数据挖掘的过程。
与此同时,对于热点事件的预测,我们同样需要建立一个模型来寻找事件规律。
因此,数据挖掘算法无疑是一个可以有效发掘热点事件规律的有力手段。
数据挖掘算法可以应用到各种各样的情境之中,例如景点的客流预测、商品销售预测、医疗保健预测等等。
在热点事件预测中,数据挖掘算法同样可以发挥出其数据分析和规律挖掘的能力。
通过聚类算法、关联规则挖掘算法以及时间序列预测算法等等,我们可以更好地发现热点事件背后的经济、政治、社会等等方面的规律和模式。
二、创新型数据挖掘算法在热点事件预测中的应用相较于传统算法,创新型数据挖掘算法在热点事件预测中的应用更为广泛和有效。
这是由于创新型算法通常建立在传统算法之上,通过创新性的思维和方法,能够得到更为精准和有效的预测结果。
就如,基于机器学习的数据挖掘算法已经成为目前的研究热点之一。
通过机器学习的方法,算法可以根据历史事件的数据模式来构建模型,进而判断未来的热点事件,达到预测的目的。
机器学习算法在热点事件预测方面有着广泛的应用,例如在金融行业中,我们可以通过机器学习算法来确定股票价格的趋势和上涨下跌的概率。
除此之外,深度学习算法、神经网络算法等等也是目前研究热点之一。
这些算法都是通过创新性的能力来提高预测的准确率和效果。
基于创新型算法的热点事件预测技术随着技术的不断进步,越来越受到人们的关注和青睐。
三、基于创新型数据挖掘算法的热点事件预测技术应用前景全球化以及数字化的加速发展已经带来了许多文化、政治和经济的变化,这意味着不断出现新的热点事件。
基于数据挖掘技术的微博热点话题预测

Keywords:data mining;network technology;micro⁃blog topic;forecasting model
0
引
有指数平滑、线性回分、灰色模型等 [5⁃7],微博热点话题预
言
测精度低,这主要是因为微博热点话题受到多种因素的
随 着互联网的不断发展,出现了微博热点话题,指
题的预测性能进行分析。结果表明,数据挖掘技术可以描述微博热点话题的变化特点,提高了微博热点话题的预测准确性。
关键词:数据挖掘;网络技术;微博话题;预测模型
中图分类号:TN911.1⁃34;TP391
文章编号:1004⁃373X(2017)15⁃0052⁃04
文献标识码:A
Micro⁃blog hot topic forecasting based on data mining technology
机构建微博热点话题预测模型,并采用量子粒子群优化
l ci = l cMin + (l cMax - l cMin ) × ( i s)
算法确定支持向量机的参数,结果表明,本文模型提高
了微博热点话题的预测精度。
1
1.1
53
张贵红,等:基于数据挖掘技术的微博热点话题预测
作用,其中人为因素影响最为严重,具有强烈的时变性,
人们对某个问题的议论和评价。微博热点话题有直接
传统模型无法准确描述该变化特点,其应用范围受到一
性、突发性、偏差性等变化特点,传播速度快,影响大 [1]。
定的限制 [8]。现代方法主要采用数据挖掘技术,有神经
一些负面的微博热点话题会对国家安全、社会稳定性产
(乐山师范学院 计算机科学学院,四川 乐山
摘
基于Kmeans算法微博热点话题预测分析

1 微博热点话题预测背景及现状介绍
微博热点话题的建模和预测主要基于时间分析。他们将微博 热点话题的历史样本视为时变数据,可分为两类 :传统方法和现 代方法。有指数平滑、线性回归、灰色模型等。微博热点话题的 预测准确率较低,主要是因为微博热点话题受到多种因素的影响, 其中人为因素最为严重,具有很强的时变性。传统模型无法准确 描述变化特征,其应用范围受到一定限制。现代方法主要使用数 据挖掘技术,如神经网络和支持向量机,以获得比传统模型更理 想的预测结果。
射频功率(W) 103.3 155.1 201.5
真空度(Pa) 2.33×101 1.35×101 5.61×100
4 模拟测试
为 了 分 析 基 于 数 据 挖 掘 技 术 的 微 博 热 点 预 测 性 能, 采 用 python 编程实现了微博热点预测模型,选取金庸之死作为微博热 点预测的目标,并选取最后 50 个微博热点来测试模型的泛化能力, 热点趋势图如图 2 所示。
图2
4.1 结果和分析 从该模型中微博热门话题的预测结果来看(下转第 122 页)
图1
首先,通过微博爬虫系统获取所需的数据,如微博内容、评 论号、转发号和受众号。其次,从获取的数据中提取话题识别的 数据源,并通过中文分词对数据进行过滤。对于预处理后的微博 内容中的每个特征词,使用特征词权重计算方法 TF-IDF(术语 频率 - 反文档频率)计算特征权重并建立向量空间模型,然后使 用 K 均值文本聚类来总结多个主题。最后,对几个主题的影响进 行了计算和分析,并通过效果验证确定了热点主题。
利用数据挖掘技术预测舆情走势

利用数据挖掘技术预测舆情走势近年来,随着社交媒体的普及和数字化程度的提高,舆情管理已经成为各行各业都需要面对的重要问题。
一些企业和政府机构,长期以来都采取了传统的对外沟通、宣传和公关等方法,以维护良好的形象和品牌。
但是,这些方法的效果往往难以评估和预测,也难以应对突发的负面事件。
因此,利用数据挖掘技术预测舆情走势成为了一个备受关注的方向。
数据挖掘是一种从大规模的数据中自动发现隐藏在其中的有用信息和模式的技术。
在舆情预测中,数据挖掘可以应用于舆情监测、情感分析、事件检测等方面。
通过对社交媒体、新闻报道、评论和博客等大量数据的收集和分析,可以抽取出关键词、主题、情感倾向等信息,从而推测当前的舆情热点、变化趋势和可能产生的影响。
在此基础上,可以进行预警、预测和干预,以避免或降低负面影响。
舆情预测的过程可以分为数据收集、特征提取、模型构建和预测四个阶段。
首先,需要确定数据源,收集与预测对象相关的数据,并对数据进行清理、预处理和筛选。
其次,通过文本处理和自然语言处理技术,将文本数据转化为数字特征向量,以表示文本的语义信息、情感倾向和主题意图等,同时过滤掉无关的信息和干扰项。
第三步,利用机器学习、数据挖掘或人工智能等技术,选定合适的模型,并对特征向量进行训练和优化,从而得到能够预测舆情走势的模型。
最后,对新的数据进行预测和分析,评估模型的准确性和可靠性,并不断优化和修正模型。
值得注意的是,舆情预测不是一种超准确的预测技术,它只是通过数值分析对当前舆情的趋势和变化进行推测,具有一定的局限性和误差率。
因此,在进行舆情预测时,需要充分考虑到各种因素的复杂性和不确定性,以及数据的质量和实时性。
同时,还需要关注舆情的社会背景和历史背景,以避免误判和错误决策,从而达到稳定和可持续的效果。
舆情预测技术的应用前景广阔,可以服务于企业、政府、媒体、广告、教育、医疗等领域,为他们提供更加准确、灵敏和主动的舆情管理方案。
例如,企业可以及时了解消费者的需求和反馈,调整产品和服务策略,提高客户满意度和忠诚度;政府可以对公共事件和政策进行预判和调整,减少社会不稳定因素和矛盾冲突;媒体可以根据舆情趋势制定报道和编辑方案,提高新闻的公信力和传播效果;广告可以根据精准的舆情分析定位目标人群,提高广告的点击率和转化率;教育可以对学生的心理状态和学习需求进行监测和干预,提高学生的综合素质和学业成绩;医疗可以通过舆情监测和预警,及时发现和防治疫情和疾病传播等问题,提高公共卫生水平和医疗服务质量。
基于数据挖掘的网络论坛话题热度趋势预报

基于数据挖掘的网络论坛话题热度趋势预报
张虹;钟华;赵兵
【期刊名称】《计算机工程与应用》
【年(卷),期】2007(043)031
【摘要】利用小波分析和神经网络相结合的方法进行网络论坛话题热度趋势的预报.该方法主要是对由帖子的点击数(或回复数)所形成的原始时间序列进行小波多尺度分析,产生一系列子序列并进行评价,并通过BP神经网络进行类别训练,找出使得类内距离最小、类间距离最大的若干系数作为特征系数.对于未知类别的时间序列,把其特征系数送入神经网络进行预测.实验结果表明,将该方法用于网络论坛话题的热度趋势预测,可得出良好的预测精度.
【总页数】4页(P159-161,174)
【作者】张虹;钟华;赵兵
【作者单位】北京城市学院,人工智能研究所,北京,100083;北京城市学院,人工智能研究所,北京,100083;中国电力科学研究院,北京,100085
【正文语种】中文
【中图分类】TP18
【相关文献】
1.内容分发网络中基于数据挖掘的影片热度预测 [J], 周志伟;郑烇;王嵩
2.基于小波多尺度的网络论坛话题热度趋势预测 [J], 张虹;赵兵;钟华
3.基于小波神经网络的话题热度预测模型研究 [J], 谭鹏;罗顺莲;孙小淞;王惠;梁晓
菡
4.基于用户活跃程度的网络话题热度计算 [J], 程锦彬;钱钢
5.基于小波神经网络的话题热度预测模型研究 [J], 谭鹏;罗顺莲;孙小淞;王惠;梁晓菡;
因版权原因,仅展示原文概要,查看原文内容请购买。
利用数据挖掘技术实现网络舆情监测与分析

利用数据挖掘技术实现网络舆情监测与分析近年来,随着社交媒体的普及,公众在网络上的表达方式呈现多样化的趋势,这也带来了网络舆情的复杂性和时效性,如何迅速地感知和分析当前的网络舆情,成为了媒体、公众和政府部门关注的焦点。
利用数据挖掘技术进行网络舆情监测与分析,成为了当前解决舆情问题的主要手段之一。
一、什么是网络舆情?网络舆情是指通过互联网媒介发布的信息,引发公众对某一事物的看法和态度,这些看法和态度可以是正面、负面、中性或者混杂的。
同时,网络舆情的传播速度、范围和影响力往往比传统媒体更快、更广、更深。
二、数据挖掘在网络舆情监测与分析中的应用1. 爬虫技术在网络舆情监测和分析中,获得数据是首要问题。
因此,爬虫技术成为了信息收集最常用的一种技术手段。
通过爬虫技术,可以在网络中自动爬取和抓取大量信息,并将其整理成具有结构和价值的数据集,以便后续分析使用。
2. 文本挖掘技术文本挖掘技术是指对大规模文本数据进行语言处理和统计分析,以获取隐藏在文本数据中的知识和情感。
文本挖掘技术可主要包含:自然语言处理、词性标注以及情感分析和主题挖掘等。
将文本挖掘应用到网络舆情的分析中,可以有效地识别信息中包含的情感和主题,进而更准确地分析和把握当前网络舆情的发展趋势。
3. 可视化技术可视化技术将数据转化成可视化的图像或交互式界面,帮助用户更加直观地理解和分析数据。
比如,在网络舆情监测中,可以利用可视化技术对不同时间段的主题、情感等关键信息制作成曲线图或词云图,提供一种清晰明了的信息展示方式。
三、网络舆情监测与分析的意义网络舆情监测和分析的意义在于,通过系统性、科学性的分析和评估,在最短时间内了解当前舆情状况,把握公众情绪和舆论导向,及时制定公关计划和危机应对措施,避免过度解读、片面理解和采取盲目行动。
四、网络舆情监测与分析的应用场景1. 媒体监测在新闻报道和热点事件报道中,通过利用数据挖掘技术的手段,可以有效地捕捉媒体对当前事件的报道方向、情感倾向、重点角度等方面的信息,更好地理解公众心态和政策环境。
基于数据挖掘的流量热点预测与优化研究

基于数据挖掘的流量热点预测与优化研究随着互联网的高速发展和智能设备的普及,网络流量的快速增长对网络服务和设备资源的性能带来了巨大的挑战。
流量热点是指网络中出现的高流量密度区域,它们可能导致网络拥塞、服务质量下降和用户体验不佳。
因此,准确预测和优化流量热点成为了网络管理和网络优化的重要问题。
为了解决流量热点问题,研究人员利用数据挖掘技术分析大规模的网络流量数据,从中发现流量热点的规律和特征,并基于这些信息进行预测和优化。
本文将重点探讨基于数据挖掘的流量热点预测和优化研究。
首先,流量热点预测是解决流量热点问题的基础。
数据挖掘技术可以从大量的网络流量数据中学习到流量热点的模式和趋势,从而准确预测未来可能出现的热点区域。
预测流量热点的主要方法包括时间序列分析、聚类分析和关联规则挖掘等。
时间序列分析通过分析历史流量数据中的周期性和趋势性,预测未来的流量状况和热点区域。
聚类分析通过将网络流量数据分组成不同的簇,然后用每个簇的特点来预测未来可能的热点区域。
关联规则挖掘基于频繁项集的发现,通过分析网络流量中的关联规则,可以提前发现热点区域的潜在特征。
这些预测方法可以为网络管理者提供有关未来流量热点的预警信息,帮助他们采取相应措施防止或缓解热点问题的发生。
其次,针对已经发生的流量热点,数据挖掘技术可以帮助我们优化流量分发和资源调度,以提高网络的整体性能和用户体验。
优化流量热点的主要方法包括拓扑设计和负载均衡。
拓扑设计是指调整网络的物理结构或逻辑结构,以减少流量热点的发生概率和影响范围。
拓扑设计可以通过增加链路容量、改变网络拓扑、优化路由策略等方式来实现。
负载均衡是指在网络中合理地分配流量,使得每个设备的负载均衡,并且避免流量热点的产生。
负载均衡可以通过动态调整路由路径、引入流量监测和控制机制等方法来实现。
这些优化方法可以帮助提高网络的吞吐量、降低延迟,并提升用户的访问速度和体验。
数据挖掘技术在流量热点预测和优化研究中发挥着重要的作用,但也面临一些挑战。
基于数据挖掘的新闻传播分析与预测

基于数据挖掘的新闻传播分析与预测随着信息时代的到来,新闻传播不再受限于传统媒体的局限,而是借助着互联网、社交媒体等新兴媒介以更快的速度和更广泛的范围传递。
这些新兴媒介产生了大量的新闻传播数据,通过数据挖掘技术对这些数据进行分析与预测已成为新闻传播领域的研究热点。
一、数据挖掘在新闻传播领域的应用在新闻传播领域,数据挖掘主要应用于以下几个方面:首先,利用数据挖掘技术来挖掘出新闻传播中的热门话题、关键词和事件等,以便新闻工作者更好地把握新闻热点,提高新闻的质量和效率。
其次,通过挖掘新闻传播数据,可以发现新闻传播中的影响力节点,为新闻传播提供更可靠、准确和全面的数据支持。
再次,通过数据的可视化分析,可以更加简洁直观地表现新闻数据中的规律和趋势,便于人们更好地理解和应用。
最后,结合其他数据分析技术,可以利用数据挖掘技术对新闻传播趋势进行预测,为新闻行业的发展提供更可靠的参考。
二、新闻传播数据挖掘的案例1、新浪微博“热门话题”新浪微博作为国内最大的社交媒体之一,是新闻传播领域一个重要的研究对象。
利用新浪微博中的“热门话题”数据,通过数据挖掘技术对热门话题的情感极性进行分析,可以较为准确地衡量其舆情。
2、十九大新闻传播在2017年中共十九大召开期间,新闻媒体对十九大的报道引起了广泛关注。
结合数据挖掘技术,可以对十九大新闻传播进行全方位的分析,既包括社交媒体上的新闻热度和转发量等指标分析,又包括各大新闻媒体的报道数量和报道质量等分析,为新闻传播提供更科学、准确和全面的数据支持。
三、新闻传播数据挖掘的发展趋势随着信息技术和数据挖掘技术的发展,新闻传播数据挖掘领域将有以下几个发展趋势:首先,挖掘技术将更加多样化和智能化,可以通过结合自然语言处理技术和深度学习技术,更加准确地分析文本的情感极性和主题关键词等信息。
其次,结合大数据和云计算技术,可以更加高效地处理海量数据。
最后,新闻传播数据挖掘领域将与其他领域如金融、医疗,形成交叉融合,共同推进数据挖掘技术的发展。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
k
W 。对时间序列 fk =( (f 0) , (f 1) , …, (f N- 1) ) , N=2 作变换就是
00
将其转换成带有系数的基函数之和的形式。例如 fk=3 =<f#0 >#0 +
00
11
11
22
22
22
2
<f$0 >$0 +<f$0 >$0 +<f$1 >$1 +<f$0 >$0 +<f$1 >$1 +<f$2 >$2 +<f$3 >
3 小波分析
小波变换具有良好的时频分析特性, 它具有多分辨分析
( MRA) 的特点。应用一系列的低通和带通滤波器, 通过低通滤
波产生慢变时间序列, 它描述的是序列的整体趋势; 通过带通
滤波产生快变时间序列, 它描述的是系统的细节信息。
Mallat[3]在 MRA 的基础上给出了小波系数快速分解的金字
摘 要: 利用小波分析和神经网络相结合的方法进行网络论坛话题热度趋势的预报。该方法主要是对由帖子的点击数( 或回复数) 所形成的原始时间序列进行小波多尺度分析, 产生一系列子序列并进行评价, 并通过 BP 神经网络进行类别训练, 找出使得类内距 离最小、类间距离最大的若干系数作为特征系数。对于未知类别的时间序列, 把其特征系数送入神经网络进行预测。实验结果表 明, 将该方法用于网络论坛话题的热度趋势预测, 可得出良好的预测精度。 关键词: 时间序列; 小波分析; 神经网络 文章编号: 1002- 8331( 2007) 31- 0159- 03 文献标识码: A 中图分类号: TP18
- 0.2
0
2
4
6
低通滤波器
0
2
4
6
高通滤波器
0.5
0.5
0.0
0.0
- 0.5
- 0.5
01234567
01234567
图 1 Daubechies 小波基
函
数 d b 4
利用尺度函数主要提取时间序列的平均值信息, 也称低频
信息; 利用小波函数主要提取时间序列的变化信息, 也称高频
Computer Engineering and Applications 计算机工程与应用
2007, 43( 31) 159
基于数据挖掘的网络论坛话题热度趋势预报
张 虹 1, 钟 华 1, 赵 兵 2 ZHANG Hong1, ZHONG Hua1, ZHAO Bing2
1.北京城市学院 人工智能研究所, 北京 100083 2.中国电力科学研究院, 北京 100085 1.Artificial Intelligence Institute, Beijing City University, Beijing 100083, China 2.China Electric Power Research Institute, Beijing 100085, China E- mail: zhanghong@bcu.edu.cn
2 数据采集
数据采集过程的主要目标是对时间序列历史数据进行挑 选和整理, 按照时间序列的后续走势情况对数据序列进行分 类, 建立训练集与测试集。本次实验选取了网易新闻论坛 2005
基金项目: 国家高技术研究发展计划( 863)( the National High- Tech Research and Development Plan of China under Grant No.2005AA147030) 。 作者简介: 张虹( 1972- ) , 讲师, 主要研究方向: Web 数据挖掘, 模式识别; 钟华( 1968- ) , 副教授, 主要研究方向: Web 数据挖掘。
160 2007, 43( 31)
Computer Engineering and Applications 计算机工程与应用
年 05 月 18 日到 2006 年 01 月 22 日共 600 条帖子的点击数所 形成的时间序列作为实验对象, 采集间隔为 1 小时, 每条帖子 给出了 512 个数据点。其中选取 400 条帖子作为训练集, 其余 200 条作为测试集。通过数据采集, 可得到热帖 和 普 通 帖 两 类 训练集, 接下来就是要对这两类训练集进行数据转换和特征 提取。
塔算法, 并构造了用于小波分解和重构的高、低通滤波器组, 大
大简化了小波系数的计算。Daubechies[4]小波基函数 dbN( N 为
消 失 矩 阶 数) 具 有 正 交 性 和 紧 支 撑 性 等 优 良 特 性 , 可 对 连 续 和
离散时间序列信号进行分析处理。本文取 N=4 阶消失矩的 db4
小波, 其对应的支撑长度为 2N- 1。图 1 是 4 阶 Daubechies 小波
的 尺 度 函 数 和 小 波 函 数 及 分 解 高 、低 通 滤 波 器 , 具 有 良 好 的 平
滑性。
db4 尺度函数 !
db4 尺度函数 "
1.0 1.0
0.8
0.6
0.5
0.4
0.2
0.0
0.0
- 0.5
4 基于神经网络的特征提取
该 步 骤 的 主 要 工 作 是 对 训 练 集 成 员 的 小 波 系 数[5]进 行 评 价 , 找出最有助于分类的系数位置及其数值作为该类别的特征参数。
要从 N 个特征中挑选出对于缩小类内距离和增大类间距 离贡献度较大的 n 个特征参数( n<N) , 通 常 以 特 征 参 数 xi 对 状 态 yi 变化的灵敏度 %ij 作为评价特征系数的度量: %ij = #yj /#xi 。
2
$3( 其中的尖括号表示内积) 。变换后得到的系数个数与时间序
列宽度相同, 然而它与原序列的最大差别是体现了不同频率、
不同位置的数值变化信息, 因此比原数据更有意义。然而这些
信息未必都对后续的数据挖掘过程有用, 这就需要对这些系数
进行评价, 找出有价值的系数作为特征系数, 即下一步特征提
取所要做的工作。
这里采用 3 层 BP 神经网络, 输入层 N 个单元对应 N 个特 征参数, 输出层 M个单元对应 M种模式分类, 取中间隐含层单
B
元数为 Q, 用 Wiq 表示输入层单元 i 与隐含层单元 q 之间的连
张 虹, 钟 华, 赵 兵: 基于数据挖掘的网络论坛话题热度趋势预报
本 文 利 用 小 波 变 换 对 帖 子 的 点 击 数( 或 回 复 数) 所 形 成 的 时间序列进行转换, 得到转换后的低频和高频小波系数值。根 据 训 练 集( 包 括 热 帖 和 非 热 帖 两 类) 的 时 间 序 列 对 各 个 小 波 系 数进行评价, 选取贡献度最高的若干系数作为该类别的特征系 数。对于未知类别的时间序列, 把其特征系数送入神经网络进 行预测, 输出的类别即为预测结果。实验结果表明, 本方法用于 网络论坛话题的热度趋势预测, 显示出较好的预测精度。
ZHANG Hong, ZHONG Hua , ZHAO Bing.Hot tr end pr ediction of networ k for um topic based on data mining.Computer Engineer ing and Applications, 2007, 43( 31) : 159- 161.
信 息 。通 过 对 尺 度 函 数 与 小 波 函 数 进 行 偏 移 和 缩 放 可 以 得 到 两
j
j
j
j
个 函 数 族 , 分 别 为 #i( t) =#( 2 t- i) 和 $i( t) =$( 2 t- i) , 其 中 j=
j
0, 1, …; i=0, 1, …, 2 - 1。这两个函数族构成了变换基函数向量
本文中小波变换采用小波函数 db4 进行 3 层多分辨分析[8], 其结构如图 2 所示。其中 A 表示低频, D 表示高频。由图可见多 分辨分析主要是对低频部分进行进一步分解, 分解关系为 S= A3+D3+D2+Dl。图 3 分别为某热帖、非热帖点击数序列的小波 分解。其中 A3 为 3 层分解得到的低频子序列, D3、D2 和 D1 分 别为第 3、第 2 和第 1 层分解得到的高频子序列。
由于网络论坛本身是复杂的非线性系统, 同时又受到众多 外界因素的影响, 每个帖子受关注程度( 如点击率和回复率) 所 形成的时间序列往往复杂多变, 数据中含有多种周期类波动,
又 呈 现 非 线 性 升 、降 趋 势 , 而 这 些 特 点 难 以 用 传 统 的 时 间 序 列 模型描述[1, 2]。而目前较流行的时间序列分析方法是小波分析方 法, 利用其多分辨分析的特点可以提取时间序列的频谱特性, 在 时 频 两 域 都 具 有 表 征 信 号 局 部 特 征 的 能 力 [6]。
Abstr act: In this paper, a method was proposed, which combined wavelet multi- resolution decomposition and neural networks to forecast network forum topic hot trend.That was first, using wavelet multi- resolution to decompose the original time series formed from click numbers or reply numbers of forum post, to create a series of wavelet coefficients of the sub- series.Then, through BP neural networks to classify the hot post and normal post, coefficients were selected from all wavelet coefficients to form a feature coefficients set, which best enlarged the distance between different classes and reduced the distance within same classes.For the unknown time series, their feature coefficients were sent neural networks to forecast.This proposed method was tested to make better prediction accuracy for network forum topic hot trend. Key wor ds: time series; wavelet analysis; neural network