时间序列的区域周期模式及挖掘算法

小型微型计算机系统

Journal of Chinese Computer Systems 2018年10月第10期Vol.39No.102018 收稿日期:2017-12-12 收修改稿日期:2018-02-06 基金项目:国家自然科学基金项目(61170286)资助;重庆市基础科学与前沿技术项目(cstc 2016jcyjA 0539)资助. 作者简介:郭 静,女,1986年生,硕士,讲师,研究方向为计算机应用;陈 欣,女,1982年生,硕士,副教授,研究方向为计算机应用;何 杰,男,1984年生,博士,讲师,研究方向为网络安全;谭志国,男,1978年生,博士,讲师,研究方向为机器视觉.时间序列的区域周期模式及挖掘算法

郭 静1,陈 欣1,何 杰2,4,谭志国3,4

1

(重庆工程学院软件与计算机学院,重庆400056)2

(国防科技大学计算机学院,长沙410073)3

(国防科技大学电子科学与工程学院,长沙410073)

4(武警警官学院信息通信系,成都610213)E-mail :jack.237@https://www.360docs.net/doc/a58669352.html,

摘 要:时间序列中周期行为的挖掘是众多领域研究的理论基础.针对时间序列中只在区域部分存在的周期行为,提出了一种新型周期模式概念,称之为区域周期模式.在对区域周期模式进行形式化描述的基础上,进一步提出了三种拥有不同求解目标的区域周期模式挖掘算法.算法1结合已有的部分周期模式挖掘算法和暴力迭代过程进行求解,虽能保证得到完整解,但由于过大的计算量,使其不具备实践应用价值;算法2基于类Apriori 原则和三种剪枝策略,不仅能保证完整解,还具备较高的运算效率;算法3通过一阶区域周期模式的密集度推荐计算区域,大幅度地压缩了计算代价,为重要区域周期模式的快速挖掘提供了便捷方法.最后利用公开数据集测试和评估了3种算法的求解完整性和计算性能,验证了所提出算法的设计目标.关键词:时间序列;区域周期模式;部分周期模式;Apriori 原则;模式挖掘

中图分类号:TP 301 文献标识码:A 文章编号:1000-1220(2018)10-2180-06

Mining Regional Periodic Patterns in Time Series Data

GUO Jing 1,CHEN Xin 1,HE Jie 2,4,TAN Zhi-guo 3,41

(Department of Software and Computer ,Chongqing Engineering Institute ,Chongqing 400056,China )2

(College of Computer ,National University of Defense Technology ,Changsha 410073,China )3

(College of Electronic Science and Engineering ,National University of Defense Technology ,Changsha 410073,China )

4(Department of Information and Communication ,Officers College of PAP ,Chengdu 610213,China )

Abstract :Mining periodic patterns in time series data is the theoretical basis of many fields.We propose a novel concept about period-ic pattern ,called regional periodic pattern ,which can describe the patterns that only activated in parts of a time series.After formali-zing this regional periodic pattern ,we further propose three regional periodic pattern mining algorithms for different goals.The first algorithm aims at finding all possible qualified patterns based on existing partial periodic patterns mining algorithm and brute-iterative method.Although it can guarantee the complete results ,it does not have pragmatic value because of massive computation cost.The second algorithm is based on apriori-like principle and three pruning strategies.It can not only ensure the complete results ,but also have high computational efficiency.The third algorithm can recommend computation ranges for mining process by using intensity of

1-patterns ,which can much further reduce the computation cost for mining important regional periodic patterns in time series.At last ,the result completeness and computing performance of three algorithms are tested and evaluated using a public dataset.Experimental result demonstrates that the goals of all three algorithms are satisfied.Key words :time series ;regional periodic patterns ;partial periodic patterns ;Apriori principle ;pattern mining 1 引 言

挖掘周期性行为是理解时间序列特征的一个重要方面,

在很多科学领域和社会领域都有重要的研究价值.如在生物

信息学领域中,挖掘DNA 序列中核酸和氨基酸的周期分布

情况等[1];在天文学领域,研究行星的周期性运行规律等[2];在经济学领域,探测股票周期性波动趋势等

[3];在网络安全领域,检测恶意软件周期性行为等[4].当前研究的周期模式主要包括全周期模式和部分周期模

式[5-8],其中全周期模式中周期段中的每一个位置都要参与周期变化,如物理学中钟摆的运动趋势等;而部分周期模式中只有部分位置参与周期变化,如某人的一日生活规律可能只有上二下班时间具有周期性,而饮食地点二工作地点并不一定具有周期性.其他类似研究如模糊周期性[9]二移动目标的周期性[10]以及事务数据库的周期性[11]等虽然名称有区别,但本质上都属于全周期模式和部分周期模式范畴.但是在科学研究中经常出现另外一种情况,即某一个时

间序列在整体趋势上可能并没有明显的周期性,但在时间序

列的某一部分上隐含着短暂的周期性行为.由于出现的概率

并不固定以及延续时间不能估计,因此在基于整体的挖掘分万方数据

相关主题
相关文档
最新文档