基于多维滑窗的异常数据检测方法

合集下载

基于滑动窗口的奇异点数据挖掘算法研究

基于滑动窗口的奇异点数据挖掘算法研究
付 强 车 文 刚 ,
(. 1 昆明理 工大 学信 息工程与 自动化学 院, 云南 昆明 60 5 ; 50 1
昆明 6 05 ) 5 0 1 2 昆明理 工大学云南省计算 机技术应用重点实验室 , . 云南
摘要 : 在一条 时间序列上与其 它序列 点存在显著差异的 点, 被称 为奇异点。提 出了一种基 于滑动窗 口的奇异
s re . nay i g s c it s if r to n h i e e o o e y S a g a tc x h n e e s By a lzn e ur i no main a d t e t i e me s r s c mp s d b h n h iso k e c a g i c mp st nd x,a g e e r t n i n a iiy o e a g rt m. o oi i e e r st a i a t a d v ld t ft lo h u h oly h i
K n i nvr t o i c dT c o g , u nnK n ig6 05 R ) u mn U i s y f S e ea eh l y Y n a um n 5 0 P C g e i c n n n o 1
Absr c Ioae ng lrt sa e s re on swhih a e r ma k b y dfe e tfo oh r n t e F — t a t:s l td Si u a ii r e sp i t c r e r a l i r n r m te si h i e i f n n e t ei s r i a r p e e t n Io ae i g lrt n n lo i m a e n si n a c i me s re .,h s p pe r s ns a s ltd S n a i mi i g a g rt u y h b s d o l wi — p d w. e ag rt m ee t e io ae i g l rt si efn n etme s re sn o a ule a — o lo i h d tc st s ltd sn a i e n t a c i e su ig lc lo tirfc h u i h i i

一种基于滑动窗口的时间序列异常检测算法

一种基于滑动窗口的时间序列异常检测算法

一种基于滑动窗口的时间序列异常检测算法
裴丽鹊
【期刊名称】《巢湖学院学报》
【年(卷),期】2011(013)003
【摘要】时间序列的异常检测的应用越来越广泛,本文是讨论在基于分段线性的FKD时间序列模式表示基础上时间序列的异常检测.文中提出了一种基于滑动窗口的时间序列模式偏离和窗口异常度的概念,并在此基础上提出了基于滑动窗口的时间序列模式异常的检测算法.通过实验证明了该算法是合理的、有效的.
【总页数】4页(P28-31)
【作者】裴丽鹊
【作者单位】福建对外经济贸易职业技术学院信息技术系,福建福州350016
【正文语种】中文
【中图分类】TP310.6
【相关文献】
1.基于滑动窗口的多变量时间序列异常数据的挖掘 [J], 翁小清;沈钧毅
2.基于滑动窗口和ARMA的Argo剖面数据异常检测算法 [J], 罗一迪;蒋华;王慧娇;王鑫
3.基于滑动窗口预测的水文时间序列异常检测 [J], 余宇峰;朱跃龙;万定生;关兴中
4.一种基于Attention-GRU和iForest的周期性时间序列异常检测算法 [J], 王腾; 焦学伟; 高阳
5.基于滑动窗口的时间序列异常检测方法 [J], 田腾;石茂林;宋学官;马跃;冯翔宇
因版权原因,仅展示原文概要,查看原文内容请购买。

基于滑动窗口的多变量时间序列异常数据的挖掘

基于滑动窗口的多变量时间序列异常数据的挖掘

—102— 基于滑动窗口的多变量时间序列异常数据的挖掘翁小清1, 2,沈钧毅1(1. 西安交通大学计算机软件与理论研究所,西安 710049;2. 河北经贸大学计算机中心,石家庄 050061)摘 要:与其它多变量时间序列(MTS)子序列显著不同的子序列,称为异常子序列(含异常数据)。

该文提出了一种基于滑动窗口的MTS 异常子序列的挖掘算法,使用扩展的Frobenius 范数来计算两个MTS 子序列之间相似性,使用两阶段顺序查询来进行K-近邻查找,将不可能成为候选异常子序列的MTS 子序列剪去,对上海证券交易所股票交易情况MTS 数据集进行了异常子序列(含异常数据)挖掘,结果表明了算法的有效性。

关键词:多变量时间序列;滑动窗口;局部稀疏系数;扩展的Frobenius 范数;异常数据挖掘Outlier Mining for Multivariate Time SeriesBased on Sliding WindowWENG Xiaoqing 1, 2, SHEN Junyi 1(1. Institute of Computer Software, Xi’an Jiaotong University, Xi’an 710049; 2. Computer Center, Hebei University of Economics and Trade, Shijiazhuang 050061)【Abstract 】Multivariate time series (MTS) subsequences, which differ significantly from the remaining MTS subsequences, are referred to as outlier subsequences. Tthe mining method for MTS outlier subsequences based on sliding window is proposed. An extended Frobenius norm is used to compare the similarity between MTS subsequences, K-NN searches are performed by using two-phase sequential scan, and MTS subsequences which are not possible outlier candidates are pruned which reduce the number of computations and comparisons. The MTS datasets of stock market is used for outlier mining, the results show the effectiveness of the algorithm.【Key words 】Multivariate time series; Sliding window; Local sparsity coefficient; Extended frobenius norm; Outlier mining计 算 机 工 程Computer Engineering 第33卷 第12期Vol.33 No.12 2007年6月June 2007·软件技术与数据库·文章编号:1000—3428(2007)12—0102—03文献标识码:A中图分类号:TP391多变量时间序列(MTS)在各个领域中是非常普遍的,如在金融领域,上市公司的股票交易情况可以用6个变量的MTS 描述;在多媒体领域,CyberGloves 作为人与计算机的接口[1],有22个传感器,可以用22个变量(传感器)的MTS 来描述。

数据流异常检测算法

数据流异常检测算法

数据流异常检测算法
一种常用的数据流异常检测算法是基于移动窗口的方法。

该方法将数据流划分为固定长度的窗口,通过统计窗口内数据的特征来判断是否存在异常。

常用的窗口特征包括均值、标准差、最大值和最小值等。

如果窗口内的数据特征与历史数据相比存在显著偏差,则可以判断该窗口内存在异常。

另一种常用的数据流异常检测算法是基于离群点检测的方法。

该方法利用统计学原理,通过计算数据点与其他数据点之间的距离或相似度来判断是否为离群点。

常用的离群点检测算法包括LOF(Local Outlier Factor)和孤立森林等。

这些算法在数据流中可以实时地计算出离群因子或离群分数,从而快速检测出异常数据点。

为了适应数据流中的变化,数据流异常检测算法通常采用在线学习的方式。

在线学习算法能够根据新产生的数据不断更新模型,从而提高检测的准确性和鲁棒性。

常用的在线学习算法包括递增式聚类和增量式异常检测等。

这些算法可以在不重新训练整个模型的情况下,根据新数据进行更新,大大提高了算法的效率。

除了上述算法,还有一些其他的数据流异常检测算法,如基于时间序列分析的方法和基于机器学习的方法等。

这些算法各有特点,可以根据具体的应用场景选择适合的算法。

总之,数据流异常检测算法是一种用于实时监测和检测数据流中异常行为的技术。

通过合理选择算法和模型,可以在满足实时性需求的同时,有效地发现和识别数据流中的异常行为。

这对于保障数据安全和提高应用性能有着重要的意义。

基于多模态技术的工业异常检测方法

基于多模态技术的工业异常检测方法

基于多模态技术的工业异常检测方法基于多模态技术的工业异常检测方法是一种利用多种模态数据(如图像、声音、温度等)进行工业异常检测的方法。

该方法通过整合不同模态的数据,可以更全面地了解工业系统的运行状态,提高异常检测的准确性和可靠性。

基于多模态技术的工业异常检测方法主要包括以下步骤:1. 数据采集:使用不同的传感器和设备,采集工业系统运行过程中的各种模态数据,如图像、声音、温度、振动等。

2. 数据预处理:对采集到的多模态数据进行预处理,包括去噪、归一化、特征提取等,以便更好地整合和分析数据。

3. 特征融合:将来自不同模态的数据进行特征融合,即将不同模态的特征整合到一个统一的特征空间中。

这一步可以采用简单的特征拼接,也可以采用更复杂的特征融合算法。

4. 异常检测:在特征融合的基础上,采用机器学习、深度学习等算法进行异常检测。

常见的算法包括支持向量机(SVM)、随机森林、神经网络等。

5. 结果输出:将异常检测的结果进行可视化展示,并可根据需要进行预警或进一步的分析处理。

基于多模态技术的工业异常检测方法具有以下优点:1. 提高准确性和可靠性:通过整合不同模态的数据,可以更全面地了解工业系统的运行状态,提高异常检测的准确性和可靠性。

2. 降低漏检率:多模态数据可以相互补充,降低漏检率,避免因单一模态数据导致的重要异常被忽略。

3. 减少人工干预:通过对多模态数据的自动化分析,可以减少人工干预,提高检测过程的自动化程度。

4. 灵活性高:可以根据实际需求选择不同的模态数据和算法,灵活性高,能够适应不同的工业异常检测场景。

基于多模态技术的工业异常检测方法在工业领域具有广泛的应用前景,如智能制造、安全监控、环境保护等。

未来,随着多模态数据处理技术的发展和算法的不断优化,基于多模态技术的工业异常检测方法将会得到更广泛的应用和推广。

多变量时间序列滑动窗口异常点的检测

多变量时间序列滑动窗口异常点的检测

多变量时间序列滑动窗口异常点的检测
戴慧;阚建飞;李伟仁;周卫东
【期刊名称】《南京信息工程大学学报》
【年(卷),期】2014(000)006
【摘要】针对多变量时间序列( MTS)的异常点的探测问题,提出了采用由粗到细的二次探测方案。

基于滑动窗口数据的置信区间,构造了变化趋势值特征和相对变化趋势值特征分别用于二次探测,同时研究了特征的快速提取算法。

通过对OPEN3000数据监测系统采集的事故发生前后某市城南变电站各设备表的数据集进行异常点探测,结果表明提出的算法能够快速准确地探测出异常点的位置。

【总页数】5页(P515-519)
【作者】戴慧;阚建飞;李伟仁;周卫东
【作者单位】南京工程学院计算机工程学院,南京,210013;南京工程学院计算机工程学院,南京,210013;德州大学阿灵顿分校电子工程系,达拉斯,美国,76013;德州大学阿灵顿分校电子工程系,达拉斯,美国,76013
【正文语种】中文
【中图分类】TP206
【相关文献】
1.基于统计方法的异常点检测在时间序列数据上的应用 [J], 曹晨曦;田友琳;张昱堃;刘晓峰
2.基于滑动窗口的多变量时间序列异常数据的挖掘 [J], 翁小清;沈钧毅
3.时间序列异常点及突变点的检测算法 [J], 苏卫星;朱云龙;刘芳;胡琨元
4.基于大数据的时间序列异常点检测研究 [J], 程艳云;张守超;杨杨
5.基于混合方法的多维时间序列驾驶异常点检测 [J], 衡红军; 刘静
因版权原因,仅展示原文概要,查看原文内容请购买。

基于滑动窗口的多变量时间序列异常数据的挖掘.

基于滑动窗口的多变量时间序列异常数据的挖掘.

Outlier Mining for Multivariate Time Series Based on Sliding Window
WENG Xiaoqing1, 2, SHEN Junyi1
(1. Institute of Computer Software, Xi’an Jiaotong University, Xi’an 710049; 2. Computer Center, Hebei University of Economics and Trade, Shijiazhuang 050061)
LSC k
(
p)
=
∑o∈Nk ( p)
| Nk (
lsrk lsrk p) |
(o) ( p)
(4)
如果样本p的局部稀疏系数LSCk(p)较大,就意味着样本p
的邻域中所含样本的个数比较少,不拥挤,说明样本p是异常
样本的可能性比较大。
2 算法
MTS 异常子序列挖掘算法主要包括 3 个方面:(1)对每个
要输出的 MTS 异常子序列的个数 Num。
输出 含有异常数据的 MTS 子序列。
(1)将 MTS 划分成 m − l +1个长度为 l 的 MTS 子序列。
(2)对每个 MTS 子序列 p,计算其协方差矩阵。
(3)对每个 MTS 子序列 p 的协方差矩阵进行奇异值分解,
求其特征值、右特征向量矩阵。
|
(1)
基金项目:国家自然科学基金资助项目(60173058) 作者简介:翁小清(1965-),男,博士生、副教授,主研方向:数据 挖掘;沈钧毅,教授、博导 收稿日期:2006-09-05 E-mail:xqweng@
其 中 , < ai , bi > 是 列 向 量 ai 与 bi 的 内 积 , w 是 权 重 向 量 ,

多变量时间序列滑动窗口异常点的检测

多变量时间序列滑动窗口异常点的检测

多变量时间序列滑动窗口异常点的检测戴慧1 阚建飞1 李伟仁2 周卫东2【摘要】摘要【期刊名称】南京信息工程大学学报【年(卷),期】2014(000)006【总页数】5【关键词】关键词针对多变量时间序列(MTS)的异常点的探测问题,提出了采用由粗到细的二次探测方案.基于滑动窗口数据的置信区间,构造了变化趋势值特征和相对变化趋势值特征分别用于二次探测,同时研究了特征的快速提取算法.通过对OPEN3000数据监测系统采集的事故发生前后某市城南变电站各设备表的数据集进行异常点探测,结果表明提出的算法能够快速准确地探测出异常点的位置.0 引言时间序列是属性值在时间顺序上体现出来的特征数据集合,多变量时间序列(MTS)在工业界得到广泛关注.由于系统的观测变量之间具有关联性,需要对具有相关性的观测变量进行综合比较分析.如果变量的观测值偏离其他的观测值太远,可能是由其他机制导致的不正常数据,这样的观测值被称为异常点.多变量时间序列是时间序列的子序列,需对时间序列数据集进行处理和比较分析,挖掘出具有异常点的多变量时间子序列集合.在工业界对事故的分析和预测的研究中,为调度运行人员提供电网系统的设备健康状态评价和电网的故障辅助分析决策支持显得非常重要,而前兆数据就是挖掘出的包含异常点的MTS.由于系统采集的各种实时、连续、有序的时间序列值是典型的数据流,具有无边界性的特征,根据数据流的特点和MTS相关性的要求,本文提出了一种对MTS进行异常点探测的算法,建立了滑动窗口的相对变化趋势的模型用于异常点的提取和状态监测,研究了快速的滑动窗口数据特征提取算法,用于对电网各设备事故发生之前的非正常状态模式下的探测.目前,时间序列异常点的探测研究大部分针对单变量时间序列,包括基于距离的算法[1]、基于离群指数的算法[2]、基于偏差的算法[3]和基于小波变换的算法[4]等.针对MTS,文献[5]提出了基于滑动窗口的MTS异常数据的挖掘算法,但该算法在检测效率和运算效率上都有待改进.本文提出由粗到细的二次探测方案,构造新的基于滑动窗口置信区间的特征,并研究特征的快速提取算法,从而提升异常点的探测精度和加快速度.1 问题的提出本文是对OPEN3000数据监测系统采集的各种电力数据流进行异常点探测.OPEN3000系统采集的设备表中变量之间的相关性符合MTS的特征要求和符合数据流无限性和实时性的特征要求,同时也符合数据流在实际应用中的需要.本文要解决的问题是将OPEN3000数据采集系统中监测与记录的电流数据描述成MTS,然后采用滑动窗口的方法在MTS中找出含有异常数据的MTS 子序列.假设一个长度为k含有n个变量MTS为x(t)=(x1(t),x2(t),…,xn(t)),1≤t≤k,其变量i的第j个长度为l的滑动窗口为si,j=(xi(j),xi(j+1),…,xi(j+l-1)).该滑动窗口其实就是对应一段长度为l的MTS子序列,因此总共可以得到(k-l+1)个MTS子序列.要解决的问题就是找出这些MTS子序列中含有异常的一些子序列.2 算法设计本文提出算法的框图如图1所示.下面对各个模块涉及的算法和模型进行详细介绍.2.1 滑动窗口特征快速提取及疑似异常点判断2.1.1 滑动窗口变化趋势值特征对于每个变量的每个滑动窗口,考虑采用其变化趋势值作为特征进行异常点的初步判断,而变化趋势值定义为每个窗口置信区间的距离半径.变量xi的第j个长度为l的滑动窗口si,j=(xi(j),xi(j+1),…,xi(j+l-1))的置信区间的距离半径为(1)式(1)中,置信上限其中为均值,σi,j为均方差,随机变量Z~N(0,1),α为置信水平,取0.05,置信下限2.1.2 疑似异常点判断基于2.1.1提取的特征,给出疑似异常点的判断模型:假设含有n个变量的MTS序列x(t),对于第j个目标窗口,如果存在某个变量xi,使得距离半径di,j>τ,其中τ为阈值,则认为MTS序列x(t)在第j个窗口存在疑似异常点.2.1.3 滑动窗口均值和标准方差的快速计算算法由式(1)可知,特征提取的关键在于均值和均方差σi,j的计算.对于长度为k滑动窗口长度为l的MTS,共有(k-l+1)个滑动窗口.通常MTS都具有较大的长度k,从而(k-l+1)个滑动窗口的均值和均方差的计算量是非常可观的,因此,研究它们的快速计算显得非常必要.对于变量xi的第j个长度为l的滑动窗口si,j,易知其均值和均方差σi,j分别为(2)接下来推导第(j+1)个滑动窗口的均值和标准方差σi,j+1与其前一个窗口均值和均方差σi,j之间的关系.由式(2)可得:(3)(4)对于式(4)中的分子,由式(3)可得:(xi(t)-)2+(xi(j+l)-)2-(xi(j)-)2+l+(xi(j+l)-xi(j))(xi(j+l)+xi(j)-(5)将式(5)代入式(4)可得:σi,j+1=(+((xi(j+l)-xi(j))(l(xi(j+l)+xi(j)-2)-(6)式(3)和式(6)给出了前后2个窗口均值和均方差之间的关系,也可通过前一窗口的均值和均方差来计算当前窗口的均值和均方差,而且比式(2)所示的直接计算更快速.由表1可以看出提出的快速计算算法与窗口大小无关,明显优于直接算法.2.2 二次特征提取及二次判断由于前文提取的变化趋势值特征只考虑了当前窗口,而忽视了相邻窗口之间的关联,所以需引入相对变化趋势值特征对疑似异常点进行二次判断.基于前文所提取的每个滑动窗口的变化趋势值特征,定义该滑动窗口的相对变化趋势值(二次特征)为Ωi,j=(di,j-di,j-1)/di,j-1.(7)给出二次判断模型:假设含有n个变量的MTS序列x(t)存在m个具有相关性的变量xi,i=1,2,…,m,设这m个变量的第j个目标窗口的相对变化趋势值为Ωi,j,如果满足下述条件则认为MTS序列x(t)在第j个窗口存在异常:(8)其中γ为阈值.2.3 相关性模型二次判断考虑的是具有相关性的变量之间的相对变化趋势值特征,因此定义2个变量序列之间的相关性(广义相关性)[6-10].对于长度为k滑动窗口长度为l的MTS序列x(t)中2个变量序列xi(t)和xi′(t),定义它们之间的相关性系数R为(9)其中Rj为xi(t)和xi′(t)的2个相应第j个滑动窗口si,j和si′,j之间的相关性系数:(10)由式(9)易知相关性系数的取值范围为|R|≤1.|R|越接近于1,表明变量之间的相关程度越高,它们之间的关系越密切.2.4 算法步骤输入:长度为k含有n个变量的MTS;滑动窗口的长度为l.输出:含有异常数据的MTS子序列时间范围.算法步骤如下:1) 采用式(3)快速计算每个变量的(k-l+1)个滑动窗口的均值;2) 采用式(6)快速计算每个变量的(k-l+1)个滑动窗口的均方差;3) 采用式(1)求解每个变量的(k-l+1)个滑动窗口的置信区间距离半径;4) 将距离半径与阈值τ进行比较,初步确定含有突变点的MTS子序列的位置;5) 采用式(7)计算具有相关性的变量在含有突变点的滑动窗口的相对变化趋势值;6) 依据式(8)二次确定含有异常点的MTS子序列的时间范围.3 实验仿真3.1 实验数据集数据集为OPEN3000系统于2013年9月2日1:10至2013年9月3日1:05对江苏省某市城南变电站每隔5 min对8个设备表采集的数据集,共有288个采样点,每个采样点包含了8个设备表的信息.事故发生的具体时刻为2013年9月2日13:05:55.用MTS来表示采集的数据:x(t)=(x1(t),x2(t),…,x8(t)),1≤t≤288,其中x1(t)表示高有功,x2(t)表示高A相电流,x3(t)表示高B相电流,x4(t)表示高C相电流,x5(t)表示低有功,x6(t)表示低A相电流,x7(t)表示低B相电流,x8(t)表示低C相电流值.3.2 实验结果及分析根据系统对数据的采样频率以及经验理论将滑动窗口的大小设计为1 h,即长度l为12.将初次异常点判断的阈值τ设定为0.6,阈值γ设为0.01.实验环境:操作系统是Windows XP,CPU为2.40 GHz,内存2 GB,硬盘60 GB,采用MatlabR2006b进行代码编译.通过计算8个变量各滑动窗口置信区间的距离半径,发现只有变量高有功存在2个突变点,如图2所示.对应的时间范围为2013年9月2日9:05—9:10和2013年9月2日23:50—23:55.由于突变点可能是正常范围的电流值升高所导致的,并不一定是异常点,需进行二次异常点探测.二次探测是对提取MTS数据中具有相关性的变量的相对变化趋势值特征进行判断,所以需先分析变量之间的相关性.对于采集的MTS电力数据x(t)中的每个滑动窗口,采用相关性模型计算8个变量之间的相关性系数(表2).表2表明这8个变量之间均具有较强的相关性,相关性系数的绝对值均不小于0.98.这与电力系统的经验是一致的.图3—5展示了高有功和高A、B、C相电流之间的相对变化趋势.可知,存在2个点的相对变化趋势值的差值均超过了阈值γ=0.01,时间范围为2013年9月2日9:05—9:10的MTS子序列和2013年9月2日23:50—23:55的MTS子序列,所以这2个MTS子序列就是异常子序列,存在异常点.4 结论针对存在异常的MTS数据流,提出了一种由粗到细的两阶段探测策略,同时还研究了快速滑动窗口特征的提取算法.针对某市城南变电站各设备表采集的异常数据的实验结果很好地说明了提出算法的有效性.参考文献References[1] 廖国琼,李晶.基于距离的分布式RFID数据流孤立点检测[J].计算机研究与发展,2009,47(5):172-179LIAO Guoqiong,LI Jing.Distance-based outlier detection for distributed RFID data streams[J].Journal of Computer Research and Development,2009,47(5):172-179[2] 郑斌祥,席裕庚,杜秀华.基于离群指数的时序数据离群挖掘[J].自动化学报,2004,30(1):70-77ZHENG Binxiang,XI Yugeng,DU Xiuhua.Outlier mining for time series data based on outlier index[J].Acta Automatica Sinica,2004,30(1):70-77 [3] 谭庆,张瑞玲.基于局部偏离因子的孤立点检测算法[J].计算机工程,2008,34(17):59-61TAN Qing,ZHANG Ruiling.Outlier detection algorithm based on local deviation factor[J].Computer Engineering,2008,34(17):59-61[4] 文琪,彭宏.小波变换的离群时序数据挖掘分析[J].电子科技大学学报,2005,34(4):556-558WEN Qi,PENG Hong.Analysis of time series outlier mining based on wavelet transform[J].Journal of University of Electronic Science and Technology of China ,2005,34(4):556-558[5] 翁小清,沈钧毅.基于滑动窗口的多变量时间序列异常数据的挖掘[J].计算机工程,2007,33(12):102-104WENG Xiaoqing,SHEN Junyi.Outlier mining for multivariate time series based on sliding window[J].Computer Engineering,2007,33(12):102-104 [6] Zhang Y,Meratnia N,Havinga P.Outlier detection techniques for wireless sensor networks:A survey[J].IEEE Communications Surveys & Tutorials,2010,12(2):159 -170[7] Lee J-G,Han J W,Li X L.Trajectory outlier detection:A partition-and-detect framework[C]∥IEEE 24th International Conference on Data Engineering,2008:140-149[8] Yang K,Shahabi C.A PCA-based similarity measure for multivariate time series[C]∥Proceedings of the Second ACM International Workshop on Multimedia Databases,2004:65-74[9] Agyemang M.LSC-Mine:Algorithm for mining localoutliers[C]∥Khosrow-Pour M.Innovations Through Information Technology,2004,doi:10.4018/978-1-59140-261-9.ch002[10] Krämer J,Seeger B.Semantics and implementation of continuous sliding window queries over data streams[J].ACM Transactions on Database Systems,2009,34(1):19-26多变量时间序列;滑动窗口;异常点;置信区间资助项目江苏省政府留学奖学金基金;国家自然科学基金(61103141);江苏省高校自然科学基金(13KJB520015)戴慧,女,博士生,讲师,研究方向为智能电网和智能大数据.1520759669@1 南京工程学院计算机工程学院,南京,2100132 德州大学阿灵顿分校电子工程系,达拉斯,美国,76013。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

f a c t o r a s s p a c e ,t i m e ,p r o v e n a n c e a s w e l 1 .I n c a s e o f d i f f e r e n t w e a t h e r a n d f l o o d s e a s o n ,t h e a l g o i r t h m a d j u s t e d t h e c o n t r o l l i n g
远低 于基 于遗忘 因子的卡 尔曼( A K F ) 算法和基于小波的卡 尔曼( WK F ) 算法。 关键词 : 模型 ; 多维影响 因子 ; 卡 尔曼算法
中 图分 类 号 : T P 3 0 2 文献标志码 : A
I mp r o v e d Ka l ma n a l g o r i t hm f o r a b no r ma l d a t a de t e c t i o n b a s e d o n mu l t i d i me ns i o n a l i m pa c t f a c t o r s
Abs t r a c t :W i t h t h e wi d e s p r e a d a pp l i c a t i o n o f t he da t a lo f w, t h e a bn o r ma l da t a d e t e c t i o n p r o b l e m i n da t a lo f w ha s c a u s e d
基 于 多维 滑 窗 的 异 常数 据 检 测 方 法
花 青 , 许 国艳, 张 叶
( 河海大学 计算机与信息学 院, 南京 2 1 1 1 0 0 ) ( 通信作者 电子邮箱 5 1 7 8 3 7 0 0 2 @q q . c o n r )

要: 随着数据流的广泛运用 , 数据 流 中异 常数 据的检 测 问题也 引起 了更 多的关 注。现有 的卡 尔曼滤波 算法
需要的历 史数据量 虽然小 , 但 只适 用于单个异常点的检测 , 对于复杂连续的异 常值检 测效果较 差。针 对这个 问题 , 提
出一种水文传感 器分级标注模 型 , 并在此基础 上提 出一 种基 于多维影响 因子的卡 尔曼滤波 算法, 加入 空 间、 时 间、 起 源三个维度的影响 因子 , 在天 气和汛期等影响 因素改变时 , 对 系统模 型的控制参数进行 适 3调整 " - , 并且对测 量噪 声进 行更加 准确 的估计 , 提 高异 常检测的 准确性。 实验结果证明 , 所提算 法在 保证运行 时间相近的前提 下, 检测 的错误 率
H U A Q i n g ’ ,X U G u o y a n ,Z HA N G Y e
( C o l l e g e o f c o m p u t e r a n d i n f o r m a t i o n ,H o h a i U n i v e r s i t y ,N a n g J i a n g s u 2 1 1 1 0 0 ,C h i n a )
J o u na r l o f C o mp u t e r Ap p l i c a t i o n s
I S S N 1 0 0 1 . 9 0 8 1
2 01 5—1 1 —1 0
计算机应用, 2 0 1 5 , 3 5 ( 1 1 ) : 3 1 1 2—3 1 1 5 , 3 1 5 6
mo r e a t t e n t i o n .E x i s t i n g K a l ma n f i l t e r i n g a l g o r i t h ms n e e d s ma l l a mo u n t o f h i s t o ic r l a d a t a ,b u t t h e y o n l y a p p l y t o s i n g l e a b n o m a r l p o i n t d e t e c t i o n .T h e e f e c t t o c o mp l e x c o n t i n u o u s o u t l i e r p o i n t s i s p o o r .I n o r d e r t o s o l v e t h e p r o b l e m,a Ka lma n
i f l t e r i n g l a g o r i t h m b a s e d o n m u l t i d i me n s i o n a l i m p a c t f a c t o r s w a s p r o p o s e d . T h e a l g o i r t h m j o i n e d t h e t h r e e d i m e n s i o n s o f i m p a c t
文章编号 : 1 0 0 1 — 9 0 8 1 ( 2 0 1 5 ) 1 1 — 3 1 1 2 — 0 4
C 0D EN J YI I D U
h t t p : / / w w w . j o c a . c n d o i : 1 0 . 1 1 7 7 2 / j . i s s n . 1 0 0 1 — 9 0 8 1 . 2 0 1 5 . 1 1 . 3 1 1 2
相关文档
最新文档