基于奇异事件特征聚类的时间序列符号化方法
时间序列聚类方法

时间序列聚类方法引言时间序列数据是在不同时间点上收集的数据,具有时间上的依赖关系和内在的序列性质。
时间序列聚类是将相似的时间序列数据分组,以便于分析和理解数据集中的模式和结构。
在本文中,将介绍几种常见的时间序列聚类方法及其应用。
一、K-means聚类算法K-means聚类算法是一种经典的聚类方法,通过迭代计算数据点与聚类中心之间的距离,并将数据点分配给与其最近的聚类中心。
该方法在时间序列聚类中的应用需要将时间序列数据转化为一维向量,例如通过提取统计特征或使用傅里叶变换等方法。
然后,可以使用K-means算法将时间序列数据进行聚类,以发现数据中的模式和结构。
二、基于密度的聚类算法基于密度的聚类算法是一种基于数据点密度的聚类方法,通过将数据点分配到高密度区域形成簇。
在时间序列聚类中,可以使用基于密度的聚类算法来发现数据中的异常点和突变点。
一种常见的基于密度的聚类算法是DBSCAN算法,它通过定义半径和最小密度来确定核心点、边界点和噪音点,并将核心点连接形成簇。
三、层次聚类算法层次聚类算法是一种自底向上或自顶向下的聚类方法,通过计算数据点之间的相似度或距离来构建聚类树。
在时间序列聚类中,可以使用层次聚类算法来发现数据中的层次结构和模式。
一种常见的层次聚类算法是凝聚层次聚类算法,它从每个数据点作为一个簇开始,然后迭代地合并相似的簇,直到达到预定的簇数目。
四、基于模型的聚类算法基于模型的聚类算法是一种将时间序列数据建模为概率模型或统计模型来进行聚类的方法。
在时间序列聚类中,可以使用基于模型的聚类算法来发现数据中的潜在分布和生成模式。
一种常见的基于模型的聚类算法是高斯混合模型聚类算法,它假设数据由多个高斯分布组成,并通过最大似然估计来估计模型参数。
五、动态时间规整聚类算法动态时间规整聚类算法是一种将时间序列数据进行规整化后进行聚类的方法。
在时间序列聚类中,由于数据点之间的时间差异和长度差异,可以使用动态时间规整聚类算法来处理这些问题。
基于节点行为特征的时序链路预测方法研究(一)

基于节点行为特征的时序链路预测方法研究(一)研究报告:基于节点行为特征的时序链路预测方法引言•背景介绍:时序链路预测是网络分析领域的重要问题之一,具有很大的应用潜力。
•研究目的:本研究旨在提出一种基于节点行为特征的时序链路预测方法,以提高预测准确性。
方法介绍1.数据收集–针对特定领域或网络,收集时间序列数据。
–获取节点之间的链路信息。
2.特征提取–利用收集到的时间序列数据,计算出节点的行为特征。
–例如,可以计算节点的度中心性、聚类系数等指标作为行为特征。
3.时序建模–使用收集到的时间序列数据,将节点行为特征作为输入,构建时序模型。
–常用的时序建模方法包括ARIMA、LSTM等。
4.预测链路–利用构建好的时序模型,对未来时刻的链路进行预测。
实验设计与结果分析1.数据集构建–选择特定领域的网络数据集,并进行预处理,获得时间序列数据。
2.实验设置–将数据集划分为训练集和测试集。
–选择适当的评价指标,如准确率、召回率等。
3.实验结果–比较基于节点行为特征的时序链路预测方法与其他方法的预测准确性。
–进行统计分析,验证新方法的有效性。
结论与展望•结论:本研究提出的基于节点行为特征的时序链路预测方法在预测准确性上取得了显著优势。
•展望:未来可以进一步改进方法,考虑更多的节点行为特征,并扩展适用范围,提高方法的实用性。
参考文献[1] 张三, 李四. 时间序列预测方法综述. 计算机科学与技术, 2018. [2] 王五, 赵六. 基于节点行为的网络分析方法研究进展. 通信学报, 2019.引言•背景介绍:时序链路预测是网络分析领域的重要问题之一,具有很大的应用潜力。
通过预测节点之间的链接关系,可以帮助我们理解网络的演化规律,优化网络资源分配等。
•研究目的:本研究旨在提出一种基于节点行为特征的时序链路预测方法,通过探索节点的行为特征和时序变化规律,以提高链路预测的准确性和鲁棒性。
方法介绍1.数据收集–选择适当的领域或网络,收集时间序列数据。
基于特征的时间序列信号表示方法

doi: 10.11857/j.issn.1674-5124.2019010084基于特征的时间序列信号表示方法沈培璐1, 汪朝海2, 钱源来1, 邵 帅1, 周松飞1(1. 中化兴中石油转运(舟山)有限公司,浙江 舟山 316000; 2. 中国计量大学计量测试工程学院,浙江 杭州 310018)摘 要: 为实现时间序列信号特征的预处理,提出一种基于特征协方差矩阵的时间序列信号表示方法。
以一维时间序列数据为输入,计算每一采样时刻的点值、邻域差值、累加值、均差值、秩以及时间索引值等特征,组成点特征向量,将不同时刻的点特征向量依次带入黎曼流形空间,从而实现从一维采样数组到二维特征矩阵的转换;利用矩阵内含的时间序列局部和全局特征信息,计算二维特征矩阵的协方差矩阵,从而建立基于协方差矩阵的时间序列信号表示方法。
为验证方法在特征表示方面的有效性,文中将其用于时间序列信号的相似度度量计算,实验结果表明,相比动态时间规整(DTW )、形状变换(ST )及其尺度不变特征变换(SIFT ),文中算法总体分类性能为最佳,表明具有高效的特征表示性能。
关键词: 时间序列数据; 协方差矩阵; 特征向量; 动态时间规整; 尺度不变特征变换中图分类号: TP391文献标志码: A 文章编号: 1674–5124(2020)05–0013–06Representation method of time series signals based on featureSHEN Peilu 1, WANG Chaohai 2, QIAN Yuanlai 1, SHAO Shuai 1, ZHOU Songfei 1(1. Sinochem Xingzhong Oil Staging (Zhoushan) Co., Ltd., Zhoushan 316000, China; 2. College of Metrology &Measurement Engineering, China Jiliang University, Hangzhou 310018, China)Abstract : In order to extract the features of vibration signals and other time series data, a time series representation method using feature covariance matrix is proposed. Taking one-dimensional time series data as input, calculating feature quantities such as point value, neighborhood difference value, accumulated value,average difference value, rank and time index value at each sampling time to form point feature vectors, and sequentially bringing the point feature vectors at different times into Riemannian manifold space, thus realizing conversion from one-dimensional sampling array to two-dimensional feature matrix; Using the local and global feature information of the time series contained in the matrix, the covariance matrix of the two-dimensional feature matrix is calculated to realize feature extraction. In the paper, the similarity measurement of time series signals is taken as an example for verification. Compared with dynamic time warping (DTW), shape transformation (ST) and scale invariant feature transformation (SIFT), indicating that it has more efficient feature representation performance.Keywords : time series data; covariance matrix; feature vector; DTW; SIFT收稿日期: 2019-01-23;收到修改稿日期: 2019-03-04基金项目: 国家重点研发计划项目(2018YFF0214700);舟山市科技计划项目(2017c12036)作者简介: 沈培璐(1986-),男,浙江舟山市人,助理工程师,硕士,主要从事储运系统信息化和设备安全监测。
统计学中的时间序列聚类分析

统计学中的时间序列聚类分析时间序列聚类分析是统计学中一种重要的数据分析方法,它能帮助我们挖掘时间序列数据中的潜在模式和规律。
本文将介绍时间序列聚类分析的基本概念、常用方法以及在实际应用中的意义。
一、概述时间序列聚类分析是一种将相似的时间序列数据归类到同一类别的方法。
它可以帮助我们理解数据之间的联系,发现隐藏的动态模式,以及对序列进行分类和预测。
通过聚类分析,我们可以将时间序列数据划分成多个群组,每个群组内的序列更相似,而不同群组之间的序列则具有较大的差异。
二、常用方法1. 基于距离的聚类方法基于距离的聚类方法是最常用的时间序列聚类分析方法之一。
它通过计算不同序列之间的距离或相似性度量,将相似度较高的序列归到同一类别。
常用的距离度量方法包括欧氏距离、曼哈顿距离和动态时间规整等。
2. 基于子序列的聚类方法基于子序列的聚类方法是另一种常用的时间序列聚类分析方法。
它将序列划分成多个子序列,并计算子序列之间的距离或相似性,从而实现聚类。
该方法适用于时间序列中存在局部模式或变化的情况。
3. 层次聚类方法层次聚类方法是一种将序列逐步合并或拆分的聚类方法。
它从一个个单独的序列开始,通过计算相似度得到相邻的序列对,并逐渐构建聚类树。
层次聚类方法可以用于确定聚类数目,并提供更直观的聚类结果。
三、实际应用意义时间序列聚类分析在实际应用中具有广泛的意义和应用价值。
1. 金融行业时间序列聚类分析在金融行业中被广泛应用于股票价格预测、风险管理和投资组合优化等方面。
通过对股票价格的聚类分析,可以识别出具有相似价格走势的股票,从而指导投资决策。
2. 交通运输对交通运输中的时间序列数据进行聚类分析,可以帮助我们理解交通流量变化的规律,并提供交通拥堵预测和交通优化方案。
例如,通过聚类分析找到相似的交通流量模式,可以制定出适当的交通调控措施。
3. 环境监测时间序列聚类分析在环境监测领域也有重要的应用。
通过对空气质量、水质水量等时间序列数据进行聚类分析,可以发现环境变化的规律,为环境保护提供科学依据。
基于qiime2的dada2 asv聚类方法

pnpdetectedfatalerror解决方法
"PNP detected fatal error" 是指插拔设备时出现致命错误。
解决
此问题的方法如下:
1. 重启电脑:有时候简单地重新启动计算机就可以解决此问题。
2. 检查硬件连接:确保所有硬件设备正确连接到计算机,并没有松动或损坏的连接。
3. 更新驱动程序:使用更新的设备驱动程序可以解决一些与设备兼容性相关的问题。
您可以访问设备制造商的网站,在那里找到最新的驱动程序并下载安装。
4. 卸载不必要的程序:有时安装了冲突的程序或驱动程序会导致此问题。
您可以尝试卸载最近安装的程序,并检查是否解决了问题。
5. 进入安全模式:进入安全模式可以帮助您确定是否是某个特定程序或驱动程序导致了问题。
在安全模式下,只加载最基本的驱动程序和服务,以帮助您排除问题。
6. 进行系统恢复:如果以上方法都无效,您可以尝试使用系统恢复功能将计算机恢复到之前的某个时间点,以消除可能导致此问题的更改。
如果您无法解决此问题,建议联系计算机制造商或技术支持人员,以获得更进一步的帮助。
基于特征的时间序列聚类方法研究进展_宋辞

第31卷第10期2012年10月地理科学进展PROGRESS IN GEOGRAPHYV ol.31,No.10Oct.,2012收稿日期:2011-10;修订日期:2012-03.基金项目:中国科学院知识创新工程重要方向项目(KZCX2-YW-QN303);中国科学院地理资源所自主部署创新项目(200905004);863项目(2009AA12Z227)。
作者简介:宋辞(1986-),男,博士研究生,主要研究方向为空间数据挖掘。
E-mail:songc@通讯作者:裴韬(1972-),男,副研究员,主要从事空间数据挖掘和空间信息统计等方面的研究。
E-mail:peit@1307-1317页基于特征的时间序列聚类方法研究进展宋辞,裴韬(中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京100101)摘要:时间序列聚类可以根据相似性将对象集分为不同的组,从而反映出同组对象的相似性特征和不同组对象之间的差异特征。
当序列维度较高时,传统的时间序列聚类方法容易受噪声影响,难以定义合适的相似性度量,聚类结果往往意义不明确。
当数据有缺失或不等长时,聚类方法也难以实施。
基于上述问题,一些学者提出了基于特征的时间序列聚类方法,不仅可以解决上述问题,还可以发现序列本质特征的相似性。
本文根据时间序列的不同特征,综述了基于特征的时间序列聚类方法的研究进展,并进行了分析和评述;最后对未来研究进行了展望。
关键词:时间序列;时间序列特征;数据挖掘;聚类1引言随着传感器数量的不断增长以及遥感(RS)、地理信息系统(GIS)、全球定位系统(GPS)的广泛使用,地学研究邻域产生了大量的观测数据。
这些数据不再局限于传统的静态空间中,而是逐渐向时间维扩展,形成了时间序列数据[1]。
时间序列中蕴藏着不同的模式,而不同的模式反映了不同的序列成因。
因此,针对序列模式进行聚类,将其分为不同的类别成为我们认识序列数据,进而理解序列形成本质的重要手段。
基于seasonal-trend-loess方法的符号化时间序列网络

(2019 年 5 月 24 日收到; 2019 年 9 月 4 日收到修改稿)
为了有效控制海量数据时间序列网络的规模并使得网络更贴近实际, 符号化时间序列网络成为研究热 点. 结合周期性时间序列的 seasonal-trend-loess 方法和符号化转化方法, 本文提出一种新的符号化时间序列 建网方法. 该方法考虑了单个数据值的状态又结合了序列的长远变化趋势. 以符号模式为节点; 依时间顺序 推移, 以节点间的邻接转换关系定义连边; 根据转换方向和转换频次确定连边的方向和权重, 建立有向加权 网络. 分别以航空旅客吞吐量时间序列和因特网流量时间序列为实验数据构建的两个时间序列网络, 有明显 差异的拓扑特征; 进一步对移动通信语音时间序列做了实证分析, 挖掘时间序列数据的本质规律.
关键词:周期时间序列, seasonal-trend-loess 方法, 复杂网络, 拓扑特征
PACS:89.75.–k, 05.45.Tp, 43.72.+q, 89.70.–a
DOI: 10.7498/aps.68.20190794
1 引 言
将时间序列通过某种对应关系映射为复杂网 络的思想最早由 Zhang 和 Small 提出, 这一创造 性的想法为时间序列的分析方法提供了新的研究 方向和视角. 2006 年, Zhang 和 Small[1] 首次由伪 周期时间序列构建了复杂网络. 之后, 时间序列网 络方法成为热门的研究方向之一并被应用到许多 领域, 如: 医学 [2]、金融学 [3]、交通运输 [4,5]. 目前, 普 遍应用的时间序列建网方法有: 基于相空间重构法 建网 [6,7]、基于可视图方法建网 [8,9]、基于递归法建 网 [10] 和基于符号模式建网 [11−13].
《2024年基于多源数据聚类与奇异值分解的混合推荐算法》范文

《基于多源数据聚类与奇异值分解的混合推荐算法》篇一一、引言随着互联网技术的飞速发展,信息过载问题日益严重,用户面临着海量的数据选择。
推荐系统作为一种有效的信息过滤工具,已经在电子商务、社交网络、在线视频等各个领域得到了广泛的应用。
传统的推荐算法通常依赖于用户的个人偏好和行为历史数据来生成推荐。
然而,单一的推荐算法难以充分捕捉和利用用户的多样性和复杂的行为模式。
因此,基于多源数据的混合推荐算法应运而生,其融合了不同数据源和算法的优点,为用户提供更精准、多样化的推荐结果。
本文将重点探讨一种基于多源数据聚类与奇异值分解的混合推荐算法。
二、相关研究近年来,混合推荐算法得到了广泛的研究和应用。
该类算法结合了不同类型的数据和算法,以优化推荐结果的准确性和多样性。
在众多算法中,基于聚类和奇异值分解的混合推荐算法因其良好的性能和可扩展性而备受关注。
聚类算法可以有效地对用户或物品进行分组,捕捉用户的潜在兴趣和需求;奇异值分解则可以用于降维和提取数据中的主要特征,提高推荐的准确性。
三、算法设计本文提出的混合推荐算法基于多源数据聚类和奇异值分解。
具体步骤如下:1. 数据收集与预处理:从多个数据源(如用户行为数据、社交网络数据、内容数据等)收集相关数据,并进行预处理,包括去重、清洗、格式化等操作。
2. 用户聚类:利用聚类算法(如K-means、谱聚类等)对用户进行分组,以捕捉用户的潜在兴趣和需求。
根据不同的数据源和需求,可以选择合适的聚类算法。
3. 奇异值分解:对聚类后的用户数据进行奇异值分解,提取主要特征和降维。
这一步骤有助于提取出隐藏在数据中的关键信息,提高推荐的准确性。
4. 混合推荐:结合用户的历史行为、兴趣偏好、社交关系等多方面信息,生成混合推荐结果。
在混合推荐过程中,可以根据具体需求调整不同数据源和算法的权重,以优化推荐效果。
5. 推荐结果评估与优化:通过用户反馈、点击率、购买率等指标对推荐结果进行评估,并根据评估结果对算法进行优化和调整。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i i
式中: t i ∋ ∋ ∋ 第 i 个特征点的水平位置; x t ∋ ∋ ∋ 第 i 个特征 点的值 , w L + 1 , t ∋ ∋ ∋ 第 i 个特征点在特征尺度 s A 的模极大
i i
值, 可作为事件特征点的重要性度量, 其中 k 为由 s A 尺度 确定的事件特征点数目, k =
收稿日期 : 2005 08 02; 修回日期 : 2005 09 19。
[ 1]
1
1. 1
时间序列的奇异事件提取
奇异事件特征提取算法 奇异性是指信号本身或它的某阶导数在某一时刻存在
突变, 奇异点携带有比较重要的信息 , 它是信号重要的特征 之一。由于局部奇异点可以反应时间序列的重要变化特
ห้องสมุดไป่ตู้
基金项目 : 国家科技成果重点推广项目 ( 2003EC000164) ; 北京市自然科学基金资助课题 ( 4022008) 作者简介 : 曲文龙 ( 1970 ) , 男 , 博士研究生 , 主要研究方向为时态数据挖掘。 E m ail: qu wenl@ s oh u. com
[ 3- 4]
时间序列数据广泛存在于众多领域。时间序列数据分 析与挖掘可以揭示系统变化和发展的内在规律。为实现时 间序列数据挖掘首先对连续数值的时间序列进行高层的抽 象表示- 事件序列 ( event sequence) , 以获取定性描述的事 件模式和规则。事件表示时间序列的一种基本的相对独立 的变化模式 , 即元模式( m eta pat tern) , 元模式应易于理解 和解释。Gautam Das 最早研究了时间序列的规则发现, 采用定长滑动窗口获取子序列得到元模式。但窗口宽度的 选取没有一个明确的标准, 难以确定一个合理的窗口宽度 使得所有时间序列片段都具有相对独立的变化模式。Li Bin[ 2] 采用线性分段拟合得到元模式 , 但合理的分段数难以 确定, 使得序列中混杂不同尺度的元模式, 影响模式发现的 准确性。本文提出一种基于小波的多尺度奇异事件特征提 取方法获取时间序列的重要信息特征, 提取的奇异事件体
*
! ( a, b) , 且x - x !
*
( a, b) 有式 ( 1 ) 成立, 则称 f ( x) 在 ( a, b) 上是一致李氏指数
&LM
n
i, t
为 2i ( i = 1 , 2 , ∃, L ) 尺度和 sA ( i = L + 1 ) 的模极
大值点数目。 步骤 3 对 sA 尺度的每一模极大值点( L M i , t = 1 ) , 利 用 LocalMax 标记矩阵依次寻找其在 2 , 2 , ∃, 1 尺度和 原始序列 X = { x t } 的繁殖点, 得到事件序列 EventSeq = { ( t i , x t , w L+ 1 , t ) } , i = 1, 2, ∃, k
( 1. 北京电子科技学院 , 北京 100070; 2. 北京科技大学信息工程学院 , 北京 100083; 3. 北京印刷学院, 北京 102600)
摘 要: 提出一种基于小波的多尺度奇异事件特征提取方法, 将时间序列分割为一系列具有独立趋势形态的
事件子序列; 对以变换参数表示的事件子序列的利用混合遗传聚类算法实现离散符号化, 每一事件子序列以其所 属类别标识, 从而将连续数值域的时间序列转化为离散符号域的事件序列。 方法用于对非平稳金融时间序列进 行了符号化转换 , 实验结果表明该方法是有效的。 关键词: 时间序列 ; 符号化; 奇异事件; 知识发现 中图分类号 : T P311. 13 文献标识码: A
t= 1
n + 1, 如果存在两
个常数 A 和 h 0 > 0 , 及 n 次多项式 p n ( h ) , 使得对任意的 ( 1)
则称 f ( x) 在点 x 0 为 Lipschitz 指数 。李氏指数越大, 函数 越光滑。如果 f ( x) 在 x 0 Lipschitz 指数不为 1, 则称函数在 x 0 点是奇异的。 定义 2 的。 传统的傅里叶变换方法只给出 f ( x) 在全域的奇异性 度量。而利用小波可分析这种局部奇异性, 小波系数的值 取决于 f ( x) 在 x 0 的邻域内的特性及小波变换所选取的尺 度。在比较小的尺度上 , 它提供了 f ( x ) 的局部化性质。 定义 3 在尺度 s0 下, 称点( s0 , x 0 ) 是局部极大值点 , 若 Wf ( s0 , x 0 ) 在 x = x 0 有一过零点, 则称( s0 , x 0 ) 为小波变换 x 的模极大值点。若对属于 x 0 的某一邻域内的任意点 x , 有 Wf ( s0 , x ) Wf ( s0 , x 0 ) , 则尺度空间 ( s , x) 中所有 模极大值点的连线称为模极大值线。 定义 4 称小波 ( x ) 具有 n 阶消失矩, 如果对于一切 正整数 k< n, 有 如果对任意 x ! ( a, b) , x
t= 1
& LM
n
L+ 1, t
。
∀x
- #
#
k
( x) dx = 0
( 2)
为提高运算效率, 算法中采用了二进小波变换, 对于尺 度 2 上一个模极大值 x 1 , 若它与尺度 2 上的一个模极大 值 x 2 有相同的符号, 位置也比较靠近且有较大的幅值, 则认 为 x 2 为 x 1 的繁殖点, 利用这种规律可估计信号的模极大 值线。 本文目标是检测时间序列的事件特征 点 ( 趋势转折 点) , 即一阶导数的间断点( 其李氏指数 a < 2 ) , 因此用于奇 异事件检 测的小 波应 具有 对称 性且 要有 二阶 消失 矩。 Mexican hat 小波是由高斯平滑函数的二次导数导出, 具有 二阶消失矩, 当尺度从小到大变化时不会引入新的奇异点, 可以有效检测和准确定位峰值奇异点。 对时间序列进行奇异事件特征提取后, 为使每一事件 标识符定性的表示某一类变化模式, 对事件子序列进行形 态相似聚类。本文中事件子序列以简单的内插线性模型表 示, 每个事件子序列以三维变换参数( 转角, 模长、 始点垂直 位置) 空间的点表示。事件的形态相似度量在变换参数空 间定义。
j j- 1
Mallat 对利用小波进行信号奇异性进行了深入分析[ 5 ] , 下 面的定理给出了小波变换的模极大值与函数的奇异性 Lip schitz 指数的关系。 定理 1 设 n 为一严格正整数, 为一有 n 阶消失矩、 n 没
次连续可微具有紧支集的小波 f ( x ) ! L 1 ( [ a, b] ) , 则式( 1 ) 若存在尺度 s0 > 0 , 使得 s < s0 , x ! ( a, b) , Wf ( s , x ) 有局部极大值点, 则 ! > 0 和 a < n, f ( x ) 在区间 ( a + ! ,
0
引
言
现在相同的尺度, 从而使得事件规则中的元模式具有相同 量级, 提高了规则的精确性和可用性。 聚类分析( cluster ing analysis) 是一种无监督的模式识 别方式, 利用遗传算法可以改进聚类算法的性能 。本 文利用事件变换参数聚类实现事件的离散符号化, 提出一 种混合遗传聚类算法 ( H GA) , 利用免疫原理中的个体浓度 抑制机制控制个体选择, 防止过早收敛; 利用等位基因交叉 操作提高全局搜索能力; 利用动态变异策略提高局部搜索 能力。实验表明使本文的 H GA 聚类算法可以稳定的全局 最优聚类结果, 保证了时间序列事件符号化的质量。
Time series symbolization based on singular event feature clustering
QU Wen long 1, 2 , ZH A NG Ke jun 2 , YANG Bing ru 2 , YOU F u cheng 3
( 1 . Beij ing Electr onic Science and T echnology I nst . , Beij ing 100070 , China; 2 . I nf ormation Eng ineer ing S chool , Beij ing Univ . of Science and T echnology , B eij ing 100083 , China; 3 . B eij ing I nst . of Grap hic Communication, Beij ing 102600 , China )
Abstract: A feature extraction method of singular event based on m ult i scale w avelet is presented. Time se ries is divided int o event subsequences w it h independent t rend. The event subsequences represented by trans formed parameters are clustered by a hybrid genet ic algorithm to implement sym bolizat ion. Each event is ident i fied by the cluster it belongs to. T he proposed m ethod is applied to unst eady financial time series symbolization. E xperiment al result show s th at t he met hod is effect ive. Key words: t ime series; sym bolization; singular event ; know ledge discovery
1132