时空数据挖掘研究进展
时空关联性分析方法研究与应用

时空关联性分析方法研究与应用摘要:随着信息技术、通讯技术、数字存储技术和高速数据获取技术的迅猛发展,在交通、电力、物流、环境监控、工业生产等领域积累了大量与时间和地理空间相关的数据资源,可这些随时随地获取的、呈爆炸性增长的数据资源在给我们带来丰富信息的同时,“数据越丰富,知识越贫乏”的问题则日益突出。
近年来,越来越多的学者认识到,通过研究空间对象随时间的变化规律,发现数据的时空关联规则,分析数据的时空变化趋势并预测未来的时空状态,对于规划建设、指挥调度、应急管理、信息服务等具有重要的应用价值。
本文研究的目的是面向智能交通领域,在时空关联性分析基础上,利用时空关联规则挖掘方法获取含时空约束的关联规则,从而进行交通拥堵趋势分析,为道路导航、趋势查询、交通控制等提供辅助决策信息。
时空关联性分析是研究空间对象随时间的变化规律,反映时空数据在时间和空间上的关联性,时空关联规则挖掘作为时空关联性分析的主要方法之一,目前已有不少学者对其进行了研究或应用。
本文详细介绍了时空关联规则挖掘的研究现状,通过分析现有时空关联规则算法在同时考虑时间和空间约束方面的不足,实现了一种新的时空关联规则挖掘方法。
文中首先对时空数据进行空间关联性分析和时间段划分形成事务表,然后对空间关联的项集进行连接并产生时空关联规则。
在算法执行过程中,对关联规则挖掘相关的阈值进行了分析,使挖掘所得的结果能更好的满足用户的需求。
算法分析和实验对比表明,同时考虑时间和空间约束,能够在分析过程中及时过滤不相关的数据,提高时空关联规则的获取效率,能够有效地发现时空关联规则。
在理论研究的基础上,本文设计并实现了一个基于时空关联规则分析交通拥堵趋势的原型系统,可有效地实现时空关联性分析和结果的可视化。
关键词:时空关联性分析,时空关联规则,可视化,阈值分析,交通拥堵时空关联性分析绪论当前像气象预报、环境监测和交通控制等领域,在问题的求解过程中越来越需要同时考虑时间和空间因素,而时空关联性分析的目标就是明确时空数据的时间有效性和空间可达性,从而在时间和空间上进行有效的趋势分析和预测。
面向大规模数据的时空关联与演化分析方法研究

面向大规模数据的时空关联与演化分析方法研究随着信息技术的飞速发展和互联网用户的快速增长,大规模数据的产生变得越来越常见。
在这些大规模数据中,时空关联与演化分析成为了研究的热点之一。
时空关联分析旨在发现和理解数据中时空相关性的模式和规律,而时空演化分析则旨在识别和描述数据中的时空变化过程。
本文将介绍面向大规模数据的时空关联与演化分析所采用的方法与技术,并探讨其中的一些应用案例。
1. 时空关联分析方法时空关联分析方法可以帮助我们理解数据中时空相关性的模式和规律。
其中常用的方法包括:1.1 空间关联分析空间关联分析研究的是地理空间中不同地点之间的关联性。
其中,空间自相关分析是一个常用的方法,用于检测空间数据中的空间相关性。
其他方法还包括空间克里金插值和空间回归分析等等。
1.2 时间关联分析时间关联分析研究的是时间序列数据中的关联性,主要应用于时间序列数据的预测和分析中。
常用的时间关联分析方法有自回归移动平均模型(ARIMA)、季节性分解法和指数平滑法等。
1.3 时空关联分析时空关联分析通常结合了空间和时间的因素,研究时空数据中的关联性。
这些方法可以通过计算地点和时间之间的距离来发现数据中的空间时间相关性。
时空关联中的一种常见方法是时空聚类分析,用于发现时空数据中的聚类模式。
2. 时空演化分析方法时空演化分析方法用于识别和描述数据中的时空变化过程。
这些方法可以帮助我们理解和预测数据中的时空演化趋势。
以下是一些常见的时空演化分析方法:2.1 空间插值方法空间插值方法用于填补地理空间上的数据空白。
通过插值方法,我们可以根据已知的数据点推断出未知位置的数据值,从而得到完整的地理空间数据。
插值方法中常用的有克里金插值方法、反距离权重插值和泛克里金插值等。
2.2 时空数据挖掘方法时空数据挖掘方法结合了时空特征和数据挖掘技术,用于发现和分析时空数据中的模式、规律和趋势。
数据挖掘方法包括聚类分析、分类分析和关联规则挖掘等。
超高时空分辨率数据的精确处理与数据挖掘

超高时空分辨率数据的精确处理与数据挖掘一、超高时空分辨率数据的奇妙世界你能想象自己站在一个超级高清的世界里吗?就像从一个放大镜下看生活,每个细节都被放得巨清楚,没错,超高时空分辨率数据就是这么神奇的存在。
现在的技术让我们可以以非常高的精度,捕捉到某一时刻、某一地点的所有变化,像是给世界装上了“显微镜”。
比方说,你在看一场足球比赛,突然间,你可以看到球员的每一次脚步、每一次传球的轨迹,每个动作背后的细节,而这还只是其中的冰山一角。
这些数据背后隐藏着大量的信息,如果把它们不加处理地一股脑儿放出来,那可真是一团乱麻,怎么理都理不顺。
所以啊,如何精准地处理这些数据,才能真正让它们发挥作用,就成了当下科技领域的一个大难题。
二、数据处理的难度到底有多大?当我们面对这么庞大的时空数据,首先要做的,就是给这些数据“剪剪发”,让它们看起来不那么乱。
说得通俗点,就像你整理一堆资料,先得把它们按类别分好,再根据需要挑出最重要的部分。
可这不是那么简单的事情,毕竟我们说的“时空数据”不仅仅是时间和空间的普通数据,它们的每一个点都可能代表着某种特殊的现象,稍有不慎,就会误判,错过一些关键的信息。
举个例子,假设你在做一个卫星图像分析,可能会遇到云层、天气变化、甚至地面反射等因素的干扰,哪怕这些干扰微小到只有几毫秒或者几米的差距,都可能让你得出错误的结论。
这种情况就像你在大海捞针,针是有的,但每一根针都跟海水和沙子打着交道,找起来可比登天还难。
你看一个数据集,乍一看,它清清楚楚、一目了然,仿佛没什么大不了的。
但一深入分析,你才发现,那些看似简单的数据背后,藏着层层迷雾。
不仅要去除杂音、弥补数据缺失,还得对数据进行修正和优化。
别小看这些工作,甚至可以说,它们是整个数据挖掘的“基石”。
没有准确的数据,后续的分析、预测、决策什么的,都是空中楼阁,根本站不住脚。
三、数据挖掘:像打麻将一样的策略与技巧咱们先把处理过的数据给整合好,就得进入“数据挖掘”环节了。
隐私保护数据挖掘研究进展

( 南京邮 电大 学 地理 与生物 信息 学院 ,南京 2 1 0 0 0 3 )
摘 要 :近年 来 隐私保 护数据挖 掘 已经 成为数 据挖掘 的 研 究热 点 , 并 取得 了丰 富 的研 究 成果 。但是 , 随 着移 动 通信、 嵌入式、 定位 等技 术的发展 与 物联 网、 位 置服 务 、 基 于位置 的社 交 网络 等应 用的 出现 , 具有 个人 隐私 的信 息
,
( C o l l e g e o f G e o g r a p h i c&B i o l o g i c I n f o r m a t i o n,N a n j i n g U n i v e r s i t y f o P o s t s&T e l e c o mmu n i c a t i o n s ,N a n g 2 1 0 0 0 3,C h i n a )
o f e x i s t i n g p iv r a c y - p r e s e vi r n g d a t a mi n i n g me t h o d s , t h i s p a p e r p r o p o s e d t h e i r c h a l l e n g e s f r o m t h e i f e l d o f n e w d i s t r i b u t e d s y s — t e m, h i g h d i me n s i o n a l d a t a a n d s p a t i o — t e mp o r a l d a t a, e t c, a s w e l l a s i n d i c a t e f t h e f u t u r e r e s e a r c h d i r e c t i o n s . Ke y wo r d s :p r i v a c y — p r e s e vi r n g d a t a mi n i n g;n e w d i s t r i b u t e d s y s t e m;h i g h d i me n s i o n a l d a t a ;s p a t i o — t e mp r a l d a t a
基于时空数据的异常检测技术研究

基于时空数据的异常检测技术研究一、时空数据异常检测技术概述时空数据是指包含空间和时间信息的数据,如交通流量、气象数据、移动设备定位数据等。
在现代信息社会中,大量的时空数据被采集、传输和存储,这些数据在人类生产生活中起到越来越重要的作用。
然而,由于数据量大、复杂度高、噪声干扰等几个方面的问题,管理时空数据的复杂性和挑战性不断增加。
因此,时空数据异常检测技术成为了解决这些问题的一种重要手段。
时空数据异常检测技术是指通过对时空数据的分析和挖掘,发现其中不同于其他数据的异常点,以便进一步深入了解其背后的原因。
该技术可以应用于许多领域,例如交通管理、环境保护、公共安全和商业智能等领域。
常见的时空数据异常检测方法包括基于统计学、机器学习、数据挖掘和深度学习等技术。
二、基于统计学的时空数据异常检测技术基于统计学的时空数据异常检测技术是一种传统的方法,它通过对数据的概率分布进行分析,将不同于正常数据的数据点视为异常点。
常用的统计学方法包括Z-score法、Grubbs检验法和均值-方差法等。
Z-score法是指将数据点与样本均值之间的距离除以样本标准差,得到的值称为Z分数,如果Z分数超出了预设的阈值,则该数据点被认为是异常值。
Grubbs检验法则是基于极值理论的一种方法,它通过计算数据点与样本均值之间的距离,识别离群值并计算其概率。
均值-方差法则是通过计算数据点与均值之间的距离,利用高斯分布的特性来识别异常值。
这些方法在处理时空数据异常检测中都有其适用性,但是由于时空数据的高维度和复杂度,这些方法存在一些限制,如难以处理大量的数据、无法有效地捕捉数据的时空特征等。
三、基于机器学习的时空数据异常检测技术基于机器学习的时空数据异常检测技术是一种比较先进的方法,它可以捕捉到数据的时空特征,基于这些特征通过机器学习算法进行异常检测。
该方法通过先训练模型,再将新的数据输入到已训练的模型中进行异常检测。
常用的机器学习算法包括支持向量机、决策树、随机森林、神经网络和深度学习等。
《2024年地理学时空数据分析方法》范文

《地理学时空数据分析方法》篇一一、引言地理学作为一门研究地球表面自然现象与人文现象的学科,在众多领域具有广泛应用。
随着科技的进步,特别是计算机技术和大数据的飞速发展,地理学的研究方法也在不断更新和升级。
其中,时空数据分析方法作为地理学研究的重要手段,日益受到关注。
本文旨在探讨地理学时空数据分析方法的基本原理、应用领域及未来发展趋势。
二、地理学时空数据分析方法的基本原理地理学时空数据分析方法主要是通过收集、处理、分析和解释地理空间数据和时间序列数据,以揭示地理现象的时空分布规律和演变趋势。
其基本原理包括以下几个方面:1. 数据收集:根据研究目的和需求,收集相关的地理空间数据和时间序列数据。
数据来源可以是遥感影像、地理信息系统数据库、社会经济统计数据等。
2. 数据处理:对收集到的数据进行清洗、格式化、坐标转换等预处理工作,以便进行后续的时空分析。
3. 数据分析:利用统计学、地理信息系统、遥感技术等方法,对数据进行时空分析,包括空间自相关分析、空间插值、时空聚类分析等。
4. 结果解释:根据分析结果,结合地理学理论和其他相关知识,对地理现象进行解释和预测。
三、地理学时空数据分析方法的应用领域地理学时空数据分析方法在多个领域都有广泛应用,如城市规划、环境保护、气候变化研究、农业管理、灾害监测等。
以下列举几个典型应用领域:1. 城市规划:通过分析城市人口分布、交通流量、土地利用等时空数据,为城市规划提供科学依据,优化城市布局。
2. 环境保护:监测空气质量、水质、生态变化等时空数据,评估环境质量状况,为环境保护政策制定提供支持。
3. 气候变化研究:分析气候变化的空间分布和时间变化趋势,研究气候变化对人类社会和自然环境的影响。
4. 农业管理:利用遥感技术监测农作物生长状况、土壤湿度等时空数据,为农业管理提供决策支持。
5. 灾害监测:通过实时监测灾害事件的时空分布,为灾害预警和应急救援提供支持。
四、地理学时空数据分析方法的未来发展趋势随着科技的进步和大数据时代的到来,地理学时空数据分析方法将迎来更多发展机遇。
时空数据分析算法及其
时空数据分析算法及其应用研究时空数据分析算法及其应用研究空间和时间是现实世界最基本、最重要的属性,许多空间应用系统都需要表达地学对象的时空属性,例如在地理位置变更、环境监测、城市演化等领域都需要管理历史变化数据,以便重建历史、跟踪变化、预测未来。
面向对象的技术是用在软件设计中的一种方法,它用在时空数据[1]表达中主要是为了克服给定实体的空间或非空间属性在不同时间不同频率变化而出现的复杂问题[2]。
下面从KNN 、RNN 、SkyLine 三种时空数据分析算法出发,论述时空数据分析算法的应用。
1、KNN 分析算法的基本概述及应用分析KNN 算法是非参数回归模型的基本算法之一,通过在状态空间中搜索与待测点X 相近的k 个样本(X i ,Y i )估计g n (x),因此又称为k 最近邻非参数回归,其预测函数[3]可表示为Y=g(X)=∑=k 1i W i (X ;X k 1,…,X k k )Y i =∑=k 1i k i Y i (1)其中X k 1.表示与x 距离最近的点,并赋予权值k 1;X k 2则被赋予权值k 2;以此类推,得到k 个权函数k 1,k 2,⋯,k k ,满足k 1≥k 2≥…≥k k ≥0,∑=k 1i i k =1 (2)KNN 算法通过计算样本个体之间的距离或者相似度来寻找与每个样本个体最相近的K 个个体,在这个过程中需要完成一次样本个体的两两比较,所以算法的时间复杂度,跟样本的个数直接相关。
K 最近邻算法通常情况下是用于分类的,这只是对K 近邻算法用途的本质说明[4]。
从实际来看,K 近邻算法可以应用的地方还有很多,比如系统推荐等等。
简单的讲,就是挖掘出客户喜欢的相同商品,来进行相似物品的推荐。
另外区分客户群体,从而使我们更好的为客户服务。
下面是KNN 分类器构建实例。
KNN 的实现分训练和识别两步。
训练时,把每类样本降维后的结果作为KNN 的输入。
如图1所示,圆圈表示待识别数据所处的位置,选择K 值为3时,选中实线圆中的3个数据,识别结果为三角形代表的类;选择K 值为5时,选中虚线圆中的5个数据,识别结果为正方形代表的类。
基于深度学习的时空行为分析技术研究
基于深度学习的时空行为分析技术研究随着物联网和智能设备的普及,大量的人们活动信息被记录下来,在互联网平台上产生了海量数据。
这些数据涵盖了人们日常生活的方方面面,如移动轨迹、社交网络行为等。
基于这些数据的特征和模式,可以研究人类的行为规律,进一步应用在安防监控、城市规划、交通管理等领域。
时空行为分析技术正是利用这些数据特征解析人类活动规律的一项研究。
时空行为分析技术是一个交叉学科,应用了计算机科学、数学、统计学、物理学等多个领域的知识。
该技术旨在研究人类的移动轨迹、空间分布、社交网络等活动特征,通过这些特征的模式分析,实现对人类活动中的可见和不可见行为的识别和预测。
在过去的几十年中,时空行为分析技术已经得到了很大的发展。
传统的时空数据挖掘方法基本上是基于统计模型和机器学习算法来建立模型和解决问题的,如集束算法、聚类算法、神经网络和支持向量机等。
这些方法在数据量较小的情况下可以得到很好的结果,但是往往难以处理大规模的数据集和复杂的人类行为模式。
近年来,随着深度学习技术的发展,基于神经网络的方法在时空行为分析领域开始逐渐受到重视。
深度学习是模拟人类神经网络的一种机器学习方法,它可以有效处理大规模、高维度的数据,同时可以自动生成特征并学习复杂的非线性关系。
在时空行为分析中,深度学习可以处理人类的轨迹、位置、行动和交互等方面的数据,从而能够更好的识别人类行为模式。
在基于深度学习的方法中,卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)是最常用的两种模型。
CNN通过分层的滤波器来提取数据的空间特征,而RNN则可以模拟序列数据中的时序关系。
两种方法可以结合使用,如空间金字塔池化卷积神经网络(Spatial Pyramid Pooling Convolutional Neural Network,SPP-CNN)。
如何进行时空数据建模与分析
如何进行时空数据建模与分析时空数据建模与分析是指对在时间和空间上变化的数据进行建模和分析的过程。
随着科技的发展和数据采集技术的进步,时空数据变得越来越重要,它可以应用于各个领域,如城市规划、环境保护、交通管理等。
本文将介绍时空数据建模与分析的基本概念和方法,并讨论如何有效地进行时空数据建模与分析。
一、时空数据建模的基本概念时空数据建模是指对在时间和空间上变化的数据进行抽象和描述的过程。
时空数据经常以表格、图像或视频形式呈现,它包含了多个维度的数据,例如时间、地理位置、属性等。
时空数据建模的目标是找到数据的内在规律和关联,并能够解释和预测未来的变化趋势。
在时空数据建模中,需要考虑以下几个关键问题:1. 数据获取:时空数据的获取是建模的基础,需要使用各种数据采集技术,如卫星遥感、传感器网络等。
获取的数据应具有高准确度和高时空分辨率,以更好地反映现实世界的变化。
2. 数据预处理:时空数据通常存在缺失值、异常值和噪声,需要进行预处理,以提高数据质量。
预处理的方法包括插值、异常检测和平滑等。
3. 数据集成:时空数据通常来自多个数据源,需要将不同来源的数据集成为一个一致的数据集。
数据集成的关键是解决数据的差异性和冲突性,以提供一个完整的时空数据集。
4. 数据建模:数据建模是将时空数据转化为可分析的形式,以进行进一步的分析和预测。
常用的建模方法包括统计模型、机器学习和深度学习等。
二、时空数据分析的基本方法时空数据分析是指对时空数据进行统计、挖掘和可视化的过程。
通过分析时空数据,可以发现其潜在的规律和关联,从而提供支持决策和优化的依据。
下面介绍几种常用的时空数据分析方法:1. 空间分析:空间分析是对地理位置上变化的数据进行分析和研究的过程。
常用的空间分析方法包括地理加权回归、Kriging插值和空间聚类等。
通过空间分析,可以揭示空间分布的规律和模式。
2. 时间序列分析:时间序列分析是对时间上变化的数据进行建模和分析的过程。
空间数据智能中的轨迹大数据分析:多源融合与前沿进展
空间数据智能中的轨迹大数据分析:多源融合与前沿进展目录1. 内容描述 (2)1.1 研究背景和意义 (2)1.2 国内外研究现状 (3)1.3 本文的研究内容与方法 (5)2. 空间数据智能概述 (6)2.1 空间数据定义与特性 (6)2.2 智能数据处理技术 (7)2.3 空间数据处理的发展趋势 (8)3. 轨迹大数据的概念与特点 (10)3.1 轨迹数据定义 (11)3.2 轨迹大数据的特点 (12)3.3 轨迹数据的主要应用领域 (13)4. 多源轨迹数据融合技术 (14)4.1 数据融合的基本原理 (16)4.2 数据融合技术的发展历程 (17)4.3 多源融合算法与技术 (19)4.4 融合技术在轨迹大数据中的应用 (20)5. 前沿进展 (22)5.1 深度学习在轨迹分析中的应用 (23)5.2 云计算与大数据分析技术 (25)5.3 跨学科融合研究 (26)5.4 隐私保护与安全问题 (27)6. 应用案例分析 (29)6.1 交通流量预测 (30)6.2 城市环境监测 (31)6.3 安全监控与应急管理 (33)7. 未来发展方向 (34)7.1 技术创新与应用领域拓展 (35)7.2 数据隐私与安全挑战 (37)7.3 跨学科研究的融合 (38)7.4 标准化与政策法规制定 (39)8. 结论与展望 (41)1. 内容描述本论文旨在探讨和分析在空间数据智能领域中关于轨迹大数据的处理方法和分析技术,特别是涉及多源数据融合的前沿进展。
首先,我们将介绍轨迹数据的特点、处理和分析的重要性和背景。
之后,将详细讨论多源数据融合的技术和方法,包括但不限于传感器数据、卫星图像、社交媒体信息等,这些数据来自于不同的来源和平台,它们在空间数据智能中扮演着关键角色。
我们将深入研究各类分析技术,如模式识别、机器学习、深度学习模型以及它们如何帮助在轨迹大数据中揭示模式和趋势。
此外,还将探讨隐私保护和数据挖掘过程中的伦理问题,因为这些技术的应用不仅涉及到数据质量、精确度和效率,还涉及到对个人隐私的保护。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机研究与发展ISSN1000—12391CN11—1777/TP
JournalofComputerResearchandDevelopment50(2):225—239,2013
时空数据挖掘研究进展刘大有陈慧灵齐红杨博(吉林大学计算机科学与技术学院长春130012)
(符号计算与知识工程教育部重点实验室(吉林大学)长春130012)(1iudayoul9420601@gmail.corn)
AdvancesinSpatiotemporalDataMining
LiuDayou,ChenHuiting,QiHong,andYangBo(CollegeofComputerScienceandTechnology,JilinUniversity,Changchun130012)(KeyLaboratoryofSymbolicComputationandKnowledgeEngineering(JilinUniversity),MinistryofEducation,
Changchun130012)
AbstractInrecentyears,thewidespreaduseoftheadvancedtechnologiessuchasglobalpositioning
systems,sensornetworkandmobiledevices,resultsinaccumulationofagreatamountofnon-
spatiotemporaldataandspatiotemporaldata.Inaddition,theprocessingofspatiotemporaldataismorecomplex,whichmakestheincreasingoneroussituationofdataprocessing
tasksworse.To
addressthesechallenges,spatiotemporaldatamininghasemergedasanactiveresearchfield,focusing
onthedevelopmentoftheory,methodology,andpracticefortheextractionofusefulinformationand
knowledgefrommassiveandcomplexspatiotemporaldatabases.Therefore,lookingforeffectivespatiotemporaldataminingmethodsisofgreatsignificance.Thispaper
attemptstoreviewtherecent
theoreticalandappliedresearchprogressinspatiotemporaldataminingandknowledge
discovery.We
mainlyfocusonspatiotemporalpatterndiscovery,spatiotemporalclustering,spatiotemporalanomaly
detection,spatiotemporalprediction,spatiotemporalclassification,andthecombinationofspatiotemporal
data
miningwithreasoning.Wehaveintroducedthestate-of-the-artresearchonspatiotemporaldataminingindetail,anddiscussedthecurrentmajorproblemswearefacinganditspossiblesolutions.
Keywordsspatiotemporal,datamining;spatiotemporal
pattern
mining;spatiotemporalclustering;
spatiotemporaloutlierdetection;spatiotemporalpredictionandclassification
摘要近年来,随着全球定位系统、传感器网络和移动设备等的普遍使用,非时空数据和时空数据急剧增加,加之时空数据处理更为复杂,使数据处理任务日趋繁重的形势更加严峻.因此,寻找有效的时空数据挖掘方法具有十分重要的意义.针对这一背景,主要围绕时空模式发现、时空聚类、时空异常检测、时空预测、时空分类、时空数据挖掘与推理的结合等方面,对时空数据挖掘研究的现状进行了详细介绍,对其当前所面临的一些主要问题及可能的解决方案进行了探讨.
关键词时空数据挖掘;时空模式发现;时空聚类;时空异常检测;时空预测和分类中图法分类号TPl81
早期的数据挖掘研究主要针对字符一数值型的商业数据.20世纪90年代中后期,数据挖掘领域的一些较成熟的技术,如关联规则挖掘、分类、预测与聚类等被逐渐用于时间序列数据挖掘和空间数据挖掘,以发现与时间‘1。43或空间睁93相关的有价值的模式.这些研究得到了快速发展.随着传感器网络、全球
收稿日期;2011—03—11;修回日期;2012—06—25基金项目:国家自然科学基金项目(61133011,61170092,60973088,60873149)
万方数据计算机研究与发展2013,50(2)定位系统(GPS)、手持移动设备和射频识别(RFID)等设备的普遍应用,积累了大量的移动对象数据[1’1旷13].此外,遥感卫星和地理信息系统(GIS)等的显著进步,使人们前所未有地获取了大量的气候数据、数字影像数据以及地理科学数据[1’1旷13].这些时空数据内嵌于连续空间,其样本在时间、空间上存在很强的自相关性,其中隐含的模式往往是局部的,从而使时空数据挖掘具有特殊性和复杂性.因此,寻找有效的时空数据分析技术对于时空数据中有价值时空模式的自动抽取与分析具有重要意义[1’111.时空数据挖掘作为一个新兴的研究领域,正致力于开发和应用新兴的计算技术来分析海量、高维的时空数据,揭示时空数据中的有价值知识[1’14].近年来,时空数据挖掘已成为数据挖掘领域的研究热点,在国内外赢得了广泛关注,被SCI,EI收录的论文数量逐年上升.国际顶级会议(如数据库领域的SIGMOD,VLDB,ICDE,数据挖掘领域的SIGKDD,ICDM)和相关领域的著名国际期刊(如《IEEETransactionsonKnowledgeandDataEngineering(TKDE)》,《IEEETransactionsonGeoscienceandRemoteSensing(GRSS)》,《InternationalJournalofGeographicalInformationScience(IJGIS)》,({JournalofIntelligentInformationSystems(JIIS)》等)每年都有很多关于时空数据挖掘研究成果的报道;同时,国际上每年都会举办有关这方面的研讨会(如数据挖掘领域权威国际会议IEEEICDM从2006年起每年都设立“WorkshoponSpatialandSpatiotemporalDataMining”①);此外,还有很多专题会议涉及时空数据挖掘,例如SymposiumonSpatialandTemporalDatabases(SSTD)⑦,ACMInternationalSymposiumonAdvancesinGeographicInformationSystems(ACMGIS)③)等.当前,时空数据挖掘的研究已吸引了来自GIS、时空推理、数据挖掘、机器学习和模式识别等众多领域的学者,取得了诸多研究成果.与此同时,时空数据挖掘也在许多领域得到应用,如移动电子商务(基于位置的服务)[1融“]、土地利用分类及地域范围预测[1719|、全球气候变化监控(如海洋温度、厄尔尼诺现象、生物量)[20-zz]、犯罪易发点发现[23]、交通协调与管理(交通中的局部失稳、道路查找)[z4|、疾病监控瞳5|、水资源管理口6伽、自然灾害(如台风、森林火灾)预警[28‘29|、公共卫生与医疗健康[3∞333等.本文对时空数据挖掘领域的研究现状以及目前面临的主要问题进行了分析,试图为该研究方向勾画出一个较为全面和清晰的轮廓,为数据挖掘、机器学习和GIS等相关领域的研究者提供有益的参考.
1时空数据挖掘按照数据挖掘的定义n21,可将时空数据挖掘定义为从具有海量、高维、高噪声和非线性等特性的时空数据中提取出隐含的、人们事先不知道的、但又潜在有用的信息及知识的过程.时间维和空间维为数据挖掘任务增加了额外的复杂性,使得时空数据挖掘研究更具挑战性.作为一个新兴的研究领域,经过近年的快速发展,时空数据挖掘研究领域出现了
Fig.1Theclassificationchartofspatiotemporaldataminingtasks.图l时空数据挖掘任务分类图
①http://i.cs.hku.hk/~nikos/sstdm06/’http://spatial.rive.es.vt.edu/sstdm07,http:Ilwww.ornl.gov/sei/knowledgediseovery/sstdm-08/httpt||www.ornl.gov/sci/knowledgediscovery/sstdm-09|②http:flwww.informatik.uni。-trier.det~ley/db/eon{/ssdtindex.html③http:II,^,ww.sigspatial.org/sigspatial—conferences
万方数据