一种基于数据融合和方法融合的时空综合预测算法
基于时空数据的异构数据融合与集成算法研究

基于时空数据的异构数据融合与集成算法研究随着时空数据的快速增长和异构数据的广泛应用,如何有效地融合和集成时空数据成为了研究的热点问题。
本文将从理论和应用两个方面,对基于时空数据的异构数据融合与集成算法进行深入研究。
一、理论研究1. 异构数据融合理论异构数据融合是指将来自不同来源、不同类型、不同结构的时空数据进行整合,以提取更全面、准确、一致的信息。
在异构数据融合中,需要解决如何对不同类型的时空数据进行统一建模、如何处理不同精度和分辨率的时空信息等问题。
2. 异构数据集成理论异构数据集成是指将来自不同领域、不同地域以及不同时间段的时空信息进行整合分析。
在异构数据集成中,需要解决如何处理来自多个源头的信息冲突和一致性问题,以及如何建立有效地模型来描述多源信息之间的关系等问题。
3. 异质性度量与处理在基于时空信息融合与集成算法中,需要对异质性进行度量和处理。
异质性度量可以通过计算不同数据源之间的相似性和差异性来实现,而处理异质性可以通过数据变换、特征选择和特征融合等方法来实现。
二、应用研究1. 空间数据融合与集成算法空间数据融合与集成算法是基于空间信息的异构数据融合与集成研究的重要内容。
通过对不同空间分辨率、不同投影方式以及不同坐标系的空间数据进行整合,可以提高对地球表面特征和过程的认识。
2. 时间数据融合与集成算法时间数据融合与集成算法是基于时间信息的异构数据融合与集成研究的重要内容。
通过对不同时段、不同频率以及不同时间尺度下的时间数据进行整合,可以揭示出地球表面特征和过程随时间变化的规律。
3. 时空关联分析时空关联分析是基于时空信息进行关联规则挖掘和模式识别研究的重要内容。
通过对时空信息中存在关联关系或相似模式进行挖掘,可以帮助人们更好地理解地球表面特征和过程之间的相互作用。
三、算法研究1. 基于统计方法的时空数据融合与集成算法基于统计方法的时空数据融合与集成算法是一种常用的数据融合与集成方法。
通过建立统计模型,对不同类型、不同分辨率、不同精度的时空数据进行整合,可以提高对地球表面特征和过程的认识。
ADS-B技术在低空空域安全中应用的现状与展望

ADS-B技术在低空空域安全中应用的现状与展望摘要:ADS-B系统作为一个中央监控和通信系统集成,提供了范围广泛的传输速度的优点以及与传统网络驱动器集成以改进监控系统的能力。
ADS-B还可以在冲突检测和CDTI之间建立有机联系,开发新的冲突预防系统,这是新一代飞行系统开发的关键技术。
以下阐述了ADS-B技术在低空气安全中应用的现实和前景,作为指导。关键词:ADS-B技术;低空空域安全中应用;现状与展望引言低空空域飞行一般指航空器在1000米以下的高度所进行的飞行。
一般在低空空域中飞行的航空器都是一些低空飞行器如无人机等。
近年来,随着科技的进步,我国无人机行业也在迅速地发展,无人机以及一些低空飞行器的数量也逐年增加。
1ADS-B的发展概述ADS-B监测具有自动广播功能,全面盲杀报告,有效监测真空自我,有效扩大驾驶员视力,并根据观点有益地执行指导方针。
国内外进行的大量研究表明,该技术在通用和市政航空及交通领域特别有效,在国际民用航空领域得到广泛应用,是近年来ADS-B发展的重要动力。
ADS-B在国外的应用。
ADS-B技术的重要性近年来在许多国家和地区稳步提高,提供了强有力的支持,并与自身充分集成,以推进ADS-B技术的引进,为ADS-B制定成熟的发展战略。
2000年,ADS-B技术受到美国联邦航空局的测试,2001年,西阿拉斯加被指定为“Class-Radar”空中交通管制。
ADS-B技术发展的第一阶段,对墨西哥湾和阿拉斯加所有雷达系统实施ADS-B技术控制。
该技术的第二开发阶段采用ADS-B技术,以保持终端区域的空白,提供精确的信道监测服务和辅助监测服务,为第三开发阶段的海路管理技术服务。
ads-b-中国民航应用实例。
今天,我们东部的许多航空公司都配备了几个雷达设施,但西部的信号并不完全,一些地区缺乏雷达信号,主要是由于地形因素高、复杂,使得雷达系统的监测变得困难,维护成本高。
基于ADS-B技术实际运行的硬件条件,我国有针对性地为众多系统制定了规则,为ADS-B技术的应用奠定了良好的基础,为空中交通管制的发展创造了新的机会。
环境监测中的数据融合与分析方法综述

环境监测中的数据融合与分析方法综述一、引言随着环境污染问题的日益突出,环境监测成为了一项重要的任务。
而环境监测的核心是对数据进行收集、融合和分析,以获取对环境质量的准确评估和预测。
本文将综述环境监测中常用的数据融合与分析方法,为环境监测工作提供指导。
二、数据融合方法1. 传统方法传统的数据融合方法主要包括平均法、加权法和最大法。
平均法简单地将不同传感器获取的数据进行平均,但忽略了传感器的差异性。
加权法通过为不同传感器赋予权重,根据其精确性进行加权平均,能更好地考虑传感器的差异性。
最大法则假设不同传感器读数之间的最大值是最接近真实情况的,因此将最大值作为最终的融合结果。
2. 模型法模型法是基于数学模型的数据融合方法。
一些统计模型,如贝叶斯理论、卡尔曼滤波器等,被广泛运用于环境监测中的数据融合。
贝叶斯理论通过将先验知识和观测数据相结合,得出后验概率,从而进行数据融合。
卡尔曼滤波器则基于状态空间模型和观测方程,通过迭代的方式估计最优状态值。
3. 人工智能方法近年来,人工智能方法在数据融合中逐渐得到应用。
神经网络、支持向量机和遗传算法等方法被用于数据融合过程中的模式识别和分类。
这些方法能够有效地处理高维数据,并具有自适应和学习能力。
三、数据分析方法1. 描述统计分析描述统计分析是对环境监测数据进行常规的统计分析。
通过计算数据的均值、方差、标准差和百分位数等指标,可以揭示数据的分布和变化情况。
此外,箱线图、直方图和散点图等图形工具也可以用于对数据的可视化分析。
2. 时空分析时空分析是通过对环境监测数据进行时间和空间的分析,揭示数据在时序和空间上的特征和变化规律。
时间序列分析可以用于预测未来环境污染趋势,而空间插值方法则能够对不连续监测站点的数据进行推测,从而建立全局的环境质量模型。
3. 数据挖掘数据挖掘可以挖掘数据中的隐藏规律和关联性,为环境监测提供更深入的认识和分析。
聚类分析、关联规则挖掘和分类分析等方法可以用于发现数据中存在的群组、关联关系和隐含模式。
生态环境监测中的数据融合方法使用方法

生态环境监测中的数据融合方法使用方法随着环境污染问题日益凸显,对生态环境进行监测和评估已成为保护生态系统健康的重要手段。
然而,生态环境监测所涉及的数据种类繁多,包括遥感数据、地理信息系统数据、环境监测数据等,这些数据往往来自于不同的传感器、设备和监测平台,因此如何将各种数据进行有效融合,更好地揭示环境变化的趋势和特征,成为了当前生态环境监测中的重要问题。
数据融合是指将多源、多时空的数据结合起来,通过使用适当的方法和技术,生成一组具有更高精确度、更全面信息的数据。
在生态环境监测中,数据融合可以提高监测结果的准确性,解决数据不连续性和不完整性的问题,提供更全面的环境信息,为环境保护和决策提供科学依据。
下面,我们将介绍一些常用的生态环境监测数据融合方法及其使用方法。
1. 加权平均法加权平均法是最简单直接的数据融合方法之一。
该方法将不同数据源的数据根据其可靠性和权重进行加权平均。
可靠性较高的数据将以较大的权重参与融合过程,而可靠性较低的数据则以较小的权重参与融合过程。
数据融合后的结果为不同数据源的加权平均值。
使用加权平均法进行融合时,首先需要对数据源的可靠性进行评估,确定权重分配。
常用的评估方法包括误差分析、相关性分析等。
然后,根据权重进行加权平均计算,得到融合后的数据。
具体计算公式为:融合数据 = (权重1 * 数据1 + 权重2 * 数据2 + … + 权重n * 数据n) / (权重1 + 权重2 + … + 权重n)2. 主成分分析法主成分分析法是一种基于统计学原理的数据融合方法。
该方法通过分析数据之间的相关性,将原始数据转化为一组相互独立的主成分,从而达到降维和去除冗余信息的目的。
使用主成分分析法进行融合时,首先需要将不同数据源的数据进行预处理,包括去除噪声、标准化等。
然后,进行主成分分析,得到一组主成分。
根据主成分的权重和系数,对原始数据进行加权和线性组合,从而得到融合后的数据。
3. 支持向量机法支持向量机法是一种基于机器学习的数据融合方法。
基于时空相关性的LSTM算法及PM_(2.5)浓度预测应用

第38卷第6期 计算机应用与软件Vol 38No.62021年6月 ComputerApplicationsandSoftwareJun.2021基于时空相关性的LSTM算法及PM2.5浓度预测应用赵彦明(河北民族师范学院数学与计算机科学学院 河北承德067000)收稿日期:2019-09-12。
河北省社科基金项目(HB18TJ004)。
赵彦明,副教授,主研领域:脑计算理论,图像分析,生物特征识别。
摘 要 现阶段空气污染物粒子浓度演进过程模拟与预测算法忽视了粒子浓度的空间相关性,且没有实现粒子浓度的时间依赖性与空间相关性融合。
对此,提出基于时空相关性的LSTM算法(TS_LSTM)并应用于PM2.5浓度预测。
该算法提出空间相关性及其相关因子计算方法;将局部区域相关性因子与LSTM算法的遗忘门和记忆门融合,建立基于局部地理信息的LSTM算法(LTS_LSTM);融合LTS_LSTM算法学习结果与全局空间相关性因子,构造基于全局地理信息时空相关的LSTM算法(GTS_LSTM)。
模拟全局与局部的空气污染物粒子浓度演进过程,并实现离子浓度预测。
在全局与局部数据集上,将该算法与回归算法、支持向量机、模糊神经网络、LSTM神经网络、GC LSTM神经网络、DL LSTM神经网络比较研究,结果表明:在空气粒子浓度预测上,该算法的预测性能优于各种传统预测算法,接近深度LSTM算法。
关键词 长短时记忆网络 空气污染物浓度预测 循环神经网络 时空相关性 PM2.5中图分类号 TP3 文献标志码 A DOI:10.3969/j.issn.1000 386x.2021.06.040LSTMALGORITHMBASEDONSPATIO TEMPORALCORRELATIONANDITSAPPLICATIONOFPM2.5CONCENTRATIONPREDICTIONZhaoYanming(SchoolofMathematicsandComputerScience,HebeiNormalUniversityforNationalities,Chengde067000,Hebei,China)Abstract Atpresent,thesimulationandpredictionalgorithmoftheevolutionprocessofairpollutantparticleconcentrationignoresthespatialcorrelationofparticleconcentration,anddoesnotrealizethefusionoftime dependentandspatialcorrelationofparticleconcentration.Basedonthis,aLSTMalgorithmbasedonspatio temporalcorrelation(TS_LSTM)anditsapplicationofPM2.5concentrationpredictionisproposed.Itproposedthecalculationmethodofcorrelationfactor;thefactoroflocalspatialinformationcorrelationwasfusedwithforgettinggateandmemorygateofLSTMalgorithmtoestablishtheLSTMalgorithmofthelocalgeographicinformation(LTS_LSTM);thealgorithmfusedthelearningresultofLTS_LSTMalgorithmwiththeglobalspatialcorrelationfactortoestablishaglobalspatio temporalcorrelationLSTMalgorithm(GTS_LSTM).Itsimulatedglobalandlocalevolutionprocessofairpollutantparticleconcentration,andrealizedionconcentrationprediction.Onthelocalandglobaldataset,thisalgorithmiscomparedwithregressionalgorithm,supportvectormachine,fuzzyneuralnetwork,LSTMneuralnetwork,GC LSTMneuralnetworkandDL LSTMneuralnetwork.Theresultsshowthat:intheairparticleconcentrationprediction,thepredictionperformanceofthisalgorithmisbetterthanvarioustraditionalpredictionalgorithms,closetothedepthLSTMalgorithm.Keywords LSTM Predictionofairpollutantconcentration Recurrentneuralnetwork Spatio temporalcorrelation PM2.5250 计算机应用与软件2021年0 引 言空气污染物对人类健康的威胁与日俱增。
基于CNN-LSTM和气象要素关联的气温时空预测

基于CNN-LSTM和气象要素关联的气温时空预测基于CNN-LSTM和气象要素关联的气温时空预测近年来,随着气候变化和全球气温上升的问题日益引起关注,准确的气温预测变得尤为重要。
气温的时空预测是气象预测领域的一个关键问题,对于农业、能源、水资源管理等领域具有重要意义。
传统的气温预测模型主要依赖于统计方法和气象观测数据,但这些模型往往无法准确捕捉气象系统的复杂动态过程。
基于深度学习的方法在气象预测领域取得了显著的进展。
卷积神经网络(CNN)和长短期记忆网络(LSTM)是两种主要应用于时间序列数据处理的深度学习模型,它们在图像和自然语言处理等领域已经证明了其优越性能。
在气温时空预测中,CNN-LSTM模型通过融合空间特征和时间序列特征,可以更好地捕捉各个地区气温的时空关联。
首先,CNN-LSTM模型通过卷积层提取输入数据的空间特征。
对于气象数据而言,每个地区的气温受到周边地区气候要素的影响,例如地理位置、海洋温度、地形等。
CNN可以有效地从输入数据中提取这些空间特征,帮助模型理解地区间的关联性。
接着,LSTM模型通过循环神经网络架构处理输入数据的时间序列特征。
气温具有很强的时序性,在相邻时间点上存在一定的关联性。
LSTM通过引入记忆单元和遗忘门等机制,可以有效地处理和记忆时间序列信息,从而更准确地预测未来气温。
在CNN-LSTM模型中,空间特征和时间序列特征被融合在一起,通过多层神经网络进行训练和预测。
模型通过反向传播算法优化参数,不断提高模型的预测准确性。
除了CNN-LSTM模型本身,气象要素关联也是气温时空预测的重要因素。
气象要素包括大气压力、湿度、降水等,它们与气温之间存在着一定的关联关系。
通过分析和挖掘这些气象要素之间的关联,可以进一步提高气温预测的准确性。
基于CNN-LSTM和气象要素关联的气温时空预测方法可以应用于多个场景。
例如,在农业领域,准确的气温预测可以帮助农民合理安排种植时间和农作物品种选择,提高农业生产效益。
数据融合方法
数据融合方法数据融合是一种将不同来源的数据整合在一起的方法,旨在从多个维度对数据进行分析,产生更准确、更全面的结论。
数据融合方法可以应用于各种领域,如天文学、气象学、地球科学、社会科学等。
本文将对数据融合方法进行探讨,并介绍几种常见的数据融合方法。
1. 基于模型的数据融合方法这种方法旨在使用已知模型来整合数据,使得它们更加准确。
在这种方法中,模型可以是物理模型、数学模型或统计模型。
基于模型的数据融合方法通常需要先进行模型校准,然后将数据传递给模型进行预测。
模型结果可以被认为是旧数据的一个函数,以生成更准确的新数据。
这种方法旨在使用统计分析来整合数据,以产生更精确的结果。
在这种方法中,通过分析和对比不同来源的数据来获取信息,从而定量估计测量误差。
这种方法通常使用卡尔曼滤波、贝叶斯网络等统计分析方法。
二、数据融合方法的几种常见形式1. 图像融合图像融合是将两幅或多幅图像组合在一起创造出一个完整的、更清晰的图像。
此方法通常使用多张不同波长的卫星图像,以产生更精确的图像。
常见的图像融合方法包括PAN-sharpening、多波段、优化融合等。
2. 空间数据融合空间融合是将来自不同观测平台(例如卫星、飞机、地面观测点等)的数据集成在一起,形成空间数据立体结构。
这种方法可以有效地提高对空间数据的理解和分析。
通常使用的方法有网格插值、空间协方差函数、克里金插值等。
时间数据融合是对来自不同时段的数据进行整合,以提高数据的时空分辨率和精度。
这种方法通常使用循环卡尔曼滤波、核素浓度模型、基于历史温度资料的时间插值等方法。
数据融合框架是将多个数据源进行整合的过程,通过应用一系列算法来生成更准确、更可靠的数据。
这种方法通常使用的方法有迁移学习、深度神经网络等。
三、数据融合的优势和应用领域数据融合的优势是可以将不同来源的信息进行处理和结合,从而产生更准确、更全面的分析结果。
它可以帮助科学家、工程师和决策者更好地理解数据集,并做出更好的决策。
多平台多传感器多源信息融合系统时空配准及性能评估研究
多平台多传感器多源信息融合系统时空配准及性能评估研究1. 本文概述随着信息技术的飞速发展,多平台多传感器多源信息融合技术在众多领域,如军事侦察、环境监测、智能交通等,发挥着越来越重要的作用。
该技术通过整合来自不同平台、不同类型传感器以及多种信息源的数据,以提高信息处理的准确性和效率。
由于各种传感器在时空上的差异,如何有效地进行时空配准成为该领域研究的重点和难点。
本文旨在探讨多平台多传感器多源信息融合系统中的时空配准方法,并对不同方法的性能进行评估。
本文首先介绍了时空配准的基本概念及其在多源信息融合系统中的重要性。
随后,详细分析了目前常用的时空配准技术,包括基于滤波器的方法、基于图论的方法以及基于深度学习的方法。
进一步,本文对这些方法的优缺点进行了比较分析,并提出了改进建议。
本文通过仿真实验评估了这些方法的性能,为实际应用中的时空配准技术选择提供了参考依据。
本文的研究成果不仅有助于深化对多平台多传感器多源信息融合系统中时空配准技术的理解,而且对于推动相关领域的技术进步具有积极意义。
2. 相关理论与技术基础多平台多传感器信息融合理论是本研究的核心,其基础是信息融合的层次模型。
该模型通常包括三个层次:数据层融合、特征层融合和决策层融合。
数据层融合直接在原始数据上进行,不涉及数据解释,其优点在于保留了尽可能多的原始信息,但计算量较大。
特征层融合则是在提取特征后进行,减少了数据量,提高了处理速度,但可能会丢失部分信息。
决策层融合是在各个传感器独立做出决策后进行,其优点在于灵活性和鲁棒性较强,但要求各传感器具有高度的决策一致性。
时空配准是多源信息融合的关键技术之一,其目的是将来自不同时间和空间的信息进行对齐,以便进行有效融合。
时空配准主要包括时间配准和空间配准两个方面。
时间配准解决的是不同传感器数据在时间上的不一致问题,常用的方法有时间延迟补偿、插值等。
空间配准则是解决数据在空间上的不一致问题,常用的方法有坐标变换、投影变换等。
时空数据的集成与融合方案
时空数据的集成与融合方案时空数据的集成与融合方案时空数据的集成与融合是指将不同来源、不同格式的时空数据整合在一起,形成一种综合性的数据资源,以便更好地支持地理信息系统(GIS)的应用和决策支持。
该方案涉及到数据的采集、处理、存储、分析和展示等环节,需要综合运用多种技术手段和方法。
首先,在时空数据集成与融合方案中,合理的数据采集是基础。
不同来源的时空数据通常具有不同的格式和结构,因此需要通过合适的采集设备和技术手段来获取数据。
例如,可以使用无人机、卫星遥感、传感器等设备进行数据采集,获取地表高程、遥感影像、气象数据等多种时空信息。
其次,在数据处理和存储方面,需要开展数据清洗、格式转换、数据融合等工作。
由于时空数据的多样性和复杂性,数据的质量和一致性往往成为集成与融合的难点。
因此,需要对数据进行清洗,去除重复、缺失和错误的数据,保证数据的准确性和完整性。
同时,还需要进行格式转换,将不同来源、不同格式的数据统一为一种格式,以便进行后续的数据融合和分析。
此外,还可以借助数据库等技术手段,对数据进行存储和管理,提高数据的访问效率和安全性。
然后,在数据分析方面,可以利用时空数据的集成与融合来进行空间分析和时序分析。
通过将不同来源的数据进行融合,可以获取更全面、更细致的地理信息,帮助用户了解地理现象的时空变化规律。
例如,可以通过融合遥感影像和地面观测数据,对土地利用、植被覆盖等进行监测和分析;可以通过融合气象数据和人口数据,对气候变化对人口迁移和社会经济发展的影响进行研究。
此外,还可以利用时空数据的集成与融合,进行模型构建和预测分析,为决策者提供科学依据。
最后,在数据展示方面,可以通过地图、图表、动画等形式,将时空数据以直观、可视化的方式呈现出来。
这样可以帮助用户更好地理解和利用数据,提高决策的准确性和效率。
例如,可以利用地图软件,将不同时间段的遥感影像进行叠加,形成地表覆盖的时序变化图;可以利用图表工具,将不同地点的气象数据进行比较,揭示地理区域的气候特征。
地理国情监测复习资料
...wd...第0章绪论1、国情:是一个国家的社会性质、政治、经济、文化等方面的根本情况和特点。
2、地理国情:是空间化、可视化的国情信息,是从地理空间角度分析、研究、描述和反映一个国家自然、经济、人文的国情信息。
3、监测:是对事物动态变化的监管和检测。
4、地理国情监测:是对地理相关的国情进展动态测绘、统计和分析研究。
〔概念本质:是地理监测在国家尺度上的一种变化监测〕5、地理国情监测的数据特点:海量性、多维性、异构性、多源性〔位置、属性和时间〕6、监测的最终目的:获取事物的动态变化信息并分析变化信息的合理性7、地理国情监测的特点:系统集成性、动态变化性、主动服务性、准确可靠性、过程完整性。
8、地理国情监测技术开展趋势:随着数据获取技术、数据分析方法、数据表达方法等开展,向着更快、更好的方向开展。
技术集成开展、数据源的多样性、更科学的时效性监测、监测成果的共享服务、更先进的监测设备、多部门协同监测。
9、地理国情监测的内容及过程内容:土地资源调查与监测、环境调查与监测、农情监测、森林和湿地监测、灾害动态监测、水文监测、海洋监测、矿产资源调查与监测气象监测10、地理国情监测系统的功能:国情信息普查、地理国情动态监测信息系统、综合分析与决策建模。
11、地理国情监测活动涉及的关键核心技术:遥感技术〔偏重空间位置的现状、变化数据的获取〕;GIS技术〔时空数据管理、数据的分析、信息共享等〕;地理和社会经济调查与地理编码技术〔偏重属性数据的获取、属性数据的空间化技术等〕第1章地理国情普查1、地理国情普查:是一项重大的国情国力调查,是全面获取地理国情信息的重要手段,是掌握地表自然、生态以及人类活动根本情况的根基性工作。
2、地理国情普查的内容:地形地貌普查、地表覆盖普查、地理单元普查。
3、地理国情普查的对象〔范围〕:地表自然要素〔地形地貌、植被覆盖、水域、荒漠与裸露地等〕人文地理要素〔与人类活动密切相关的交通网络、居民地与设施、地理单元等〕4、地理国情普查的目标:查清我国地表自然和人文地理要素的现状和空间分布情况,为开展常态化地理国情监测奠定根基,满足经济社会开展和生态文明建设的需求,提高地理国情信息对政府、企业和公众的服务能力。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
引
言
随着空间数据采集和处理能力的增强,空间数 据库在遥感、地理信息系统、医疗影像、交通控制和
环境监测等方面得到广泛的应用.由于空间信息系 统只能存储最近的静态信息,使系统的动态性和推 理机制受到限制,因而能够保存历史数据的时空信 息系统得到了迅速的发展.时空信息系统的发展推 动了时空数据挖掘技术的研究,使数据挖掘的研究
forecasts mixed data sequence using spatio—temporal auto—regressive model, and finally integrates the individual time sequence forecast,spatial forecast and spatio—temporal forecast through linear regression to
deliver the final result.The approach was successfully used in the forecasting of railway曲ssenger flow in
an attempt to overcome the limitations of traditional railway passenger flow forecasting methods. The experimental result shows the effectiveness of the approach.
2基于双融合的时空综合预测算法
2.1时空综合预测模型结构 时空综合预测是指对具有时间和空间两种属性
的数据变化趋势针对不同数据特征采用不同方法进 行建模.
算法的基本思想是采用信息性原理和外推预测 法,从历史数据中挖掘未来状态信息.
算法的核心是时空综合,即考虑目标对象本身j 又考虑相邻对象的影响.
算法的策略是双融合策略,即首先是数据的融 合,其次是方法的融合.数据的融合是指全面利用 横截面和纵截面等动态和静态数据,既使用变量本 身过去的变化,也使用变量与其他变量之间的静态 关系来预测未来.方法的融合是针对不同数据序列 特点使用不同方法,比如对目标对象的时间序列采 用时间序列分析方法,这样可不需假定只受前一时 刻的影响;对相邻对象的空间影响用神经网络求解, 这样则不用计算距离矩阵;对两者的混合数据序列, 采用时空自回归模型,这样可使时间和空间结合更 紧密,强调了时空的连动性,然后将单独的时间预 测、空间预测和时空预测有效地融合在一起,产生最 后的时空综合预测结果.时空综合预测模型结构如 图1所示:
Key words spatio—temporaI forecasting;spatio—temporal data mining;fusion;passenger flow forecasting
摘要 时空数据挖掘是数据挖掘中的重要研究内容,其中时空预测的应用领域最为广泛.针对目前时 空预测方法中的不足,提出了一种基于数据融合和方法融合的时空综合预测算法.该方法首先采用统 计学原理对目标对象本身的时序进行预测;然后通过神经网络解算相邻对象的空间影响,继而对混合数 据序列使用时空自回归预测模型;最后使用线性回归将单个的时间预测、空间预测和时空预测有效地融 合在一起,得到综合预测结果.应用该方法预测铁路客流,突破了传统铁路客流预测方法的局限,实验 结果表明了算法的有效性.
际值,R一。是£一1时刻的预测值,口是平滑系数,它 在[0,1]区间内取值.如果是具有明显周期波动的 数据序列,可使用乘积季节自回归求和移动平均模
型(MSARIMA)【划:
西P(B5)声。(B)(1一B)4(1一B5)哩。=
口。(B)@Q(B5)a。,
(3)
其中,B是后移算子;D是季节差分;d是非季节差 分;s是季节周期;垂,(B5)是季节多项式自回归;
较小的时间复杂度[1 0|.这里,我们将序列相关模型扩
展为滞后残差时空白回归模型,使模型中的残差包含 目标样本和空间近邻的残差.模型可描述如下:
yr,i=y。(x£,。)+“f,i,f=1,…,行,
,,、
气
收稿日期:2004 ll 29;修回日期:2005—04—25 基金项目:国家自然科学基金项目(60332020)
万方数据
计算机研究与发展2005,42(7)
对象从一般的事务型数据库、空间数据库,扩展到时 空数据库.实际上,很多应用领域在问题求解过程 中越来越需要同时考虑时间因素和空间因素,例如 交通管理、环境监测,地震救援等.
(xuwe妇zy@sohu.com)
An Integrated Spatio-Temporal Forecasting ApprOach Based on Data Fusion and MethOd FusiOn
Xu Weil,Huang Houkuanl,and Wang Yin西ie2
1(&^00Z o,CD聊加£Pr n行d J挖如r卅nfio押%^"oZq纠,&巧i行g Ji∞幻理g‰i傀玲泐,&巧i行g 100044) 2(j起盯i£“据o,C0埘加fi玎g Tk^舢Z9到,吼i行口A∞如my盯Rniz伽y Sfi硎伽,&巧i竹g 100081)
且空间关系并不是由空间距离单独决定的.为了计
算出稳定、可靠的空间关系,可以采用人工神经网络 来学习隐含的模式和关系.神经网络输出节点权值 的变化表示如下:
△叫ii=叩(£7一o 7)o7(1一o 7)z“,
(4)
式(4)中,o,为计算输出,f,为实际输出.用.厂3(£)和
厂4(£)作为输入训练样本,用厂。(f)和^(£)作为输
型l罄黑
IntegratiVe Spatio·1劬poral
F0recast Linear Regression
f洫e口嘶e
Fig.1 The fOrecasting algo“thm based on the integration of spatial and temporal data.
图1 基于双融合的时空综合预测方法
Data Sequence attheNearlv
^(f),以(f).
^(f),^(f),
Continuous
正(f),^(f). AutO—Regres
一一删一一一
Time,பைடு நூலகம்【f) MSARIMA Result:石2
TempOral FOrecast
BP Network
Result:^
Sive Model Result:矗
近邻数据形成的序列;鸽(£)(J=1,…,咒)为目标的咒
个相邻对象的历史同期数据形成的序列;忍(£)为目 标的相邻对象的连续时间近邻数据形成的序列;£。 为序列的起始时刻;£。为序列的终止时刻.
不同的数据序列分布会有所不同,比如历史同 期序列相对比较平稳;而连续时间近邻数据序列可 能会有震荡.此外每个序列的长度会有所不同.
时空数据挖掘中一个重要的任务是时空预测,时 空预测是在掌握相关信息的基础上,运用经济学、统 计学、地理学、神经网络等定性定量方法以及引入时 间和空间两方面因素后的扩展方法,研究具有时空特 征的事物的未来发展趋势及运行规律.目前的时空预 测研究主要是针对具体问题的应用研究,比如1990 年Phillip讨论了旅馆的选择问题;1997年Cressie 等人对家畜垃圾进行追踪;1998年Kelly等人使用 了加入邻接矩阵的时空自回归方法在住宅定价时考 虑了相邻房产价格的影响;2000年Jothityangk∞n 等人对降雨的时空分布模型做了测试,采用隐马尔 可夫模型模拟了每月的降雨量;2001年Pokrajac等 人在序列相关模型中加入了近邻的残差,完成了农 作物产量的估计.在交通运输领域,Yamashita等人 提出城市交通分析的战略规划模型,该模型使用神 经网络及时空算法预测城市居民出行需求;斐玉龙 等人用神经网络对城市路网节点的短时段交通量进 行了预测等等11 ̄8j.
Abstract Spatio—temporal data mining is an important research topic in data mining,and in which spatio— temporal forecasting is the most widely used.In order to overcome the limitations of current spatio—temporal forecasting methods, this paper proposes a spatio—temporal forecasting approach based on data fusion and
出训练样本,将目标对象o。的空间预测表示为厂。. 2.3.3时空自回归预测
时空自回归模型实现的一种策略是对空间自回 归模型一般化,即将模型中的空间距离矩阵扩展为 时空加权矩阵.假定每个训练数据样本依赖一定数 量的空间近邻(不考虑时间)和一定数量的时间近邻
(不考虑空间),则时空加权矩阵就是时间加权矩阵 和空间加权矩阵的矩阵乘.还有一种方法是时间自 回归模型的一般化,即在模型中加入空间关系,得到 时空白回归模型.第2种方法可以不用进行复杂的 矩阵乘运算,不用对空间属性进行自回归,所以具有
method fusion. The approach first forecasts time sequence of the target object itself with statistical principles and computes influences of neighboring objects employing neural network technique, then
上述这些应用研究采用的方法丰富多样,但研 究手段都是基于时间和空间结合的策略.他们的主 要问题是:如果以时间序列预测为主,从空间上只能 考虑到最近邻的影响;如果以空间预测为主,从时间 上则只能考虑最近时刻的影响.对此,本文提出了 基于数据和方法两方面融合的时空综合预测算法, 该方法利用了数据的多种特征,并针对不同数据序 列采用不同的方法,而且使时空影响同时被综合考 虑,通过铁路客流真实数据验证.结果表明,对具有 时空特征的数据,时空综合预测算法明显优于传统 的预测方法.