多源空间数据集成方法探讨

多源空间数据集成方法探讨
多源空间数据集成方法探讨

第34卷增刊

2009年4月

测绘科学

S c i e n c e o f S u r v e y i n g a n dM a p p i n g

V o l .34S u p p l

2009.

作者简介:尹晓慧(1984-),女,硕士研究生,主要研究方向:人文地理学。E -m a i l :Y X H 840116@163.c o m 收稿日期:2008-09-16

多源空间数据集成方法探讨

尹晓慧

①③

,宋庆斌②,王利伟

(①解放军信息工程大学测绘学院,郑州 450052;②解放军 61363部队四室,

西安 710054;③海军出版社二室,天津塘沽 300450)

【摘 要】随着G I S 应用的深入,对空间数据的需求越来越大,为了充分利用G I S 软件强大的空间分析查询功能,需

要将多种来源多种格式的空间数据集成管理。本文介绍了空间数据多源异构特性及目前的三种集成模式,并对基于地理标记语言G M L 的空间数据集成模型进行了探讨。【关键词】G M L ;空间数据;数据集成【中图分类号】P 208 【文献标识码】A 【文章编号】1009-2307(2009)07-0059-03

1 引言

不同的G I S 应用部门在同一地区、同一比例尺的空间数据往往采用不同的数据源(外业实地测量、航空摄影图像、卫星图像、地形图、海图、航空图和各种各样地图)、不同的空间数据标准、不同的的数据模型及空间物体分类分级体系进行重复采集。这不仅造成了人力、财力的巨大浪费,还引发了空间数据的多语义性、多时空性、多尺度性、存储格式的不同以及数据模型与存储结构的差异等,给G I S 部门之间的数据共享和数据集成带来极大困难[1]。数据集成是数据仓库工程中很重要的部分,是将多个数据源中的数据结合起来存放在一个一致的数据存储之中,在这里就是指数据仓库,我们在数据集成的时候必须将高质量的数据集成到数据仓库平台中。多源地理空间矢量数据集成是把不同来源、格式、比例尺、多投影方式或大地坐标系统的地理空间数据在逻辑上或物理上的有机集中,从而实现地理信息的共享。

2 空间数据的多源异构特性

G I S 作为空间数据的有效管理工具,面临着不同来源不

同数据组织形式的空间信息。这些数据由于来源广,范围大,往往呈现出较大的差异,主要表现在以下三方面[2]:

1)数据内容与来源的差异性

目前空间数据主要类型有三种:①地图数据:可能是扫描后以栅格形式存在或者经过输入设备矢量化后以矢量的形式存在,也可能是直接通过数字测量设备以数字的形式存在的数据;②影像数据:目前的来源主要有航空摄影,卫星遥感等,这些数据一般都是以图像数据的形式存在,也就是说,一般都是以栅格数据的形式存放;③地形数据:这类数据一般用来描述地球表面起伏,存在的形式有等高线形式(这是一种传统的地形描述方式)、不规则三角网形式、格网形式、另外还可能有不规则三角网和格网的混和形式。

2)空间数据模型的差异性

不同的空间数据库在数据模型上可能存在着较大的差异,如有拓扑和无拓扑的数据模型,二维或三维的空间数据模型,时空数据模型等不同的空间数据库模型等。

3)支撑软件平台的差异性

由于不同的原因,空间数据库在建立的时候采用了不同的地理信息软件系统,这些系统往往都是封闭的,孤立的,没有统一的标准,各自采用不同的数据格式、数据存储处理方法,即使是相同类型的数据建立起来的空间数据库也不相同。

3 多源数据集成方式

目前,G I S 多格式空间数据的集成主要有以下三种模式[3]

:数据格式转化模式、数据互操作模式和直接数据访问模式。3.1 数据格式转化模式

目前在商业上,得到公认的几种重要的空间数据格式是由大的商业软件开发商或数据标准化组织负责提出明码数据交换格式,如A r c I n f o 的E 00,A u t o C A D 的D X F ,A r e V i e w 的S h a p e ,M a p I n f o 的M i f 格式等,用户自己编写相应的数据转换程序把其他格式的数据经过转换,变成本系统的数据格式,这是当前G I S 软件系统共享数据的主要方法。但是数据转换方式存在许多问题,主要表现在:①在数据相互转换的过程中,容易丢失信息,如空间要素的图形表达信息(线型、符号、颜色等);②数据更新和数据应用的不同步,数据转换的目的往往是为了数据应用的需求,而如果数据更新仍然采用和数据应用不同的空间数据管理平台,往往更新的是转换前的数据。更新后需要重新转换到应用G I S 平台的格式,造成更新和应用的不同步;③数据共享困难,如果数据需要共享给其他单位或部门,在使用不同的G I S 平台的情况下,数据还需要进行再转换,增加了数据共享的难度。3.2 数据互操作模式

数据互操作模式是O p e n G I S c o n s o r t i u m(O G C )制定的规范。O G C 是为了发展开放式地理数据系统、研究地学空间信息标准化以及处理方法的一个非盈利组织。G I S 互操作是指在异构数据库和分布计算的情况下,G I S 用户在相互理解的基础上,能透明地获取所需的信息。O G C 为数据互操作制定了统一的规范,从而使得一个系统同时支持不同的空间数据格式成为可能。但是数据互操作模式需要每种格式的宿主软件都按照统一的规范实现数据访问接口,在一定时期内还不现实;另外,但由于地理数据互用性规范技术比较新,技术资料有限,国内研究多停留在一般性介绍,深层次研究和开发工作还不够。3.3 直接数据访问模式

直接数据访问指在一个G I S 软件中实现对其他软件数据格式的直接访问、存取和空间分析,用户可以使用单个G I S 软件存取多种数据格式。其原理是利用空间数据引擎的方法实现多源数据的集成。直接数据访问不仅避免了繁琐的数据转换,而且在一个G I S 软件中访问某种软件的数据格式

测绘科学 第34卷

不要求用户拥有该数据格式的宿主软件,更不需要该软件运行。直接数据访问提供了一种更为经济实用的多源数据集成模式,但是构建成本较高。数据的更新和应用更为方便。但是,直接访问方式仍然存在许多问题:①首先,空间数据格式多种多样,不同的G I S 软件其数据组织不尽相同。很难有一种软件能够支持所有的空间数据格式的直接访问;②各个G I S 软件厂商由于考虑自身的利益,其原始的数据结构一般是不公开的,造成直接访问方式很难实现;③各种原始空间数据格式的数据结构都处于一种不断变化的过程中,这就造成在实现直接访问时的代价较高。

4 基于G ML 的空间数据集成

4.1 G ML 数据存储技术

G M L 是一种用于建模、传输和存储地理及与地理相关信息的X M L 编码语言,它包括了地理要素(F e a t u r e )与层(C o v e r -a g e )的空间与非空间特征。G M L 建立在W 3C 系列标准之上,以一种互联网上容易共享的方式来描述、表达地理信息,是第一个被G I S 界广泛接受的元标记语言。在这之前开发的各种用于存储和交换地理信息的文件格式或标准,由于缺少相应的支持工具,而没有被广泛接受。G M L 一个重要优势就是它能够让开发者或用户非常灵活地使用已被广泛接受的X M L 技术,它建立在X M L 、X M LS c h e m a 、X L i n k 和X P o i n t e r 基础之上。G M L 数据能够很容易地与非空间数据集成使用。G M L 使用X M L 对地理数据进行编码,为开发商和用户提供了一种开放的、中立于任何厂商的地理数据建模框架。使地理信息能够在不同领域、不同部门进行语义共享。4.2 基于G ML 的空间数据模型

O G C 的抽象规范(A b s t r a c t S p e c i f i c a t i o n )规定了G M L 是如何对现实世界进行描述的,G M L 使用地理要素(F e a t u r e )来描述地理世界。一个地理要素被定义为“从真实世界中提取出来的,与地球上的某一位置相关的事物”。要素的状态是由一系列的属性来定义的。每一个属性都是一个包括名称n a m e ,类型t y p e ,值v a l u e 的三元组。地理要素就是具有几何属性值的要素。因此,对整个真实世界的数字表示就可以认为是一系列的要素集合。按照O G C 的简单要素模型网,G M L 提供了以下几种类型的几何元素类型:P o i n t 、L i n e S -t r i n g 、L i n e a r R i n g 、P o l y g o n 、M u l t i P o i n t 、M u h i L i n e S t r i n g 、M u -h i P o l y g o n 、M u h i G e o m e t r y ,此外,还有元素对描述坐标,还有一个元素来定义范围。在G M L 中,任何一种几何类的实例的坐标都可用一系列包含元素的元素或者包含在一个元素的字符串来表示。使用元素的优

点在图1 G ML s c h e ma 关系图

于可以使得X M L 的解析器进行基本的类型检测,以及

对坐标对数目的约束。两

种方式都可以表达一维、二维或者三维的坐标。

G M L 由3个基本X M L S c h e m a 构成,其中,F e a t u r e .x s d 定义了抽象地理特征模型,g e o m e t r y .x s d 定义了具体的几何形状信息,x l i n k .x s d 定义了各种功能链接。图1概括了G M L 中3个S c h e m a 之间的关系。

G M L 是一个开放的框架结构,其中3个S c h e m a 相当于3个基类,通过对这3个基本S c h e m a 的继承和扩展,可以用自己定义的S c h e m a 来对地理实体数据进行编码,完成数据对象的建模。4.3 建立以格式转换为基础的数据集成模型

以s h a p e f i l e 为例。S h a p e 数据模型是E S R I 提供的一种矢量空间数据格式,具有以下特点:简单无拓扑关系;数据结构简捷;支持索引文件;直接存取;支持点、线、面要素和文字注记操作;支持索引文件和属性操作;包含一个自定义的数据字典,方便用户理解要素及其属性。

数据格式的转换分为读取S h a p e f i l e 主文件和生成G M L 文件两个步骤。

生成G M L 文件流程图[4]如下:图2 生成G ML 文件流程图S h a p e f i l e 文件中定义的多边形(P o l y -g o n )是G M L 中P o l y -g o n 和M u l t i P o l y g o n 的并集。由于S h a p e -f i l e 没有对其进行区分,在读取文件时,只是将它们一同存入P o l y g o n s 对象。但G M L 是将两者分开的,所以在写G M L 时,就要对其进行判断和区分。M u l t i —P o l y g o n 和P o l y g o n 的根本区别在于:M u l t i P o l y g o n 可以有多个外边界(外部环)和多个内边界(内部环),而P o l y g o n 只能有一个外边界和多个内边界。因此,区分M u l t i P o l y g o n 和P o l y g o n 的关键在于判断外边界的个数,要对所有环进行判断,确定其是外部环还是内部环。

从S h a p e f i l e 数据源经过转换程序生成G M L 文件是没有信息损失的,因为S h a p e f i l e 格式存储地物的几何类型比较简单,而且同一层只存储同一类地物,从S h a p e f i l e 到G M L 之间的映射关系没有造成源数据的信息损失。

表1 G ML 数据与S h a p e

数据的映射关系

G M L 数据S h a p e 数据P

o i n t P o i n t

M u l t i P o i n t M u l t i P o i n t

L

i n e S t r i n g (只有一个P a t h )P o l y L i n e

M u l t i L i n e S t r i n g (有多个P a t h )P o l y g o n (只有一个外环)

P o l y g o n

M u l t i P o l y g o n (有多个外环)5 总束语

随着I n t e m e t 的飞速发展,地理信息系统的广泛应用,积累了大量的G I S 数据资源。

由于各G I S 系统分别

采用不同的数据格式来存储矢量空间数据,为了更好的综合利用

这些数据,实现空间数据共享,进行空间数据

转换就成为了一条势在必行的途径。G M L 是专门为地理空间数据网络共享和转换所设计的一种数据规范,能描述不同复杂程度的数据,而且分离了数据的内容与表现数据的形式,因此我们采用G M L 制定的统一的空间数据模型描述来自不同数据源的矢量空间数据,从而实现多源空间数据的集成。

参考文献

[1]郭黎,崔铁军,等.多源空间数据融合技术探讨[J ].地

理信息世界,2007,(1).[2]于雪芹.基于G M L 的矢量空间数据转换方法及应用

研究[D ].武汉:武汉大学,2005.[3]姚敏,等.国土资源空间数据一体化的集成与管理[J ].

地球信息科学,2006,(2).[4]张竞,陆嵘,等.S h a p e f i l e 文件转换为G M L 文件的方法

[J ].地理与地理信息科学,2004,(1).[5]谭喜成,等.基于G M L 模式转换的异构空间数据集成

[J ].测绘信息与工程,2005,(4).[6]M i k e H o g a n .X M L :T h eF o u n d a t i o nf o r t h e F u t u r e .h t t p ://

w w w .x m l .o r g /x m l /x m l f o u n d a t i o n f u t u r e .s h t m l ,2007.[7]潘雨清,等.基于G M L 的地理空间数据模型[J ].江苏

大学学报(自然科学版),2002,(6).(下转第205页)

60

 增刊 胡永刚等 G P S 水准高程拟合模型在线状工程中的研究及应用表4 不同区域选取联测点的拟合结果比较(单位:m m )

名称选法一

选法二

多项式三次样条A k i m a 法多项式三次样条A k i m a 法最大值1615232146521469最小值

1418

-454

-3747

-10

-33

-216

表5 不同区域选取联测点的拟合精度比较(单位:m m )

名称选法一

选法二

多项式三次样条

A k i m a 法多项式三次样条A k i m a 法内符精度3020850165外符精度

24

165

1527

40

190

526

图6 选法二不同拟合方法拟合残差比较

从表4、表5与方案一、方案二对比可以看出,G P S 水准

联测点均匀分布在全线所拟合得到的结果精度最好,而G P S 水准联测点分布在线路的顶端两种选法拟合所得到的结果精度比较差,而且相差的比较大;从图5、图6可以直观看到两种选法拟合结果均只能控制测线的局部,在控制范围内的检核点和公共点残差就比较小,控制范围外的检核点和公共点残差就很大;因此在布设G P S 水准联测点时,

必须均匀分布在整个测线上。

6 结束语

本文以线状工程的G P S 水准高程为探讨对象,对线状工

程的几种拟合模型做了简单的介绍,然后通过具体实例对拟合结果从多方面进行了对比、分析和研究,得出以下结论:

1)应该根据测区现场具体情况以及数据收集情况综合加以考虑,只有拟合前选择合适的拟合函数,才能获得比较满意的精度和结果。

2)如果选点适当,拟合精度能达到厘米级。但这几种拟和方法又有所区别,多项式曲线拟合法计算较简单,适合已知点个数较少的情况,

3)长测线的拟合,三次样条曲线拟合法拟合精度要高于多项式曲线拟合,拟和精度可以满足一般工程的要求。A k i -m a 拟合法不稳定,边界处理不好,使拟合结果在边界出现很大的偏差,所以高程拟合中不易采用。

参考文献

[1]孔祥元,郭际明,刘宗泉.大地测量学基础[M ].武汉:

武汉大学出版社,2001-09.[2]覃锋.G P S 高程应用的关键在于精化大地水准面[J ].

测绘与空间地理信息,2006,(2):40-43.[3]朱紫阳,施一民,黄占邦.以G P S 水准点作为起闭点的

三角高程导线闭合差限差之讨论[J ].测绘通报,2006,(6):23-25.

[4]邸国辉,姜卫平.G P S 水准及其在测绘工程中的应用

[J ].地理空间信息,2006,(2):6-8.[5]裴亮,何孝莹,高荣贵,乔仰文.G P S 高程转换的拟合方

法及其实现[J ].矿山测量,2003,(4):1-4.[6]李征航,黄劲松.G P S 测量与数据处理[M ].武汉:武

汉大学出版社,2005-03.[7]于来法.用数值拟合法确定G P S 正常高的研究[J ].测

绘学报,1996,(2):90-94.[8]李庆扬,王能超,易大义.数值分析第四版[M ].北京:

清华大学出版社,2001-08.[9]聂桂根,万剑华.A k i m a 插值法在测量中的应用[J ].测

绘通报,1998,(3):31-34.

T h e r e s e a r c ha n da p p l i c a t i o no f G P Sl e v e l h e i g h t f i t t i n gm o d e l s i nl i n e a rp r o j e c t

A b s t r a c t :T h e c o o r d i n a t e s c a l l e d Zo f 3d i m e n s i o n c o o r d i n a t e s ,t h i s i s g e o d e t i c e l e v a t i o n ,c a n 't t a k e e f f e c t i n p r a c t i c e ,I t i s a v e r y a c t u a l a n d s i g n i f i c a n t t o p i c h o wt o m a k e e f f e c t i v e l y u s e o f G P S e l e v a t i o n i n f o r m a t i o n t o t r a n s f o r mg e o d e t i c e l e v a t i o n i n t o n o r m a l h e i g h t ,d i r e c t l y s e r v i c e p r o d u c t i o n ,r e a l i z e s a c q u i r e m e n t o f a p p l i e dG P S 3d i m e n s i o nc o o r d i n a t e s .t h e a r t i c l e d i s c u s s e s t h e m e t h o d o f a n a l y t i c s o f l o n ga n d n a r r o wr e g i o na n dc o m b i n e s t h e o r y w i t hp r a c t i c e ,a n ds u m s u pd i s a d v a n t a g ea n da d v a n t a g e o f d i v e r s i f i e df i t t i n g m o d e l s ,t h e ng i v e s s o m e r e a s o n a b l e s u g g e s t i o n .

K e yw o r d s :g l o b a l p o s i t i o n i n g s y s t e m ;g e o d e t i c e l e v a t i o n ;n o r m a l h e i g h t ;d e t e c t i o n o f o u t l i e r s f i t t i n gm o d e l s

H UY o n g -g a n g ①,W U W e n -b o ②,L I UL i -j u n ②

(①L i a o n i n gH u l u d a o 125000,C h i n a ;②L i a o n i n gT e c h n i c a l U n i v e r s i t y ,L i a o n i n g F u x i n 123000,C h i n a )

(上接第60页)

T h e s t u d yf o r i n t e g r a t i o no f Mu l t i -S o u r c e S p a t i a l D a t a

A b s t r a c t :W i t ht h e d e v e l o p m e n t o f G I S a p p l i c a t i o n ,t h e d e m a n d o f s p a t i a l d a t a b e c o m e s m o r e a n d m o r e u r g e n t .I n o r d e r t o m a k e u s e o f t h e p o w e r f u l s p a c i a l a n a l y t i c a l f u n c t i o n o f G I S ,w e s h o u l d i n t e g r a t e a n d m a n a g e M u l t i -S o u r c e S p a t i a l D a t a .T h i s p a p e r i n t r o d u c e s t h e c h a r a c t e r i s t i c o f t h e M u l t i -S o u r c e S p a t i a l D a t a ,a n d t h e a c t u a l 3k i n d s o f i n t e g r a t i o n m o d e s .T h e n ,i t d i s c u s s e s t h e m o d e o f I n t e g r a -t i o no f M u l t i -S o u r c e S p a t i a l D a t a b a s e do nG e o g r a p h y M a r k u pL a n g u a g e (G M L ).

K e yw o r d s :G M L ;s p a t i a l d a t a ;i n t e g r a t i o no f d a t a

Y I NX i a o -h u i ①③,S O N GQ i n g -b i n ②,W A N GL i -w e i ③

(①I n s t i t u t e o f S u r v e y i n g a n d M a p p i n g ,I n f o r m a t i o nE n g i n e e r i n g U n i v e r s i t y ,Z h e n g z h o u 450052,C h i n a ;②61363T r o o p s ,X i 'a n 710045,C h i n a ;③N a v y P r e s s ,T i a n j i n 300450,C h i n a )

205

相关文档
最新文档