gis数据标准

gis数据标准
gis数据标准

GIS数据的标准化与数据共享

范志坚1,2,方源敏1,汪虹 2

(1.昆明理工大学国土资源工程学院昆明 650093;2.云南省基础地理信息中心昆明 650034)

摘要:地理信息系统的核心是数据。数据的标准化是实现数据共享的关键,也是促进地理信息产业形成和发展的必要条件;数据共享是国家空间数据基础设施建设需要解决的核心问题,数据的标准化和数据共享是地理信息系统的关键技术。

关键词:GIS;数据的标准化;数据共享

Data standardization and Data sharing in GIS

Fan Zhi-jian1,2,Fang Yuan-min1,Wang-Hong2

(1.Faculty of Land Resources Engineering,Kunming University of Science and Technology,Kunming

650093,China;2.Yunnan Provincial Geomatics center,Kunming 650034,China) Abstract:The core of Geographic Information System is data.Data standardization is the key to

carry out data sharing and also is the necessary condition to promote formation and development of geographic information industry;data sharing is the core problem that National Spatial Data Infrastructure Construction needs to be resolved,data standardization and data sharing are the key technology of Geographic Information System.

Key words:GIS;data standardization;data sharing

0 前言

过去几年我国GIS在各种领域得到广泛应用。目前,我国已经建成大量的地理信息数据库,这些数据资源分散在各个部门和行业中。由于历史和机制的原因,各个部门基于各自的部门利益,不愿意对外共享数据;另外,由于不同的行业部门采用不同的GIS软件,各部门数据采集和管理的方法各不相同,同时,各部门在使用同一商业GIS软件时,又做了不同程度的二次开发,于是形成了许多独立、封闭的系统,对数据的共享造成了很大的障碍;再就是不同用户提供的数据可能来自不同的途径,其数据内容、数据格式和数据质量千差万别,因而给数据共享带来了很大困难,有时甚至会遇到数据格式不能转换或数据格式转换后丢失信息的棘手问题,严重地阻碍了数据在各部门和各软件系统中的流动与共享。造成上述现象的原因主要是由于缺乏数据的标准化,以至于数据资源难以共享与利用,导致重复投资和信息资源浪费。降低采集、处理数据的成本,促进数据的共享,已经成为各界的共识。随着“数字中国”、“数字省区”、“数字城市”的兴起,GIS 正走向社会化、大众化,并且融于主流的信息技术。国家有关部门正逐步将GIS 嵌入到电子政务系统中,使之成为信息社会和信息基础设施的重要组成部分。

1 数据的标准化

1.1 数据标准化的定义

数据标准是指数据的名称、代码、分类编码、数据类型、精度、单位、格式等的标准形式。数据标准的制定对于GIS的发展具有重要意义、但目前数据标准的研究仍然落后于GIS的发展。

数据的标准化是在数据应用实践中,对重复性事物和概念通过制定、发布和

实施标准,达到统一,以获得最佳秩序和社会效益。

数据标准化不但是一个系统与另一个系统实现数据共享的需要,而且是在一个系统内保持数据的连贯性、持续有效性的需要。GIS数据的标准化直接影响地理信息的共享,而地理信息共享又直接影响到GIS的经济效益和社会效益。数据共享的实现除了由国家颁布一定的法律规范来保障外,最需要的是要有统一的数据标准。数据标准的统一是实现数据共享的前提条件。在数据标准化建设还不是十分成熟的情况下,为了尽可能满足数据共享,在数据生产和数据库建设过程中应尽量满足GIS数据标准化所包含的基本内容。

1.2 数据标准化所包含的内容

(1) 统一的地理坐标系统:地理坐标系统又称数据参考系统或空间坐标系,具有公共地理定位基准是地理空间数据的主要特点。通过投影方式、地理坐标、网格坐标对数据进行定位,可使各种来源的地理信息和数据在统一的地理坐标系统上反映出它们的空间位置和四至关系特征。统一的地理坐标系统是各类地理信息收集、存储、检索、相互配准及进行综合分析评价的基础。所以说统一的地理坐标系统是保障数据共享的前提。

(2) 统一的分类编码:GIS数据必须有明确的分类体系和分类编码。只有将GIS数据按科学的规律进行分类和编码,使其有序地存入计算机,才能对它们进行存储、管理、检索分析、输出和交换等,从而实现信息标准化、数据资源共享等应用需求,并力求实现数据库的协调性、稳定性、高效性。分类过粗会影响将来分析的深度,分类过细则采集工作量太大,在计算机中的存储量也很大。分类编码应遵循科学性、系统性、实用性、统一性、完整性和可扩充性等原则,既要考虑数据本身的属性,又要顾及数据之间的相互关系,保证分类代码的稳定性和惟一性。

(3) 统一通用的数据交换格式标准:数据交换格式标准是规定数据交换时采用的数据记录格式,主要用于不同系统之间的数据交换。一个完善的数据交换标准必须能完成两项任务:一是能从源系统向目标系统实现数据的转换,尽管它们之间在数据模型、数据格式、数据结构和存储结构方面存在差别;二是能按一定方法转换空间数据,该方法要跨越两系统硬件结构之间的不同。GIS软件或数据并不是一次性的“消耗品”,也不是一个专题系统单独使用,而是可多次使用,相互共享。一般属性数据库仅有几种固定的数据类型,因此数据转换问题比较简单。但是空间数据与之不同,除了起说明作用的属性数据外,还有起定位作用的空间数据,因此数据共享比较复杂。但是总的原则是制定的数据交换格式应尽量简单实用,能独立于数据提供者和用户的数据格式、数据结构及软硬件环境,数据格式应便于修改、扩充和维护,便于同国内外重要的GIS软件数据格式进行交换,保证较强的通用性。在当前GIS软件数据格式较多的情况下,应制定一套稳定的数据交换格式标准,并将国家的基础空间数据面向成这一标准,逐步向各行业推广。

(4) 统一的数据采集技术规程:GIS数据库中涉及到多源数据集,它具有数据量大、数据种类繁多,空间定位数据和统计调查数据并存的特点。数据随时更新且有共享性、利于数据传输、交换等需求。根据空间数据库的目标和功能,要求数据库全面而准确地拥有尽可能多的有用数据。作业规程中对设备要求、作业步骤、质量控制、数据记录格式、数据库管理及产品验收都应作详细规定。所采集的数据应具有权威性、科学性和现势性的特点。

(5) 统一的数据质量标准

①数据质量标准:GIS数据质量标准是生产、使用和评价数据的依据,数据质量是数据整体性能的综合体现,对数据生产者和用户来说都是一个非常重要的参考因子,它可以使数据生产者正确描述他们的数据集符合生产规范的程度,也是用户决定数据集是否符合他们应用目的的依据。其内容包括:执行何规范及作业细则;数据情况说明;位置精度或精度评定;属性精度;时间精度;逻辑一致性;数据完整性;表达形式的合理性等。

②数据质量控制:由于生产部门数字化作业人员水平、数据生产所采用的各种数据源(地形图、各种遥感影像等)、航摄及解析仪器、数字化设备的精度不同,最终导致对GIS数据的精度和质量差异。另外,对地理特征的识别质量与作业人员的专业训练也有很大的关系。为了提高GIS数据的质量,需要对GIS数据质量进行控制。其内容包括:完整的技术方案;优化的工艺流程;严密的生产组织管理;各环节的质量评价及过程控制等。

(6) 统一的元数据标准:随着GIS数据共享的日益普遍,管理和访问大型数据集正成为数据生产者和用户面临的突出问题。数据生产者需要有效的数据管理、维护和发布办法,用户需要找到快捷、全面和有效的方法,以便发现、访问、获取和使用现势性强、精度高、易于管理和易于访问的GIS数据。在这种情况下,数据的内容、质量、状况等元数据信息变得更加重要,成为数据资源有效管理和应用的重要手段。数据生产者和用户都已认识到元数据的重要价值。其内容包括:基本识别信息;空间数据组织信息;空间参考信息;实体和属性信息;数据质量信息;数据来源信息;其他参考信息。

1.3 数据的标准化所面临的问题

首先,GIS数据的标准化仍受到传统地理学习惯的制约,存在专业定义与描述上的相悖,例如土壤分类、地貌分类、森林分类、土地利用分类等等,分类问题未形成兼顾交叉学科的标准体系,则制定数据标准也失去了基础。其次,GIS 数据面临的另一个重要问题是数据模型的不标准化。目前市场上流行的GIS商业软件数据模型是不统一的,例如ArcGIS,MapInfo,MapGIS以及GeoStar等。

2 数据共享

2.1 数据共享的定义

数据共享就是让不同行业、不同部门在不同地方使用不同计算机、不同软件的用户能够读取他人数据并进行各种操作运算和分析。数据共享的程度反映了一个地区、一个国家的信息发展水平,数据共享程度越高,信息发展水平越高。2.2 数据共享的解决方案

数据共享是现代信息社会的一个最基本的特点,是国家空间数据基础设施(National Spatial Data Infrastructure,简称NSDI)建设需要解决的核心问题,除了政策和行政协调方面需要解决的问题外,技术层面的共享上仍有大量的难题需要解决。但是由于不同的GIS软硬件平台、数据格式、数据标准、参考系统、数据的组织方法及学术、经济和立法的障碍等因素,实现数据的共享并非易事。尽管如此,目前还是有多种方法可以解决一般的数据共享问题,其中最简单的方法是通过数据转换技术来实现数据的共享,即不同的部门分别建立不同的系统,当要进行数据集成或综合应用时,先将数据进行格式转换转为本系统的内部数据格式再进行应用。但是这种数据共享方法是低级的,它是间接的延时共享,不是直接的实时共享。建立国家空间数据基础设施以及“数字中国”应该追求直接的实时的数据共享,就是说用户可以任意调入国家空间数据基础设施各系统的

数据,进行查询和分析,实现不同数据类型、不同系统之间的互操作。

目前,实现GIS数据共享大体上有三种方案:数据格式转换方案、数据直接访问方案和数据互操作方案。

(1) 数据格式转换:数据格式转换就是通过设计数据转换工具,将一种格式的数据转换为另外的一种格式。这种数据共享的实现方式又可分为两种情况:

①通过数据转换器转换:转换器是一个内部数据模型,通过对输入数据类型及值按照转换规则进行转换,得到指定的数据模型及值(如图1)。这种转换发生在两个数据文件之间,系统之间的数据转换是单向的,即转换后的数据b可能不能在系统A中使用。例如ArcGIS软件中的ArcToolbox模块,它的数据转换功能就是应用数据转换器方式转换数据格式。

图1通过数据转换器转换

②基于空间数据转换标准转换:采用空间数据的转换标准来实现GIS数据的转换,转换标准是一个大家都遵守,并且很全面的一系列规则。通过这个中间桥梁,将所有不同系统中的数据转换成统一的标准格式,供其它系统调用(如图2)。空间数据的转换标准必须能够表示现实世界实体的一系列属性和关系,同时它必须提供转换机制,以保证对这些属性和关系的描述结构不会改变,并能被接收者正确地调用。

系统A 系统B 系统…

空间数据转换标准

系统1 系统2 系统…

图2 基于空间数据转换标准转换

数据格式转换是传统GIS实现数据共享的主要方法,通过专门的数据转换程序把其他数据格式进行格式转换,复制到当前系统的数据库或文件中。当前由主要GIS软件厂商和组织提出并得到公认的空间数据转换格式有:ESRI的E00、AutoDESK的DXF等。这些格式各有特色,但由于缺乏对空间对象统一的描述方法,从而使得不同数据格式描述空间对象时采用的数据模型不同,因而转换后不能完全准确地表达源数据的信息,导致转换中源数据的信息有部分丢失。

(2) 数据直接访问:直接数据访问是指在一个GIS软件中实现对其他软件数据格式的直接访问,用户可以使用单个GIS软件存取多种数据格式。直接数据访问不仅避免了繁琐的数据转换,而且在一个GIS软件中访问某个软件的数据格式不要求用户拥有该数据格式的宿主软件,更不需要该软件运行。直接数据访问提供了一种更为经济实用的多源数据共享模式。

直接数据访问同样要建立在对要访问的数据格式的充分了解的基础上,如果要访问的数据格式不公开,就非破译该格式不可,还要保证破译完全正确,这样才能真正与该格式的宿主软件实现数据共享。如果宿主软件数据格式发生变化,各数据集成软件不得不重新研究该宿主软件数据格式,提供升级版本,而宿主软件的数据格式发生变化时往往不对外声明,这样其他数据集成软件对基于这种GIS软件数据格式的数据处理必定存在滞后性。目前ESRI的ArcGIS软件已能通

过数据直接访问方式调用多种数据格式。

(3) 数据互操作:互操作是指异构环境下两个或两个以上的实体,尽管它们实现的语言、执行的环境和基于的模型不同,但它们可以相互通讯和协作,以完成某一特定任务。这些实体包括应用程序、对象、系统运行环境等。互操作是一个信息系统的各构件的自由的组合及匹配,而不是全面成功的折中方案。

数据转换方法仅仅是从数据角度考虑互操作,是数据的集成,而没有考虑数据处理方面。因此还不能达到真正的互操作。GIS 互操作是在异构数据库和分布计算下出现的。对系统而言,系统能彼此更安全地获取和处理对方的消息;对用户而言,用户能方便地查询到所需的信息,并能方便地使用各种不同类型和格式的数据;对信息管理者来说,他们能很好地管理信息,为用户服务,并将资源充分地提供给用户。

数据互操作是自由交换信息,以及协作运行地理信息处理软件。为了实现数据的互操作,便通过共同接口来实现。接口相当于一种规程(互操作协议,它的功能类似于网络协议,是对地学数据处理的相互响应的协议),它是大家都遵守并达成统一的标准。在接口中不仅要考虑数据格式、数据处理,还要提供对数据处理应采用的协议,各个系统通过公共的接口相互联系,而且允许各自系统内部数据结构和数据处理可互为不同(如图3)。

图3 基于公共接口的数据互操作

(4) 数据互操作与数据转换的比较

数据互操作强调将具有不同数据结构和数据格式的软件系统集成在一起操作,与数据转换相比,互操作不仅考虑数据,还要考虑处理过程,它是在更高层次上不同系统之间的相互合作。它不仅是对数据的集成,还是对处理过程的集成。互操作与数据转换的差异如表1所示。

表1 互操作与数据转换的差异

2.3 OGC 与数据互操作

数据互操作模式是Open GIS Consortium(OGC)制定的规范。OGC 是为了发展开放式地理数据系统、研究地学空间信息标准化以及处理方法的一个非盈利性组织。OGC 为数据互操作制定了统一的规范,从而使得一个系统同时支持不同的空间数据格式成为可能。根据OGC 颁布的规范,可以把提供数据源的软件称为数据

系统A 公共接口 系统B 公共接口 系统… 公共接口 协议及分布式计算环境

系统1 公共接口 系统2 公共接口 系统… 公共接口

服务器(Data Servers),把使用数据的软件称为数据客户(Data Clients),数据客户使用某种数据的过程就是发出数据请求,由数据服务器提供服务的过程,其最终目的是使数据客户能够读取任意数据服务器提供的空间数据。为实现不同平台间服务器和客户端之间数据请求和服务提供了统一的协议。OGC规范正得到一些国际标准化组织的承认,从而逐渐成为一种国际标准,将被越来越多的GIS软件以及研究者所接受和采纳。目前,还没有商业化GIS软件完全支持这一规范。

数据互操作为多源数据集成提供了崭新的思路和规范,它将GIS带入了Open GIS时代,从而为空间数据集中式管理、分布式存储与共享提供了操作的依据。OGC标准将计算机软件领域的非空间数据处理标准成功地应用到空间数据上,但是它更多地采用了Open GIS协议的空间数据服务软件和空间数据客户软件,对于那些已经存在的大量非Open GIS标准的空间数据格式的处理办法还缺乏标准的规范。从目前来看,非Open GIS标准的空间数据格式仍然占据已有数据的主体,而且非Open GIS标准的GIS软件仍在产生大量非Open GIS标准的空间数据,如何继续使用这些GIS软件和共享这些空间数据成为Open GIS标准不可解决的问题。

数据互操作规范为多源数据集成带来了新的模式,但这一模式在应用中存在一定局限性:首先,为真正实现各种格式数据之间的互操作,需要每种格式的宿主软件都按照统一的规范实现数据访问接口,在一定时期内还不现实;其次,一个软件访问其他软件的数据格式时是通过数据服务器实现的,这个数据服务器实际上就是被访问数据格式的宿主软件,也就是说,用户必须同时拥有这两个GIS 软件,并且同时运行,才能完成数据互操作过程。最后,即使以后新建的GIS 软件都支持Open GIS,现有的GIS软件生产出来的空间数据也要转化到Open GIS 标准

2.4 数据共享存在的问题

GIS数据共享有三个基本要求:一是GIS数据所表达的地理信息正确;二是用户无歧义、无错误的接收并正确使用信息;三是要保障数据供需双方的权力不受侵害。目前,由于缺乏数据标准,数据共享存在的主要问题如下:(1)语义共享问题(语义:也叫词义,指词语的意义)。要保持在GIS数据共享过程中语义稳定性和一致性。

(2)数据质量不稳定。包括:①数据生产的质量控制,例如空间数据的位置精度控制和非空间属性的编码以及录入的正确性;②数据质量评价方法的稳定性和一致性。

(3)数据库设计不规范。包括数据模型设计、数据库结构及功能设计、数据建库的工艺流程设计方面的标准化问题。

(4)标准化数据档案问题。包括:①描述GIS数据库开发及GIS数据共享活动的各种文档性资料的标准化;②对所生产或共享的GIS数据集的描述文档的标准化。

(5)数据格式不一致。包括:①不同GIS系统之间数据格式转换问题;

②通用数据交换标准出现后,由于这种标准太多,增加了用户选择的难度及GIS 软件系统开发的开销,反而使标准不标准了。

(6)数据的可视化问题。包括:①用于GIS的制图符号的标准化和标准制图符号库的开发;②研究非制图符号的GIS可视化(图片符号、声音符号等)。

(7)缺乏GIS软件产品及数据产品测评手段及规范。由于缺乏相应的标准及一套规范化的工艺流程,因此使现在实际的测评工作具有较浓重的实验色彩,在这方面仍然存在着大量急待解决的问题。

3 实现数据的标准化和数据共享的现实意义

数据的标准化能使各部门的数据基于统一的地理框架或标准,便于管理和使用,并保持数据的一致性;数据共享可以使更多的部门能使用非己有的数据和更加充分、有效地利用已有的数据,减少重复劳动和数据采集的费用;可减少数据的维护和管理费用;使GIS系统更容易集成;能够使GIS开发的重点集中在开发新的应用上。

4 结束语

数据的标准化是实现数据共享的关键问题之一,也是促进地理信息产业形成和发展的必要条件。数据的标准化和数据共享是当前空间信息研究领域的一个重要研究方向。随着空间信息技术和网络技术的发展,人们对空间信息及其服务有了更高的需求,提出了诸如“数字地球”、全球空间数据基础设施、国家空间数据基础设施等大型应用需求。这些大型应用项目能否成功实现,数据的标准化和数据共享是必须要首先解决的问题。

参考文献:

[1] 中国GIS协会标准化与质量控制专业委员会.GIS标准化综述.地理信息世界,2004,(5):11-15

[2] 李新通,何建邦.GIS互操作与OGC规范.地理信息世界,2003,(5):23-28

[3] 杨正华.城市GIS空间数据共享初探.测绘通报,2003,(5):55-57

[4] 胡诚,陈方林,刘俊亮.空间数据共享与互操作技术探讨.现代测绘,2003,(12):31-33

[5] 李琦,曾澜,苗前军等编著.空间信息基础设施与互操作.北京:科学出版社,2003年7月

[6] 陈常松著.地理信息共享的理论与政策研究.北京:科学出版社,2003年1月

[7] 李满春,任建武,陈刚等著.GIS设计与实现.北京:科学出版社,2003年8月

[8] 毕硕本,王桥,徐秀华著.地理信息系统软件工程的原理与方法.北京:科学出版社,2003年7月

[9] 龚健雅,杜道生,李清泉等著.当代地理信息技术.北京:科学出版社,2004年7月

[10] 龚建雅著.地理信息系统基础.北京:科学出版社,2001年2月

[11] 吴信才著.地理信息系统原理与方法.北京:电子工业出版社,2002年3月

[12] 冯学智,都金康著.数字地球导论.北京:商务印书馆,2004年5月

相关主题
相关文档
最新文档