第四章空间数据库

第四章空间数据库
第四章空间数据库

第四章空间数据库

第一节数据库概述

数据库技术是60年代初开始发展起来的一门数据管理自动化的综合性新技术。数据库的应用领域相当广泛,从一般事务处理,到各种专门化数据的存储与管理,都可以建立不同类型的数据库。建立数据库不仅仅是为了保存数据,扩展人的记忆,而主要是为了帮助人们去管理和控制与这些数据相关联的事物。地理信息系统中的数据库就是一种专门化的数据库,由于这类数据库具有明显的空间特征,所以有人把它称为空间数据库,空间数据库的理论与方法是地理信息系统的核心问题。

一、数据库的定义

数据库就是为了一定的目的,在计算机系统中以特定的结构组织、存储和应用的相关联的数据集合。

计算机对数据的管理经过了三个阶段—最早的程序管理阶段,后来的文件管理阶段,现在的数据库管理阶段。其中,数据库是数据管理的高级阶段,它与传统的数据管理相比有许多明显的差别,其中主要的有两点:一是数据独立于应用程序而集中管理,实现了数据共享,减少了数据冗余,提高了数据的效益;二是在数据间建立了联系,从而使数据库能反映出现实世界中信息的联系。

地理信息系统的数据库(以下称为空间数据库)是某区域内关于一定地理要素特征的数据集合。空间数据库与一般数据库相比,具有以下特点:

(1) 数据量特别大,地理系统是一个复杂的综合体,要用数据来描述各种地理要素,尤其是要素的空间位置,其数据量往往大得惊人。即使是一个很小区域的数据库也是如此。

(2) 不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数据,即描述地理要素空间分布位置的数据,并且这两种数据之间具有不可分割的联系。

(3) 数据应用的面相当广,如地理研究、环境保护、土地利用与规划、资源开发、生态环境、市政管理、道路建设等等。

上述特点,尤其是第二点,决定了在建立空间数据库时,一方面应该遵循和应用通用数据库的原理和方法,另一方面又必须采取一些特殊的技术和方法来解决其它数据库所没有的管理空间数据的问题。

二、数据库的主要特征

数据库方法与文件管理方法相比,具有更强的数据管理能力。数据库具有以下主要特征:

1、数据集中控制特征

在文件管理方法中,文件是分散的,每个用户或每种处理都有各自的文件,不同的用户或处理的文件一般是没有联系的,因而就不能为多用户共享,也不能按照统一的方法来控制、维护和管理。数据库很好地克服了这一缺点,数据库集中控制和管理有关数据,以保证不同用户和应用可以共享数据。数据集中并不是把若干文件“拼凑”在一起,而是要把数据“集成”。因此,数据库的内容和结构必须合理,才能满足众多用户的要求。

2、数据冗余度小的特征

冗余是指数据的重复存储。在文件方式中,数据冗余太。冗余数据的存在有两个缺点:一是增加了存储空间;二是易出现数据不一致。设计数据库的主要任务之一是识别冗余数据,并确定是否能够消除。在目前情况下,即使数据库方法也不能完全消除冗余数据。有时,为了提高数据处理效率,也应该有一定程度的数据冗余。但是,在数据库中应该严格控制数据的冗余度。在有冗余的情况下,数据更新、修改时,必须保证数据库内容的一致性。

3、数据独立性特征

数据独立是数据库的关键性要求。数据独立是指数据库中的数据与应用程序相互独立,即应用程序不因数据性质的改变而改变;数据的性质也不因应用程序的改变而改变。数据独立分为两级:物理级和逻辑级。物理独立是指数据的物理结构变化不影响数据的逻辑结构;逻辑独立意味着数据库的逻辑结构的改变不影响应用程序。但是,逻辑结构的改变必然影响到数据的物理结构。目前,数据逻辑独立还没有能完全实观。

4、复杂的数据模型

数据模型能够表示现实世界中各种各样的数据组织以及数据间的联系。复杂的数据模型是实现数据集中控制、减少数据冗余的前提和保证。采用数据模型是数据库方法与文件方式的一个本质差别。

数据库常用的数据模型有三种:层次模型,网络模型和关系模型。因此,根据使用的模型,可以把数据库分成:层次型数据库,网络型数据库和关系型数据库。

5、数据保护特征

数据保护对数据库来说是至关重要的,一旦数据库中的数据遭到破坏,就会影响数据库的功能,甚至使整个数据库失去作用、数据保护主要包括四个方面的内容:安全性

控制、完整性控制、并发控制、故障的发现和恢复。

三、数据库的系统结构

数据库是一个复杂的系统。数据库的基本结构可以分成三个层次:物理级、概念级和用户级。

1、物理级:数据库最内的一层。它是物理设备上实际存储的数据集合(物理数据库)。它是由物理模式(也称内部模式)描述的。

2、概念级:数据库的逻辑表示,包括每个数据的逻辑定义以及数据间的逻辑联系。它是由概念模式定义的,这一级也被称为概念模型。

3、用户级:用户所使用的数据库,是一个或几个特定用户所使用的数据集合(外部模型),是概念模型的逻辑子集。它由外部模式定义。

四、数据组织方式

数据是现实世界中信息的裁体,是信息的具体表达形式。为了表达有意义的信息内容,数据必须按照一定的方式进行组织和存储。数据库中的数据组织一般可以分为四级:数据项、记录、文件和数据库。

1、数据项:是可以定义数据的最小单位,也叫元素、基本项、字段等。数据项与现实世界实体的属性相对应,数据项有一定的取值范围,称为域。域以外的任何值对该数据项都是无意义的。如表示月份的数据项的域是1—12,13就是无意义的值。每个数据项都有一个名称,称为数据项目。数据项的值可以是数值的、字母的、汉字的等形式。数据项的物理特点在于它具有确定的物理长度,一般用字节数表示。

几个数据项可以组合,构成组合数据项。如“日期”可以由日、月、年三个数据项组合而成。组合数据项也有自己的名字,可以作为一个整体看待。

2、记录:由若干相关联的数据项组成。记录是应用程序输入—输出的逻辑单位。对大多数据库系统,记录是处理和存储信息的基本单位。记录是关于一个实体的数据总和,构成该记录的数据项表示实体的若干属性。

记录有“型”和“值”的区别。“型”是同类记录的框架,它定义记录,“值”是记录反映实体的内容。

为了唯一标识每个记录,就必须有记录标识符,也叫关键字。记录标识符一般由记录中的第一个数据项担任,唯一标识记录的关键字称主关键字,其它标识记录的关键字称为辅关键字。

3、文件:文件是一给定类型的(逻辑)记录的全部具体值的集合。文件用文件名称标

识。文件根据记录的组织方式和存取方法可以分为:顺序文件、索引文件、直接文件和倒排文件等等。

4、数据库:是比文件更大的数据组织。数据库是具有特定联系的数据的集合,也可以看成是具有特定联系的多种类型的记录的集合。数据库的内部构造是文件的集合,这些文件之间存在某种联系,不能孤立存在。

五、数据间的逻辑联系

数据间的逻辑联系主要是指记录与记录之间的联系。记录是表示现实世界中的实体的。实体之间存在着一种或多种联系,这样的联系必然要反映到记录之间的联系上来。数据之间的逻辑联系主要有三种:Array

1、一对一的联系:简记为1:1,如图4-1所

示,这是一种比较简单的一种联系方式,是指在集

合A中存在一个元素a i,则在集合B中就有一个且

仅有一个b j与之联系。在1:1的联系中,一个集

合中的元素可以标识另一个集合中的元素。例如,

地理名称与对应的空间位置之间的关系就是一种

一对一的联系.

2、一对多的联系(1:N):现实生活中以一对

多的联系较多常见。如图4-2所示,这种联系可以

表达为:在集合A中存在一个a i,则在集合B中存

在一个子集B′=(b j1,b j2…b jn)与之联系。通常,

B′是B的一个子集。行政区划就具有一对多的联

系,一个省对应有多个市,一个市有多个县,一个

县又有多个乡。

3、多对多的联系(M:N):这是现实中最复杂

的联系(如图4-3所示),即对于集合A中的一个

元素a i。在集合B就存在一个子集B′=(b j1,b j2…

b jn)与之相联系。反过来,对于B集合中的一个元

素B j在集合A中就有一个集合A′=(a i1,a i2,a i3…a in)

与之相联系。M:N的联系,在数据库中往往不能

直接表示出来,而必须经过某种变换,使其分解成

两个1:N的联系来处理。地理实体中的多对多联

系是很多的,例如土壤类型与种植的作物之间有多对多联系。同一种土壤类型可以种不同的作物,同一种作物又可种植在不同的土壤类型上。

第二节传统数据库系统的数据模型

数据模型是数据库系统中关于数据和联系的逻辑组织的形式表示。每一个具体的数据库都是由一个相应的数据模型来定义。每一种数据模型都以不同的数据抽象与表示能力来反映客观事物,有其不同的处理数据联系的方式。数据模型的主要任务就是研究记录类型之间的联系。

目前,数据库领域采用的数据模型有层次模型、网状模型和关系模型,其中应用最广泛的是关系模型。

一、层次模型

层次模型是数据处理中发

展较早、技木上也比较成熟的一

种数据模型。它的特点是将数据

组织成有向有序的树结构。层次

模型由处于不同层次的各个结

点组成。除根结点外,其余各结

点有且仅有一个上一层结点作为其“双亲”,而位于其下的较低一层的若干个结点作为其

“子女”。结构中结点代表数据记录,连线描述位于不同结点数据间的从属关系(限定为一

对多的关系)。对于图4-4所示的地图M 用层次模型表示为如图4-5所示的层次结构。 层次模型反映了现实世界中实体间的层次关系,层次结构是众多空间对象的自然表达形式,并在一定程度上支持数据的重构。但其应用时存在以下问题:

1、由于层次结构的严格限制,对任何对象的查询必须始于其所在层次结构的根,使得低层次对象的处理效率较低,并难以进行反向查询。数据的更新涉及许多指针,插入和删除操作也比较复杂。母结点的删除意味着其下属所有子结点均被删除,必须慎用删除操作。

2、层次命令具有过程式性质,它要求用户了解数据的物理结构,并在数据操纵命令中显式地给出存取途径。

3、模拟多对多联系时导致物理存贮上的冗余。

4、数据独立性较差。

二、网状模型

网络数据模型是数据模型的另一种重要结构,它反映着显示世界中实体间更为复杂的联系,其基本特征是,结点数据间没有明确

的从属关系,一个结点可与其它多个结点建立联

系。如图4-6所示的四个城市的交通联系,不仅

是双向的而且是多对多的。如图4-7所示,学生

甲、乙、丙、丁、选修课程,其中的联系也属于

网络模型。

网络模型用连接指令或指针来确定数据间的显式连接关系,是具有多对多类型的数据组织方式,网络模型将数据组织成有向图结构。结构中结点代表数据记录,连线描述不同结点数据间的关系。

有向图(Digraph)的形式化定义

为:

Digraph =(Vertex ,(Relation))

其中Vertex 为图中数据元素(顶点)

的有限非空集合;Relation 是两个顶

点(Vertex)之间的关系的集合。

有向图结构比层次结构具有更

大的灵活性和更强的数据建模能

力。网络模型的优点是可以描述现实生活中极为常见的多对多的关系,其数据存贮效

率高于层次模型,但其结构的复杂性限制了它在空间数据库中的应用。

网络模型在一定程度上支持数据的重构,具有一定的数据独立性和共享特性,并且运行效率较高。但它应用时存在以下问题:

1、网状结构的复杂,增加了用户查询和定位的困难。它要求用户熟悉数据的逻辑结构,知道自身所处的位置。

2、网状数据操作命令具有过程式性质。

3、不直接支持对于层次结构的表达。

三、关系模型

在层次与网络模型中,实体间的联系主要是通过指针来实现的,即把有联系的实

体用指针连接起来。而关系模型则采用完全不同的方法。

关系模型是根据数学概念建立的,它把数据的逻辑结构归结为满足一定条件的二

维表形式。此处,实体本身的信息以及实体之间的联系均表现为二维表,这种表就称

为关系。一个实体由若干个关系组成,而关系表的集合就构成为关系模型。

关系模型不是人为地设置指针,而是由数据本身自然地建立它们之间的联系,并

这就是关系模型的本质。

在生活中表示实体间联系的最自然

的途径就是二维表格。表格是同类实体

的各种属性的集合,在数学上把这种二

维表格叫做关系。二维表的表头,即表

格的格式是关系内容的框架,这种框架

叫做模式,关系由许多同类的实体所组

成,每个实体对应于表中的一行,叫做

一个元组。表中的每一列表示同一属性,

叫做域。

对于图4-4的地图,用关系数据模

型则表示为图4-8所示。

关系数据模型是应用最广泛的一种

数据模型,它具有以下优点:

1、能够以简单、灵活的方式表达现实世界中各种实体及其相互间关系,使用与维

护也很方便。关系模型通过规范化的关系为用护提供一种简单的用户逻辑结构。所谓规范化,实质上就是使概念单一化,一个关系只描述一个概念,如果多于一个概念,就要将其分开来。

2、关系模型具有严密的数学基础和操作代数基础——如关系代数、关系演算等,可将关系分开,或将两个关系合并,使数据的操纵具有高度的灵活性;

3、在关系数据模型中,数据间的关系具有对称性,因此,关系之间的寻找在正反两个方向上难度程度是一样的,而在其它模型如层次模型中从根结点出发寻找叶子的过程容易解决,相反的过程则很困难。

目前,绝大多数数据库系统采用关系模型。但它的应用也存在着如下问题:

1、实现效率不够高。由于概念模式和存贮模式的相互独立性,按照给定的关系模式重新构造数据的操作相当费时。另外,实现关系之间联系需要执行系统开销较大的联接操作。

2、描述对象语义的能力较弱。现实世界中包含的数据种类和数量繁多,许多对象本身具有复杂的结构和涵义,为了用规范化的关系描述这些对象,则需对对象进行不自然的分解,从而在存贮模式、查询途径及其操作等方面均显得语义不甚合理。

3、不直接支持层次结构,因此不直接支持对于概括、分类和聚合的模拟,即不适合于管理复杂对象的要求,它不允许嵌套元组和嵌套关系存在。

4、模型的可扩充性较差。新关系模式的定义与原有的关系模式相互独立,并未借助已有的模式支持系统的扩充。关系模型只支持元组的集合这一种数据结构,并要求元组的属性值为不可再分的简单数据(如整数、实数和字符串等),它不支持抽象数据类型,因而不具备管理多种类型数据对象的能力。

5、模拟和操纵复杂对象的能力较弱。关系模型表示复杂关系时比其它数据模型困难,因为它无法用递归和嵌套的方式来描述复杂关系的层次和网状结构,只能借助于关系的规范化分解来实现。过多的不自然分解必然导致模拟和操纵的困难和复杂化。

第三节GIS中空间数据库的组织方式

GIS中的数据大多数都是地理数据,它与通常意义上的数据相比,具有自己的特点:地理数据类型多样,各类型实体之间关系复杂,数据量很大,而且每个线状或面状地物的字节长度都不是等长的等等。地理数据的这些特点决定了利用目前流行的数据库系统直接管理地理空间数据,存在着明显的不足,GIS必须发展自己的数据库-空间数

据库。

空间数据库是作为一种应用技术而诞生和发展起来的,其目的是为了使用户能够方便灵活地查询出所需的地理空间数据,同时能够进行有关地理空间数据的插入、删除、更新等操作,为此建立了如实体、关系、数据独立性、完整性、数据操纵、资源共享等一系列基本概念。以地理空间数据存储和操作为对象的空间数据库,把被管理的数据从一维推向了二维、三维甚至更高维。由于传统数据库系统(如关系数据库系统)的数据模拟主要针对简单对象,因而无法有效地支持以复杂对象(如图形、影像等)为主体的工程应用。空间数据库系统必须具备对地理对象(大多为具有复杂结构和内涵的复杂对象)进行模拟和推理的功能。一方面可将空间数据库技术视为传统数据库技术的扩充;另一方面,空间数据库突破了传统数据库理论(如将规范关系推向非规范关系),其实质性发展必然导致理论上的创新。

空间数据库是一种应用于地理空间数据处理与信息分析领域的具有工程性质的数据库,它所管理的对象主要是地理空间数据(包括空间数据和非空间数据)。传统数据库系统管理地理空间数据有以下几个方面的局限性:

(1)传统数据库系统管理的是不连续的、相关性较小的数字和字符;而地理信息数据是连续的,并且具有很强的空间相关性。

(2)传统数据库系统管理的实体类型较少,并且实体类型之间通常只有简单、固定的空间关系;而地理空间数据的实体类型繁多,实体类型之间存在着复杂的空间关系,并且还能产生新的关系(如拓扑关系)。

(3)传统数据库系统存贮的数据通常为等长记录的数据;而地理空间数据通常由于不同空间目标的坐标串长度不定,具有变长记录,并且数据项也可能很大,很复杂。

(4)传统数据库系统只操纵和查询文字和数字信息;而空间数据库中需要有大量的空间数据操作和查询,如相邻、连通、包含、叠加等。

目前,大多数商品化的GIS软件都不是采取传统的某一种单一的数据模型,也不是抛弃传统的数据模型,而是采用建立在关系数据库管理系统(RDBMS)基础上的综合

一、混合结构模型(Hybrid Model)

它的基本思想是用两个子系统分别存储和

检索空间数据与属性数据,其中属性数据存储

在常规的RDBMS中,几何数据存储在空间数

据管理系统中,两个子系统之间使用一种标识

符联系起来。图4-9为其原理框图。在检索目标时必须同时询问两个子系统,然后将它们的回答结合起来。

由于这种混合结构模型的一部分是建立在标准RDBMS之上,故存储和检索数据比较有效、可靠。但因为使用两个存储子系统,它们有各自的规则,查询操作难以优化,存储在RDBMS外面的数据有时会丢失数据项的语义;此外,数据完整性的约束条件有可能遭破坏,例如在几何空间数据存储子系统中目标实体仍然存在,但在RDBMS中却已被删除。

属这种模型的GIS软件有ARC/INFO、MGE、SICARD、GENEMAP等。

二、扩展结构模型(Extended Model)

混合结构模型的缺陷是因为两个存储子系统具有各自的职责,互相很难保证数据存储、操作的统一。扩展结构模型采用同一DBMS存储空间数据和属性数据。其做法是在标准的关系数据库上增加空间数

构查询语言(GeoSQL)转化成标准

的SQL查询,借助索引数据的辅

助关系实施空间索引操作。这种

模型的优点是省去了空间数据库

和属性数据库之间的繁琐联结,

空间数据存取速度较快,但由于

是间接存取,在效率上总是低于

DBMS中所用的直接操作过程,

且查询过程复杂。图4—10为其

原理框图。

这种模型的代表性GIS软件有SYSTEM 9,SMALL WORLD等。

三、统一模数据型(Integrated Model)

这种综合数据模型不是基于标准的RDBMS,而是在开放型DBMS基础上扩充空间数据表达功能。如图4-11所示,空间扩展完全包含在DBMS中,用户可以使用自己的基本抽象数据类型(ADT)来扩充DBMS。在核心DBMS中进行数据类型的直接操作很方便、有效,并且用户还可以开发自己的空间存取算法。该模型的缺点是,用户必须在DBMS

环境中实施自己的数据类型,对有些应用将相当复杂。

属于此类综合模型的软件如TIGRIS(intergraph)、GEO++(荷兰)等。

第四节面向对象数据库系统

一、面向对象技术概述

近十几年来,一种新颖,具有独特优越性的新方法,正引起全世界越来越强烈的关注和高度的重视,它就是被誉为“研究高技术的好办法”的“面向对象方法”(Object-Oriented Paradigm,简称OO)

面向对象方法起源于面向对象的编程语言(简称OOPL)。60年代中后期,Simula-67语言的设计者首次提出了“对象”(Object)的概念,并开始使用数据封装(data encapsulation)技术(对外部只提供一个抽象接口而隐藏具体实现细节)。但面向对象方法的推广应用则主要得益于面向对象语言Smalltalk—80,它在系统设计中强调对象概念的统—,引入对象、对象类、方法、实例等概念和术语,采用动态联编和单继承性机制。它还以OOPL 为核心,集各种软件开发工具为一体,建立OO计算环境,配有很强的图形功能和多窗口用户界面。因此,Smalltalk的商品化标志了面向对象的编程语言已建立较完善的概念和理论,并推向实用。Smalltalk作为一种新的、纯粹的面向对象编程语言,同时又为面向对象方法学的形成和发展起了重大的作用。

面向对象方法基本出发点就是尽可能按照人类认识世界的方法和思维方式来分析和解决问题。客观世界是由许多具体的事物或事件、抽象的概念、规则等组成的。因此,我们将任何感兴趣或要加以研究的事物概念都统称为“对象”(或称目标)。面向对象的方法正是以对象作为最基本的元素,它也是分析问题,解决问题的核心。OO方法很自然地符合人的认识规律。计算机实现的对象与真实世界具有一对一的对应关系,不需作任何转换,这样就使OO方法更易于为人们所理解、接受和掌握。面向对象方法具有的模块化,信息封装与隐藏、抽象性、多形性等独特之处,为解决大型软件管理,提高软件可靠性、可重用性、可扩充性和可维护性提供了有效的手段和途径,很快被引入到所有与计算机科学有关的领域,如在编程语言方面,Vc、Object Pascal, 数据库管理软件Vb等。吉奥之星、Small World 等GIS软件,也采用了面向对象的方法。

二、面向对象方法中的基本概念

面向对象的定义是指无论怎样复杂的事例都可以准确地由一个对象表示,这个对象是一个包含了数据集和操作集的实体。

1、对象

在面向对象的系统中,所有的概念实体都可以模型化为对象。多边形地图上的一个结点或一条弧段是对象,—条河流或—个省也是一个对象。一个对象是由描述该对象状态的—组数据和表达它的行为的一组操作(方法)组成的。例如,河流的坐标数据描述了它的位置和形状,而河流的变迁则表达了它的行为。由此可见,对象是数据和行为的统—体。

GIS中的地理对象则可定义为:描述一个实体的空间和属性数据以及定义一系列对实体有意义的操作函数的统一体。如一个城市、一条街道、一个街区等。

定义1:一个对象object是一个三元组

object=(ID,S,M)

其中,ID为对象标识,M为方法集,S为对象的内部状态,它可以直接是—属性值,也可以是另外一组对象的集合,因而它明显地表现出对象的递归。把ID,S,M三部分作为—个整体对象作如下递归定义。

定义2:

①Number, String, Symbol, True, False等称为原子对象;

②如S中都是属性值,S1,S2…S n均为原子对象,则称object为简单对象。

③如果S1,S2…S n包含了原子对象以外的其它类型的对象,则称Object为复杂对象。而其中的S i称为子对象。若S中所包含的子对象属同—类对象,则称Object为组合对象,

或称简单的复杂对象。

在面向对象的系统中,对象作为一个独立的实体,一经定义就带有一个唯—的标识号,且独立于它的值而存在。

总之,一个对象就是一个具有名称标识并有自身的状态与功能的实体。如一个人,他有一些身体状况如性别、年龄、身高、体重等,他还有一些其他的情况如所干工作、所学专业、爱好等。

2、对象类

对象类,简称类,是关于同类对象的集合,具有相同属性和操作的对象组合在一起形成“类”(class)。类是用来定义抽象数据类型的,类描述了实例的形式(属性等)以及作用于类中对象上的操作(方法)。属于同一类的所有对象共享相同的属性项和方法,每个对象都是这个类的一个实例,即对象与类的关系是instance—of的关系。同一个类中的对象在内部状态的表现形式上(即型)相同,但它们有不同的内部状态,即有不同的属性值,类中的对象并不是一模一样的,而应用于类中所有对象的操作却是相同的。

所以,在实际的系统中,仅需对每个类型定义一组操作,供该类中的每个对象应用。但因每个对象的内部状态不完全相同,所以要分别存贮每个对象的属性值。

如所有河流均有共性,名称、长度、面积以及操作方法,抽象成河流类,而黄河、长江等就是其实例对象,同时又有其自身的状态特征(属性值)。

3、方法和消息

对一个类所定义的所有操作称为方法。对对象类的操作是由方法来具体实现的,而对象间的相互联系和通信的唯一途径是通过“消息”传送来实现。消息是对象与对象之间相互联系、请求、协作的途径。

另外,消息还分公有消息和私有消息,例如,如果一批消息都属于同一个对象,但有些是可由其它对象向它发送,叫公有消息,另外一些则是由它自己向本身发送,叫私有消息。

4、协议与封装

对象和消息对自然界的实际事物进行了良好的模拟,也简化了人们对世界事物的理解。但是,现实事物仅靠这两个概念还不能充分表达。例如,一个人有各种各样的能力。有一些能力,他乐意向外人宣告;有些能力只向一部分人通告;还可能有些能力,不想让任何人知道。另外,即使外人知道了他的某些能力,但他也不向外界提供这些服务。这是经常出现的情况,上面的私有消息便是这样的例子。这里就有一个协议的问题。

协议是一个对象对外服务的说明,它告知一个对象可以为外界做什么。外界对象能

够并且只能向该对象发送协议中所提供的消息,请求该对象服务。因此,它是由一个对象能够接受并且愿意接受的所有消息构成的对外接口。也就是说,请求对象进行操作的唯一途径就是通过协议中提供的消息来进行。即使一个对象可以完成某一功能,但它没有将该功能放入协议中去,外界对象依然不能请求它完成这一功能。从私有消息和公有消息上看,协议是一个对象所能接受的所有公有消息的集合。

对象、消息和协议是面向对象设计中的支柱性概念,这些概念一起又引入了一个新的概念——封装。封装就是将某件事物包围起来,使外界不必知道其实际内容。也就是说,对象通过封装后,其它对象只能从公有消息中提供的功能进行请求服务,对这个对象内部的情况不必了解。

封装的最基本单位是对象。封装技术提高了面向对象方法开发软件的可重用性,从而大大提高了复杂软件的开发效率、质量和可靠性,更加易于维护。

三、面向对象方法的数据抽象技术和数据抽象工具

面向对象的方法除数据与操作的封装性以外,还具有极强的抽象表达能力,具有分类(classification)、概括(generalization)、聚集(aggregation)和联合(association)等数据抽象技术以及继承(inheritance)和传播(propagation)等强有力的抽象工具。

1、分类(classification)

把一组具有相同结构的实体归纳成类的过程,称为分类,而这些实体就是属于这个类的实例对象。属于同一类的对象具有相同的属性结构和操作方法。

2、超类与概括

在定义类型时,将几种类型中某些具有公共特征的属性和操作抽象出来,形成一种更一般的超类(Superclass)。

设有两种类型

C1ass l= (CID l,CS A,CS B,CM A,CM B)

Class2=(CID2,CS A,CS C,CM A,CM C)

C1assl和Class2中都带有相同的属性子集CS A和操作子集CM A

并且

CS A CS1和CS A CS2

及CM A CM l和CM A CM2

因而将它们抽象出来,形成一种超类Superclass=(SID,CSA,CMA) ,这里的SID为超类的标识号。

在定义了超类以后,则Classl 和C1ass2可表达为:

Classl=(CID l,CS B, CM B)

Class2=(CID2,CS C, CM C)

其中Class1和Class2则称为Superclass的子类。

子类与超类的关系是is-a的关系。例如,建筑物是饭店的超类,因为饭店也是建筑物。子类还可以进一步分类,如饭店类可以进一步分为小餐馆、普通旅社、涉外宾馆、招待所等类型。所以一个类可能是某个或某几个超类的子类,同时又可能是几个子类的超类。

建立超类实际上是一种概括,避免了说明和存贮上的大量冗余。但是仅由(10—7)式不足以描述Classl和Class2的状态和操作,它们需要结合(10—6)式中的CSA和CMA共同表达该对象。所以需要一种机制,在获取子类对象的状态和操作时,能自动得到它的超类的状态和操作。这就是面向对象方法中著名的模型工具—继承。

3、继承

继承是一种服务于概括的工具。在上述概括的概念中,子类的某些属性和操作来源于它的超类。例如在前面概括的例子中,饭店类是建筑物类的子类,它的一些操作,如显示和删除对象等,以及一些属性如房主、地址、建筑日期等是所有建筑物公有的,所以仅在建筑物类中定义它们,然后遗传给饭店类等子类。

在遗传的过程中,还可以将超类的属性和操作遗传给子类的子类。例如可将建筑物类的一些操作和属性通过饭店遗传给孙类——招待所类等。继承是一有力的建模工具,它有助于进行共享说明和应用的实现,提供了对世界简明而精确的描述。

继承有单个继承和多个继承。单个继承是指子类仅有一个直接的父类,而多个继承允许多于一个直接父类。

多个继承的现实意义是一个子类的属性和操作可以抽象出几个其它子类所公有的属性和操作子集,建立一个以上的超类。

GIS中经常要遇到多个继承的问题,下面举例说明两个不同的体系形成的多个继承。一个由人工和自然的交通线形成,另一个是以水系为主线。运河具有两方面的特性,即

人工交通线和水系;而可航行的河流也有两方面的特性,即河流和自然交通线。其它一些类型如高速公路和池塘仅属于其中某一个体系(见图4-12)。

另外,从继承内容上讲,继承还有包含继承、受限继承、取代继承等等。如水系是一类对象,湖是一种特殊的水系。湖继承了水系的所有特征,并且任何一个湖都是一个水系,这便是包含继承,即湖包含了水系具有的所有特征。鸵鸟是类特殊的鸟,它们不能继承鸟会飞的特征,这就是受限继承。

4、联合与组合对象

在定义对象时,将同—类对象中的几个具有部分相同属性值的对象组合起来,为了避免重复,设立一个更高水平的对象表示这些相同的属性值。例如一个县是由若干个乡镇联合而成。

联合常用集合来描述,有联合关系的对象叫成员,所以联合就指的是“成员”关系。在联合中,一个成员对象的具体细节被忽略了,强调的是整个对象的特征。一个集合对象的实例可以分解成一系列其成员对象的实例。联合通过其成员产生集合数据结构,一个集合的操作是由该集合每个成员的操作组成的。

5、聚集与复合对象

聚集有点类似于联合,但聚集是将几个不同特征的对象组合成一个更高水平的对象。每个不同特征的对象是该复合对象的一部分,它们有自己的属性描述数据和操作,这些是不能为复合对象所公用的,但复合对象可以从它们那里派生得到一些信息,它们与复合对象的关系是Parts-of的关系。例如房子从某种意义上说是一个复合关系,它是由墙、门、窗和房顶组成的。

考虑聚集时,不能强调复合对象的具体细节,每个聚集对象的实例都可以分解成其它成员对象实例,每个成员对象都保持其自有的功能。聚集的操作和其它部分的操作是不兼容的。聚集的每一个操作是由每个部分产生的不同操作所组成的。

6、传播

传播是作用于联合和聚集的工具,它通过一种强制性的手段将子对象的属性信息传播给复杂对象。就是说,复杂对象的某些属性值不单独存于数据库中,而是从它的子对象中提取或派生。

例如,一个多边形的位置坐标数据,并不直接存于多边形文件中,而是存于弧段和结点的文件中,多边形文件仅提供一种组合对象的功能和机制,借助于传播的工具可以得到多边形的位置信息。这一概念可以保证数据库的一致性,因为独立的属性值仅存贮一次,不会因数据库的更新而破坏它的一致性。

以上分类、概括、联合和聚集的概念丰富了面向对象方法的语义模型,使面向对象的系统具有支持多种语义联系的功能,这些概念的抽象关系列举如下:

分类instance—of

概括is—a

联合member—of

聚集parts—of

继承和传播工具为实现这种语义模型提供了有力的保证。它们分别用在不同的方面,继承是在概括中使用,而传播则作用于联合和聚集的结构;继承是以从上到下的方式,从一般类型到更详细的类型,而传播则以自下而上的方式,提取或派生子对象的值;继承应用于类型方面。传播直接作用于对象:继承包括了属性和操作,而传播一般仅涉及属性值;继承—般是隐含的,系统提供—种机制,只要声明子类与超类的关系,超类的特征—般会自动遗传给它的子类,而传播是—种带强制性的工具,它需要在复杂对象中显式定义它的每个子对象,并声明它需要传播哪些属性值。

四、面向对象的几何抽象类型

考察GIS中的各种地物,在几何性质方面不外乎表现为四种类型,即点状地物、线状处物、面状地物以及由它们混合组成的复杂地物,因而这四种类型可以作为GIS中各种地物类型的超类(见图4-13)。从几何位置抽象,点状地物为点,具有x, y, z坐标。线状地物由弧段组成,弧段由结点组成。面状地物由弧段和面域组成。复杂地物可以包含多个同类或不同类的简单地物(点、线、面),也可以再嵌套复杂地物。因此弧段聚集成

线状地物,简单地物组合成复杂地物,结点的坐标由标识号传播给线状地物和面状地物,进而还可以传播给复杂地物。

为了描述空间对象的拓扑关系,对空间对象的抽象,除了点、线、面、复杂地物外,

还可以再加上结点、弧段等几何元素。如我国一些研究人员,把空间对象还分为零维对象、一维对象、二维对象、复杂对象,其中,零维对象包括独立点状地物、纯结点、结点地物(既是几何拓扑类型,又是空间地物)、注记参考点、多边形标识点。一维对象包括拓扑弧段、无拓扑弧段(也称面条地物,如等高线)、线状地物。二维对象是指面状地物,它由组成面状地物的周边弧段组成,有属性编码和属性表。复杂对象包括有边界复杂地物和无边界复杂地物。

在美国空间数据交换标准中,对矢量数据模型中的空间对象,抽象为6类分别是:复杂地物(Complex),多边形(polygon)、环(ring )、线(line)、弧(arc)、点-结点(point-node)。其中,线相当于线状地物,由弧段组成,弧是指圆弧、B样条曲线等光滑的数学曲线,环是为了描述带岛屿的复杂多边形而新增的,结点作为一种点对象和点状地物合并为点-结点类。

在定义一个地物类型时,除按属性类别分类外,还要声明它的几何类型,例如定义建筑物类时,声明它的几何类型为面状地物,此时它自动联接到面状地物的数据结构,继承超类的几何位置信息及有关对几何数据的操作。这种联接可以通过类标识和对象标识实现。

五、面向对象的属性数据模型

关系数据模型和关系数据库管理系统基本上适应于GlS中属性数据的表达与管理。但如果采用面向对象数据模型,语义将更加丰富,层次关系也更明了。与此同时,它又能吸收关系数据模型和关系数据库的优点,或者说它在包含关系数据库管理系统的功能基础上,在某些方面加以扩展,增加面向对象模型的封装、继承、信息传播等功能。

GIS中的地物可根据国家分类标准或实际情况划分类型。如一个大学GIS的对象可分为建筑物、道路、绿化、管线等几大类,地物类型的每一大类又可以进一步分类,如建筑物可再分成教学楼、科研实验楼、行政办公楼、教工住宅、学生宿舍、后勤服务建筑、体育楼等子类,管线可再分为给水管道、污水管道、电信管道、供热管道、供气管道等,另一方面,几种具有相同属性和操作的类型可综合成一个超类。

六、面向对象数据库系统的实现方式

面向对象的数据模型为用户提供了自然的丰富的数据语义,从概念上将人们对GIS 的理解提高到了一个新的高度。同时它又巧妙地容纳了GIS中拓扑数据结构的思想,能有效地表达空间数据的拓扑关系。另一方面,面向对象数据模型在表达和处理属性数据时,又具有许多独特的优越性。因而,完全有可能采用面向对象的数据模型和面向对象

的数据库管理系统同时表达和管理图形和属性数据,结束目前许多GIS软件将它们分开处理的历史。

目前,采用面向对象数据模型,建立面向对象数据库系统,主要有三种实现方式:1、扩充面向对象程序设计语言(OOPL),在OOPL中增加DBMS的特性

面向对象数据库系统的一种开发途径便是扩充OOPL,使其处理永久性数据。典型的OOPL有Smalltalk和C十十。在OODBMS中增加处理和管理地理信息数据的功能,则可形成地理信息数据库系统。在这种系统中,对象标识符为指向各种对象的指针;地理信息对象的查询通过指针依次进行(巡航查询);这类系统具有计算完整性。

这种实现途径的优点是:①能充分利用OOPL强大的功能,相对地减少开发工作量;

②容易结合现有的C十十(或C)语言应用软件,使系统的应用范围更广。这种途径的缺点是没有充分利用现有的DBMS所具有的功能。

2、扩充RDBMS,在RDBMS中增加面向对象的特性

RDBMS是目前应用最广泛的数据库管理系统。既可用常规程序设计语言(如C、FORTRAN等)扩充RDBMS,也可用OOPL(如C十十)扩充RDBMS。IRIS就是用C语言和LISP语言扩展RDBMS所形成的一种OODBMS。

这种实现途径的优点是:①能充分利用RDBMS的功能,可使用或扩展SQl查询语言;②采用OOPL扩展RDBMS时,能结合二者的特性,大大减少开发的工作量。这种途径的缺点是数据库I/O检查比较费时,需要完成一些附加操作,所以查询效率比纯OODBMS低。

3、建立全新的支持面向对象数据模型的OODBMS

这种实现途径从重视计算完整性的立场出发,以记述消息的语言作为基础,备有全新的数据库程序设计语言(DBPL)或永久性程序设计语言(PPL)。此外,它还提供非过程型的查询语言。它并不以OOPL作为基础,而是创建独自的面向对象DBPl。

这种实现途径的优点是:①用常规语言开发的纯OODBMS全面支持面向对象数据模型,可扩充性较强,操作效率较高;②重视计算完整性和非过程查询。这种途径的缺点是数据库结构复杂,并且开发工作量很大。

上述三种开发途径各有利弊,侧重面也各有不同。第一种途径强调OOPL中的数据永久化;第二种途径强调RDBMS的扩展;第三种途径强调计算完整性和纯面向对象数据模型的实现。这三种途径也可以结合起来,充分利用各自的特点,既重视OOPL和RDBMS的扩展,也强调计算完整性。

七、Geostar 中的空间对象模型

Geostar软件是由武汉测绘科技大学测绘遥感信息工程国家重点实验室研制开发的面向对象的GIS软件。

在Geostar中,把GIS需要的地物抽象成结点、弧段、点状地物、线状地物、面状地物和无空间拓扑关系的面条地物。为了便于组织与管理,对空间数据库又设立了工程、工作区和专题层,工程包含了某个GIS工程需要处理的空间对象,工作区则是在某一个范围内,对某几种类型的地物,或某几个专题的地物进行操作的区域。从工程和地物的属性而言,空间地物又可以进一步向上抽象,按属性特征划分为各种地物类型,若干种地物类型组成一个专题层。同一地理空间的多个专题层组成一个工作区,而一个工程又可以包含一个或多个工作区。这种从下到上的抽象过程与从上往下的分解过程组成了GIS 中的面向对象模型(如图4—14所示)。一方面它表达了地理空间的自然特性,接近人们对客观事物的理解;另一方面,它完整地表达了各类地理对象(大到工程,小到结点)之间的各种关系,而且用层次方法清晰地表达了它们之间的联系。同时,为了表达方便,在Geostar 中,还设立了一个数据结构—位置坐标(Location),为了制图的方便,还包括制图的辅助对象如注记、符号、颜色等。

虽然,完全意义上的面向对象的空间数据库系统尚未出现,但目前已有的成果已经显示,面向对象的数据库系统会逐步成为空间数据库的基本结构形式。

海量空间数据存储技术研究.

海量空间数据存储技术研究作者:作者单位:唐立文,宇文静波唐立文(装备指挥技术学院试验指挥系北京 101416,宇文静波(装备指挥技术学院装备指挥系北京 101416 相似文献(10条 1.期刊论文戴海滨.秦勇.于剑.刘峰.周慧娟铁路地理信息系统中海量空间数据组织及分布式解决方案 -中国铁道科学2004,25(5 铁路地理信息系统采用分布式空间数据库系统和技术实现海量空间数据的组织、管理和共享.提出中心、分中心、子中心三层空间数据库分布存储模式,实现空间数据的全局一致和本地存放.铁路基础图库主要包括不同比例尺下的矢量和栅格数据.空间数据库的访问和同步采用复制和持久缓存.复制形成主从数据库结构,从数据库逻辑上是主数据库全部或部分的镜象.持久缓存是在本地形成对远程空间数据的部分缓存,本地所有的请求都通过持久缓存来访问. 2.学位论文骆炎民基于XML的WebGIS及其数据共享的研究 2003 随着计算机技术、网络通信技术、地球空间技术的发展,传统的GIS向着信息共享的WebGIS发展,WebGIS正成为大众化的信息工具,越来越多的 Web站点提供空间数据服务。但我们不得不面对这样的一个现实:数以万计的Web站点之间无法很好地沟通和协作,很难通过浏览器访问、处理这些分布于Web的海量空间数据;而且由于行业政策和数据安全的原因,这些空间资源

大多是存于特定的GIS系统和桌面应用中,各自独立、相对封闭,从而形成空间信息孤岛,难以满足Internet上空间信息决策所需的共享的需要。此外,从地理空间信息处理系统到地理空间信息基础设施和数字地球,地理空间信息共享是它们必须解决的核心问题之一。因此,对地理空间信息共享理论基础及其解决方案的研究迫在眉睫;表达、传输和显示不同格式空间数据,实现空间信息共享是数字地球建设的关键技术之一,GIS技术正在向更适合于Web的方向发展。本文着重于探索新的网络技术及其在地理信息领域中的应用。 3.学位论文马维峰面向Virtual Globe的异构多源空间信息系统体系结构与关键技术 2008 GIS软件技术经过30多年的发展,取得了巨大发展,但是随着GIS应用和集成程度的深入、Internet和高性能个人计算设备的普及,GIS软件技术也面临着诸多新的问题和挑战,主要表现为:GIS封闭式的体系结构与IT主流信息系统体系结构脱节,GIS与其他IT应用功能集成、数据集成困难;基于地图 (二维数据的数据组织和表现方式不适应空间信息应用发展的需求;表现方式单一,三维表现能力不足。现有GIS基础平台软件的设计思想、体系结构和数据组织已经不适应GIS应用发展的要求,尤其不能适应“数字地球”、“数字城市”、“数字区域”建设中对海量多源异构数据组织和管理、数据集成、互操作、应用集成、可视化和三维可视化的需求。 Virtual Globe 是目前“数字地球”最主要的软件实现技术,Vtrtual Globe通过三维可视化引擎,在用户桌面显示一个数字地球的可视化平台,用户可以通过鼠标、键盘操作在三维空间尺度对整个地球进行漫游、缩放等操作。随着Google Earth的普及,Virtual Globe已成为空间数据发布、可视化、表达、集成的一个重要途径和手段。 Virtual Globe技术在空间数据表达、海量空间数据组织、应用集成等方面对GIS软件技术具有重要的参考价值:从空间数据表达和可视化角度,基于Virtual Globe的空间信息可视化方式是GIS软件二维电子地图表达方式的最好替代者,其空间表达方式可以作为基于地图表达方式的数字化天然替代,对于GIS基础平台研究具有重要借鉴意义;从空间数据组织角度,Virtual Globe技术打破了以图层为基础的空间数据组织方式,为解决全球尺度海量数据的分布式存取提供了新的思路;从应用集成和空间数据互操作角度,基于VirtualGlobe的组件化GIS平台可以提供更好的与其他IT系统与应用的集成方式。论文在现有理论和技术基础上,借鉴和引入

第一章 绪论

第一章绪论 1.地理参照数据:描述地球表面空间要素的位置和特征的数据,即空间数据和属性数据两种组成。(P5) 2.空间数据:描述空间要素几何特性的数据,可以使离散的或连续的;属性数据:描述空间要素特征的数据。 3.矢量数据和栅格数据之间的不同:矢量数据适用于表示离散要素,而栅格数据适用于表示连续要素。它们结构也不同,栅格数据模型使用行、列式单一数据结构和固定像元位置。矢量数据模型可以是地理相关的或是基于对象的,是否拓扑均可,且可包括单一或复合要素。 4.地理相关数据模型和基于对象数据模型之间的不同:存储方式不同。地理相关模型使用不同的数据系统分部存储空间数据和属性数据;基于对象数据模型则将空间数据和属性数据存储在统一的数据系统中。 5.矢量数据分析的工具和技术:缓冲区建立(由选择的要素量测直线距离来创建缓冲区)、地图叠置(将不同图层的几何形态和属性组合而创建输出图层)、距离量算(计算空间要素之间的距离)、空间统计(检测要素之间的空间依赖性和聚集模式)和地图操作(管理和改变数据库中得图层)。 6.栅格数据分析的操作:局部(对单个像元操作)、邻域、分区(对一组相同值的像元或类似要素的操作)和整体操作(对整个栅格进行操作)。经常用数学函数将输入和输出联系起来。 7.习题:①将Raster文件、Shapefile文件导入Geodatebase;②gird文件生成坡度图的方法和流程;③*.mxd是什么文件,具有什么功能。 第二章坐标系统 1.大地基准在GIS中的重要性:大地基准是地球的一个数学模型,可作为计算某个位置地理坐标的参照或基础。大地基准的定义可包括大地原点、用于计算的椭球参数、椭球与地球在原点的分离。大地基准的概念还可用于测量海拔和高度。 2.地图投影(球形的地球表面到平面的转换过程):经纬线在平面上的系统安排。 3.根据所保留性质描述地图投影的4种类型:正形投影、等积投影、等距投影、等方位投影。 4.通过投影或可展曲面描述地图投影的3中类型:圆柱投影、圆锥投影、方位投影。 5.标准线和中央线的差异:标准线是定义地图投影的一个普通参数,与切割状态直接相关,标准线指明投影变形分布的模式;而中心线定义了地图投影的中心或原点。 6.比例系数与主比例尺如何建立关系:比例系数是局部比例尺与主比例尺的比值。

Oracle数据库的空间数据类型

Oracle数据库中空间数据类型随着GIS、CAD/CAM的广泛应用,对数据库系统提出了更高的要求,不仅要存储大量空间几何数据,且以事物的空间关系作为查询或处理的主要内容。Oracle数据库从9i开始对空间数据提供了较为完备的支持,增加了空间数据类型和相关的操作,以及提供了空间索引功能。 Oracle的空间数据库提供了一组关于如何存储,修改和查询空间数据集的SQL schema与函数。通过MDSYS schema规定了所支持的地理数据类型的存储、语法和语义,提供了R-tree空间数据索引机制,定义了关于空间的相交查询、联合查询和其他分析操作的操作符、函数和过程,并提供了处理点,边和面的拓扑数据模型及表现网络的点线的网络数据模型。 Oracle中各种关于空间数据库功能主要是通过Spatial组件来实现。从9i版本开始,Oracle Spatial空间数据库组件对存储和管理空间数据提供了较为完备的支持。其主要通过元数据表、空间数据字段(即SDO_GEOMETRY字段)和空间索引来管理空间数据,并在此基础上提供一系列空间查询和空间分析的函数,让用户进行更深层次的GIS应用开发。Oracle Spatial使用空间字段SDO_GEOMETRY存储空间数据,用元数据表来管理具有SDO_GEOMETRY字段的空间数据表,并采用R树索引和四叉树索引技术来提高空间查询和空间分析的速度。 1、元数据表说明。 Oracle Spatial的元数据表存储了有空间数据的数据表名称、空间字段名称、空间数据的坐标范围、坐标参考信息以及坐标维数说明等信息。用户必须通过元数据表才能知道ORACLE数据库中是否有Oracle Spatial的空间数据信息。一般可以通过元数据视图(USER_SDO_GEOM_METADATA)访问元数据表。元数据视图的基本定义为: ( TABLE_NAME V ARCHAR2(32), COLUMN_NAME V ARCHAR2(32), DIMINFO MDSYS.SDO_DIM_ARRAY, SRID NUMBER

武汉大学空间数据库复习资料整理

《空间数据库原理》 第一章数据库 1、空间数据库:①提供结构用于存储和分析空间数据②空间数据由多维空间的对象组成③在标准数据库中存储空间数据需要大量的空间,从一个标准数据库中检索查询空间数据需要很多时间并且很累赘,通常导致很多错误。 2、DBMS:(数据的操作系统)一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。SDBMS:增加了处理空间数据功能的DBMS。①在它的数据模型中提供空间数据类型和查询语言②至少在执行时支持提供空间数据类型:空间索引;空间链接有效的算法。 在地理信息系统中为什么要研究专门的空间数据库系统? 1.空间数据库能提供结构存储和空间数据分析 2.空间数据库包含多面空间的对象 3.在标准数据库中存储空间数据会需要过多的空间 4.标准数据库的查询反馈和空间数据分析会消耗过多时减并且留下大量错误空间 5.空间数据库能提供更多有效率的存储和空间数据分析 3、哈希(Hash)函数:一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。 质数除余法(直接取余法):f(x):=x mod maxM ;maxM一般是不太接近2^t的一个质数。 乘法取整法:f(x):=trunc((x/maxX)*maxlongit) mod maxM,主要用于实数。 平方取中法:f(x):=(x*x div 1000 ) mod 1000000);平方后取中间的,每位包含信息比较多。 第二章数据库基本原理 1、数据模型Data Model:关于数据基础或对象以及他们之间的关系的抽象描述被表示在一个数据库中。 3、概念数据模型:也称语义模型,关于实体和实体间联系的抽象概念集,用统一的语言描述、综合、集成的用户视图。 2、数据字典:是指对数据库的内容包括数据项和属性码定义,是元数据的重要组成部分。(是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。) Metadata:是描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。 3、数据库设计和实现:①需求分析②概念数据建模③逻辑建模(参考DBMS和基础数据模型)④物理建模或者实现(参考物理存储和电脑环境)。 需求调查:根据数据库设计的主题对用户的需求进行调查,了解用户特点和要求,取得设计者与用户对需求的一致看法。需求分析:指的是在创建一个新的或改变一个现存的系统或产品时,确定新系统的目的、范围、定义和功能时所要做的所有工作。 4、E-R图:描述对象类型之间的关系,是表示概念模型的一种方式。 第三章基本空间概念 1、凸多边形:把一个多边形任意一边向两方无限延长成为一条直线,如果多边形的其他各边均在此直线的同旁,那么这个多边形就叫做凸多边形。 2、点集拓扑:一个基于相邻关系定义拓扑学空间的方法。 3、大圆距离:大圆距离指的是从球面的一点A出发到达球面上另一点B,所经过的最短路径(圆弧)的长度。 曼哈顿距离:两个点上在标准坐标系上的绝对轴距之总和。 4、欧式空间(欧几里德空间):空间的坐标模型。作用:能将空间属性转化为以实数为元组的属性;坐标系包括一个确定的原点和在原点交叉的一对正交轴线。

海量空间数据组织及存储方案

本栏目责任编辑:代影数据库与信息管理Computer Knowledge and Technology 电脑知识与技术第6卷第29期(2010年10月)海量空间数据组织及存储方案 李慧玲 (长治学院计算机系,山西长治046011) 摘要:目前信息管理系统中需要存储的数据越来越多,而且数据的结构也变的越来越复杂。那么如何来组织和存储数据就变得很重要。该文以土地档案海量数据为例,从数据的存储方式、空间数据引擎以及利用关系数据库三个方面进行说明MAPGIS 是如何组织和管理海量空间数据的。 关键词:GIS 技术;海量空间数据;图档一体化 中图分类号:TP311文献标识码:A 文章编号:1009-3044(2010)29-8168-02 Organization and Storage Solutions of Massive Spatial Data LI Hui-ling (Computer Science Department,Changzhi University,Changzhi 046011,China) Abstract:The current information management systems need to store more data,and data structure becomes more and more complex.So how to organize and store data becomes very important.This land mass data files,for example,from the data is stored,spatial data and the use of relational database engines are described from three aspects that MAPGIS is how to organize and manage massive spatial data.Key words:GIS technology;massive spatial data;integration of drawing and files 现阶段,档案管理正在从以纸质档案管理为主逐步向以纸质档案管理和电子档案管理并重发展转变。随着信息化程度的提高,档案管理最终将以电子档案管理为主。土地档案的数据越来越多,而且除了海量属性数据之外,还有图形数据等等,那么如何来更好的存储这些海量空间数据才是真正的解决土地档案管理问题。本文利用GIS 技术和采用关系数据库结合的方式从三方面叙述并解决了这个问题,并能实现图档一体化管理。 1数据在GIS 中是如何存储的 目前,数据的存储方式有以下三种:1)GIS 数据是通过文件与关系数据库两者的结合来共同存储和管理的。当前大部分GIS 应用软件都是采用这种方式来对数据进行管理的。2)GIS 应用软件中的所有数据都存储在文件中。所谓的文件存储也就是将所有的数据包括空间数据和非空间数据都存储在一个或者多个文件中。3)采用数据库来存储和管理空间数据和属性数据的方式。通过这种方式来存储数据,包括空间数据和属性数据,即空间数据也可存放在数据库中。利用数据库来存储海量空间数据,这是GIS 应用软件发展的必然趋势。通过数据库来存储空间数据,解决了用文件存储空间数据时,对数据不能进行并发操作的缺点;用C/S (Client/Server)的操作模式,解决了以前空间数据不能进行分布式处理等问题。它从理论上保证了数据的完整性和数据的共享性,实现了属性数据和空间数据的一体化存储。利用关系数据库来存储空间数据将GIS 本身的问题转移到数据库的领域中,给开发GIS 应用软件的开发带来了新的解决方向[1]。就目前的形势,大型数据库厂商越来越重视空间数据的存储,通过研究与摸索,大型数据库厂商各自推出了自己的关于空间数据存储的解决方案,如0racle Satial ,B lade,Informix Satial 。GIS 技术的发展在这些厂商对于空间数据存储的支持下,有了更广阔的应用前景。无论采用哪种模式建立GIS 系统,通过利用0rac1e 的空间数据存储技术,在开发GIS 产品中,都可以跳过传统GIS 平台开发时所需要的一些必要的步骤,解决了大型空间数据不能多人维护数据的问题。另外数据库本身自带的一些特点,可以解决GIS 存在的一些问题:比如说数据库可支持多用户并发操作,克服了文件方式不能多用户同时操作数据的缺点,同时由于数据库的支持克服了以前由于不同GIS 厂商之间数据文件格式不同,导致的空间数据从一个GIS 平台移植到另外一个GIS 平台上数据处理的复杂性,从而保证空间数据能够做到完全意义上的共享,提高了GIS 系统的可用性和实用性[2]。这样GIS 平台的发展加上数据库技术的提高,两者的结合可以很好的解决土地档案海量空间数据的存储问题。 2SDE SDE 中文全称是,空间数据引擎。现在市场上的数据库几乎都是利用关系原理建立的,可是GIS 管理数据强调空间性以及拓扑关系,明显GIS 数据是不能直接存储在这些数据库中的,更不能对其进行查询了。所以要结合两者,并利用各自的优势,就要有一个中间件来联系数据库和GIS 系统。MAPGIS 就是在关系数据库的基础上,增加了联系二者的纽带?—空间数据引擎(SDE),空间数据引擎将客户端接收到的空间数据、属性数据的查询、添加、修改等操作转换成数据库中的关系操作。同时SDE 还优化了对数据库的操作,而且SDE 为系统管理员或客户端提供了GIS 的概念模型,利用SDE ,可以直接以GIS 的概念对数据进行维护和权限管理,使用户脱离了关系数据库中许多繁琐的细节等。空间数据引擎还增加了关系数据库中实现不了一些功能,对数据进行自动检查和维护功能,如拓扑一致性检查等。当然近些年来,关系数据库也在不断的更新和发展,其技术也慢慢地成熟起来,实现了利用关系数据库对空间数据和属性数据进行一体化管理和存储,这种现象已经成为GIS 平台发展的一个趋势。空间数据引擎(Satial Data Engine),收稿日期:2010-08-15 ISSN 1009-3044 Computer Knowledge and Technology 电脑知识与技术Vol.6,No.29,October 2010,pp.8168-8169E-mail:jslt@https://www.360docs.net/doc/501104021.html, https://www.360docs.net/doc/501104021.html, Tel:+86-551-569096356909648168

空间数据库概论答案

空间数据库概论答案 【篇一:数据库系统概论试题及答案整理版】 >第一章绪论 一、选择题 1. 在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。在这几个 阶段中,数据独立性最高的是a阶段。 a.数据库系 2. 数据库的概念模型独立于a。 a.具体的机器和dbms 3. 数据库的基本特点是b。 a.(1)数据结构化 (2)数据独立性 (3)数据共享性高,冗余大,易移植 b.(1)数据结构化 (2)数据独立性 (3)数据共享性高,冗余小,易扩充 c.(1)数据结构化 (2)数据互换性 (3)数据共享性高,冗余小,易扩充 (4)统一管理和控制(4)统一管理和控制(4)统一管理和控制 b.e-r图 c.信息世界 d.现实世界 b.文件系统 c.人工管理 d.数据项管理 d.(1)数据非结构化 (2)数据独立性 (3)数据共享性高,冗余小,易扩充(4)统一管理和控制 4. b是存储在计算机内有结构的数据的集合。 a.数据库系统 5. 数据库中存储的是c。 a. 数据 6. 数据库中,数据的物理独立性是指c。 a.数据库与数据库管理系统的相互独立 b.用户程序与dbms的相互独立 c.用户的应用程序与存储在磁盘上数据库中的数据是相互独立的d.应用程序与数据库中数据的逻辑结构相互独立 7. 数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指d。

a.同一个应用中的多个程序共享一个数据集合 b.多个用户、同一种语言共享数据 c.多个用户共享一个数据文件 d.多种应用、多种语言、多个用户相互覆盖地使用数据集合 b. 数据模型 c. 数据及数据间的联系 d. 信息 b.数据库 c.数据库管理系统 d.数据结构 8. 数据库系统的核心是b。 a.数据库 9. 下述关于数据库系统的正确叙述是 a 。 a.数据库系统减少了数据冗余b.数据库系统避免了一切冗余 c.数据库系统中数据的一致性是指数据类型一致 d.数据库系统比文件系统能管理更多的数据 10. 数将数据库的结构划分成多个层次,是为了提高数据库的 b ①和 b ②。①a.数据独立性 ②a. 数据独立性 11. 数据库(db)、数据库系统(dbs)和数据库管理系统(dbms)三者之间的关系是 a 。 a.dbs包括db和dbmsc.db包括dbs和dbms 12. 在数据库中,产生数据不一致的根本原因是d。 a.数据存储量太大 b.没有严格保护数据 d.数据冗余 b.ddms包括db和dbs d.dbs就是db,也就是dbms b.逻辑独立性 b.物理独立性 c.管理规范性 c.逻辑独立性 d.数据的共享 b.数据库管理系统 c.数据模型 d.软件工具 d.管理规范性 c.未对数据进行完整性控制 13. 数据库管理系统(dbms)是d。 a.数学软件

基于SQLServer的空间数据存储器的设计与实现

长春理工大学学报 Journal of Changchun University of Science and Technology 第7卷第3期2012年3月 Vol.7No.3Mar.2012 基于SQLServer 的空间数据 存储器的设计与实现 刘宝娥 (集宁师范学院,内蒙古乌兰察布,012000) [摘 要] 随着信息技术的发展,数据量的逐渐膨胀以及分布式地理信息系统GIS 中的发展,对空间数据以及地理数据 的管理提出了更高的要求,而传统的关系型数据库难以满足空间数据存储以及地理信息系统客户端应用程序连接的需要,由此,应通过以面向实体的数据模型为基础,通过SQLServe 的关系型数据库的管理系统,以相应的功能以及数据引擎技术,实现了对海量空间数据的一体化存储,满足了地理信息系统的实际发展需求。[关键词]SQLServe ;空间数据;存储器;设计;实现 [中图分类号] TP311.132.3 [文献标识码] A [作者简介] 刘宝娥(1975-),女,在职硕士,讲师,研究方向为计算机教学。 空间数据管理包括空间数据模型和空间数据库两个方面的内容体系。当前,地理信息系统基础软件平台所沿用的空间数据模型,从而在一定程度上导致了空间实体关系以及时空变化的相关描述与表达、数据的组织、空间的分析等方面具有较大的局限性,难以满足新时期空间信息系统基础软件平台的以及应用系统发展的实际需要,由于现实对象较多,从而导致了空间关系日渐复杂,要描述空间对象之间的关系需要大量的数据,由此,对空间复杂数据的管理应基于空间数据模型,构建空间数据库系统。通过以地理信息系统软件的发展需求为基础,结合MAPGIS 面向实体的空间数据模型以及SQLServer 数据库的应用特点,实现了利用空间数据引擎实现对空间数据与属性数据的一体化存储方式的设计和实现。 一、空间数据存储器系统设计 (一)空间数据模型 对空间数据模型的研究以及设计在当前地理信息系统(GIS )发展过程中有着重要的作用。空间数据模型MAPGIS 中采用了面向对象的设计原则和思想,通过以地理实体为中心,实现对面向实体的空间数据模型的构建和发展。建立观察范围内部的地理世界的视图模式。该模型以描述实体特性以及实体之间关系为基础,实现对人类理解的地理世界语义环境的模拟。MAPGIS 空间数据模型以地理数据库—数据集—类为数据组织的层次,也就是非空间的实体抽象为了实际的对象,而空间的实体则被抽象地定义为要素,具有同样类型结构的要素构成了要素类,同样类型的对象构成了对象类。若干要素类以及对象类组成了要素集,要素集的汇集则构成了地理的信息数据库。由此,从相应体系的结构上可分为参照系、要素类、对象类、关系类、动态类、注记类、修饰类、要素数据集、子类型、几何网络、域集和规则集。从而实现了对空间数据存储系统的整体设计和系统定义。 (二)空间数据引擎 空间数据引擎(MAPGIS-SDE )实现了空间数据库解决方案,空间数据引擎基于关系数据库系统(RDBMS )以及地理信息系统之间的中间件部分,实现了对空间数据模型到关系数据模型RDBMS 之间的关系映射,并通过关系型的数据库存储以及管理和快速检索的以TB 为单位的海量数据库。空间数据引擎具有以下几个方面的特点: 1.引擎机制。MAPGIS-SDE 在服务器端以及客户端存在分布,客户端以软件的应用为基础,并且未上层的应用客户提供了SDE 接口,实现了对用户标准空间存储、查询以及分析提供了服务体系,承接了客户端需求。服务器端以及客户端之间的数据传输模式采用了异步的缓冲机制,通过服务器端,将所要提取的数据存放入缓冲区,而后整批发向客户端,实现相应的应用模式,从而在很大程度上提高了网络传输的效率。 2.接口技术。空间数据存储以及空间数据服务的核心在于空间数据存储器,为有效保证空间数据存储器的跨平台的特性以及对商业数据库的访问效率的保障,空间数据库的引擎应通过一致性服务接口的提供,针对不同的数据库采用不同接口技术的使用,例如,针对SQLServer 可采用ODBC 和ADO 接口技术。 3.物理部署。空间数据存储系统的引擎,能实现与数据库管理系统服务器部署在同一服务器上,或是分开部署在不同的服务器上,可根据实际的需要对空间存储系统进行相应的部署,从而有效减轻数据库服务器荷载,提高相应数据库的运行效率。 (三)存储器系统架构 空间数据存储器由空间数据库引擎、商业数据库两部分组成。具体实用于空间是数据库。空间数据库引擎实现了对各类空间数据的存储管理。该类数据包括数据字典、表、存储过程等等,并面向用户提供了访问的接口。数据字典提 ----237

第4章 地理信息系统空间数据库-1

第四章地理信息系统空间数据库(1)

第四章地理信息系统空间数据库 第1节空间数据库概述 第2节传统的数据模型 第3节语义和面向对象数据模型 第4节空间数据库逻辑模型设计和物理设计第5节GIS空间时态数据库

第一节空间数据库概述?空间数据库的概念 ?空间数据库的设计 ?空间数据库的实施和维护

一、空间数据库的概念 1. 数据库的相关概念 ①数据库:是指长期储存在计算机内有结构的、大量的、可共享的数据集合。 ②数据库管理系统:是位于用户与操作系统之间的一层数据管理软件;他的功能包括:数据定义,数据操作,数据库的运行管理,数据库的建立和维护。 ③数据库系统:指在计算机系统中引入数据库后的系统,它由数据库、数据库管理系统及其开发工具、应用系统、数据库管理员和用户构成。 ④数据库系统管理员:负责数据库的建立、使用和维护的专门人员。

2. 空间数据库的相关概念 空间数据库:是地理信息系统在计算机物理存储介质存储的与应用相关的地理空间数据的总合,以一系列特定结构的文件形式组织后存储在介质上。 空间数据库(系统)组成:包括3部分 ?空间数据库:是地理信息系统在计算机物理存储介质存储的与应用相关的地理空间数据的总合,一般是以一系列特定结构的文件形式组织后存储在介质上。 ?空间数据库管理系统:是指能够对物理介质上存储的地理空间数据进行语义和逻辑上的定义,提供必需的空间数据查询检索和存取功能,以及能够对空间数据进行有效的维护和更新的一套软件。?空间数据库应用系统:应用模块。

空间数据库是GIS中存储的与应用相关的地理空间数据的总和。(是GIS基本且重要的组成部分) 数据库=数据库系统

地理信息系统第一章知识点

第一章绪论 1、GIS问题的共性是什么? 答:①与地理环境及其地理过程密切相关;②与空间位置相关;③需要地理空间数据和信息的支持。 2、GIS解决问题的流程(方法、步骤)是什么?这个过程和本课程的内容安排有什么关系? 答:①提出地理问题;②获取地理数据;③研究地理数据(数据预处理);④分析地理信息;⑤可视化地理结果;⑥基于地理知识解决问题。这个过程和本课程的内容安排的先后顺序一致,便于从逻辑上逐步地学习地理信息系统,明白地理信息系统解决问题的流程。第一章和第二章阐述GIS的基本概念,第三章讲解地理数据的获取,第四章、第五章和第六章讲解地理数据的研究,第七章讲解地理信息的分析,第八章讲解地理结果的可视化。 3、GIS的定义是什么,应如何去理解这个定义? 答:①定义:地理信息系统是以采集、处理、管理、分析和描述整个或部分地球表面(包括大气层在内)与空间和地理分布有关的数据的计算机空间信息系统。②地理信息系统的类别主体是计算机空间信息系统。所谓空间信息系统是一种十分特别而重要的信息系统,它要采集、管理、处理和更新空间信息,并且地理信息系统以计算机为基础。③地理信息系统解决问题的流程是采集、处理、管理、分析和描述空间数据。能在计算机软件和硬件的支持下,运用系统工程和信息科学的理论,科学管理和综合分析具有空间内涵的地理数据,以提供对规划、管理、决策和研究所需信息。④地理信息系统的研究范围是整个或部分地球表面(包括大气层在内)与空间和地理分布有关的数据。(与自然地理相比,GIS研究范围更大,自然地理研究范围是对流层顶到沉积岩石圈的底部。卫星在电离层) 4、GIS为什么会出现? 答:①以应用需求为驱动:正所谓哪里有需求哪里就会有发展,在现实世界中,人们感兴趣的很多问题,如:某类型的土壤特征、臭氧洞的变化、城乡人口分布的变化,最优路径的规划等,都与地表地理环境及其地理过程密切联系,都需要地理空间数据和信息、需要地图、需要GIS。 ②以技术发展为导引:传统的方法存在很多的问题,随着计算机技术的发展,人们开始 利用计算机来存储、管理、分析地理信息,因而产生了地理信息系统。摄影测量和遥感成像技术的发展,使摄影测量工作者能以很高的精度快速地进行大面积测图,并为地球资源科学家(土质、土壤、生态等)提供制图服务。 5、GIS的发展经历了几个过程?每个过程的特点是什么? 答:①二十世纪50~60年代的GIS开拓期。特点:计算机水平不高,GIS机助制图能力较强,能够实现地图的手扶跟踪数字化以及地图数据的拓扑逻辑和分幅数据拼接功能; 早期的GIS大多数是基于格网系统,发展了许多基于栅格的操作方法;专家兴趣以及政府需求的推动起着积极的引导作用,多数工作仅限于政府和大学范畴,国际交往甚少。 ②二十世纪70年代的GIS巩固发展期。特点:技术发展没有新的突破;系统应用与技 术开发多限于某几个机构;专家影响减弱,政府影响增强;一些发达国家建立了专业的地理信息系统;商业公司开始开发商业GIS软件;许多大学和研究机构开始重视GIS软件设计和研究;许多大学开始提供GIS培训,商业性咨询服务公司开始从事GIS工作。 ③二十世纪80年代的GIS普及和推广应用阶段。特点:GIS开始注重于空间决策支持

空间数据库

《空间数据库》习题第一章: 1、什么是空间数据库? KA0394******* 2、空间数据库有哪些特点? 4001-520-520 3、空间数据库与传统数据库的差异何在? 4、空间数据库有哪些主要作用? 5、目前空间数据库存在哪些主要问题? 6、简述空间数据库发展的历史和现状。 7、何谓空间数据? 8、地理空间类型的表现形式主要有哪些? 9、何谓地理空间? 10、当前常用的数据库软件有哪些? 11、空间数据的类型主要有哪几种? 第二章: 1、空间实体包括哪些? 2、空间实体类型主要有哪几种?

3、什么是空间认知的三层模型? 4、什么是空间认知的九层模型? 5、地理空间场操作可分为哪几种? 6、何谓空间认知? 7、什么是E-R模型? 第三章: 1、OGC定义的基本几何空间对象有哪些? 2、GIS逻辑数据模型主要有哪些? 3、什么是面向对象数据模型? 4、面向对象数据模型所涉及的主要概念及主要技术有哪些? 5、三维空间数据模型主要有哪几种? 6、构成E-R模型的三要素指什么? 7、Spaghetti数据结构与拓扑矢量数据结构的差异何在? 8、简述三维矢量模型的数据结构特征。 9、简述三维体元模型的数据结构特征。

10、空间关系主要有哪几种? 11、GIS逻辑数据模型主要有哪几种? 第四章: 1、ArcGIS的Geodatabase是如何定义空间对象模型的? 2、空间数据的管理方式有哪些? 3、什么是空间数据引擎? 4、空间数据库引擎管理空间数据的实现方法有哪些? 5、何谓栅格金字塔结构? 6、空间数据库引擎的作用是什么? 7、栅格数据的存储方式主要有哪些? 8、栅格数据有几种取值方法? 9、空间数据的组织方式有哪些? 10、主要空间数据库管理方法各有何优缺点? 第五章: 1、四叉树索引有几种方法? 2、简述网格空间索引的基本原理。

空间数据库建库复习资料

第一章 1.GIS的名词分析与推论 GIS概念:具有地理数据的采集、管理、分析、表达能力,能为决策者提供有用地理信息的系统。 推论1:地理信息系统采集的数据为空间数据,即具有空间位置,又具有属性特征。地理信息系统的数据库因此又称为空间数据库。 推论二:地理信息系统具有采集、管理、分析地理数据和表达地理信息的能力。包括空间数据库建设和空间数据库的应用两个层次。 推论三:地理信息系统包括计算机硬件、软件、数据、系统开发人员和用户,但由于处理和分析的是地理数据,因此,在通用的硬件、软件基础上,还有体现专业特点的硬、软件。 2.GIS空间数据体系 空间数据库:空间数据和属性数据的组织 矢量有混合式、扩展式和开放式

矢量数据的空间数据组织:空间坐标数据的非结构化和属性数据的结构化 栅格数据:像元阵列 3.GIS数据模型 矢量数据模型:简单数据结构(面条结构):如Shapefile、拓扑数据结构:如Coverge、面向对象的数据模型:如Geodatabase 栅格数据模型:栅格文件常用格式:*.tif,*.jpg,*.bmp等。GIS中的栅格格式:ESRI 的Grid、Geodatabase的栅格数据集等。遥感图像的格式:PCI的* .pix,Erdas 的*.img等。 4.空间数据库设计核心 将现实世界抽象为GIS数据模型,这是数据库设计的核心。 5.名词解释: 面条结构:数据按点、线、面为单元进行组织,点、线、面都有自己的坐标数据。最典型的是面条结构。 拓扑数据结构:不仅存储空间位置,同时存储空间关系。 拓扑关联:指存在于空间图形的不同类型元素之间的拓扑关系。如结点与弧段、弧段与多边形。 第二章 1.名词解释: 数据词典:以词典的方式描述和定义E-R模型设计中出现和形成的实体、关系。数据模型匹配:实现将实体类型和特征类型(Coverage、Shapefile、Grid等)的匹配。 区:基于现有的面特征来描述复杂的区域如多个独立的多边形组成的区域、相互

关系型数据库存储空间数据的研究和应用

https://www.360docs.net/doc/501104021.html, 关系型数据库存储空间数据的研究和应用 李敏 长安大学汽车学院西安 710054 胡群袖 中南大学信息科学与工程学院长沙 410083 lilacesuefvy@https://www.360docs.net/doc/501104021.html, 摘要:对空间数据库的研究是当前的GIS领域的一个热点。本文对于空间数据在关系数据库中的存储表示和查询过程进行了研究,开发出关系型数据库与MapGIS应用程序之间的中间件,能够将MapGIS明码文件数据转储到SQL SERVER数据库中,并从数据库中读取数据进行显示查询。 关键字:空间数据库,中间件,数据转储, MapGIS明码文件 1. 引言 空间数据是地理信息系统的血液,而如何有效地存储空间数据就成为地理信息系统的核心问题。受以往数据库的限制,空间数据和属性数据是分开存储的,随着GIS应用向分布式管理系统领域的转移,在数据共享、网络通信、并发控制等方面出现了许多难以解决的问题。大型关系型数据库技术的日益完善,促使GIS软件都在向集成管理的方向发展,即充分利用关系数据库管理系统的优势,真正实现了空间数据一体化管理。在空间数据库的数据模型中能提供空间数据类型和查询语言,支持空间关系、空间特征和空间操作。在空间数据库的实施中支持空间数据类型,可进行有效的检索和索引,支持空间选择和空间连接[1]。 利用现有的成熟关系型数据库技术进行空间数据的管理,涉及到怎样将空间数据导入到关系型数据库中,数据库的逻辑模型等方面。本文结合当前的关系型数据库开发出一个中间件,将MapGIS的明码数据文件转储到关系型数据库中,使MapGIS应用程序能够通过中间件实现对数据库中的图形数据进行显示和查询。 2. 空间数据库 空间数据库管理技术是当前数据库领域的一个研究热点。目前GIS软件与大型商用关系型数据库管理系统(RDBMS)的集成采用面向对象技术和中间件技术两种方式来实现[2]。 面向对象技术是指通过对象的行为(空间数据操作)来控制对象的属性(空间数据及其属性数据),克服空间数据的非结构化特征。如MapInfo公司的SpatialWare是第一个在“对象-关系”型数据库环境下基于SQL进行空间查询和分析的空间信息管理系统。它不仅实现了在数据库中存储空间数据类型的目标,而且建立了一套基于标准SQL的空间运算符,使得空间查询和分析能在服务器端进行。其高效的基于R-Tree的空间索引技术,保证了空间查询的快速性和准确性。 中间件是GIS平台与空间数据库之间的转换层,通过中间件的作用,将不同的操作系统平台和数据库平台的差异之处屏蔽在中间件之后,将面向空间数据管理及应用所需的技术高度专业化地实现出来,供不同的客户端高效地共享和互操作。数据访问中间件为异构空间数据的共享和互操作性提供了良好的解决方案,通过提供统一的访问接口和操作模式,屏蔽 - 1 -

数据库系统概论第一章课后答案

第01章绪论 1 .试述数据、数据库、数据库系统、数据库管理系统的概念。 答: ( l )数据(Data ) :描述事物的符号记录称为数据。数据的种类有数字、文字、图形、图像、声音、正文等。数据与其语义是不可分的。解析在现代计算机系统中数据的概念是广义的。早期的计算机系统主要用于科学计算,处理的数据是整数、实数、浮点数等传统数学中的数据。现代计算机能存储和处理的对象十分广泛,表示这些对象的数据也越来越复杂。数据与其语义是不可分的。500 这个数字可以表示一件物品的价格是500 元,也可以表示一个学术会议参加的人数有500 人,还可以表示一袋奶粉重500 克。 ( 2 )数据库(DataBase ,简称DB ) :数据库是长期储存在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。 ( 3 )数据库系统(DataBas 。Sytem ,简称DBS ) :数据库系统是指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。解析数据库系统和数据库是两个概念。数据库系统是一个人一机系统,数据库是数据库系统的一个组成部分。但是在日常工作中人们常常把数据库系统简称为数据库。希望读者能够从人们讲话或文章的上下文中区分“数据库系统”和“数据库”,不要引起混淆。 ( 4 )数据库管理系统(DataBase Management sytem ,简称DBMs ) :数据库管理系统是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。DBMS 的主要功能包括数据定义功能、数据操纵功能、数据库的运行管理功能、数据库的建立和维护功能。解析DBMS 是一个大型的复杂的软件系统,是计算机中的基础软件。目前,专门研制DBMS 的厂商及其研制的DBMS 产品很多。著名的有美国IBM 公司的DBZ 关系数据库管理系统和IMS 层次数据库管理系统、美国Oracle 公司的orade 关系数据库管理系统、s 油ase 公司的s 油ase 关系数据库管理系统、美国微软公司的SQL Serve ,关系数据库管理系统等。

空间数据库的发展与应用

空间数据库结课报告—空间数据库的发展与应用学号: 班级序号: 专业: 姓名: 指导老师: 中国地质大学(武汉)信息工程学院 2013年1月

目录 一、前言 (3) 二、空间数据库的简介及特征 (3) 2.1空间数据库简介 (3) 2.2空间数据库的特征 (3) 2.2.1空间数据库的完备性 (3) 2.2.2空间查询的执行效率 (3) 2.2.3空间数据的物理特征 (4) 三、空间数据库管理系统模式 (4) 四、空间数据库的应用模式 (4) 4.1文件与关系数据库混合管理系统 (4) 4.2全关系型空间数据库管理系统 (5) 4.3对象—关系数据库管理系统 (6) 4.4面向对象空间数据库管理系统 (6) 4.5面向对象的矢栅一体化空间数据库管理系统 (6) 五、空间数据库的实际应用.......................................................................................... .7 5.1空间数据库实际应用的必要性 (7) 5.2空间数据库的具体应用 (7) 5.2.1实例1—石油地质空间数据库 (7) 5.2.2实例2—城市规划图 (9) 六、结束语 (10) 参考文献 (11)

空间数据库的发展与应用 XXX (中国地质大学(武汉)信息工程学院湖北武汉 430074) 摘要:在GIS的基础上,鉴于实际需求下,空间数据库应运而生,本文从空间数据库的简单介绍开始,主要概述了空间数据库的发展、特征、应用类型及其在发展中的一些实际应用。在通过对文献的阅读它的实际作用和空间数据库管理系统模式的概述,对空间数据库从三方面有了进一步的了解,最后列出空间数据库在实际应用中的具体案例。 关键词:空间数据库;GIS;特征;模式;类型;应用。 一、前言 地理信息系统( Geographic Informa tion System ,GIS)融合了信息学、地理学、测绘学、城市科学等一系列科学技术,是一门典型的边缘学科。经过40余年的发展,GIS 经历了从最早期简单的机助制图,到现在与 卫星遥感技术相结合的过程,已经发展成为 一项非常成熟的应用技术,活跃于生产和生 活的各个部门。但是,GIS 的广泛应用和深 入发展, 也给 GIS 数据库带来了数据量激 增的问题,而且传统GIS中空间数据与属性数据是分别存储的,即空间数据(图形数据) 以文件格式存放,非空间数据(属性数据)则 存放在关系数据库中,形成文件 + 关系数 据库的二元存储模式。这样的存储方式在数据安全和数据共享方面都存在着不少缺陷。基于这种情况,GIS自身的数据存储能力显 然已经不能完全满足实际需求,需要借助功 能更加强大的外部数据库来存储和处理海 量数据。空间数据库正是在这一背景下应运而生, 并应用到了 GIS中。 二、空间数据库的简介及 特征。 2.1空间数据库简介 空间信息是指与位置(特别是地理位置)有关的信息,它在信息中占有相当大的比例(曾有统计可达 80%)然而,空间信息又有其特殊的一面,它具有诸如数据量巨大、结构复杂多样操作是计算密集型的具有自相关性等特性随着IT技术的迅速发展,以GIS 为代表的空间信息技术在各领域得到了应用,同时遥感等空间信息获取技术不断进步,现代社会对位置服务和分析决策的需要也日益迫切,因此深入研究和掌握空间信息技术的理论与方法的重要性也日益凸显出来空间数据库是近年的热点研究领域,是一门前沿的交叉学科其研究成果(如空间多维索引)开始应用于许多不同领域正是已有应用的需求推动了空间数据库管理系统的研究,这些应用包括地理信息系统(geographical information system ,GIS)和计算机辅助设计(computer-aided design ,CAD),以及诸如多媒体信息系统数据仓库等近年来,许多计算机应用领域通过扩充数据库管理系统的功能来支持与空间相关的数据空间数据库管理系统(spatial database management system ,SDBMS)研究是找到有效处理空间数据的模型和算法的重要步骤。 2.2空间数据库的特征 2.2.1空间数据的完整性 所谓完整性,就是数据的正确性和一致性,在关系型数据库中,有实体完整性参照完整性用户自定义完整性;在空间数据库中,语义层面的空间数据的正确性和一致性,就很难界定,它要比关系型属性数据复杂得多。打个比方一条道路横跨一条河流,必然经过一座桥,而如果不经过,就必然违背了空间数据的正确性,也就是说不完整这只是一个很简单的例子,类似于这样的空间语义关系,

相关文档
最新文档