空间数据库复习重点答案完整)

空间数据库复习重点答案完整)
空间数据库复习重点答案完整)

1、举例说明什么是空间数据、非空间数据?如何理解空间查询和非空间查询的区别?常用的空间数据库管理方式有哪几种及其各自特点。

数据:是指客观事务的属性、数量、位置及其相互关系等的符号描述。空间数据:是对现实世界中空间对象(事物)的描述,其实质是指以地球表面空间位置为参照,用来描述空间实体的位置、形状、大小及其分布特征等诸多方面信息的数据。河流的泛洪区,卫星影像数据、气象气候数据等都可以是空间数据书店名称店员人数,去年的销售量,电话号码等是非空间数据

空间查询是对空间数据的查询或命令

人工管理阶段

文件管理阶段缺点:

1)程序依赖于数据文件的存储结构,数据文件修改时,应用程序也随之改变。

2)以文件形式共享,当多个程序共享一数据文件时,文件的修改,需得到所有应用的许可。不能达到真正的共享,即数据项、记录项的共享。

常用:

文件与数据库系统混合管理阶段优点:由于一部分建立在标准的RDBMS上,存储和检索数据比较有效、可靠。

缺点:1)由于使用了两个子系统,它们各自有自己的规则,查询操作难以优化,存储在RDBMS外的数据有时会丢失数据项的语义。

2)数据完整性的约束条件可能遭破坏,如在几何空间数据系统中目标实体仍存在,但在RDBMS中却已删除。

3)几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多

全关系型空间数据库管理系统

◆属性数据、几何数据同时采用关系式数据库进行管理

◆空间数据和属性数据不必进行烦琐的连接,数据存取较快

◆属性间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作

◆GIS软件:System9,Small World、GeoView等

本质:GIS软件商在标准DBMS顶层开发一个能容纳、管理空间数据的系统功能。

对象关系数据库管理系统

优点:在核心DBMS中进行数据类型的直接操作很方便、有效,并且用户还可以开发自己的空间存取算法。缺点:用户须在DBMS环境中实施自己的数据类型,对有些应用相当困难。

面向对象的数据库系统。

采用面向对象方法建立的数据库系统;

对问题领域进行自然的分割,以更接近人类通常思维的方式建立问题领域的模型。

目前面向对象数据库管理系统还不够成熟,价格昂贵,在空间数据管理领域还不太适用;

基于对象关系的空间数据库管理系统可能成为空间数据管理的主流

2、什么是GIS,什么是SDBMS?请阐述二者的区别和联系。

GIS是一个利用空间分析功能进行可视化和空间数据分析的软件。它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量GIS 可以利用SDBMS来存储、搜索、查询、分享大量的空间数据集

改:地理信息系统是以地理空间数据库为基础,在计算机软硬件的支持下,运用系统工

科学管理和综合分析具有空间内涵的地理数据,以提供管理、决策等所需信息的技术系统。简单的说,地理信息系统就是综合处理和分析地理空间数据的一种技术系统。

2、SDBMS是一个软件模块。它可以①、利用一个底层的数据库管理系统②、支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言③、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则

3、区别与联系:①、利用GIS可以对某些对象和图层进行操作,而利用SDBMS则可以对更多的对象集和图层进行更加简单的操作②、SDBMS可以在GIS不能使用的某些领域进行使用,例如基因组学、天文学、多媒体信息系统等③、GIS可以作为SDBMS的前端,利用一个高效的SDBMS可以大大提高GIS的效率和生产率。

改:联系:GIS可作为SDBMS的前端工具,一个高效的空间数据库系统是实现GIS高效查询和分析的前提条件。

区别:GIS和SDBMS的主要不同侧重点:

GIS是一个侧重于空间数据可视化和分析的软件,GIS常用分析功能:

GIS使用SDBMS存储、检索、查询、共享大型空间数据集

SDBMS重点关注:

高效存储、查询和共享大型空间数据集

提供尽量简单的查询方法

通过空间索引和查询优化方法加快大型空间数据集的查询反应时间

SDBMS有可能用于非GIS领域的其它方面:如天文、气象、生物等

3、用传统数据库系统管理空间数据,存在哪些局限?

只支持简单的数据类型,如:数字、字符串、日期。实现上述的多段线表达非常复杂答:(1)传统数据库系统管理的是不连续的、相关性较小的数字和字符;而地理信息数据是连续的,并且具有很强的空间相关性。

(2)传统数据库系统管理的实体类型较少,并且实体类型之间通常只有简单、固定的空间关系;而地理空间数据的实体类型繁多,实体类型之间存在着复杂的空间关系,并且还能产生新的关系(如拓扑关系)。

(3)传统数据库系统存贮的数据通常为等长记录的数据;而地理空间数据通常由于不同空间目标的坐标串长度不定,具有变长记录,并且数据项也可能很大,很复杂。

(4)传统数据库系统只操纵和查询文字和数字信息;而空间数据库中需要有大量的空间数据操作和查询,如相邻、连通、包含、叠加等。

或者:总结标准DBMS存储空间数据的局限性

空间数据记录是变长的(如点数的可变性),而一般的数据库都只允许把记录的长度设定为固定;

在存储和维护空间数据拓扑关系方面存在着严重缺陷;

一般都难以实现对空间数据的关联、连通、包含、叠加等基本操作;

不能支持复杂的图形功能;

单个地理实体的表达需要多个文件、多条记录,一般的DBMS也难以支持;

难以保证具有高度内部联系的GIS数据记录需要的复杂的安全维护。

4、什么是SDBMS?SDBMS的三层体系结构是什么?

一个SDBMS(空间数据库管理系统)是一个软件模块,它利用一个底层数据库管理系统(如ORDBMS、OODBMS);

SDBMS支持多种空间数据类型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言

SDBMS支持空间索引、高效的空间操作算法以及

用于查询优化的特定领域规则

SDBMS包括:空间数据模型、查询语言、文件组织、查询优化等。下图表示了基于对象关系模型上的一个空间数据库应用的三层体系结构。

SDBMS三层体系结构

顶层为空间应用,如GIS、MMIS(多媒体信息系统),或者CAD。该层不直接与OR-DBMS打交道,需要一个中间层与OR-DBMS交互。

中间层:空间数据库(SDB),中间层是封装大多数空间领域知识的地方,不“插”入到OR-DBMS中。又称空间数据刀片、空间数据暗盒、空间数据引擎。

最后一层;DBMS

5、数据库模式有哪些?

物理模式(物理层设计)内模式、逻辑模式(通常简称为“模式”)子模式(外模式)通常,数据库管理系统支持一个物理模式、一个逻辑模式和多个子模式。

6、什么是数据模型?概念模型有哪些?逻辑模型有哪些?每一种模式的原理是什么?

数据模型是数据库系统中关于数据内容和数据之间联系的逻辑组织的形式表示。每一个具体的数据库都由一个相应的数据模型来定义。(数据库的概念描述,是数据库系统中用于提供信息表示和操作手段的形式构架。)

概念模型:按用户的观点从现实应用中抽象出事物以及事物之间的联系

结构数据模型:从计算机实现的观点来对数据建模

概念模型:

实体-联系模型(ER)

?现实世界被划分为若干实体(entity),由属性(attribute)来描述性质,通过联系(relationship)互

相关联

面向对象模型

逻辑数据模型:

层次模型

?用树结构表示实体之间联系的模型叫层次模型

?树由节点和连线组成

?节点代表实体型

?连线表示两实体型间的一对多联系

网状模型

网状数据模型是一个满足下列条件的有向图:

1、可以有一个以上的节点无父节点。

2、至少有一个节点有多于一个的父节点(排除树结构)。

关系模型

?用二维表来表示实体及其相互联系

面向对象模型

为了有效地描述复杂的事物或现象,需要在更高层次上综合利用和管理多种数据结构和数据模型,并用面向对象的方法进行统一的抽象。

7、数据库设计的三个步骤有哪些?每一步有些什么内容?

答、首先,采用高层次的概念数据模型来组织所有与应用相关的可用信息;

然后,逻辑建模阶段,与概念数据模型在商用DBMS上的具体实现有关

最后,数据库设计的第三个步骤是物理设计的建模,它解决数据库营养在计算机中具体实现是方方面面的细节。

改:概念模型

?按用户的观点从现实应用中抽象出事物以及事物之间的联系

逻辑建模

?建立概念和联系的逻辑结构

逻辑结构设计的步骤:

1)将概念结构转化为一般的关系、网状、层次模型、面向对象模型

2)对数据模型进行优化

3)设计用户子模式

物理设计建模

?对逻辑结构进行具体实现方面的安排和考虑

?存储组织、索引、内存管理……

8、ER模型的作用,ER图包括哪些要素,如何表达多值属性?

答:ER图可以以一种避开计算机隐喻的方式来表达这个微型世界,从而把应用中的概念与实现细节分离开来。

ER图包括实体(物理上或概念上独立存在的事物或对象)、属性和联系。实体用属性来刻画性质,实体之间通过练习相互作用和关联。属性可以是单值或多值。ER图中实体用矩形表示,属性表示为椭圆,联系为菱形。码属性加下划线,多值属性用双椭圆。

9、对于空间数据,ER模型方法的不足之处?为表达空间概念,扩展ER模型主要增加了哪些要素?举例说明用象形符号扩展ER图,对于空间数据建模有何好处?

.ER图在空间建模中的不足:

场模型无法用ER模型进行自然映射——因为:ER模型的最初设计隐含了基于对象模型的假设。

传统ER模型中,实体之间的关系由应用来导出;而空间建模中,空间对象之间总会有内在联系。

建模空间对象所使用的实体类型与“地图”比例尺有关。有时是点、线,有时是多边形。

扩展E-R模型:

1)、实体象形图:

象形图:象形图是一种将对象插在方框内的微缩图表示,这些微缩图用来扩展ER图,并插到实体矩形框中的适当位置。

形状:形状是象形图中的基本图形元素,它代表着空间数据模型中的元素。

一个模型元素可以是基本形状、复合形状、导出形状或备选形状。

基本形状

复合形状:为了处理那些不能用某个基本形状表示的对象,我们定义了一组聚合的形状,并用基数来量化这些复合形状

导出形状:如果一个对象的形状是由其他对象的形状导出的,那么就用斜体形式来表示这个象形图。

备选形状:备选形状可以用于表示某种条件下的同一个对象。例如,根据比例尺,一条河流可以表示成一个多边形或一条线。

任意形状:对于形状的组合,我们用通配符(*)表示,它表示各种形状。例如,一个灌溉网是由泵站(点)、水渠(线)以及水库(多边形)所组成的。

用户自定义形状

2)、联系象形图。

联系象形图用来构建实体间联系的模型。例如,part-of用于构建道路与路网之间联系的模型,或是用于把森林划分成林分的建模。

好处:用象形符号扩展ER图,以便专门处理空间数据类型。这将减少ER图以及所产生的关系模式的复杂

度,同时改进空间建模的质量。空间联系(例如Road-Crosses-River)就可以从ER图中省略,用隐式的方式表

示。关系模式中的表达多值空间属性的关系和M:N空间联系也就不需要了

10、举例说明如何将ER图映射成关系模型?

1.实体映射成单独关系

2.对于基数为1∶1的联系转换为一个独立的关系模式,也可与任一端对应的关系模式合并。将任一实体的

码属性作为其他关系的一个外码。如Manager-Forest

3.对于基数为M∶1的联系,可以转换为一个独立的关系模式,也可以与M端对应的关系模式合并。将“1”

侧关系的主码作为“M”侧关系的外码,转换来的关系的主码为M 侧的码。如Forest-FireStation

4.对于基数M:N的联系,则每一个M:N的联系被映射成一个新关系,其主码由参与的实体对主码组成,联

系的属性映射成关系的属性,如Facility-River

5.对于多值属性,创建一个具有两列的新关系,一列对应多值属性,另一列对应实体的码。多值属性和实

体码一起构成新的关系的主码。如Forest-stand的几何属性polygonid,新表为Fstand-Geom。

6.多值属性Elevation也需要一个新表,表中由ForestName、Elevation和Pointid共同构成主码。

7. 具有相同码的关系模式可合并

11、常用的空间信息模型有哪些?它们分别由哪些内容组成?采用什么样的数据结构?基于每种空间信息

模型有哪些操作?

两种常用空间信息模型:

场模型(Field base model),采用栅格模型

对象模型(Object based model),采用矢量结构

场模型用于表示具有连续的空间变化的情况,形状不定的现象。对象模型用于表示具有固定形状的空间实体/概念描述空间上离散的空间对象。

场模型的3个组成部分:空间框架、场函数、场操作。

场操作分类:

(1)局部操作

对于局部操作,空间框架内一给定位置的新场取值只依赖于同一位置场的输入值。

(2)聚焦操作

指定位置的结果场的值依赖于同一位置的一个假定领域上的场的值

设E(x,y)是state-park的高程场,E给出了空间框架F在位置(x,y)的高程值,计算高程场的梯度▽E(x,y) ,就是一个聚焦操作,梯度值依赖于(x,y)的邻域场(x1,y1)的高程。

(3)区域操作

与聚集运算符或积分运算有关。如在森林的例子中求某种树种的平均高度。

对象模型的组成部分:对象类型、对象属性和操作、对象关系。

空间对象的操作:面向集合的、拓扑的方位的、度量空间的、欧氏空间的

12、什么是范式理论?理解并简述函数依赖、部分函数依赖、部分函数依赖、传递函数依赖的涵义。

范式是符合某一种级别的关系模式的集合。

设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y” 或“Y函数依赖于X”,记作X→Y。X称为这个函数依赖的决定属性集(Determinant)。Y=f(x)

函数依赖不是指关系模式R的某个或某些关系实例满足的约束条件,而是指R的所有关系实例均要满足的约束条件。

在关系模式R(U)中,如果X→Y,并且对于X的任何一个真子集X’,都有X’ Y, 则称Y完全函数依赖于X,记作X fY。若X→Y,但Y不完全函数依赖于X,则称Y部分函数依赖于X,记作X P Y。在关系模式R(U)中,如果X→Y,Y→Z,且Y ?X,Y→X,则称Z传递函数依赖于X。

注: 如果Y→X,即X←→Y,则Z直接依赖于X。

13、结合实例,简述1~4NF的涵义,并能判别属于第几范式,及如何转换成更高级别的范式。

各种范式之间存在联系:

2

3

1?

?

?

?

?

4

NF

NF

BCNF

NF

NF

NF5

某一关系模式R为第n范式,可简记为R∈nNF。

1NF的定义:如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF。第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库。

但是满足第一范式的关系模式并不一定是一个好的关系模式。

2NF的定义:定义5.6 若关系模式R∈1NF,并且每一个非主属性都完全函数依赖于R的码,则R∈2NF。(所有非主属性完全依赖每个候选关键字。)

例:SLC(Sno, Sdept, Sloc, Cno, Grade) ∈1NF

SLC(Sno, Sdept, Sloc, Cno, Grade) ∈2NF SC(Sno,Cno,Grade)∈2NF

SL(Sno,Sdept,Sloc)∈2NF

(sloc为学生住处,sdept为选课)

订单号商品号商品名商品描述单价供应商号供应商名供应商电话

000001 200 A ........ 2.00 234560 XXXXXX ..........

000001 201 B ........ 1.00 234560 XXXXXX ..........

000001 202 C ........ 10.00 234560 XXXXXX ..........

000001 203 D ........ 20.00 234560 XXXXXX ..........

000001 204 E ........ 5.00 234560 XXXXXX ..........

-------------------------------------------------------------------------------

000002 200 A ........ 2.00 234561 YYYYYY ..........

000002 201 B ........ 1.00 234561 YYYYYY ..........

000002 202 C ........ 10.00 234561 YYYYYY ..........

000002 204 E ........ 5.00 234561 YYYYYY ..........

-------------------------------------------------------------------------------

000003 202 C ........ 10.00 234560 XXXXXX ..........

000003 203 D ........ 20.00 234560 XXXXXX ..........

000003 204 E ........ 5.00 234560 XXXXXX ..........

(订单号商品号商品名商品描述单价供应商号供应商名供应商电话)

其中:主码(订单号,商品号)

商品号?(商品名,商品描述, 单价)

因为“商品号”在表中是主键的一部分, 所以“商品名商品描述单价”对于“商品号”存在部分函数依赖.

将存在部分依赖关系的列拿出来新生成一个新的表Product,

而原来的Order表中去掉了一些列,形成一个新的Order表,

Order表: 订单号商品号供应商号供应商名供应商电话...

Product表: 商品号商品名商品描述单价...

采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。

将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。

SL(Sno,Sdept,Sloc)∈2NF

例:2NF关系模式SL(Sno, Sdept, Sloc)中

函数依赖:

Sno→Sdept

Sdept→Sloc

Sno→Sloc

Sloc传递函数依赖于Sno,即SL中存在非主属性对码的传递函数依赖。

解决方法

采用投影分解法,把SL分解为两个关系模式,以消除传递函数依赖:

SD(Sno,Sdept)

DL(Sdept,Sloc)

SD的码为Sno,DL的码为Sdept。

定义3FN: 关系模式R中若不存在这样的码X、属性组Y及非主属性Z(Z ? Y), 使得X→Y,Y→X,Y→Z,成立,则称R∈3NF。(所有非主属性都不传递函数依赖每个候选关键字或一个或多个属性(列)依赖于非主键的属性(列). )

例,SL(Sno, Sdept, Sloc) ∈2NF

SL(Sno, Sdept, Sloc) ∈3NF

SD(Sno,Sdept)∈3NF

DL(Sdept,Sloc)∈3NF

若R∈3NF,则R的每一个非主属性既不部分函数依赖于候选码也不传递函数依赖于候选码。

如果R∈3NF,则R也是2NF。

采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。

将一个2NF关系分解为多个3NF的关系后,并不能完全消除关系模式中的各种异常情况和数据冗余。

学生关系表Student(学号, 姓名, 年龄, 所在学院, 学院地点, 学院电话),

关键字:“学号”,

(学号) →(姓名, 年龄, 所在学院, 学院地点, 学院电话)

(学号) →(所在学院) →(学院地点, 学院电话):即存在非关键字段“学院地点”、“学院电话”对关键字段“学号”的传递函数依赖。

这个关系是符合2NF的,但是不符合3NF,

它也会存在数据冗余、更新异常、插入异常和删除异常的情况,

把学生关系表分为如下两个表:

学生:(学号, 姓名, 年龄, 所在学院);

学院:(学院, 地点, 电话)。

这样的关系是符合3NF

假设仓库管理关系表为StorehouseManage(仓库ID, 存储物品ID, 管理员ID, 数量),且一个管理员只在一个仓库工作;一个仓库可以存储多种物品。判断该关系模式所属范式

这个数据库表中存在如下决定关系:

(仓库ID, 存储物品ID) →(管理员ID, 数量)

(管理员ID, 存储物品ID) →(仓库ID, 数量)

所以,(仓库ID, 存储物品ID)和(管理员ID, 存储物品ID)都是StorehouseManage的候选关键字,表中的唯一非关键字段为数量,它是符合第三范式的。

范式的判断:

1、确定候选键,找出主属性和非主属性

2、确定非主属性和候选键之间是否存在函数依赖,若存在部分函数依赖,则关系模式属于1NF, 若存

在传递函数依赖,则关系模式属于2NF, 若消除了部分函数依赖和传递函数依赖,则关系模式属于3NF 候选键的确定:

1、可以按照候选键的定义求解,即关系模式R(U,F)中的一个或一组属性X,若属性集U完全依

赖于X,则X为关系模式R的候选键。也就是说根据语义分析得到的F,如果X可以确定每一个属性,那么X就是候选键。

4NF定义:关系模式R(U,F)∈1NF,如果对于R的每个非平凡多值依赖X Y(Y不包含于X),X 都含有候选码,则R ∈4NF。

4NF 限制关系模式的属性之间不允许有非平凡且非函数依赖的多值依赖。

如果一个关系模式是4NF,则必为BCNF

B表示参考书。假设某一门课由多个教师讲授,一

门课使用相同的一套参考书。

关系模式存在以下依赖:

数学?[邓海,陈红]?[高数,数学分析,微分方程]

物理?[李东,张强,刘明] ?[普通物理学,光学]

该关系模式码为(C,T,B),为全码。满足BCNF,但仍存在四种异常。

为什么呢?

对TEACH(C,T,B)处理,去掉多值依赖。

分解两个关系模式:

CT(C,T)∈4NF

CB(C,B)∈4NF

14、什么是拓扑关系,举例说明拓扑与非拓扑特性、拓扑与非拓扑操作。

拓扑关系

答:是指满足拓扑几何学原理的各空间数据间的相互关系。即用结点、弧段和多边形所表示的实体之间的邻接关联和包含等关系。

拓扑特性:弹性变形后临近物体之间的拓扑关系没有发生改变

非拓扑特性:弹性变形后临近物体之间的拓扑关系发生了改变

拓扑操作与非拓扑操作

常见的拓扑属性

endpoint(point, arc) 点是弧的端点

simple-nonself-intersection(arc) 非自交的弧

on-boundary(point, region) 点在区域的边界上

inside(point, region) 点在区域内部

outside(point, region) 点在区域之外

open(region) 区域是开域(不包括边界)

close(region) 区域是闭域(包括边界)

connected(region) 区域是连通域(区域上任2点,都有路径相连)

inside(point, loop) 点在环中

crosses(arc, region) 弧穿过区域

touches(region, region) 区域与区域相邻

touches(arc, region) 弧与区域相邻

overlap(region, region) 区域与区域重叠

常见的非拓扑属性

Euclidean-distance(point, point) 2点间的欧氏距离

direction(point, point) 点在点的东面

length(arc) 弧的长度(单位向量长度为1个单位)

perimeter(area) 区域的周长(单位正方形的周长为4个单位)

area(region) 区域的面积(单位正方形的面积为1个平方单位)

拓扑信息:研究空间相关的事物本身或者事物之间的在空间坐标变换下的不变质

事物本身的内外关系

事物之间的相离、相接、相交

事物之间相连的布局

几何信息

描述了事物在空间中的位置及所占据的范围

将地球表面以投影方式转换为平面

通过平面几何来抽象描述和研究事物的位置和范围

用图形和符号的方式来描绘这些空间相关的事物

属性信息

与位置范围无关的其它信息

描述了事物本身的内在性质和外在表现

事物之间的非位置关系

???用于空间对象之间拓扑关系的操作测试8个

Equal 相等——若2个几何体的内部和边界在空间上都相等,则返回真Disjoint 相离——若2个几何体的内部和边界都不相交,则返回真

Intersect 交叠——若2个几何体相交,则返回真

Touch 相接——若2个面仅边界相交,而内部不相交,则返回真

Cross 横过——若一条线和面的内部相交,则返回真

Within 在内部——若给定的几何体的内部不与另一个几何体的外部相交,则返回真Contains 包含——若给定的几何体包含另一个几何体,则返回真

Overlap 覆盖/被覆盖——若2个几何体的内部有非空交集,则返回真

15. OGIS提出的关于空间几何体的基本构件有哪些?

16、OGIS支持的空间操作有哪些?

OGIS类中操作分3类

用于所有几何类型的基本操作6个

SpatialReference( ) 返回几何体的基本坐标系统

Envelope( ) 返回包含几何体的最小外接矩形

Export( ) 返回以其他形式表示的几何体

IsEmpty( ) 若几何体为空集,则返回真

IsSimple( ) 若几何体为简单的(不自交的),则返回真

Boundary( ) 返回几何体的边界

用于空间对象之间拓扑关系的操作测试8个

Equal 相等——若2个几何体的内部和边界在空间上都相等,则返回真

Disjoint 相离——若2个几何体的内部和边界都不相交,则返回真

Intersect 交叠——若2个几何体相交,则返回真

Touch 相接——若2个面仅边界相交,而内部不相交,则返回真

Cross 横过——若一条线和面的内部相交,则返回真

Within 在内部——若给定的几何体的内部不与另一个几何体的外部相交,则返回真

Contains 包含——若给定的几何体包含另一个几何体,则返回真

Overlap 覆盖/被覆盖——若2个几何体的内部有非空交集,则返回真

用于空间分析的一般操作7个

Distance 求距离——返回2个几何体之间的最短距离

Buffer 求缓冲区——返回到给定几何体距离小于等于指定值的几何体的点的集合

ConvexHull 求最小闭包——返回几何体的最小闭包

Intersection 集合交——返回2个几何体的交集构成的几何体

Union 集合并——返回2个几何体的并集构成的几何体

Difference 集合差——返回几何体与给定几何体不相交的部分

SymmDiff 返回2个几何体与对方互不相交的部分

17. 说明九交模型表达拓扑关系的原理。

在一个平面上。两个对象A、B之间的二元拓扑关系主要基于以下的相交情况,即分别是A和B的内部、边界、外部。值六部分可以构成九交模型。

考虑取值有空(0)和非空(1),可以确定有29=512种二元拓扑关系。对于R2嵌在中的二维区域,有八个关系是可实现的,并且它们彼此互斥且完全覆盖。:相离、相接、交叠、相等、包含、在内部、覆盖、被覆盖。

18. 简述关系模式中的三种完整性。

答:码约束:每个关系必须要有一个主码;

实体完整性约束:主码不能为空;

参照完整性约束:外码的属性值要么是另一个关系的主码,要么为空值。

19. 主码、外码的概念。

从候选码中选择一个唯一地标识一个元组候选码作为码。若候选码多于一个,则选定其中的一个做为主码(Primary Key)。

外码:关系模式R中属性或属性组X并非R的码,但X是另一个关系模式的码,则称X是R的外部码,简称外码

20、UML的作用?了解UML的主要符号。

UML是用于面向对象软件设计的概念层建模的新兴标准之一,它是一种标准化语言,用于在概念层对结构化模式和董涛行为进行建模。

符号:类——等价于ER图中实体,可象形图扩展;属性——数据成员;方法——成员函数;关系——类之间的联系。3种关系:聚合关系,泛化关系,关联关系。

改:UMLCD符号

类——等价于ER图中实体,可象形图扩展

属性——数据成员:+ ——公有的;- ——私有的;# ——受保护的

方法——成员函数

关系——类之间的联系,类似于ER图中联系

3种关系:聚合关系——整体-部分关系,一个类作为另一个类的一部分——强聚合

一个类作为多个类的一部分——弱聚合

泛化关系——generalization,几个子类抽象出一个父类

关联关系——不同类的对象之间的联系。涉及n个类——n元关联

21、比较ER与UML。

答:1)、没有方法的类就是实体;2)、属性在两个里都一样;3)、UML中没有主键和完整性约束;4)、ER 中没有方法;5)、ER中关系的内容更丰富;6)、ER图中的实体与数据集有关,但UML的类几乎和数据集无关。

改:

22、请列举SQL所包含哪几个部分?每个部分的功能是什么?对每种功能列举相关的操作符(语句)。

数据定义语言(DDL),例如:CREATE、DROP、ALTER等语句。

数据操作语言(DML),例如:INSERT(插入)、UPDATE(修改)、DELETE(删除)语句。数据查询语言(DQL),例如:SELECT语句。

数据控制语言(DCL),例如:GRANT、REVOKE、COMMIT、ROLLBACK等语句。

23、SQL有哪些版本,每个版本有什么特点?(参照PPT)空间数据类型和操作被允许加入到SQL的哪个版本中(SQL3).

SQL版本:SQL2 /SQL92、SQL3/SQL99

SQL-86

SQL-89:“具有完整性增强的数据库语言SQL”,增加了对完整性约束的支持

SQL-92:“数据库语言SQL”,是SQL-89的超集,增加了许多新特性,如新的数据类型,更丰富的数据操作,更强的完整性、安全性支持等。

SQL-3:新的标准,增加了对面向对象模型的支持

24、SELECT

FROM

WHERE

ORDER BY

GROUP BY,

HAVING

自己编写SQL语句实现:

(1)查询员工信息表employee中每个员工的所有信息

(2)查询员工信息表employee中员工的姓名和年龄

(3)在员工信息表employee中按照员工年龄降序查询数据

(4)在员工信息表employee中年龄在20~26岁的员工姓名

(5)在员工信息表employee中查询姓赵的员工信息

(6)在员工信息表employee中,求所有员工业绩的总合

(7)在员工信息表employee中,查询业绩最高的员工信息

(8)查询员工信息表employee中员工的数量

(9)在员工信息表employee中,按照员工部门对记录进行分组

(10)在员工信息表中,统计各部门员工的总业绩

(11)在员工信息表中,按照部门进行分组并对计算部门员工的平均年龄,再查询平均年龄小于22的信息. 答:1) SELECT*from employee

(2) select员工姓名,员工年龄from employee

(3) select*from employee

order by员工年龄desc

(4) select员工姓名from employee

where员工年龄between 20 and 26

(5) select*from employee

where员工姓名like'赵%'

(6) select sum(员工业绩)as员工业绩总和from employee

(7) select*from employee

where员工业绩=(select MAX(员工业绩)from employee)

(8) select COUNT(员工编号)as员工数量from employee

(9) select COUNT(*)as部门数,所在部门from employee

group by所在部门

(10) select所在部门,SUM(员工业绩)as总业绩from employee

group by所在部门

(11)select所在部门,AVG(员工年龄)as平均年龄from employee

group by所在部门

having AVG(员工年龄)< 22

(12)PPT中增加、删除、更新表中数据的例句

(13)PPT中创建、修改、删除表结构的例句

(14)PPT中授予、收回权限的例句

25、读懂书中关系代数查询、每一个空间查询例句。或者给出查询目的,要求写语句。

(1)查询:列出Country表中所有与美国相邻的国家名字

(2)查询:列出River表中河流流经的国家名字

(3)查询:对于River表中列出的河流,在City表中找到距其最近的城市

(4)查询:列出距劳伦斯河方圆300km的城市

(5)查询:列出Country表中每个国家的名字、人口和国土面积

(6)查询:求出河流在流经的各国家境内的长度

(7)查询:列出每个国家的GDP及其首都到赤道的距离

(8)查询:按邻国多少列出所有国家

(9)查询:列出只有1个邻国的国家

(10)查询:哪个国家的邻国最多

(11)用SQL语言查询:圣劳伦斯河发源地国家的首都的名字是什么,该城市的人口是多少?

(12)用集合并运算列出所有符合下列条件的国家:它们要么在北美州,要么是河流发源地的国家

(13) 用关系代数列出所有位于北美洲但不是河流发源地的国家。

(14) 用关系代数列出要么是首都城市,要么人口>2百万的城市

(15) 用关系代数列出GDP超过20亿美元的国家的首都和人口数

(16)用事务实现,对数据表table_1进行插入记录的工作,当遇到错误时回滚到插入数据前的状态(17)用事务实现,阻止其他用户对数据表进行修改,但可以查询

(18)用带锁的方式创建事务,阻止其他用户对数据表table_1进行访问

25.(1)查询:列出Country表中所有与美国相邻的国家名字

SELECT https://www.360docs.net/doc/92146557.html, AS “Neighbors of USA”

FROM Country C1, Country C2

WHERE Touch(C1.Shape, C2.Shape) = 1 AND (拓扑相接)

https://www.360docs.net/doc/92146557.html, = ‘USA’

(2)查询:列出River表中河流流经的国家名字

SELECT https://www.360docs.net/doc/92146557.html,, https://www.360docs.net/doc/92146557.html,

FROM River R, Country C

WHERE Cross(R.Shape, C.Shape) = 1 (横过)

(3)查询:对于River表中列出的河流,在City表中找到距其最近的城市

SELECT https://www.360docs.net/doc/92146557.html,, https://www.360docs.net/doc/92146557.html,

FROM City C1, River R1

WHERE Distance(C1.Shape, R1.Shape) < (求距离)

ALL(SELECT Distance(C2.Shape, R1.Shape)

FROM City C2

WHERE https://www.360docs.net/doc/92146557.html, <> https://www.360docs.net/doc/92146557.html,)

(4)查询:列出距劳伦斯河方圆300km的城市

SELECT https://www.360docs.net/doc/92146557.html,

FROM City Ci, River R

WHERE Overlap(Ci.Shape, Buffer(R.Shape, 300)) = 1 AND (被覆盖缓冲区)

https://www.360docs.net/doc/92146557.html, = ‘St. Lawrence

(5)查询:列出Country表中每个国家的名字、人口和国土面积

SELECT https://www.360docs.net/doc/92146557.html,, C.Pop, Area(C.Shape) AS “Area” (求面积,仅适用于多边形、多个多边形,若为经纬度坐标,则需中间变换,对求距离、长度一样)

FROM Country C

(6)查询:求出河流在流经的各国家境内的长度

SELECT https://www.360docs.net/doc/92146557.html,, https://www.360docs.net/doc/92146557.html,, Length(Intersection(R.Shape, C.Shape) AS “Length” (求长度,线串与多边形的交集为线串)

FROM River R, Country C

WHERE Cross(R.Shape, C.Shape) = 1 (河流流经的国家)

(7)查询:列出每个国家的GDP及其首都到赤道的距离

SELECT https://www.360docs.net/doc/92146557.html,, Co.GDP, Distance(Point(0, Ci.Shape.y), Ci.Shape) AS “Distance” (求距离,↑赤道上与城市经度相同的点)

FROM Country Co, City Ci

WHERE https://www.360docs.net/doc/92146557.html, = Ci.Country AND

Ci.Capital =‘Y’

(8)查询:按邻国多少列出所有国家

SELECT https://www.360docs.net/doc/92146557.html,, Count(https://www.360docs.net/doc/92146557.html,) (计数)

FROM Country Co, Country Co1

WHERE Touch(Co.Shape, Co1.Shape) =1 (相邻)

GROUP BY https://www.360docs.net/doc/92146557.html, (按国家分组)ORDER BY Count(https://www.360docs.net/doc/92146557.html,) (按计数排序)

(9)查询:列出只有1个邻国的国家

SELECT https://www.360docs.net/doc/92146557.html,

FROM Country Co, Country Co1

WHERE Touch(Co.Shape, Co1.Shape) =1 (2国相邻)

GROUP BY https://www.360docs.net/doc/92146557.html, (按国家分组)

HAVING Count(https://www.360docs.net/doc/92146557.html,) = 1 (计数为1)

SELECT https://www.360docs.net/doc/92146557.html,

FROM Country Co

WHERE https://www.360docs.net/doc/92146557.html, IN (满足1个邻国条件)

(SELECT https://www.360docs.net/doc/92146557.html,

FROM Country Co, Country Co1

WHERE Touch(Co.Shape, Co1.Shape)=1

GROUP BY https://www.360docs.net/doc/92146557.html,

HAVING Count(*) = 1) (计数为1)(10)查询:哪个国家的邻国最多

CREAT VIEW Neighbor AS (创建视图Neighbor)

(复杂查询第一个查询——计算各国邻国数)

SELECT https://www.360docs.net/doc/92146557.html,, Count(https://www.360docs.net/doc/92146557.html,) AS “Num_neighbors” (国家计数做新属性)

FROM Country Co, Country Co1

WHERE Touch(Co.Shape, Co1.Shape) =1 (2国相邻)

GROUP BY https://www.360docs.net/doc/92146557.html, (按国家分组)

(第二个查询——从视图Neighbor中选出邻国数最大的国家)SELECT https://www.360docs.net/doc/92146557.html,, Num_neighbors

FROM Neighbor

WHERE Num_neighbors = (SELECT Max(Num_neighbors) (求最大值)

FROM Neighbor)

(11)查询:圣劳伦斯河发源地国家的首都的名字是什么,该城市的人口是多少?

SELECT https://www.360docs.net/doc/92146557.html,,Ci.Pop

FROM City Ci, Country Co, River R

WHERE R.Origin=Co.Country AND

https://www.360docs.net/doc/92146557.html,=Ci.Country AND

https://www.360docs.net/doc/92146557.html,=’https://www.360docs.net/doc/92146557.html,wrence’ AND

Ci.Capital=”Y”

(12)用集合并运算列出所有符合下列条件的国家:它们要么在北美州,要么是河流发源地的国家

1)R= πName (σCont = NAM(Country))

2)S=πorigin (River)

3) R∪S 结果表见P69

(13)列出所有位于北美洲但不是河流发源地的国家。

1)R= πName (σCont = NAM(Country))

2)S=πorigin (River)

3) R-S 结果表见P69

事务的定义:事务是数据库中执行的一个工作单位,它是由用户定义的一组操作序列组成。这些操作“要

么全做,要么都不做”。

事务的特征—— ACID原则

(1)原子性(Atomicity):指的是整体性,全部操作的不可再分,要么不执行,要么全部执行。

(2)一致性(Consistency):事务执行的结果必须是使数据库从一个一致性状态变到另一个一致状态。(3)隔离性(Isolation):一个事务的执行不能被其他事务干扰。

(4)持久性(Durability):也称永久性,指一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。

27. 什么是并发操作?并发操作可能带来哪些问题?

数据库的重要特征是支持数据共享,允许多个用户程序并行地存取数据库中的数据。这样,多个用户或多个事务可能同时对同一数据进行操作,称为并发操作。

如果系统对并发操作不加以控制,就会存取或存储不正确的数据,破坏数据的完整性。

并发操作带来的三个问题:1)丢失修改2)污读3)不可重读

28.简述污读、不可重读、活锁、死锁的概念。

污读:当事务1在读取数据对象时另一个事务T2同时对其进行修改,导致事务T1读取的数据不正确。

不可重读:当事务T1首先读取数据对象,事务T2修改数据对象的值导致事务T1再次读取数据对象时与前一次读取的对象不一致。

活锁:当某个事务请求对某一数据的排他性封锁时,由于其他事务一直优先得到对该数据的封锁与操作而使这个事务一直处于等待状态,这种状态形成活锁。

死锁:指的是多个事务因封锁冲突(竞争资源)而永远等待下去的情形。也就是说,同时处于等代状态的事务间,每个事务的执行都以另一个事务释放锁为前提,结果造成任何一个事务都无法得到执行的现象。

29.简述锁的类型及其作用?

锁的类型有:排他锁(写锁,X锁exclusive lock)作用:可以防止并发事务对资源进行访问

共享锁(读锁,S锁share lock)作用:允许并行事务读取同一种资源,这时的事务不能修改访问的数据。

30.简述一级、二级、三级封锁协议的内容和区别。

一级封锁协议:内容:事务T在修改数据对象前必须对其加X锁,直到事务结束才释放。可以解决“丢失修改” 问题!

二级封锁协议:内容:在一级封锁协议的基础上,另外加上事务T在读取数据对象R前必须对其加S锁,读完后立即释放。可以解决“污读” 问题!

三级封锁协议:内容:对于二级封锁协议当中的读锁,直到事务T结束才释放。可以解决“不可重读”问题!

31.简述解决活锁、死锁的方法。

活锁问题:当某个事务请求对某一数据的排他性封锁时,由于其他事务一直优先得到对该数据的封锁与操作而使这个事务一直处于等待状态,这种状态形成活最简单的方法就是先锁。如何才能避免活锁呢?来先服务的策略。按照请求封锁的次序对事务排队,一旦记录上的锁释放,就使申请队列中的第一个事务获得锁。

预防死锁的方法:1)一次封锁法2)顺序封锁法

死锁的诊断与解除

1)超时法:当某事务的等待时间超过了规定的时限,就认为发生了死锁。

2)等待图法:用一个有向图表示事务等待的情况。

32. view(视图)的含义和创建语句。

含义:视图是用来描述导出数据或查询结果简化复杂网状查询的表

CREATE VIEW

<视图名> [(<列名> [,<列名>]…)]

AS <子查询>

[WITH CHECK OPTION];表示对视图进行update,insert和delete操作时要保证更新、插入或删除的行满足视图定义中的谓词条件(即子查询中的条件表达式)。

33.计算机存储设备的种类?优缺点分别是什么?

寄存器(register):与运算部件直接连接,速度最快,极少(几十个)

高速缓冲存储器(cache memory):在CPU中,速度极快,容量小(几十K~2M)

主存储器(main memory):速度很快(纳秒级),一般容量在几十M~几个G

随机访问:访问任何存储单元,时间相同;易失性:断电丢失。

快闪存储器(flash memory):速度受到存储介质和接口限制;随机访问,非易失性,断电不丢失

磁盘存储器(disk memory):同上,但是机械装置,速度更慢

光盘存储器(CDROM/CDR/CDRW/DVD):只读,可写一次,可重复读写;机械装置,随机访问,速度更低

磁带存储器(tape):速度最低,容量价格比最高(至几百G)

34、磁盘存储相关概念:磁道track、扇区sector、柱面cylinder?页面的概念?

答:磁道:圆心磁盘片上向边缘延伸的同心圆

扇区:每个磁道中被分成若干等份的区域

柱面:是磁盘上具有相同镭的磁道的集合

页面:又称磁盘块。是磁盘与主存之间的最小传输单位

35、访问磁盘扇区数据的过程,哪个过程花费的时间最多?

全部存取时间:ta = ts + tl + tt

ts 寻道时间——磁头到达特定磁道的时间(平均4 ~10毫秒)

tl 延迟时间——磁盘块旋转到磁头下方的时间(平均2~5毫秒)

tt 传输时间——磁头读/写块中数据的时间

一般:ts > tl > tt

36、域(filed)、记录(record)、文件(file)的概念,

1、数据项:是可以定义数据的最小单位,也叫元素、基本项、字段等。数据项与现实世界实体的属性相对应,数据项有一定的取值范围,称为域。

2、记录:由若干相关联的数据项组成。

3、文件:文件是一给定类型的(逻辑)记录的全部具体值的集合。

37、页面的概念

页面的概念:磁盘与主存之间的最小传输单位。一个文件可能跨越多个页面。一个页面是槽的集合,一个槽包含一条记录

38、什么是聚类、内部聚类、外部聚类、全局聚类?

空间数据库期末复习重点总结

一、数据管理的发展阶段 1、人工管理阶段 2、文件系统阶段 3、数据库管理阶段 注意了解各阶段的背景和特点 二、数据库系统的特点 1、面向全组织的复杂的数据结构 2、数据的冗余度小,易扩充 3、具有较高的数据和程序的独立性:数据独立性 数据的物理独立性 数据的逻辑独立性 三、数据结构模型三要素 1、数据结构 2、数据操作 3、数据的约束性条件 四、数据模型反映实体间的关系 1、一对一的联系(1:1) 2、一对多的联系(1:N) 3、多对多的联系(M:N) 五、数据模型: 是数据库系统中用于提供信息表示和操作手段的形式构架。 数据库结构的基础就是数据模型。数据模型是描述数据(数据结构)、数据之间的联系、数据语义即数据操作,以及一致性(完整性)约束的概念工具的集合。 概念数据模型:按用户的观点来对数据和信息建模。ER模型 结构数据模型:从计算机实现的观点来对数据建模。层次、网状模型、关系 六、数据模型的类型和特点 1、层次模型: 优点:结构简单,易于实现 缺点:支持的联系种类太少,只支持二元一对多联系 数据操纵不方便,子结点的存取只能通过父结点来进行 2、网状模型: 优点:能够更为直接的描述世界,结点之间可以有很多联系 具有良好的性能,存取效率高 缺点:结构比较复杂 网状模型的DDL、DML复杂,并且嵌入某一种高级语言,不易掌握,不易使用

3、关系模型: 特点:关系模型的概念单一;(定义、运算) 关系必须是规范化关系; 在关系模型中,用户对数据的检索操作不过是从原来的表中得到一张新的表。 优点:简单,表的概念直观,用户易理解。 非过程化的数据请求,数据请求可以不指明路径。 数据独立性,用户只需提出“做什么”,无须说明“怎么做”。 坚实的理论基础。 缺点:由于存储路径对用户透明,存储效率往往不如非关系数据模型 4、面向对象模型 5、对象关系模型 七、三个模式和二级映像 1、外模式(Sub-Schema):用户的数据视图。是数据的局部逻辑结构,模式的子集。 2、模式(Schema):所有用户的公共数据视图。是数据库中全体数据的全局逻辑结构和特性的描述。 3、内模式(Storage Schema):又称存储模式。数据的物理结构及存储方式。 4、外模式/模式映象:定义某一个外模式和模式之间的对应关系,映象定义通常包含在各外模式中。当模式改变时,修改此映象,使外模式保持不变,从而应用程序可以保持不变,称为逻辑独立性。 5、模式/内模式映象:定义数据逻辑结构与存储结构之间的对应关系。存储结构改变时,修改此映象,使模式保持不变,从而应用程序可以保持不变,称为物理独立性。 八、数据视图 数据库管理系统的一个主要作用就是隐藏关于数据存储和维护的某些细节,而为用户提供数据在不同层次上的抽象视图,即不同的使用者从不同的角度去观察数据库中的数据所得到的结果—数据抽象。 九、规范化 1、几个概念 候选码(候选关键字):如果一个属性(组)能惟一标识元组,且又不含有其余的属性,那么这个属性(组)称为关系的一个候选码(候选关键字)。 码(主码、主键、主关键字):从候选码中选择一个唯一地标识一个元组候选码作为码 主属性:任何一个候选码中的属性(字段) 非主属性:除了候选码中的属性 外码:关系模式R中属性或属性组X并非R的码,但X是另一个关系模式的码,则称X是R的外部码,简称外码。 2、函数依赖 (1)设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y。X称为这个函数依赖的决定属性集(Determinant)。Y=f(x)

校园基础地理空间数据库建设设计方案

校园基础地理空间数据库建设设计方案 遥感1503班第10组 (杨森泉张晨欣杨剑钢熊倩倩) 测绘地理信息技术专业 昆明冶金高等专科学校测绘学院 2017年5月

一.数据来源 二. 目的 三 .任务 四. 任务范围 五 .任务分配与计划六.小组任务分配七. E-R模型设计八.关系模式九.属性结构表十.编码方案

一.数据来源 原始数据为大二上学期期末实训数字测图成果(即DWG格式的校园地形图) 导入GIS 软件数据则为修改过的校园地形图 二.目的 把现实世界中有一定范围内存在着的应用数据抽象成一个数据库的具体结构的过程。空间数据库设计要满足用户需求,具有良好的数据库性能,准确模拟现实世界,能够被某个数据库管理系统接受。

三.任务 任务包括三个方面:数据结构、数据操作、完整性约束 具体为: ①静态特征设计——结构特性,包括概念结构设计和逻辑结构设计; ②动态特性设计——数据库的行为特性,设计查询、静态事务处理等应用程序; ③物理设计,设计数据库的存储模式和存储方式。 主要步骤:需求分析→概念设计→逻辑设计→物理设计 原则:①尽量减少空间数据存储冗余;②提供稳定的空间数据结构,在用户的需要改变时,数据结构能够做出相应的变化;③满足用户对空间数据及时访问的需求,高校提供用户所需的空间数据查询结果;④在空间元素间为耻复杂的联系,反应空间数据的复杂性;⑤支持多种决策需要,具有较强的应用适应性。 四、任务范围 空间数据库实现的步骤、建库的前期准备工作内容、建库流程 步骤:①建立实际的空间数据库结构;②装入试验性数据测试应用程序;③装入实际空间数据,建立实际运行的空间数据库。 前期准备工作内容:①数据源的选择;②数据采集存储原则;③建库的数据准备;④数据库入库的组织管理。 建库流程:①首先必须确定数字化的方法及工具;②准备数字化原图,并掌握该图的投影、比例尺、网格等空间信息;③按照分层要求进行

空间数据库复习资料资料

空间数据库复习资料

空间数据库复习资料 (仅供参考) 1.什么是空间数据库?阐述空间数据库管理系统的主要功能? 答:(1)空间数据库:是长期储存在计算机内、有组织的、可共享的大量空间数据的集合。(指某区域内以特定的信息结构和数据模型表达、存储和管理的空间数据的集合。) (2)主要功能:数据定义功能,数据组织、存储和管理,数据操纵功能,数据库的事务管理和运行管理,数据库的建立和维护功能;空间数据和空间关系的定义和描述,空间操作算子,空间数据索引,空间数据查询语言,几何完整性约束,长事务管理,海量空间数据的存储和组织,空间数据的可视化。 2.阐述数据库系统的外部、内部体系结构。 答:(1)外部体系结构:单用户结构/主从式结构,客户/服务器,分布式结构,B/S结构 (2)内部体系结构:三级模式结构:外模式,模式,内模式 3.什么是数据模型?阐述常用数据模型的基本思想。 答:(1)数据模型:在数据库中用数据模型来抽象、表示和处理现实世界中的数据和信息。数据模型应满足三方面要求:能比较真实地模拟现实世界,容易为人所理解,便于在计算机上实现。 (2)常用数据模型的基本思想:①层次模型是用树形结构来表示实体及实体间联系的模型,它将数据组织成一对多的联系。②网状模型是用网状结构来表示实体及实体间联系的模型,它将数据组织成多对多的联系。③关系模型是用二维关系来表示实体及实体间联系的模型,它将数据组织成规范化的关系表格。 ④面向对象模型象的基本思想就是以接近人类思维的方式将客观世界的一切实

体或现象模型化为一系列对象。每一种对象都有各自的内部状态和行为,不同对象之间的相互联系和相互作用就构成了各种不同的面向对象系统 4.什么是空间索引?阐述格网索引、四叉树索引、R树索引的基本思想。 答:(1)空间索引,也叫空间访问方法,是指依据空间对象的位置、形状以及空间对象之间的某种空间关系,按一定顺序排列的一种数据结构。其中包括空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。(2)①格网空间索引的基本思想是将研究区域按一定规则划分为大小相等或不等的网格,记录每一个网格所包含的地理对象。当用户进行空间查询时,首先计算出用户查询对象所在的格网,然后通过该格网快速查询所选的地理对象。 ②四叉树是一种对空间进行规则递归分解的空间索引结构,将已知范围的空间划成四个相等的子空间。如果需要可以将每个或其中几个子空间继续划分下去,这样就形成了一个基于四叉树的空间划分。 ③R-Tree是基于空间数据对象分割的空间索引方法,它采用空间对象的最小外包矩形MBR来近似表达空间对象 5.如何扩展SQL语言,使其支持空间查询? 答:SQL的空间扩展,需要一项普遍认可的标准。OGC是由一些主要软件供应商组成的联盟,负责制定与GIS互操作相关的标准。在OGIS标准中,所指定的操作可分成三类:⑴用于所有几何类型的基本操作,⑵用于空间对象间拓扑关系的操作测试,⑶用于空间分析的一般操作 6.阐述数据库设计的基本步骤。 答:数据库设计分6个阶段:需求分析,概念结构设计,逻辑结构设计,物理结构设计,数据库实施,数据库运行和维护 7.阐述数据库的安全性、完整性、并发控制、数据库恢复基本思想。 答:①数据的安全性:保护数据库防止恶意的破坏和非法的存取,防范对象:非法用户和非法操作。②数据的完整性:防止数据库中存在不符合语义的数据,也就是防止数据库中存在不正确的数据,防范对象:不合语义的、不正确的数据。 ③并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性。

武汉大学空间数据库复习资料整理

《空间数据库原理》 第一章数据库 1、空间数据库:①提供结构用于存储和分析空间数据②空间数据由多维空间的对象组成③在标准数据库中存储空间数据需要大量的空间,从一个标准数据库中检索查询空间数据需要很多时间并且很累赘,通常导致很多错误。 2、DBMS:(数据的操作系统)一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。SDBMS:增加了处理空间数据功能的DBMS。①在它的数据模型中提供空间数据类型和查询语言②至少在执行时支持提供空间数据类型:空间索引;空间链接有效的算法。 在地理信息系统中为什么要研究专门的空间数据库系统? 1.空间数据库能提供结构存储和空间数据分析 2.空间数据库包含多面空间的对象 3.在标准数据库中存储空间数据会需要过多的空间 4.标准数据库的查询反馈和空间数据分析会消耗过多时减并且留下大量错误空间 5.空间数据库能提供更多有效率的存储和空间数据分析 3、哈希(Hash)函数:一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。 质数除余法(直接取余法):f(x):=x mod maxM ;maxM一般是不太接近2^t的一个质数。 乘法取整法:f(x):=trunc((x/maxX)*maxlongit) mod maxM,主要用于实数。 平方取中法:f(x):=(x*x div 1000 ) mod 1000000);平方后取中间的,每位包含信息比较多。 第二章数据库基本原理 1、数据模型Data Model:关于数据基础或对象以及他们之间的关系的抽象描述被表示在一个数据库中。 3、概念数据模型:也称语义模型,关于实体和实体间联系的抽象概念集,用统一的语言描述、综合、集成的用户视图。 2、数据字典:是指对数据库的内容包括数据项和属性码定义,是元数据的重要组成部分。(是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。) Metadata:是描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。 3、数据库设计和实现:①需求分析②概念数据建模③逻辑建模(参考DBMS和基础数据模型)④物理建模或者实现(参考物理存储和电脑环境)。 需求调查:根据数据库设计的主题对用户的需求进行调查,了解用户特点和要求,取得设计者与用户对需求的一致看法。需求分析:指的是在创建一个新的或改变一个现存的系统或产品时,确定新系统的目的、范围、定义和功能时所要做的所有工作。 4、E-R图:描述对象类型之间的关系,是表示概念模型的一种方式。 第三章基本空间概念 1、凸多边形:把一个多边形任意一边向两方无限延长成为一条直线,如果多边形的其他各边均在此直线的同旁,那么这个多边形就叫做凸多边形。 2、点集拓扑:一个基于相邻关系定义拓扑学空间的方法。 3、大圆距离:大圆距离指的是从球面的一点A出发到达球面上另一点B,所经过的最短路径(圆弧)的长度。 曼哈顿距离:两个点上在标准坐标系上的绝对轴距之总和。 4、欧式空间(欧几里德空间):空间的坐标模型。作用:能将空间属性转化为以实数为元组的属性;坐标系包括一个确定的原点和在原点交叉的一对正交轴线。

无锡市基础空间数据库SHP格式方案(大比例尺)

无锡市基础空间数据SHP格式设计方案 (大比例尺) 1、综述 1.1目的 为无锡市规划局基础空间数据建库提供标准。 1.2适用范围 1:500、1:1000、1:2000基础地形图数据 1.3制定原则 ●保证按本方案生产的数据可以实现同SHP数据的高效互转; ●保证按本方案生产的数据在转入数据库后可以实现标准图的输出; ●操作方便。 1.4类型约定 ● ●

1.5引用标准 《GB/T 14804-93 1:500 1:1000 1:2000 地形图要素分类与代码》(1994-08-01)《GB/T 7929-1995 1:500 1:1000 1:2000 地形图图式》(1996-05-01) 《GB 1:500 1:1000 1:2000 地形图数字化规范》(1998-08-01) 《GB/T14804-93 1:500 1:1000 1:2000 地形图要素分类与代码》(1994-08-01)《GT地籍数据库标准》 《GB/T 13923-92 国土基础信息数据分类与代码》(1993-07-01) 2、实体的划分 数据在SDE的服务器里是按照点、线、面和注记划分的,每一个SDE图层(FEATURECLASS)只能存储上述的一种空间对象。由于这种存储模型的限制,势必造成很多国标中的复杂地物被拆分到不同的SDE图层。为了在编码中体现设计的合理性、对实体的物理存储进行统一的管理,特在数据库的设计中在对空间实体做逻辑的划分。 2.1简单点 ●简单点实体只记录插入点的位置和相关属性,所有的简单点实体都必须以插入符号 的形式采集。 ●简单点状实体对应ARCOBJECT体系的IPOINT对象。 ●采集单位在使用点符号的时候要保证简单点的符号要和本方案提供的符号描述一 致,符号的插入点一致。 2.2简单无向线 ●简单线需要作业单位针对每一种实体制作线符号,这里所指的线符号必须是采集系 统提供的线符号库,不能用程序绘制。

空间数据库建库复习资料全

第一章 1.GIS的名词分析与推论 GIS概念:具有地理数据的采集、管理、分析、表达能力,能为决策者提供有用地理信息的系统。 推论1:地理信息系统采集的数据为空间数据,即具有空间位置,又具有属性特征。地理信息系统的数据库因此又称为空间数据库。 推论二:地理信息系统具有采集、管理、分析地理数据和表达地理信息的能力。包括空间数据库建设和空间数据库的应用两个层次。 推论三:地理信息系统包括计算机硬件、软件、数据、系统开发人员和用户,但由于处理和分析的是地理数据,因此,在通用的硬件、软件基础上,还有体现专业特点的硬、软件。 2.GIS空间数据体系 空间数据库:空间数据和属性数据的组织 矢量有混合式、扩展式和开放式

矢量数据的空间数据组织:空间坐标数据的非结构化和属性数据的结构化 栅格数据:像元阵列 3.GIS数据模型 矢量数据模型:简单数据结构(面条结构):如Shapefile、拓扑数据结构:如Coverge、面向对象的数据模型:如Geodatabase 栅格数据模型:栅格文件常用格式:*.tif,*.jpg,*.bmp等。GIS中的栅格格式:ESRI的Grid、Geodatabase的栅格数据集等。遥感图像的格式:PCI的* .pix,Erdas的*.img等。 4.空间数据库设计核心 将现实世界抽象为GIS数据模型,这是数据库设计的核心。 5.名词解释: 面条结构:数据按点、线、面为单元进行组织,点、线、面都有自己的坐标数据。最典型的是面条结构。 拓扑数据结构:不仅存储空间位置,同时存储空间关系。 拓扑关联:指存在于空间图形的不同类型元素之间的拓扑关系。如结点与弧段、弧段与多边形。 第二章 1.名词解释: 数据词典:以词典的方式描述和定义E-R模型设计中出现和形成的实体、关系。 数据模型匹配:实现将实体类型和特征类型(Coverage、Shapefile、Grid等)的匹配。

空间数据库复习资料

空间数据库复习资料 (仅供参考) 1.什么是空间数据库?阐述空间数据库管理系统的主要功能? 答:(1)空间数据库:是长期储存在计算机内、有组织的、可共享的大量空间数据的集合。(指某区域内以特定的信息结构和数据模型表达、存储和管理的空间数据的集合。) (2)主要功能:数据定义功能,数据组织、存储和管理,数据操纵功能,数据库的事务管理和运行管理,数据库的建立和维护功能;空间数据和空间关系的定义和描述,空间操作算子,空间数据索引,空间数据查询语言,几何完整性约束,长事务管理,海量空间数据的存储和组织,空间数据的可视化。 2.阐述数据库系统的外部、内部体系结构。 答:(1)外部体系结构:单用户结构/主从式结构,客户/服务器,分布式结构,B/S结构 (2)内部体系结构:三级模式结构:外模式,模式,内模式 3.什么是数据模型?阐述常用数据模型的基本思想。 答:(1)数据模型:在数据库中用数据模型来抽象、表示和处理现实世界中的数据和信息。数据模型应满足三方面要求:能比较真实地模拟现实世界,容易为人所理解,便于在计算机上实现。 (2)常用数据模型的基本思想:①层次模型是用树形结构来表示实体及实体间联系的模型,它将数据组织成一对多的联系。②网状模型是用网状结构来表示实体及实体间联系的模型,它将数据组织成多对多的联系。③关系模型是用二维关系来表示实体及实体间联系的模型,它将数据组织成规范化的关系表格。④面向对象模型象的基本思想就是以接近人类思维的方式将客观世界的一切实体或现象模型化为一系列对象。每一种对象都有各自的内部状态和行为,不同对象之间的相互联系和相互作用就构成了各种不同的面向对象系统 4.什么是空间索引?阐述格网索引、四叉树索引、R树索引的基本思想。 答:(1)空间索引,也叫空间访问方法,是指依据空间对象的位置、形状以及空间对象之间的某种空间关系,按一定顺序排列的一种数据结构。其中包括空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。 (2)①格网空间索引的基本思想是将研究区域按一定规则划分为大小相等或不等的网格,记录每一个网格所包含的地理对象。当用户进行空间查询时,首先计算出用户查询对象所在的格网,然后通过该格网快速查询所选的地理对象。 ②四叉树是一种对空间进行规则递归分解的空间索引结构,将已知范围的空间划成四个相等的子空间。如果需要可以将每个或其中几个子空间继续划分下去,这样就形成了一个基于四叉树的空间划分。 ③R-Tree是基于空间数据对象分割的空间索引方法,它采用空间对象的最小外包矩形MBR来近似表达空间对象 5.如何扩展SQL语言,使其支持空间查询? 答:SQL的空间扩展,需要一项普遍认可的标准。OGC是由一些主要软件供应商组成的联盟,负责制定与GIS互操作相关的标准。在OGIS标准中,所指定的操作可分成三类:⑴用于所有几何类型的基本操作,⑵用于空间对象间拓扑关系的操作测试,⑶用于空间分析的一般操作 6.阐述数据库设计的基本步骤。 答:数据库设计分6个阶段:需求分析,概念结构设计,逻辑结构设计,物理

《空间大数据库》复习

《空间数据库》复习 1、空间数据具有哪些特点? 空间特征空间关系非结构化抽象特征多时空性特征分类编码特征海量数据特征 多尺度与多态性 2、为什么不适合直接采用关系型数据库对空间数据进行管理? (1)传统数据库管理的是不连续的相关性较小的数字或字符,而空间数据是连续的,并且有很强的空间相关性; (2)传统数据库管理的实体类型较少,并且实体类型间关系简单固定,而GIS数据库的实体类型繁多,实体间存在着复杂的空间关系; (3)传统数据库存储的数据通常为等长记录的数据,而空间数据的目标坐标长度不定,具有变长记录,并且数据项可能很多,很复杂; (4)传统数据库只查询和操作数字和文字信息,而空间数据库需要大量的空间数据操作和查询。 3、常用的空间数据库管理方式有哪几种及其各自特点。 ㈠文件关系数据库混合管理方案 用一组文件形式来存储地理空间数据及其拓扑关系,利用通用关系数据库存储属性数据,通过唯一的标识符来建立它们之间的连接。 优点:⑴GIS 可通过DBMS提供的高级编程语言的接口,直接操纵属性数据,查询属性数据库,并在GIS的用户界面下,显示查询结果。⑵在ODBC推出后,GIS软件商只需开发GIS与ODBC的接口软件,就可将属性数据与任何一个支持ODBC的RDBMS连接。这样用户可在一个界面下处理图形和属性数据。 缺点:⑴属性数据和图形数据通过ID联系起来,使查询运算,模型操作运算速度慢;⑵数据发布和共享困难;⑶属性数据和图形数据分开存储,数据的安全性、一致性、完整性、并发控制以及数据损坏后的恢复方面缺少基本的功能;⑷缺乏表示空间对象及其关系的能力。㈡全关系式数据库管理方案 基于关系模型方式,将图形数据按关系模型组织。图形数据和属性数据统一存储在通用关系数据库中,即将图形文件转成关系存放在目前大部分关系型数据库提供的二进制块中。将图形数据变长部分处理成Binary Block字段 优点:⑴在全关系型数据库中加入了二进制数据块形式省去大量关系连接操作,可提高查询

数据库基础知识试题(含答案)

数据库基础知识试题 部门____________ __________ 日期_________ 得分__________ 一、不定项选择题(每题1.5分,共30分) 1.DELETE语句用来删除表中的数据,一次可以删除( )。D A .一行 B.多行 C.一行和多行 D.多行 2.数据库文件中主数据文件扩展名和次数据库文件扩展名分别为( )。C A. .mdf .ldf B. .ldf .mdf C. .mdf .ndf D. .ndf .mdf 3.视图是从一个或多个表中或视图中导出的()。A A 表 B 查询 C 报表 D 数据 4.下列运算符中表示任意字符的是( )。B A. * B. % C. LIKE D._ 5.()是SQL Server中最重要的管理工具。A A.企业管理器 B.查询分析器 C.服务管理器 D.事件探察器 6.()不是用来查询、添加、修改和删除数据库中数据的语句。D A、SELECT B、INSERT C、UPDATE D、DROP 7.在oracle中下列哪个表名是不允许的()。D A、abc$ B、abc C、abc_ D、_abc 8.使用SQL命令将教师表teacher中工资salary字段的值增加500,应该使用的命令 是()。D A、Replace salary with salary+500 B、Update teacher salary with salary+500 C、Update set salary with salary+500 D、Update teacher set salary=salary+500 9.表的两种相关约束是()。C

空间数据库复习重点答案完整)

1、举例说明什么是空间数据、非空间数据?如何理解空间查询和非空间查询的区别?常用的空间数据库管理方式有哪几种及其各自特点。 数据:是指客观事务的属性、数量、位置及其相互关系等的符号描述。空间数据:是对现实世界中空间对象(事物)的描述,其实质是指以地球表面空间位置为参照,用来描述空间实体的位置、形状、大小及其分布特征等诸多方面信息的数据。河流的泛洪区,卫星影像数据、气象气候数据等都可以是空间数据书店名称店员人数,去年的销售量,电话号码等是非空间数据 空间查询是对空间数据的查询或命令 人工管理阶段 文件管理阶段缺点: 1)程序依赖于数据文件的存储结构,数据文件修改时,应用程序也随之改变。 2)以文件形式共享,当多个程序共享一数据文件时,文件的修改,需得到所有应用的许可。不能达到真正的共享,即数据项、记录项的共享。 常用: 文件与数据库系统混合管理阶段优点:由于一部分建立在标准的RDBMS上,存储和检索数据比较有效、可靠。 缺点:1)由于使用了两个子系统,它们各自有自己的规则,查询操作难以优化,存储在RDBMS外的数据有时会丢失数据项的语义。 2)数据完整性的约束条件可能遭破坏,如在几何空间数据系统中目标实体仍存在,但在RDBMS中却已删除。 3)几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多 全关系型空间数据库管理系统 ◆属性数据、几何数据同时采用关系式数据库进行管理 ◆空间数据和属性数据不必进行烦琐的连接,数据存取较快 ◆属性间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作 ◆GIS软件:System9,Small World、GeoView等 本质:GIS软件商在标准DBMS顶层开发一个能容纳、管理空间数据的系统功能。 对象关系数据库管理系统 优点:在核心DBMS中进行数据类型的直接操作很方便、有效,并且用户还可以开发自己的空间存取算法。缺点:用户须在DBMS环境中实施自己的数据类型,对有些应用相当困难。 面向对象的数据库系统。 采用面向对象方法建立的数据库系统; 对问题领域进行自然的分割,以更接近人类通常思维的方式建立问题领域的模型。 目前面向对象数据库管理系统还不够成熟,价格昂贵,在空间数据管理领域还不太适用; 基于对象关系的空间数据库管理系统可能成为空间数据管理的主流 2、什么是GIS,什么是SDBMS?请阐述二者的区别和联系。 GIS是一个利用空间分析功能进行可视化和空间数据分析的软件。它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量GIS 可以利用SDBMS来存储、搜索、查询、分享大量的空间数据集 改:地理信息系统是以地理空间数据库为基础,在计算机软硬件的支持下,运用系统工 科学管理和综合分析具有空间内涵的地理数据,以提供管理、决策等所需信息的技术系统。简单的说,地理信息系统就是综合处理和分析地理空间数据的一种技术系统。

空间数据库复习资料整理v3

一、名词解释 1空间数据库 是地理信息系统在计算机物理存储介质上存储和应用的相关的地理空间数据的总合。 2空间数据库管理系统: 能进行语义和逻辑定义存储在空间数据库上的空间数据,提供必需的空间数据查询、检索和存取功能,以及能够对空间数据进行有效的维护和更新的一套软件系统。 3空间数据库应用系统 提供给用户访问和操作空间数据库的用户界面,是应用户数据处理需求而建立的具有数据库访问功能的应用软件。一般需要进行二次开发,包括空间分析模型和应用模型。 4什么是arcSDE 空间数据库引擎(SDE: Spatial Database Engine) ArcSDE是一个用于访问存储于关系数据库管理系统(RDBMS)中的海量多用户地理数据库的服务器软件产品。 5什么是空间数据 地理信息系统的数据库(简称空间数据库或地理数据库)是某一区域内关于一定地理要素特征的数据集合。 6空间数据模型 空间数据(库)模型:就是对空间实体及其联系进行描述和表达的数学手段,使之能反映实体的某些结构特性和行为功能。 空间数据模型是衡量GIS功能强弱与优劣的主要因素之一。 7空间数据结构 不同空间数据模型在计算机内的存储和表达方式。 8场模型 在空间信息系统中,场模型一般指的是栅格模型,其主要特点就是用二维划分覆盖整个连续空间 9对象模型 面向对象数据模型(Object―Oriented Data Model,简称O―O Data Model)是一种可扩充的数据模型,在该数据模型中,数据模型是可扩充的,即用户可根据需要,自己定义新的数据类型及相应的约束和操作。 10概念数据模型 按用户的观点来对数据和信息建模。用于组织信息世界的概念,表现从现实世界中抽象出来的事物以及它们之间的联系。如E-R模型。

空间数据库毕业课程设计报告

空间数据库课程设计兼ARCSDE入门 手册 一.ArcSDE的配置 数据库的创建 数据库的配置 数据库的网络配置 数据库的控制和管理 ArcSDE的配置 二.数据库的设计 建立数据库连接 表的创建与设计 版本的注册与创建 成员角色与任务分配 三.问题与解决方案 软件本身的问题 多版本编辑的问题 四.总结 个人心得 各成员工作情况 一. ArcSDE的配置 1.数据库的创建:

打开Database Configuration Assistant工具 如图(1.1)所示 为初始界面 图(1.1) 按照向导对话框依次选择执行的操作创建数据库→选择一般用途的模→输入数据库名称和SID号(*注意SID号默认和数据库名相同)→管理选项(默认设置)→输入口令号(*可以根据不同的用户设置不同的口令)→存储选项(默认设置)→数据库文件所在位置(默认设置)→恢复配置(默认设置)→数据库内容(默认设置)→初始化参数(默认设置)→数据库存储(默认设置)→创建选项(如图1.2)→确定对话框→开始创建图1.2 2.数据库的配置 创建数据库成功之后需要进行数据库的配置,同上打开Database Configuration Assistant工具,点击下一步,选择配置数据库选项→选择需要配置的数据库→数据库内容(默认设置)→连接模式(*客户机较少时默认设置),点击完成开始配置数据库(如上图) 3.数据库的网络配置 配置数据库之后,打开Oracle Net Configuration Assistant 工具,如图(1.4)为初始界面 图1.4

按下一步进入监听程序配置→监听程序(*若需要添加新的监听程序,选择添加,这里选择已有的监听程序,选择重新配置如右图)→选择监听程序→选择协议(默认有TCP)→选择端口(*端口号默认为1521,若配置了多个监听程序,不应重复使用1521端口,否则后期的本地NET服务名配置会出错,如右图)→完成配置好监听程序后配置本地NET服务名配置→重新配置→选择Net服务名(根据新创建的数据库选择服务名)→服务名配置(输入新创建的数据库名)→选择协议(默认配置)→输入主机号和选择端口(主机号为计算机名)→选择测试→测试登录方式用户名填system,口令重新输入,如右图(若测试失败,可以试着重新配置数据库,注意配置端口号) 4.数据库的控制和管理 工具: OEM和SQL*PLUS 登录OEM方式:网页登陆。(下图) 网址可在安装目录oracle\product\10.2.0\db_1\install\readme.txt中得到,输入网址,并用sys用户登录,使用SYSDBA身份。 登录SQL*PLUS方式:对话框登录。 输入用户名:System, 输入口令: 输入主机字符串:数据库名 (右图)

空间数据库考试复习资料

1.空间数据的定义及特点 定义:空间数据是指用来描述空间实体的位置、形状、大小及其分布特征等诸多方面信息的数据,以及表示地球表层一定范围内的地理事物及其关系。 特点:(1)空间性,空间性表示了空间实体的位置或所处的地理位置、空间实体几何特征以及空间实体的拓扑关系,从而形成了空间实体的位置、形态以及由此产生的一系列特性。空间性又包括空间定位、空间度量、空间结构和空间集合。(2)专题性,专题性是指在一个坐标位置上的地理信息具有专题属性信息。(3)时间性,时间性是指空间数据的空间特性和属性特征随时间变化的动态变化特征,即时序特征。 2.空间数据库的定义及特点 定义:空间数据库是存放空间数据的数据库。更准确地说,空间数据库是描述空间物体的位置数据、位置数据元素(点、线、面)之间的拓扑关系及描述这些物体的属性数据的数据库。 特点:(1)空间数据库管理的是现实世界中相关性大的连续数据,要求进行综合管理;(2)空间数据库中描述的数据实体类型多,关系复杂。使数据模型复杂;(3)空间数据库存储的空间数据具有非结构化特征,不满足关系数据模型的范式要求。 3.传统关系数据库模型的局限性 答:(1)用关系模型描述具有复杂结构和含义的地理对象时,对地理实体进行不自然的分解,导致存储模式、查询途径及操作等方面不够合理;(2)关系数据库模型无法用递归和嵌套的方式来描述复杂关系的层次和网状结构,因此模型和操作复杂地理对象的能力较弱;(3)空间数据中图形数据通常是变长的,而一般空间数据库管理系统记录固定长度的记录,这不利于空间数据的表达;(4)GIS要管理的是具有高度内部联系的数据,为了保证地理数据库的完整性,需要复杂的安全维护系统。 4.空间数据库引擎的定义及特点 答:定义:SDE是空间数据组织管理的重要基础技术,从用户的角度的角度看,SDE是用户和异构空间数据库的接口;从软件的角度看,SDE是应用程序和空间数据库管理系统之间的查件,用来管理空间数据库;从系统的角度来看,SDE 利用空间数据库管理系统和其扩展功能,实现空间数据在数据库中的物理存储。特点:(1)采用空间数据库管理系统高效组织和管理海量空间数据;(2)采用高度结构化的关系表存储;(3)实现真正的client/serve计算,并在系统级、数据库级实现信息共存;(4)不足是还没有实现不同GIS平台之间的数据互操作。 5.Shapefile的文件格式 答:Shapefile至少由三个固定的文件组成,主文件(.shp)、索引文件(.shx)、表文件(.dbf)。Shapefile是ArcView的原生数据格式,属于简单要素类。Shapefile 中的信息分两类,一种与数据有关,如文件的记录信息,主文件文件头有关数据描述的字段,一种与数据的组织管理有关,如文件和记录的长度和记录的偏移等。(1)Shapefile中主文件(.shp)由固定长度的文件头和不变长度的空间数据记

空间数据库期末复习重点总结

空间数据库期末复习重点总结

————————————————————————————————作者:————————————————————————————————日期:

一、数据管理的发展阶段 1、人工管理阶段 2、文件系统阶段 3、数据库管理阶段 注意了解各阶段的背景和特点 二、数据库系统的特点 1、面向全组织的复杂的数据结构 2、数据的冗余度小,易扩充 3、具有较高的数据和程序的独立性:数据独立性 数据的物理独立性 数据的逻辑独立性 三、数据结构模型三要素 1、数据结构 2、数据操作 3、数据的约束性条件 四、数据模型反映实体间的关系 1、一对一的联系(1:1) 2、一对多的联系(1:N) 3、多对多的联系(M:N) 五、数据模型: 是数据库系统中用于提供信息表示和操作手段的形式构架。 数据库结构的基础就是数据模型。数据模型是描述数据(数据结构)、数据之间的联系、数据语义即数据操作,以及一致性(完整性)约束的概念工具的集合。 概念数据模型:按用户的观点来对数据和信息建模。ER模型 结构数据模型:从计算机实现的观点来对数据建模。层次、网状模型、关系 六、数据模型的类型和特点 1、层次模型: 优点:结构简单,易于实现 缺点:支持的联系种类太少,只支持二元一对多联系 数据操纵不方便,子结点的存取只能通过父结点来进行 2、网状模型: 优点:能够更为直接的描述世界,结点之间可以有很多联系 具有良好的性能,存取效率高 缺点:结构比较复杂 网状模型的DDL、DML复杂,并且嵌入某一种高级语言,不易掌握,不易使用

3、关系模型: 特点:关系模型的概念单一;(定义、运算) 关系必须是规范化关系; 在关系模型中,用户对数据的检索操作不过是从原来的表中得到一张新的表。 优点:简单,表的概念直观,用户易理解。 非过程化的数据请求,数据请求可以不指明路径。 数据独立性,用户只需提出“做什么”,无须说明“怎么做”。 坚实的理论基础。 缺点:由于存储路径对用户透明,存储效率往往不如非关系数据模型 4、面向对象模型 5、对象关系模型 七、三个模式和二级映像 1、外模式(Sub-Schema):用户的数据视图。是数据的局部逻辑结构,模式的子集。 2、模式(Schema):所有用户的公共数据视图。是数据库中全体数据的全局逻辑结构和特性的描述。 3、内模式(StorageSchema):又称存储模式。数据的物理结构及存储方式。 4、外模式/模式映象:定义某一个外模式和模式之间的对应关系,映象定义通常包含在各外模式中。当模式改变时,修改此映象,使外模式保持不变,从而应用程序可以保持不变,称为逻辑独立性。 5、模式/内模式映象:定义数据逻辑结构与存储结构之间的对应关系。存储结构改变时,修改此映象,使模式保持不变,从而应用程序可以保持不变,称为物理独立性。 八、数据视图 数据库管理系统的一个主要作用就是隐藏关于数据存储和维护的某些细节,而为用户提供数据在不同层次上的抽象视图,即不同的使用者从不同的角度去观察数据库中的数据所得到的结果—数据抽象。 九、规范化 1、几个概念 候选码(候选关键字):如果一个属性(组)能惟一标识元组,且又不含有其余的属性,那么这个属性(组)称为关系的一个候选码(候选关键字)。 码(主码、主键、主关键字):从候选码中选择一个唯一地标识一个元组候选码作为码 主属性:任何一个候选码中的属性(字段) 非主属性:除了候选码中的属性 外码:关系模式R中属性或属性组X并非R的码,但X是另一个关系模式的码,则称X是R的外部码,简称外码。 2、函数依赖 (1)设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称“X函数确定Y”或“Y函数依赖于X”,记作X→Y。X称为这个函数依赖的决定属性集(Determinant)。Y=f(x)

空间数据库复习题

Chapter 1: Introduction to Spatial Databases 1、举例说明什么是空间数据、非空间数据?如何理解空间查询(spatial queries)和非空间查询的区别(Non-spatial queries)? 答:河流的泛洪区,卫星影像数据、气象气候数据等都可以是空间数据 书店名称店员人数,去年的销售量,电话号码等是非空间数据 空间查询是对空间数据的查询或命令 2、什么是GIS,什么是SDBMS?请阐述二者的区别和联系。 答:1、GIS是一个利用空间分析功能进行可视化和空间数据分析的软件。它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量 GIS 可以利用SDBMS来存储、搜索、查询、分享大量的空间数据集 2、SDBMS是一个软件模块。它可以 ①、利用一个底层的数据库管理系统 ②、支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言 ③、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则 3、区别与联系:①、利用GIS可以对某些对象和图层进行操作,而利用SDBMS则可以对更多的对象集和图层进行更加简单的操作 ②、SDBMS可以在GIS不能使用的某些领域进行使用,例如基因组学、天文学、多媒体信息系统等 ③、GIS可以作为SDBMS的前端,利用一个高效的SDBMS可以大大提高GIS的效率和生产率。

3、从GIS这一缩写的三种含义来理解GIS的发展历程。 答:地理信息系统:为专业人员提供的软件 地理信息科学:为地理信息系统和服务提供使用和发展的定义、框架和理论 地理信息服务:为普通用户提供的网点和服务中心,例如PC机上的地理和空间服务 4、用传统数据库系统管理空间数据,存在什么不足之处? 答:1)无法用递归和嵌套的方式来描述复杂关系的层次和网状结构,模拟和操作复杂地理对象的能力较弱; 2)用关系模型描述本身具有复杂结构和涵义的地理对象时,需对地理实体进行不自然的分解,导致存储模式、查询途径及操作等方面均显得语义不甚合理; 3)由于概念模式和存储模式的相互独立性,及实现关系之间的联系需要执行系统开销较大的联接操作,运行效率不够高 4)空间数据通常是变长的,而一般RDBMS只允许记录的长度设定为固定长度,此外,通用DBMS难于存储和维护空间数据的拓扑关系。 5)一般RDBMS都难以实现对空间数据的关联、连通、包含、叠加等基本操作。 6)一般DBMS不能支持GIS需要的一些复杂图形功能。 7)一般RDBMS难以支持复杂的地理信息,因为单个地理实体的表达需要多个文件、多条记录,包括大地网、特征坐标、拓扑关系、属性数据和非空间专题属性等方面信息。8)GIS管理的是具有高度内部联系的数据,为了保证地理数据库的完整性,需要复杂的安全维护系统,而这些完整性约束条件必须与空间数据一起存储,由地理数据库来维护系统

空间数据库复习资料

第一章 1数据库的定义:数据库:就是为了一定的目的,在计算机系统中以特定的结构组织、存储、管理和应用的相关联的数据集合。空间数据库是存取、管理空间信息的数据库。 2 空间数据库的内容 (1)矢量地形要素数据库矢量核心地形要素数据库是利用计算机存储的各种数字地形数据及其数据管理软件的集合。 (2)数字高程模型数据库数字高程模型是计算机存储的数字高程模型数据及其管理软件的集合。 (3)数字正射影像数据库数字正射影像数据库是具有正射投影的数字影像的集合。 (4)数字栅格地图数据库数字栅格地图数据库是数据栅格地图及其管理软件的集合。数字栅格地图是现有纸质地形图经计算机处理后的栅格数字文件。 (5)元数据库元数据库是描述数据库/子库和库中各数字产品的元数据构成的数据库。(6)专题数据库专题数据库是各种专题数据的集合 3 空间数据管理演变过程(发展) 空间数据库的研究始于20世纪70年代的地图制图与遥感图像处理领域,其目的是为了有效利用卫星遥感资源迅速绘制出各种经济专题地图。 (1)人工管理阶段(50年代中期以前) (2)文件系统阶段(50年代后期—60年代中期) (3)文件与数据库管理阶段(20世纪70年代初) (4)全关系型空间数据库管理系统(20世纪70年代后期) (5)对象关系数据库管理系统 (6)面向对象的数据库管理系统 4 地理空间数据库主要研究内容 (1)空间数据模型 (2)地理空间数据的获取与处理1)空间数据库的准确性研究2)空间数据质量研究(3)地理空间数据组织1)空间数据的多种表达方式研究2)时空关系的研究 3)海量空间数据库的结构体系研究 (4)空间数据库管理系统1)空间关系语言研究2)分布式处理和Client/Server模式(5)地理空间数据共享研究1)空间数据共享的理论;2)空间数据共享的处理方法,包括数据规范、标准、元数据研究,空间数据融合、集成与互操作的理论与方法等。 第二章 1 空间实体——指具有确定的位置和形态特征并具有地理意义的地理空间物体。(河流、道 路、城市、航线等) 空间实体:地理信息系统中不可再分的最小单元现象称为空间实体.属性是空间实体已定义 的特征(如人口数量、林地上林木名称等) 空间实体:是指现实世界中地理实体的最小抽象单位,主要包括点、线和面三种类型.空间检索的目的是对给定的空间坐标,能够以尽快的速度搜索到坐标范围内的空间对象,进 而对空间对象进行拓扑关系的分析处理 2 空间对象模型特征 (1)点对象点是有特定的位置、维数为零的实体 1)点实体(point entity):用来代表一个实体。 2)注记点:用于定位注记。 3)内点(label point):用于记录多边形的属性,存在于多边形内。 4)结点(node):表示线的终点和起点。

相关文档
最新文档