空间数据库复习题
Chapter 1: Introduction to Spatial Databases
1、举例说明什么就是空间数据、非空间数据?如何理解空间查询(spatial queries)与非空间查询的区别(Non-spatial queries)?
答:河流的泛洪区,卫星影像数据、气象气候数据等都可以就是空间数据
书店名称店员人数,去年的销售量,电话号码等就是非空间数据
空间查询就是对空间数据的查询或命令
2、什么就是GIS,什么就是SDBMS?请阐述二者的区别与联系。
答:1、GIS就是一个利用空间分析功能进行可视化与空间数据分析的软件。它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量
GIS 可以利用SDBMS来存储、搜索、查询、分享大量的空间数据集
2、SDBMS就是一个软件模块。它可以
①、利用一个底层的数据库管理系统
②、支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言
③、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则
3、区别与联系:①、利用GIS可以对某些对象与图层进行操作,而利用SDBMS则可以对更多的对象集与图层进行更加简单的操作
②、SDBMS可以在GIS不能使用的某些领域进行使用,例如基因组学、天文学、多媒体信息系统等
③、GIS可以作为SDBMS的前端,利用一个高效的SDBMS可以大大提高GIS 的效率与生产率。
3、从GIS这一缩写的三种含义来理解GIS的发展历程。
答:地理信息系统:为专业人员提供的软件
地理信息科学:为地理信息系统与服务提供使用与发展的定义、框架与理论
地理信息服务:为普通用户提供的网点与服务中心,例如PC机上的地理与空间服务
4、用传统数据库系统管理空间数据,存在什么不足之处?
答:1)无法用递归与嵌套的方式来描述复杂关系的层次与网状结构,模拟与操作复杂地理对象的能力较弱;
2)用关系模型描述本身具有复杂结构与涵义的地理对象时,需对地理实体进行不自然的分解,
导致存储模式、查询途径及操作等方面均显得语义不甚合理;
3)由于概念模式与存储模式的相互独立性,及实现关系之间的联系需要执行系统开销较大的联接操作,运行效率不够高
4)空间数据通常就是变长的,而一般RDBMS只允许记录的长度设定为固定长度,此外,通用DBMS难于存储与维护空间数据的拓扑关系。
5)一般RDBMS都难以实现对空间数据的关联、连通、包含、叠加等基本操作。
6)一般DBMS不能支持GIS需要的一些复杂图形功能。
7)一般RDBMS难以支持复杂的地理信息,因为单个地理实体的表达需要多个文件、多条记录,包括大地网、特征坐标、拓扑关系、属性数据与非空间专题属性等方面信息。
8)GIS管理的就是具有高度内部联系的数据,为了保证地理数据库的完整性,需要复杂的安全维护系统,而这些完整性约束条件必须与空间数据一起存储,由地理数据库来维护系统数据的完整性。否则,一条记录的改变会导致错误、相互矛盾的数据存在,而一般RDBMS难以实现这一功能。
5、What is a SDBMS ?
答:SDBMS就是一个软件模块。它可以
①、利用一个底层的数据库管理系统
②、支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言
③、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则
6、什么就是后关系数据库模型?后关系数据库模型有哪些?
答:后关系数据库模型支持用户定义抽象数据类型,空间数据的类型可以添加。
包括面向对象的数据库模式OOBDMS与面向关系ORDBMS的数据库模式。
7、SDBMS的三层体系结构(Three Layer Architecture)就是什么?借此深入理解SDBMS的作用。
答:空间应用—空间数据库—DBMS
教材P11的图
8、空间数据库主要涉及哪些内容?
答:数据模型、查询语句、查询处理与优化、文件组织与索引、数据挖掘
9、举例说明单遍扫描查询与多遍扫描查询的概念。
答:单边扫描查询中,被查询的表(关系)中的一条记录(元组)最多只被访问一次;例如“列出武
大周围5km内的书店的名字”。
多遍扫描查询就是被查询的表(关系)中的一条记录(元组)至少被访问一次,例如“找出其代表的选取范围大于200公顷并且在这区拥有公司的女议员的名字”
10、过滤-精炼策略的作用?两个步骤的内容就是什么?
提示:ppt : Efficient algorithms to answer spatial queries
Common Strategy - filter and refine(过滤-精炼)
Filter Step:Query Region overlaps with MBRs of B,C and D
过滤:查询区域与B、C、D的最小外接矩形有重叠部分,保留B、C、D,其她的舍弃
Refine Step: Query Region overlaps with B and C
精炼:查询区域与B、C有重叠,舍弃D
11、平面扫描(plane sweep)技术主要解决什么问题?其主要步骤?
答:主要解决的就是如何在过滤阶段中尽可能多的淘汰不符合条件的对,从而减少几何计算的计算代价。
Step 1:从左至右移动一条扫描线(例如,垂直于x轴的线),停在R∪S的第一个元素处。这就就是具有最小T.xl值的矩形T,例子为就是矩形R4 。
Step2:搜索S中已排序的矩形,直到抵达第一个矩形Sf,这里有Sf.xl> T.xu。显然,对于所有1≤j
Step 4:继续移动扫描线来穿过集合R∪S,直至碰到下一个矩形,在本例中就是S2。这时进行步骤2与3。
Step 5:当R∪S=?时,处理结束;
12、从程序员的观点与DBMS设计者的观点瞧,影响系统效率的因素有何不同。
答:在程序员瞧来,计算机主要包括两个部分:CPU与无限量的内存
在DBMS设计者瞧来,计算机主要包括三个部分:CPU、有限的内存、无限的硬盘空间。
访问硬盘的速度要远远小于访问内存的速度,因此前者关注减少算法的计算时间,后者强调的就是将计算时间与I/O时间的总与减少到最小。
13、查询优化与数据挖掘的概念。
答:查询优化:基于数据集的特点对查询中的操作进行排序,为每一步操作选择有效策略数据挖掘:即进行系统的搜索,找出隐藏在电子信息中潜在的有用信息。
Chapter 2: Spatial Concepts and Data Models
1、什么就是数据模型?举例说明数据模型的重要性。
答、数据模型就是数据集的特定结构与模式,就是对数据的文件描述,有利于某些性质的前期分析。
作用:①、属性的前期分析;②、重利用多媒体应用中的共享数据;③、组织中交换数据④、将数据传递给新软件或环境
例子:千禧年危机正确的使用数据模式可以显著的降低成本,如果软件中的时间与数据被定义成抽象数据模型,只有一小部分的软件会执行数据,ADT数据要被重新修改。
2、掌握两种常用的空间信息模型:要素模型与场模型,矢量、栅格数据结构。
答:场模型:①、空间分割框架②、场函数③、场操作:并、复合
森林模型中分段函数表示,区域中每个点被映射成主要树种对应的值要素模型:①、对象:把空间信息抽象成明确的,可识别的事物或实体;②、对象具有属性与操作
森林模型中多边形表示(林分),每个对象有唯一的标示符、主要树种与一块区
域。
矢量数据结构
栅格数据结构:栅格结构用密集正方形(或三角形,多边形)将地理区域划分为网格阵列。位置由行,列号定义,属性为栅格单元的值。点:由单个栅格表达。线:由沿线走向有相同属性取值的一组相邻栅格表达。面:由沿线走向有相同属性取值的一片栅格表达。
3、基于场模型的操作有哪些,举例说明区基于场模型的局部操作、聚焦(focal)与区域操作?
基于对象模型的操作有哪些?
答:基于场模型:
局部操作:空间框架内一个给定位置的新场的取值只依赖于同一个位置场的输入值。书上P31。
聚焦操作:在指定位置的结果场的值依赖于同一位置的一个假定小领域输入场的值。
极限、高程场的梯度
区域操作:与聚集运算符或微积分中的积分运算有关。计算每个树种的平均高度。