空间数据库复习题讲解
武汉大学空间数据库复习资料整理

《空间数据库原理》第一章数据库1、空间数据库:①提供结构用于存储和分析空间数据②空间数据由多维空间的对象组成③在标准数据库中存储空间数据需要大量的空间,从一个标准数据库中检索查询空间数据需要很多时间并且很累赘,通常导致很多错误。
2、DBMS:(数据的操作系统)一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。
SDBMS:增加了处理空间数据功能的DBMS。
①在它的数据模型中提供空间数据类型和查询语言②至少在执行时支持提供空间数据类型:空间索引;空间链接有效的算法。
在地理信息系统中为什么要研究专门的空间数据库系统?1.空间数据库能提供结构存储和空间数据分析2.空间数据库包含多面空间的对象3.在标准数据库中存储空间数据会需要过多的空间4.标准数据库的查询反馈和空间数据分析会消耗过多时减并且留下大量错误空间5.空间数据库能提供更多有效率的存储和空间数据分析3、哈希(Hash)函数:一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
质数除余法(直接取余法):f(x):=x mod maxM ;maxM一般是不太接近2^t的一个质数。
乘法取整法:f(x):=trunc((x/maxX)*maxlongit) mod maxM,主要用于实数。
平方取中法:f(x):=(x*x div 1000 ) mod 1000000);平方后取中间的,每位包含信息比较多。
第二章数据库基本原理1、数据模型Data Model:关于数据基础或对象以及他们之间的关系的抽象描述被表示在一个数据库中。
3、概念数据模型:也称语义模型,关于实体和实体间联系的抽象概念集,用统一的语言描述、综合、集成的用户视图。
2、数据字典:是指对数据库的内容包括数据项和属性码定义,是元数据的重要组成部分。
(是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。
)Metadata:是描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
空间数据库复习资料最终版

一、名词解释1.空间数据库:描述与特定空间位置有关的真实世界对象的数据集合。
2.数据库:统一存储和管理数据的基地3.空间数据:指以地球表面空间位置为参照,用来描述空间实体的位置、形状、大小及其分布等诸多方面信息的数据4.空间认知:对现实世界的空间属性包括位置、大小、距离、模式、运动和物体内部关系的认知,是通过获取、处理、存储、传递、和解译空间信息,来获取空间知识的过程5.矢量数据结构:利用欧式几何学中的点、线、面及其组合体来表示地理实体空间分布的一种数据组织方式6.栅格数据结构实际实质就是像元阵列,即像元按矩阵形式的集合7.空间关系:空间目标在一定区域上构成的与空间特性有关的联系。
8.四面体网格:将目标空间用紧密排列但不重叠的不规则四面体形成的网格来表示,其实质就是2D TIN结构在3D空间上的拓展9.空间数据库系统:指带有数据库的计算机系统,采用现代数据库技术来管理空间数据。
10.空间数据引擎:用来解决如何在关系数据库存储空间数据,实现真正的数据库方式管理空间数据,建立空间数据服务器的方法11.空间索引:指在存储空间数据时依据空间对象的位置和形状或空间对象之间的某种空间关系,按一定顺序排列的一种数据结构,其中包含空间对象的概要信息。
12.空间链接查询:是空间数据库系统一种重要的多路查询,即从两个数据集合中检索出所有满足某一条件的空间对象。
13.元数据:是关于数据的数据,用于描述数据的内容、质量、表示方式、空间参照系、管理方式、数据的所有者、数据的提供方式以及数据集的其他特征14.空间元数据:描述地理信息数据集内容、表示、空间参照、质量以及管理的数据二、填空1.空间数据特征包括:时空特征、多维特征、多尺度性、海量数据特征2.空间数据库的作用:①空间数据处理与更新②海量数据存储于管理③空间分析与决策④空间信息交换与共享3.空间数据库的特征:综合抽象特征、非结构化特征、分类编码特征、复杂性与多样性4.空间数据管理的五种方式:基于文件管理方式、文件与关系数据库混合型空间数据库、全关系型空间数据库、对象-关系型空间数据库、面向对象空间数据库5.空间类型的表现形式:感知空间、认知空间、符号空间6.空间认知模式:空间特征感知、空间对象认识、空间格局认知7.空间认知的三层模型:空间概念数据模型、空间逻辑数据模型、物理数据模型8.矢量数据结构主要有spaghetti结构和拓扑矢量数据结构9.最基本的拓扑关系:关联、临接、包含10.栅格数据结构实际实质就是像元阵列,即像元按矩阵形式的集合11.栅格数据取值的四种方法:中心归属法、面积占优法、长度占优法、重要性法12.四叉树编码的方式:规则四叉树、线性四叉树、一对四式四叉树13.栅格数据的存储:全栅格式存储、链式编码、行程编码、块式编码、四叉树编码14.空间关系可分为:拓扑关系、度量关系、顺序关系15.面向对象的数据模型涉及四个抽象概念:分类,概括,聚集,联合、以及继承和传播两个语义模型工具16.TIN常用的算法:逐点插入法、分治算法、三角形生长法17.空间构模方法可归纳为:基于面模型、基于体模型、基于混合模型18.根据模型所具有的主要特征大致可以将其分为4类:三维矢量模型、三维体元模型、混合或集成数据模型、面向实体的数据模型19.图形数据与专题数据的链接基本上有4种方式:图形数据与专题属性数据分别管理、对通用DBMS扩展以增加空间数据库的管理能力、属性数据与图形数据有统一的结构、图形数据与属性数据自成体系20.目前空间索引技术超过50多种,可概括为树结构、线性映射和多维空间区域变换三种类型,从应用范围上可以分为静态索引和动态索引21.典型的空间索引技术包括:R树索引、四叉树索引、网格索引22.四叉树索引的方法有:点四叉树索引、MX四叉树索引、PR四叉树索引、CIF四叉树索引、基于固定网格划分的四叉树索引、线性可排序四叉树索引23.SQL查询语言的优点:非过程化语言、统一的语言、所有关系数据库的公共语言24.SQL查询语言的功能:查询、操纵、定义、控制25.SQL可细分为:DDL、DML、DCL26.主要的空间查询包括:点查询、区域查询、最邻近查询27.空间查询采用的算法:过滤筛选步骤、细化步骤28.查询分析的类型:属性查询、空间查询、空间分析29.空间数据交换的方式:①外部数据交换模式②直接数据访问模式③基于空间数据转换标准的转换④空间数据互操作模式30.空间数据库的设计可分为:需求分析,概念设计,逻辑设计,物理设计,数据库的实现,数据库的运行和维护6个阶段31.空间数据库需求分析主要包括三方面内容:用户基本需求调研、分析空间数据现状、系统环境/功能分析三、问答题1.空间数据库与传统数据库的差异:①信息描述差异。
空间数据库建库复习资料

1.GIS的名词分析与推论GIS概念:具有地理数据的采集、管理、分析、表达能力,能为决策者提供有用地理信息的系统.推论1:地理信息系统采集的数据为空间数据,即具有空间位置,又具有属性特征.地理信息系统的数据库因此又称为空间数据库.推论二:地理信息系统具有采集、管理、分析地理数据和表达地理信息的能力.包括空间数据库建设和空间数据库的应用两个层次.推论三:地理信息系统包括计算机硬件、软件、数据、系统开发人员和用户,但由于处理和分析的是地理数据,因此,在通用的硬件、软件基础上,还有体现专业特点的硬、软件.2.GIS空间数据体系空间数据库:空间数据和属性数据的组织矢量有混合式、扩展式和开放式矢量数据的空间数据组织:空间坐标数据的非结构化和属性数据的结构化栅格数据:像元阵列3.GIS数据模型矢量数据模型:简单数据结构〔面条结构〕:如Shapefile、拓扑数据结构:如Coverge、面向对象的数据模型:如Geodatabase栅格数据模型:栅格文件常用格式:*.tif,*.jpg,*.bmp等.GIS中的栅格格式:ESRI的Grid、Geodatabase的栅格数据集等.遥感图像的格式:PCI的* .pix,Erdas的*.img等.4.空间数据库设计核心将现实世界抽象为GIS数据模型,这是数据库设计的核心.5.名词解释:面条结构:数据按点、线、面为单元进行组织,点、线、面都有自己的坐标数据.最典型的是面条结构.拓扑数据结构:不仅存储空间位置,同时存储空间关系.拓扑关联:指存在于空间图形的不同类型元素之间的拓扑关系.如结点与弧段、弧段与多边形.第二章1.名词解释:数据词典:以词典的方式描述和定义E-R模型设计中出现和形成的实体、关系. 数据模型匹配:实现将实体类型和特征类型〔Coverage、Shapefile、Grid等〕的匹配.区:基于现有的面特征来描述复杂的区域如多个独立的多边形组成的区域、相互重叠的区域.路径系统:提供一套用现有的弧段特征模拟线形特征的工具,可以支持沿着弧发生的任何线现象的定义.空间数据分层:根据分层的基本原则,对数据模型匹配后的实体进行分层组织. 元数据:空间数据集的标识信息、数据质量信息、空间参照系统、内容信息、发布信息等.shp.xml存放的是元数据信息.2.GIS数据库设计的三个步骤:概念、逻辑、物理从概念到逻辑设计:定义实体与关系到数据模型匹配再到空间数据分层和属性表3.数据库设计需求分析、系统体系结构的确定由需求分析确定系统实现的功能,再由功能确定所需数据,再组织数据,建立功能数据关系矩阵,拟定初步计划〔数据获取可选方式、选择的数据是否满足用户需求和功能〕;简单说来就是确定数据到组织数据再到草拟初步计划.4.数据库设计的数据模型匹配与空间数据分层数据模型匹配:实现将实体类型和特征类型〔Coverage、Shapefile、Grid等〕的匹配.如行政区划是一个实体,其对应的ArcInfo数据模型就是Polygon也就是面.空间数据分层:根据分层的基本原则,对数据模型匹配后的实体进行分层组织.分层基本原则有图形原则和对象原则,同时给每一个层一个名称.第三章1.资料收集与预处理资料收集需考虑的问题:资料内容:完备性、原始资料资料精度:必须满足建库要求.〔如图纸变形小,纠正后误差小于0.1mm〕资料现势性:与数据库建设要求的时期一致.资料形式:优先选择数字形式的资料.信息类别与输入方式;从原始数据到目标数据的实现过程:森林调查数据:扫描——空间参考——矢量化小班卡片:格式转换遥感数据:格式转换——空间参考地形数据:扫描——空间参考——矢量化——格式转换2.地理参考〔空间参考〕的概念、地理参考的必要性和大致过程〔Georeferencing 工具的使用,以地形图为例〕地理参考:将图像数据嵌入到一个空间参照系中的过程.空间参照系可以是地理坐标系统,也可以是投影坐标系统.关键技术:–多项式次数:依图像确定–控制点•位置:精确•最少控制点:<n+1><N+2>/2,最少<>最好•分布均匀,变形大的地方多选控制点•保存控制点:View Link Table -Save–正确设置投影参数3.空间数据的类型与采集方式、半自动矢量的概念半自动矢量化:即人为给定初始点与其他初始要求,然后计算机自动完成数字化的过程成为半自动数字化.4.林相图空间数据采集流程〔从校正、矢量化到属性关联〕:看实验一5.数字高程模型的概念、利用ArcGIS建立数字高程模型的完整流程<从校正、矢量化、伪结点消除、到数字高程模型转换>数字高程模型:是用一组有序数值阵列形式表示地面高程的一种实体地面模型. 流程分两步:1〕.等高线数据的后处理:常见的拓扑错误有悬挂弧段、不与弧段、错误弧段和伪结点消除悬挂弧段与错误短弧段:基本思想:依据弧段长度字段进行选择〔select 工具〕Coverage:固有的Length字段Shapefile:如果无长度字段,可增加数值型字段并Calculate Geometry<Length> 融合弧段:Clean工具使用Clean融合弧段的步骤:转换手工编辑后的Shapefile为Coverage在ArcMap中量测适当融合值ArcCatalog-Coverage属性-Clean消除伪结点:Dissolve2〕有等高线生成Grid等高线Coverage转化为Grid表面命令:Topo to Raster工具Grid表面转换为Tin:Raster to Tin工具6.等高线伪结点的概念等高线伪结点:即指不是真正的等高线上面的结点,由于输入数据的质量误差,而造成的非真正的结点.7.空间数据拼接概念;矢量、栅格数据拼接流程;以国家标准的地形图为例,栅格底图拼接流程〔先剪裁-再拼接〕空间数据拼接:将分散的矢量或栅格数据进行拼接的过程.矢量、栅格数据拼接流程:8.坐标系定义的概念;投影转换的概念;它们的区别;实验3坐标系统定义:〔通过使用投影文件给空间数据的坐标值进行定义;〕GIS空间数据的坐标值通过文件方式存储.坐标值需要使用投影文件进行定义,才能与实际地面关联起来.对坐标值进行定义的投影文件反应的是该图层的文件坐标系统.空间数据的坐标值不可能丢失,除非将空间对象删除;但投影文件可能丢失.当对坐标值定义的坐标系统描述丢失后,坐标值就失去了与实地地面关联的信息.投影转换:将具有空间坐标系统的空间数据转换为另一个空间坐标系统,生成新的空间数据的过程.从ArcGIS显示数据机制分析:显示坐标系统:Layers的坐标系统文件坐标系统:Layer的坐标系统从ArcGIS显示数据机制分析Layers显示坐标系统默认依据第一个导入的图层的文件坐标系统,也可修改如果图层有坐标系统定义,图层自动转换文件坐标系统到显示坐标系统下显示实事求是的定义省会坐标系统:方案1:ArcToolBox:Data Management Tools-Define Projection方案2:ArcCatalog:Layer Properties转换矢量数据投影工具:ArcToolBox-Project转换栅格数据投影工具:ArcToolBox-Project Raster第四章1.Geodatabase的概念、Geodatabase的特征Geodatabase的概念与特征:简单说来就是面向对象的空间数据结构,是建立在DBMS之上的统一的、智能的空间数据模型;它将各个要素作为对象,支持自定义属性值X围和子类,同时扩展拓扑关系,支持图层和对象间的规则定义,将注记作为一个要素类2.Geodatabase的类型Personal GeodatabaseFile GeodatabaseArcSDE Geodatabase3.讨论:两个同区域要素类导入前能在ArcMap正确叠放显示,导入到要素数据集后两新要素类却不能在ArcMap叠放,可能原因?因为坐标系统未定义;4.属性域的概念、要素类的概念、要素数据集的概念、关系类的概念、拓扑关系的概念要素类:是具有相同几何类型的要素的集合.要素数据集:是共享一个空间坐标系统的要素类的集合.属性域:定义字段取值X围的要素;关系类:要素类或表格对象类之间通过公共字段建立起来的关系;拓扑关系:规定要素类内部或要素类之间的要素之间的空间关系,如等高线之间无伪节点;公交站点必须在道路线上;〔设置拓扑规则:Must Not Have Pseudos〕5.在Geodatabase建库中,属性域、子类型、关系类和拓扑关系的应用、建立道路和路灯的关系类〔道路移动,路灯也移动;道路删除,路灯也删除〕、将道路分级,设置不同级别的规则如何实现?如何实现定义禁伐林面积不能小于10的规则?复习实验四6.ArcSDE的概念,如何建立空间数据、空间数据库引擎的概念;ArcSDE的概念〔空间数据库引擎的概念〕:即数据通路,是ArcGIS的空间数据引擎,它是在关系数据库管理系统〔RDBMS〕中存储和管理多用户空间数据库的通路.它允许用户在多种数据管理系统中管理地理信息,并使所有的ArcGIS应用程序都能够使用这些数据.空间数据:构建Geodatabase的步骤〔以林业管理信息系统为例〕:在ArcCatalog建立一个空的数据库建立要素数据集添加数据集‘林业’要素类Feature Class第五章1.SketchUp简述SketchUp是一个极受欢迎并且易于使用的3D设计软件,官方将它比喻作电子设计中的"铅笔〞.它的主要卖点就是便用简便,人人都可以快速上手.并且用户可以将使用SketchUp创建的3D模型直接输出至Google Earth里,非常的酷!2.基于SketchUp和ArcGIS的三维建模完整流程详见PPT第五章3.导入3DS文件的坐标数据纠正方法,并分析与坐标系统定义的本质区别导入3DS文件的坐标数据纠正方法:获取原图中心位置坐标,直接偏移,但提示超出原图X围,只能新建MultiPatch要素,将转换的要素拷贝至新图层中进行Move. 与坐标系统本质区别:数据纠正方法只是简单地把坐标直接偏移,并未改变坐标系统,而坐标系统定义则是将坐标系统定义为事实上的坐标系统.。
空间数据库原理复习题

空间数据库原理复习题(2018)同济大学-测绘工程-地理信息系统方向必修课整理者:Quan一、★第一章1.地图数据的获取手段有哪些?地图的数字化、传感器技术、航空和航天平台技术、现代遥感技术、全球定位系统和惯性导航系统。
2.地图数据使用的坐标系有哪几种?地理坐标系、投影坐标系。
3.根据地理实体数字描述方式,空间数据可分为哪两种形式?矢量数据、栅格数据。
(另:从概念上分,空间对象数据、场对象数据)4.什么是空间数据非结构化特征?空间数据不像一般事务数据一样每一个记录都有相同的结构与长度,因为空间数据包含了拓扑信息,在方便空间数据分析与查询的同时增大了信息管理的难度。
5.空间数据管理演变有哪些过程?说明各过程的特点。
(1)人工管理阶段(20世纪50年代中期):数据不保存;没有数据管理软件;数据冗余;(2)文件系统阶段(20世纪60年代中期):数据文件是大量数据集合形式;面向用户;数据文件与对应程序有一定独立性;数据文件由顺序文件发展为索引文件、链接文件、直接文件等;(3)文件与数据库系统混合管理阶段(20世纪70年代中期):对用户观点的数据进行更严格描述;允许用户以记录或数据项作单位进行访问;数据的物理存储可以很复杂。
(4)全关系型空间数据库管理系统(20世纪70年代后期):不仅可以读写定长的属性数据,而且可以读写非结构化的图形数据,但由于二进制文件的读写效率低,速度慢,效率低。
(5)对象关系数据库管理系统:能直接管理和存储非结构化的空间数据,效率有所提升,但仍有很大限制。
可能成为空间数据管理的主流。
(6)面向对象的数据库系统:支持变长记录及对象的嵌套、信息的继承和聚集;但价格昂贵且不太成熟,不太通用。
6.什么是空间数据库的内容?矢量地形图数据库、数字高程模型数据库、影像数据库、数字栅格地形图、专题数据、数字地图、元数据。
第二章1.请叙述空间实体的地图表示方法。
(1)地图对空间实体的定位表示:空间信息在图形上表示为一组地图元素。
空间数据库

《空间数据库》习题第一章:1、什么是空间数据库?KA0394*******2、空间数据库有哪些特点?4001-520-5203、空间数据库与传统数据库的差异何在?4、空间数据库有哪些主要作用?5、目前空间数据库存在哪些主要问题?6、简述空间数据库发展的历史和现状。
7、何谓空间数据?8、地理空间类型的表现形式主要有哪些?9、何谓地理空间?10、当前常用的数据库软件有哪些?11、空间数据的类型主要有哪几种?第二章:1、空间实体包括哪些?2、空间实体类型主要有哪几种?3、什么是空间认知的三层模型?4、什么是空间认知的九层模型?5、地理空间场操作可分为哪几种?6、何谓空间认知?7、什么是E-R模型?第三章:1、OGC定义的基本几何空间对象有哪些?2、GIS逻辑数据模型主要有哪些?3、什么是面向对象数据模型?4、面向对象数据模型所涉及的主要概念及主要技术有哪些?5、三维空间数据模型主要有哪几种?6、构成E-R模型的三要素指什么?7、Spaghetti数据结构与拓扑矢量数据结构的差异何在?8、简述三维矢量模型的数据结构特征。
9、简述三维体元模型的数据结构特征。
10、空间关系主要有哪几种?11、GIS逻辑数据模型主要有哪几种?第四章:1、ArcGIS的Geodatabase是如何定义空间对象模型的?2、空间数据的管理方式有哪些?3、什么是空间数据引擎?4、空间数据库引擎管理空间数据的实现方法有哪些?5、何谓栅格金字塔结构?6、空间数据库引擎的作用是什么?7、栅格数据的存储方式主要有哪些?8、栅格数据有几种取值方法?9、空间数据的组织方式有哪些?10、主要空间数据库管理方法各有何优缺点?第五章:1、四叉树索引有几种方法?2、简述网格空间索引的基本原理。
3、什么是空间数据库索引技术?第六章:1、空间查询主要有哪几种类型?2、空间连接查询的实现过程分哪那两步?3、现给出如下关系模式:COUNTY(Name:varchar(35),count:varchar(35),Pop:Integer,GDP:Integer,Life_Exp:Integer,Shape:Binary);CITY(Name:varchar(35),count:varchar(35),Pop:Integer,Capital:Char (I),Shape:Binary);RIVER(Name:varchar(35),Origin;varchar(35),Length:Integer,Shape:Binary)。
《空间数据库》复习

《空间数据库》复习1、空间数据具有哪些特点?空间特征空间关系非结构化抽象特征多时空性特征分类编码特征海量数据特征多尺度与多态性2、为什么不适合直接采用关系型数据库对空间数据进行管理?(1)传统数据库管理的是不连续的相关性较小的数字或字符,而空间数据是连续的,并且有很强的空间相关性;(2)传统数据库管理的实体类型较少,并且实体类型间关系简单固定,而GIS数据库的实体类型繁多,实体间存在着复杂的空间关系;(3)传统数据库存储的数据通常为等长记录的数据,而空间数据的目标坐标长度不定,具有变长记录,并且数据项可能很多,很复杂;(4)传统数据库只查询和操作数字和文字信息,而空间数据库需要大量的空间数据操作和查询。
3、常用的空间数据库管理方式有哪几种及其各自特点。
㈠文件关系数据库混合管理方案用一组文件形式来存储地理空间数据及其拓扑关系,利用通用关系数据库存储属性数据,通过唯一的标识符来建立它们之间的连接。
优点:⑴GIS 可通过DBMS提供的高级编程语言的接口,直接操纵属性数据,查询属性数据库,并在GIS的用户界面下,显示查询结果。
⑵在ODBC推出后,GIS软件商只需开发GIS与ODBC的接口软件,就可将属性数据与任何一个支持ODBC的RDBMS连接。
这样用户可在一个界面下处理图形和属性数据。
缺点:⑴属性数据和图形数据通过ID联系起来,使查询运算,模型操作运算速度慢;⑵数据发布和共享困难;⑶属性数据和图形数据分开存储,数据的安全性、一致性、完整性、并发控制以及数据损坏后的恢复方面缺少基本的功能;⑷缺乏表示空间对象及其关系的能力。
㈡全关系式数据库管理方案基于关系模型方式,将图形数据按关系模型组织。
图形数据和属性数据统一存储在通用关系数据库中,即将图形文件转成关系存放在目前大部分关系型数据库提供的二进制块中。
将图形数据变长部分处理成Binary Block字段优点:⑴在全关系型数据库中加入了二进制数据块形式省去大量关系连接操作,可提高查询速度;⑵便于数据的维护。
空间数据库复习重点答案(完整)
空间数据库复习重点答案(完整)1、举例说明什么是空间数据、非空间数据?如何理解空间查询和非空间查询的区别?常用的空间数据库管理方式有哪几种及其各自特点。
文件管理阶段缺点:1)程序依赖于数据文件的存储结构,数据文件修改时,应用程序也随之改变。
2)以文件形式共享,当多个程序共享一数据文件时,文件的修改,需得到所有应用的许可。
不能达到真正的共享,即数据项、记录项的共享。
常用:文件与数据库系统混合管理阶段优点:由于一部分建立在标准的RDBMS上,存储和检索数据比较有效、可靠。
缺点:1)由于使用了两个子系统,它们各自有自己的规则,查询操作难以优化,存储在RDBMS外的数据有时会丢失数据项的语义。
2)数据完整性的约束条件可能遭破坏,如在几何空间数据系统中目标实体仍存在,但在RDBMS中却已删除。
3)几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多全关系型空间数据库管理系统◆属性数据、几何数据同时采用关系式数据库进行管理◆空间数据和属性数据不必进行烦琐的连接,数据存取较快◆属性间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作◆GIS软件:Sytem9,SmallWorld、GeoView等本质:GIS软件商在标准DBMS顶层开发一个能容纳、管理空间数据的系统功能。
对象关系数据库管理系统优点:在核心DBMS中进行数据类型的直接操作很方便、有效,并且用户还可以开发自己的空间存取算法。
缺点:用户须在DBMS环境中实施自己的数据类型,对有些应用相当困难。
面向对象的数据库系统。
采用面向对象方法建立的数据库系统;GIS是一个利用空间分析功能进行可视化和空间数据分析的软件。
它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量GIS可以利用SDBMS来存储、搜索、查询、分享大量的空间数据集改:地理信息系统是以地理空间数据库为基础,在计算机软硬件的支持下,运用系统工程和信息科学的理论,科学管理和综合分析具有空间内涵的地理数据,以提供管理、决策等所需信息的技术系统。
空间大数据库原理复习题
空间数据库原理复习题(2018)同济大学-测绘工程-地理信息系统方向必修课整理者:Quan一、★第一章1.地图数据的获取手段有哪些?地图的数字化、传感器技术、航空和航天平台技术、现代遥感技术、全球定位系统和惯性导航系统。
2.地图数据使用的坐标系有哪几种?地理坐标系、投影坐标系。
3.根据地理实体数字描述方式,空间数据可分为哪两种形式?矢量数据、栅格数据。
(另:从概念上分,空间对象数据、场对象数据)4.什么是空间数据非结构化特征?空间数据不像一般事务数据一样每一个记录都有相同的结构与长度,因为空间数据包含了拓扑信息,在方便空间数据分析与查询的同时增大了信息管理的难度。
5.空间数据管理演变有哪些过程?说明各过程的特点。
(1)人工管理阶段(20世纪50年代中期):数据不保存;没有数据管理软件;数据冗余;(2)文件系统阶段(20世纪60年代中期):数据文件是大量数据集合形式;面向用户;数据文件与对应程序有一定独立性;数据文件由顺序文件发展为索引文件、文件、直接文件等;(3)文件与数据库系统混合管理阶段(20世纪70年代中期):对用户观点的数据进行更严格描述;允许用户以记录或数据项作单位进行访问;数据的物理存储可以很复杂。
(4)全关系型空间数据库管理系统(20世纪70年代后期):不仅可以读写定长的属性数据,而且可以读写非结构化的图形数据,但由于二进制文件的读写效率低,速度慢,效率低。
(5)对象关系数据库管理系统:能直接管理和存储非结构化的空间数据,效率有所提升,但仍有很大限制。
可能成为空间数据管理的主流。
(6)面向对象的数据库系统:支持变长记录及对象的嵌套、信息的继承和聚集;但价格昂贵且不太成熟,不太通用。
6.什么是空间数据库的容?矢量地形图数据库、数字高程模型数据库、影像数据库、数字栅格地形图、专题数据、数字地图、元数据。
第二章1.请叙述空间实体的地图表示方法。
(1)地图对空间实体的定位表示:空间信息在图形上表示为一组地图元素。
空间数据库考试复习资料
1.空间数据的定义及特点定义:空间数据是指用来描述空间实体的位置、形状、大小及其分布特征等诸多方面信息的数据,以及表示地球表层一定范围内的地理事物及其关系。
特点:(1)空间性,空间性表示了空间实体的位置或所处的地理位置、空间实体几何特征以及空间实体的拓扑关系,从而形成了空间实体的位置、形态以及由此产生的一系列特性。
空间性又包括空间定位、空间度量、空间结构和空间集合。
(2)专题性,专题性是指在一个坐标位置上的地理信息具有专题属性信息。
(3)时间性,时间性是指空间数据的空间特性和属性特征随时间变化的动态变化特征,即时序特征。
2.空间数据库的定义及特点定义:空间数据库是存放空间数据的数据库。
更准确地说,空间数据库是描述空间物体的位置数据、位置数据元素(点、线、面)之间的拓扑关系及描述这些物体的属性数据的数据库。
特点:(1)空间数据库管理的是现实世界中相关性大的连续数据,要求进行综合管理;(2)空间数据库中描述的数据实体类型多,关系复杂。
使数据模型复杂;(3)空间数据库存储的空间数据具有非结构化特征,不满足关系数据模型的范式要求。
3.传统关系数据库模型的局限性答:(1)用关系模型描述具有复杂结构和含义的地理对象时,对地理实体进行不自然的分解,导致存储模式、查询途径及操作等方面不够合理;(2)关系数据库模型无法用递归和嵌套的方式来描述复杂关系的层次和网状结构,因此模型和操作复杂地理对象的能力较弱;(3)空间数据中图形数据通常是变长的,而一般空间数据库管理系统记录固定长度的记录,这不利于空间数据的表达;(4)GIS要管理的是具有高度内部联系的数据,为了保证地理数据库的完整性,需要复杂的安全维护系统。
4.空间数据库引擎的定义及特点答:定义:SDE是空间数据组织管理的重要基础技术,从用户的角度的角度看,SDE是用户和异构空间数据库的接口;从软件的角度看,SDE是应用程序和空间数据库管理系统之间的查件,用来管理空间数据库;从系统的角度来看,SDE 利用空间数据库管理系统和其扩展功能,实现空间数据在数据库中的物理存储。
武汉大学空间数据库自考复习题d
《空间数据库原理》一、概念解释1.空间数据结构是指空间数据适合于计算机存储、管理、处理的逻辑结构,是空间数据在计算机内的组织和编码形式,是地理实体的空间排列和相互关系的抽象描述。
2.空间数据库管理系统(SDBMS)对各类空间数据进行统一处理、存储、维护和管理的软件系统。
SDBMS是空间数据库的核心软件,他对空间数据和属性数据进行了一体化,为GIS应用开发提供空间数据库管理系统除了必须具备普通数据库管理系统的功能。
3.网格索引网格索引是空间数据库的非常常用的一种索引方法,通过对地理空间进行网格划分,划分成大小相同的网格,每个网格对应着一块存储空间,索引项登记上落入该网格的空间对象。
4.空间数据挖掘空间数据挖掘是指从空间数据库中抽取没有清楚表现出来的隐含的知识和空间关系,并发现其中有用的特征和模式的理论、方法和技术。
5.后关系型数据库采用了更现代化的多维模型,作为数据库引擎。
并且,这种以稀疏数组为基础的独特的多维数据库架构,是从已成为国际标准的数据库语言基础上继承和发展的数据库二、简答题1.什么是空间曲线填充?z曲线填充在数据库设计中的作用是什么?空间填充曲线是利用一个线性顺序来填充空间,可以获得丛一端到另一端的曲线。
多维空间本身没有自然排序关系,但存在一对一的连续映射,可以将多维空间的点映射到一维空间,以达到对多维空间进行一维排序的目的。
常用的算法有Z曲线和Hilberlt曲线Z曲线:1)读入x和y坐标的二进制表示 2)隔行扫描二进制数字的比特到一个字符串3)计算出结果二进制串的十进制值,作用:1)空间数据所处的多维空间中没有天然的顺序,加强了多维空间中的位置顺序2)允许在空间数据中使用传统的有效搜索3)存储磁盘从逻辑上说是一维的设备,空间聚类技术就是要寻找一个从高维空间向一维空间的映射方法,空间上邻近的元素,映射为直线上接近的点,而且一一对应为达到这一目的,人们提出了很多种算法2.试举例说明空间数据库设计的主要内容是什么?空间数据库设计的任务:经过一系列转换,将现实世界描述为计算机世界中的空间数据模型,也就是将地理现象表示为空间数据模型和数据结构。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Chapter 1: Introduction to Spatial Databases1、举例说明什么是空间数据、非空间数据?如何理解空间查询(spatial queries)和非空间查询的区别(Non-spatial queries)?答:河流的泛洪区,卫星影像数据、气象气候数据等都可以是空间数据书店名称店员人数,去年的销售量,电话号码等是非空间数据空间查询是对空间数据的查询或命令2、什么是GIS,什么是SDBMS?请阐述二者的区别和联系。
答:1、GIS是一个利用空间分析功能进行可视化和空间数据分析的软件。
它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量GIS 可以利用SDBMS来存储、搜索、查询、分享大量的空间数据集2、SDBMS是一个软件模块。
它可以①、利用一个底层的数据库管理系统②、支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言③、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则3、区别与联系:①、利用GIS可以对某些对象和图层进行操作,而利用SDBMS则可以对更多的对象集和图层进行更加简单的操作②、SDBMS可以在GIS不能使用的某些领域进行使用,例如基因组学、天文学、多媒体信息系统等③、GIS可以作为SDBMS的前端,利用一个高效的SDBMS可以大大提高GIS的效率和生产率。
3、从GIS这一缩写的三种含义来理解GIS的发展历程。
答:地理信息系统:为专业人员提供的软件地理信息科学:为地理信息系统和服务提供使用和发展的定义、框架和理论地理信息服务:为普通用户提供的网点和服务中心,例如PC机上的地理和空间服务4、用传统数据库系统管理空间数据,存在什么不足之处?答:1)无法用递归和嵌套的方式来描述复杂关系的层次和网状结构,模拟和操作复杂地理对象的能力较弱;2)用关系模型描述本身具有复杂结构和涵义的地理对象时,需对地理实体进行不自然的分解,导致存储模式、查询途径及操作等方面均显得语义不甚合理;3)由于概念模式和存储模式的相互独立性,及实现关系之间的联系需要执行系统开销较大的联接操作,运行效率不够高4)空间数据通常是变长的,而一般RDBMS只允许记录的长度设定为固定长度,此外,通用DBMS难于存储和维护空间数据的拓扑关系。
5)一般RDBMS都难以实现对空间数据的关联、连通、包含、叠加等基本操作。
6)一般DBMS不能支持GIS需要的一些复杂图形功能。
7)一般RDBMS难以支持复杂的地理信息,因为单个地理实体的表达需要多个文件、多条记录,包括大地网、特征坐标、拓扑关系、属性数据和非空间专题属性等方面信息。
8)GIS管理的是具有高度内部联系的数据,为了保证地理数据库的完整性,需要复杂的安全维护系统,而这些完整性约束条件必须与空间数据一起存储,由地理数据库来维护系统数据的完整性。
否则,一条记录的改变会导致错误、相互矛盾的数据存在,而一般RDBMS 难以实现这一功能。
5、What is a SDBMS ?答:SDBMS是一个软件模块。
它可以①、利用一个底层的数据库管理系统②、支持多种空间数据模型、相应的空间抽象数据类型(ADT)以及一种能够调用这些ADT的查询语言③、支持空间索引、高效的空间操作算法以及用于查询优化的特定领域规则6、什么是后关系数据库模型?后关系数据库模型有哪些?答:后关系数据库模型支持用户定义抽象数据类型,空间数据的类型可以添加。
包括面向对象的数据库模式OOBDMS和面向关系ORDBMS的数据库模式。
7、SDBMS的三层体系结构(Three Layer Architecture)是什么?借此深入理解SDBMS的作用。
答:空间应用—空间数据库—DBMS教材P11的图8、空间数据库主要涉及哪些内容?答:数据模型、查询语句、查询处理与优化、文件组织和索引、数据挖掘9、举例说明单遍扫描查询和多遍扫描查询的概念。
答:单边扫描查询中,被查询的表(关系)中的一条记录(元组)最多只被访问一次;例如“列出武大周围5km内的书店的名字”。
多遍扫描查询是被查询的表(关系)中的一条记录(元组)至少被访问一次,例如“找出其代表的选取范围大于200公顷并且在这区拥有公司的女议员的名字”10、过滤-精炼策略的作用?两个步骤的内容是什么?提示:ppt :Efficient algorithms to answer spatial queriesCommon Strategy - filter and refine(过滤-精炼)Filter Step:Query Region overlaps with MBRs of B,C and D过滤:查询区域与B、C、D的最小外接矩形有重叠部分,保留B、C、D,其他的舍弃Refine Step: Query Region overlaps with B and C精炼:查询区域与B、C有重叠,舍弃D11、平面扫描(plane sweep)技术主要解决什么问题?其主要步骤?答:主要解决的是如何在过滤阶段中尽可能多的淘汰不符合条件的对,从而减少几何计算的计算代价。
Step 1:从左至右移动一条扫描线(例如,垂直于x轴的线),停在R∪S的第一个元素处。
这就是具有最小T.xl值的矩形T,例子为是矩形R4 。
Step2:搜索S中已排序的矩形,直到抵达第一个矩形Sf,这里有Sf.xl> T.xu。
显然,对于所有1≤j<f,关系[T.xl,T.xu]∩[Sj.xl,Sj.xu]存在(非空),在本例中Sf就是S1。
注意f是以图1-9c的数组索引为序,即S1=S2、S2= S1、S3=S3。
这样S2就是一个可能与R4交叠的候选矩形。
Step 3:如果对任意l≤j≤f,关系[T.yl,T.yu] ∩[Sj.yl,Sj.yu]存在,则Sj与T相交。
因此,这一步就确定了R4与S2的确是交叠的,并且< R4,S2>是连接结果的一部分。
记录所有这样的信息,然后将矩形T(R4)从集合R∪S中去掉,它不再需要参与结果集中的其他相交对。
Step 4:继续移动扫描线来穿过集合R∪S,直至碰到下一个矩形,在本例中是S2。
这时进行步骤2和3。
Step 5:当R∪S=∅时,处理结束;12、从程序员的观点和DBMS设计者的观点看,影响系统效率的因素有何不同。
答:在程序员看来,计算机主要包括两个部分:CPU和无限量的内存在DBMS设计者看来,计算机主要包括三个部分:CPU、有限的内存、无限的硬盘空间。
访问硬盘的速度要远远小于访问内存的速度,因此前者关注减少算法的计算时间,后者强调的是将计算时间和I/O时间的总和减少到最小。
13、查询优化和数据挖掘的概念。
答:查询优化:基于数据集的特点对查询中的操作进行排序,为每一步操作选择有效策略数据挖掘:即进行系统的搜索,找出隐藏在电子信息中潜在的有用信息。
Chapter 2: Spatial Concepts and Data Models1、什么是数据模型?举例说明数据模型的重要性。
答、数据模型是数据集的特定结构和模式,是对数据的文件描述,有利于某些性质的前期分析。
作用:①、属性的前期分析;②、重利用多媒体应用中的共享数据;③、组织中交换数据④、将数据传递给新软件或环境例子:千禧年危机正确的使用数据模式可以显著的降低成本,如果软件中的时间和数据被定义成抽象数据模型,只有一小部分的软件会执行数据,ADT数据要被重新修改。
2、掌握两种常用的空间信息模型:要素模型和场模型,矢量、栅格数据结构。
答:场模型:①、空间分割框架②、场函数③、场操作:并、复合森林模型中分段函数表示,区域中每个点被映射成主要树种对应的值要素模型:①、对象:把空间信息抽象成明确的,可识别的事物或实体;②、对象具有属性和操作森林模型中多边形表示(林分),每个对象有唯一的标示符、主要树种和一块区域。
矢量数据结构栅格数据结构:栅格结构用密集正方形(或三角形,多边形)将地理区域划分为网格阵列。
位置由行,列号定义,属性为栅格单元的值。
点:由单个栅格表达。
线:由沿线走向有相同属性取值的一组相邻栅格表达。
面:由沿线走向有相同属性取值的一片栅格表达。
3、基于场模型的操作有哪些,举例说明区基于场模型的局部操作、聚焦(focal)和区域操作?基于对象模型的操作有哪些?答:基于场模型:局部操作:空间框架内一个给定位置的新场的取值只依赖于同一个位置场的输入值。
书上P31。
聚焦操作:在指定位置的结果场的值依赖于同一位置的一个假定小领域输入场的值。
极限、高程场的梯度区域操作:与聚集运算符或微积分中的积分运算有关。
计算每个树种的平均高度。
基于对象模型:面向集合、拓扑、方位、度量空间4、什么是拓扑关系,举例说明拓扑与非拓扑特性、拓扑与非拓扑操作。
答:是指满足拓扑几何学原理的各空间数据间的相互关系。
即用结点、弧段和多边形所表示的实体之间的邻接关联和包含等关系。
拓扑特性:弹性变形后临近物体之间的拓扑关系没有发生改变非拓扑特性:弹性变形后临近物体之间的拓扑关系发生了改变拓扑操作与非拓扑操作5、OGIS提出的关于空间几何体的基本构件有哪些?6、说明九交模型表达拓扑关系的原理。
答:在一个平面上。
两个对象A、B之间的二元拓扑关系主要基于以下的相交情况,即分别是A和B的内部、边界、外部。
值六部分可以构成九交模型。
考虑取值有空(0)和非空(1),可以确定有29=512种二元拓扑关系。
对于R²嵌在中的二维区域,有八个关系是可实现的,并且它们彼此互斥且完全覆盖。
:相离、相接、交叠、相等、包含、在内部、覆盖、被覆盖。
7、数据库设计的三个步骤及其主要内容。
答、首先,采用高层次的概念数据模型来组织所有与应用相关的可用信息;然后,逻辑建模阶段,与概念数据模型在商用DBMS上的具体实现有关最后,数据库设计的第三个步骤是物理设计的建模,它解决数据库营养在计算机中具体实现是方方面面的细节。
8、ER模型的作用,ER图包括哪些要素,如何表达多值属性?ER图与空间信息对象模型之间的异同?答:ER图可以以一种避开计算机隐喻的方式来表达这个微型世界,从而把应用中的概念与实现细节分离开来。
ER图包括实体(物理上或概念上独立存在的事物或对象)、属性和联系。
实体用属性来刻画性质,实体之间通过练习相互作用和关联。
属性可以是单值或多值。
ER图中实体用矩形表示,属性表示为椭圆,联系为菱形。
码属性加下划线,多值属性用双椭圆。
异同:①、实体是物体属性的集合;②、ER模型不允许普通用户定义操作;③、在对象模型中关系不被直接支持,但可以由操作来模仿。
9、数据库三层约束的内容:码约束--实体完整性(entity integrity)约束,参照完整性(referentialintegrity]约束和用户参照完整性。