空间索引结构(遥感)

合集下载

GIS试卷题目及答案

GIS试卷题目及答案

GIS试卷题目及答案1、空间信息技术包括哪三部分?1)卫星定位系统2)地理信息系统3)遥感技术2、空间实体具有哪些基本特征?P631)空间位置特征。

(表示空间实体在一定的坐标系中的空间位置或几何定位,包括空间实体的位置、大小、形状和分布状况等。

)2)属性特征。

(是与空间实体相联系的、表征空间实体本身性质的数据或数量,如实体的类型、语义、定义、量值等。

)3)时间特征。

(是指空间实体随着时间变化而变化的特性。

)4)空间关系特征。

(在地理空间中,空间实体一般都不是独立存在的,而是相互之间存在着密切的联系。

这种相互联系的特性就是空间关系。

包括拓扑关系、顺序关系和度量关系。

)3、数字地形分析和数据高程模型P2361)数字地形分析(DTA)是指在数字高程模型上进行地形属性计算和特征提取的数字信息处理技术。

其主要内容有两方面:一是提取描述地形属性和特征的因子,并利用各种相关技术分析解释地貌形态、划分地貌形态等;二是DTM的可视化分析。

根据分析内容,常用的数字地形分析方法有①坡面地形因子提取②特征地形要素提取③地形统计特征分析。

2)数字高程模型(DEM)是通过有限的地形高程数据实现对地形曲面的数字化模拟(即地形表面形态的数字化表示),高程数据常常采用绝对高程(即从大地水准面起算的高度)。

①从狭义的角度定义,DEM是区域表面海拔高程的数字化表达。

②从广义的角度定义,DEM是地理空间中地理对象表面海拔高度的数字化表达。

4、目前,地理空间数据的概念模型大致分为哪三类?P65 1)场模型,用于描述空间中连续分布的现象。

2)对象模型,用于描述各种空间地物。

3)网络模型,可以模拟现实世界中的各种网络。

5、GIS系统应该具备的功能有哪些?P91)数据采集功能。

2)数据编辑与处理。

3)数据存储、组织与管理功能。

4)空间查询与空间分析功能。

5)数据输出功能。

6、数字地形分析是怎样一种信息数据模型数字地形分析(DTA)是指在数字高程模型上进行地形属性计算和特征提取的数字信息处理技术。

GIS名词解释

GIS名词解释

GIS,由计算机硬件,软件和不同的方法组成的系统,该系统支持空间数据的采集,管理。

处理,分析,建模和显示,以便解决复杂的规划和管理问题℡救赎ヽ(1838247150) 17:31:15地理信息。

是指表示地理环境诸多要素的数量,质量,分布特征以及相互联系和变化规律的数字,文字,图像和图形等的总称℡救赎ヽ(1838247150) 17:34:34信息系统是具有采集管理,处理,分析和表达能力的系统。

信息系统是为实现某些特定功能,由人,机器,数据或方法按一定的相关关系联系起来进行工作的集合体,内部要素之间的相互联系通过信息流来实现。

由硬件,软件,数据和用户四个主要部分组成。

2017-10-25℡救赎ヽ(1838247150) 12:20:39地理数据,以地球表面空间位置为参考,描述自然和社会经济要素的数据,可以是图形,图像,文字,数字和表格等。

℡救赎ヽ(1838247150) 12:22:04地理信息科学,是研究地理信息采集,分析。

存储,显示,管理,传播和应用,以及地理信息流的产生,传输和转化规律的一门科学℡救赎ヽ(1838247150) 12:24:28数据模型,是对现实世界进行认知,简化和抽象表达,并将抽象结果组织成能反映现实世界真实状况数据集的桥梁,是GIS的基础。

2017-10-26℡救赎ヽ(1838247150) 10:51:38矢量数据结构,以几何空间坐标为基础,记录取样点坐标,能够精确的表示点,线及多边形实体,可以得到精美的地图,还可以对复杂数据以最小冗余进行存储,数据精度高,占存储空间少,是一种高效的图形数据结构。

℡救赎ヽ(1838247150) 10:55:40栅格数据结构,基于栅格模型的数据结构简称为栅格数据结构,指将空间分割成有规则的网格,在各个网格上给出相应的属性值来表示地理实体的一种数据组织形式。

℡救赎ヽ(1838247150) 10:57:26栅格矩阵,是最简单的栅格数据存储的方法,又称直接栅格编码。

空间索引结构(学生)分解

空间索引结构(学生)分解

第七章空间索引结构空间索引技术是从空间数据库中获取空间数据的有效方法,是提高空间数据查询和各种空间分析效率的关键技术。

建立空间索引是为了缩小空间数据的搜索范围,以便在空间数据查询时不必遍历整个空间数据集,只访问空间索引数据便可快速得到一条特定的空间查询语句所请求的空间数据,或得到包含全部空间查询结果的一个较小的空间数据集。

索引文件中包含的数据称为索引数据,索引结构是索引数据的数据结构及索引创建与维护算法的总称。

空间索引结构是按照空间数据在空间分布上的特性来组织和存储索引数据的索引结构。

一种良好的空间索引结构应满足下列三个要求:一、存储效率高:相对于被索引的数据集而言,索引数据的数据量应尽量小。

否则,访问索引数据可能成为数据查询与更新的效率瓶颈。

二、查询效率高:空间索引结构需要选择良好的索引数据结构,设计具体的基于索引的空间访问方法(SAM Spatial Access Method),必须能够高效的实现以下几种基于位置的查询:1、点选择:从数据集中找出包含给定点的所有空间对象。

2、范围查询:查询与给定对象间的距离小于某个给定值的所有空间对象。

3、区域(窗口)查询:查找含在区域内、与区域相交或部分位于区域中的所有空间对象。

窗口是一个特殊的区域,窗口查询是GIS中最常用、最基本的查询。

4、K-最邻近查询:给定一个参照对象(点、线或区域),查询距离参照对象最近的K 1个空间对象。

5、空间关系查询:相交、相邻、包含等拓扑关系查询,方位关系和基于距离的各种查询。

6、其他查询:将满足一定空间条件的两个空间对象集合进行空间连接,空间集合运算等也是一种空间访问。

三、更新效率高:许多GIS应用中会涉及海量且不断变化的空间数据集。

数据集中数据对象的增加、修改和删除将直接导致索引数据的更新,索引数据与被索引的数据集必须保持一致,才能保证基于索引数据的查询结果的正确性。

索引数据的更新操作包括:插入索引项,将新数据对象的索引项添加到索引数据中;删除索引项,把数据对象的索引项从索引数据中删除;修改索引项,在索引数据中先删除再增加该数据对象的索引。

gis地理信息系统考试复习资料

gis地理信息系统考试复习资料

Gis地理信息系统复习资料大全1、地理信息:地理信息是有关地理实体和地理现象的性质、特征和运动状态的表征和一切有用的知识,它是对表达地理特征与地理现象之间关系的地理数据的解释。

2、地理数据:是各种地理特征和现象间关系的数字化表示,包括空间位置、属性信息、时空特征3、地理信息系统:一种特定的十分重要的空间信息系统,是在计算机软、硬件系统支持下,对整个或部分地球表层(包括大气层)的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。

4、地理空间分析的三大要素:空间位置、属性、时间5、GIS的基本功能:采集、编辑与处理、数据存储和管理、空间查询和空间分析、数据输出6、GIS的组成:硬件系统、软件系统、网络、空间数据、管理和应用人员1、地图投影:将地球椭球面上的点映射到平面上的方法,称为地图投影2、GIS中为什么要考虑地图投影?地理坐标为球面坐标,不方便进行距离、方位、面积等参数的量算地球椭球体为不可展曲面地图为平面,符合视觉心理,并易于进行距离、方位、面积等量算和各种空间分析3、投影有哪几种变形?长度变形、面积变形、角度变形4、我国国家的基本比例尺地形图有哪些?1:100万:兰勃特投影大部分分省图、大多数同级比例尺也采用兰勃投影1:50万、1:25万、1:10万、1:5万、1:2.5万、1:1万、1:5000采用高斯—克吕格投影。

1、概念模型:地理空间中地理事物与现象的抽象概念集,是地理数据的语义解释。

2、逻辑模型:GIS描述概念数据模型中实体及其关系的逻辑结构,是系统抽象的中间层3、物理模型:是概念模型在计算机内部具体的存储形式和机制,即在物理磁盘上如何存放和存取,是系统抽象的最底层4、概念模型的分类:对象模型、场模型、网络模型5、对象模型:是将整个研究地理空间看作是一个空域,地理现象和空间实体作为独立的对象分布在该空间区域中,对象模型强调地理空间的单个地理现象6、场模型:把地理空间中的现象作为连续的变量或体来看待,如大气污染程度、地表温度、地形高度7、网络模型:网络模型是描述不连续的地理现象,与对象模型在某些方面类似,不同之处在于它需要考虑通过路径相互连接多个地理现象之间的连通情况。

空间索引算法

空间索引算法

空间索引算法随着科技的不断发展,数据量的急剧增加,如何高效地存储和检索数据成为了一个重要的问题。

在空间数据检索领域,空间索引算法是一种常用的解决方案。

本文将介绍空间索引算法的基本概念、分类和应用。

一、基本概念空间索引算法是一种将空间数据组织成索引结构以便快速检索的算法。

其基本思想是将空间数据划分为若干个空间单元,将数据存储在相应的单元内,并建立索引来加速检索。

空间单元的划分方式和索引结构的设计是空间索引算法的核心内容。

二、分类根据空间单元的划分方式和索引结构的设计,可以将空间索引算法分为以下几类。

1.基于网格的算法基于网格的算法是将空间数据划分为规则的网格单元,每个单元内存储相应的数据对象。

网格单元的大小可以根据数据密度和查询需求进行调整。

常见的网格单元有正方形和六边形。

基于网格的算法包括Quadtree、Octree、R-Tree等。

Quadtree是一种将空间划分为四叉树的算法,每个节点代表一个正方形空间单元。

从根节点开始,将空间逐级划分为四个子节点,直到每个节点内只包含一个数据对象。

查询时,从根节点开始递归遍历四叉树,找到与查询范围相交的节点,将其子节点加入遍历队列,直到队列为空。

Quadtree适用于二维空间数据的存储和检索。

Octree是一种将空间划分为八叉树的算法,每个节点代表一个立方体空间单元。

从根节点开始,将空间逐级划分为八个子节点,直到每个节点内只包含一个数据对象。

查询时,从根节点开始递归遍历八叉树,找到与查询范围相交的节点,将其子节点加入遍历队列,直到队列为空。

Octree适用于三维空间数据的存储和检索。

R-Tree是一种将空间划分为多维矩形的算法,每个节点代表一个矩形空间单元。

从根节点开始,将空间逐级划分为多个子节点,直到每个节点内只包含一个数据对象或者达到最大容量。

查询时,从根节点开始递归遍历R-Tree,找到与查询范围相交的节点,将其子节点加入遍历队列,直到队列为空。

R-Tree适用于多维空间数据的存储和检索。

GIS资料(测绘工程、地信、遥感)

GIS资料(测绘工程、地信、遥感)

1数据是指通过数字化或直接记录下来的可以被鉴别的符号,它不仅包括数字还包括文字、符号、图形、图像以及各种可以转换成数据的现象。

2信息是指用数字、文字、符号、语言等介质来表示事件、事物、现象等内容、数量和特征,是向人们或机器提供关于现实世界各种事实的知识,是数据、消息中所包含的意义,它不随载体的物理形式的各种改变而改变。

4数据与信息之间的关系:数据包含原始事实,信息是数据处理的结果,它是把数据处理成有意义或有用的形式。

对一个人是信息对其他人可能数据;信息必须是有意义或有用的。

数据与信息不可分,信息来自数据。

信息是用记录在各种物理介质中的数据来表达的。

数据中所包含的意是信息。

即信息是数据的内涵,而数据是信息的表达,数据只是信息的载体,并不等同于信息。

5地理数据:地理圈或地理环境固有要素或物质的数量、质量分布特征、联系和规律的数字、文字、图像和图形等的总称,(包括几何数据、属性数据、时间数据)6地理信息:有关地理实体的性质、特征和运动状态的表征和一切有用的知识,它是对地理数据的解释(特征:区域特征、多维特征、时间特征)7信息系统:能对数据和信息进行采集、存储、加工和再现,并能回答用户一系列问题的系统称为信息系统。

8地理信息系统:以采集、储存、管理、分析和描述整个或部分地球表面与空间和地理分布有关的数据的空间信息系统。

(构成:硬件,软件,系统开发、管理与使用人员,地理空间数据库)10地理信息系统一般信息系统之间的区别:1.地理信息系统在分析处理问题中使用了空间数据与属性数据,并通过数据库管理系统将两者联系在一起共同管理、分析和应用,从而提供了认识地理现象的一种新的思维方法。

而管理信息系统则只有属性库的管理,即使存储了图形,也仅仅以机械形式存储,不能进行有关空间数据的操作。

2.地理信息系统强调的是空间分析,通过利用空间分析模型来分析空间数据,地理信息系统的成功也依赖于空间分析模型的研究与设计。

3.地理信息系统的成功不仅取决于技术体系,而且依靠一定的组织体系。

简述空间索引的类型

简述空间索引的类型

简述空间索引的类型
空间索引是一种用于管理和查询空间数据的技术。

它可以帮助我们快速地找到空间数据中的特定位置或区域。

在GIS(地理信息系统)和其他空间应用程序中,空间索引是非常重要的。

本文将介绍几种常见的空间索引类型。

1. R树
R树是一种广泛使用的空间索引结构。

它是一种树形结构,每个节点代表一个矩形区域。

R树的叶子节点包含实际的空间对象,而非叶子节点包含其他节点或矩形区域。

R树的优点是可以快速地找到包含某个点或区域的节点,从而快速地查询空间数据。

2. 四叉树
四叉树是一种二叉树的变体,它将空间划分为四个象限。

每个节点代表一个矩形区域,而非叶子节点包含其他节点或矩形区域。

四叉树的优点是可以快速地找到包含某个点或区域的节点,从而快速地查询空间数据。

3. KD树
KD树是一种二叉树的变体,它将空间划分为多个维度。

每个节点代表一个点,而非叶子节点包含其他节点或点。

KD树的优点是可以快速地找到最近邻点,从而快速地查询空间数据。

4. 网格索引
网格索引是一种将空间划分为网格的方法。

每个网格代表一个矩形区域,而非叶子节点包含其他节点或矩形区域。

网格索引的优点是可以快速地找到包含某个点或区域的节点,从而快速地查询空间数据。

空间索引是一种非常重要的技术,它可以帮助我们快速地查询空间数据。

不同的空间索引类型适用于不同的应用场景,我们需要根据具体情况选择合适的空间索引类型。

空间数据管理-空间数据库

空间数据管理-空间数据库
空间数据管理-空间数据 库
contents
目录
• 空间数据库概述 • 空间数据库的核心技术 • 空间数据库的应用领域 • 空间数据库面临的挑战与解决方案 • 空间数据库的未来发展趋势
空间数据库概述
01
定义与特点
定义
空间数据库是一种用于存储和管理空 间数据的数据库系统,它能够存储、 检索、更新和管理空间数据,包括地 理信息、地图数据、遥感数据等。
空间数据查询语言
空间数据查询语言是用于查询和管理 空间数据库的标准语言,它提供了丰 富的空间函数和操作符,用于对空间 数据进行各种复杂的查询和操作。
常见的空间数据查询语言包括SQL、 PostGIS等。
空间数据模型与结构
空间数据模型与结构是描述空间数据的组织和表达方式,它决定了空间数据的表示、存储和查询方式 。
环境监测与保护是空间数据库的重要应用领域之一。 环境监测部门需要利用空间数据库来分析环境质量、 生态状况等信息,为环境保护提供决策支持。
环境监测与保护还包括污染治理、生态修复等领域。
空间数据库面临的挑
04
战与解决方案
数据安全与隐私保护
数据加密
采用先进的加密算法对空间数据进行加密, 确保数据在存储和传输过程中的安全性。
访问控制
实施严格的访问控制策略,对不同用户设定不同的 权限级别,防止未经授权的访问和数据泄露。
隐私保护
在数据采集、处理和使用过程中,采取匿名 化、去标识化等技术手段保护用户隐私。
高性能查询优化
索引技术
利用空间索引技术提高查询效率,如 R-tree、Quadtree等。
查询策略优化
根据查询需求和数据特点,优化查询 路径和算法,减少计算量和I/O负载。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

空间索引结构
3、区域(窗口)查询:查找含在区域内、
与区域相交或部分位于区域中的所有空间对象, 窗口是一个特殊的区域。
4、K-最邻近查询:给定一个参照对象(点、 线或区域),查询距离参照对象最近的K 1个 空间对象。 5、空间关系查询:相交、相邻、包含等拓 扑关系查询,方位关系和基于距离的各种查询。
可索引点对象和对象的MBB,能够与B+树简
单集成,在商用数据库Oracle中已实现。
均匀网格索引
一、均匀网格的特征
设几何对象均为点对象。研究区域为一个
[Sx*Sy]大小的空间,将其划分为nx*ny个相同大 小的网格,每个网格的边长为Sx/nx*Sy/ny,起始 坐标为(Xo,
物理页,每个网格中的点存入相应的磁盘页中。 每个索引单元包含的索引项数量是有限制的,
不能超过一个物理页的存储容量。
均匀网格索引
如图7-3,索引组织成2D数组DIR[1:nx,1:ny]形式的目 录表,每个目录项DIR[i,j] 对应一个索引单元。一个索引 单元包含形式为[OID, PageID]的多个索引项,存储为一个 物理页。OID为空间对象的主码,PageID为该索引单元对 应的物理页标识。
图7-8 对象14的插入
网格文件索引
2、插入对象15 图7-9为目录不分裂而磁盘页溢出的情况。 插入前DIR[3,2]和DIR[3,3]同指向p4,将对象15分别插入 DIR[3,2]和DIR[3,3]中。插入后DIR[3,2]和DIR[3,3]中的索引 项均不超过4个,目录不用分裂,但磁盘页p4溢出。创建新页p7, DIR[3,2] 指向p4,DIR[3,3] 指向p7。
Back
空间索引结构
空间索引技术是提高空间数据查询和各种
空间分析效率的关键技术。空间索引可缩小 空间数据的搜索范围,使访问不需要遍历整 个空间数据集。 索引文件中的数据称为索引数据,索引结 构是索引数据的数据结构及索引创建与维护 算法的总称。 空间索引结构是按照空间数据在空间分布 上的特性来组织和存储索引数据的索引结构。
空间索引结构
空间索引结构应满足下列三个要求: 一、存储效率高: 相对于被索引的数据集而言,索引数据的数 据量应尽量小。否则,访问索引数据可能成为数 据查询与更新的效率瓶颈。 二、查询效率高: 选择良好的索引数据结构,设计具体的基于 索引的空间访问方法(SAM Spatial Access Method),高效实现以下的查询: 1、点选择:从数据集中找出包含给定点的所 有空间对象。 2、范围查询:查询与给定对象间的距离小于 某个给定值的所有空间对象。
图7-9 对象15的插入
网格文件索引
(二)点查询算法 1、工作过程 第一步:给定点坐标P(xp,yp),沿X,Y两个 方向在Sx和Sy中查找P(xp,yp)位置,得到含有P 的网格单元。 第二步:进行一次磁盘操作将这个索引单元对 应的磁盘页调入内存,读取该页所存对象的(MBB, OID),构成集合E。对E中的每个对象e,测试 e.mbb是否含有点P。 第三步:对于包含点P的e.mbb,通过e.oid获取 其几何边界数据,精确测试P是否位于e.oid的几何 边界之内。
网格文件索引
图7-5均匀网格文件的插入
网格文件索引
网格文件索引
网格文件索引
三、格网文件索引MBB 用网格文件对MBB进行索引,最简单的情况是每个覆盖MBB的 网格单元都保存该MBB的索引项。MBB与网格单元的关系有三种: MBB包含网格单元、网格单元与MBB相交、网格单元包含MBB。前两 种情况,每个网格单元都建立MBB的索引项,一个MBB有多项索引。 例子:有15个MBB,每页的最大容量为4。图7-6为用均匀网格建 立的索引:
均匀网格索引
格网分辨率的选择取决于被索引点对象的数量。 假设共有N个点对象,每页存储的最大点数为M, 则至少需要有N/M个网格。如果某个网格中的点数 超过M,多出的点放到溢出区,溢出区与索引区域 用指针相连。 所有的网格共用一个溢出区,溢出区可能由多 个磁盘页连接成溢出区链。如果o点存储在溢出区链 的第q页,则点查询的I/O数为q。最坏的情况下,所 有点都位于同一网格中,索引结构为磁盘页的线性 列。点的频繁插入会导致较长的溢出链,而点删除 会导致空页。对于某些具体分布,这种索引不能满 足磁盘存储的要求。
网格文件索引
2、例子:图7-10为一个格网文件点查询的例子。点P位于 DIR[3,2]范围之内,对应的磁盘页p4中含有4个索引项。将p4 页调入内存,对其包含的4个mbb分别进行测试,其中8和12的 mbb中包含了点P。根据对象标识8和12取出各自的几何边界数 据,精确测试对象8和12,求出包含点P的对象12。
空间索引技术的基本原理
空间索引技术的基本原理是采用基于空间 位置或基于空间对象的分割方法,把研究空间 划分为若干区域,每个区域为一个索引单元, 存储多个空间索引项,按照空间位置邻近的对 象其索引项的位置也应该邻近的原则来组织空 间索引数据。 空间索引按照对空间的划分方式分为空间 驱动的索引和数据驱动的索引;按照索引文件 的数据结构又分为线性索引和非线性索引。
空间索引技术的基本原理
空间对象的几何形状错综复杂,表示几何形状的坐 标序列是变长的,直接以形状数据为索引字段将导致索 引项很复杂。为此,首先将空间对象的几何形状采用某 种近似的简单图形来表示,平行于坐标轴且包含特定空 间对象的最小外接矩形MBB(Minimal Bounding Box) 或MBR(Minimum Bounding Rectangle) 是空间对象几 何形状的一种近似表示。 以 [MBB,OID,PRT]为索引项建立空间索引,可 使每个空间索引项具有固定长度。其中:OID为对象标 识,MBB为对象的最小外接矩形,PRT为指向几何数据 的指针,OID直接将MBB映射到存放几何形状和属性的 物理页。
图7-3 均匀网格
均匀网格索引
(二)基于均匀网格索引的空间访问 1、插入新点:假设新点的坐标为(x,y),计算新点 所在网格(索引单元)的行列号。新点的索引目录项为 DIR[i,j],假设对应的磁盘页DIR[i,j].PageID为(a,b)所 在的页P(a,b),将新点插入P(a,b)页中。 2、点查询:假设鼠标当前位置的坐标为 (x,y),计算 鼠标位置所属索引单元的行列号i=(X-Xo)/(Sx/nx)+1和j=(YYo)/(Sy/ny) +1,读入对应的磁盘页DIR[i,j].PageID,扫 描该页中所有点对象,判断哪些点对象与(x,y)点重叠。 3、窗口查询:计算窗口W覆盖的网格集合S={Ci,j}, 对S中的每个读取DIR[i,j].PageID,返回这些页中包含的 所有点对象,即为窗口W范围内包含的点对象。
图7-10 基于网格文件的点查询
网格文件索引
(三)窗口查询算法 工作过程如下: 第一步:计算所有覆盖窗口的索引单元。 第二步:扫描每一个索引单元,调入相应的磁盘页。读入每 个磁盘页中的对象,排序并去掉重复对象。求出那些落入窗口中, 或与窗口相交的mbb。 第三步:根据各自的对象标识取出这些mbb对应的几何边界, 精确检测每个对象是否位于窗口中或与窗口相交。 (四)总结 用网格文件索引MBB,大多数情况下比较理想,但也存在很 多问题: 1、对象的多重索引增加了索引表的容量,数据集越大越严 重,索引单元接近MBB大小时,情况就更严重。 2、索引表容量越大,查询重复项的代价越高。 3、算法的效率依赖于索引表位于内存中的假设,如果索引 表很大,一部分要存入磁盘,管理将变得复杂,效率会受影响。
网格索引
网格索引是一种空间驱动的非线性索引结 构,其基本特征是用正方形或矩形格网对研究 区域的2D空间进行划分,每个网格单元为一 个索引单元,索引多个空间对象,索引单元按 行列号组织成2D目录。 网格索引包括均匀网格索引和网格文件索 引,均匀网格适合于索引空间点对象;网格文 件是均匀网格的改进,是一种多关键字索引,
空间驱动的索引结构
空间驱动索引结构的主要特征是采用
某种格网对2D空间进行划分,将空间划分
成小区域,每个小区域为一个索引单元, 每个索引单元包含多个索引项,每个索引 项索引一个空间对象。 索引单元按照一定的数据结构来组织。
如果组织成线性结构,则相应的空间索引
为线性索引,如果组织成非线性结构,则
相应的空间索引为非线性索引。
6、其他查询:将满足一定空间条件的两个
空间对象集合进行空间连接,空间集合运算等也 是一种空间访问。
空间索引结构
三、更新效率高: 数据对象的增加、修改和删除将导致索引数据 更新,索引数据与被索引的数据集必须保持一致。 索引数据的更新操作包括:插入索引项、删除 索引项和修改索引项(先删除再增加)。数据集经 常变化时,需要考虑新增索引项和删除索引项时, 索引结构的快速更新能力。 很难设计一种空间索引结构同时能提供高效的 存储、高效的查询和高效的更新,实际应用中总是 牺牲某些方面的效率来换取另外方面的效率。 索引结构可分为静态索引和动态索引结构,还 分为内存索引和外存索引,外存索引需要考虑磁盘 页面访问的效率瓶颈问题。
均匀网格索引
如图7-4中例子,每个网格所存的最大点数M=4, k,l,m,n,o五个点对象位于同一个网格中,对应于磁盘 页P。将k,l,m,n四个点放入P页,o放入溢出区,将溢
出区与P页相连。
图7-4 均匀网格中的溢出页
网格文件索引
二、点对象的格网文件 格网文件与均匀格网的相同之处是采用平行于坐标轴的格网 对空间进行完全划分,每个网格单元为一个索引单元,索引单元 组织成2D目录形式。与均匀格网不同的是,每次发生溢出时,动 态的将网格单元在横向或纵向上分裂为两个单元,可根据网格单 元中点对象的分布情况来选择进行纵向还是横向划分;网格文件 中的网格单元为大小不相同的矩形单元,多个网格单元可对应同 一个磁盘页。 (一)格网文件的数据结构 格网文件由三种数据结构来实现,索引目录DIR是一种与均 匀网格中的索引目录类似的2D数组,差别是两个相邻单元可共享 同一磁盘页;Sx,Sy是两个线性数组,表示沿两坐标轴的划分。 图7-5中的例子描述了这种结构,假设网格的最大容量M=4。
相关文档
最新文档