空间数据库报告分析

空间数据库报告分析
空间数据库报告分析

空间数据挖掘

一、空间数据库概述

空间数据库指的是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的。空间数据库的研究始于20世纪70年代的地图制图与遥感图像处理领域,其目的是为了有效地利用卫星遥感资源迅速绘制出各种经济专题地图。由于传统的关系数据库在空间数据的表示、存储、管理、检索上存在许多缺陷,从而形成了空间数据库这一数据库研究领域。而传统数据库系统只针对简单对象,无法有效的支持复杂对象(如图形、图像)。

空间数据挖掘是指从空间数据库中抽取没有清楚表现出来的隐含的知识和空间关系,并发现其中有用的特征和模式的理论、方法和技术。空间数据挖掘和知识发现的过程大致可分为以下多个步骤:数据准备、数据选择、数据预处理、数据缩减或者数据变换、确定数据挖掘目标、确定知识发现算法、数据挖掘、模式解释、知识评价等,而数据挖掘只是其中的一个关键步骤。但是为了简便,人们常常用空间数据挖掘来代替空间数据挖掘和知识发现。

空间数据挖掘与传统数据挖掘的不同表现在以下三个方面:

传统数据挖掘处理的是数字和类,而空间数据则是一些更为复杂的数据类型;传统数据挖掘通常具有显式的输入,而空间数据挖掘的输入则常常是隐式的;在传统数据挖掘中,有一个至关重要的前提假设:数据样品是独立生成的。而这一假设在空间数据分析中是不成立的。事实上,空间数据之间是高度自关联的。

二、空间数据挖掘的技术特点

(一)数据挖掘算法具有高效、可测的特点

数据库一般有数千个表和属性以及上百万个元组。数据库中千兆级别的数据已不再罕见,因为万亿级别的数量数据库已经腾空出世,取代了千兆级别的数据库。高维空间的海量数据库不但使搜索的空间变大,而且更容易发现模式存在的错误,所以充分利用相关知识去改变维数,降低维数,删除多余的数据,使数据挖掘的算法更具高效性。海量空间数据提供知识的算法要有可测性、高效性。多项式算法和指数算法没有实际的使用价值,但是若把算法换成以有限的数据做成特定的模型来获取合适的参数,实现的价值将会相当可观。

(二)所挖掘的信息来源于各种数据

用因特网、广域网、局域网与其他数据源组成一个结构复杂、空间庞大的数据库。数据进行挖掘主要是在各种语义的非格式化和格式化的数据中挖掘数据知识,这种数据挖掘可以弥补庞大、复杂的数据库所不能查询的数据知识。数据库本身已拥有分布广、规模大、数据挖掘方法复杂等特性,该特性的要求是要构建一种分布平行的数据挖掘技术。

(三)具有集成功能

一个发现系统的功能和方法如果没有足够多样,其能够使用的范围也必定会受到影响和限制。要想拓宽发现知识的领域,空间数据的挖掘系统就必须要把网络系统、知识管理库、数据管理库、专家系统、可视化系统、决策支持系统等技术集成到一起。

(四)数据挖掘知识可以在多抽象层上交互

预测数据库将会挖掘出何种知识,这是一件艰难的事情,因此作为高级的数据查询挖掘系统必须要更深人地探寻更多有利的线索。数据挖掘具有的交互特点可以帮助用户及时定义出数据挖掘的需求,使数据挖掘的过程得到深化,并以不同的视觉机智地看待数据挖掘技术在多抽象层面上出现的结果。

(五)用户的界面可以达到人机交互的效果

空间数据的挖掘目的是要实现数据挖掘结果的准确性,并且要言简意赅,容易表达。用多角度、多视角的考察方式对知识进行探索发现,把带有图文的界面与高级语言有机结合起来,对数据的结果和要求进行表达。在当下,还有很多用户无法与知识发现工具和知识发现系统进行人机的交互,针对这种情况,可以选择数据库的演绎方法以及贝叶斯法去发现知识,进而实现用户界面与人进行交互的效果。

(六)数据挖掘的安全性和私有性

数据挖掘的过程中,通常会以一种全方位、多角度、多层面的视觉去看待数据,这往往会对数据挖掘的安全性和私有性产生严重影响。探究、分析数据挖掘时出现的数据不合法人侵等现象,可以对数据库的安全方法进行合理改进,以此来保护信息,防止信息被泄露出去。

(七)对不同的数据进行处理

各种数据库之间是存在有关系、有联系的,所以要清楚地分析数据库之间的关系,从而有效地执行对数据库的科学挖掘。数据应用的领域各有不同,其所在的数据库也将有所不同,经常出现各种类型的复杂数据,同一个数据的挖掘系统没有办法实现对各种数据的处理观,要有针对性地对数据类型的特点,建立符合相关功能的数据挖掘系统。

三、空间数据挖掘常用方法

1. 基于概率论的方法。

这是一种通过计算不确定性属性的概率来挖掘空间知识的方法,所发现的知识通常被表示成给定条件下某一假设为真的条件概率。在用误差矩阵描述遥感分类结果的不确定性时,可以用这种条件概率作为背景知识来表示不确定性的置信度。

2. 空间分析方法。

指采用综合属性数据分析、拓扑分析、缓冲区分析、密度分析、距离分析、叠置分析、网络分析、地形分析、趋势面分析、预测分析等在内的分析模型和方法,用以发现目标在空间上的相连、相邻和共生等关联规则,或挖掘出目标之间的最短路径、最优路径等知识。目前常用的空间分析方法包括探测性的数据分析、空间相邻关系挖掘算法、探测性空间分析方法、探测性归纳学习方法、图像分析方法等。

3. 统计分析方法。

指利用空间对象的有限信息和/或不确定性信息进行统计分析,进而评估、预测空间对象属性的特征、统计规律等知识的方法。它主要运用空间自协方差结构、变异函数或与其相关的自协变量或局部变量值的相似程度实现包含不确定性的空间数据挖掘。

4. 归纳学习方法。

即在一定的知识背景下,对数据进行概括和综合,在空间数据库(数据仓库)中搜索和挖掘一般的规则和模式的方法。归纳学习的算法很多,如由Quinlan提出的著名的C5.0决策树算法、Han Jiawei教授等提出的面向属性的归纳方法、裴健等人提出的基于空间属性的归纳方法等。

5. 空间关联规则挖掘方法。即在空间数据库(数据仓库)中搜索和挖掘空间对象(及其属性)之间的关联关系的算法。最著名的关联规则挖掘算法是Agrawal 提出的Apriori算法;此外还有程继华等提出的多层次关联规则的挖掘算法、许龙飞等提出的广义关联规则模型挖掘方法等。

6. 聚类分析方法。

即根据实体的特征对其进行聚类或分类,进而发现数据集的整个空间分布规律和典型模式的方法。常用的聚类方法有K-mean, K-medoids方法、Ester等提出的基于R—树的数据聚焦法及发现聚合亲近关系和公共特征的算法、周成虎等提出的基于信息熵的时空数据分割聚类模型等。

7. 神经网络方法。

即通过大量神经元构成的网络来实现自适应非线性动态系统,并使其具有分布存储、联想记忆、大规模并行处理、自学习、自组织、自适应等功能的方法;在空间数据挖掘中可用来进行分类和聚类知识以及特征的挖掘。

8. 决策树方法。

即根据不同的特征,以树型结构表示分类或决策集合,进而产生规则和发现规律的方法。采用决策树方法进行空间数据挖掘的基本步骤如下:首先利用训练空间实体集生成测试函数;其次根据不同取值建立决策树的分支,并在每个分支子集中重复建立下层结点和分支,形成决策树;然后对决策树进行剪枝处理,把决策树转化为据以对新实体进行分类的规则。

9. 粗集理论。

一种由上近似集和下近似集来构成粗集,进而以此为基础来处理不精确、不确定和不完备信息的智能数据决策分析工具,较适于基于属性不确定性的空间数据挖掘。

10. 基于模糊集合论的方法。

这是一系列利用模糊集合理论描述带有不确定性的研究对象,对实际问题进行分析和处理的方法。基于模糊集合论的方法在遥感图像的模糊分类、GIS模糊查询、空间数据不确定性表达和处理等方面得到了广泛应用。

11. 空间特征和趋势探侧方法。

这是一种基于邻域图和邻域路径概念的空间数据挖掘算法,它通过不同类型属性或对象出现的相对频率的差异来提取空间规则。

12. 基于云理论的方法。

云理论是一种分析不确定信息的新理论,由云模型、不确定性推理和云变换三部分构成。基于云理论的空间数据挖掘方法把定性分析和定量计算结合起来,处理空间对象中融随机性和模糊性为一体的不确定性属性;可用于空间关联规则

的挖掘、空间数据库的不确定性查询等。

13. 基于证据理论的方法。

证据理论是一种通过可信度函数(度量已有证据对假设支持的最低程度)和可能函数(衡量根据已有证据不能否定假设的最高程度)来处理不确定性信息的理论,可用于具有不确定属性的空间数据挖掘。

14. 遗传算法。

这是一种模拟生物进化过程的算法,可对问题的解空间进行高效并行的全局搜索,能在搜索过程中自动获取和积累有关搜索空间的知识,并可通过自适应机制控制搜索过程以求得最优解。空间数据挖掘中的许多问题,如分类、聚类、预测等知识的获取,均可以用遗传算法来求解。这种方法曾被应用于遥感影像数据中的特征发现。

15. 数据可视化方法。

这是一种通过可视化技术将空间数据显示出来,帮助人们利用视觉分析来寻找数据中的结构、特征、模式、趋势、异常现象或相关关系等空间知识的方法。为了确保这种方法行之有效,必须构建功能强大的可视化工具和辅助分析工具。

16. 计算几何方法。

这是一种利用计算机程序来计算平面点集的Voronoi图,进而发现空间知识的方法。利用Voronoi图可以解决空间拓扑关系、数据的多尺度表达、自动综合、空间聚类、空间目标的势力范围、公共设施的选址、确定最短路径等问题。17. 空间在线数据挖掘。

这是一种基于网络的验证型空间来进行数据挖掘和分析的工具。它以多维视图为基础,强调执行效率和对用户命令的及时响应,一般以空间数据仓库为直接数据源。这种方法通过数据分析与报表模块的查询和分析工具(如OLAP、决策分析、数据挖掘等)完成对信息和知识的提取,以满足决策的需要。

四、空间数据挖掘算法模型

1、空间数据不确定性的Monte Carlo模拟

根据不同空间数据的不确定性(误差)分布采用Monte Carlo模拟法进行不确定性模拟.本文中取用2002年中国37个主要大中城市的地理空间经济数据的位置数据和若干属性数据(距海洋的距离、人均GDP、人均年可支配收入和商品房均价),采用Monte Carlo模拟法对它们进行不确定性模拟,根据不同空间对象的位置数据和不同属性数据的均值和中误差,分别得到不同空间对象的位置数和不同属性数据的1 000组模拟数据。具体算法如下:

1)确定每个待输入空间数据集的不确定性类型(位置数据的圆形正态模型,属性数据的一维正态模型);

2)取用依空间数据集分布的随机采样来代替原输入空间数据;

3)对每一次实现,存储其结果;

4)随机抽取l 000组实验数据作为样本数据.这里,随机数发生器采用普雷斯等人(1996)推荐的随机数发生器ran2,随机向量的抽样方法采用著名的博克斯一马勒(Box-Muller)方法。

2、基于不确定性空间数据的空间自相关度量

几乎所有空间数据都具有空间自相关性,因此在处理地理区域或地带的离散数据时须考虑空间数据的空间自相关性。本文借用Voronoi和Delaunay图,结

合距离标准来构建空间权重矩阵.普通的距离计算技术一般隐含地假设空间数据的位置是精确的.考虑到空间数据的不确定性,采用3种方法计算空间数据间空间自相关矩阵:中心法、最小法和最大法哺].假设区域S中有/,/个位置不确定的点,第i个点P。的误差带用一个圆形Q。表示.具体算法如下:输入:区域S中的一组点的误差带Q一{Q。,Q。,?,Q)和邻域距离d输出:区域S 中一组点的邻域图和空间自相关距阵

步骤1:构造点集P的Voronoi多边形

步骤2:对所有相邻的Voronoi多边形进行如下运算

步骤2.1:计算d。。。。(C。,Cj),d。。,(Qf,Q,),d。i。(Qi,Q;) 步骤2.2:如果d

3、不确定性空间数据聚类算法

传统的空间数据聚类算法是利用经典的聚类算法(如K—means,K—medoid)进行聚类.这种方法由于并未考虑空间数据的空间约束,其结果经常在地理位置上很混乱.此外,这种聚类方法还有一个共同的缺点是将空间对象集合划分为互不相交的子集,其中每个空间对象最多只属于一个聚类.但是当空间对象与2个聚类之间的距离相等,或者空间对象与2个聚类区域同时相交时,强制聚类之间不能相交的约束就不符合实际。

4、不确定性空间数据关联规则挖掘模型

在空间数据挖掘过程中,一方面须分析挖掘过程中存在的不确定性,并采用有效方法处理其不确定性;另一方面,又不可能消除所有的不确定性,因为空间数据挖掘算法本身和不确定性处理过程中均会带来不同程度的新的不确定性.所以,对空间数据挖掘进行质量评价是十分必要,它可以帮助我们更客观地度量空间数据挖掘的真实性.本文结合传统数据挖掘质量评价方法[1 0。,考虑空间数据不确定性特点的基础上,初步建立了一套适合不确定性空间数据关联规则挖掘的质量评价指标。包括覆盖度、支持度、可信度、作用度、杠杆作用度和兴趣度[11]以及它们的均值(mean)和方差(variance).

五、基于GIS的空间数据挖掘

由于空间数据挖掘在处理空间数据上具有重要意义,早在20世纪90年代初美国韩家炜就对空间数据挖掘进行了研究,提出了联机分析挖掘思想,并在MapInfo 软件平台上开发空间数据挖掘原型系统。Walter 于2008年提出了建立在栅格算法基础上的矢量数据库自动解译。Donato 利用归纳逻辑技术的方法提取了空间人口调查数据的关联规则。国内对空间数据挖掘的研究起步稍晚,在1994年李德仁教授提出了从GIS 数据库中发现知识,并对空间知识发现的特点和方法进行了系统的分析。董春、张清浦等人提出了基于地理数据库进行空间数据挖掘的构想。陈江平、傅仲良等人提出一种建立在空间分析基础上的空间关联规则挖掘算法。由于空间数据挖掘是计算机、数据库应用和管理决策支持等技术发展到一定阶段时,由数据库、模式识别、统计学、人工智能和管理信息系统多学科交叉的新兴学科,因而空间数据挖掘方法较

为丰富,但针对地理空间数据库,其方法可总结为以下4种:

1、空间分析算法

空间分析作为地理信息系统区别于一般计算机系统的主要标志,也是支持其强大功能的关键技术。借助GIS系统强大的空间分析功能模块,可以发现客观事物在地理空间上的相邻、相连和共生等关联关系、找出客观事物之间的最优路径、最短路径和最佳位置。空间分析通常作为处理空间数据和提取空间数据特征的方法,进而发现空间数据库知识。

2、空间聚类算法

聚类是按一定的规则将数据分成若干个相互区别的组,发现数据的分布特征,使得每组中的数据具有高相似,而不同组之间的数据尽可能不同。目前空间聚类算法较为丰富,但主要有划分方法、层次的方法、基于密度的方法、基于网格的方法及基于模型的方法5大类。

3、空间关联规则算法

关联规则是由Agrawal 等人通过对大型的事务型数据库的挖掘首次提出,而后Koperski 等人将其扩展至空间数据库,进一步提出了挖掘强空间关联规则的算法,并给出了空间优化技术。空间关联规则可表示为:AUB(c1%、A ∩B(c2%,其A 、B 表示空间或非空间谓词的集合,c1%、c2%为规则的支持度和可信度,空间谓词有3种表示形式:空间方向的谓词、拓扑结构的谓词和距离的谓词。

近些年来,虽然空间数据挖掘技术发展迅速,并取得了一定的成果,但许多的理论与方法仍需进行深入研究。未来空间数据挖掘应把基于空间不确定性的数据挖掘、多源空间数据的数据挖掘、一体化栅格矢量数据挖掘、空间查询语言数据挖掘、遥感图像及其网络空间数据的挖掘等方面作为主要努力方向。与此同时,在开发空间数据挖掘系统时,还要研究人机交互技术、空间数据挖掘系统与地理信息系统、多源空间数据的集成,多算法的集成、地理空间数据库、空间数据决策支持系统以及解译专家解译系统的集成等问题。

六、结束语

空间数据库含有空间数据和非空间数据。目前卫星、红外、电视摄像、光电、电子显微成像、CT成像等各种宏观与微观传感器的大量使用,空间数据的数量和复杂性都在飞快地增长。终端用户要详细的分析这些空间数据,并提取感兴趣的知识或特征是不现实的。因此,从空间数据库中自动地挖掘知识,寻找隐藏在空间数据库中的不明确的、隐含的知识、空间关系或其他模式,即空间数据挖掘和知识发现,变得越来越重要。目前,从空间数据库发现知识的传统途径是通过数据挖掘和专家系统空间分析等技术来实现的。但是在空间数据库隐含知识的发现方面。只单独依靠某一种技术,往往存在着这样或那样的缺陷。比如对于数据挖掘来讲。空间数据库与普通数据库在数据存储机制方面的不同、空间数据的相互依赖性等决定了在空间数据库无法直接采用传统的数据挖掘方法。对于专家系统来讲,专家系统不具备自动学习的能力,仅能利用已有的知识进行推导。对于空间分析来讲,虽然空间分析中常用的统计方法可以很好地处理数字型数据,但是它存在的问题很多。此外,统计方法对大规模数据库的计算代价非常高,所以在处理海量数据方面能力较低。因此,在空间数

据库进行知识发现,需要融合多种不同技术,比如使用空间数据挖掘技术来解决从空间数据库知识发现隐含知识的难题。

空间数据的挖掘可以借助海量数据库的搜寻来提取规律性和感兴趣的知识,然后利用这些数据解释空间数据、建立空间数据知识库等。随着空间数据挖掘技术的不断进步与深化,使得地理信息系统系统越来越趋向大众化、网络化、智能化、全球化的特点。由此可见,空间数据挖掘技术不但有利益计算机科学、空间科学的发展,而且也使得人类对世界有了更深层次的认识,开发了人类改变世界的潜能,进而为人类社会做出更好的服务。

参考文献:

1、“空间数据挖掘技术的应用研究”作者:王远敏出处:《计算机光盘软件与应用》2014年第21期

2、“空间数据挖掘技术应用探析”作者:顾润龙出处:《吉林省教育学院学报:中旬》2013年第5期

3、“浅析空间数据挖掘技术”作者:杜芳芳出处:《福建电脑》2010年第5期

4、“空间数据库中的数据挖掘”作者:李燕出处:《中南论坛:综合版》2010年第1期

5、“空间数据挖掘技术的研究”作者:廉彦平出处:《天津职业院校联合学报》2009年第5期

6、“空间数据库的数据挖掘”作者:胡艳慧陈俊杰[1]出处:《科技情报开发与经济》2007年第5期

7、“空间数据挖掘聚类算法研究”作者:宋殿霞王艳邹光辉出处:《滨州学院学报》2006年第6期

8 、“空间数据挖掘及其在地理信息系统中的应用”作者:李春梅范全润出处:《楚雄师范学院学报》

2005年第3期

9、“论空间数据挖掘和知识发现”[期刊论文] 《武汉大学学报(信息科学版)》ISTIC EI PKU -2001年6期

李德仁王树良史文中王新洲

10、“论空间数据处理与空间数据挖掘”[期刊论文] 《武汉大学学报(信息科学版)》ISTIC EI PKU -2006

年1期王新洲WANG Xinzhou

11 、“基于GIS的空间数据挖掘研究”[期刊论文] 《绿色科技》-2015年2期王皓王红崧Wang Hao

Wang Hongsong

12、“不确定性空间数据挖掘算法模型”[期刊论文] 《中国矿业大学学报》ISTIC EI PKU -2007年1期

何彬彬方涛郭达志HE Bin-bin FANG Tao GUO Da-zhi

空间分析实验指导书

空间分析实验指导书 黎华 武汉理工大学资环学院 2011年9月

目录 实验一、市区择房分析 (2) 实验二、最短路径分析 (3) 实验三、寻找最佳路径 (5) 实验四(综合实验一)、学校选址规划 (7)

实验一、市区择房分析 1、背景 如何找到环境好、购物方便、小孩上学方便的居住区地段是购房者最关心的问题,因此购房者就需要从总体上对商品房的信息进行研究分析,选择最适宜的购房地段。 2、数据 ●城市市区交通网络图(network.shp) ●商业中心分布图(marketplace.shp) ●名牌高中分布图(school.shp) ●名胜古迹分布图(famous place.shp) 3、步骤 1)所寻找的区域应该满足以下条件 ●离主要交通要道200米之外,以减少噪音污染 ●在商业中心的服务范围内,服务范围以商业中心规模的大小(属性字段YUZHI)来 确定 ●距名牌高中在750米内,以便小孩上学便捷 ●距名胜古迹500米内,环境幽雅 2)对每个条件进行缓冲区分析,得到各个条件所对应的区域 3)运用空间叠置分析对上述4个图层进行叠加,得到适合的购房地段

实验二、最短路径分析 1.背景:在现实生活中寻求最短,最快,提高效率有着重大意义,而交通网络中要素的设置如权重的改变和阻强的设置对最短路径的选择也有着很大的影响,研究这些因子的改变究竟对最短路径能造成多大的影响,对于现实也有一定的指导意义。 2.目的:学会用ArcGIS9 进行各种类型的最短路径分析,了解内在的运算机理。 3.数据:试验数据位于\Chp7\Ex2,请将练习拷贝至E:\Chp7\Ex2\ 一个GeoDatabase 地理数据库:City.mdb,内含有城市交通网、超市分布图,家庭住址以及网络关系。 4.要求:应该能够给出到达指定目的地的路径选择方案根据不同的权重要求得到不同的最佳路径,并给出路径的长度;根据需求找出最近的设施的路径,这里是以超市为例。 (1)在网络中指定一个超市,要求分别求出在距离、时间限制上从家到超市的最佳路径。 (2)给定访问顺序,按要求找出从家经逐个地点达到目的地的最佳路径。 5.操作步骤: 首先打开ArcMap选择E:\Chp7\Ex2\city.mdb再双击后选择将整个要素数据集city加载进来。然后将place 点状要素以HOME 字段属性值进行符号化,1 值是家,0 值是超市,(1)无权重最佳路径的选择 1)在设施网络分析工具条上,点选旗标和障碍工具板下拉箭头,将旗标放在家和想要去的超市点上。 2)确认在Analysis 下拉菜单中的Options 按钮打开的Analysis Options 对话框中的weight 和weight filter 标签项全部是none,这样使得进行的最短路径分析是完全按照这个网络自身的长短来确定的。 3)点选追踪工作(Track task)下拉菜单选择寻找路径(find path)。单击solve 键,则最短路径将显示出来,这条路径的总成本将显示在状态列。 (2)加权最佳路径选择 1)在设施网络分析工具条上,点选旗标和障碍工具板下拉箭头,将旗标放在家和想去的某个超市点上。 2)选择Analysis 下拉菜单,选择Option按钮,打开Analysis Option对话框,选择Weight 标签页,在边的权重(edge weight)上,全部选择长度(length)权重属性。 3)点选追踪工作(Track task)下拉菜单选择寻找路径(find path)。单击solve键,则以长度为比重为基础的最短路径将显示出来,这条路径的总成本将显示在状态列。 4)上述是通过距离的远近选择而得到的最佳路径,而不同类型的道路由于道路车流量的问题,有时候要选择时间较短的路径,同样可以利用网络分析进行获得最佳路径。 这里的时间属性是在建网之前,通过各个道路的类型(主干道,次要道等)来给定速度属性,然后通过距离和速度的商值确定的,并将其作为属性设定于每个道路上,这里没有考虑红灯问题以及其他因素,而是一种理想情况,不过可以将其他的要素可以逐渐加入来完善。 (3)按要求和顺序逐个对目的点的路径的实现 1)在设施网络分析工具条上,点选旗标和障碍工具板下拉箭头,将旗标按照车辆访问的顺序逐个放在点上。

实验空间数据库管理及属性编辑实验报告

实验报告 一、实验名称 二、实验目的 三、实验准备 四、实验内容及步骤 五、实验后思考题 班级:资工(基)10901 姓名:魏文风 序号:28 实验二、空间数据库管理及属性编辑 一、实验目的 1.利用ArcCatalog管理地理空间数据库,理解Personal Geodatabse空间数据库模型的有关概念。 2.掌握在ArcMap中编辑属性数据的基本操作。 3.掌握根据GPS数据文件生成矢量图层的方法和过程。 4.理解图层属性表间的连接(Join)或关联(Link)关系。 二、实验准备 预备知识: ArcCatalog 用于组织和管理所有GIS 数据。它包含一组工具用于浏览和查找地理数据、记录和浏览元数据、快速显示数据集及为地理数据定义数据结构。 ArcCatalog 应用模块帮助你组织和管理你所有的GIS 信息,比如地图,数据集,模型,元数据,服务等。它包括了下面的工具: ●浏览和查找地理信息。 ●记录、查看和管理元数据。 ●创建、编辑图层和数据库 ●导入和导出geodatabase 结构和设计。 ●在局域网和广域网上搜索和查找的GIS 数据。

管理ArcGIS Server。 ArcGIS 具有表达要素、栅格等空间信息的高级地理数据模型,ArcGIS支持基于文件和DBMS(数据库管理系统)的两种数据模型。基于文件的数据模型包括Coverage、Shape文件、Grids、影像、不规则三角网(TIN)等GIS数据集。 Geodatabase 数据模型实现矢量数据和栅格数据的一体化存储,有两种格式,一种是基于Access文件的格式-称为Personal Geodatabase,另一种是基于Oracle或SQL Server等RDBMS关系数据库管理系统的数据模型。 GeoDatabase是geographic database 的简写,Geodatabase 是一种采用标准关系数据库技术来表现地理信息的数据模型。Geodatabase是ArcGIS软件中最主要的数据库模型。 Geodatabase 支持在标准的数据库管理系统(DBMS)表中存储和管理地理信息。 在Geodatabase数据库模型中,可以将图形数据和属性数据同时存储在一个数据表中,每一个图层对应这样一个数据表。 Geodatabase可以表达复杂的地理要素(如,河流网络、电线杆等)。比如:水系可以同时表示线状和面状的水系。 基本概念:要素数据集、要素类 数据准备: 数据文件:National.mdb ,GPS.txt (GPS野外采集数据)。 软件准备: ArcGIS Desktop 9.x ---ArcCatalog 三、实验内容及步骤 第1步启动ArcCatalog打开一个地理数据库 当ArcCatalog打开后,点击, 按钮(连接到文件夹). 建立到包含练习数据的连接(比如 “E:\ARCGIS\EXEC2”), 在ArcCatalog窗口左边的目录树中, 点击上面创建的文件夹的连接图标旁的(+)号,双击个人空间数据库-National.mdb。打开它。. 在National.mdb中包含有2个要素数据集、1个关系类和1个属性表第2步预览地理数据库中的要素类 在ArcCatalog窗口右边的数据显示区内,点击“预览”选项页切换到“预览”视图界面。在目录树中,双击数据集要素集-“WorldContainer”,点击要素类-“Countries94”激活它。 在此窗口的下方,“预览”下拉列表中,选择“表格”。现在,你可以看到Countries94的属性表。查看它的属性字段信息。 花几分钟,以同样的方法查看一下National.mdb地理数据库中的其它数据。

武汉大学空间数据库复习资料整理

《空间数据库原理》 第一章数据库 1、空间数据库:①提供结构用于存储和分析空间数据②空间数据由多维空间的对象组成③在标准数据库中存储空间数据需要大量的空间,从一个标准数据库中检索查询空间数据需要很多时间并且很累赘,通常导致很多错误。 2、DBMS:(数据的操作系统)一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。SDBMS:增加了处理空间数据功能的DBMS。①在它的数据模型中提供空间数据类型和查询语言②至少在执行时支持提供空间数据类型:空间索引;空间链接有效的算法。 在地理信息系统中为什么要研究专门的空间数据库系统? 1.空间数据库能提供结构存储和空间数据分析 2.空间数据库包含多面空间的对象 3.在标准数据库中存储空间数据会需要过多的空间 4.标准数据库的查询反馈和空间数据分析会消耗过多时减并且留下大量错误空间 5.空间数据库能提供更多有效率的存储和空间数据分析 3、哈希(Hash)函数:一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。 质数除余法(直接取余法):f(x):=x mod maxM ;maxM一般是不太接近2^t的一个质数。 乘法取整法:f(x):=trunc((x/maxX)*maxlongit) mod maxM,主要用于实数。 平方取中法:f(x):=(x*x div 1000 ) mod 1000000);平方后取中间的,每位包含信息比较多。 第二章数据库基本原理 1、数据模型Data Model:关于数据基础或对象以及他们之间的关系的抽象描述被表示在一个数据库中。 3、概念数据模型:也称语义模型,关于实体和实体间联系的抽象概念集,用统一的语言描述、综合、集成的用户视图。 2、数据字典:是指对数据库的内容包括数据项和属性码定义,是元数据的重要组成部分。(是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。) Metadata:是描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。 3、数据库设计和实现:①需求分析②概念数据建模③逻辑建模(参考DBMS和基础数据模型)④物理建模或者实现(参考物理存储和电脑环境)。 需求调查:根据数据库设计的主题对用户的需求进行调查,了解用户特点和要求,取得设计者与用户对需求的一致看法。需求分析:指的是在创建一个新的或改变一个现存的系统或产品时,确定新系统的目的、范围、定义和功能时所要做的所有工作。 4、E-R图:描述对象类型之间的关系,是表示概念模型的一种方式。 第三章基本空间概念 1、凸多边形:把一个多边形任意一边向两方无限延长成为一条直线,如果多边形的其他各边均在此直线的同旁,那么这个多边形就叫做凸多边形。 2、点集拓扑:一个基于相邻关系定义拓扑学空间的方法。 3、大圆距离:大圆距离指的是从球面的一点A出发到达球面上另一点B,所经过的最短路径(圆弧)的长度。 曼哈顿距离:两个点上在标准坐标系上的绝对轴距之总和。 4、欧式空间(欧几里德空间):空间的坐标模型。作用:能将空间属性转化为以实数为元组的属性;坐标系包括一个确定的原点和在原点交叉的一对正交轴线。

数据库原理实验报告(2)

南京晓庄学院 《数据库原理与应用》 课程实验报告 实验二数据库的创建、管理、备份及还原实验 所在院(系):数学与信息技术学院 班级:11软工转本2 学号: 1130708 11130710 姓名:马琦乔凌杰

1.实验目的 (1)掌握分别使用SQL Server Management Studio图形界面和Transact-SQL语句创建和修改 数据库的基本方法; (2)学习使用SQL Server查询分析窗口接收Transact-SQL语句和进行结果分析。 (3)了解SQL Server的数据库备份和恢复机制,掌握SQL Server中数据库备份与还原的方 法。 2.实验要求 (1)使用SQL Server Management Studio创建“教学管理”数据库。 (2)使用SQL Server Management Studio修改和删除“教学管理”数据库。 (3)使用Transact-SQL语句创建“教学管理”数据库。 (4)使用Transact-SQL语句修改和删除“教学管理”数据库。 (5)使用SQL Server Management Studio创建“备份设备”;使用SQL Server Management Studio对数据库“教学管理”进行备份和还原。 (6)SQL Server 2005数据库文件的分离与附加。 (7)按要求完成实验报告 3.实验步骤、结果和总结实验步骤/结果 (1) 总结使用SQL Server Management Studio创建、修改和册除“TM”(教学管理)数据库的过程。 新建数据库如下图所示: 进入sql server management studio 主界面,选择数据库右击新建数据库。 如何修改数据库 进入sql server management studio 主界面,选择数据库右击属性即可看到数据库信息,可更改数据库基本信息。

基于arcsde的空间数据库的设计与建立

基于ArcSDE的空间数据库的设计与建立 摘要:随着地理信息系统的发展,传统的以文件形式管理、存储地理空间数据的方式已不能满足现在应用的需求。针对以上问题,本文通过arcsde对空间数据进行管理,使空间数据和属性数据统一存储在面向对象的关系型数据库(sql server)中,实现统一、高效的管理。 关键词:空间数据库;属性数据;arcsde 围绕空间数据的管理,前后出现了几种不同的空间数据管理模式:纯文件模式、文件结合关系型数据库的管理模式、全关系型数据库管理模式和面向对象的数据库管理模式。前两种方式都是将空间数据和属性数据分离存储,这样往往会产生诸多问题:1.空间数据与属性数据的连接太弱,综合查询效率不高,容易造成空间数据与属性数据的脱节;2.空间数据与属性数据不能统一管理,实质上是两套管理系统,造成资源的浪费和管理的混乱,数据一致性较难维护;3.由于空间数据不能统一在标准数据库里存放,造成空间数据不能在网上共享。而面向对象数据库管理系统技术还不够成熟,并且价格昂贵,目前在gis领域还不够通用。所以在较长时间内,还不能完全脱离现有关系型数据库来建设gis空间数据库。arcsde是esri公司提供的一个基于关系型数据库基础上的地理数据库服务器。同一些数据库厂商推出的在原有数据库模型上进行空间数据模型扩展的产品(如oracle spatial)不同,esri的arcsde 的定位则是空间数据的管理及应用,而非简单的数据库空间化。

1.系统目标 建成一个多级比例尺(100万、25万、5万、1万)矢量、栅格以及航空影像、遥感影像(tm,spot)的c/s结构基础地理空间数据库,便于对空间数据有效的管理、分发和应用。 2.总体设计方案 系统总体技术方案设计在充分考虑实际应用环境及应用需求的 基础上,结合考虑国际国内发展的主流趋势和平台产品的功能与性能来完成。 2.1技术路线 空间数据库建设应放弃数据文件式的管理方式,采用大型关系数据库管理系统(sql server)管理空间数据,arcsde作为sql server 2008和arc/info或其他地理信息系统软件的接口, vb/vc/delphi/java/c#为前端应用开发工具。其中,空间数据通过arcsde存储在sql server 2008数据库。arcsde是基于c/s计算模型和关系数据管理模式的一个连续的空间数据模型,借助这一模型,可将空间数据加入到数据库管理系统(rdbms)中去[1]。arcsde 融于rdmbs后,提供了对空间、非空间数据进行高效率操作的数据接口。由于arcsde采用c/s体系结构,大量用户可同时针对同一数据进行操作。arcsde提供了应用程序接口(api),开发人员可将空间数据检索和分析功能集成到应用工程中去,以完成前端的应用开发,最终提供数据的存储、查询和分发服务。如图1所示: 图1结构图

实验指导四空间大数据处理与地图投影

实验四空间数据处理与地图投影 一、实验目的 1.掌握空间数据处理(融合、拼接、剪切、交叉、合并)的基本方法,原理。 2.掌握地图投影变换的基本原理与方法。 3.掌握ArcGIS中投影的应用及投影变换的方法、技术,同时了解地图投影及其变换在实际中的应用。 二、实验准备 1.软件准备:ArcGIS 10.2 2.数据准备: (1)stationsll.shp(美国爱达荷州轮廓图) (2)idll.shp(美国爱达荷州滑雪场资料) 以上两个数据是以十进制表示经纬度数值的shapefile (3)snow.txt(美国爱达荷州40个滑雪场的经纬度值) (4)stations.shp,一个已投影的shapefile,用于检验习作2的投影结果 (5)idoutl.shp,基于爱达荷横轴墨卡托坐标系的爱达荷州轮廓图,用于检验习作3投影的正确性 三、实验容与步骤 1.空间数据处理 1.1 裁剪要素 ?在ArcMap中,添加数据“县界.shp”、“Clip.shp”(Clip 中有四个实体) ?开始编辑,激活Clip图层。选中Clip图层中的一个实体(注意不要选中“县界”中的实体!)

图4-1 编辑Clip ?点击按钮,打开ArcToolBox; ?选择“Analysis Tools->Extract”,双击“Clip”,弹出窗口剪切窗口,指定输入实体为“县界”,剪切实体为“Clip”(必须为多边形实体),并指定输出实体类路径及名称,这里请命名为“县界_Clip1” 如图4-5; 图4-2 工具箱

图4-3 剪切窗口 ?依次选中Clip主题中其它三个实体,重复以上的操作步骤,完成操作后将得到共四个图层——“县界_Clip1”,“县界_Clip2”,“县界_Clip3”,“县界_Clip4”); ?操作完成后,一定要“Save Editors”。 图4-4 生成四个剪切图层

空间数据库报告

武汉理工大学 《空间数据库》实验报告 班级:地理1502班姓名:xx 学号:xxx 第1章需求分析 1.1需求概述 图书管理系统主要是适用于学校的,通过oracle数据库进行逻辑处理,实现对图书、读者(学生)、出版社信息的增删改查,核心功能是实现借书和还书操作,亮点是增添了学生可以挂失和修改密码的功能。下面设计的图书管理信息系统,这些功能均已实现。 1.2功能需求 图1.1

第2章概念设计 2.1 实体与属性 根据需求建立五个实体(admin,book,publisher,reader,booktype),并赋予其各自的属性,如图2.1 图2.1 2.2 初步E-R图 将各个局部E-R图合并,消除属性冲突、命名冲突、结构冲突,然后再用分析的方法或者规范化理论来消除冗余,生成基本E-R图,流程如图2.2,合并后的初步E-R图如图2.3所示。 图2.2

图2.3 第3章逻辑设计 3.1 逻辑结构设计 逻辑结构设计的流程图如图3.1所示,主要包括三个部分:1、将基本E-R图根据七条转化原则转化为一般数据模型;2、根据所选用的DBMS(Oracle)的功能及限制,将数据模型转换为Oracle 规定的模型。 图3.1

3.2 优化后的模型 管理员(职工号,姓名,性别,年龄,密码) 借阅者(卡号,姓名,年龄,性别,密码,专业,学院,最大借阅量)书籍(索书号,书名,作者,出版社号,类型号,价格,是否被借阅)出版社(出版社号,出版社名,电话,地址) 类型(类型号,类型名,所在楼层) 借阅(借阅号,借阅时间,归还时间,是否过期,卡号,索书号) 第4章物理设计 4.1 设计数据表 管理员表(admin) 图书表(book) 图书类型表(bookType)

人口分布空间数据库设计书

人口分布空间数据库设计书 1)概念设计 概念设计是通过对错综复杂的现实世界的认识与抽象,最终形成空间数据库系统及其应用系统所需的模型。 具体是对需求分析阶段所收集的信息和数据进行分析、整理,确定地理实体、属性及它们之间的联系,将各用户的局部视图合并成一个总的全局视图,形成独立于计算机的反映用户观点的概念模式。概念模式与具体的DBMS无关,结构稳定,能较好地反映用户的信息需求。 表示概念模型最有力的工具是E-R模型,即实体-联系模型,包括实体、联系和属性三个基本成分。用它来描述现实地理世界,不必考虑信息的存储结构、存取路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,具有直观、自然、语义较丰富等特点。 本设计书中的E-R模型如图1所示: 图1 E-R模型 2)逻辑设计 在概念设计的基础上,按照不同的转换规则将概念模型转换为具体DBMS支持

的数据模型的过程,即导出具体DBMS可处理的地理数据库的逻辑结构(或外模式),包括确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。导出的逻辑结构是否与概念模式一致,能否满足用户要求,还要对其功能和性能进行评价,并予以优化。 2.1要素分类 我们制作、统计的地理信息数据应该提供准确、可靠、经得起专业部门检验的地理信息,这就要求测绘部门和相关专业部门应该有一致的地理要素的定义和分类体系。依据GB/T 13923-2006《基础地理信息要素分类与编码》将地理要素分为了地位基础、水系、居民地及设施、交通、管线、境界与政区、地貌、植被 2.2 数据层设计 GIS的数据可以按照空间数据的逻辑关系或专业属性分为各种逻辑数据层或 专业数据层,原理上类似于图片的叠置。在进行空间分析、数据处理、图形显示时,往往只需要若干相应图层的数据。 数据层的设计一般是按照数据的专业内容和类型进行的。数据的专业内容的类型通常是数据分层的主要依据,同时也要考虑数据之间的关系。如需考虑两类物体共享边界(道路与行政边界重合、河流与地块边界的重合)等,这些数据间的关系在数据分层设计时应体现出来。不同类型的数据由于其应用功能相同,在分析和应用时往往会同时用到,因此在设计时应反映出这样的需求,即可将这些数据作为一层。 本设计书中的数据层设计如表2所示: 表2 数据层设计 2.3关系数据表 本设计书中的关系数据表如表3-表6所示:

空间数据库报告分析

空间数据挖掘 一、空间数据库概述 空间数据库指的是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的。空间数据库的研究始于20世纪70年代的地图制图与遥感图像处理领域,其目的是为了有效地利用卫星遥感资源迅速绘制出各种经济专题地图。由于传统的关系数据库在空间数据的表示、存储、管理、检索上存在许多缺陷,从而形成了空间数据库这一数据库研究领域。而传统数据库系统只针对简单对象,无法有效的支持复杂对象(如图形、图像)。 空间数据挖掘是指从空间数据库中抽取没有清楚表现出来的隐含的知识和空间关系,并发现其中有用的特征和模式的理论、方法和技术。空间数据挖掘和知识发现的过程大致可分为以下多个步骤:数据准备、数据选择、数据预处理、数据缩减或者数据变换、确定数据挖掘目标、确定知识发现算法、数据挖掘、模式解释、知识评价等,而数据挖掘只是其中的一个关键步骤。但是为了简便,人们常常用空间数据挖掘来代替空间数据挖掘和知识发现。 空间数据挖掘与传统数据挖掘的不同表现在以下三个方面: 传统数据挖掘处理的是数字和类,而空间数据则是一些更为复杂的数据类型;传统数据挖掘通常具有显式的输入,而空间数据挖掘的输入则常常是隐式的;在传统数据挖掘中,有一个至关重要的前提假设:数据样品是独立生成的。而这一假设在空间数据分析中是不成立的。事实上,空间数据之间是高度自关联的。 二、空间数据挖掘的技术特点 (一)数据挖掘算法具有高效、可测的特点 数据库一般有数千个表和属性以及上百万个元组。数据库中千兆级别的数据已不再罕见,因为万亿级别的数量数据库已经腾空出世,取代了千兆级别的数据库。高维空间的海量数据库不但使搜索的空间变大,而且更容易发现模式存在的错误,所以充分利用相关知识去改变维数,降低维数,删除多余的数据,使数据挖掘的算法更具高效性。海量空间数据提供知识的算法要有可测性、高效性。多项式算法和指数算法没有实际的使用价值,但是若把算法换成以有限的数据做成特定的模型来获取合适的参数,实现的价值将会相当可观。 (二)所挖掘的信息来源于各种数据 用因特网、广域网、局域网与其他数据源组成一个结构复杂、空间庞大的数据库。数据进行挖掘主要是在各种语义的非格式化和格式化的数据中挖掘数据知识,这种数据挖掘可以弥补庞大、复杂的数据库所不能查询的数据知识。数据库本身已拥有分布广、规模大、数据挖掘方法复杂等特性,该特性的要求是要构建一种分布平行的数据挖掘技术。

ACCESS2010数据库技术实验指导书3

《ACCESS2010数据库技术及应用》 实验指导(3) 学号: 姓名: 班级: 专业:

实验三窗体 实验类型:验证性实验课时: 4 学时指导教师: 时间:201 年月日课次:第节教学周次:第周 一、实验目的 1. 掌握窗体创建的方法 2. 掌握向窗体中添加控件的方法 3. 掌握窗体的常用属性和常用控件属性的设置 二、实验内容和要求 1. 创建窗体 2. 修改窗体,添加控件,设置窗体及常用控件属性 三、实验步骤 案例一:创建窗体 1.使用“窗体”按钮创建“成绩”窗体。 操作步骤如下: (1)打开“教学管理.accdb”数据库,在导航窗格中,选择作为窗体的数据源“教师”表,在功能区“创建”选项卡的“窗体”组,单击“窗体”按钮,窗体立即创建完成,并以布局视图显示,如图3-1所示。 (2)在快捷工具栏,单击“保存”按钮,在弹出的“另存为”对话框中输入窗体的名称“教师”,然后单击“确定”按钮。 图3-1布局视图 2.使用“自动创建窗体”方式 要求:在“教学管理.accdb”数据库中创建一个“纵栏式”窗体,用于显示“教师”表中的信息。 操作步骤: (1)打开“教学管理.accdb”数据库,在导航窗格中,选择作为窗体的数据源“教师”表,在功能区“创建”选项卡的“窗体”组,单击“窗体向导”按钮。如图3-2所示。 (2)打开“请确定窗体上使用哪些字”段对话框中,如图3-3 所示。在“表和查询”下拉列表中光图3-2窗体向导按钮

标已经定位在所学要的数据源“教师”表,单击按钮,把该表中全部字段送到“选定字段”窗格中,单击下一步按钮。 (3)在打开“请确定窗体上使用哪些字”段对话框中,选择“纵栏式”,如图3-4所示。单击下一步按钮。 (4)在打开“请确定窗体上使用哪些字”段对话框中,输入窗体标题“教师”,选取默认设置:“打开窗体查看或输入信息”,单击“完成”按钮,如图3-5所示。 (5)这时打开窗体视图,看到了所创建窗体的效果,如图3-6所示。 图3-3“请确定窗体上使用哪些字”段对话框 图3-4“请确定窗体使用的布局”段对话框中

电子科技大学-空间数据库上机实验报告

一、建立Geodatabase数据文件 1、新建一个Geodatabase: 如图1.1所示:在ArcCatalog环境下新建一个名为“Personal Geodatabase”的数据文件。 1.1 建好的Geodatabase 数据文件 2、新建要素集: 在Personal Geodatabase下,新建一个shanghai要素集,定义坐标系统为高斯投影(如图 1.2所示),单位为米,精度为1。

1.2 创建要素数据集 3、新建要素类: 在shanghai要素集中,新建一个parcel和pole要素类,parcle的Shape字段类型为polygon,新增字段parcel_name(文本型)、owner_name (文本型);pole的Shape 字段类型为点类型,新增三个字段:类型(短整型)、高度(短整型)和管理部门(文本型)。 1.3 创建parcel要素类 1.4 创建pole要素类 4、新建表:

如图1.5所示,在Personal Geodatabase下,新建一个owner表,新增字段name (文本型)、age (短整型) 1.5 创建owner表 二、创建子类 1、新建子类: 单击鼠标右键,打开pole要素类的属性表,选择子类选项卡,根据type字段创建pole类型子类,包括Wood、Steel和Cement。 图2.1 pole要素类新建子类 2、对子类赋值: 如图2.2所示,在ArcMap环境下通过列表框选择对要素子类进行赋值。

图2.2 pole要素类赋值 三、按子类定义pole要素类的域: 1、打开Geodatabase的属性表,定义三个域:Wood_pole高度域(短整型),20—30ft;Steel_pole的高度域(短整型),30—50ft;pole的管理部门域(文本),市管,区县管。 图3.1 按子类定义pole要素类的域

oracle数据库实验指导书

计算机科学学院《ORACLE数据库》实验指导书

《ORACLE数据库》实验指导书 实验一Oracle数据库安装配置以及基本工具的使用 1.实验的基本内容 实验室中oracle数据库安装后某些服务是关闭的(为了不影响其他课程的使用),所以在进入数据库前需要对oracle进行配置: (1)启动oracle OraHomeTNSLISTENER 和oracleserviceORACLE 两个服务 (2)修改listener.ora 和tnsnames.ora 两个文件的内容 (3)以用户名:system ,口令:11111 以“独立登录”的方式进入oracle 数据库系统 (4)熟悉数据库中可用的工具。 2.实验的基本要求 (1)掌握Oracle11g的配置以及登录过程。 (2)熟悉系统的实验环境。 3.实验的基本仪器设备和耗材 计算机 4.实验步骤 (1) 查看设置的IP地址是否与本机上的IP地址一致。若不一致则修改为本机IP地址。 (2) 启动oracle OraHomeTNSLISTENER 和oracleserviceORACLE 两个服务 控制面板/性能与维护/管理工具/服务/ oracle OraHomeTNSLISTENER(右击/启动)。 控制面板/性能与维护/管理工具/服务/ oracleserviceORACLE(右击/启动) (3) 修改listener.ora 和tnsnames.ora 两个文件的内容 D:\app\Administrator\product\11.1.0\db_1\NETWORK\ADMIN (用记事本方式打开),将HOST=“…..”内容修改为本机的IP地址,保存退出。 D:\app\Administrator\product\11.1.0\db_1\NETWORK\ADMIN (用记事本方式打开),将HOST=“…..”内容修改为本机的IP地址,保存退出。 (4) 启动oracle 数据库

空间数据库建库复习资料

第一章 1.GIS的名词分析与推论 GIS概念:具有地理数据的采集、管理、分析、表达能力,能为决策者提供有用地理信息的系统。 推论1:地理信息系统采集的数据为空间数据,即具有空间位置,又具有属性特征。地理信息系统的数据库因此又称为空间数据库。 推论二:地理信息系统具有采集、管理、分析地理数据和表达地理信息的能力。包括空间数据库建设和空间数据库的应用两个层次。 推论三:地理信息系统包括计算机硬件、软件、数据、系统开发人员和用户,但由于处理和分析的是地理数据,因此,在通用的硬件、软件基础上,还有体现专业特点的硬、软件。 2.GIS空间数据体系 空间数据库:空间数据和属性数据的组织 矢量有混合式、扩展式和开放式

矢量数据的空间数据组织:空间坐标数据的非结构化和属性数据的结构化 栅格数据:像元阵列 3.GIS数据模型 矢量数据模型:简单数据结构(面条结构):如Shapefile、拓扑数据结构:如Coverge、面向对象的数据模型:如Geodatabase 栅格数据模型:栅格文件常用格式:*.tif,*.jpg,*.bmp等。GIS中的栅格格式:ESRI 的Grid、Geodatabase的栅格数据集等。遥感图像的格式:PCI的* .pix,Erdas 的*.img等。 4.空间数据库设计核心 将现实世界抽象为GIS数据模型,这是数据库设计的核心。 5.名词解释: 面条结构:数据按点、线、面为单元进行组织,点、线、面都有自己的坐标数据。最典型的是面条结构。 拓扑数据结构:不仅存储空间位置,同时存储空间关系。 拓扑关联:指存在于空间图形的不同类型元素之间的拓扑关系。如结点与弧段、弧段与多边形。 第二章 1.名词解释: 数据词典:以词典的方式描述和定义E-R模型设计中出现和形成的实体、关系。数据模型匹配:实现将实体类型和特征类型(Coverage、Shapefile、Grid等)的匹配。 区:基于现有的面特征来描述复杂的区域如多个独立的多边形组成的区域、相互

空间数据库复习重点答案完整)

1、举例说明什么是空间数据、非空间数据?如何理解空间查询和非空间查询的区别?常用的空间数据库管理方式有哪几种及其各自特点。 数据:是指客观事务的属性、数量、位置及其相互关系等的符号描述。空间数据:是对现实世界中空间对象(事物)的描述,其实质是指以地球表面空间位置为参照,用来描述空间实体的位置、形状、大小及其分布特征等诸多方面信息的数据。河流的泛洪区,卫星影像数据、气象气候数据等都可以是空间数据书店名称店员人数,去年的销售量,电话号码等是非空间数据 空间查询是对空间数据的查询或命令 人工管理阶段 文件管理阶段缺点: 1)程序依赖于数据文件的存储结构,数据文件修改时,应用程序也随之改变。 2)以文件形式共享,当多个程序共享一数据文件时,文件的修改,需得到所有应用的许可。不能达到真正的共享,即数据项、记录项的共享。 常用: 文件与数据库系统混合管理阶段优点:由于一部分建立在标准的RDBMS上,存储和检索数据比较有效、可靠。 缺点:1)由于使用了两个子系统,它们各自有自己的规则,查询操作难以优化,存储在RDBMS外的数据有时会丢失数据项的语义。 2)数据完整性的约束条件可能遭破坏,如在几何空间数据系统中目标实体仍存在,但在RDBMS中却已删除。 3)几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多 全关系型空间数据库管理系统 ◆属性数据、几何数据同时采用关系式数据库进行管理 ◆空间数据和属性数据不必进行烦琐的连接,数据存取较快 ◆属性间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作 ◆GIS软件:System9,Small World、GeoView等 本质:GIS软件商在标准DBMS顶层开发一个能容纳、管理空间数据的系统功能。 对象关系数据库管理系统 优点:在核心DBMS中进行数据类型的直接操作很方便、有效,并且用户还可以开发自己的空间存取算法。缺点:用户须在DBMS环境中实施自己的数据类型,对有些应用相当困难。 面向对象的数据库系统。 采用面向对象方法建立的数据库系统; 对问题领域进行自然的分割,以更接近人类通常思维的方式建立问题领域的模型。 目前面向对象数据库管理系统还不够成熟,价格昂贵,在空间数据管理领域还不太适用; 基于对象关系的空间数据库管理系统可能成为空间数据管理的主流 2、什么是GIS,什么是SDBMS?请阐述二者的区别和联系。 GIS是一个利用空间分析功能进行可视化和空间数据分析的软件。它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空间分析/统计、度量GIS 可以利用SDBMS来存储、搜索、查询、分享大量的空间数据集 改:地理信息系统是以地理空间数据库为基础,在计算机软硬件的支持下,运用系统工 科学管理和综合分析具有空间内涵的地理数据,以提供管理、决策等所需信息的技术系统。简单的说,地理信息系统就是综合处理和分析地理空间数据的一种技术系统。

数据库实验报告(一)

滨江学院 题目数据库实验报告(一) 学生姓名 学号 系部电子工程系 专业通信工程 指导教师林美华 二O一三年十二月十八日

实验一数据库的定义实验 本实验需要2学时。 一、实验目的 要求学生熟练掌握和使用SQL、SQL Server企业管理器创建数据库、表、索引和修改表结构,并学会使用SQL Server 查询分析器接收语句和进行结果分析。 二、实验内容 1 创建数据库和查看数据库属性。 2 创建表、确定表的主码和约束条件。为主码建索引。 3 查看和修改表结构。 4 熟悉SQL Server企业管理器和查询分析器工具的使用方法。 三、实验步骤 1 基本操作实验 (1) 使用企业管理器按教材中的内容建立图书读者数据库。 (2)在企业管理器中查看图书读者数据库的属性,并进行修改,使之符合要求。 (3)通过企业管理器,在建好的图书借阅数据库中建立图书、读者和借阅3个表,其结构为; 图书(书号,类别,,作者,书名,定价,作者). 读者(编号,,单位,性别,). 借阅(书号,读者编号,借阅日期) 要求为属性选择合适的数据类型,定义每个表的主码.是否允许空值和默认值等列级数据约束。 (4)在企业管理器中建立图书、读者和借阅3个表的表级约束.每个表的主码约束.借阅表与图书表间、借阅表与读者表之间的外码约束,要求按语义先确定外码约束表达式.再通过操作予以实现.实现借阅表的书号和读者编号的惟一性约束:实现读者性别只能是“男”或“女”的Check(检查)约束。 2 提高操作实验 (一) 将教材中用SQL描述的建立学生--课程操作.在SQL Server企业管理器中实现。库中表结构为: 学生(学号,,年龄,性别,所在系). 课程(课程号,课程名,先行课). 选课(学号,课程号,成绩) 要求: 1)建库、建表和建立表间联系。, 2)选择合适的数据类型。 3)定义必要的索引、列级约束和表级约束. 四、实验方法 l创建数据库 (1)使用企业管理器创建数据库的步骤 1)从“开始”菜单中选择;“程序”“Microsoft SQL2000”“企业管理器”.

数据库设计各阶段word版本

数据库设计各阶段

1.数据库应用系统的设计步骤 按规范设计的方法可将数据库设计分为以下六个阶段 (1)需求分析; (2)概念结构设计; (3)逻辑结构设计; (4)数据库物理设计; (5)数据库实施; (6)数据库运行和维护。 2.需求分析 需求收集和分析是数据库应用系统设计的第一阶段。明确地把它作为数据库应用系统设计的第一步是十分重要的。这一阶段收集到的基础数据和一组数据流图(Data Flow Diaˉgram———DFD)是下一步设计概念结构的基础。概念结构对整个数据库设计具有深刻影响。而要设计好概念结构,就必须在需求分析阶段用系统的观点来考虑问题、收集和分析数据及其处理。如何分析和表达用户需求呢?在众多的分析方法中,结构化分析(Structured Analysis,简称SA方法)是一个简单实用的方法。SA方法用自顶向下、逐层分解的方式分析系统。用数据流图,数据字典描述系统。然后把一个处理功能的具体内容分解为若干子功能,每个子功能继续分解,直到把系统的工作过程表达清楚为止。在

处理功能逐步分解的同时,它们所用的数据也逐级分解。形成若干层次的数据流图。数据流图表达了数据和处理过程的关系。处理过程的处理逻辑常常用判定表或判定树来描述。数据字典(Data Dictionary,简称DD)则是对系统中数据的详尽描述,是各类数据属性的清单。对数据库应用系统设计来讲,数据字典是进行详细的数据收集和数据分析所获得的主要结果。数据字典是各类数据描述的集合,它通常包括以下5个部分: (1)数据项,是数据最小单位。 (2)数据结构,是若干数据项有意义的集合。 (3)数据流,可以是数据项,也可以是数据结构。表示某一处理过程的输入输出。 (4)数据存储,处理过程中存取的数据。常常是手工凭证、手工文档或计算机文件。 (5)处理过程。 3.概念结构设计 如同软件工程中重视需求分析与规范说明的思想一样,数据库设计中同样十分重视数据分析、抽象与概念结构的设计。概念结构的设计,是整个数据库设计的关键之一。概念结构独立于数据库逻辑结构,独立于支持数据库的DBMS,也独立于具体计算机软件和硬件系统。归纳总结,其主要特点是:

空间数据库设计综合实习报告

空间数据库设计综合实习报告 班级:地理信息系统091、092班 实验人员名单及学号: 日期:2011/10/24 目录 空间数据库设计综合实习报告 (1) 一、设计题目 (2) 二、实验目的 (2) 三、需求分析 (2) 四、功能分析和数据组织 (2) 五、数据库建设流程 (2) 5.1软硬件配置 (2) 5.2数据采集流程 (3) 六、数据库应用案例 (6) 6.1.查询 (6) 6.2 缓冲区分析 (9)

一、设计题目 成都市市区基础地理数据库的构建 二、实验目的 通过设计和建立空间数据库,掌握空间数据库设计和建设流程,学会利用所学GIS知识独立分析和解决问题的能力。 三、需求分析 1. 利用计算机进行显示城市信息; 2. 借助现有城市专题图能否自己构建一个简单的基础城市地理数据库; 3. 在基础数据基础上,完成自动制图。 四、功能分析和数据组织 1.功能分析:该数据库主要用于存储成都市的基本道路信息、居民点分布信息以 及学校医院等政设服务性机构信息。 2.数据组织:居民点分布数据、道路数据、河流数据、现有公园分布数据、 市内现有基础服务设施分布数据,几类数据应该平行组织,以便 建立他们之间拓扑关系。 五、数据库建设流程 5.1软硬件配置 1.软件:专业软件ArcGIS9.3 系统软件windows 7

2.硬件:酷睿系列微机 5.2 数据采集流程 按照功能设计、数据组织,因此数据采集的流程为: 1)收集进行数字化的基础数据:成都市地图;若干具有精确地理位置的特征点; 本实验数据来源于空间数据库DATA\栅格专题图: 成都.bmp,成都市若干道路交叉口的地理坐标(WGS-84坐标系).txt。 其中,成都.bmp作为数字化底图,从它上面提取所需数据;而成都市若干道路交叉口的地理坐标(WGS-84坐标系)这个文件则是作为地理参照,以此为依据对底图进行几何校正。 2)地理参考:对所得地图进行地理参考; 利用pci对底图进行校正,采用输入已知坐标的方法,为底图加上地理坐标WGS-84。 3)数字化:对地图信息进行分层数字化; 分工合作对底图进行数字化:用画多边形、线、点得方法,针对不同特征的图形,采用不同方法,比如,河流道路呈线状,则采取画线的方式,而学校医院已有标识,则采用画点的方式将其提取出来。 4)坐标统一:对所得图层统一进行投影,采用高斯投影; 所得的几个图层均以经纬度的方式即地理坐标表示,由于这对于常人认识地图的方式有所不变,故要统一为它们加上投影信息Gauss_Kruger。 5)构建Geodatabase,并对图层经销属性域的编辑; A.在ArcCatalog中相应文件夹下建立文件空间数据库CITY,如图5.1;

GIS空间数据库设计方法讨论

第31卷总第77期 西北民族大学学报(自然科学版)Vol.31,No.1 2010年3月 Journal of N orthw est U niversity for N ationalities(Natural Science)Sep,2010 GIS空间数据库设计方法讨论 薛国梁 (西北民族大学人事处,甘肃兰州730030) [摘 要]通过分析地理信息系统建设过程中空间数据库的建设内容1综述空间数据块的划分、图层的分层设计方法、专题图层划分和数据集设计、分析空间数据库的结构,讨论了空间数据库系统建设的方法和需解决的关键技术问题1 [关键词]GIS;空间数据库;专题图层;元数据 [中图分类号]TP311.131 [文献标识码]A [文章编号]1009-2102(2010)01-0049-04 0 引言 地理信息系统是集计算机科学、空间科学、信息科学、测绘遥感科学、环境科学等学科于一体的新兴边缘科学1GIS从20世纪60年代出现以来,至今只有短短的40多年时间,但已成为已成为多学科集成并应用于各领域的基础平台,成为地学空间信息分析的基本手段和工具1目前,地理信息系统不仅发展成为一门较为成熟的技术科学,而且已成为一门新兴产业,在测绘、地质、水利、环境检测、土地管理、城市规划、国防建设等领域发挥越来越重要的作用1 1 空间数据库内容 每个GIS数据集都提供了对世界某一方面的空间表达,包括: 基于矢量的要素(点、线和多边形)的有序集合; 诸如数字高程模型和影像的栅格数据集; 网络; 地形和其他地表; 测量数据集; 其他类型数据,诸如地址、地名和制图信息; 描述性的属性1 除了地理表现形式以外,地理数据集还包括传统的描述地理对象的属性表1许多表和空间对象之间可以通过它们所共有的字段(也常称为“关键字”)相互关联1就像它们在传统数据库应用中一样,这些以表的形式存在的信息集和信息关系在GIS数据模型中扮演着非常关键的角色1 2 空间数据表现形式 211 空间关系:拓扑和网络 空间关系,比如拓扑和网络,也是一个GIS数据库的重要部分1使用拓扑是为了管理要素间的共同边界、定义和维护数据的一致性法则,以及支持拓扑查询和漫游(如确定要素的邻接性和连接性)1 [收稿日期]2009-12-10 [作者简介]薛国梁(1980—),男,陕西韩城市人,党政管理研究实习员,主要从事高教管理工作1

相关文档
最新文档