GIS 的原理与方法

G I S的原理与方法

课程性质与期望

性质:地理信息系统专业的专业必修课、学位课。

目的:使学生比较完整地了解和掌握地理信息系统的基本原理和方法。目标：使学生知道和初步掌握与G I S空间数据管理、空间分析有关的理论与方法。

教材

黄杏元等《地理信息系统概论》高等教育出版社2001年12月第二版张超等《地理信息系统实习教程》高等教育出版社2000年8月第一版朱光等《地理信息系统基本原理及应用》测绘出版社1997年6第一版陆守一等《地理信息系统实用教程》中国林业出版社2000年1第二版汤国安等《地理信息系统》科学出版社2000年10月第一版

参考书目

吴立新等《地理信息系统原理算法》科学出版社2003年10月第一版陈述彭等《地理信息系统导论》科学出版社1999年5月第一版龚健雅《地理信息系统基础》科学出版社2001年2月第一版王家耀《空间信息系统原理》科学出版社2001年5月第一版P a u l A.L o n g l e y等《地理信息系统（上：原理与技术；下：管理与应

用）》电子工业出版社2004年9月第一次印刷

第一章地理系统与地理信息系统

⒈地理系统的概念

地理系统是上个世纪中叶系统研究思潮影响下在地理学领域逐渐形成

的一个概念.

地理学的研究对象:地球表层

地理学的视角:

前苏联:索恰瓦的地理系统学说

研究策略:过程的系统分析

地理系统的定义

地理系统的自组织与平衡状态

地理学的研究对象:地球表层

地球表层：海陆表面上下一定范围

上界：电离层、臭氧层、对流层顶

下界：沉积岩圈底部、莫霍面、岩石圈

地理学的研究对象:地球表层

地球表层的基本特征：

太阳辐射集中分布

各圈层相互渗透：大气、岩石、水、生物、土壤、人类

人类社会发生发展的场所

地理学的视角(P e r s p e c t i v e s)

索恰瓦的地理系统学说(1970s)

认为:地理系统=自然综合体

自然综合体是在空间分布上相互联系，并作为整体部分发展变化的各地理组成成分相互制约的动态系统。

成分: 地壳坚硬物质（岩石圈）大气圈水圈生物圈土壤圈人类工程建筑地球表层系统是由大小复杂程度有区别、等级有高低的自然综合体组成的.

优点:ａ．可从定性分析走向定量分析

ｂ．有助于地理预报

ｃ．扩大了学科间交流的可能性。

研究策略:过程的系统分析

分析各地理成分之间物质迁移与能量转换的动态过程

ａ．美：土壤－植物－大气统一体

ｂ．苏：风化壳－水－大气；植被－水－大气；动物－植物－土壤ｃ．德：地形－气候；地形－陆地水

ｄ．英：土壤－植被

地理系统的定义

地理系统,指某一个特定时间和特定空间的,由两个以上相互区别又

相互联系、相互制约的地理要素或过程所组成的,并具有特定功能和行为,与外界环境相互作用,并能自动调节和具有自组织功能的整体。

形式定义:S={Ω,R}

Ω={x1,x2,x3,…,x n}为n个不同类型的地理要素

R为地理要素之间的相互关系

地理系统的自组织与平衡状态

地理系统的自组织是指系统在无外界强制条件下自发形成的有序行为，能自身调节功能的行为。

地理系统形成之初，系统呈混沌（c h a o s）状态，然后从无序到有序，向平衡态演化。但也可能退化。

混沌是一种远离平衡态、无明显周期性和对称性的无规则现象。

地理系统可从一种平衡态向更有序的平衡态演化。

如：河流系统的发育演化、植物群落的演化

三点概括

地球表层可视为最大的地理系统，其内部可以按区域划分出不同大小等级的子系统；也可以按地理现象之间的联系性划分出各种子系统。

地理学可以从区域出发，考察大小等级不同的地理系统，以及它们之间的相互关系。

地理学也可以从过程入手，考察组成地理系统的各个要素，以及它们之间的相互关系。

⒉地理空间认知理论

认知与空间认知

认知研究关注人类与其他智慧生物的知识的获取、存储、检索、处理和使用。

认知包括感觉、知觉、思考、想象、推理、求解、记忆、学习和语言认知结构和过程是智力的一部分，来自于社会与自然世界中存在的个体的大脑与神经系统

空间认知处理世界的空间属性，包括位置、大小、距离、方向、形状、格局、移动、以及事物间关系的认知

被感知世界的特征

感觉是神经系统对外部世界的刺激的最初反应。

感觉系统可细分为：视觉、听觉、嗅觉、味觉、触觉（压力与质地、温度）、肌肉运动感（肢体位置与移动）、前庭感（重力与身体加速）知觉是经由感觉对自身和世界的知识的主动获取。

被感知的世界有下列特征：

位置的透视——总是从一个视点看世界，是不完全访问

信息冗余（如插值和线形透视所隐含的）

恒定性（颜色、大小、位置、形状）——事物、事件、及背景，即使在观察条件改变时，仍维持许多特性不变

有意义的——总是感知到有意义的、熟悉的事物与事件

认知地图（c o g n i t i v e m a p s）

认知地图是记忆中的世界与其空间属性的内在表达。又称心象地图（m e n t a l m a p）

认知地图对个人是特定的，但可以在群体中分享。

认知地图与通常的地图不一样：

它不是有一定比例的唯一表达，也不完整

通常由离散的片段组成（矢量而非栅格）

地界标记、道路、区域

认知地图

这些片段有一定等级

不同层次多个片段状态上有差别，如大小

不同层次间有包含关系

同一层次内的片段并不完全连接

误差特征及对问题响应的次数揭示出这种等级关系

片段内和片段间各个地方保持其相对位置

空间信息并未按度量几何（如欧氏几何）建模

与情感有关联

认知地图

认知地图中存在失真

失真让我们了解了认知地图的一些属性

知识的准确度是如何被定义的呢？

符合实际计量

从众原则

行为适应

失真的例子：

通常认为南美洲位于北美洲正南，实际在东南方。

路口与路障会明显增加两地之间的距离。

记忆中拐弯往往是直角；弯道经常变直了。

空间学习（l e a r n i n g）与发育

学习是来自于实践或经验的认知或行为方面的相对永久性的变化。

空间知识是通过一个或多个获取媒体学习而得到的。

直接感觉经验、地图、模型、照片、图画、电影与录象、口头或书面语言、虚拟空间

媒体对获取的知识的性质有重要意义

空间学习与发育

认知发育是认知内容与过程，经过一定时间而发生的系统性变化，包括学习、成熟、成长（儿童或成年人）

瑞士儿童心理学家皮亚杰（P i a g e t）因定性的儿童认知发育的“阶段理论”而知名

从幼年具体感觉空间转变到青春期抽象空间推理

用于定义位置的参照系从自我中心转变为外在中心

空间知识的几何学从拓扑的发展到投影的和度量的信息处理途径提供了连续、定量发育的替代理论

关于世界空间知识的传统理论受皮亚杰理论支持；由三个阶段或要素组成：

第一是“地标知识”：标志一个地方的独特的可知觉到的各个事件

第二是“路径知识”：感觉到的连接地标序列的各条路径，几乎没有度量空间知识

第三是“测量知识”：同时相关位置的二维分布知识；允许绕道、走捷径和创造性导航

信息处理途径提出了比较初始的度量空间知识在范围、准确度和完整性方面的替代的连续定量的增加。

地理空间的认知模型

在地理认知模型中，人类对现实世界的理解表述为某种地理概念的实例形式，包括

几何要素：位置、距离、方向

专业内容：向斜、蛇形丘

主观地理对象：位置感

研究这些概念是为了能以反映人们思考周围世界的最好方式进行系统设计。

⒊地理空间的表达

地理系统与地理空间

地理空间是地球表层地理实体（地理现象）集及其关系的集合。

S={Ω，R}。

形式定义：与地理系统一致

内涵：地理系统强调组成要素间的整体性，地理空间则无此约束

因此，一个具体地理系统可视为其所在的地理空间的一种抽象、一个子系统。

地理空间的地图表达

地图用点、线、多边形和等值线来表达地理现象的空间信息。

地图用符号和注记来表达地理现象的属性信息。

在地图上，空间关系是隐含的；取决于地图读者的解释。

投影：使平面地图可以展现（椭）球面

比例尺：使有限图幅可以展现大洲大洋

地图比例尺

比例尺的种类：文字、表达分数、图形

我国基本地形图的分幅

地图的局限性

原始数据必须简化、分类后才便于表达、理解，但很多有用信息在分类中被丢失。

若分类变了，又得从头做起。

大范围的地图不得不分幅，不便使用。

图上查找、检索、量算很不便，误差大。

不同地图间建立联系非常困难。

地图的更新方法复杂，更新周期太长。

地理空间的遥感图象表达

遥感是一种远距离、非接触的目标探测技术和方法。

航空遥感与航天遥感

被动遥感：0.4~0.7μm，0.7~1m m

主动遥感：0.001~1m

遥感图象以象元矩阵的形式描述地理空间

象元有一个D N：为传感器接受到的、地物反射或辐射出的电磁波信息的量化值

地面分辨率：1k m，30m，25m，10m，1m

遥感图象

O n26D e c2004,00:58:53U T C(7:58:53a m l o c a l t i m e),a m a g n i t u d e

9.0e a r t h q u a k e o c c u r r e d o f f t h e w e s t c o a s t o f n o r t h e r n S u m a t r a,

I n d o n e s i a.T h e e p i-c e n t r e w a s l o c a t e d u n d e r s e a w a t e r a t3.32N

95.85E.T h i s i s t h e f o u r t h l a r g e s t e a r t h q u a k e i n t h e w o r l d s i n c e1900. T h e e a r t h q u a k e g e n e r a t e d t s u n a m i s w h i c h s w e p t a c r o s s t h e I n d i a n

O c e a n w i t h i n h o u r s.O v e r120,000p e o p l e l o s t t h e i r l i v e s i n t h i s

d i s a s t

e r.A r e a s n e a r t o t h e e p i c e n t r e i n I n d o n e s i a,e s p e c i a l l y A c e h,

w e r e d e v a s t a t e d b y t h e e a r t h q u a k e a n d t s u n a m i s.T h e t s u n a m i s a l s o a f f e c t e d P h u k e t a n d s u r r o u n d i n g a r e a s i n T h a i l a n d,P e n a n g i n

M a l a y s i a,S r i L a n k a,I n d i a,a n d p l a c e s a s f a r a s S o m a l i a i n A f r i c a

遥感图象的局限性

遥感图象为中心投影，若覆盖范围大，则有几何误差

遥感图象拼幅与投影转换困难

遥感图象须经过专家解译，方可使用

地理空间的G I S表达

G I S继承了地图表达的优势，同时避免了地图的局限性

G I S使用了类似于遥感图象的表达方法，一定程度上克服了其局限性

本课程的任务是介绍地理空间的G I S表达的概念与方法

第二章G I S的信息组织与数据结构

⒈数据模型的概念

数据模型是对现实世界的模拟和抽象。

人们使用数据模型，进行数据建模。

数据模型应满足三方面的要求：

能比较真实地模拟现实世界

容易为人所理解

便于在计算机上实现（必须支持空间分析）

通常应根据具体应用的目的要求，选择适当的数据模型。

数据结构:

第一层次：

根据用户的观点和应用需要，从现实世界中选择感兴趣的地理现象，构建地理空间；

用概念模型加以描述。

不依赖于具体的计算机系统，主要用于数据库设计

第二层次：

概念模型将被转换为计算机世界的数据模型。

有严格的形式化定义，便于在数据库管理系统中实现。

O p e n G I S要素模型

地理目标

?用地理目标描述地理空间的实体

?基本目标类型：

?点状：电线杆、住宅小区、城市、矿床

?线状：各种管网、河流、铁路

?面状：地块、行政区、土壤植被分布区、城市

?表面：地形、温度场

?体状：建筑物、地下巷道、水体

数据模型的组成要素

?数据模型是严格定义的一组概念的集合。

?数据结构指所研究的数据对象及其相互关系的描述。

?它反映了数据的静态特性，是数据模型中最重要的要素。

数据模型的组成要素

数据操作是指对数据库中各种对象（包括型和值）允许执行的操作的集合，包括操作及有关的操作规则。

数据库主要有检索和更新（包括插入、删除、修改）

它是对系统动态特性的描述。

数据的约束条件是一组完整性规则的集合。

它是给定的数据模型中数据及其联系所具有的制约和依存规则，用以限定符合数据模型的数据库状态以及状态的变化，以保证数据的正确、有效和相容。

G I S数据模型

G I S数据模型应能表达各种地理目标

三个组成要素

数据结构

数据操作

约束条件

⒉空间实体联系模型

空间实体联系模型是E-R模型的拓展。

实体联系模型（E-R模型）是P.P.S.C h e n于1976年提出的，其初衷是建立一个统一的数据模型，以概括包括层次、网状和关系等三种数据模型；并且希望能克服这些模型的弱点，能以比较自然的方式来描述现实世界。

尽管其目标并未完全实现，但这一模型目前在数据库概念设计方面已得

到了广泛应用。

E-R模型

E-R数据模型把现实世界看作是有许许多多通过联系彼此联结在一起的实体组成的。

实体是现实世界中可区别的对象

具体的：如职工、飞机、汽车时刻表、地图、黄山、太湖

抽象的：如鬼神、灵感、兴趣爱好等。

现实世界由实体集及其联系组成

实体集及其联系用E-R图表示

实体集

每个实体可以有不同种类的属性，其中部分属性值可以唯一地标识该实体；该属性或属性集称为“码（k e y）”

属性及其值域相同的所有实体属于同一个实体集；

属性

简单属性和复杂属性（可否分解）

道路名/姓名、地址

单值属性和多值属性

身高、体重/电话号码

N U L L属性

当实体在某个属性上没有值时，使用n u l l值

派生属性

指可从其他相关属性或实体派生出来的属性

工龄=当前日期–开始工作日期

大学生金纬（一个对象）

实体的属性仅仅是根据用户需要而选择的；同一个对象有可能抽象出属性集不同的实体

身体状况：

身高、体重、胸围、肺活量、心率、视力、……

家庭状况：

父亲、母亲、社会关系、……

学籍与成绩记录：

学历：小学、初中和高中

联系集

联系指实体集之间的关系。当实体集A和B，处在一个联系r中时，记为A r B。

联系集为同类联系的集合。

分类：

聚集联系：一对一、一对多、多对多

从属联系：i s a

一对一联系

如果A r B存在，且为一对一联系，则实体集B中的单个实体最多与实体集A中的一个实体有联系，反之亦然。

一对多联系

如果A r B存在，且为一对多联系，则实体集B中的单个实体最多与实体集A中的一个实体有联系，反之不成立。

多对多联系

如果A r B存在，且为多对多联系，则实体集A中的单个实体可能与实体集B中的任意数目的实体有联系，反之亦然。

从属联系

如果A i s a B存在，则A是B的具体化；B是A的一般化。

如船长集从属于船员集，船长具备船员集成员的全部属性，相反不成立。从属联系使实体集之间可以建立层次联系。

E n t i t y-R e l a t i o n s h i p G r a p h

S p a t i a l E -R 模型

地理实体指具有地理位置的实体空间联系

空间联系指空间（地理）实体之间的关系度量关系、方位关系、拓扑关系

多目标实体与多时相实体

S p a t i a l E -R 模型的例

⒊ 栅格G I S 的数据模型与结构

实体及其属性：

空间实体及其属性：路段（路名，类型，宽度）线段（坐标，拓扑关系）路口（路名1，路名2，...）

节点（坐标，拓扑关系）建筑物（建成日期，估计价值）建筑基座（坐标）

土壤类型（土壤类型代码，面积）多边形（坐标，拓扑关系）土地利用（土地利用代码，面积）

栅格格子（坐标）

地理实体空间目标

坐标指示拓扑

指示

目标（实体）空间目标坐标指示拓扑指示目标（实体）空间目标坐标指示拓扑指示目标（实体）

目标（实体）空间目标坐标指示拓扑指示

空间目标坐标指示拓扑指示

目标（实体）

空间目标坐标指示拓扑指示目标（实体）

⑴

栅格模型栅格模型

栅格数据模型，又称场模型，使用连续的元子空间描述地理空间。

场模型：{a , x ,y ,z , t } 二维：{a , x ,y , t } 高程：{ z , x ,y , t }

地表连续，地点(p l a c e )是无限的

许多地理现象呈现连续变化，

可视为变量，每个变量可概念化为场如：气压场、温度、地下潜水位连续变量必须离散化 ⑵ 栅格结构栅格结构

线段路名路名路口站点线路线路线路图2.6 空间实体联系模型的示例

节点

坐标

多边形

坐标

拓扑

节点

坐标

/多边形

坐标

拓扑

路口

路段

宗地

公交站点

连通性

邻接性

近邻

路名

类型

宽度

-1

-2

ID -2 ID

-3 ID

-1 ID

业主姓名

估计价值

业主地址

栅格（R a s t e r）数据结构以类似于遥感图象的方式表达地理现象，即将研究区域划分成规则的网格。其位置信息(坐标)是隐含的；空间关系也是隐含的。

栅格实际上是像元（p i x e l）矩阵。有行有列。每个像元被称之为格子（c e l l）.格子的形状可以是六边形的、三角形的，但更普遍的是方形的。

栅格结构

当栅格表达的范围比较大时，必须考虑地球曲率的影响。可以使用高斯-克吕格投影。

有的栅格系统采用地理坐标（经纬度），则格子的实际形状是曲面梯形。在这种情况下，通常采用等距圆柱投影。

分辨率p.43

分辨率可定义为栅格所记录的地理空间的最小单元的线形长度。

分辨率越高，精度越高，数据量越大。

如何确定分辨率呢？可考虑：

格子应小到足以捕捉用户需要的最小细节

取样成本与数据的可获得性

栅格的大小不能超过硬件的能力

方位角

方位角指栅格的列与真北的夹角。一般来说，栅格的列与经线平行。

在栅格所反映的区域形状比较特殊的情况下，转动一个适当的角度是可行的。

⑶地理现象的栅格表达

标量场的表达：

在标量场的每个地点仅有一个值。可用一个栅格来表达。

如：气温、气压、降水、海拔高度、地下潜水位、土壤p H值等等；地理现象的栅格表达

矢量场的表达：

矢量场的每个地点有一个以上的值。可用两个有联系的栅格来表达。

如：风场有风向与风力。一个栅格记录风向，另一个记录风力；或一个栅格记录风场的X分量，另一个记录Y分量。

点实体的表达

栅格用一个格子近似地表示点。当方格的边长较大时，误差较大。

线实体的表达

栅格用一系列相连的具有相同值的格子表达线状地物，如河流、道路等。所谓格子相连指八方位相邻。

多边形实体的表达

栅格用充满整个多边形的具有相同值的格子的集合来表达区域。

取样定位

指在连续空间中离散取样的位置确定

若随机取样，则用空间内插法插补

取值方法p.68

平均值法（整格取样）：

适用于遥感图像的灰阶数据、高程数据。

中心点法（中心、节点取样）：

用于连续数据，如高程数据、气压数据；

也可用于分类数据。

面积占优法（整格取样）：

适用于分类数据。

重要性法（整格取样）：

适用于需特别表达的内容。如孤立的古树。

百分比分割法（整格取样）：

一个格子取多个值，一个值对应一种特征。对于统计分析非常有用。

⑷栅格数据的编码方法p.45

栅格数据的扫描顺序

使二维结构降低为一维结构

逐行扫描法

往返扫描法（B o s t r o p h e d o n法）

M o r t o n法

P i-o r d e r法

行程编码

四叉树：寻址与分类

往返扫描法

可直译为牛犁田法。

M o r t o n 法 p .49

由反Z 字嵌套而成；适用于2n ×2n 的方阵 P i -o r d e r 法

又称P e a n o 曲线：

行（游）程编码 p .45

行程编码法是一种数据无损压缩方法。它用一对数据描述连续排列且数值相同的数据的值及其个数。

以左列原始数据，按逐行扫描顺序：方法1：

? 格子值，相同值的个数；

? 4,4 2,4 4,3 2,4 3,1 …… 方法2：

起始列位置，格子值；

1,4 5,2 1,4 4,2 8,3 …… 压缩效率 p .46

()%

100?-=

原数据量

压缩后数据量原数据量压缩比

压缩效率主要取决于数据性质和扫描方法

数据冗余度(r e d u n d a n c e)p.46

R e=1–Q÷(m×n)

Q:图层内相邻属性值变化次数的累加和

m:图层的行数

n:图层的列数

当R e＞0.2，压缩效果明显

即Q＜0.8(m×n)

Q=27＜0.8(8×8)

D E M数据的压缩p.47

D E M中相邻的高程数据有相关性，可以利用差分映射法预处理，提高压缩比。

方法：每行从第n列开始按下式计算

V i=V i-V(i-1)

i：2,3,…,n

四叉树p.48

四叉树

适用于2n×2n栅格。

分割次数i，（i：0,1,…，n），又称深度

叶节点所在的方形面积为:

S=2(n–i)×2(n–i)

具有可变分辨率，便于栅格层的合并与分割

编码具有区域性质，便于分析运算

便于与栅格行列坐标转换

四叉树寻址

象限地址：332，其二进制数：111110

M o r t o n码→象限地址

行列地址：左下角起，0行0列

M o r t o n码→行列地址

M o r t o n码→象限地址

①M o r t o n码→二进制数：

62→111110

②从左到右每两位分开→十进制数：

111110→11，11，10；

11→3，10→2

③从左到右连结转换好的十进制数：

3，3，2→332

M o r t o n码→行列地址

位交错法：从0行0列起

四叉树分类p.49~50

指针四叉树（常规）：

记录每个节点的下列数据

4个子节点地址+父节点地址+属性值线形四叉树：

记录每个叶节点的（行列）地址、深度和属性值地址可用象限地址

四叉树实现策略

储存：利用M o r t o n码扫描，行程编码压缩

建树：解码，自下而上建线形四叉树

⒋矢量G I S的数据模型与结构

⑴矢量数据模型的概念

矢量数据模型的概念

矢量数据模型，又称目标模型，

使用点或有向线段构成的图形元

素来描述地理空间。

该模型假设现实世界是空的空

间，离散分布着各类地理实体。

实体可被表达为有点、线、多边

形等目标。

目标模型：{e,a,s,t}

一定区域里某一类实体的集合，

称专题（t h e m e）。每个专题的所有实体，其属性在区域内呈现地理变化。

⑵面条结构p.37

每个目标表示为一对或一对以上顺序排列的（x,y）坐标组成的记录缺点：空间关系隐含；相邻边界两度存储

优点：有利于显示与硬拷贝输出

⑶拓扑结构p.38

仅存储点的（x,y）坐标。线段（弧）由节点与形态点组成，多边形由线段组成

优点：坐标仅存储一次；有利于空间分析缺点：输出效率略低于面条结构

⑷ 拓扑关系的表达 C o n n e c t i v i t y p .33 连通性：指弧在节点彼此连接

拓扑关系的表达 A r e a d e f i n i t i o n

区域定义：环绕一个区域的弧定义一个多边形；0 指明其后的弧定义了多边形的内部边界(岛屿或洞)

拓扑关系的表达 C o n t i g u i t y 邻接性：弧的左右侧多边形相邻

⑸ 平面增强过程平面增强（p l a n e e n f o r c e m e n t ）是为了解决空间数据中存在的数据不完整性而提出的一组规则。

通过平面增强过程，使数据规范化，使点、线段和多边形之间形成拓扑关系。

平面增强的规则

0-C e l l（节点）：

指线段的端点和两条线段的交点。

1-C e l l（弧）：

?指两个相连的0-C e l l之间的线段。

2-C e l l（多边形）：

指每一组相连的1-C e l l构成的闭合区域；且不包括任何不属于该区域边界的1-C e l l。

平面增强前的数据特点

面条结构

两个相邻的多边形可能重叠，或分离

多边形不闭合

过头（O v e r s h o o t）线

缩头（U n d e r s h o o t）线

平面增强的结果

0-C e l l s或是孤立的点，或是邻接一个

或多个1-C e l l s的节点。

所有的1-C e l l s，恰好结束于两个

0-C e l l s。

相邻的两个0-C e l l s之间的每个线段被指定为一个1-C e l l。

所有的1-C e l l s恰好位于两个2-C e l l s之间。

线段两两之间的区域被指定为单个2-C e l l（制图区以外的区域也是一个2-C e l l，其I D常设定为0）。

点坐标文件

弧段-点索引文件

弧段文件

节点文件

多边形文件

平面增强（基于M a p i n f o）的步骤

弧段交点计算

更新弧段目标

生成V e r t e x、P o l y l i n e_V e r t e x、P o l y l i n e的始终点、N o d e表

确定P o l y l i n e的左右多边形

过头线、断头线的编辑

生成P o l y g o n表