计量地理学

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

现以dij表示地点(或样品)i与j的距离,用G1,G2,...,表示类别,而
Gp与Gq两类间的距离用Dpq表示,则
• Dpq=min(dij)
i∈Gp,j∈Gq
• 用最短距离法进行聚类的步骤如下:
– 1. 确定计算距离方法,计算出各地点(样品)间距离,列出初始距离矩阵 D(0)表,其中每个元素都自成一类,这时Dpq=dpq。
• 2. 极差标准化
• 例如:对我国新疆地区6个地点的数据进行处理后,可得表7-2
第七章 地理系统的聚类分析与判别分析
第七章 地理系统的聚类分析与判别分析
• 三、聚类分析的统计量 • 聚类分析统计量可分两大类,即相似系数和距离系数。 • (一)相似系数 • 相似系数是描述地理数据之间相似程度的一种指标。 • 1. 夹角余弦(cosθ)设有n个地点,每个地点有m个特征值,如把每个
第七章 地理系统的聚类分析与判别分析
• 2. 相关系数(r) 为了衡量要素(变量)或指标之间的亲疏关系, 常用相关系数(rij)作为分类统计量,计算公式可参照相关系数定义。
• 在数据标准化后,相关系数可简化成
• 式中,i和j代表两个地点,xk代表第k个指标。 • 计算出的任意两两变量(指标)间的相关系数,构成一个相关阵(R)
第七章 地理系统的聚类分析与判别分析
• 在定义类与类之间距离方面,也有许多方法。例如,最短距离法、最长 距离法、类平均法、重心法和离差平方和法等。
– 最短距离法,是两类之间的距离以两类间的最近样本的距离来表示; – 最长距离法,是两类之间的距离用两类间最远样本的距离来表示; – 类平均法,是两类之间的距离以各类元素两两之间的平均平方距离来表示; – 重心法,是两类之间的距离以重心之间的距离来表示; – 离差平方和法,是两类之间的平方距离用两类归类后所增加的离差平方和来
• 聚类分析法的基本特点是:事先无需知道分类对象的分类结构,而只需 要一批地理数据;选好分类统计量,并按步骤进行计算;最后就可以得 到完整的分类系统图。
Fra Baidu bibliotek
第七章 地理系统的聚类分析与判别分析
• 二、聚类分析的数据处理 • 聚类分析是根据各变量的观测值予以分类的,它涉及到通过各种途径和
手段所得到的有意义的地理数据。由于要素(或指标)的量纲、数量级 和数量变化幅度的差异,如用原始数据进行聚类分析,就会将不同性质、 不同量纲、不同数量变化幅度的数值都统计在一起,这样就有可能突出 某些数量级大的变量对分类的作用,降低了分类的可靠性。 • 为此,常对数据进行标准化处理,现分述如下:
表示。
• 以上方法虽然定义不同,但可用一公式把它们统一起来,如书中所示。 • 比较常用的方法是最短距离法和最长距离法。
第七章 地理系统的聚类分析与判别分析
• (二)最短距离法
• 在系统聚类法中,应用最广泛的是最短距离法。在最短距离法中,定义
两类之间的距离,是以两类间所有样本中最近的两个样本距离来表示的。
地点的特征值看作是多维空间的一个向量,则两个地点之间的相似程度 可用两个向量间夹角的余弦来表示,即
• i和j代表两个地点,xk表示第k个特征值或指标。上式也叫相似系数。
第七章 地理系统的聚类分析与判别分析
• 把两两地点之间的相似系数都计算出来,便可排成一个相似系数矩阵:
• 这一方阵是实对称矩阵,其主对角线元素为1,只须计算其上三角或下 三角阵即可,依此便可进行聚类。cosθij的取值范围在-1到+1之间,其 值越大,越相似,归为一类;其余可归属于另一些类别。
第七章 地理系统的聚类分析与判别分析
• 在进行聚类分析时,首先要根据一批地理数据或指标找出能度量这些数 据或指标相似程度的统计量;然后以统计量作为划分类型的依据,把一 些相似程度较大的样品首先聚合为一类,把另一些聚合为另一类。依次 类推,关系密切的样品便聚合到一小类,而关系疏远的站点则聚合到一 大类,直到把所有的点都聚合完毕,便可逐步画成一张完整的分类系统 图,又称谱系图。
• 距离系数越小,两点间的相似程度越大,反之则小。
第七章 地理系统的聚类分析与判别分析
• 四、地理系统的聚类方法 • (一)系统聚类法概要 • 地理分类和分区是地理学研究的中心内容之一。根据分类目的不同,聚
类分析可分两类:一类是对地点、地区或样品进行分类,称为Q型聚类 分析;另一类是对要素、指标或变量进行分类,称为R型聚类分析。 • 聚类方法有多种,如:系统聚类法、逐步聚类法、逐步分解法和最优分 割法等。其中,以系统聚类法应用最广。其基本作法是:先将n个地点 (或样品)看成各自成一类,并定义样品间、类与类之间的距离,进而 选择距离最小的一对合成一新类,以后计算新类与其他类间的距离,再 将距离最近的两类合并,这样每合并依次都减少一类,直到所有的样品 都成为一类为止。
第七章 地理系统的聚类分析与判别分析
• (一)地理数据的对数变换 • 在对地理数据进行标准化之前,应先对数据进行对数变换,经对数变换
后,数据变幅减小且变均匀。 • (二)地理数据的标准化 • 为了消除量纲的不同,应进一步对数据进行标准化处理。 • 数据标准化方法较多,常用的方法有: • 1. 标准差标准化
第七章 地理系统的聚类分析与判别分析
• (二)距离系数(简称距离) • 假设把我们研究的对象(地点或样品)视为m维空间的点,所谓距离,
就是用各种方法计算出各点间的相互距离,并以它来刻画各点间的相似 性或亲疏程度。距离系数有多种,现仅介绍两种如下: • 1. 绝对距离 • 绝对距离表达式为 • 2. 欧氏距离 • 欧氏距离是一种常用的分类统计量,其距离系数可按下式计算:
– 2. 在初始距离矩阵D(0)中,选出最短距离,即最小元素Dpq,将Gp类和Gq类 合并成一新类Gr,Gr={Gp,Gq},再计算新类与其他类的距离Drk。
第七章 地理系统的聚类分析与判别分析
• Drk=min dij =min {min dij, mindij}
• i∈Gr i∈Gp
i∈Gq
• j∈Gk j∈Gk
j∈Gk
– 3. 将D(0)中第p、q行和p、q列删去,加上第r行和第r列。 第r行和第r列与其他类间的距离按照上式判断后填上的, 这样就得到一个新距离矩阵D(1)表。为清楚计算,应在 表下方注明新类是由哪两类聚成的。
相关文档
最新文档