地理系统要素的统计分析
统计学中的地理信息系统与空间数据分析

统计学中的地理信息系统与空间数据分析地理信息系统(Geographic Information System,简称GIS)是一种结合了地理空间数据的采集、管理、分析和展示的技术系统。
在统计学领域,地理信息系统与空间数据分析的结合为我们提供了更丰富的数据维度,并且帮助我们更好地理解地理空间与统计分析之间的关系。
本文将介绍统计学中的地理信息系统与空间数据分析的相关概念和应用。
一、地理信息系统的概念与应用地理信息系统是一种以地理位置为基础,使用计算机技术来收集、存储、分析、管理和展示地理空间数据的系统。
地理信息系统包括硬件、软件、数据和人员组成的综合性技术系统。
其中,地理空间数据是地理信息系统的核心,包括地图数据、遥感数据、卫星图像等。
在统计学中,地理信息系统可以用于绘制地理分布图、空间插值、空间聚类等空间数据分析任务。
例如,我们可以通过地理信息系统绘制出某一区域的人口密度分布图,进而进行人口统计学分析,找出人口密度高的地区。
同时,地理信息系统还可以帮助统计学家进行空间插值,通过已知的样本点数据,生成整个区域的人口密度估计结果。
二、空间数据分析的基本方法空间数据分析是利用统计学方法来研究地理空间现象的科学,其目标是研究地理现象的空间相关性、空间分布特征、空间聚类等。
在空间数据分析中,常用的方法包括空间自相关性分析、地理加权回归以及核密度估计等。
1. 空间自相关性分析空间自相关性分析是用来研究地理空间上相邻区域之间的相似性或相关性。
通过衡量地理空间上相邻地区之间的相似性程度,我们可以了解地理现象的空间集聚特征。
常用的空间自相关性指标包括莫兰指数和Geary's C指数。
2. 地理加权回归地理加权回归是一种结合了经典回归分析和地理空间因素的统计方法。
在传统的回归分析中,我们通常假设样本之间独立且同分布。
然而,在地理空间数据中,样本之间往往具有空间相关性。
地理加权回归通过引入空间权重,考虑样本之间的空间关系,从而提高回归模型的准确性。
地理信息系统下的空间分析——第六章_空间数据的量算及统计分析方法0

地理信息系统下的空间分析——第六章_空间数据的量算及统计分析方法0地理信息系统 (Geographic Information System, 简称GIS) 是一种用于捕捉、存储、管理、分析和展示地理数据的技术。
GIS的空间分析是指对地理数据进行计量和统计分析的过程。
本文将介绍GIS中空间数据的量算及统计分析方法。
一、空间数据的量算方法1.面积量算:面积量算是对地理空间对象的面积进行计算的方法。
常见的面积量算方法有几何方法、计算公式等。
在GIS中,可以通过点、线、面等要素的矢量数据来计算其面积。
2.距离量算:距离量算是对地理空间对象之间的距离进行计算的方法。
常见的距离量算方法包括欧氏距离、曼哈顿距离、最短路径距离等。
在GIS中,可以通过点、线、面等要素的矢量数据来计算其之间的距离。
3.方位角量算:方位角量算是对地理空间对象之间的方向角进行计算的方法。
常见的方位角量算方法有方位角计算公式等。
在GIS中,可以通过点、线要素的矢量数据来计算其之间的方位角。
二、空间数据的统计分析方法1.面状数据的统计分析:对面状数据进行统计分析是研究地理空间对象在空间范围内的分布情况和特征的方法。
常见的面状数据的统计分析方法有面积统计分析、面积比例统计分析、分区统计分析等。
2.点状数据的统计分析:对点状数据进行统计分析是研究地理空间对象在空间位置上的分布情况和特征的方法。
常见的点状数据的统计分析方法有点密度统计分析、距离统计分析、聚类统计分析等。
3.线状数据的统计分析:对线状数据进行统计分析是研究地理空间对象在空间路径上的分布情况和特征的方法。
常见的线状数据的统计分析方法有长度统计分析、方向统计分析、曲率统计分析等。
三、GIS空间分析的应用场景1.环境保护:通过对空间数据的量算和统计分析,可以评估环境状况和监测环境污染等问题。
2.城市规划:通过对地理空间对象的量算和统计分析,可以评估城市土地利用情况、交通网络等,为城市规划提供科学依据。
地理学中的经典统计分析方法

地理学中的经典统计分析方法(思考题与练习题)1.什么是相关系数?单相关系数、偏相关系数和复相关系数在计算上有什么联系?三者在检验上有什么区别? 答:相关系数是用来测定地理要素之间相互关系密切程度的数值;偏相关系数的计算要以单相关系数为基础,而复相关系数的计算要同时用到单相关系数和偏相关系数;一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系数的临界值表来完成的,偏相关系数的检验,一般采用t-检验法,对复相关系数的显著性检验,一般采用F 检验法。
2.什么是秩相关系数?试比较单相关系数和秩相关系数。
答:秩相关系数,又称等级相关系数或顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。
实际它是位次分析3.什么是地理回归分析?相关分析和回归分析的联系和区别是什么?答:回归分析方法,就是研究地理要素之间具体数量关系的一种强有力的工具,运用这种方法能够建立反映地理要素之间具体数量关系的数学模型,即回归模型。
相关分析揭示了地理要素之间的相关程度,而回归分析进一步揭示了地理要素之间的数量关系。
4.什么是地理过程时间序列?地理时间序列分析在地理学中有什么用途?答:时间序列,也叫时间数列或动态数列,是要素(变量)的数据按照时间顺序变动排列而形成的一种数列,他反映了要素(变量)随时间变化的发展过程。
地理过程的时间序列分析,就是通过分析地理要素(变量)随时间变化的历程,揭示其发展变化的规律,并对未来状态进行预测。
11.某地区粮食产量(t )与受灾面积(hm 2)的历年数据见下表,使计算二者的相关系数,并对相关系数进行检验(a=) 答案见下表:年份粮食产量/t受灾面积/1995 251 521286661996 801 101 199720065167854hm 2x x i--y y i--))((y yx x ii----)(x x i 2--)(y y i 2--1998 409 88 1999 415 90 2000 502 98 2001 314 120 2002 1101 150241376 2003 980 140137122 2004 1124120264504.∑∑-∑=-==------=n i ini ini iix x y y x x y y 111xy )()())((r =33.997152.8868=对于该地区粮食产量(t )与受灾面积(hm 2)的相关系数,f=10-2=8,表里面没有a=的数据,但是随着a 的增大,临界值在不断减小,我们知道当a=时的临界值是,因为远大于,所以说粮食产量(t )与受灾面积(hm 2)显著相关。
如何进行地理数据分析

如何进行地理数据分析地理数据分析是一种利用地理信息系统(GIS)和地理统计学方法来解释、分析和处理地理数据的过程。
通过对地理数据进行分析,我们可以提取出隐藏在数据背后的价值和洞察力,为我们理解和解决现实世界中的问题提供有力的支持。
下面将介绍如何进行地理数据分析的步骤和方法。
一、数据收集和准备在进行地理数据分析之前,我们首先需要收集和准备相关的地理数据。
这些数据可以来自各种渠道,如传感器、遥感影像、人工采集等。
在收集数据的过程中,需要确保数据的质量和准确性。
此外,还需要对数据进行预处理,如去除异常值、数据清洗和处理等,以保证数据的可靠性和一致性。
二、数据可视化和探索分析在收集和准备好地理数据后,我们可以利用GIS软件将数据进行可视化。
数据可视化有助于我们对地理数据的空间分布和模式有一个直观的认识。
通过制作地图、图表和图形,我们可以发现数据中存在的趋势、关联和变化。
在探索分析过程中,我们可以同时使用多种可视化技术,如散点图、热力图、等级符号图等,以便更好地理解和解释数据。
三、空间统计分析在数据可视化和探索分析的基础上,我们可以进一步进行空间统计分析。
空间统计分析是一种研究地理数据在空间上的分布、关联和变化的方法。
通过空间统计分析,我们可以发现地理现象的空间模式和趋势,评估空间相关性和相似性,从而为地理决策提供参考。
常用的空间统计分析方法包括空间聚类分析、空间插值、空间自相关分析等。
四、地理数据建模与预测除了空间统计分析,地理数据分析还可以涉及到建模和预测。
地理数据建模是通过利用已有的地理数据和其他相关数据来构建数学或统计模型,以预测未来的地理现象或趋势。
常用的地理数据建模方法包括回归分析、时空拟合模型等。
通过合适的模型,我们可以预测未来的地理事件发展和变化,为决策提供科学依据。
五、结果解释和决策支持最后,在进行地理数据分析之后,我们需要对分析结果进行解释和理解,并将其转化为决策支持的信息。
对于地理数据分析的结果,我们可以通过报告、可视化图表或动态地图等形式进行展示和分享。
地统计分析方法

高维数据分析
发展适用于高维数据的降维和可视化 技术,以更好地处理复杂数据。
大数据处理
利用高性能计算机和云计算技术,提 高地统计分析方法的计算效率和准确 性。
可解释性研究
加强地统计分析结果的解释性和可视 化研究,提高结果的易理解性和可解 释性。
05
地统计分析方法的实际案例
案例一:城市人口密度的空间分布特征分析
总结词
通过地统计分析方法,分析农业产量的空间 相关性,揭示农作物生长的空间依赖性和异 质性。
详细描述
利用地统计分析方法,对农业产量进行空间 相关性分析,探究不同地区间农作物产量的 相互影响关系。通过分析产量数据的空间自 相关性和集聚模式,理解农作物生长过程中 的空间依赖性和异质性,为农业管理和区域 发展提供科学依据。
04
地统计分析方法的优势与局限性
优势
空间依赖性分析
高效的空间预测
地统计分析方法能够揭示数据的空间依赖 性,即相邻观测值之间的相互影响,有助 于理解空间现象的内在机制。
地统计分析方法利用已知观测值对未知区 域进行预测,能够提供更精确和可靠的空 间预测结果。
降维处理
灵活的模型选择
地统计分析方法能够将高维数据降维处理 ,提取关键的空间结构和模式,简化复杂 数据的分析过程。
发展
地统计分析方法在不断发展完善中,出现了许多新的方法和模型,如克里格插值 、马尔科夫链蒙特卡罗方法等,为地统计分析提供了更丰富的工具和手段。
02
地统计分析方法的原理
空间自相关原理
空间自相关是地统计分析的核心概念,它描述了空间中某一位置上的现象与周围位 置上同种现象之间的相关性。
空间自相关可以用来检测空间依赖性和异质性,从而揭示空间模式和结构。
地理信息系统应用地理数据分析与处理

地理信息系统应用地理数据分析与处理地理信息系统(Geographic Information System,简称GIS)作为一种综合性的空间信息科学技术,已经广泛应用于各个领域。
而地理数据的分析与处理,则是GIS的核心功能之一。
本文将介绍地理数据的分析与处理方法以及其在地理信息系统中的应用。
一、地理数据分析方法地理数据的分析是指通过对地理数据的处理和分析,提取出其中所蕴含的空间关系和规律。
常用的地理数据分析方法包括空间查询、空间统计分析和空间模型等。
1. 空间查询空间查询是指通过逻辑运算和空间关系运算,从地理数据库中筛选出符合指定条件的地理要素。
常见的空间查询包括属性查询、空间查询和组合查询等。
通过空间查询,可以帮助用户快速找到所需的地理信息。
2. 空间统计分析空间统计分析是指对地理数据进行统计建模和分析,探索其中的空间分布规律和相互关系。
常见的空间统计分析包括空间聚类、空间相关性和空间插值等。
通过空间统计分析,可以揭示地理现象的规律性,为决策提供科学依据。
3. 空间模型空间模型是对地理现象的空间特征和关系进行描述和模拟的数学模型。
常见的空间模型包括地理实体模型、地理过程模型和地理网络模型等。
通过空间模型,可以对地理数据进行建模和仿真,以增强对地理现象的理解和预测能力。
二、地理数据处理方法地理数据的处理是指对原始地理数据进行预处理和加工,使其适应地理信息系统的需求。
常用的地理数据处理方法包括数据清洗、数据转换和数据集成等。
1. 数据清洗数据清洗是指对地理数据进行纠错、去噪和去冗余等操作,提高数据的质量和准确性。
常见的数据清洗方法包括拓扑修复、数据平滑和数据匹配等。
通过数据清洗,可以有效提高地理数据的可靠性和可用性。
2. 数据转换数据转换是指将不同格式和存储方式的地理数据进行转换和整合,以适应地理信息系统的要求。
常见的数据转换方法包括数据格式转换、坐标系转换和数据投影等。
通过数据转换,可以实现不同数据源之间的互操作性和数据共享。
地理信息系统中的空间数据分析方法和使用教程
地理信息系统中的空间数据分析方法和使用教程地理信息系统(Geographic Information System,简称GIS)是一种集地理空间数据收集、存储、管理、分析和展示于一体的综合性工具。
其中,空间数据分析是GIS的核心功能之一,它帮助人们了解和解释地理现象,并为决策提供支持。
本文将介绍地理信息系统中的空间数据分析方法和使用教程。
一、空间数据分析方法1. 空间查询分析地理信息系统中的空间查询分析是通过对地理空间数据进行查询和筛选,从而获取特定的空间信息。
空间查询可以通过属性查询和空间关系查询实现。
属性查询是基于地理空间数据的属性,在数据库中执行条件查询。
空间关系查询是根据地理对象之间的空间关系,如相交、包含、邻近等进行查询分析。
2. 空间缓冲分析空间缓冲分析是一种常用的地理信息系统中的空间分析方法,它以某一地理空间对象为中心,根据设定的缓冲距离,生成一系列缓冲区域。
空间缓冲分析可以用于分析地理要素的覆盖范围、相互作用范围以及对环境的影响等。
3. 空间插值分析空间插值分析是通过已知的点数据,推算未知地点的数值。
它使用插值算法,根据给定的空间数据点,在空间上生成连续的表面。
空间插值分析用于补充缺失数据、推算未来趋势以及对地理现象进行模拟和预测。
4. 空间聚类分析空间聚类分析是通过对地理要素进行分类和聚类,揭示地理现象的空间集聚特征。
它可以帮助我们发现空间上的热点区域、人口分布密度等。
常用的空间聚类分析方法有基于密度的聚类方法和基于网格的聚类方法。
5. 空间统计分析空间统计分析是通过计算地理要素的空间分布和相互关系,揭示地理现象的统计特征。
它可以帮助我们理解地理数据的空间相关性、局部差异性和空间自相关性等。
常用的空间统计分析方法包括空间自相关分析、热点分析和空间回归分析等。
二、空间数据分析使用教程1. 数据准备在进行空间数据分析之前,首先需要对数据进行准备。
这包括收集和整理地理空间数据,将其转换为GIS所支持的数据格式,如shapefile、GeoJSON等。
地理学中的统计分析方法
地理学中的统计分析方法地理学是一门关注地球表面自然和人文现象相互关系的学科,对于地理学研究来说,统计分析方法是一种重要的工具。
统计分析方法可以帮助地理学家从大量的数据中获得有用的信息,并对地理现象进行解释和预测。
本文将介绍地理学中常用的几种统计分析方法:描述统计、空间统计分析和多元回归分析。
首先是描述统计方法。
描述统计是对地理数据的基本特征进行描述和总结的方法。
在地理学中,我们常常需要对地理现象的空间分布、变化趋势和规律进行分析。
描述统计可以通过计算数据的中心趋势(均值、中位数、众数)和离散程度(标准差、变异系数)来揭示地理现象的特点。
例如,在研究城市人口分布时,可以通过计算人口的平均值来了解城市的人口规模,通过计算标准差来了解城市人口的分散程度。
其次是空间统计分析方法。
空间统计分析是研究地理现象在空间上的分布和相互关系的方法。
地理现象往往具有一定的空间相关性,即其中一地区的现象可能会受到邻近地区的影响。
例如,在研究气候变化时,不同地区的气候可能会互相影响。
空间统计分析可以通过计算地理现象的空间相关性指标(如Moran's I指数)来研究地理现象的空间分布规律和相互关系。
还可以利用地理信息系统(GIS)软件进行空间统计分析,通过地图展示地理现象的空间分布情况,并进行空间插值和空间推断等操作。
最后是多元回归分析方法。
多元回归分析是通过建立数学模型来探究地理现象的原因和结果之间的关系的方法。
地理现象受到多个因素的影响,而这些因素往往相互作用。
多元回归分析可以通过计算各个因素的回归系数和显著性检验,从而判断各个因素对地理现象的影响程度和贡献度。
例如,在研究城市发展时,可以建立一个多元回归模型,将城市发展水平作为因变量,经济、人口、基础设施等因素作为自变量,来研究这些因素对城市发展的影响。
总结起来,描述统计、空间统计分析和多元回归分析是地理学中常用的统计分析方法。
这些方法可以帮助地理学家从大量的数据中提取有用的信息,揭示地理现象的规律和原因,并对地理现象进行解释和预测。
计量地理学第三章统计分析方法相关分析(共48张PPT)
越密切; 越接近于0,表示两要素的关系越 不密切
lxy
(xi x)(yi y)
xi
yi
1 n
xi
yi
lxx
(xi x)2 xFra bibliotek21 n
xi 2
lyy (yi y)2
-3.6 -1.4 5.1
14. 5
22. 3
26. 9
28. 2
26. 5
21. 1
13. 4
4.6
-1.9
用导出公式
rxy
lxy lxx lyy
xi
yi
xi
n
y i
xi2
xi
2
n
yi2
yi
2
n
相关系数计算表
月份 总和
气温(x)
地温(y)
xy
1
-4.7
-3.6
相关指数必大于或至少等于用同一批资料所求得的 相关系数的绝对值,即Ryx≥∣r∣ Ryx的性质与上述情况基本相同,但在通常情况下, R者y才x与相R等xy不相等,仅当完全相关或完全无关时,两
(三)多要素相关与相关矩阵
如果问题涉及到多个要素(n个),则对于其中任何两个 要素xi和xj ,都可以按照下面的公式计算。得到多要素的 相关系数矩阵
2.00
62 rs 112(1221)0.993
秩相关系数的检验
表3.1.5 秩相关系数检验的临界值
显著水平α
n
0.05
0.01
显著水平α
n
0.05 0.01
地理数据与地理统计分析
地理数据与地理统计分析地理数据是指通过地理信息系统(GIS)等技术工具采集、整理和存储的与地理位置相关的数据,包括地形地貌、土地利用、城市分布等信息。
地理统计分析则是根据这些地理数据进行定量分析和模型建立,以揭示地理现象的规律与关联。
本文将介绍地理数据的来源和类型,以及地理统计分析的方法和应用。
一、地理数据的来源和类型地理数据的来源多种多样,包括遥感数据、地形数据、卫星影像、人工智能等。
遥感数据通过卫星或飞机传感器获取的观测数据,可以提供关于地表特征、气象信息等的定量数据。
地形数据则是通过激光雷达、水深测量仪等仪器测得的地表高程数据,用于地理地形分析和地貌建模。
卫星影像则是通过卫星拍摄的地球表面图像,可以用于土地利用分类、城市规划等方面的分析研究。
此外,人工智能技术的快速发展也为获取和处理地理数据提供了新的途径。
地理数据的类型也非常丰富,包括点数据、线数据和面数据。
点数据是指地理位置的坐标数据,例如地震发生地点的经纬度;线数据则是指由多个点连接而成的线段数据,例如河流、铁路等;而面数据则是指由多个线围成的面状数据,例如土地利用类型的空间分布。
地理数据的多样性为地理统计分析提供了丰富的对象和数据源。
二、地理统计分析的方法和应用地理统计分析的方法主要包括空间分布分析、空间插值分析和空间相关性分析等。
空间分布分析用于研究地理现象在空间上的分布特征,例如城市人口密度的空间分布;空间插值分析则通过数学方法填补地理数据之间的空缺,以形成连续的地理表面,例如利用高程点数据插值生成地形模型;空间相关性分析则是研究地理现象之间是否存在相关性和空间相互作用的统计方法。
地理统计分析在各个领域都有广泛的应用。
在城市规划领域,可以利用地理数据和统计分析方法研究城市的土地利用结构、人口流动等问题,为城市规划和决策提供科学依据。
在环境保护领域,地理统计分析可以用于监测空气质量、水质污染等环境问题,并根据分析结果制定相应的环境保护策略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章地理系统要素的统计分析地理系统特征和性质通常是通过地理系统数据来表示的。
地理数据可以分为数值数据和非数值数据两大类。
本章主要讨论数值数据的某些处理方法及其地理意义。
地理数据本身还不能直接刻划出地理系统的特性,必须对地理数据进行统计加工,计算要素在时间或空间变化的统计特征数据和反映这种变化规律的统计量。
因为它描述要素的特征,因此又称为描述性统计(descriptive statistics)。
在地理研究中特别重视空间统计的概念。
因为地理系统是地理与地理区域相对应的,即不同等级的系统都有它的空间分布范围,有一定的地域界线。
所以,地理系统特性在区域上有性质的变化,它通常通过空间数据(spatial data)反映出来。
空间数据是反映地理差异的数据。
第一节地理数据类型和地理数据矩阵在计量地理学中,经常要使用和接触许多的数据,这些数据往往能提供大量的、多方面的有用地理信息,据此可以发现和阐明地理系统的特征和规律性。
地理数据是用一定的测度标准去衡量地理要素而取得的地理信息。
不同的测度标准可以产生不同类型的地理数据,它们分别反映地理要素的不同特征。
在统计分析上又往往应用不同的处理技术,因此了解地理数据类型及其测度标准是十分重要的。
地理数据的来源地理数据资料的收集工作是十分重要的,它是统计加工和科学分析的基础。
如果收集的资料计划不周,原始数据不准,往往会给统计分析造成困难,甚至得出错误的结论。
因此,收集地理数据资料,必须保证其完整性和准确性。
当取得大量的地理数据后,必须对这些资料加以汇总和整理,使之系统化、条理化,以便揭示其地理规律。
地理数据的整理工作,大致可分为三步:检查资料、统计分组和绘制图表。
1.检查资料:在整理资料前,首先要对原始资料和所抽取的样本资料进行详细的检查,以保证样本资料的代表性、完整性和准确性。
2.统计分组:地理数据资料经检查后,即可进行分组整理。
正确地选择分组标志是运用分组法的关键。
统计分组就是根据地理事物内部特点和研究任务,按某种标志把自然和社会现象区分出不同类型或性质不同的组。
3.频数分布图表的绘制某组的频数,是指原始地理数据出现在该组内的次数,各组频数的和应等于数据的总和。
频数分布表可分为分组频数分布表和不分组频数分布表。
频数分布图的绘制地理数据可以分为定量数据和定性数据两类。
定性数据又可以称为名义尺度数据。
一.定量地理数据在地理学中有大量问题是可以用数量来表示的。
例如温度、雨量、流量、人口、土地面积、钢铁产量等等,这此都是定量变量,表达定量变量的数据称为定量数据。
(一)间隔尺度数据(interval scale)这种数据是以连续的量来表示地理要素。
根据地理要素的不同性质,它采用不同的度量单位作为标准。
间隔尺度数据是地理数据类型中最常见的一种,一般统计分析方法都以这类数据作为基础。
(二)比例尺度数据(ratio scale)这种数据也是以连续的量来表示地理要素,但它必须事先规定一个基点,这个基点可以是间隔尺度数据的某一个量。
作为基点的量又可以用0或100、1等表示,其它的量换算成为它的比例。
因此,比例尺度数据常常又称为指数或百分比。
在统计分析中,一般可以用于间隔尺度数据的技术也可以用于比例尺度数据。
二.定性地理数据定性数据表示地理现象或要素只有性质上的差异,而没有数量上的变化。
例如,天气可以分成晴、阴,性别可分成男、女,职业可分出工人、职员、教员等,这些变量可称为定性变量。
定性变量在许多地理问题中是很重要的。
表达定性变量的数据,称为定性数据。
定性数据虽然没有数量上的差别,但是通过“数量化方法”,可对一定的地理现象或要素予以“赋值”。
其赋值方法通常采用二分法,即以二元数据0和1来表示,还可用其它方法来表示。
定性数据根据其测度标准分三种:有序数据(ordinal)二元数据名义尺度数据(一)有序数据当测度标准不是用连续的量,而只表示其次序关系的数据,称为有序尺度或等级尺度数据。
它不表示具体的数量是多少,而是给出一个等级或次序。
有序尺度数据的统计分析技术常与间隔尺度数据、比例尺度数据这两种数据的统计分析技术有明显的差别。
(二)二元数据即0-1数据。
它表示地理要素性质,以列成矩阵的0、1变量表示,变量数取地理要素性质类型数据减1,即(N-1)。
通过二元数据矩阵,可以把地理要素的定性数据和定量数据联系起来进行数量分析。
这种方法又称为数量化方法,是二十世纪七十年代以来的数据处理技术。
(三)名义尺度数据(nominal scale)它可以用文字或字符表示,是用以表示地理要素的类型的数据。
它的统计分析技术与间隔尺度数据、有序数据分析技术有显著差别。
地理数据是由定量地理数据或定性地理数据(或其两者)列成的矩阵,其列可以是地理要素的时间或区域单位,反过来其行也可以是地理要素的时间或区域单位。
地理数据和地理数据矩阵是地理系统分析的素材。
在地理系统分析中,首先必须根据分析要求收集或测量、统计地理数据,列成地理数据矩阵。
各种尺度的数据都可以在计算机中存取,按一定的处理技术进行各种操作或运算。
最常用的仍然是二维的地理数据矩阵。
在考虑时间时,只是把每一时段视为一个文件来处理。
第二节地理调查中抽样方案的设计为了准确、及时、全面、经济地搜集统计分析所需的原始资料,应根据不同的调查对象和调查目的,选用各种不同的调查方式。
地理要素的调查对象比较复杂,对其进行的调查,一般均采用非全面调查(抽取部分重点、重要的要素),而不采用全面调查(全部要素)。
许多地理要素的数据可以从统计主管机构收集,但除了这些系统统计数据外,根据地理研究工作的需要,进行一定范围内的路线或区域的典型调查是常用的方法。
这种典型调查往往属于抽样调查。
因此,抽样方案的设计、典型样本个数的确定及数据分组等对地理分析的质量有显著影响。
一.地理调查中抽样方案的设计典型调查中可以采用下述几种不同特点的抽样方案:典型调查的抽样方案1.随机抽样把地理调查单位编码,利用随机数据表或随机函数确定典型调查样本。
2.机械抽样对编码后的地理调查单位按照固定的间隔确定为典型样本。
3.分组随机抽样和分组机械抽样这种抽样方法是先把全部地理调查单位按其性质差异分成若干组,然后再进行随机抽样或机械抽样。
二.调查样本规模的计算当地理要素的平均状态由典型调查确定时,必须考虑有多少个典型调查单位才能代表总体,这种能代表总体的抽样个数称为样本规模。
样本规模与我们选取的可信度要求和标准误差、对要素数值作估计所要求的精度有关。
在抽样的必要样本个数计算中,我们都是采用重复抽样计算公式。
这样做,计算简便,所得的样本数大于重复抽样计算公式所得的结果。
因此,对调查精度不会有影响。
在实际地理调查中,典型样本抽取的个数以及样本标准差S的计算时,抽取的样本数都涉及工作所允许的人力、物力、财力的限度,必须根据工作量和实际可能作适当的平衡。
三.数据分组数确定在确定了典型调查所必须的样本规模并得到各样本的数据后,在进一步分析数据之前,还要考虑这些样本应分为多少组为宜。
因为分组数不同,可能会得出不同的分析结果。
在调查样本较多的情况下,要素的数值多接近于正态分布,这时,样本规模N与分组数K应满足渐近的最优关系。
在确定了抽样方案、样本规模及其适当的分组数之后,我们就可以进行进一步的分析。
第三节地理数据统计特征值一.频数与频率我们所利用的统计资料,往往是一组数值或几组数值,这些数值是地理系统要素的数量表现,我们称这种数值为变量。
在地理系统分析中,变量是指随时间或空间而变化的某种要素或几种要素的数量特征。
这些数据一般都是间隔尺度数据或比例尺度数据。
1.频数与频数分布直方图把变量按大小顺序依次排列,并按一定的间距进行分组。
变量在各组出现或发生的次数,称为频数。
频数分布直方图就是表示频数分布状况的统计图。
相对频数和相对频数分布表相对频数分布直方图相对频数分布曲线2.频数或频率分布表、分布直方图是分析地理要素以及表示这种特征的方法,这种方法可以应用于许多问题的分析和表示。
二.平均值、数学期望、中数和众数1.平均值或平均数反映随机变量取值的集中位置,用以表示地理要素在时间或空间分布上的集中位置。
2.数学期望数学期望在数理统计是有严格的定义,在应用时,往往就把加权平均数称为数学期望,通常以E表示,有时也用M表示。
其中,权数就是地理要素出现的频率。
显然,数学期望就等于变量数值分别乘以其出现的频率,然后求和。
如果权数不等于频率,就称为加权平均数。
3.中数中数表明一种地理要素可能以大于等于1/2的概率出现时的数值,这对分析地理问题是有意义的。
4.众数众数就是有最大可能出现的数值。
众数可能不是唯一的。
以上各种统计特征数,都是用来表示地理现象的数值表现的集中位置,用不同的统计量描画不同类型的集中位置。
三.极差、离差、方差与标准差、变差系数在分析地理数据时,不但要找出它的集中位置,而且也要查明这些数据的离散程度,即它们对于中心位置的离散程度,还需要分析它们的变化范围。
1.极差一种地理要素的数值,其最大值与最小值的差值称为极差,它表示这个地理要素的取值范围。
2.离差与离差平方和离差表示各数值与其平均值的离散程度,用d表示。
d = x i- x离差平方和d2 = ∑(x i- x)23.方差、均方差、标准差方差是均方差的简称,它是以离差平方和除以变量个数而得到的。
标准差б则是对方差开平方所得。
4.变差系数变差系数也称变异系数,用它来衡量地理要素在时间与空间上的相对变化(波动)的程度。
C v = (S/X)×100%式中:s-标准差第四节地理要素的分布特征参数及其计算地理要素在时间和空间的分布特征可以用概率分布函数来描述。
概率分布函数的一阶导数称为概率密度,或称密度函数。
密度函数的特征参数称为分布特征参数,常用偏度系数和峰度系数来衡量分布特征。
一.地理要素的分布特征参数1.标准偏度系数(g1)标准偏度系数即三阶中心矩,它表示要素分布的不对称性。
2.标准峰度系数(g2)用四阶中心矩可以表示密度函数的凸平度,其含意是地理要素的时间、空间分布在均值附近的集中程度,称为标准峰度系数。
二.相关特征参数的计算要素本身在时间上或空间上的相关,称为时间或空间自相关。
两个要素之间的相关程度可以用相关系数测度;要素在时间顺序上或空间顺序上的相关,则可以用线性时关系数测度。
1.线性相关系数(空间或时间自相关)线性相关系数用以分析在区域(或时段)1,2,…,K内地理系统要素是否存在线性相关关系。
2.线性时关系数线性时关系数是描述要素数值与其顺序之间关系的统计量,这种顺序可以是时间顺序或空间顺序。
3.两要素间的相关系数两个地理系统要素在区域或时间分布上有线性相关关系由相关系数给出。
如果考察地理系统中一一对应的相关系数,则形成相关关系矩阵,这在地理研究中应用广泛。