空间插值克里金内插法半方差计算规则分布点
克里格空间插值法

1.7 区域变量
在有趋势的情况下,假设数据是弱平稳的,并假设对于 所有的h,增量Z(x)-Z(x+h)的方差是有限的,而且只 是相隔h的函数。在该假设成立的情况下,定义半方差为:
其中,n是相隔距离为h的样点对的个数。将r(h)和h 作为纵、横坐标作图即可获得实验半方差函数图(图 7.10)。实验方差函数图不受数据的非平稳性影响,是空 间变异性研究中的一个有力工具,也是区域变量定量描述 的第一步。
1.8 方差变异函数
2)曲线从较低的方差值升高,到一定的间隔值时 到达基台值,这一间隔称为变程(range)。在理 论函数模型中,变程用a表示。 变程是半方差函数中最重要的参数,它描述 了该间隔内样点的空间相关特征。在变程内,样 点越接近,两点之间相似性、即空间上的相关性 越强。很明显,如果某点与已知点距离大于变程, 那么该点数据不能用于数据内插(或外推),因 为空间上的自相关性不复存在。 变程的高低取决于观测的尺度,说明了相互 作用所影响的范围。不同的属性,其变程值可以 变化很大。
空间插值分析是将离散点的测量数据转 换为连续的数据曲面的方法。其作用是便于 与其它空间现象的分布模式进行比较。 空间插值的理论假设是空间位置上越靠 近的点,越可能具有相似的特征值;而距离 越远的点,其特征值相似的可能性越小。
1.1空间插值法简述
空间插值法包括了空间内插和外推两种算法 1 内插算法是一种通过已知点的数据推 求同一区域其它未知点数据的计算方法; 2 空间外推算法则是通过已知区域的数 据,推求其它区域数据的方法
1.8 方差变异函数
图 典型试验方差函数和拟合曲线
1.9理论变异函数模型
1.线性模型(Linear model_)
空间插值方法汇总

空间插值方法汇总Inverse Distance to a Power(反距离加权插值法)Kriging(克里金插值法)Minimum Curvature(最小曲率)Modified Shepard's Method(改进谢别德法)Natural Neighbor(自然邻点插值法)Nearest Neighbor(最近邻点插值法)Polynomial Regression(多元回归法)Radial Basis Function(径向基函数法)Triangulation with Linear Interpolation(线性插值三角网法)Moving Average(移动平均法)Local Polynomial(局部多项式法)1、距离倒数乘方法距离倒数乘方格网化方法是一个加权平均插值法,可以进行确切的或者圆滑的方式插值。
方次参数控制着权系数如何随着离开一个格网结点距离的增加而下降。
对于一个较大的方次,较近的数据点被给定一个较高的权重份额,对于一个较小的方次,权重比较均匀地分配给各数据点。
计算一个格网结点时给予一个特定数据点的权值与指定方次的从结点到观测点的该结点被赋予距离倒数成比例。
当计算一个格网结点时,配给的权重是一个分数,所有权重的总和等于1.0。
当一个观测点与一个格网结点重合时,该观测点被给予一个实际为 1.0 的权重,所有其它观测点被给予一个几乎为 0.0 的权重。
换言之,该结点被赋给与观测点一致的值。
这就是一个准确插值。
距离倒数法的特征之一是要在格网区域内产生围绕观测点位置的"牛眼"。
用距离倒数格网化时可以指定一个圆滑参数。
大于零的圆滑参数保证,对于一个特定的结点,没有哪个观测点被赋予全部的权值,即使观测点与该结点重合也是如此。
圆滑参数通过修匀已被插值的格网来降低"牛眼"影响。
2、克里金法克里金法是一种在许多领域都很有用的地质统计格网化方法。
空间插值算法-克里金算法

克里格法(Kriging)是地统计学的主要内容之一,从统计意义上说,是从变量相关性和变异性出发,在有限区域内对区域化变量的取值进行无偏、最优估计的一种方法;从插值角度讲是对空间分布的数据求线性最优、无偏内插估计一种方法。
克里格法的适用条件是区域化变量存在空间相关性。
克里格法,基本包括普通克里格方法(对点估计的点克里格法和对块估计的块段克里格法)、泛克里格法、协同克里格法、对数正态克里格法、指示克里格法、折取克里格法等等。
随着克里格法与其它学科的渗透,形成了一些边缘学科,发展了一些新的克里金方法。
如与分形的结合,发展了分形克里金法;与三角函数的结合,发展了三角克里金法;与模糊理论的结合,发展了模糊克里金法等等。
应用克里格法首先要明确三个重要的概念。
一是区域化变量;二是协方差函数,三是变异函数一、区域化变量当一个变量呈空间分布时,就称之为区域化变量。
这种变量反映了空间某种属性的分布特征。
矿产、地质、海洋、土壤、气象、水文、生态、温度、浓度等领域都具有某种空间属性。
区域化变量具有双重性,在观测前区域化变量Z(X)是一个随机场,观测后是一个确定的空间点函数值。
区域化变量具有两个重要的特征。
一是区域化变量Z(X)是一个随机函数,它具有局部的、随机的、异常的特征;其次是区域化变量具有一般的或平均的结构性质,即变量在点X与偏离空间距离为h的点X+h 处的随机量Z(X)与Z(X+h)具有某种程度的自相关,而且这种自相关性依赖于两点间的距离h与变量特征。
在某种意义上说这就是区域化变量的结构性特征。
二、协方差函数协方差又称半方差,是用来描述区域化随机变量之间的差异的参数。
在概率理论中,随机向量X与Y 的协方差被定义为:区域化变量在空间点x和x+h处的两个随机变量Z(x)和Z(x+h)的二阶混合中心矩定义为Z(x)的自协方差函数,即区域化变量Z(x) 的自协方差函数也简称为协方差函数。
一般来说,它是一个依赖于空间点x 和向量h 的函数。
空间插值方法大致总结

前段时间要对气象要素进行插值,翻看了多种方法,做了个PPT报告.对每个方法有简单的介绍极一些总结,不一定都是个人看法,参考了多方书面(sufer,ArcGIS应用教程)以及坛子里,百度上等搜到的资料的看后笔记,有些注了出处有些忘了.截图共享下,也不知有用没用.有错的地方请跟贴指正,谢谢啦!--------------------------------所谓空间数据插值,即通过探寻收集到的样点/样方数据的规律,外推/内插到整个研究区域为面数据的方法.即根据已知区域的数据求算待估区域值, 影响插值精度的主要因素就是插值法的选取空间数据插值方法的基本原理:任何一种空间数据插值法都是基于空间相关性的基础上进行的。
即空间位置上越靠近,则事物或现象就越相似, 空间位置越远,则越相异或者越不相关,体现了事物/现象对空间位置的依赖关系。
(/dky/nb/page/2000-3-3/2000332117262480.htm,南京师范大学地理科学学院地理信息系统专业网络课程教程)➢由于经典统计建模通常要求因变量是纯随机独立变量,而空间插值则要求插值变量具备某种程度的空间自相关性的具随机性和结构性的区域化变量。
即区域内部是随机的,与位置无关的,而在整体的空间分布上又是有一定的规律可循的,这也是不宜用简单的统计分析方法进行插值预估的原因。
从而空间统计学应用而生。
➢无论用哪种插值方法,根据统计学假设可知,样本点越多越好,而样本的分布越均匀越好。
常用的空间数据插值方法之一:趋势面分析⏹趋势面分析(Trend analyst)。
严格来说趋势面分析并不是在一种空间数据插值法。
它是根据采样点的地理坐标X,Y值与样点的属性Z值建立多元回归模型,前提假设是,Z值是独立变量且呈正态分布,其回归误差与位置无关。
⏹根据自行设置的参数可建立线性、二次…或n次多项式回归模型,从而得到不同的拟合平面,可以是平面,亦可以是曲面。
精度以最小二乘法进行验证。
空间插值分析课件

26
3.距离反比法
反距离加权法(IDW)的一个改进
? ---按方位取点!
27
空间插值分析
概述 最近邻法 距离反比法 趋势面法 样条法 克里金法 精度评定及方法选择
28
4.趋势面法
趋势面法分析
把实际的地理曲面分解为趋势面和剩余面两部分,具体地 ,趋势面法将样本点的实测点Zi变换分解为两部分,表达 为:
5m-10m的间隔下的半方差图
41
6.克里金法
半变率图的组成
块金值(c0,Nuddget): 当h = 0时
的非零变率,由不可解释的原因
引起 ;
空间自相关部分:C/(c0+c)
基台值(c0+c;sill): 半变率曲线变 平缓时的变率值,表明在某个距 离上样本点不再存在相关性,通 常等于数据集的方差;
缺点
高次多项式在数据区外围产生异常高值或低值; 空间采样选择会影响结果。
32
4.趋势面法
趋势面法的实际应用
1998年全国年平均降水数据
趋势面法插值结果
33
空间插值分析
概述 最近邻法 距离反比法 趋势面法 样条法 克里金法 精度评定及方法选择
34
5.样条法
样条法原理
样条插值的目标就是寻找一
近似插值:插值产生的曲面不通过所有观测点。
当数据存在不确定性时,应该使用近似插值,由于估计值替代 了已知变量值,近似插值可以平滑采样误差。
10
空间插值分析
概述 最近邻法 距离反比法 趋势面法 样条法 克里金法 精度评定及方法选择
11
2.最近邻法
基本原理
最近邻点法由A. H. Thiessen提出,又叫泰森多边形方法。 它采用一种极端的边界内插方法,即只用最近的单个点进
空间插值介绍简洁明了

一、最近邻法(Nearest Neighbor)
• 最近邻点法又叫泰森多边形方法。它采用一种极端的边界内 插方法—只用最近的单个点进行区域插值(区域赋值)。 • 泰森多边形按数据点位置将区域分割成子区域,每个子区域 包含一个数据点,各子区域到其内数据点的距离小于任何到 其它数据点的距离,并用其内数据点进行赋值。
(2)“实际”验证
将部分已知变量值的样本点作为“训练数据集”,用于插值 计算;另一部分样点 “验证数据集”,该部分站点不参加 插值计算。然后利用“训练数据集” 样点进行内插,插值 结果与“训练数据集”验证样点的观测值对比,比较插值的 效果。
插值方法
1. 最近邻法(Nearest Neighbor) 2. 算术平均值(Arithmetic Mean) 3. 距离反比法(Inverse Distance) 4. 高次曲面插值(Multiquadric) 5. 趋势面插值(Polynomial) 6. 最优插值(Optimal) 7. 样条插值(Spline Surface) 8. 径向基函数插值(Radial Basis Functions) 9. 克里金插值(Kriging) 10. 最小曲率 (Minimum Curvature)
四、高次曲面插值 (Multiquadric)
高次曲面插值由 Hardy 于1971年首先提出,随后应用于不同的 学科。每个样点对插值点的影响都用样点坐标函数构成的圆锥表 示,插值点的变量值是所有圆锥贡献值的总和(Caruso,1998)。 插值数学表达式为:
ve ci d ei
i 1
其中ci 是样本点(xi,yi)的系数,dei是待估点(xe, ye)与样 本点(xi, yi)的距离。
• 反距离权重插值综合了泰森多边形的自然邻近法和多元回归渐变 方法的长处,在插值时为待估点Z值为邻近区域内所有数据点都 的距离加权平均值,当有各向异性时,还要考虑方向权重。 • 权重函数与待估点到样点间的距离的U次幂成反比,即随着距离 增大,权重呈幂函数递减。且对某待估点而言,其所有邻域的样 点数的权重和为1。 • 决定反距离权重插值法结果的参数包括距离的U次幂值的确定, 同时还取决于确定邻近区域的所使用的方法。此外,为消除样点 数据的不均匀分布的影响,还可设置引入一个平滑参数,以保证 没有哪个样点被赋予全部的权重,即使得插值运算时尽可能不只 有一个样点参与运算。 • IDW是一种全局插值法,即全部样点都参与某一待估点的Z值的 估算; • IDW的适用于呈均匀分布且密集程度足以反映局部差异的样点数 据集; • IDW与之前介绍的插值法的不同之处在于,它是一种精确的插值 法,即插值生成的表面中预测的样点值与实测样点值完全相等。
克里金插值-Kriging插值-空间统计-空间分析

克里金插值方法-Kriging 插值-空间统计-空间分析1.1 Kriging 插值克里金插值(Kriging 插值)又称为地统计学,是以空间自相关为前提,以区域化变量理论为基础,以变异函数为主要工具的一种空间插值方法。
克里金插值的实质是利用区域化变量的原始数据和变异函数的结构特点,对未采样点的区域化变量的取值进行线性无偏、最优估计。
克里金插值包括普通克里金插值、泛克里金插值、指示克里金插值、简单克里金插值、协同克里金插值等,其中普通克里金插值是最为常用的克里金插值方法。
以下介绍普通克里金插值的原理。
包括普通克里金方法在内的各种克里金插值方法的使用前提是空间数据存在着显著的空间相关性。
判断数据空间相关性是否显著的工具是半变异函数(semi-variogram ),该函数以任意两个样本点之间的距离h 为自变量,在h 给定的条件下,其函数值估计方法如下:2||||1()[()()]2()i j i j s s h h z s z s N h γ-==-∑其中()N h 是距离为h 的样本点对的个数。
()h γ最大值与最小值的差m a x m i n γγ-可以度量空间相关性的强度。
max min γγ-越大,空间相关性越强。
如果()h γ是常数,即max min 0γγ-=,则说明无论样本点之间的距离是多少,样本点之间的差异不变,也就是说样本点上的值与其周围样本点的值无关。
在实际操作中,会取一些离散的h 值,当||s s ||i j -接近某个h 时,即视为||||i j s s h -=。
然后会通过这些离散点拟合成连续的半变异函数。
拟合函数的形式有球状、指数、高斯等。
在数据存在显著的空间相关性的前提下,可以采用普通克里金方法估计未知点上的值。
普通克里金方法的基本公式如下:01ˆ()()()n i ii Z s w s Z s ==∑普通克里金方法的基本思想是:通过调整i s 的权重()i w s ,使未知点的估计值0ˆ()Z s 满足两个要求:1.0ˆ()Z s 是无偏估计,即估计误差的期望值为0,2.估计误差的方差达到最小。
第六讲 空间插值

每个采样点对插值结果的影响随距离增加而减弱,因 此距目标点近的样点赋予的权重较大。
n
a ttr0 a ttri * w i i1
wi
1 pow er (D isti )n
n
1 pow er(D isti )n
i1
二、空间插值方法
4. 距离反比加权法—参数对插值结果的影响
权重的影响
权重过高,较近点的影响较大,拟合表面更细致(不光 滑);
趋势面分析的一个基本要求就是,所选择的趋势面模型应 该是剩余值最小,而趋势值最大,这样拟合度精确度才能 达到足够的准确性;
在数学上,拟合数学曲面要注意两个问题:一是数学曲面 类型(数学表达式)的确定,二是拟合精度的确定。
二、空间插值方法
5.1 趋势面模型的建立
设地理要素的实际观测数据为Zi(xi,yi)(i=1,2,…,n),
基本内容
空间插值:定义及应用 空间插值方法及特征
泰森多边形( Voronoi )及不规则三角网(TIN) 距离反比加权法(IDW) 地质统计学(Geostatistics)
利用样条曲线优化插值结果 插值精度评估 三参数插值方法(体数据或者动态演化特征)
为何进行插值?
1. 2D离散点转化为连续面,如地表、地层界面 如基于空间离散点,剖面数据和等高线等来构建连续
不足——对权重函数的选择十分敏感;易受数据点集群的 影响,结果常出现一种孤立点数据明显高于周围数据点的 “鸭蛋”分布模式;
全局最大和最小变量值都散布于数据之中。 距离反比很少有预测的特点,内插得到的插值点数据在样
点数据取值范围内。
二、空间插值方法
5. 趋势面分析
实际的地理曲面分解为趋势面和剩余面两部分,前者反应 地理要素的宏观分布规律,属于确定性因素作用的结果; 而后者则对应于微观区域,被认为是随机因素影响的结果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
空间统计分析
趋势分析
8
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
空间统计分析协方差Fra bibliotek图半方差/变异函数云图
9
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
空间统计分析
四、分布密度——单位分布区域内分布对象的数量,针对的是离散分布数据
5
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
空间统计分析
三、属性数据的离散特征数——描述数据集的离散程度,相对于中心位置的程度
1、极差:是一组数据中最大值与最小值之差;
2、离差,平均离差与离差平方: 1)离差:一组数据中的各数据值与平均数之差; 2)平均离差:将离差取绝对值,然后求和,再取平均数; 3)离差平方:离差求平方和; 平均离差和离差平方和是表示各数值相对于平均数的离散程度的重要统计量。 3、 方差与标准差 1) 方差: 是均方差的简称,是以离差平方和除以变量个数求得的,记为σ2;
空间统计分析
一、统计图表分析
柱状图
扇形图
直方图
折线图
散点图
统计图能被用户直观地观察和理解数据。 统计表格是详尽地表示非空间数据的方法,不直观,但可提供详细数据,便于对数据进行再处理。
4
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
空间统计分析
二、属性数据的集中特征数----找出数据分布的集中位置
求解 1、使用Jacobi矩阵计算特征值和特征向量 2、找出几个较大的特征值所对应的特征向量
13
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
空间统计分析
关键变量分析
利用变量之间的相似系数建立变量之间的相关矩阵,通过用户所确定的阀值,从变 量中找出一定数量的关联独立变量,进而消除其他冗余变量。
地理信息系统
——GIS空间统计分析
主讲教师:胡嘉骢
不 动 产 学 院 2007-04
BNUEP
地 理 信 息 系 统
空间分析类型
基本的空间分析包括:
空间查询 空间量算 缓冲区分析 叠置分析 网络分析 空间统计分析 空间插值 地形分析 空间分析模型 简单的空间分析
10
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
空间统计分析
均值计算误区:平均密度
区域 1 2 3 4 5 人口 50 100 80 75 60 面积 人口密度 100 180 70 90 200 0.5 0.56 1.14 0.83 0.3
方法一、 ∑人口密度/5=0.666 方法二、 ∑人口/ ∑总面积=0.57 哪一个对? 如何计算区域平均人口?
相似系数的计算
rij
相关系数矩阵
(x
k 1
n
ki xi )( xkj x j ) n
(x
k 1
n
2 2 x ) ( x x ) ki i kj j k 1
Rnm
1 r 21 ri1 rn1
对 1 rn 2 1 rij rn 3 1 称
11
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
空间统计分析
多变量统计分析
为什么要进行多变量统计分析? 数据类型繁多 模型构建困难 数据库负担 运算复杂 特性:数据之间相互关联 目的:简化数据 多变量统计分析主要方法 主成分分析 主因子分析 关键变量分析 变量聚类分析
复杂的空间分析
面向应用的空间分析
2
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
空间统计分析 空间统计分析的目的:
空间数据的直观、综合评价 空间数据的主要特征和内在联系 空间数据的分类和评价
3
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
12
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
空间统计分析
主成分分析
通过数理统计分析,求得各变量之间的线性关系表达式,进而将众多的变量信息压 缩表达成具有若干代表性的合成变量,克服变量选择时的冗余和相关,然后选择信 息最丰富的因子进行各种分析和模型构建。
数学函数
2)标准差:标准差是方差的平方根;
4、变差系数:用来衡量数据在时间和空间上的相对变化的程度,它 是无量纲的量。为标准差除以平均数取百分。
6
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
空间统计分析
直方图
7
GIS空间查询与分析
2007-04
胡 嘉 骢
BNUEP
地 理 信 息 系 统
a11 a12 a1m x1 x11 x12 x1m a x a a x x 21 22 2 m x2 21 22 2m X Z 1 p , p m a a a pm xn1 xn 2 xnm p1 p 2 xm
1、频数和频率 将变量xi(i=1,2,…,n)按大小顺序排列,并按一定的间距分组。
频数:变量在各组出现或发生的次数;
频率:各组频数与总频数之比; 用以表示事件出现的次数和频率,事件的分布状况。 2、平均数:反映了数据取值的集中位置,通常有简单算术平均数和加权算术平均数。 3、数学期望:反映数据分布的集中趋势。 4、中数:有序数据集中出现频率占半数的数据值。 5、众数:众数是具有最大可能出现的数值。