地理加权回归模型介绍
地理加权回归模型结果解读

地理加权回归模型结果解读
地理加权回归(GWR)模型是一种用于分析空间数据的空间统计方法,它通过引入地理位置权重来揭示自变量与因变量之间的局部关系。
与传统的全局回归模型相比,GWR模型可以更好地揭示空间异质性和局部关系。
下面是对GWR模型结果的解读:
1. 模型参数:GWR模型结果中,最主要的参数是带宽(Bandwidth)。
带宽用于确定邻近地区的范围,带宽的选择会影响模型的预测精度。
合适的带宽可以使得模型结果更接近真实情况,反映出局部关系。
2. 系数估计:GWR模型结果中,各解释变量的系数会随着地理位置的变化而变化。
系数的大小反映了自变量对因变量的影响程度,正值表示正相关,负值表示负相关。
通过分析系数的变化,可以了解不同地理位置下自变量对因变量的影响。
3. 残差分析:GWR模型的残差是观测值与模型预测值之间的差异。
残差的空间分布可以反映出模型是否能够较好地拟合数据,如果残差在空间上呈现随机分布,说明模型的预测效果较好。
4. 空间异质性:GWR模型可以揭示空间异质性,即地理位置对模型结果的影响。
通过分析模型结果,可以了解不同地理位置下自变量与因变量之间的关系,以及空间异质性的存在。
5. 模型评价:GWR模型的评价指标主要包括决定系数(R²)、赤池信息准则(AIC)等。
这些指标可以用来评价模型的拟合效果和预测能力。
总之,在解读GWR模型结果时,要结合具体问题和数据特点进行分析,避免对模型结果的误解。
同时,在实际应用中,需要根据实际情况选择合适的带宽,以获得更好的模型效果。
地理加权回归模型介绍

第三章地理加权回归模型介绍3.1 基本模型在地学空间分析中,n组观测数据通常是在n个不同地理位置上获取的样本数据,全局空间回归模型就是假定回归参数与样本数据的地理位置无关,或者说在整个空间研究区域内保持稳定一致,那么在n个不同地理位置上获取的样本数据,就等同于在同一地理位置上获取的n个样本数据,其回归模型与最小二乘法回归模型相同,采用最小二乘估计得到的回归参数户既是该点的最优无偏估计,也是研究区域内所有点上的最优无偏估计。
而在实际问题研究中我们经常发现回归参数在不同地理位置上往往表现为不同,也就是说回归参数随地理位置变化,这时如果仍然采用全局空间回归模型,得到的回归参数估计将是回归参数在整个研究区域内的平均值,不能反映回归参数的真实空间特征。
为了解决这一问题,国外有些学者提出了空间变参数回归模型(Spatially Varying-Coeffi Cient Regression Model)(Fosterand Gorr,1986;Gorrand Olligschlaeger,1994),将数据的空间结构嵌入回归模型中,使回归参数变成观测点地理位置的函数。
Fortheringham等(Brunsdonetal,1996;Fortheringham et al,1997;Brunsdon et al,1998)在空间变系数回归模型基础上利用局部光滑思想,提出了地理加权回归模型(Geographieally Weighted Regression Model-GWR)。
地理加权回归模型(GWR)是对普通线性回归模型(OLR)的扩展,将样点数据的地理位置嵌入到回归参数之中,即:式中:(u i,v i)为第i个样点的坐标(如经纬度);βk(u i,v i)是第i个样点的第k个回归参数;i是第i个样点的随机误差。
为了表述方便,我们将上式简写为:若,则地理加权回归模型(GWR)就退变为普通线性回归模型(OLR)。
地理加权回归模型介绍

第三章地理加权回归模型介绍3.1 基本模型在地学空间分析中,n组观测数据通常是在n个不同地理位置上获取的样本数据,全局空间回归模型就是假定回归参数与样本数据的地理位置无关,或者说在整个空间研究区域内保持稳定一致,那么在n个不同地理位置上获取的样本数据,就等同于在同一地理位置上获取的n个样本数据,其回归模型与最小二乘法回归模型相同,采用最小二乘估计得到的回归参数户既是该点的最优无偏估计,也是研究区域内所有点上的最优无偏估计。
而在实际问题研究中我们经常发现回归参数在不同地理位置上往往表现为不同,也就是说回归参数随地理位置变化,这时如果仍然采用全局空间回归模型,得到的回归参数估计将是回归参数在整个研究区域内的平均值,不能反映回归参数的真实空间特征。
为了解决这一问题,国外有些学者提出了空间变参数回归模型(Spatially Varying-Coeffi Cient Regression Model)(Fosterand Gorr,1986; Gorrand Olligschlaeger,1994),将数据的空间结构嵌入回归模型中,使回归参数变成观测点地理位置的函数。
Fortheringham等(Brunsdonetal,1996;Fortheringham et al,1997;Brunsdon et al,1998)在空间变系数回归模型基础上利用局部光滑思想,提出了地理加权回归模型(Geographieally Weighted Regression Model-GWR)。
地理加权回归模型(GWR)是对普通线性回归模型(OLR)的扩展,将样点数据的地理位置嵌入到回归参数之中,即:式中:(u i,v i)为第i个样点的坐标(如经纬度);βk(u i,v i)是第i个样点的第k个回归参数;εi是第i个样点的随机误差。
为了表述方便,我们将上式简写为:若β1k=β2k=⋯=βnk,则地理加权回归模型(GWR)就退变为普通线性回归模型(OLR)。
地理加权回归模型gwr结果解读

地理加权回归模型gwr结果解读地理加权回归模型(GWR)是一种用于分析空间数据的统计方法。
它结合了回归分析和地理加权技术,通过考虑地理位置的影响来解释和预测变量之间的关系。
以下是对GWR结果的解读。
GWR模型的输出主要包括回归系数、标准误差、t值和p值。
回归系数表示变量之间的影响关系,标准误差衡量了该系数的可靠性,t值用于检验回归系数是否显著,p值表示显著性水平。
在解读GWR结果时,首先要关注各个变量的回归系数。
正系数表示变量对因变量的增加有正向影响,负系数则表示反向影响。
系数的大小表示了该变量对因变量的贡献程度,绝对值越大表示影响越显著。
比较不同变量的系数可以帮助确定哪些变量对因变量的影响最大。
其次,标准误差可以用于衡量回归系数的可靠性。
较小的标准误差意味着系数估计更精确,较大的标准误差则表示估计的不确定性较高。
因此,在解读GWR结果时,可比较不同变量的标准误差,并根据其大小判断变量系数的可靠程度。
t值和p值用于判断变量的显著性。
较大的t值表明在该空间位置上,变量对因变量的影响具有统计显著性。
通常,当t值的绝对值大于1.96时,可以认为该变量是显著的。
相应的,p值小于0.05或0.01时可认为结果具有显著性。
最后,需要关注空间异质性。
GWR模型能够考虑地理位置对变量关系的影响,因此,结果会显示出各个地理位置的异质性。
可以通过观察不同地理位置上模型的回归系数和显著性来了解这种异质性。
如果不同地理位置上的回归系数存在较大差异,或者某些位置上的回归系数与总体模型的系数相反,说明存在空间异质性。
总结来说,解读GWR结果时要关注回归系数、标准误差、t值和p值,并考虑空间异质性。
这将有助于理解变量之间的关系以及地理位置对模型的影响。
使用地理加权回归模型探索空间异质性的R包

使用地理加权回归模型探索空间异质性的R包地理加权回归(Geographically Weighted Regression,GWR)是一种用于探索空间异质性的地理统计方法。
在传统的回归模型中,假设自变量与因变量之间的关系是全局一致的。
然而,在现实世界中,地理空间中的数据通常存在空间异质性,即自变量与因变量之间的关系在不同地理区域可能不同。
地理加权回归通过引入空间权重矩阵,将回归模型在空间上进行局部适应,从而能够更好地探索空间异质性。
R语言提供了多种用于地理加权回归模型的包,以下是其中几个常用的包:1. `spgwr`包:这是一个基于`sp`(Spatial)包构建的地理加权回归模型包。
它提供了多种地理加权回归方法,包括全局自相关模型、局部自相关模型等。
使用该包可以方便地进行地理加权回归模型的估计、评估和可视化。
2. `gdistance`包:这个包提供了一些用于计算地理空间距离的函数,可以方便地计算地理空间权重矩阵。
该包还提供了一些函数用于建立地理加权回归模型。
3. `GWmodel`包:这是一个用于地理加权回归模型的完整工具箱。
它提供了丰富的函数用于数据预处理、地理加权回归模型的估计和评估等。
此外,该包还提供了一些用于模型诊断和可视化的函数。
使用地理加权回归模型可以比传统回归模型更好地探索空间异质性。
通过估计每个地理区域的回归参数,可以得到在不同地理位置上自变量与因变量之间的局部关系。
此外,地理加权回归模型还可以用于预测和解释空间中的数据。
例如,可以利用地理加权回归模型来预测一个地理位置上的因变量值,或者用于解释一些地理区域内自变量与因变量之间的关系。
总之,地理加权回归模型是一种用于探索空间异质性的强大工具。
R 语言提供了多个包用于实现地理加权回归模型,可以方便地进行模型的估计、评估和可视化。
使用地理加权回归模型可以更好地探索自变量与因变量之间的空间关系,并在预测和解释空间数据方面提供有力的支持。
地理加权回归模型介绍

第三章地理加权回归模型介绍基本模型在地学空间分析中,n组观测数据通常是在n个不同地理位置上获取的样本数据,全局空间回归模型就是假定回归参数与样本数据的地理位置无关,或者说在整个空间研究区域内保持稳定一致,那么在n个不同地理位置上获取的样本数据,就等同于在同一地理位置上获取的n个样本数据,其回归模型与最小二乘法回归模型相同,采用最小二乘估计得到的回归参数户既是该点的最优无偏估计,也是研究区域内所有点上的最优无偏估计。
而在实际问题研究中我们经常发现回归参数在不同地理位置上往往表现为不同,也就是说回归参数随地理位置变化,这时如果仍然采用全局空间回归模型,得到的回归参数估计将是回归参数在整个研究区域内的平均值,不能反映回归参数的真实空间特征。
为了解决这一问题,国外有些学者提出了空间变参数回归模型(Spatially Varying-Coeffi Cient Regression Model)(Fosterand Gorr,1986; Gorrand Olligschlaeger,1994),将数据的空间结构嵌入回归模型中,使回归参数变成观测点地理位置的函数。
Fortheringham等(Brunsdonetal,1996;Fortheringham et al,1997;Brunsdon et al,1998)在空间变系数回归模型基础上利用局部光滑思想,提出了地理加权回归模型(Geographieally Weighted Regression Model-GWR)。
地理加权回归模型(GWR)是对普通线性回归模型(OLR)的扩展,将样点数据的地理位置嵌入到回归参数之中,即:式中:(u i,v i)为第i个样点的坐标(如经纬度);βk(u i,v i)是第i个样点的第k个回归参数;εi是第i个样点的随机误差。
为了表述方便,我们将上式简写为:若β1k=β2k=⋯=βnk,则地理加权回归模型(GWR)就退变为普通线性回归模型(OLR)。
地理加权回归模型介绍

第三章地理加权回归模型介绍3.1 基本模型在地学空间分析中,n组观测数据通常是在n个不同地理位置上获取的样本数据,全局空间回归模型就是假定回归参数与样本数据的地理位置无关,或者说在整个空间研究区域内保持稳定一致,那么在n个不同地理位置上获取的样本数据,就等同于在同一地理位置上获取的n个样本数据,其回归模型与最小二乘法回归模型相同,采用最小二乘估计得到的回归参数户既是该点的最优无偏估计,也是研究区域内所有点上的最优无偏估计。
而在实际问题研究中我们经常发现回归参数在不同地理位置上往往表现为不同,也就是说回归参数随地理位置变化,这时如果仍然采用全局空间回归模型,得到的回归参数估计将是回归参数在整个研究区域内的平均值,不能反映回归参数的真实空间特征。
为了解决这一问题,国外有些学者提出了空间变参数回归模型(Spatially Varying-Coeffi Cient Regression Model)(Fosterand Gorr,1986; Gorrand Olligschlaeger,1994),将数据的空间结构嵌入回归模型中,使回归参数变成观测点地理位置的函数。
Fortheringham等(Brunsdonetal,1996;Fortheringham et al,1997;Brunsdon et al,1998)在空间变系数回归模型基础上利用局部光滑思想,提出了地理加权回归模型(Geographieally Weighted Regression Model-GWR)。
地理加权回归模型(GWR)是对普通线性回归模型(OLR)的扩展,将样点数据的地理位置嵌入到回归参数之中,即:式中:(u i,v i)为第i个样点的坐标(如经纬度);βk(u i,v i)是第i个样点的第k个回归参数;εi是第i个样点的随机误差。
为了表述方便,我们将上式简写为:若β1k=β2k=⋯=βnk,则地理加权回归模型(GWR)就退变为普通线性回归模型(OLR)。
地理加权回归模型的原理

地理加权回归模型的原理
地理加权回归模型是一种考虑地理因素权重的回归模型,用于分析地理现象和变量之间的关系。
该模型的原理是通过引入地理权重矩阵,将地理因素的空间依赖性考虑进回归模型中。
地理权重矩阵反映了空间上不同地点之间的相关性和影响力。
在回归分析中,地理权重矩阵会根据地理位置的邻近性和距离来赋予各地点不同的权重。
具体地,对于每个地点的回归方程,地理加权回归模型的数学表达式可以写为:
y_i = β_0 + β_1*x_i + ∑(w_ij*β_j*x_j) + ε_i
其中,y_i是地理现象结果的观测值,x_i是自变量值,w_ij是地理权重矩阵的元素,表示地点i对地点j的影响权重,β_0和β_1是回归方程的常数项和自变量系数,β_j是权重回归模型的系数,ε_i是误差项。
地理加权回归模型通过考虑地理因素的权重,能够更准确地分析地理现象和变量之间的关系。
例如,在研究房价时,可以考虑不同地点之间的邻近性和距离对房价的影响权重,从而更准确地分析房价与其他自变量之间的关系。
通过使用地理加权回归模型,可以在回归分析中更好地利用地理信息,提高回归模型的预测准确性,并帮助了解地理现象和变量之间的空间关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章地理加权回归模型介绍3.1 基本模型在地学空间分析中,n组观测数据通常是在n个不同地理位置上获取的样本数据,全局空间回归模型就是假定回归参数与样本数据的地理位置无关,或者说在整个空间研究区域内保持稳定一致,那么在n个不同地理位置上获取的样本数据,就等同于在同一地理位置上获取的n个样本数据,其回归模型与最小二乘法回归模型相同,采用最小二乘估计得到的回归参数户既是该点的最优无偏估计,也是研究区域内所有点上的最优无偏估计。
而在实际问题研究中我们经常发现回归参数在不同地理位置上往往表现为不同,也就是说回归参数随地理位置变化,这时如果仍然采用全局空间回归模型,得到的回归参数估计将是回归参数在整个研究区域内的平均值,不能反映回归参数的真实空间特征。
为了解决这一问题,国外有些学者提出了空间变参数回归模型(Spatially Varying-Coeffi Cient Regression Model)(Fosterand Gorr,1986; Gorrand Olligschlaeger,1994),将数据的空间结构嵌入回归模型中,使回归参数变成观测点地理位置的函数。
Fortheringham等(Brunsdonetal,1996;Fortheringham et al,1997;Brunsdon et al,1998)在空间变系数回归模型基础上利用局部光滑思想,提出了地理加权回归模型(Geographieally Weighted Regression Model-GWR)。
地理加权回归模型(GWR)是对普通线性回归模型(OLR)的扩展,将样点数据的地理位置嵌入到回归参数之中,即:式中:(u i,v i)为第i个样点的坐标(如经纬度);βk(u i,v i)是第i个样点的第k个回归参数;εi是第i个样点的随机误差。
为了表述方便,我们将上式简写为:若β1k=β2k=⋯=βnk,则地理加权回归模型(GWR)就退变为普通线性回归模型(OLR)。
Fotheringham et al依据“接近位置i的观察数据比那些离i位置远一些的数据对的估计有更多的影响”(Fotheringham et al,1996)的思想,利用加权最小二乘法来估计参数,得其中:β̂是β的估计值,n是空间样点数,k是自变量的个数,W in是对位置i刻画模型时赋予数据点n的权重。
由于地理加权回归模型中的回归参数在每个数据采样点上都是不同的,因此其未知参数的个数为n×(P + l),远远大于观测个数n,这样就不能直接利用参数回归估计方法估计其中的未知参数,而一些非参数光滑方法为拟合该模型提供了一个可行的思路。
Foste & Gorr(1986)和Gorr & Olligsehiaeger(1994)利用广义阻尼负反馈(generalized damped negative feedback)方法估计未知参数在各地理位置的值,这种估计方法只是在很直观的意义上考虑数据的空间结构,加之估计方法较为复杂,很难对估计量作深入的统计推断方面的研究。
Brunsdon等(1996)在局部多项式光滑思想上提出了偏差和方差折衷(Bias-Variance Trade-off)的解题思路:假设回归参数为一连续表面,位置相邻的回归参数非常相似,在估计采样点i的回归参数时,以采样点i及其邻域采样点上的观测值构成局域子样,建立全局线性回归模型,然后采用最小二乘方法得到回归参数估计β̂ik(k=0,1,2,…,p)。
对于另一个采样点,i+1采用另一个相应的局域子样来估计,以此类推。
由于在回归分析过程中,以其它采样点上的观测值来估计i点上的回归参数,因此得到的i点上的参数估计不可避免存在偏差,即参数估计为有偏估计。
显然,参与回归估计的子样规模越大,参数估计的偏差就越大,参与回归估计的子样规模越小,参数估计的偏差就越小。
从降低偏差这一角度考虑因尽量减少子样规模,但子样规模的减少必然导致回归参数估计值的方差增加,精度降低。
3.2 空间权函数的选择空间权重矩阵是地理加权回归模型(GWR)的核心(Brunsdonetal, 2000),空间权函数的选取对地理加权回归模型(GWR)的参数估计影响很大。
(1)距离阈值法距离阈值法是最简单的空间权函数,它的关键是选取合适的距离阈值D,然后将数据点j与回归点i之间的距离d ij与其进行比较,若大于该阈值则权重为0,否则为1,即这种权重函数的实质就是一个移动窗口,计算虽然简单,但其缺点为函数不连续,因此在地理加权回归模型的参数估计中不宜采用。
(2)距离反比法Tobler(1970)地理学第一定律认为空间相近的地物比相远的地物具有更强的相关性,因此在估计回归点i的参数时,应对回归点的邻域给予更多的关注。
根据这种思路,人们自然想到用距离来衡量这种空间关系:这里a为合适的常数,当a取值为1或2时,对应的是距离倒数和距离倒数的平方。
这种方法简洁明了,但对于回归点本身也是样本数据点的情况,就会出现回归点观测值权重无穷大的情况,若要从样本数据中剔除却又会大大降低参数估计精度,所以距离反比法在地理加权回归模型参数估计中也不宜直接采用,需要对其进行修正。
(3)高斯(Gauss)函数法高斯(Gauss)函数法就是表示w ij与d ij之间的连续单调递减函数,可以克服上述空间权函数不连续的缺点。
其函数形式如下:图3.1 Gauss空间权函数式中是描述权重与距离之间函数关系的非负衰减参数,称之为带宽(Bandwidth)。
带宽越大,权重随距离增加衰减的越慢,带宽越小,权重随距离增加衰减的越快。
(3) bi-square 函数法在实际中,往往会将对回归参数估计几乎没有影响的数据点截掉,不予计算,并以有限高斯函数来代替高斯函数,最常采用的便是bi-square函数(Bmndonetal,1997;Fotheringham et al, 1998):图3.2 bi-square空间权函数从上式可以看出,bi-square函数法可以看成是距离阈值法和高斯(Gauss)函数法的结合。
带宽范围内的回归点,可以通过有限高斯函数来计算数据点的权重,而带宽之外的数据点权重为0。
本文分别选用高斯(Gauss)函数和bi-square函数两类空间权函数方法进行地理加权回归模型(GWR)的分析。
3.3 带宽的确定与优化地理加权回归分析对高斯(Gauss)权函数和bi-square权函数的选择并不是很敏感,但对特定权函数的带宽却很敏感。
因此,带宽的确定是地理加权回归分析巾的关键。
图3.3 不同权函数与带宽选择对参数估计的影响在实际应用中我们发现,地理加权回归分析对Gauss 权函数和bi-Squar 权函数的选择并不是很敏感,但对特定权函数的带宽却很敏感(如图3.3),带宽过大回归参数估计的偏差过大,带宽过小又会导致回归参数估计的方差过大。
最小二乘平方和是最常采用的优化原则之一,但对于地理加权回归分析中的带宽选择却失去了作用,这是因为对∑[y i −y ̂i (b )]n i=12=min 而言,带宽b 越小,参与回归分析的数据点的权重越小,预测值y ̂i (b )越接近实际观测值y i ,从而∑[y i −ŷi (b )]n i=12≈0,也就是说最优带是只包含一个样本点的狭小区域。
(1)交叉验证方法基于此,Cleveland (1979)、Bowman (1984)建议采用用于局域回归分析的交叉验证方法(cross-validation , CV ),该方法的公式表达为:其中,y ̂≠i (b )是的拟和值,在刻画过程中省略了点i 的观测值得。
这样当b 变得很小时,模型仅仅刻画点i 附近样点而没有包括i 本身。
在实际应用中为了减少计算量,Loader 于1999年提出了一种近似交叉验证统计量的方法,称为广义交叉验证方法(generalized cross validation ,GCV ):由帽子矩阵S 的构成可知,当带宽很小时,地理加权回归分析的有效参数个数趋近样本数量n ,上式中的分母趋于零,这样即便预测值y ̂i (b )趋向y i ,GCV 也不会等于0。
(2) AIC 准则Akaike 通过对极大似然原理的估计参数方法加以修正,提出了一种较为一般的模型选择准则,称为Akaike 信息量准则(Akaike Information Criterion ,AIC )。
AIC 定义为(Akaike ,1974):其中,θ̂L 为θ的极大似然估计,Q 为未知参数的个数。
AIC 准则应用比较广泛,Hurvich et al 将AIC 准则扩展到非参数回归分析中的光滑参数选择(Hurvich et al , 1998),Brunsdon 和 Fotheringham 则在 Hurvich 等研究基础上将其进一步用于地理加权回归分析中的权函数带宽选择(Brunsdon et al ,2002; Fotheringham et al , 2002),其公式为:其中,下标C表示“修正后的” AIC估计值,n是样点的大小,σ̂是误差项估计的标准离差,tr(S)是GWR的S矩阵的迹,它是带宽的函数。
AIC有利于评价GWR模型是否比OLS模型更好地模拟数据。
其简单形式表示为:(3)贝叶斯信息准则1978年SehwartZ提出了贝叶斯信息准则(Bayesian Information Criterion,BIC),该准则可以使自回归模型的阶数适中,故常被用来确定回归模型中的最优阶数,2002年Nakaya将其用于地理加权回归分析中的权函数带宽选择。
BIC准则与AIC准则非常相似,只是惩罚因子不同,其公式为式中θ̂L为θ的极大似然估计,q为未知参数的个数,n为样本个数,使BIC最小的模型为“最优”模型。
式中可以看出,BIC准则对于具有相同未知参数个数的模型,样本数越多,惩罚度越大,对于具有相同样本的情况,则趋于选择具有更少参数的模型为最优。
与AIC不同的是,BIC准则要求模型为Bayesian模型,即每个候选模型都必须具有相同的先验概率,而实际上模型参数的先验分布通常是不知道的,另外如何将BIC准则扩展到可变带宽的非参数模型,用有效参数个数来代替全局参数个数还不是很清楚。