地理加权回归(GWR)

合集下载

gwr回归系数

gwr回归系数

gwr回归系数一、简介GWR(地理加权回归)回归系数是一种能够反映自变量对因变量空间变异的局部回归系数。

与传统回归分析相比,GWR回归系数能够考虑空间位置变量,从而更好地解释地理现象的空间分布规律。

二、计算方法GWR回归系数的计算方法主要包括以下几个步骤:1.数据准备:收集研究区域的相关数据,包括自变量、因变量和空间位置信息。

2.模型设定:根据研究目的和数据特点,选择合适的GWR模型形式,如线性、二次多项式等。

3.参数估计:利用最小二乘法或其他优化算法,求解GWR模型中的回归系数。

4.模型检验:检验GWR模型的显著性、拟合优度等指标,评估模型的适用性。

5.结果分析:根据GWR回归系数,分析自变量对因变量的影响程度及空间分布特征。

三、应用场景GWR回归系数在实证分析中具有广泛的应用场景,如:1.土地利用变化分析:分析土地利用类型之间的转换关系及影响因素。

2.环境污染研究:探究污染源与污染程度的空间分布关系。

3.城市规划与管理:分析城市发展要素的空间分布规律,为城市规划提供依据。

4.农业气象灾害分析:研究气象因子对农作物产量的影响及空间变异规律。

四、优点与局限GWR回归系数的优点:1.考虑空间位置变量,更能反映地理现象的空间分布规律。

2.具有较高的局部拟合精度,能够发现局部异常点。

3.模型形式灵活多样,可根据数据特点选择合适的模型。

局限:1.计算复杂度较高,对计算机硬件和软件要求较高。

2.参数选择和模型形式选择具有一定的主观性,可能导致模型不稳定。

3.适用于小样本、连续性数据和非线性关系分析。

五、案例分析以下是一个实际案例:某地区土地利用类型转换分析,收集了2000年和2010年的土地利用数据,包括耕地、林地、草地和建设用地的面积。

通过GWR回归分析,可以得到各个土地利用类型之间的转换关系及影响因素,从而为地区土地资源管理和规划提供依据。

六、总结GWR回归系数作为一种能够考虑空间位置变量的局部回归系数,在地理学、生态学、环境科学等领域具有广泛的应用。

gwr回归系数大小解读

gwr回归系数大小解读

gwr回归系数大小解读摘要:1.回归系数的概念与意义2.GWR 回归系数的解读方法3.影响GWR 回归系数大小的因素4.实际应用中的注意点正文:GWR(地理加权回归)是一种用于分析空间数据的局部回归方法,通过引入核函数和带宽参数,使得回归系数具有空间权重,能够反映变量之间的地理变异关系。

在GWR 模型中,回归系数是一个非常重要的结果,它反映了自变量对因变量的解释程度以及各个变量之间的相关性。

因此,对GWR 回归系数大小的解读是理解模型结果的关键步骤。

1.回归系数的概念与意义回归系数是指自变量对因变量的影响程度,用β表示。

在GWR 模型中,回归系数是一个向量,包含所有自变量对应的系数。

回归系数的绝对值越大,表示该自变量对因变量的解释程度越大,变量之间的相关性也越强。

此外,回归系数还可以通过标准化处理,将所有自变量的系数都转化为相对影响程度,便于比较各个变量的重要性。

2.GWR 回归系数的解读方法解读GWR 回归系数时,首先要对比各个自变量系数的绝对值大小,以确定哪些因素对因变量的影响较大。

其次,要分析回归系数的符号,正号表示正相关,负号表示负相关。

最后,要结合地理信息分析回归系数的空间分布特征,以了解变量之间的空间变异关系。

3.影响GWR 回归系数大小的因素GWR 回归系数的大小受多种因素影响,包括自变量的数值、带宽参数的选择以及核函数的类型等。

在实际操作中,可以通过调整带宽参数和核函数类型来控制回归系数的大小,以达到更好的拟合效果。

4.实际应用中的注意点在实际应用中,解读GWR 回归系数时要注意以下几点:首先,要确保模型选择的合理性,避免过拟合或欠拟合现象;其次,要关注模型的显著性检验,确保所选自变量对因变量的影响具有统计学意义;最后,要结合实际情况对模型结果进行解释,避免过度解读或误读。

总之,对GWR 回归系数大小的解读是分析空间数据的关键步骤。

gis地理加权回归步骤

gis地理加权回归步骤

gis地理加权回归步骤
地理加权回归(Geographically Weighted Regression,GWR)
是一种空间数据分析方法,用于探索空间数据中变量之间的关系。

以下是GIS地理加权回归的一般步骤:
1. 数据收集,首先需要收集需要分析的空间数据,包括自变量
和因变量。

自变量通常是空间属性,如人口密度、土地利用类型等,而因变量可以是社会经济指标、环境变量等。

2. 数据预处理,在进行地理加权回归之前,需要对数据进行预
处理,包括数据清洗、空间数据投影转换、空间数据的边界匹配等
操作,以确保数据的准确性和一致性。

3. 空间权重矩阵构建,GWR的关键是构建空间权重矩阵,用于
衡量不同地理位置之间的空间关联程度。

常见的空间权重矩阵包括
邻近权重矩阵、距离衰减权重矩阵等。

4. 模型拟合,使用地理加权回归模型拟合空间数据,对每个空
间位置上的局部回归模型进行参数估计,以获得空间上局部的回归
系数。

5. 参数估计,对每个空间位置上的局部回归模型进行参数估计,得到每个自变量的空间局部回归系数,从而揭示空间上变量之间的
关系。

6. 模型诊断,对地理加权回归模型进行诊断,包括残差分析、
模型拟合优度检验等,以评估模型的合理性和拟合度。

7. 结果解释和可视化,最后,对地理加权回归的结果进行解释
和可视化,可以通过空间插值方法将局部回归系数插值到整个研究
区域,以获得空间上的回归关系分布图。

总之,GIS地理加权回归是一种强大的空间数据分析方法,能
够更好地揭示空间数据中变量之间的关系,并为空间决策提供科学
依据。

地理加权回归GWR-精选文档

地理加权回归GWR-精选文档

6.残差的方差不一致:对于较小的因变量值,模型的预测效果 较好,但对于较大的因变量值,模型的预测值变得不可靠。 7.空间自相关残差:注意模型偏低预计值(红色)出现空间聚 类的方式。残差(模型的偏低预计值和偏高预计值)在统计学 上的显著空间聚类表明模型缺失关键的因变量,可以使用空间 自相关工具来确定模型残差的空间聚类是否有统计学上的显著 性。
8. 正态分布偏差:当回 归模型残差不服从均值 为 0 的正态分布时 ,与 系数关联的 P 值将变得 不可靠 。 可以用 OLS 工 具自动检查残差是否服 从正态分布。当 JarqueBera 统 计 量 显 著 ( < 0.05 )时,很可能错误 选定了模型或对其建模 的关系为非线性。通过 残差图和 GWR 系数图来 检查是否缺少关键变量, 查看散点矩阵图寻找非 线性关系。
地理加权回归(GWR)
2019年12月24日
基本框架
普通线性回归模型及估计
OLS工作的基本原理 解释OLS结果
GWR提出的背景及意义 地理加权回归模型及估计
权函数选择 权函数宽带优化 诊断工具
膀胱癌死亡率实例
OLS工作的基本原理
在实际工作中,我们可能会遇到以下类似的问题
使用 R 平方值量化模型性能
(2)评估模型中的每一个解释变量:系数、概率、稳健概 率和方差膨胀因子 (VIF)。
系数——反映它与因变量之间关系的强度,以及它们之间的关系类型。当系数
为负时,表明自变量与因变量负相关。当系数为正号时,自变量与因变量为正 相关。 概率或稳健概率(p 值)——P值很小时,系数实际为零的几率也会很小。 如果 Koenker 测试(见下图)具有统计学上的显著性,应使用稳健概率来评估 自变量的统计学显著性。对于具有统计学上显著性的概率,其旁边带有一个星 号 (*)。 VIF ——测量自变量中的冗余。一般来说,与大于 7.5 的 VIF 值关联的自变量应 逐一从回归模型中移除。

地理加权回归模型gwr结果解读

地理加权回归模型gwr结果解读

地理加权回归模型gwr结果解读地理加权回归模型(GWR)是一种用于分析空间数据的统计方法。

它结合了回归分析和地理加权技术,通过考虑地理位置的影响来解释和预测变量之间的关系。

以下是对GWR结果的解读。

GWR模型的输出主要包括回归系数、标准误差、t值和p值。

回归系数表示变量之间的影响关系,标准误差衡量了该系数的可靠性,t值用于检验回归系数是否显著,p值表示显著性水平。

在解读GWR结果时,首先要关注各个变量的回归系数。

正系数表示变量对因变量的增加有正向影响,负系数则表示反向影响。

系数的大小表示了该变量对因变量的贡献程度,绝对值越大表示影响越显著。

比较不同变量的系数可以帮助确定哪些变量对因变量的影响最大。

其次,标准误差可以用于衡量回归系数的可靠性。

较小的标准误差意味着系数估计更精确,较大的标准误差则表示估计的不确定性较高。

因此,在解读GWR结果时,可比较不同变量的标准误差,并根据其大小判断变量系数的可靠程度。

t值和p值用于判断变量的显著性。

较大的t值表明在该空间位置上,变量对因变量的影响具有统计显著性。

通常,当t值的绝对值大于1.96时,可以认为该变量是显著的。

相应的,p值小于0.05或0.01时可认为结果具有显著性。

最后,需要关注空间异质性。

GWR模型能够考虑地理位置对变量关系的影响,因此,结果会显示出各个地理位置的异质性。

可以通过观察不同地理位置上模型的回归系数和显著性来了解这种异质性。

如果不同地理位置上的回归系数存在较大差异,或者某些位置上的回归系数与总体模型的系数相反,说明存在空间异质性。

总结来说,解读GWR结果时要关注回归系数、标准误差、t值和p值,并考虑空间异质性。

这将有助于理解变量之间的关系以及地理位置对模型的影响。

地理加权回归(GWR)

地理加权回归(GWR)

9
4.不稳定性:一个输入变量在区域A中具有很强的解释能力, 但是在区域B中却不显著。如果因变量与自变量之间的关
系在研究区域内不一致,将人为地扩大计算出的标准误差。 用Koenker测试关联的概率很小时,区域变化具有统计显 著性。(地理加权回归改进)
精选完整ppt课件
10
5.多重共线性:一个自变量或多个自变量的组合冗余。多 重共线性可导致模型不稳定,不可靠。可以通过OLS工具 自动检测冗余,每个自变量都被给定一个计算出的VIF值,
VIF ——测量自变量中的冗余。一般来说,与大于 7.5 的 VIF 值关联的自变量应
逐一从回归模型中移除。
精选完整ppt课件
16
(3)评估模型是否具有显著性。
联合 F 统计量(联合卡方统计量)用于测量整个模型的统计学显著性。只
有在 Koenker (BP) 统计量(见下图)不具有统计学上的显著性时,“联合 F 统计 量”才可信。如果 Koenker (BP) 统计量具有显著性,应参考“联合卡方统计量”来确 定整个模型的显著性。对于大小为 95% 的置信度,p 值(概率)小于 0.05 表示 模型具有统计学上的显著性。
是第i个采样点上的第k个回归参数,是地理位置的函数。
简便记为:
精选完整ppt课件
23
空间权函数的选择
地理加权回归模型的核心是空间权重矩阵,它是通过 选取不同的空间权函数来表达对数据久安空间关系的 不同认识。空间权函数的正确选取对地理加权回归模 型参数的正确估计非常重要,介绍常用的几种空间全 函数。
模型,将数据的空间位置嵌入到回归参数中,利用局部
加权最小二乘方法进行逐点参数估计,其中权是回归点
所在的地理空间位置到其他各观测点的地理空间位置之 间的距离函数。

地理加权回归( GWR)

地理加权回归( GWR)

空间计量经济学打破大多数经典统计和计量分析中相互独立的基本假设,主要解决如何在横截面数据和面板数据的回归模型中处理空间相互作用(空间自相关)和空间结构(空间不均匀性)分析的问题。

空间计量经济理论认为一个地区空间单元上的某种经济地理现象或某一属性值与邻近地区空间单元上同一现象或属性值是相关的。

也就是说,各区域之间的数据存在与时间序列相关相对应的空间相关。

空间计量模型所研究的空间效应包括空间自相关和空间差异性。

空间相关性在空间回归模型中体现在误差项和因变量的滞后项,因此,空间计量的两个模型分别是空间自回归模型(Spatial Auto Regressive Model , SAR) 与空间误差模型(Spatial Error Model , SEM),空间自回归模型研究各变量在一个地区是否有扩散效应,空间误差模型考察邻接地区关于因变量的误差冲击对本地区观察值的影响。

其表达式分别为:其中,Y 为因变量;W 为n n ⨯阶的空间权重矩阵,权数系数可以根据实际情况决定,一般用邻接矩阵;Wy 为空间滞后因变量,反映了空间距离对区域行为的作用;ρ为空间自回归系数,反映相邻区域的观测值Wy 对本地区观察值y 的影响方向和程度;X 为k n ⨯的外生解释变量向量(包括常数项),β为变量系数,反映了自变量X 对因变量Y 的影响;ε为误差成分;λ为1⨯n 的因变量向量的空间误差系数,衡量了相邻地区的观察值Y 对本地区观察值Y 的影响方向和程度;γ为正态分布的随机误差向量。

上述两种模型的估计如果仍采用OLS ,往往导致各种结果和推论不够完整、科学。

本文采用极大似然法估计参数。

常用检验准则有拟合优度R 2 和对数似然值LogL 。

拟合优度和对数似然值越大,模型拟合效果越好, 对数似然值最大的模型最好。

( 一) 空间权重矩阵的选取空间权重矩阵 w 表征了空间单位之间的相互信赖性与关联程度。

实证研究中,通常采用相邻规则与距离规则来定义空间加权矩阵。

gwr回归系数

gwr回归系数

gwr回归系数
GWR (Geographically Weighted Regression) 是一种空间回归模型,它考虑了地理位置的影响,对回归系数进行局部化建模。

GWR 回归系数表示每个自变量对因变量的影响在空间上的变化程度。

与传统的全局回归模型不同,GWR 可以提供区域性的回归系数,揭示了空间异质性和空间非平稳性。

GWR 回归系数通常会根据所用的GWR 模型和数据集而有所不同。

一般来说,GWR 回归系数可以通过以下步骤计算得到:
1.数据准备:将自变量和因变量的数据进行整理和处理,确
保数据的一致性和完整性。

2.模型拟合:使用GWR 方法拟合空间回归模型,根据数据
集中每个点的空间位置和邻居观测值对回归系数进行局部
化建模。

3.回归系数估计:通过拟合的GWR 模型,得到每个点的回
归系数。

回归系数通常包括截距项和每个自变量对应的系
数。

4.空间可视化:可使用地理信息系统(GIS)软件或其他相
关工具,将估计得到的回归系数进行空间可视化,以便观
察空间上的异质性和非平稳性。

需要注意的是,GWR 回归系数是根据具体的数据集和模型计算得到的,每个点的回归系数可能会在空间上有所不同。

因此,GWR 回归系数通常以地图或其他形式的可视化展示,以增进对
空间异质性和非平稳性的理解。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(4)评估稳定性。
Koenker (BP) 统计量(Koenker 的标准化 Breusch-Pagan 统计量)是一种测试,用 于确定模型的自变量是否在地理空间和数据空间中都与因变量具有一致的关系。 如果模型在地理空间中一致,由自变量表示的空间进程在研究区域各位置处的 行为也将一致。如果模型在数据空间中一致,则预测值与每个自变量之间关系 的变化不会随自变量值(模型没有异方差性)的变化而变化。该测试的零假设 测试模型稳定性。对于大小为 95% 的置信度,p 值(概率)小于 0.05 表示模型 具有统计学上的显著异方差性和 /或不稳定性。如果该测试的结果具有统计学上 的显著性,需参考稳健系数标准差和概率来评估每个解释变量的效果。具有统 计学上显著不稳定性的回归模型通常很适合进行地理加权回归 分析。
1.距离阈值法
2.距离反比法
3.Gauss函数法
4.截尾型函数法
权函数宽带优化
在实际应用中我们发现,地理加权回归分析对Gauss函数和bisquare函数的选择并不是很敏感,但是对特定权函数的宽带却 很敏感,宽带过大回归参数估计的偏差过大,宽带过小又会导 致回归参数估计的方差过大,那么如何选择一个合适的宽带呢?
(5)评估模型偏差。
Jarque-Bera统计量用于指示残差是否呈正态分布 。该测试的零假设为
残差呈正态分布。因此,如果为这些残差建立直方图,这些残差的分布将高 斯分布相似。当该测试的 p 值(概率)较小(例如,对于大小为 95% 的置信 度,其值小于 0.05)时,回归不会呈正态分布,并指示您的模型有偏差。
一般都是按照某给定的地理单位为抽样单位得到的,随着 地理位置的变化,变量间的关系或者结构会发生变化,这 种因地理位置的变化而引起的变量间关系或结构的变化称 之为空间非平稳性(spatial nonstationarity)。 这种空间非平稳性普遍存在在空间数据中,如果采用通常 的线性回归模型或莫伊特定形式的非线性回归函数来分析 空间数据,一般很难得到满意的结果,因为全局模型 (global model)在分析之前就假定了变量间的关系具有 同质性(homogeneity),从而掩盖了变量间关系的局部 特性,所得结果也只有研究区域内的某种“平均”,因此 需要对传统的分析方法进行改进。
哪里为犯罪或火灾的高发地点? 城市中哪里的交通事故发生率比预期的要高? ……
可以通过热点分析的方法弄清以上问题
911紧急呼叫数据的 分析结果,显示了 呼叫热点(红色)、 呼叫冷点(蓝色) 以及负责事故处理 的消防和警察分队 的位置(绿色十字)
对于上面的每一个问题都询问了“where”,但是我们自然
2012年12月24日
基本框架
普通线性回归模型及估计
OLS工作的基本原理 解释OLS结果
GWR提出的背景及意义 地理加权回归模型及估计
权函数选择 权函数宽带优化 诊断工具
膀胱癌死亡率实例
OLS工作的基本原理
在实际工作中,我们可能会遇到以下类似的问题
在我们国家是否有持续发生年轻人早逝的地方?
6.残差的方差不一致:对于较小的因变量值,模型的预测效果 较好,但对于较大的因变量值,模型的预测值变得不可靠。 7.空间自相关残差:注意模型偏低预计值(红色)出现空间聚 类的方式。残差(模型的偏低预计值和偏高预计值)在统计学 上的显著空间聚类表明模型缺失关键的因变量,可以使用空间 自相关工具来确定模型残差的空间聚类是否有统计学上的显著 性。
膀胱癌死亡率实例
实验数据
研究区域:美国本土的 506个经济发展区 膀胱癌死亡率数据:国际 癌症研究所 Atlas 癌症死亡 率,1970-1994年,年龄标 准化死亡率(每年每 10 万 人) 肺癌死亡率:1954-1969年, 年龄标准化死亡率数局 人口密度:取每年人口密 度的自然对数
普通线性回归模型分析
地理加权回归模型
地理加权回归模型是对普通线性回归模型的扩展,将
数据的地理位置嵌入到回归参数中,即:
这里的 为第i个采样点的坐标(如经纬度), 点上的第k个回归参数,是地理位置的函数。 简便记为:
是第i个采样
空间权函数的选择
地理加权回归模型的核心是空间权重矩阵,它是通过
选取不同的空间权函数来表达对数据久安空间关系的 不同认识。空间权函数的正确选取对地理加权回归模 型参数的正确估计非常重要,介绍常用的几种空间全 函数。
1.交叉验证法(CV)
2.AIC准则
诊断工具(Diagnostic Tools)
1.空间自相关性(Autocorrelation) Moran’s I和Geary’s c 2.共线性 容许度(Tolerance):越接近1,共线性越小。 方差膨胀因子(VIF):容许度的倒数,越接近1,共线性 越小。 条件指标(Condition Index):10以下多重共线性较弱, 100以上存在严重的共线性。 方差比例(Variance Proportion):同一特征值序号上的 两个或者多个系数的方差比例较大,共线性越强。
(3)评估模型是否具有显著性。
联合 F 统计量(联合卡方统计量)用于测量整个模型的统计学显著性。只
有在 Koenker (BP) 统计量(见下图)不具有统计学上的显著性时,“联合 F 统计 量”才可信。如果 Koenker (BP) 统计量具有显著性,应参考“联合卡方统计量”来 确定整个模型的显著性。对于大小为 95% 的置信度,p 值(概率)小于 0.05 表 示模型具有统计学上的显著性。
GWR模型分析
现在回归系数根据经济发展区变化而变化,通过交叉验证(VC),GWR 核 函数的波段宽度的估计为1.27。拟合系数变为0.52,提高了拟合精度。
估计的系数展现出一种明显的变化,在一些地区出现了违反直觉的负相关 关系,肺癌和人口密度都是,而且人口密度的负相关更加明显。
会想到“why”
为什么国家会存在持续发生年轻人早逝的地方?是什么导 致了这种情况? 我们能否对犯罪、911呼叫或火灾频发地区的特征进行建模, 以帮助减少这些事件的发生?
导致交通事故发生率比预期要高的因素有哪些,有没有相
关政策或者措施来减少整个城市或特定事故高发区的交通 事故?
通过回归分析,我们可以对空间关系进行建模、检查和探究,
(6)评估残差空间自相关。
对回归残差运行空间自相关(Moran‘s I) 可确保回归残差在空间上随机分布。
高残差和/或低残差(模型偏高预计值和偏低预计值)在统计学上的显著聚类表 明模型中的某个关键变量缺失了。当错误指定了模型时,OLS 结果不可信。
GWR提出的背景和意义
在空间分析(Spatial analysis)中,变量的观测值(数据)
OLS回归方程
回归模型中常见的问题
1.遗漏自变量:如果模型中丢失了关键的自变量,其系数
和相应的关联 P 值将不可信。通过映射并检查 OLS 残差和 GWR系数或对回归残差进行热点分析,找出可能缺失的变 量。 2.非线性关系:OLS和GWR都是线性方法,如果任一自变量 与因变量之间的关系存在非线性关系,则获得的模型质量 不佳。通过创建散点图矩阵来了解模型中所有自变量之间 的关系。 3.数据异常值:影响大的异常值可以使模型化的回归关系 背离最佳拟合,从而使回归系数发生偏差。通过创建散点 图来检验数据的极值,如果异常值存在,则进行修正或者 移除。如果异常值正确或者有效则不能将其移除,需要对 有异常值和没有异常值的情况下分别进行回归,查看这两 种情况对结果的影响程度。
使用 R 平方值量化模型性能
(2)评估模型中的每一个解释变量:系数、概率、稳健概 率和方差膨胀因子 (VIF)。
系数——反映它与因变量之间关系的强度,以及它们之间的关系类型。当系数
为负时,表明自变量与因变量负相关。当系数为正号时,自变量与因变量为正 相关。 概率或稳健概率(p 值)——P值很小时,系数实际为零的几率也会很小。 如果 Koenker 测试(见下图)具有统计学上的显著性,应使用稳健概率来评估 自变量的统计学显著性。对于具有统计学上显著性的概率,其旁边带有一个星 号 (*)。 VIF ——测量自变量中的冗余。一般来说,与大于 7.5 的 VIF 值关联的自变量应 逐一从回归模型中移除。
改进方法
①采用局部回归分析,根据回归区域的不同可以分为分 区回归和移动窗口回归。 ②变参数回归模型。全局模型中的参数是地理位置的某 种函数,从而参数在空间中的变化趋势就可以被度量出 来。 但是这两种模型都没有充分考虑数据的空间结构,就有 了GWR的提出。 在总结前人局部回归分析和变参数研究的基础上, Fortheringham等人(1996)基于局部光滑的思想,提出 了地理加权回归(Geographically Weighted Regression ) 模型,将数据的空间位置嵌入到回归参数中,利用局部 加权最小二乘方法进行逐点参数估计,其中权是回归点 所在的地理空间位置到其他各观测点的地理空间位置之 间的距离函数。
还可以解释所观测到的空间模式背后的诸多因素。
例如分析有些地区为什么会持续发生年轻人早逝或者糖尿病 的发病率比预期的要高。 通过空间关系建模,对这些现象进行预测。 例如,对影响大学生毕业率的因素进行建模,可以对近充分插值的情况下(沿山脊地区和山谷内,雨量计通常会 短缺),可以用回归法来预测这些地区的降雨量或者是空气 质量。
4.不稳定性:一个输入变量在区域A中具有很强的解释能力, 但是在区域 B 中却不显著。如果因变量与自变量之间的关 系在研究区域内不一致,将人为地扩大计算出的标准误差。 用 Koenker 测试关联的概率很小时,区域变化具有统计显 著性。(地理加权回归改进)
5.多重共线性:一个自变量或多个自变量的组合冗余。多 重共线性可导致模型不稳定,不可靠。可以通过OLS工具 自动检测冗余,每个自变量都被给定一个计算出的 VIF 值, 当这个值很大时,冗余便成了问题,通过创建交互变量或 增大采样间隔从模型中移除冲突变量或对其进行修改。
相关文档
最新文档