使用地理加权回归模型探索空间异质性的R包_第1页
使用地理加权回归模型探索空间异质性的R包_第2页
使用地理加权回归模型探索空间异质性的R包_第3页
使用地理加权回归模型探索空间异质性的R包_第4页
使用地理加权回归模型探索空间异质性的R包_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、使用地理用加权模型探索空间异质性的R包地理加权模型(GW model)包括的功能有:地理加权汇总统计(GW summary statistics),地理加权主成分分析(GW principal comp-onents analysis,即GW PCA),地理加权回归(GW regression),地理加权判别分析(GW discriminant analysis),其中一些功能有基本和稳健形式之分。The GWmodel package comes with five example data sets, these are: (i) Georgia, (ii)LondonHP, (iii)

2、USelect, (iv) DubVoter, and (v) EWHP.运用GW model的一个重要元素就是空间加权函数,空间加权函数量化(或套)观察到的变量之间的空间关系或空间相关性。空间目标及其位置临近关系的确定。六个核函数的介绍:Global Model(均值核函数): wij=1Gaussian(高斯核函数):wij=exp(-12(dijb)2)Exponential:wij=exp(-dijb)Box-car(盒状核函数):wij=1 ifdij<b , 0 otherwise Bi-square(二次核函数):wij=1-(dijb)2)2 ifdij<b , 0

3、 otherwise Tri-cude(立方体和函数):wij=1-(dijb)3)23 ifdij<b , 0 otherwise 一、GW汇总统计(DubVoter)GW汇总统计(GW summary statistics)包括基本的 GW 汇总统计 和稳健的 GW 汇总统计.基本的 GW 汇总统计包括GW 均值, GW 标准差, GW measure of skew和GW 皮尔逊相关系数.稳健的 GW 汇总统计包括GW 中位数, GW 四分位间距和GW quantile imbalance(GW不平衡分位数)GW 标准差反映一个数据的离散程度。GW四分位数间距可反映变异程度的大小。

4、 由这两幅图可以看出在中部和西部四分位数间距和标准差值比较大,第一幅图比第二幅图更显著一些。 这两幅图是用不同的核函数说明自变量LARent和因变量GenEl2004之间的相关关系,两幅图都表明出现最高的相关性的地方是中部和西南部,且都表明LARen越高,投票人数越少。 这两幅图表明了LARent和Unempl之间的相关关系,由稳健的GW汇总统计模型得出的第一幅图可知两者相关性最强的是在西南区域。而且可以看出第一幅图的效果比第二幅图好。二、GW主成分分析主成分分析是多元数据分析的一个主要方法。GW主成分分析包括GW PCA和稳健的GW PCA.这两者之间最大的区别就是稳健的GW PCA可以降低

5、异常值对输出结果的影响,使用最小的方差行列式估计量(MCD估计量)去估计每一个当地的协方差矩阵。这两幅图表明前三个主成分总体方差的百分比的变化(即前3个主成分的贡献率的变化),由两幅图图可看出更高的比例出现在南部,低的比例出现在北部。这两幅图对主成分一中各变量对主成分的影响,第一幅图各变量对主成分一的影响表现的不是很明显,第二幅图表明Age45-64(黄色)对主成分一的影响最大。3.GW回归GW 回归是探索因变量和自变量之间的空间变化关系,其也分为基本的GW回归和稳健的GW回归。基本的GW回归是将通常的回归方法用于空间当中,最重要的是所有回归系数的估计都要加权,加权用到文章第三节提到的核函数。

6、这幅图是采用逐步回归,因变量处于图的中间位置,自变量用不同的颜色和形状表示,由这幅图可看出Unempl这个变量被一直选入,第2个进入的变量是Age25-44,经过36步回归,最后一个进入的变量是LowEdu.此图说明随着AICc值的降低,模型中进入的变量越来越多,直到最后成为全模型。 此图要解释的是基本的GW回归和稳健的GW回归对LowEdu的回归系数的估计,解释有待加强。4.GW回归和解决共线性当自变量存在多重共线性时,用普通回归得到的回归参数估计值很不稳定,回归系数的方差会随着多重共线性强度的增加而加速增长,导致回归方程过度显著或回归系数得不到合理的解释。多重共线性的诊断方法:(1)通过相

7、关系数直观简单判断(预测变量对的相关系数大于0.8,认为其存在多重共线性);(2)方差扩大因子法(VIFs)(当VIFs>10,就说明某一自变量与其余自变量之间有严重的多重共线性);(3)方差分解比例(VDPs)(VDPs大于0.5就认为存在多重共线性);(4)条件数法(此值大于30就存在较强的多重共线性)(当矩阵XX有一个特征根近似为0时,设计矩阵X的列向量间必存在多重共线性,并且XX有多少个特征根近似为0,X就有多少个多重共线性关系)。解决多重共线性一般用岭回归,岭回归是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的拟合要强于最小二乘法。当地补偿的GW回归就是基于岭回归的原理。 判断

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论