![地理加权回归(GWR)市公开课金奖市赛课一等奖课件_第1页](http://file4.renrendoc.com/view/ce29fd1a49449ef86cab06068d7cb8ef/ce29fd1a49449ef86cab06068d7cb8ef1.gif)
![地理加权回归(GWR)市公开课金奖市赛课一等奖课件_第2页](http://file4.renrendoc.com/view/ce29fd1a49449ef86cab06068d7cb8ef/ce29fd1a49449ef86cab06068d7cb8ef2.gif)
![地理加权回归(GWR)市公开课金奖市赛课一等奖课件_第3页](http://file4.renrendoc.com/view/ce29fd1a49449ef86cab06068d7cb8ef/ce29fd1a49449ef86cab06068d7cb8ef3.gif)
![地理加权回归(GWR)市公开课金奖市赛课一等奖课件_第4页](http://file4.renrendoc.com/view/ce29fd1a49449ef86cab06068d7cb8ef/ce29fd1a49449ef86cab06068d7cb8ef4.gif)
![地理加权回归(GWR)市公开课金奖市赛课一等奖课件_第5页](http://file4.renrendoc.com/view/ce29fd1a49449ef86cab06068d7cb8ef/ce29fd1a49449ef86cab06068d7cb8ef5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、地理加权回归(GWR)12月24日第1页基本框架普通线性回归模型及预计OLS工作基本原理解释OLS结果GWR提出背景及意义地理加权回归模型及预计权函数选择权函数宽带优化诊疗工具膀胱癌死亡率实例第2页OLS工作基本原理在我们国家是否有连续发生年轻人早逝地方?哪里为犯罪或火灾高发地点?城市中哪里交通事故发生率比预期要高?在实际工作中,我们可能会碰到以下类似问题第3页911紧急呼叫数据分析结果,显示了呼叫热点(红色)、呼叫冷点(蓝色)以及负责事故处理消防和警察分队位置(绿色十字)能够经过热点分析方法搞清以上问题第4页对于上面每一个问题都问询了“where”,不过我们自然会想到“why”为何国家会存在
2、连续发生年轻人早逝地方?是什么造成了这种情况?我们能否对犯罪、911呼叫或火灾频发地域特征进行建模,以帮助降低这些事件发生?造成交通事故发生率比预期要高原因有哪些,有没有相关政策或者办法来降低整个城市或特定事故高发区交通事故?第5页经过回归分析,我们能够对空间关系进行建模、检验和探究,还能够解释所观察到空间模式背后很多原因。比如分析有些地域为何会连续发生年轻人早逝或者糖尿病发病率比预期要高。经过空间关系建模,对这些现象进行预测。比如,对影响大学生毕业率原因进行建模,能够对近期劳动力技能和资源进行预测;因为监测站数量不足而无法进行充分插值情况下(沿山脊地域和山谷内,雨量计通常会短缺),能够用回归
3、法来预测这些地域降雨量或者是空气质量。第6页使用回归分析主要原因1.对某一现象建模,测量一个或多个变量改变对另一变量改变影响程度。比如,了解一些特定濒危鸟类主要栖息地特征(降水,食物源、植被、天敌),以帮助经过立法来保护该物种。2.对某种现象建模以预测其它地点或其它时间数值,构建一个连续准确预测模型。比如,假如已知人口增加情况和经典天气情况,那么明年用电量将会是多少?3.深入探索一些假设情况。假设您正在对住宅区犯罪活动进行建模,以更加好了解犯罪活动并希望实施可能阻止犯罪活动策略,开始分析时,就会有很多问题或想要检验假设情况:1).“破窗理论”表明公共财产破坏(涂鸦、被毁坏建筑物等)可招致其它犯
4、罪行为,破坏财产行为与入世偷窃之间是否存在正关系?2).非法使用毒品与偷窃行为之间存在某种关系吗(吸毒成瘾人又可能经过偷取财物来维持他们吸毒习惯吗)?第7页OLS回归方程第8页1.遗漏自变量:假如模型中丢失了关键自变量,其系数和对应关联P值将不可信。经过映射并检验OLS残差和GWR系数或对回归残差进行热点分析,找出可能缺失变量。2.非线性关系:OLS和GWR都是线性方法,假如任一自变量与因变量之间关系存在非线性关系,则取得模型质量不佳。经过创建散点图矩阵来了解模型中全部自变量之间关系。3.数据异常值:影响大异常值能够使模型化回归关系背离最正确拟合,从而使回归系数发生偏差。经过创建散点图来检验数
5、据极值,假如异常值存在,则进行修正或者移除。假如异常值正确或者有效则不能将其移除,需要对有异常值和没有异常值情况下分别进行回归,查看这两种情况对结果影响程度。回归模型中常见问题第9页4.不稳定性:一个输入变量在区域A中含有很强解释能力,不过在区域B中却不显著。假如因变量与自变量之间关系在研究区域内不一致,将人为地扩大计算出标准误差。用Koenker测试关联概率很小时,区域改变含有统计显著性。(地理加权回归改进)第10页5.多重共线性:一个自变量或多个自变量组合冗余。多重共线性可造成模型不稳定,不可靠。能够经过OLS工具自动检测冗余,每个自变量都被给定一个计算出VIF值,当这个值很大时,冗余便成
6、了问题,经过创建交互变量或增大采样间隔从模型中移除冲突变量或对其进行修改。第11页6.残差方差不一致:对于较小因变量值,模型预测效果很好,但对于较大因变量值,模型预测值变得不可靠。7.空间自相关残差:注意模型偏低预计值(红色)出现空间聚类方式。残差(模型偏低预计值和偏高预计值)在统计学上显著空间聚类表明模型缺失关键因变量,能够使用空间自相关工具来确定模型残差空间聚类是否有统计学上显著性。第12页8.正态分布偏差:当回归模型残差不服从均值为0正态分布时,与系数关联P值将变得不可靠。能够用OLS工具自动检验残差是否服从正态分布。当Jarque-Bera统计量显著(0.05)时,很可能错误选定了模型
7、或对其建模关系为非线性。经过残差图和GWR系数图来检验是否缺乏关键变量,查看散点矩阵图寻找非线性关系。第13页解释OLS结果第14页(1)评定模型性能。R 平方倍数和校正 R 平方值都能够用来测量模型性能。取值范围从 0.0 - 1.0。因为“校正 R 平方”值与数据相关,更能准确地测量出模型性能,能够反应模型复杂性,所以“校正 R 平方”值一直要比“R 平方倍数”值略小。为模型额外添加一个解释变量可能会增大“R 平方倍数”值,但可能会减小“校正 R 平方”值。假设正在创建一个入室偷窃(与每个人口普查区块相关入室偷窃数量为因变量,y)回归模型。假如“校正 R 平方”值为 0.84,则表示该模型
8、(使用线性回归建模解释变量)可解释因变量中大约 84% 改变。使用 R 平方值量化模型性能第15页(2)评定模型中每一个解释变量:系数、概率、稳健概率和方差膨胀因子 (VIF)。系数反应它与因变量之间关系强度,以及它们之间关系类型。当系数为负时,表明自变量与因变量负相关。当系数为正号时,自变量与因变量为正相关。概率或稳健概率(p 值)P值很小时,系数实际为零几率也会很小。假如 Koenker 测试(见下列图)含有统计学上显著性,应使用稳健概率来评定自变量统计学显著性。对于含有统计学上显著性概率,其旁边带有一个星号 (*)。VIF 测量自变量中冗余。普通来说,与大于 7.5 VIF 值关联自变量
9、应逐一从回归模型中移除。第16页(3)评定模型是否含有显著性。联合 F 统计量(联合卡方统计量)用于测量整个模型统计学显著性。只有在 Koenker (BP) 统计量(见下列图)不含有统计学上显著性时,“联合 F 统计量”才可信。假如 Koenker (BP) 统计量含有显著性,应参考“联合卡方统计量”来确定整个模型显著性。对于大小为 95% 置信度,p 值(概率)小于 0.05 表示模型含有统计学上显著性。第17页(4)评定稳定性。Koenker (BP) 统计量(Koenker 标准化 Breusch-Pagan 统计量)是一个测试,用于确定模型自变量是否在地理空间和数据空间中都与因变量含
10、有一致关系。假如模型在地理空间中一致,由自变量表示空间进程在研究区域各位置处行为也将一致。假如模型在数据空间中一致,则预测值与每个自变量之间关系改变不会随自变量值(模型没有异方差性)改变而改变。该测试零假设测试模型稳定性。对于大小为 95% 置信度,p 值(概率)小于 0.05 表示模型含有统计学上显著异方差性和/或不稳定性。假如该测试结果含有统计学上显著性,需参考稳健系数标准差和概率来评定每个解释变量效果。含有统计学上显著不稳定性回归模型通常很适合进行地理加权回归 分析。第18页(5)评定模型偏差。Jarque-Bera统计量用于指示残差是否呈正态分布。该测试零假设为残差呈正态分布。所以,假
11、如为这些残差建立直方图,这些残差分布将高斯分布相同。当该测试 p 值(概率)较小(比如,对于大小为 95% 置信度,其值小于 0.05)时,回归不会呈正态分布,并指示您模型有偏差。第19页(6)评定残差空间自相关。对回归残差运行空间自相关(Morans I)可确保回归残差在空间上随机分布。高残差和/或低残差(模型偏高预计值和偏低预计值)在统计学上显著聚类表明模型中某个关键变量缺失了。当错误指定了模型时,OLS 结果不可信。第20页GWR提出背景和意义在空间分析(Spatial analysis)中,变量观察值(数据)普通都是按照某给定地理单位为抽样单位得到,伴随地理位置改变,变量间关系或者结构
12、会发生改变,这种因地理位置改变而引发变量间关系或结构改变称之为空间非平稳性(spatial nonstationarity)。这种空间非平稳性普遍存在在空间数据中,假如采取通常线性回归模型或莫伊特定形式非线性回归函数来分析空间数据,普通极难得到满意结果,因为全局模型(global model)在分析之前就假定了变量间关系含有同质性(homogeneity),从而掩盖了变量间关系局部特征,所得结果也只有研究区域内某种“平均”,所以需要对传统分析方法进行改进。第21页改进方法采取局部回归分析,依据回归区域不一样能够分为分区回归和移动窗口回归。变参数回归模型。全局模型中参数是地理位置某种函数,从而参
13、数在空间中改变趋势就能够被度量出来。不过这两种模型都没有充分考虑数据空间结构,就有了GWR提出。在总结前人局部回归分析和变参数研究基础上,Fortheringham等人(1996)基于局部光滑思想,提出了地理加权回归(Geographically Weighted Regression )模型,将数据空间位置嵌入到回归参数中,利用局部加权最小二乘方法进行逐点参数预计,其中权是回归点所在地理空间位置到其它各观察点地理空间位置之间距离函数。第22页地理加权回归模型地理加权回归模型是对普通线性回归模型扩展,将数据地理位置嵌入到回归参数中,即:这里 为第i个采样点坐标(如经纬度), 是第i个采样点上第
14、k个回归参数,是地理位置函数。简便记为:第23页空间权函数选择地理加权回归模型关键是空间权重矩阵,它是经过选取不一样空间权函数来表示对数据久安空间关系不一样认识。空间权函数正确选取对地理加权回归模型参数正确预计非常主要,介绍惯用几个空间全函数。1.距离阈值法第24页2.距离反比法3.Gauss函数法第25页4.截尾型函数法第26页权函数宽带优化在实际应用中我们发觉,地理加权回归分析对Gauss函数和bi-square函数选择并不是很敏感,不过对特定权函数宽带却很敏感,宽带过大回归参数预计偏差过大,宽带过小又会造成回归参数预计方差过大,那么怎样选择一个适当宽带呢?1.交叉验证法(CV)第27页2
15、.AIC准则第28页诊疗工具(Diagnostic Tools)1.空间自相关性(Autocorrelation)Morans I和Gearys c2.共线性允许度(Tolerance):越靠近1,共线性越小。方差膨胀因子(VIF):允许度倒数,越靠近1,共线性越小。条件指标(Condition Index):10以下多重共线性较弱,100以上存在严重共线性。方差百分比(Variance Proportion):同一特征值序号上两个或者多个系数方差百分比较大,共线性越强。第29页膀胱癌死亡率实例试验数据研究区域:美国本土506个经济发展区膀胱癌死亡率数据:国际癌症研究所Atlas癌症死亡率,1
16、970-1994年,年纪标准化死亡率(每年每10万人)肺癌死亡率:1954-1969年,年纪标准化死亡率数局人口密度:取每年人口密度自然对数第30页普通线性回归模型分析第31页GWR模型分析现在回归系数依据经济发展区改变而改变,经过交叉验证(VC),GWR核函数波段宽度预计为1.27。拟合系数变为0.52,提升了拟合精度。预计系数展现出一个显著改变,在一些地域出现了违反直觉负相关关系,肺癌和人口密度都是,而且人口密度负相关愈加显著。第32页Wheeler等人用散点图预计系数之间相关性。第33页对回归系数深入探索他们之间独立性,方差百分比和条件指数作为诊疗工具。在506个SEA中,13个SEA状态指数大于30,85个条件指数要大于20,500个条件指数大于10。436个方差百分比大于0.5,在这些最大方差百分比中,又有431个条件指数大于10。总体来说,方差变异分解和条件指数在一定程度上说明了局部共线性存在。第34页另外经过总结,能够分析相关性详细位于哪个位置上。一个条件指数和方差百分比平行坐标图,一个条件指数直方图。在最大条件指数下30个SEAs选择集被高亮显示。在相关系数图中也按照条件指数大于30用黄色标注,周围靠近海洋地方大部分被选择。在平行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学二年级上册乘法口算150道
- 五年级数学小数除法口算练习
- 苏教版一年级数学下册期末复习口算练习题三
- 小学三年级班主任个人工作计划范文
- 苏教版二年级数学上册口算练习题
- 房屋租赁长期合同范本
- 2025年美发店专业技术培训及人才引进转让协议
- 2025年度住宅转租合同协议自行成交版
- 商场合作经营协议书范本
- 二零二五年度私人诊所专业护理团队聘用合作协议
- 23-张方红-IVF的治疗流程及护理
- 顶部板式吊耳计算HGT-20574-2018
- 因数和倍数复习思维导图
- LY/T 2986-2018流动沙地沙障设置技术规程
- GB/T 16288-1996塑料包装制品回收标志
- 三级教育考试卷(电工)答案
- 医院标准化运营管理课件
- 物业服务投标文件
- 《数值分析》配套教学课件
- 山西省卫生院社区卫生服务中心信息名单目录
- 二手闲置物品交易平台研究报告
评论
0/150
提交评论