Moranx27s-I(莫兰指数)与虾神_第1页
Moranx27s-I(莫兰指数)与虾神_第2页
Moranx27s-I(莫兰指数)与虾神_第3页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、王庆喜等的书?区域经济研究实用方法:基于ArcGIS、GeoDa和R的运用?前两天聊了空间统计学里面的两个经典概念,今天来说说第一篇文章留下的大坑:Moran's I首先,Moran 's I这个东西,官方叫做:莫兰指数,是澳大利亚统计学家帕特里克阿尔弗雷德皮尔斯莫兰(Patrick Alfred PierceMoran )(好长的名字,不过一般都简称为:帕克莫兰,就是以下列图这位中年帅哥了),在 1950年提出的。这一年,朝鲜战争爆发。莫兰同学1917年出生在澳大利亚的悉尼,后来考入了剑桥大学,第二次世界大战的时候,参加了盟军,并且因为在数学和物理学上面的特长,被安排在剑桥大

2、学的外弹道学实验室(External Ballistics Laboratory )负责火箭的研究工作。战争完毕后,任教于牛津大学,并且就在牛津任教期间,提出了关于莫兰指数的问题。另外再加一点点小花絮,莫兰同学终生未获得博士学位,但是据他晚年回忆,他似乎对这个事情一直感到骄傲(自己并非博士,但是带出了无数的博士生)。那么莫兰指数到底是个啥东西呢?莫兰指数一般是用来度量空间相关性的一个重要指标。一般说来,莫兰指数分为全局莫兰指数(GlobalMoran s I )和安瑟伦局部莫兰指数(AnselinLocal Moran's I )后者是美国亚利桑那州立大学地理与规划学院院长Luc An

3、selin教授在1995年提出的,后面我们会说到。今天就简单说说全局莫兰指数,也是狭义上的莫兰指数。莫兰指数是一个有理数, 经过方差归一化之后, 它的值会被归一化到-1.0 1.0之间。(如 果有喜欢看数学公式的,我最后贴出了全局莫兰指数的计算公式,这里是科普性质的,我就不贴数学公式来虐待大家的大脑了。当然,这个归一化是一般的情况,根据某些特殊的情况,也会计算出一些不在这个范围内的值,最后来讨论为什么会超出这个范围。全局莫兰指数计算完成之后,全部的要素,就会给出你一个关于全部数据的相关性的数值(反之,局部莫兰指数,就每个要素都会给你一个相关性数值了,这个以后在说)。所以我们可 以根据他给出的值

4、,来看当前你需要计算的数据结果了。Moran s I >0 表示空间正相关性,其值越大,空间相关性越明显,Moran s I <0 表示空间负相关性,其值越小,空间差异越大,否那么,Moran s I = 0 ,空间呈随机性。这里需要注意一下啊,空间差异和空间异质性是不同的概念。空间差异(spatialdisparity)是指不同地域范畴因为(社会、经济等)开展水平与其结构不同,而产生的差异。而空间异质性(spatialheterogeneity)是指因为空间位置的不同而引发的获取到不同的数据。所以二者切不可混为一谈。最后,我们们来看看,什么叫做正相关,什么叫做负相关。所谓的相关,

5、就是指相互关系,正相关,就是随着自变量的增长,应变量也随着增长,比方虾神的年纪和血压, 就是标准的正相关。 而负相关当然就是相反了,随着自变量的增长而减少,比方虾神的年纪和体力那么空间上面的正相关, 就是指随着空间分布位置 距离的聚集,相关性就也就越发显著。 空间上的负相关就正好相反了,随着空间分布位置的离散,反而相关性变得显著了。像如下我采用中国行政区划计算出来的结果:2005-2021某种疾病T-犯病人数莫兰指數 人口勘莫兰指數空间相关性分析2.40.350 30,250 2 150.10 05n '20052006200 了20OB2021Z01O 20212021範病人数莫兰指

6、数01496G70.1709960 17A7040 212410.2760570-2W110 3G57040.327546人口教奠兰指频0.1S71590.174240.15676601473250.144230.1203350 W15B40.102033整个图表可以看出来,人口数和患病的人数,都与空间信息成正相关, 就是说,空间分布聚集度大的地方,人口数和患病人数也相应多。但是可以看见的,患病人数,随着时间推移,他的莫兰指数在上升,而人口数随着年份,莫兰指数在下降,这说明了中国人口的数量慢慢的与空间分布的相关性在减弱,而患病人数与空间分布的相关性在增加。当然,莫兰指数只是在衡量空间相关性时候

7、的一个重要指标,并不完全能够代表空间相关性,还需要有其他的数据进行验证和综合考量。下面局部局部仅供不怕死脑细胞的同学参考:来源于ArcGIS for Destkop的帮助文档1全局莫兰指数的公式:空间I Xll'J Moran's 1 tfti mJ 我少为:i-1 j-A其中刊足要素i的屈性与英平均值S 一 X的瞇 叫 是要承i和3 ZH的空何权堇,n尊丁耍索越民 星所有空何权亟的渥合:1L n% = 士 f JQ 1 j=l统计的工得分按以下压式计算,(3)(h严 _£-ETMlE_T = l/(n 1)Vl = E鬥一 EF其中r2、刚刚讨论了,莫兰指数一般是在

8、-1 1之间,那么有时候突然算出来超出这个区间的数据,是怎么回事呢?是不是软件出了bug ?答案是和软件bug无关。通常,Global Moran s I指数介于-1.0 到1.0 之间。是只有对我们权重进行了行标准 化行标准化的意思,就是在做空间距离矩阵的时候,对矩阵中的每一行,求和后,每个元 素除以所在行元素之和这种标准化操作时才会这样。如果没有对权重进行行标准化处理, 那么指数值可能会落在-1.0到1.0的范围之外,这表示参数设置有问题。 最常见的问题如下:1. 输入的数据严重偏斜创立数据值的直方图可了解此情况,空间关系的概念化或距离范围的设置使得某些要素的相邻要素非常少。Global

9、Moran s I统计量是渐进正态的,这意味着,对于偏斜数据,每个要素至少需要具有8个相邻要素。为距离范围或距离阈值参数计算的默认值可确保每个要素至少具有1个相邻要素,但这可能不够,尤其是在输入数据中的有的值出现严重偏斜时。2. 使用反距离空间关系的概念化,并且反距离非常小。关于反距离过小的问题,是因为在选择反距离的幕的时候,为了突出拉伸,选择了一个过高的幂,这样就会把反距离距离的倒数变得非常的小。看下面关于反距离中幕的说明:h4D0.0250.000625Q000015625500,020.00040.000008GO0.0166670.0002 7S4.62962E-06700.0142S

10、50.0002042.9154SE-06300.01250.0001561.95313E-06300.0111110.0001231.37174E-O61000,010*00010,0000011100.0090919.26E-057.51315E437120O.OOS593&盟匚専55.78704E-O71300,007592.55166E'O71400.0071435JE-053.64431E-07 h®幕用于进一步强调点的距离幕越大,距离近的点的作用越大, 插值的结果越陡悄。幕越小,距离的间隔作用越小.插 值的结果越平滑口幕的偵常规上不应该太大乜3.未选择行标准

11、化,但应选择。除非聚合方案与所分析的字段直接相关,否那么,只要对数据进行了聚合处理,就应选择行标准化。好,关于全局莫兰值的介绍今天先到这里,下次我们来看看在 ArcGIS里面如何使用这个工具来进行计算。白话空间统计番外:再谈莫兰指数(Moran's I )原创 2021 年 03 月 15 日 14:38:03?标签:?ArcGIS /?空间统计 /?Globe Mora ns I/?全局空间自相关/?莫兰指数?17328以前写文章的时候,有些过于草率,本来以为作为科普,把这个名词告 诉大家就可以了,结果应该是这个东西国内的科普性文章太少,很多同 学都拿来做入门读物了,而且还屡次阅读,

12、读着读着,就发现,虾神你 文章里面好多坑啊该说的没有说清楚,关键还有很多说错的地 方每次遇见这种情况,我都想这样:正所谓“教然后知缺乏,这段时间以来很多同学跟我讨论了关于空间统计的一些内容,让我很受启发和教育,所以我决定把一起的一些漏洞和坑给补上。今天再来谈谈莫兰指数这个空间统计的入门概念。还有同学问过,说虾神你能不能说说在ArcGIS里面怎么用这个工具啊。遇见这个问题的时候,虾神首先表示:休这时让我叙曲ft呐不过既然同学们有要求,那就写写呗。人类天然有归纳的习惯,比方看见一堆东西之后,会用很简单的一个字词、句来统合表达对整体的一个印象,比方:又另外:对于三哥的阅兵。米帝大统领也给出了一个字评

13、语:赞所以,对于一票数据,我们首先也会给出一个综合性的评论。比方“这 数据真尼玛的乱。当然,这种评论更多是“定性的,对于科学 观测法来说,我们要给出一个量化的评定标准,所以就有了各种指数。那么这个所谓的莫兰指数, 就是用来衡量空间自相关的程度的一个综合 性评价特指全局莫兰指数。关于空间自相关, 我以前也写过一篇文章,大家有兴趣就去翻历史文章 吧,这里仅作简单的回忆。其实空间自相关要是把空间两个字去掉,就 是经典统计学里面的相关性分析, 加上空间之后, 就变成了空间与属性 共同作用的相关性分析了。自相关的这个“自,表示你进行相关性观察统计量,是来源于不同对 象的同一个属性, 比方两学生不同对象

14、,同时对他们的数学成绩 统 一属性进行统计,如果他们同桌空间邻接,而且 A 考得好 B 就考 得好,A考不好B也考不好高端相关,那么根本上就可以判定他们 他们的空间自相关性很强有考试串通作弊的行为。如以下列图所示:54同桌73我觉得这个两个破猫之间一定有问题情况1课桌X%995478课桌学道犀 科难灵成 木!昏不 这啊心99547B所以我们可以看见,如果排除空间关系, A猫和B猫,以与情况2得A猫和X猫,都是相关的,特别是情况 2, A猫和X猫简直是完全相关。但是加上空间关系之后,情况2计算出来的A猫和X猫,可能就是完全 不相关了,最最关键得是定义他们的空间关系,这个远隔万水千山,也 顶不住现

15、代化通信工具啊这里排除这种情况,仅仅用常规意义上的空间邻接关系来定义。所以说,经典相关性分析是两条数据 属性维度 之间的相互依赖关系, 那么空间自相关就是在空间范围内的相互依赖程度。全局的莫兰指数就是用来衡量空间自相关程度的。在 ArcGIS 的工具集 里面,这个工具干脆就直接叫做“空间自相关 Spatial Autocorrelation Global Moran's I。使用这个工具,首先来看一份数据,美国俄怀明州有关肺癌的一份统计 数据,分别选取是 68年、78 年、88年三个年度的男性肺癌的记录进行 可视化,以下数据可以提供下载,见文章最后:数据GallicJ雄Ai;扎 w予孟

16、Ej-i1E.1cXZLM-±insftK I沿注i ±li 盖量U乂二 3.1(HtaraSTS- IO':r:上巴=1血;i,畫昼;mg#g->: J啟量' i和:«§: fC<sh-i> 匚 t wi5tnc 5裝昼;X2Em 艺益:;cL«£ Mr. z«妣虽3EL 套:1ZzariniJty«*= 16Mcr G<r 紅宣-TztlslLuII 滋童j 44z-n莹里e眾邑:S5K 蔬 g a; iT E J PJJ養uJilZ- 起全7Fr=-:1=熬号4惹空宀J

17、Lllrr S7S- 27Pee6 t£C -芳量.12MMkZLl ELg 靈蠹S5 二tri::-Toluit zmflSra %Lcfazi或壘:11Hezizy敷癖sK=“亍at a-, o畠生上|趕-Put nflu .(I联": nWptnritt 姑虽!1968年 男性肺癌r.felie kiE 茁孟5羔呈;?=-* r±mtQ sr虽一i« 啦亘:Be lient 常歳z=Tir7 芒亘CoLvnhiuiATziru ZIX: TL7-ul t-an 竝讯:l:Atftitbula艺勒uranl±i ns艺宜;nWii. 1h豆

18、丘匸 當昼Srk - me &a=k-u- rzLS *?茁登12甄匿2并童.©Zrarfnri劭豊=弗Exc fzls.-戟段3可壬卫七t 筈昼:12从整体的情况来看,数据量是在不断上升的,当然,人口在增长,病患 的数据也相应增长,是符合情理的事情。那么接下,我们可以来计算一下空间自相关, 空间自相关解释什么东西 呢?解释的是,这些病患的数据,是否与空间分布又关系?也就是说, 一个县本身的肺癌病患数量,是否与他周边的县的肺癌病患数量有关? 这种判定,需要同时从空间上和属性上来判定。全局莫兰指数是一个在-1 1之间的数,如下所示:I-1负相关的程度 正相关的程度当然,解读的时

19、候,还需要有 P值和Z得分来判定,P值和Z得分的相 关内容,也请看以前写过的博客。在 ArcGIS 中,工具在如下位置:Spatial Statistics ToolsAn alyz ing Patter nsSpatial Autocorrelati on(Moran's I)ArcToolbox:+ 令 Spatial Analyst TookQ SpatialTools- 也 Andlyjng Patterns* Av&riage Mearet Neigkbor;f High/Low 匚lus-tering (GetisOrd General G) / Increfnen

20、tal ptial Auto correctionMulti-Di!tan« Spatial Cluster Analysis (RipleSpatial Autoco-relation (Morans l1+i 务 Mapping 匚luter&+' 蛰 Measuring Geographic Distributions + Modeling Spatial R亡b£onships'h 筍 Rendering 曰 Utilities:Calculjte- Areas了 匚alculte Dirtan匚色 Sand from Meighbor 匚o

21、l FN卜翻开之后,相关参数说明如下:r.,r* ptial Auto correct ton : Mcri nz I;生形抿否G4.-F.告>咸结Input F ohlxnig_LJI6® Input Fi*l<l1300一输入你的空间数据日同要进行评估是否自相关的字段.一般是数(jen#r 1+ & Report (cpti anal)CoikCpluftllz.ttion of SpLtial R»latioiishipCDHTIGUTTY_EDGES_CORMEESDistance Method'I EUCLIBEWI_DISTANCES

22、电sail"RDFDi31« BAikd Thrsh&ld ListE竺cptuali t壷ti.Mi 。萱_R虑昨2:tiKTlJITY酗缸二C沿狂陋IFVERSE 1ISTAWEINVERSE 1ISTAWCE_SQUARED FIIED DISTAMCE RWZOnjF IllDIFFiHCECqjjfGWTTT_RGIS_tJHn匚1 rn Z JI TED G_C?(j FJ匡吃GET SFATIL WEIGlfTS FRC1 TILEWmatrix File (opt 1 oitiJLj&KCancelEnvraimente.- j«

23、Htde Help这里空间关系概念化我选择了 CONTIGUITY_EDGES_CORN也就是所谓的Queen's Case,共边共点都被视为邻接要素。这个参数的选择非常重要,一定要注意选择。然后计算如下,如果不勾选生成图形结果报告,直接会弹出以下计算结果:很容易看出:P值大于0.05的95噓信度,而且Z得分也没有过1.65这个临界值,也就说这个数据偏向于随机了剩下的结果根本上不用读,解读的方法,请大家看以前写P值和Z得分。当然,如果你勾选了生成图形结果报告,还会生成一个html的页面,如下:Spatial Autocorrelation ReportHoran1Crittul Val

24、ue 2*5core c -2.5 8-2.50 - -1,56 -1- 9G £.£5 -1.65 " 1.&5 1-65 一 lr96 1-9G - 238 > 2-38Random:ClusteredGiven the 2-score of 1.266657945, the pattern does not appear to te significantiy different than randgmGlobal Moran's I SummaryMoran's Index:0.054501Expected Index;-0.

25、011494Variance:0.0028027-score:1.246666Rvalue:0.212520这个报告就直接告诉,你的z得分没有过临界值,所以数据显著的表现出了随机模式我们依次把78年、88年的数据都计算完成,计算结果如下:1978 年:5tart Tinie: Tue Mai IE:03:S9 201*scxpt- SprialAurccciel-atior-mEIE:Jiie input 工巳己p二工亡 class 殆亡曰 nor appeaxGlobal Mc:ran f s I Summary'Icxar:' g Iziden;fjExpected Ind

26、e«:0 <0119Variance:0 0030532-seere:1.655512p-value:0.OS7B21-Writing hmi report.E : wo2rkspaceGIS datadaraohloMorana 1 Resulrl. honl Completed sciipt Spatialtocaxielarior .*Succeeded at Tua Kar 15 14:03 :40 201 卫lped Tire: 0*43 seconds1II1988 年: MessagesIStaxt Time: Tue Hax 15 14:06:02 201R-i

27、ng sexist Sati&lAutGccxrlaicn WAE21ING -S£ = Tiie npuc iearie clas deei not appear pq cQntain e二n二亡匚匸巳3 P己匸曰Global Mgish ' s I SurmaiyNcan1s Index:0lOEffi9Expected Indeji:7、01.43Variance:0003153z-score :2-143381c-value:0.032083Writing hrnLL xeport + * .E :wcrksE;aceGIS_dflt&d注t:呂otL

28、iQllQ工眞说£工_號圭吕诅ltd . hntl Ccitfileted sci2.pr SpatalAi匸qcq工工电丄NtiQ土 . Succeeded ac Tue £(ar 15 14; 06:03 2C1 (Classed Tine : C T 32 seconds生成的图形报告如下:Spatial Autocorrelation RpportMoran's Index1978年Spatial Aiitacorretation ReportMoran s Index: restore: value; H1988 年Given tiie z-score of 1.&55511B&8&3, there is a less than 10H Ifkelihood that this clustered p-attm could be the neailtof random chance.Given the r-scoie of 2.I ess tha

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论