版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章空间数据的统计分析本ppt课件现在是1页\一共有88页\编辑于星期五2空间点模式分析方法面状数据空间模式分析方法现在是2页\一共有88页\编辑于星期五3空间点模式分析方法现在是3页\一共有88页\编辑于星期五4空间点模式分析方法在地图上,居民点、商店、旅游景点、流行病、犯罪现场、交通事故发生地等都表现为点的特征,有些是具体的地理实体对象,有些则是曾经发发生的事件的地点。这些地理对象或事件(点)的空间分布模式对于城市规划、服务设施布局、商业选址、流行病的控制等具有重要的作用。根据实体或事件的空间位置研究其分布模式的方法称为空间点模式。现在是4页\一共有88页\编辑于星期五5空间点模式分析方法点模式分析技术曾经在20世纪60年代的计量革命时代十分盛行,但是早期的系统和方法缺乏直观的地图表示。随着GIS的发展和地理空间数据的丰富,以及对GIS空间分析能力的广泛需求促进了空间数据分析方法的发展。点模式空间统计分析方法重新引起了人们的兴趣,基于GIS或地图环境的交互式模式分析工具不断出现,或作为方法库被统计分析程序所调用,或作为GIS软件包的宏模块,或作为空间分析软件包的函数。现在是5页\一共有88页\编辑于星期五6空间点模式分析方法空间点模式的概念点模式是研究区域R内的一系列点的组合[S1=(x1,y1),S2=(x2,y2),…,Sn=(xn,yn)]其中,Si是第i个观测事件的空间位置。研究区域R的形状可以是矩形,也可以是复杂的多边形区域。现在是6页\一共有88页\编辑于星期五7空间点模式分析方法点在空间上的分布千变万化,但不会超出从均匀到集中的模式。一般将点模式区分为三种基本类型:聚集分布、随机分布、均匀分布。区域内点集对象或事件分布模式的基本问题:这些对象或事件的分布是随机的、均匀的、还是聚集的?研究分布的模式对于探索导致这一分布模式形成的原因非常重要。例如:在一个城市区域中大型商业网点的空间分布模式是否显著地影响了餐饮网点的分布,这是二元空间点模式问题。现在是7页\一共有88页\编辑于星期五8从统计学的角度,地理现象或事件出现在空间任意位置都是有可能的。如果没有某种力量或者机制来“安排”事件的出现,那么分布模式最有可能是随机分布的,否则将以规则或者聚集的模式出现。对于此类问题,地理世界中的事物可能存在某种联系。一种现象的分布模式是否对另一种现象的分布模式产生影响也是点模式需要解决的重要问题。空间点模式分析方法现在是8页\一共有88页\编辑于星期五9点模式空间分析方法空间模式的研究一般是基于所有观测点事件在地图上的分布,也可以是样本点的模式。点模式关心的是空间点分布的聚集性和分散性问题,地理学家在研究过程中发展了两类点模式分析方法:(1)以聚集性为基础的基于密度的方法:主要有样方计数法和核函数方法两种;(2)以分散性为基础的基于距离的技术:通过测度最近邻点的距离分析点的空间分布模式,主要包括最邻近指数、G-函数、F-函数、K-函数方法等。空间点模式分析方法现在是9页\一共有88页\编辑于星期五10基于密度的方法——样方计数法与核函数法样方分析:样方分析(quadratanalysis,QA)是研究空间点模式最常用的直观方式。基本思想:通过空间上点分布密度的变化探索空间分布模式,一般使用随机分布模式作为理论上的标准分布,将QA计算的点密度和理论分布做比较,判断点模式属于聚集分布、均匀分布还是随机分布。现在是10页\一共有88页\编辑于星期五11基于密度的方法——样方计数法与核函数法样方分析:QA的一般过程:(1)将研究区域划分为规则的正方形网格区域;(2)统计落入每个网格中点的数量。由于点在空间上分布的疏密性,有的网格中点的数量多,有的网格中点的数量少,有的网格中点的数量甚至为零;(3)统计出包含不同数量点的网格数量的频率分布。(4)将观测得到的频率分布和已知的频率分布或理论上的随机分布(如泊松分布)作比较,判断点模式的类型。现在是11页\一共有88页\编辑于星期五12样方分析方法QA中对分布模式的判别产生影响的主要因素:样方的形状,采样的方式,样方的起点、方向和大小等,这些因素会影响到点的观测频次和分布。QA分析中样方的形状一般采用正方形的网格覆盖,也可以自己定义样方的形状,如圆形、正六边形等,以适合于所要研究的问题。无论采用何种形式的样方要求网格形状和大小必须一致,以避免在空间上的采样不均匀。现在是12页\一共有88页\编辑于星期五13样方分析方法除了规则网格外,采用固定尺寸的随机网格也能得到同样的效果。从统计意义上看,使用大量的随机样方估计才能获得研究区域点密度的公平估计。现在是13页\一共有88页\编辑于星期五14样方的尺寸选择对计算结果会产生很大的影响。(b)和(c)两种不同尺寸的网格,可能会导致不同的分析结论。根据专家的研究,最优的样方尺寸是根据区域的面积和分布于其中的点的数量确定的,计算公式为:Q=2A/n式中,
Q是样方的尺寸(面积);A为研究区域的面积;n为研究区域中点的数量。最优样方的边长取
。样方分析方法现在是14页\一共有88页\编辑于星期五15当样方的尺寸确定后,利用这一尺寸建立样方网格覆盖研究区域或者采用随机覆盖的方法,统计落入每个样方中的数量,建立其频率分布。根据得到的频率分布和已知的点模式的频率分布的比较,判断点分布的空间模式。2)样方分析方法现在是15页\一共有88页\编辑于星期五核密度估计法(kerneldensityestimation,KDE)认为地理事件可以发生在空间的任何位置上,但是在不同的位置上,事件发生的概率不一样。点密集的区域事件发生的概率高,点稀疏的地方事件发生的概率低。KDE反映的就是这样一种思想:使用事件的空间密度分析表示空间点模式。和样方计数法相比较,KDE更加适合于可视化方法表示分布模式。核密度估计法16现在是16页\一共有88页\编辑于星期五在KDE中,区域内任意一个位置都有一个事件密度,这是和概率密度对应的概念。空间模式在点S上的密度或强度是可测度的,一般通过测量定义在研究区域中单位面积上的事件数量来估计。最简单的事件密度估计方法是在研究区域中使用滑动的圆来统计出落在圆域内的事件数量,再除以圆的面积,就得到估计点S处的事件密度。核密度估计法17现在是17页\一共有88页\编辑于星期五核密度估计法18根据概率理论,核密度估计的一般定义为:设X1,…,Xn
是从分布密度函数f的总体中抽取的独立同分布样本,估计f在某点x处的值f(x),通常有Rosenblatt-Paren核估计:现在是18页\一共有88页\编辑于星期五19核密度估计法现在是19页\一共有88页\编辑于星期五核密度估计法20现在是20页\一共有88页\编辑于星期五核密度估计法核密度估计法的特点:21现在是21页\一共有88页\编辑于星期五关于KDE中的带宽22核密度估计法现在是22页\一共有88页\编辑于星期五23核密度估计法现在是23页\一共有88页\编辑于星期五KDE中的边缘效应这是位于R内的体积,当R是一个非规则的多边形区域时,将导致计算量的急剧增加。24现在是24页\一共有88页\编辑于星期五KDE方法在热带气旋源地分析中的应用:25现在是25页\一共有88页\编辑于星期五我们还对1×1经纬度的网格用样方计数法进行了计算。通过两种方法对比可以看出KDE方法能够更好地揭示台风源地的模式。26KDE方法在热带气旋源地分析中的应用:现在是26页\一共有88页\编辑于星期五基于距离的方法最近邻距离法:27最邻近距离法(也称为最邻近指数法)使用最邻近的点对之间的距离描述分布模式,形式上相当于密度的倒数(每个点代表的面积),表示点间距。最邻近距离法首先计算最邻近的点对之间的平均距离,然后比较观测模式和已知模式之间的相似性。一般将随机模式作为比较的标准,如果观测模式的最邻近距离大于随机分布的最邻近距离,则观测模式趋向于均匀,如果观测模式的最邻近距离小于随机分布模式的最邻近距离,则趋向于聚集分布。现在是27页\一共有88页\编辑于星期五最邻近距离:28基于距离的方法最邻近距离是指任意一点到其最邻近的点之间的距离。图4.10中编号1的点的最邻近点是2,最邻近距离为3.67。现在是28页\一共有88页\编辑于星期五CSR模式:完全随机模式29基于距离的方法现在是29页\一共有88页\编辑于星期五最近邻指数测度方法30基于距离的方法为了使用最邻近距离测度空间点模式,1954年Clark和Evans提出了最邻近指数法(NNI)。NNI的思想:首先对研究区内的任意一点都计算最邻近距离,然后取这些最邻近距离的均值作为评价模式分布的指标。对于同一组数据,在不同的分布模式下得到的NNI是不同的,根据观测模式的NNI计算结果与CSR模式的NNI比较,即可判断分布模式的类型。聚集模式由于点在空间上多聚集于某些区域,计算得到的NNI应当小于CSR模式的NNI;均匀分布模式下,点之间的距离比较平均,计算得到NNI大于CSR模式的NNI。因此,通过最邻近距离的计算和比较就可以评价和判断分布模式。现在是30页\一共有88页\编辑于星期五NNI的一般计算过程:31基于距离的方法现在是31页\一共有88页\编辑于星期五NNI的一般计算过程:32基于距离的方法现在是32页\一共有88页\编辑于星期五33基于距离的方法现在是33页\一共有88页\编辑于星期五34在现实世界中,观测模式的分布呈现出各种各样的状态,在理论上还存在极端聚集和极端均匀的情况。极端聚集的状态:所有事件发生在研究区域的某一个位置上,R=0;极端均匀的分布模式:均匀区域上邻近的3个点构成等边三角形,即空间被正六边形划分,点位于正六边形的中心。R=2.149。在现实世界中,地理现象或事件的分布方式完全凝聚于一点或被组织为正六边形的情况十分罕见。现在是34页\一共有88页\编辑于星期五显著性检验35现在是35页\一共有88页\编辑于星期五36显著性检验现在是36页\一共有88页\编辑于星期五实例研究37现在是37页\一共有88页\编辑于星期五NNI中通过简单的概念揭示了分布模式的特征,但是只用一个距离的平均值概括所有邻近距离是有问题的。在点的空间分布中,简单的平均最近邻距离概念忽略了最邻近距离的分布信息在揭示模式特征中的作用。如果最近邻距离是均匀分布的,那么均值是唯一的稳健估计。图中给出了用实例数据计算得到的最邻近距离的频率分布直方图,显然这是一种偏态分布,更多点的最邻近距离小于均值99.48km。此外,NNI中,模式的显著性信息被忽略了。G函数与F函数38现在是38页\一共有88页\编辑于星期五G函数和F函数就是用最近邻距离的分布特征揭示空间点模式的方法。这两个函数是关于最邻近距离分布的函数。G函数39G函数与F函数现在是39页\一共有88页\编辑于星期五G函数40现在是40页\一共有88页\编辑于星期五示例如图所示的研究区域中分布有10个事件(点),计算其G函数G函数41现在是41页\一共有88页\编辑于星期五首先,计算最邻近距离,并按照升序对这些距离排序。G函数42现在是42页\一共有88页\编辑于星期五G函数43现在是43页\一共有88页\编辑于星期五根据G(d)曲线的形状分析空间点模式:如果点事件的空间分布趋向聚集,具有较小的最邻近距离的点的数量就多,那么G函数会在较短的距离内快速上升;如果点模式中事件趋向均匀分布,具有较大的最邻近距离的点的数量多,那么G函数值得增加就比较缓慢。如果G(d)在短距离内迅速增长,表明点空间分布属于聚集模式;如果G(d)先缓慢增长后迅速增长,表明点空间分布属于均匀模式。G函数44现在是44页\一共有88页\编辑于星期五图4.16是聚集、随机、均匀三类点模式的G函数曲线的形状。在实际应用中还需要进行显著性检验。45现在是45页\一共有88页\编辑于星期五F函数46现在是46页\一共有88页\编辑于星期五F函数47现在是47页\一共有88页\编辑于星期五F函数48现在是48页\一共有88页\编辑于星期五实例分析F函数49现在是49页\一共有88页\编辑于星期五F函数50现在是50页\一共有88页\编辑于星期五K函数和L函数为了在更加宽泛的尺度上研究地理事件空间依赖性与尺度的关系,Ripley提出了基于二阶性质的K函数方法,随后,Bessage又将K函数变换为L函数。K函数和L函数是描述在各向同性或均质条件下点过程空间结构的良好指标。51现在是51页\一共有88页\编辑于星期五K函数521.定义与K函数估计现在是52页\一共有88页\编辑于星期五K函数531)定义(4.36)现在是53页\一共有88页\编辑于星期五K函数54(4.36)现在是54页\一共有88页\编辑于星期五K函数55现在是55页\一共有88页\编辑于星期五K函数56现在是56页\一共有88页\编辑于星期五K函数573)K函数的边缘效应与校正现在是57页\一共有88页\编辑于星期五K函数582.K函数的点模式判别准则现在是58页\一共有88页\编辑于星期五实例研究K函数59现在是59页\一共有88页\编辑于星期五K函数60现在是60页\一共有88页\编辑于星期五L函数61现在是61页\一共有88页\编辑于星期五62L函数:实例
现在是62页\一共有88页\编辑于星期五63面状数据空间模式分析方法现在是63页\一共有88页\编辑于星期五面状数据是地理学研究中的一类重要数据,很多地理现象都通过规则的或不规则的多边形表示,这类地理现象的显著特点是空间过程与边界明确的面积单元有关。面状数据通过各个面积单元变量的数值描述地理现象的分布特征。例如气候类型区、土壤类型区、土地利用类型区、行政区、人口普查区等。面状数据的空间模式研究的是面积单元的空间关系作用下的变量值的空间模式。面积单元之间的邻接与否、距离远近等对于变量的空间分布具有重要影响。面状数据空间模式分析方法64现在是64页\一共有88页\编辑于星期五空间邻接性就是面积单元之间的“距离关系”,基于“距离”的空间邻接性测度就是使用面积单元之间的距离定义邻接性。测度任意两个面积单元之间的距离的两种方法:(1)按照面积单元是否有邻接关系的邻接法,(2)基于面积单元中心之间距离的重心距离法。空间接近性与空间权重矩阵65现在是65页\一共有88页\编辑于星期五(1)边界邻接法:面积单元之间具有共享的边界,被称为是空间邻接的,用边界邻接可以定义一个面积单元的直接邻接,然后根据邻接的传递关系还可以定义间接邻接,或者多重邻接。(2)重心距离法:面积单元的重心或中心之间的距离小于某个指定的距离,则面积单元在空间上是邻接的。这个指定距离的大小对于一个单元的邻接数量有影响。66现在是66页\一共有88页\编辑于星期五空间权重矩阵是空间邻接性的定量化测度。假设研究区域中有n个多边形,任何两个多边形都存在一个空间关系,这样就有n×n对关系,需要n×n的矩阵存储这n个面积单元之间的空间关系。根据不同准则可以定义不同的空间关系矩阵,主要的空间权重矩阵包括以下几种类型:(1)左右相邻权重:空间对象间的相邻关系从空间方位上考虑,有左右相邻的关系。左右相邻权重的定义如下:67空间接近性与空间权重矩阵现在是67页\一共有88页\编辑于星期五68空间接近性与空间权重矩阵(2)上下相邻权重:空间对象间的相邻关系从空间方位上考虑,也有上下相邻关系。上下相邻权重的定义为:(3)Queen权重的定义:(4)二进制权重的定义:(5)K最近点权重的定义:现在是68页\一共有88页\编辑于星期五69空间接近性与空间权重矩阵现在是69页\一共有88页\编辑于星期五70空间接近性与空间权重矩阵现在是70页\一共有88页\编辑于星期五空间数据的一阶效应反映了研究区域上变量的空间趋势,通常用变量的均值描述这种空间变化。研究一阶效应使用的方法主要是利用空间权重矩阵进行空间滑动平均估计。面状数据的趋势分析71现在是71页\一共有88页\编辑于星期五72面状数据的趋势分析空间滑动平均是利用邻近面积单元的值计算均值的一种方法,称之为空间滑动平均。设区域R中有m个面积单元,对应于第j个面积单元的变量Y的值为yi,面积单元i邻近的面积单元的数量为n个,则均值平滑的公式为:最简单的情况是假设近邻面积单元对i的贡献是相同的,即wij=1/n,则有:现在是72页\一共有88页\编辑于星期五空间自相关是空间地理数据的重要性质,空间上邻近的面积单元中地理变量的相似性特征将导致二阶效应。在面状数据的背景上,二阶效应又称为空间自相关。空间自相关描述的是在空间域中位置上的变量与其邻近位置上同一变量的相关性。对于任何空间变量(属性)Z,空间自相关测度的是Z的近邻值对于Z相似或不相似的程度。如果邻接位置上相互间数值接近,空间模式表现出正空间自相关;如果相互间的数值不接近,空间模式表现出负空间自相关。空间自相关分析73现在是73页\一共有88页\编辑于星期五空间自相关是指一个区域分布的地理事物的某一属性和其他所有事物的同种属性之间的关系,它研究的是不同观察对象的同一属性在空间上的相互关系。空间自相关性使用全局和局部两种指标来度量全局指标用于探测整个研究区域的空间模式,使用单一的值来反映该区域的自相关程度;局部指标计算每一个空间单元与邻近单元就某一属性的相关程度。空间自相关分析74现在是74页\一共有88页\编辑于星期五(1)全局空间关联指标计算全局空间自相关时,可以使用全局Moran’sI统计量、全局Geary’sC统计量和全局Getis-OrdG统计量等方法,它们都是通过比较邻近空间位置观察值的相似程度来测量全局空间自相关的。75空间自相关分析现在是75页\一共有88页\编辑于星期五1)Moran’sI统计量Moran首次提出用空间自相关指数(Moran’sI)研究空间分布现象。Moran’sI系数是用来衡量相邻的空间分布对象及其属性取值之间的关系。其计算公式如下:76空间自相关分析现在是76页\一共有88页\编辑于星期五Moran’sI是最常用的全局自相关指数。其取值范围在-1到1之间,正值表示具有该空间事物的属性取值分布具有正相关性,负值表示该空间事物的属性取值分布具有负相关性,零值表示空间事物的属性取值不存在空间相关,即空间随机分布。77空间自相关分析现在是77页\一共有88页\编辑于星期五78空间自相关分析现在是78页\一共有88页\编辑于星期五79空间自相关分析现在是79页\一共有88页\编辑于星期五Geary’sC统计量全局Geary’sC统计量测量空间自相关的方法与全局Moran’sI相似,其分子的交叉乘积项不同,即测量邻近空间位置观察值近似程度的方法不同。二者的区别:全局Moran’sI的交叉乘积项比较的是邻近空间位置的观察值与均值偏差的乘积,而全局Geary’sC比较的是邻近空间位置的观察值之差。Geary’sC的计算公式:80空间自相关分析现在是80页\一共有88页\编辑于星期五81空间自相关分析现在是81页\一共有88页\编辑于星期五Getis-OrdG统计量Getis-OrdG统计量首先设定一个距离阈值,在给定阈值的情况下,决定各数据的空间关系,然后分析其属性乘积来衡量这些空间对象取值的空间关系。计算公式:82空间自相关分析现在是82页\一共有88页\编辑于星期五Getis-OrdG统计量直接采用邻近空间位置的观察值之积来测量其近似程度,Getis’sG的统计空间自相关性是通过得分检验来进行的:当Z为正值时,表示属性取值较高的空间对象存在空间聚集关系,当Z值为负值时,表示属性取值较低的空间对象存在着空间聚集关系。83空间自相关分析现在是83页\一共有88页\编辑于星期五对于全局Moran’sI和全局Geary’sC两个统计量,如果邻近空间位置的观察值非常接近,并且有统计学意义,提示存在正空间自相关。如果邻近空间位置的观察值差异较大,提示存在负空间自相关。但是,当观察值大的空间位置相互邻近时,全局Moran’sI和全局Geary’sC将得到存在正空间自相关的结论,这种正空间自相关通常称为“热点区(hotspots)”;它同样可以由观察值低的空间位置相互邻近而得到,这种正空间自相关通常称为“冷点区(coldspots)”。而全局Getis-OrdG的优势则在于可以非常好地区分这两种不同的正
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度电站技术培训与转让合同3篇
- 留学项目合同范例
- 承包荒山开采合同范例
- 私人汽车抵账合同范例
- 沙厂合作合同范例
- 2024年度汽车抵押贷款居间服务合同模板3篇
- 牡丹供货合同模板
- 私人服装定制合同范例
- 新能源公司合同范例
- 2024年度汽车驾驶员雇佣协议5篇
- 智慧学校(智慧教育)智慧校园创建工作汇报-强管理、重应用、促提升
- 多路温度采集系统设计与实现
- 泥浆材料及处理剂大全
- 临床基因扩增检验操作规范
- PS+6000+综合自动化系统教学
- 《空气能占据空间吗》教学反思
- 标准化沟通在临床护理中的应用PPT幻灯片课件
- 苏教版四年级上册小学数学《简单的周期》课件(公开课)
- 生活垃圾分类(课件)小学生垃圾分类主题班会
- 临床药师工作考核制度
- 畜禽养殖污染物产生与排放量
评论
0/150
提交评论