第四章 空间统计分析初步课件_第1页
第四章 空间统计分析初步课件_第2页
第四章 空间统计分析初步课件_第3页
第四章 空间统计分析初步课件_第4页
第四章 空间统计分析初步课件_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章空间统计分析甘肃农业大学资源与环境学院第四章+空间统计分析初步本章主要内容第一节探索性空间统计分析

第二节地统计分析方法第四章+空间统计分析初步空间统计分析,即空间数据(spatialdata)的统计分析,是现代计量地理学中一个快速发展的方向和领域。空间统计分析,其核心就是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关,通过空间位置建立数据间的统计关系。空间统计分析的任务,就是运用有关统计方法,建立空间统计模型,从凌乱的数据中挖掘空间自相关与空间变异规律。

空间统计分析第四章+空间统计分析初步空间数据分析与传统统计分析主要有两大差异:(1)空间数据间并非独立,而是在维空间中具有某种空间相关性,且在不同的空间分辨率下呈现不同之相关程度;(2)地球只有一个,大多数空间问题仅有一组(空间分布不规则的)观测值,而无重复观测数据。因此,空间现象的了解与描述是极为复杂的,而传统方法,尤其是建立在独立样本上的统计方法,不适合分析空间数据。空间统计VS.经典统计经典统计:独立性、随机性假设空间统计:自相关、依赖性、异质性第四章+空间统计分析初步地理学第一定律(FLG):everythingisrelatedtoeverythingelse,butnearthingsaremorerelatedthandistantthings(Tobler,1970).空间统计的基本思想:WaldoTobler(bornin1930)receivingaplaqueforhiscontributionstogeography.OntheeventofhisNovember2000birthday.

Tobler,W.R.(1970)."AcomputermoviesimulatingurbangrowthintheDetroitregion".EconomicGeography,46(2):234-240.FLG的一般性:自然地理、人文地理、社会经济第四章+空间统计分析初步空间自相关是普遍存在的,否则地理分析便没有多大意义。

经典统计:独立

空间自相关的存在,使得经典统计学所要求的样本独立性假设不满足。如果地理学从根本上值得研究,必然是因为地理现象在空间上的变化不是随机的。

经典统计:随机第四章+空间统计分析初步可以借助空间统计更好地理解地理现象。

或许学习空间统计最重要的原因是我们不仅仅想知道问题“怎么样”,更想知道“哪里怎么样”

空间统计学可以帮助我们准确地判断具体地理模式的原因。

JohnSnow的霍乱地图

当发现某种病仅仅发生在靠近河流的村庄时,河流中的寄生物可能是病源。空间统计学可以帮助我们处理大的复杂数据集,这是GIS经常面对的事情。为什么要用空间统计第四章+空间统计分析初步霍乱病死者居住分布图(JohnSnow,1854)1854年8月到9月英国伦敦霍乱流行时,当局始终找不到发病的原因,后来医生约翰·斯诺(JohnSnow)参与调查。他在绘有霍乱流行地区所有道路、房屋、饮用水机井等内容的1:6500比例尺地图上,标出了每个霍乱病死者的居住位置,得到了霍乱病死者居住分布图。第四章+空间统计分析初步第1节探索性空间统计分析

基本原理与方法

应用实例

第四章+空间统计分析初步探索性空间数据分析(ESDA)ESDA是指利用统计学原理和图形图表相结合对空间信息的性质进行分析、鉴别,用以引导确定性模型的结构和解法。ESDA与EDA区别在于它考虑了数据的空间特性,在方法上它将数据分解为一般趋势和叠加于其上的局部变化两部分。然后用一定的数学函数去拟合由样本点产生的经验变率函数,进行诸如克立格内插等空间操作。第四章+空间统计分析初步

通常定义一个二元对称空间权重矩阵W,来表达n个位置的空间区域的邻近关系,其形式如下式中:Wij表示区域i与j的临近关系,它可以根据邻接标准或距离标准来度量。

一、基本原理与方法

(一)空间权重矩阵

第四章+空间统计分析初步①简单的二进制邻接矩阵②基于距离的二进制空间权重矩阵两种最常用的确定空间权重矩阵的规则

第四章+空间统计分析初步(二)全局空间自相关

Moran指数反映的是空间邻接或空间邻近的区域单元属性值的相似程度。

Geary系数与Moran指数存在负相关关系。

PatrickA.P.Moran(1917-1988)Moran指数和Geary系数是两个用来度量空间自相关的全局指标。第四章+空间统计分析初步

如果是位置(区域)的观测值,则该变量的全局Moran指数I,用如下公式计算式中:I为Moran指数;

;。第四章+空间统计分析初步Geary系数C计算公式如下

式中:C为Geary系数;其他变量同上式。如果引入记号第四章+空间统计分析初步

则全局Moran指数I的计算公式也可以进一步写成

Moran指数I的取值一般在[-1,1]之间,小于0表示负相关,等于0表示不相关,大于0表示正相关;

Geary系数C的取值一般在[0,2]之间,大于1表示负相关,等于1表示不相关,而小于1表示正相关。

第四章+空间统计分析初步

对于Moran指数,可以用标准化统计量Z来检验n个区域是否存在空间自相关关系,Z的计算公式为

当Z值为正且显著时,表明存在正的空间自相关,也就是说相似的观测值(高值或低值)趋于空间集聚;当Z值为负且显著时,表明存在负的空间自相关,相似的观测值趋于分散分布;当Z值为零时,观测值呈独立随机分布。

第四章+空间统计分析初步G系数探测高值聚集的能力强于低值聚集;当研究范围内同时存在高值和低值聚集时,G系数会受聚集区域规模的影响,当高值聚集区域和低值聚集区域规模相当时,G系数往往为正数,表明G系数对高值敏感;Moran指数主要受聚集区域规模的影响,随着空间聚集范围的扩展,Moran指数会明显增大。第四章+空间统计分析初步

(三)局部空间自相关

局部空间自相关分析方法包括3种:

空间联系的局部指标(LISA);

G统计量;

Moran散点图。第四章+空间统计分析初步空间联系的局部指标(LISA)

空间联系的局部指标(localindicatorsofspatialassociation,缩写为LISA)满足下列两个条件:(1)每个区域单元的LISA,是描述该区域单元周围显著的相似值区域单元之间空间集聚程度的指标;(2)所有区域单元LISA的总和与全局的空间联系指标成比例。第四章+空间统计分析初步LISA包括局部Moran指数(localMoranindex)和局部Geary指数(localGearyindex),下面重点介绍和讨论局部Moran指数。第四章+空间统计分析初步

局部Moran指数被定义为可进一步写成

式中:和是经过标准差标准化的观测值。

局部Moran指数检验的标准化统计量为

第四章+空间统计分析初步G统计量

全局G统计量的计算公式为对每一个区域单元的统计量为

第四章+空间统计分析初步

对统计量的检验与局部Moran指数相似,其检验值为

显著的正值表示在该区域单元周围,高观测值的区域单元趋于空间集聚,而显著的负值表示低观测值的区域单元趋于空间集聚,与Moran指数只能发现相似值(正关联)或非相似性观测值(负关联)的空间集聚模式相比,具有能够探测出区域单元属于高值集聚还是低值集聚的空间分布模式。第四章+空间统计分析初步Moran散点图

以(Wz,z)为坐标点的Moran散点图,常来研究局部的空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视化的二维图示。全局Moran指数,可以看作是Wz对于z的线性回归系数,对界外值以及对Moran指数具有强烈影响的区域单元,可通过标准回归来诊断出。由于数据对(Wz,z)经过了标准化,因此界外值可易由2-sigma规则可视化地识别出来。第四章+空间统计分析初步Moran散点图的4个象限,分别对应于区域单元与其邻居之间4种类型的局部空间联系形式:第1象限代表了高观测值的区域单元被高值的区域所包围的空间联系形式;第2象限代表了低观测值的区域单元被高值的区域所包围的空间联系形式;第四章+空间统计分析初步

第3象限代表了低观测值的区域单元被低值的区域所包围的空间联系形式;第4象限代表了高观测值的区域单元被低值的区域所包围的空间联系形式。第四章+空间统计分析初步

与局部Moran指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值、低值和低值、高值和低值、低值和高值之中的哪种空间联系形式。并且,对应于Moran散点图的不同象限,可识别出空间分布中存在着哪几种不同的实体。将Moran散点图与LISA显著性水平相结合,也可以得到所谓的“Moran显著性水平图”,图中显示出显著的LISA区域,并分别标识出对应于Moran散点图中不同象限的相应区域。

第四章+空间统计分析初步二、应用实例

中国大陆30个省级行政区人均GDP的空间关联分析。根据各省(直辖市、自治区)之间的邻接关系,采用二进制邻接权重矩阵,选取各省(直辖市、自治区)1998—2002年人均GDP的自然对数,依照公式计算全局Moran指数I,计算其检验的标准化统计量Z(I),结果如下表所示。年份IZP19980.50014.50350.000019990.50694.55510.000020000.51124.59780.000020010.50594.55320.000020020.50134.53260.0000第四章+空间统计分析初步

从表中可以看出,在1998—2002年期间,中国大陆30个省级行政区人均GDP的全局Moran指数均为正值;在正态分布假设之上,对Moran指数检验的结果也高度显著。这就是说,在1998—2002年期间,中国大陆30个省级行政区人均GDP存在着显著的、正的空间自相关,也就是说各省级行政区人均GDP水平的空间分布并非表现出完全的随机性,而是表现出相似值之间的空间集聚,其空间联系的特征是:较高人均GDP水平的省级行政区相对地趋于和较高人均GDP水平的省级行政区相邻,或者较低人均GDP水平的省级行政区相对地趋于和较低人均GDP水平的省级行政区相邻。第四章+空间统计分析初步

选取2001年我国30个省级行政区人均GDP数据,计算局部Gi统计量和局部Gi统计量的检验值Z(Gi),并绘制统计地图如下。第四章+空间统计分析初步

检验结果表明,贵州、四川、云南西部3省的Z值在0.05的显著性水平下显著,重庆的Z值在0.1的显著性水平下显著,该4省市在空间上相连成片分布,而且从统计学意义上来说,与该区域相邻的省区,其人均GDP趋于为同样是人均GDP低值的省区所包围。由此形成人均GDP低值与低值的空间集聚,据此可认识到西部落后省区趋于空间集聚的分布特征。

第四章+空间统计分析初步

东部的江苏、上海、浙江三省市的Z值在0.05的显著性水平下显著,天津的Z值在0.1的显著性水平下显著。而东部上海、江浙等发达省市趋于为一些相邻经济发展水平相对较高的省份所包围,东部发达地区的空间集聚分布特征也显现出来。第四章+空间统计分析初步

以(Wz,z)为坐标,进一步绘制Moran散点图可以发现,多数省(直辖市、自治区)位于第1和第3象限内,为正的空间联系,属于低低集聚和高高集聚类型,而且位于第3象限内的低低集聚类型的省(直辖市、自治区)比位于第1象限内的高高集聚类型的省(直辖市、自治区)更多一些。第四章+空间统计分析初步第四章+空间统计分析初步

上图进一步显示了30个省级行政区人均GDP局部集聚的空间结构。可以看出,从人均GDP水平相对地来看:高值被高值包围的高高集聚省(直辖市)有:北京、天津、河南、安徽、湖北、江西、海南、广东、福建、浙江、山东、上海、江苏;低值被低值包围的低低集聚省(自治区)有:黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、贵州;被低值包围的高值省(直辖市)有:重庆、广西、河北;被高值包围的低值省份只有湖南。第四章+空间统计分析初步1978、1990、2001和2007年人均GDP的Moran散点图第四章+空间统计分析初步1978、1990、2001、2007年全国各省市人均GDP的LISA显著水平图第四章+空间统计分析初步上海市1990,2000年人口密度变化自相关分析第四章+空间统计分析初步第四章+空间统计分析初步第2节地统计分析方法地统计方法的基本原理

应用实例

第四章+空间统计分析初步地统计学(Geostatistics),又称地质统计学,是法国著名统计学家G.Matheron在大量理论研究基础上提出的。地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关和依赖性,或空间格局与变异,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性。协方差函数和变异函数是以区域化变量理论为基础建立起来的地统计学的两个最基本的函数。地统计学的主要方法之一,克立格法就是建立在变异函数理论和结构分析基础之上的。

第四章+空间统计分析初步

当一个变量呈现为空间分布时,就称之为区域化变量(regionalizedvariable)。这种变量常常反映某种空间现象的特征,用区域化变量来描述的现象称之为区域化现象。

区域化变量,亦称区域化随机变量,G.Matheron(1963)将它定义为以空间点x的三个直角坐标为自变量的随机场区域化变量具有两个最显著,而且也是最重要的特征,即随机性和结构性。一、地统计方法的基本原理

(一)区域化变量

第四章+空间统计分析初步区域化变量是一种在空间上具有数值的实函数,它具有以下属性:空间局限性连续性各向异性区域化变量被限制于一定空间范围,这称为几何域。在几何域内,区域化变量的属性最为明显;在几何域外,不明显。不同的区域化变量具有不同程度的连续性,用区域化变量的半变异函数来描述。当区域化变量在各个方向上具有相同性质时称各向同性,否则称为各向异性。第四章+空间统计分析初步其它属性:①区域化变量在一定范围内呈一定程度的空间相关,当超出这一范围之后,相关性变弱甚至消失。②对于任一区域化变量,特殊的变异性可以叠加在一般的规律之上。第四章+空间统计分析初步随机变量随机函数随机过程随机场区域化变量与时间有关的随机函数带有多个(2个以上)自变量的随机函数以空间点的三个直角坐标为自变量第四章+空间统计分析初步1962年,法国学者Matheron提出区域化变量的理论并创立了地质统计学,在实践中不断得以完善。1963年,Matheron将区域化变量定义为:以空间点的三个直角坐标为自变量的随机场。ProfessorGeorgesMatheron(1930-2000.8.7)法国数学家和地质学家

第四章+空间统计分析初步区域化变量的功能:

由于区域化变量是一种随机函数,因而能同时反映空间变量的结构性和随机性。一方面,当空间点x固定后,Z(x)就是一个随机变量,这体现了其随机性。另一方面,在空间两个不同点x与x+h处的区域化变量值具有某种程度的相关性,这体现了其结构性。第四章+空间统计分析初步区域化变量的组成部分

数据点结构性可以用均值和常数趋势表示空间相关数据通常呈现正空间相关性

随机性测量误差,其他误差

第四章+空间统计分析初步第四章+空间统计分析初步distance

elevation

结构性随机性实际值第四章+空间统计分析初步(二)协方差函数

协方差函数的概念

区域化随机变量之间的差异,可以用空间协方差来表示。在概率论中,随机向量X与Y的协方差被定义为

区域化变量在空间点x和x+h处的两个随机变量和的二阶混合中心矩定义为Z(x)的自协方差函数,即(4.2.2)(4.2.1)第四章+空间统计分析初步协方差函数的计算公式

式中:h为两样本点空间分隔距离或距离滞后;为在空间位置处的实测值;是在处距离偏离h的实测值[i=1,2,…,],是分隔距离为h时的样本点对(paris)总数,和分别为和的样本平均数,即(4.2.3)(4.2.4)(4.2.5)第四章+空间统计分析初步

若==m(常数),则上式可以改写为

式中:m为样本平均数,可由一般算术平均数公式求得,即

(4.2.6)第四章+空间统计分析初步(三)变异函数

变异函数的概念

变异函数(variograms),又称变差函数、变异矩,是地统计分析所特有的基本工具。在一维条件下变异函数定义为,当空间点x在一维x轴上变化时,区域化变量Z(x)在点x和x+h处的值Z(x)与Z(x+h)差的方差的一半为区域化变量Z(x)在x轴方向上的变异函数,记为γ(h),即

(4.2.7)第四章+空间统计分析初步

在二阶平稳假设条件下,对任意的h有因此,公式可以改写为

从上式可知,变异函数依赖于两个自变量x和h,当变异函数仅仅依赖于距离h而与位置x无关时,可改写成,即

(4.2.9)(4.2.8)第四章+空间统计分析初步变异函数的性质

设Z(x)是区域化变量,在满足二阶平稳假设条件下,变异函数式具有如下性质:

(1)=0,即在h=0处,变异函数为0;

(2)=,即关于直线h=0是对称的,它是一个偶函数;

(3)≥0,即只能大于或等于0;第四章+空间统计分析初步(4)|h|→∞时,→c(0)或=c(0),即当空间距离增大时,变异函数接近先验方差

(5)[-]必须是一个条件非负定函数,由[-]构成的变异函数矩阵在条件时,为非负定的。第四章+空间统计分析初步变异函数的计算公式

设是系统某属性Z在空间位置x处的值,为一区域化随机变量,并满足二阶平稳假设,h为两样本点空间分隔距离,和分别是区域化变量在空间位置和处的实测值[i=1,2,…,N(h)],那么,变异函数的离散计算公式为(4.2.10)第四章+空间统计分析初步

这样对不同的空间分隔距离h,计算出相应的和值。如果分别以h为横坐标,或为纵坐标,画出协方差函数和变异函数曲线图,就可以直接展示区域化变量Z(x)的空间变异特点。可见,变异函数能同时描述区域化变量的随机性和结构性,从而在数学上对区域化变量进行严格分析,是空间变异规律分析和空间结构分析的有效工具。第四章+空间统计分析初步第四章+空间统计分析初步例如:假设某地区降水量Z(x)(单位:mm)是二维区域化随机变量,满足二阶平稳假设,其观测值的空间正方形网格数据如图4.2.1所示(点与点之间的距离为h=1km)。试计算其南北方向及西北和东南方向的变异函数。第四章+空间统计分析初步图4.2.1空间正方形网格数据(点间距h=1km)

从图4.2.1可以看出,空间上有些点,由于某种原因没有采集到。如果没有缺失值,可直接对正方形网格数据结构计算变异函数;在有缺失值的情况下,也可以计算变异函数。只要“跳过”缺失点位置即可(图4.2.2)。第四章+空间统计分析初步图1

空间正方形网格数据(点间距h=100m)

第四章+空间统计分析初步第四章+空间统计分析初步

首先计算南北方向上的变异函数值,由变异函数的计算公式可得

=385/72=5.35图4.2.2缺失值情况下样本数对的组成和计算过程

☉为缺失值

第四章+空间统计分析初步

同样计算出最后,得到南北方向和西北—东南方向上的变异函数计算结果见下表。同样可以计算东西方向上的变异函数。

方向

南北

方向

西北—东南

h12345h1.412.824.245.657.07N(h)

362721135N(h)

322113825.359.2617.5525.6922.907.0612.9530.8558.1350.00第四章+空间统计分析初步变异函数的参数

变异函数有4个非常重要的参数,即基台值(sill)、变程(range)或称空间依赖范围(rangeofspatialdependence)、块金值(nugget)或称区域不连续性值(localizeddiscontinuity)和分维数(fractaldimension)。前3个参数可以直接从变异函数图中得到。它们决定变异函数的形状与结构。变异函数的形状反映自然现象空间分布结构或空间相关的类型,同时还能给出这种空间相关的范围。第四章+空间统计分析初步

当变异函数随着间隔距离h的增大,从非零值达到一个相对稳定的常数时,该常数称为基台值C0+C。当间隔距离h=0时,γ(0)=C0,该值称为块金值或块金方差(nuggetvariance)。基台值是系统或系统属性中最大的变异,变异函数达到基台值时的间隔距离a称为变程。变程表示在h≥a以后,区域化变量Z(x)空间相关性消失。块金值表示区域化变量在小于抽样尺度时非连续变异,由区域化变量的属性或测量误差决定。

第四章+空间统计分析初步

上述3个参数可从变异函数曲线图直接得到,或通过估计曲线回归参数得到。第4个参数,即分维数用于表示变异函数的特性,由变异函数和间隔距离h之间的关系确定分维数D为双对数直线回归方程中的斜率,它是一个无量纲数。分维数D的大小,表示变异函数曲线的曲率,可以作为随机变异的量度。第四章+空间统计分析初步理论变异函数模型实践中,常用的是变异函数图:偏基台值:C(partialsill)块金值:C0(nugget)变程:a(range)h基台值(sill)notrelatedanymore变程范围内才有结构性变化(有规律的变化)反映随机性大小:主要来源于区域化变量Z(x)在小于抽样尺度h时所具有的内部变异;另外还有抽样分析误差。变异函数是一个单调不减函数。当h超过某一个范围,例如变程,变异函数不再增大,而是趋于一个极限值,即为基台值。实际上等于区域化变量的先验方差。即,即基台值与块金值之差,表示数据中存在空间相关性引起的方差变化范围。第四章+空间统计分析初步变异函数的理论模型

地统计学将变异函数理论模型分为3大类:第1类是有基台值模型,包括球状模型、指数模型、高斯模型、线性有基台值模型和纯块金效应模型;第2类是无基台值模型,包括幂函数模型、线性无基台值模型、抛物线模型;第3类是孔穴效应模型。下面有代表性地介绍几种常见的变异函数理论模型。第四章+空间统计分析初步

①纯块金效应模型:其一般公式为式中:c0>0,为先验方差。该模型相当于区域化变量为随机分布,样本点间的协方差函数对于所有距离h均等于0,变量的空间相关不存在。

(4.2.11)第四章+空间统计分析初步②球状模型:其一般公式为

式中:c0为块金(效应)常数;c为拱高;c0+c为基台值;a为变程。当c0=0,c=1时,称为标准球状模型。球状模型是地统计分析中应用最广泛的理论模型,许多区域化变量的理论模型都可以用该模型去拟合。

(4.2.12)第四章+空间统计分析初步

③指数模型:其一般公式为式中:c0和c意义与前相同,但a不是变程。当h=3α时,,即,从而指数模型的变程约为。当c0=0,c=1时,称为标准指数模型。(4.2.13)第四章+空间统计分析初步④高斯模型:其一般公式为式中:c0和c意义与前相同,a也不是变程。当时,,即,因此高斯模型的变程约为。当时,称为标准高斯函数模型。(4.2.14)第四章+空间统计分析初步⑤幂函数模型:其一般公式为式中:θ为幂指数。当θ变化时,这种模型可以反映在原点附近的各种性状。但是θ必须小于2,若,则函数就不再是一个条件非负定函数了,也就是说它已经不能成为变异函数了。

(4.2.15)第四章+空间统计分析初步⑥对数模型:其一般公式为显然,当,这与变异函数的性质不符。因此,对数模型不能描述点支撑上的区域化变量的结构。(4.2.16)第四章+空间统计分析初步

⑦线性有基台值模型:其一般公式为

式中:该模型的变程为a,基台值为。

⑧线性无基台值模型:其一般公式为

从式中可以看出,该模型没有基台值,也没有变程。

(4.2.18)(4.2.17)第四章+空间统计分析初步第四章+空间统计分析初步例如:某地区降水量是一个区域化变量,其变异函数的实测值及距离h的关系见下表,下面我们试用回归分析方法建立其球状变异函数模型。实测值γ(h)距离h实测值γ(h)距离h2.10.69.24.94.31.110.35.15.72.210.56.26.52.510.97.57.83.111.29.58.83.812.49.8第四章+空间统计分析初步

从上面的介绍和讨论,我们知道,球状变异函数的一般形式为当时,有第四章+空间统计分析初步

如果记,则可以得到线性模型

根据表中的数据,对上式进行最小二乘拟合,得到

(4.2.20)

计算可知,上式的显著性检验参数F=114.054,R2=0.962,可见模型的拟合效果是很好的。(4.2.19)第四章+空间统计分析初步

比较(4.2.20)式与(4.2.19)式,并做简单计算可知:c0=2.048,c=1.154,a=8.353,所以,球状变异函数模型为(4.2.21)第四章+空间统计分析初步(四)克立格插值方法

克立格(Kriging)插值法,又称空间局部估计或空间局部插值法,是地统计学的主要内容之一。克立格法是建立在变异函数理论及结构分析基础之上的,它是在有限区域内对区域化变量的取值进行无偏最优估计的一种方法。克立格法适用的条件是,如果变异函数和相关分析的结果表明区域化变量存在空间相关性。其实质是利用区域化变量的原始数据和变异函数的结构特点,对未采样点的区域化变量的取值进行线性无偏、最优估计。从数学角度抽象来说,克立格是一种对空间分布数据求最优、线性、无偏内插估计量(BestLinearUnbaiasedEstimation)方法。具体来说,它是根据待估样点(或待估块段)有限邻域内若干已测定的样点数据,在认真考虑样点的形状、大小和空间相互位置关系,它们与待估样点相互空间位置关系,以及变异函数提供的结构信息之后,对该待估样点值进行的一种线性无偏最优估计。第四章+空间统计分析初步

克立格插值(kriginginterpolation)是根据变异函数模型而发展起来的一系列地统计的空间插值方法,包括:普通克立格法(ordinarykriging);

泛克立格法(universalkriging);

指示克立格法(indicatorkriging);

析取克立格法(disjunctivekriging);

协同克立格法(cokriging)等。下面仅对普通克立格法作一些简单介绍。第四章+空间统计分析初步

首先假设区域化变量满足二阶平稳假设和本征假设,其数学期望为m,协方差函数及变异函数存在。即

假设在待估计点(x)的临域内共有n个实测点,即x1,x2,…,xn,其样本值为。那么,普通克里格法的插值公式为

(4.2.22)第四章+空间统计分析初步

其中为权重系数,表示各空间样本点处的观测值对估计值的贡献程度。可见,克立格插值的关键就是计算权重系数。显然,权重系数的求取必须满足两个条件:一是使的估计是无偏的,即偏差的数学期望为零;二是最优的,即使估计值和实际值之差的平方和最小。为此,需要满足以下两个条件:第四章+空间统计分析初步(1)无偏性。要使成为的无偏估计量,即。

当时,也就是当时,则有这时,为的无偏估计量。(2)最优性。在满足无偏性条件下,估计方差为(4.2.23)第四章+空间统计分析初步

使用协方差函数表达,它可以进一步写为

(4.2.24)

为使估计方差最小,根据拉格朗日乘数原理,令

(4.2.25)

求F对和的偏导数,并令其为0,得克立格方程组

(4.2.26)

ïïîïïíì=--=¶¶=--=¶¶åå==niiijinjjiFxxcxxcF110)1(202),(2),(2lmmll第四章+空间统计分析初步(4.2.27)(4.2.28)整理后得

解线性方程组(4.2.27)式,求出权重系数λi和拉格朗日系数μ,代入公式(4.2.24),可得克立格估计方差第四章+空间统计分析初步

在变异函数存在的条件下,根据协方差与变异函数的关系:

或,也可以用变异函数表示普通克立格方程组和克立格估计方差,即

(4.2.29)

解线性方程组(4.2.27)式,求出权重系数和拉格朗日乘数μ,代入公式(4.2.24),可得克立格估计方差,即

(4.2.30)第四章+空间统计分析初步上述过程也可用矩阵形式表示,令

则普通克立格方程组为

(4.2.31)解方程组(4.2.31)式,可得

(4.2.32)其估计方差为

(4.2.33)

第四章+空间统计分析初步

也可以将克立格方程组和估计方差用变异函数写成上述矩阵形式。令

在以上的介绍中,区域化变量的数学期望可以是已知或未知的。如果m是已知常数,称为简单克立格法;如果m是未知常数,称为普通克立格法。不管是哪一种方法,均可根据方法计算权重系数和克立格估计量。

(4.2.34)(4.2.35)(4.2.36)第四章+空间统计分析初步

以图4.2.1为例,4个观测点x1,x2,x3,x4的观测值分别为Z(x1)=37、Z(x2)=42、Z(x3)=36、Z(x4)=35,如果假设降水量的变异函数是向同性(即变异函数在各个方向的变化都相同)的二维球状模型,其具体形式为(4.2.21)式。现在,我们用普通克立格法估计观测点x0的降水量值Z(x0)。根据普通克立格法的基本原理,我们知道,Z(x0)估计的基本公式应该是

第四章+空间统计分析初步

根据公式(4.2.32),可知

(4.2.37)

根据协方差与变异函数的关系以及(4.2.21)式,可得协方差函数

第四章+空间统计分析初步

当时,根据克立格矩阵的对称性,当时,,由此计算可得

第四章+空间统计分析初步第四章+空间统计分析初步将以上计算结果代入克立格方程组(4.2.31),得

第四章+空间统计分析初步

即克立格权重系数分别为:λ1=0.287,λ2=0.210,λ3=0.202,λ4=0.301,μ=-0.473,所以观测点的降水量的克立格估计值为:根据普通克立格法的基本原理,我们知道,Z(x0)估计的基本公式应该是

37.25(mm)。

克立格估计方差为

第四章+空间统计分析初步二、应用实例

年降水量和蒸发量,既服从地带性规律,同时又受随机性因素的影响,因此它们是典型的区域化变量。我们以甘肃省53个气象台站多年平均降水量和蒸发量数据(见教材表3.1.2)为实测值,拟合了年降水量和蒸发量的半变异函数理论模型,并采用普通克立格法和双变量协同克里格法,做了空间插值计算,结论如下。

第四章+空间统计分析初步

(一)半变异函数半变异函数模型,是克立格空间插值的前提条件,同时它也决定着空间插值的精度。一般情况下,半变异函数模型是根据半变异函数云图的分布,选择合适的理论模型,按照估计方差最小的原则,运用最小二乘法求得。图4.2.4和图4.2.5分别给出了年降水量和年蒸发量的半变异函数云图。

图4.2.4年降水量的半变异函数云图

第四章+空间统计分析初步

图4.2.5年蒸发量的半变异函数云图

从图4.2.4和图4.2.5可以看出,年降水量和年蒸发量的块金效应都不明显,这是因为样本点是各个气象站点的实测值,空间分辨率可以忽略不计,另外实验误差和人为误差基本上都很小。我们选择各种不同的半变异函数理论模型,经过多次拟合计算和对比分析,发现指数模型比较好地描述了年降水量的空间变异规律。其变异函数的具体形式如下:第四章+空间统计分析初步(4.2.38)

(4.2.38)式拟合的适度系数为。我们选择各种不同的半变异函数理论模型,经过多次拟合计算和对比分析,发现球状模型比较好地描述了年蒸发量的空间变异规律。其变异函数的具体形式如下

(4.2.39)(4.2.39)式拟合的适度系数为。

第四章+空间统计分析初步(二)空间插值结果基于半变异函数的理论模型(4.2.38)和(4.2.39),对甘肃省范围内的年降水量和蒸发量,用普通克立格法进行空间插值计算,得到的结果分别如图4.2.4和图4.2.5。(三)结果讨论从图4.2.6可以看出,在甘肃省范围内,年降水量的空间分布格局总体上是东南多西北少,并且呈现从东南方向到西北方向逐渐过渡,梯度变化明显;山地多,平地少,南北方向从南部祁连山脉向北部的沙漠戈壁逐渐减少。

第四章+空间统计分析初步年降水量的空间变程很大,最多的东南部是最少的西北部的近10倍,其中,甘南东南部玛曲和禄曲、陇南东南部以及平凉和灵台东南地区,年降水量达到691.59~786.75mm之间。400mm等降水线靠近兰州附近,而到了西北端,几乎整个酒泉市、嘉峪关市和张掖市的西北部,年降水量只有59.17~102.08mm。图4.2.6甘肃省年降水量的普通克立格空间插值结果第四章+空间统计分析初步

图4.2.7甘肃省年蒸发量的普通克立格空间插值结果从图4.2.7可以看出,年蒸发量的空间格局,恰好与年降水量的空间格局相反:西北多、东南少,呈现出由西北向东南逐渐减少的变化趋势,梯度变化明显。

第四章+空间统计分析初步

年蒸发量的空间变程虽然小于年降水量,但仍然较大,在西北端的酒泉大部分地区以及民勤北部的腾格里沙漠地区,年蒸发量可以达到293

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论