土壤空间变异及其研究方法_第1页
土壤空间变异及其研究方法_第2页
土壤空间变异及其研究方法_第3页
土壤空间变异及其研究方法_第4页
土壤空间变异及其研究方法_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于土壤空间变异及其研究方法第1页,课件共112页,创作于2023年2月主要内容基本概念空间变异性分析(半变异函数)空间插值方法(Kriging方法)其它研究方法及应用第2页,课件共112页,创作于2023年2月第3页,课件共112页,创作于2023年2月70年代以后,地统计学被应用于土壤学和水资源研究,广泛应用克立格法来预测非采样点土壤属性。70年代后期,美国陆续将其应用于土壤调查制图及土壤变异性的研究中。J.B.Campbell在研究两个土壤制图单元中砂粒含量和pH空间变异时首先采用地统计学。80年代,Webster,McBratney,Burgess,Burrough,Trangmar将地统计学引入土壤科学研究,并做了大量介绍和实例研究,这方面的研究已成为土壤科学的重要内容之一。在我国1977年开始介绍地统计学。随后也开始了土壤、水资源系统中参数的空间变异研究。目前,国内外已开展了许多有关土壤物理、化学性质方面的空间变异研究,前者主要集中于土壤水分(包括饱和导水率、渗透率等)、容重、机械组成等;后者主要包括有机质、营养元素以及重金属元素等。第4页,课件共112页,创作于2023年2月土壤是不均匀和变化的连续体,即使在土壤类型相同的区域内,土壤属性值在不同空间位置上也具有明显差异。土壤属性在空间分布上的非均一性,称为土壤属性的空间变异性。空间变异的研究目的:根据不同空间位置的土壤观测或取样测定的资料,分析土壤各特性参数的空间变化特征、参数自身及各参数间的空间关系;用于确定合理的取样或观测点的数目;对未测点的参数进行最优估值,还可结合标定理论的应用分析预测状态变量的空间分布;提高土壤调查和制图精度,改进土壤分类系统的诊断精度;完善对不同空间尺度上土壤过程的预测和模拟-空间尺度转换。空间变异性第5页,课件共112页,创作于2023年2月地统计学方法以区域化变量、随机函数和平稳性假设等概念为基础,以变异函数为核心,以空间插值法为手段,研究自然现象的空间变异问题。空间变异性的研究方法第6页,课件共112页,创作于2023年2月土壤空间变异研究:why经典统计分析方法的实现是以概率论为基础的、研究随机现象统计规律的应用数学学科。研究的变量为纯随机变量,理论上可以进行无限次重复和大量重复观测试验。每次取样需要单独进行,样本中各个取值之间需要互相独立。例1:研究某县土壤有机质含量情况由于不可能获得该区域所有土壤的有机质状况,遵循经典统计学方法需要在该区域不同地点、不同类型土壤上采样,样点分布要符合随机抽样要求。经过化学分析获得各个土壤样品的土壤有机质含量。采用经典的统计方法,计算均值、标准差、变异系数等,从而得出有机质含量最终结果。这种方法可以在样本少、材料多样和环境多变情况下获取最多的信息,因此我国的大多数土壤工作者至今仍沿用这种方法。第7页,课件共112页,创作于2023年2月从有机质分布看,西北高,中间低,而东南较高,分布有空间规律性。从误差分布来看,西北角的误差都是大于0,而东南部的误差却都小于0,误差之间存在空间关联性。土壤数据具有空间相关性例1土壤有机质分布误差分布有机质第8页,课件共112页,创作于2023年2月直方图显示,两组数据几乎相同两组数据统计特征基本一致例2A、B两个区域速效钾的变异第9页,课件共112页,创作于2023年2月从空间分布来看,左图空间变化更快,右图稍缓。两组数据差异表现在空间变异性差别,而不是数量的变异性。这种空间变异的变化将影响采样设计、空间预测、制图等。第10页,课件共112页,创作于2023年2月全局的空间分析会掩盖其在不同方向上的差别。例如:丘陵斜坡上采样,顺坡和横坡方向上变异差别比较大,全局的分析会掩盖这种差异。不同方向的空间分析可以发现土壤属性的各向异性土壤性质各向异性第11页,课件共112页,创作于2023年2月土壤数据具有空间变异性具有空间关联性具有空间结构传统统计学方法已经难以解决空间数据问题第12页,课件共112页,创作于2023年2月主要内容基本概念空间变异性分析(半变异函数)空间插值方法(Kriging方法)其它研究方法第13页,课件共112页,创作于2023年2月地理学第一定律地理学第一定律由美国地理学家W.R.Tobler在1970年提出:

Everythingisrelatedtoeverythingelse,butnearthingsaremorerelatedthandistantthings.

后来人们也称之为Tobler第一定律(TFL).AllThingsbyaimmortalpower,NearorfarHiddenlytoeachotherlinkedare,ThatthoucanstnotstiraflowerWithoutthetroublingofastar英国诗人FrancisThompson,TheMistressofVision第14页,课件共112页,创作于2023年2月随机变量概念

统计学中,通常假设某随机变量取值是完全随机的,或在空间上、时间上是完全独立的;简单理解,这个变量取下一个数值时,不需要考虑过去的数值或者周围的数值。就土壤来说:土壤的各种属性,比如大范围的有机质等

景观特性等等第15页,课件共112页,创作于2023年2月相关性与协方差(correlation/covariance)

统计学中,当两个变量之间存在联系,一个变量会随着另外一个变量变化。有正相关和负相关之分。相关性并不描述两个变量之间的因果关系。相关系数r协方差cov

第16页,课件共112页,创作于2023年2月第17页,课件共112页,创作于2023年2月空间自相关的概念(spatialautocorrelation)当变量在空间一些位置的值依赖于该变量在其它位置的值时,就存在着空间自相关,亦即空间自相关描述了同一变量在不同位置的依赖性。空间自相关是针对同一个属性变量而言的,当某一样点属性值高,而其相邻点同一属性值也高时,为空间正相关;反之,为空间负相关。Moran’sI值其中Wij为权重矩阵第18页,课件共112页,创作于2023年2月第19页,课件共112页,创作于2023年2月土壤空间自相关图土壤有机质第20页,课件共112页,创作于2023年2月土壤有机质自相关各向异性第21页,课件共112页,创作于2023年2月依赖于空间分布位置的变量称为区域化变量(RegionalizedVariable)区域化变量概念有些变量,在考虑空间或时间时,变量往往不是随机的(或者说数据不是完全独立的),因而,计算这些变量的特征时,除了变量的均值、方差等统计量,还需要计算变量的空间结构。第22页,课件共112页,创作于2023年2月对于一个变量Z(比如土壤有机质含量),随不同空间位置i而变化,该变量的变化决定于三个部分:1)大尺度范围内的总体值,表示变化趋势2)局部小范围内的空间依赖性3)误差第23页,课件共112页,创作于2023年2月第24页,课件共112页,创作于2023年2月区域化变量的两大特点是随机性和结构性。①在局部的某一点,区域化变量的取值是随机的;②对整个区域而言,存在一个总体或平均的结构,相邻的区域化变量的取值具有该结构所表达的相关关系。举例:小范围χ的有机质分布与大区域是不同的,小范围内的有机质含量可能高于、低于大区域的均值,而这是随机的。这就把小范围的观测值与随机性联系起来了。可以用变量Z(χ)来表示。每个观测值认为是Z(χ)的一个实现(realization),即z(χ)。同样,另外一个点χ‘,可以用另外一个随机变量Z(χ’)来表示,每个观测值可认为是Z(χ‘)的实现。同时,Z(χ)和Z(χ‘)是存在某种数量关系。第25页,课件共112页,创作于2023年2月对于随机过程,要完整地描述其特征,必须给出它的分布函数或分布密度,但是这种分布一般很难求得。所以研究的重要切入点是其数字特征,这些数字数字特征主要包括:数学期望相关函数方差协方差均方值其中数学期望是一阶矩,后面四个数字特征都是二阶矩

当一个随机过程是二阶矩过程时,我们就可以研究它的二阶矩数字特征,从而对随机过程进行相应的分析,判断是否平稳等。如何构建区域化变量第26页,课件共112页,创作于2023年2月区域化变量完全的分布函数或分布密度函数的求取也没有必要。区域化变量分布函数或分布密度函数的头两个矩(一阶矩和二阶矩)足以提供大多数情况下所研究问题的近似解。何况,一般我们所测得的数据也不足以求得区域化变量完全的分布函数或分布密度函数。在研究中,我们只使用随机函数的头两个矩,换句话说,如果有两个随机函数有相同的一介矩和二阶矩,那么我们就认为这两个随机函数是相同的。第27页,课件共112页,创作于2023年2月一阶矩:一个区域化变量的一阶矩就是区域化变量的平均值函数。定义为:

E[Z(x)]=ư(x)二阶矩:一个区域化变量的二阶矩有三个,分别为:区域化变量的方差函数区域化变量的协方差函数半方差:又称变差函数,定义为一个区域化变量两点差值方差的一半注:偏度属于三阶标准矩,峰度属于四阶标准矩第28页,课件共112页,创作于2023年2月上述几个函数的理论表达式,在实际应用时,这些函数往往要通过若干测定值作出估计。比如半方差函数则需通过估计数学期望

E[Z(χ)-Z(χ+h)]2以及E[Z(χ)-Z(χ+h)]的值。则又必须有Z(χ)和Z(χ+h)的若干实现。然而,在土壤空间变异研究中,在点χ和点χ+h往往只能得到一对这样的数据z(χ)和z(χ+h),不可能在空间同一点再去得到第二对数据。为克服这个困难,就需要对区域化变量提出一些假设,这一假设实际是对考察区域作了一定的限定。第29页,课件共112页,创作于2023年2月平稳性假设对于经典统计学而言,大量重复的样本必须的。统计学认为,从大量重复的观察中可以进行预测和估计,并可以了解估计的变化性和不确定性。对于大部分的空间数据而言,平稳性的假设是合理的。平稳是对随机变量的一个比较严格的假定条件。如果只假定:

(1)局部范围内,变量的均值为一常数,不随位置而变化;

(2)样本点x和y的协方差C[Z(x),Z(y)]存在,且只取决于样本点x和y之间的距离,即|x-y|,则Z是二阶平稳的,结果是Z的均值和协方差在空间上不发生变化。这样,在空间某一局部范围内,对空间某一点x0,相距为h的多个点,可以看作是点z(x0)的多个实现,即可进行统计推断及估值预测。第30页,课件共112页,创作于2023年2月如果对随机变量的要求更放宽,在以下条件下,随机函数Z(x)具有内蕴假设:

(1)均值存在并且不取决于x:

E[Z(x)]=m,对于任意的xE[Z(x+h)-Z(x)]=0

(2)对于任何距离h,变量[Z(x+h)-Z(x)]具有一个有限的方差,此方差不取决于x。对于任何x和h,下式成立:Var[Z(x+h)-Z(x)]=E{{[Z(x+h)-Z(x)]-E[Z(x+h)-Z(x)]}2}=E{Z(x+h)-Z(x)2}=2r(h)式中r(h)称为(半)变异函数。变异函数用来表征随机变量的空间变异结构,或空间连续性,它是地统计学的基础。二阶平稳包含了内蕴假设,但反过来却不成立。换言之,内蕴假设的条件比二阶平稳要松,应用也应更广。第31页,课件共112页,创作于2023年2月平稳性,总结起来包括两种:一是均值平稳,即假设均值是不变的,并且与位置无关;另一类是与协方差函数有关的二阶平稳和与半变异函数有关的内蕴平稳二阶平稳是假设具有相同的距离和方向的任意两点的协方差是相同的,协方差只与两点的值相关而与它们的位置无关内蕴平稳假设是指具有相同距离和方向的任意两点的方差(即变异函数)是相同的。二阶平稳和内蕴平稳都是为了获得基本重复规律而作的基本假设,通过协方差函数和变异函数可以进行预测和估计预测结果的不确定性。第32页,课件共112页,创作于2023年2月Z(x)协方差函数(covariance)区域化变量Z(x)在点xi和xi+h处的两个随机变量Z(xi)与Z(xi+h)的二阶混合中心矩定义为区域化变量Z(x)的自协方差函数,简称为协方差函数,即第33页,课件共112页,创作于2023年2月有时将γ(h)称为“半变异函数”(semivariograms)或半方差函数。

地统计学中的变异函数区域化变量Z(x)在点xi和xi+h处的两个随机变量Z(xi)与Z(xi+h)的变异函数为:第34页,课件共112页,创作于2023年2月通常,我们利用采样点及变异函数的计算公式得出样本点的实验变异函数(experimentalvariogram),拟合后的曲线为经验变异函数。观察该变异函数的分布图像,寻找地统计学提供的某一种理论模型或者多个理论模型(basicmodel)的线性组合进行拟合。空间协方差函数和变异函数由G.Matheron在60年代提出,尤其是变异函数能同时描述区域化变量的随机性和结构性,为从数学上严格地分析区域化变量提供了有用工具。第35页,课件共112页,创作于2023年2月变异函数和协方差函数两者间的关系为:

γ(h)=Sill–Cov(h)第36页,课件共112页,创作于2023年2月变异函数曲线图:通常是r(h)对h作图而得半方差函数曲线图曲线反映了采样点与其相邻采样点的空间关系。变异函数图由一系列离散点构成,可根据其形状用直线或曲线方程拟合,这种方程即为变异函数(半方差函数)模型。在土壤科学中常用到多种理论模型,如球状(spherical)、指数(exponential)、高斯(Gaussian)、线性(linear)、乘幂(power)等模型。第37页,课件共112页,创作于2023年2月半方差函数及半方差图参数的含义C0:块金值。理论上,当采样点间的距离为0时,半变异函数值应为0。由于存在测量误差和空间变异,使得两采样点非常接近时,它们的半变异函数值不为0,即存在块金值。块金效应是非空间性质观测值的变异,因此,它是在细微尺度模拟测量误差、操作偏差和空间变异的方差。AC0C0+CA:变程。它的意义因所遵循的模型而有不同。如对于球状和线性模型,A表明土壤性质存在空间变异结构的最大相关距离;对于高斯模型和指数模型最大相关距离则分别为1.73A和3A。变程大小受观测尺度限定。在变程范围内,样点间的距离越小,其相似性,即空间相关性越大。当h>A时,区域化变量Z(x)的空间相关性不存在,即当某点与已知点的距离大于变程时,该点数据不能用于内插或外推。第38页,课件共112页,创作于2023年2月C0+C:基台值。当h趋于合适的间距(A)时,半方差的极限值,等于变量的方差,超过此变程可以认为属性变量空间独立。一般来说,球状、指数或高斯模型采用块金值、基台和变程这3个基本属性参数来表征。AC0C0+C块金与基台的比值叫基底效应,此值越大,说明空间变异更多的是随机成分引起的,否则是由特定的地理过程或多个过程综合引起的。

Cambardella等人(1994)提出区域化变量空间相关性程度的分级标准为:

基底效应<25%:有强烈的空间相关性,变异主要由空间自相关因素引起;

基底效应25-75%:说明具有中等的空间相关性;

基底效应>75%:说明空间相关性较弱,变异主要由随机因素引起,不适合采样空间插值的方法进行预测。第39页,课件共112页,创作于2023年2月各向异性图示Z(x)能通过变异函数γ(h)反映区域化变量的随机性和结构性,如果在各个方向上Z(x)的变异性相同或相近,称Z(x)为各向同性。反之,称为各向异性。各向同性只是各向异性的特例,各向异性是绝对的。一般在土壤学中,许多区域化变量都是各向异性的。在结构分析中,主要是根据变异函数的变程在不同方向上的大小来反映各向同性或各向异性,变程大的方向上的变异较大。

同向(isotrophic)模型:方差只与样点间距离有关异向(anisotrophic)模型:方差还与采样的方向有关几何(geometric)异向:方差的range随方向而改变,但sill保持不变带状(zonal)异向:方差的sill随方向而改变,但range保持不变第40页,课件共112页,创作于2023年2月变异函数的理论模型

地统计学将变异函数的理论模型分为三大类:一类是有基台值模型,包括球状模型、指数模型、高斯模型、线性有基台值模型和纯块金效应模型。另一类是无基台模型,包括幂函数模型、线性无基台值模型、抛物线模型。还有一类是孔穴效应模型。土壤学中常用到球状模型、指数模型、高斯模型和线性模型。第41页,课件共112页,创作于2023年2月

有基台模型:随距离增加,半方差聚合到sill高斯模型:(Gaussian)指数模型:(exponential)球型模型:(spherical)第42页,课件共112页,创作于2023年2月线性有基台(linear)

(h)=·h纯块金效应

(h)=C0第43页,课件共112页,创作于2023年2月

无基台型:随距离增加,方差也增加线性(linear)

(h)=·h指数(power)(h)=·hs,>0,0<s<2对数(logarithmic)

(h)=A·log(h)

,A>0第44页,课件共112页,创作于2023年2月有基台孔穴效应型:无基台孔穴效应型:孔穴效应型可以用正弦或者余弦函数来描述这种周期性第45页,课件共112页,创作于2023年2月半方差分析半方差理论公式γ(h)是两点之间距离的函数,而并不是具体各点空间位置的函数。但是,理论公式用起来不方便。假设空间中有n个点,包含数组(x1,y1,z1)(x2,y2,z2)……(xn,yn,zn),因此,存在n×(n-1)/2对观测值。对于任意两个点之间,它们的距离是第46页,课件共112页,创作于2023年2月半方差分析由于两两之间都需要计算距离,数量巨大,很难用图来表达,一般对这些距离进行分组。假设以1km为分组单元,则分为1km,2km……等各组,然后将类似的这些距离分别归入各组。S(∆x,∆y)为各组所有数据对第47页,课件共112页,创作于2023年2月可以使用以下公式计算半方差,其中N(∆x,∆y)代表S(∆x,∆y)数对的数量对于固定h的计算公式是:关于半方差的定义非常多第48页,课件共112页,创作于2023年2月例1第49页,课件共112页,创作于2023年2月引自:半变异函数法的初步实践例2第50页,课件共112页,创作于2023年2月变异的各向异性第51页,课件共112页,创作于2023年2月主要内容基本概念空间变异性分析(半变异函数)空间插值方法(Kriging方法)其它研究方法第52页,课件共112页,创作于2023年2月由于土壤空间变异较大,而采样分析成本很高,空间数据不可能、也不必要覆盖全部区域。可以用已知点土壤性质对未采样点的土壤性质进行预测由于存在空间自相关性,空间特定点的土壤性质预测必然依据该点周围已知点的土壤属性对于区域来说,需要了解某种土壤性质的整体分布状况,利用已知点信息进行全覆盖式的插值。对于区域插值结果进行验证土壤特性空间预测与插值PartB第53页,课件共112页,创作于2023年2月长武土壤有机质空间插值图第54页,课件共112页,创作于2023年2月土壤空间插值方法预测与插值研究确定性插值地统计插值:包括普通Kriging,简单kriging,泛Kriging,概率Kriging,析取Kriging,协同Kriging插值区域不同全局性插值:全局多项式法

局部性插值:反距离加权法、局部多项式法、径向基函数法创建的表面是否经过所有的采样点

精确性插值:反距离加权法、径向基函数法

非精确性插值:全局多项式法、局部多项式法

第55页,课件共112页,创作于2023年2月反距离加权插值法(IDW,InverseDistanceWeighted)

Ẑ(S0):S0处预测值;N:预测计算过程中要使用的预测点周围样点的数量;

Z(Si):在Si处获得的测量值;

i:预测计算过程中使用的各样点的权重,该值随着样点与预测点之间距离的增加而减小

基于相近相似原理,假设各已知点对预测点值的预测都有局部性影响,其影响随着距离的增加而减小:PartB第56页,课件共112页,创作于2023年2月IDW权重i计算公式:

随着样点与预测点之间距离的增加,权重值的降低用参数p来控制。

di0是预测点S0与各已知样点Si之间的距离。在各预测过程中,各样点值对预测点值得权重大小是成比例的,这些权重值的总和为1。PartB第57页,课件共112页,创作于2023年2月最近邻插值

e=

i

满足dei=min(de1,de2,……den)

其中dij=[(xi-xj)2+(yi-yj)2]-1/2

适用:空间变异小、小区域平均值

e=1/n

i分类同类取相同的值主要问题:预测精度低其他考虑距离的确定性插值方法PartB第58页,课件共112页,创作于2023年2月全局多项式插值法用一个由采样点拟合的多项式数学方程来拟合整个表面,很少能与已知样点完全重合,是非精确插值方法。多次二项式(multiquadric)

e=cidej多项式(polynomial)

e=akk(xe,ye)

ak:系数;k:在(xe,ye)的第k个基础函数各样点与这个表面之间距离的平方和最小(最小二乘回归分析)。常使用低阶多项式建立一个变化平缓的表面来描述某些物理过程(如污染)。得到一个平滑的数学表面,适用于研究区域表面变量的缓慢变化或者检验长期变化的、全局性趋势的影响。注意:多项式越复杂,物理意义越难描述;得到的表面容易受离群点(具有极高和极低的值的样点)影响,尤其在边沿地区,这种影响更明显。PartB第59页,课件共112页,创作于2023年2月

采用回归的方法用一个平滑曲面,即趋势面,来拟合采样点己知数据的空间分布情况,再根据该曲面方程来计算未采样点位里的数据。适合分析空间变量在较大尺度上的分布规律,或用来进行空间变量的平滑处理,其计算量较小。回归分析所使用的曲面多项式,形式如:f(x,y)=xy+p式中:(x,y)为二维平面上的坐标;和为权值;为决定确定趋势面形状的参数,可以由最小二乘法估计得到;p为多项式的项数。方法假设采样位置为独立变量,采样数据也为独立变量且呈正态分布,同时假设回归误差是与位置无关的独立变量。趋势面的拟合程度可以用F分布进行检验。趋势面插值法PartB第60页,课件共112页,创作于2023年2月局部多项式插值法采用多个多项式,每个多项式仅对指定的相邻区域内所有点进行插值,邻近区域之间相互重叠。产生的表面多用来解释局部变异。例如对于既有山川又有平原,地形起伏的区域,想将这个地势表面精确地表示出来,仅仅使用一种全局多项式表面是远远不够的,需要使用多个多项式平面才能模拟得更精确。

PartB第61页,课件共112页,创作于2023年2月径向基函数插值法(RadialBasisFunctions)

如同将一个橡胶膜插入并经过各个已知样点,同时使表面的总曲率最小。基本函数决定了橡胶薄膜插入到这些点之间的方式,有五种不同的基本函数:平面样条函数(thin-platespline)张力样条函数(splinewithtension)规则样条函数(completelyregularizedspline)高次曲面函数(multiquadricfunctions)反高次曲面样条函数(inversemultiquadricspline)。与反距离加权插值法不同,在于它可以预测比样点高或低的未知点值。适用于对大量点数据进行插值,或变化平缓的表面的插值。不适用的情况有:较短的水平距离内表面值变化较大,或无法确定采样点数据的准确性,或采样点的数据具有很大的不确定性。PartB第62页,课件共112页,创作于2023年2月克立格插值法利用原始数据和变异函数的结构性,对未采样点的变量进行无偏最佳估计。这种方法不仅能生成一个预测表面,还可以给出预测结果的精度。与反距离加权插值相似,通过给已知样点赋权重来派生出未知点的预测值。kriging中的权重λi不仅考虑已知点和预测点间的距离,还考虑了已知点的位置和属性值整体的空间分布和格局。因此,权重λi取决于已知点的变异函数拟合模型、距预测位置的距离和预测点周围的已知点间的空间关系。PartB第63页,课件共112页,创作于2023年2月空间估值-克立格插值方法简单克立格法(SimpleKriging,简称SK)普通克立格法(OrdinaryKriging,简称OK)泛克立格法(UniversalKriging,简称UK)协同克立格法(Co-Kriging,简称CK)对数正态克立格法(LognormalKriging,简称LNK)析取克立格法(DisjunctiveKriging,简称DK)指示克立格法(IndicatorKriging,简称IK)概率克立格法(ProbabilityKriging,简称PK)

第64页,课件共112页,创作于2023年2月举例说明xyapP13.04.0120P26.33.4103P32.01.3142Px3.03.0????X135791357p1p2p3pxPx=w1*ap1+w2*ap2+w3*ap3w1+w2+w3=1各点权重125.3第65页,课件共112页,创作于2023年2月克立格插值方法克立格插值方法的基本形式为:

Z(s)=μ(s)+ε(s)其中,s表示不同的位置点;Z(s)是s处的变量值,即克立格估计量,它可分解为确定趋势值μ(s)和自相关随机误差ε(s)。假设误差项ε(s)的期望均值为零,并且ε(s)和ε(s+h)之间的自相关不取决于s点的位置,而取决于位移量h。通过对这个公式进行变化可以生成克立格方法的不同类型。第66页,课件共112页,创作于2023年2月趋势值μ(s)可以被简单地赋以一个常量,即在任何位置s处μ(s)=μ,如果μ是未知的,这便是普通克立格法(OrdinaryKriging)所基于的模型;μ(s)也可以表示为其空间坐标的线性函数,例如,

μ(s)=β0+β1x+β2y+β3x2+β4y2+β5xy这是一个二阶多项式趋势面方程,是由空间坐标(x,y)经线性回归分析而获得的。如果趋势方程中的回归系数是未知的,那么便形成了泛克立格模型(UniversalKriging)如果在任何时候趋势是已知的(例如所有的系数和协方差都已知),无论趋势是常量是否,都会形成简单克立格模型(SimpleKriging)。各种克立格方法之间的关系第67页,课件共112页,创作于2023年2月对克立格估计量Z(s)进行变换。例如,可以把它转换成一个指示变量,如果Z(s)低于一定的阈值,则将它的值变为0,高于这个阈值时为1。然后对Z(s)高于阈值的情况进行概率预测。基于这样的模型做出的预测便形成了指示克立格模型(IndicatorKriging)。对Z(s)作未知变换,第i个变量变换后的形式为fi(Z(si)),可以将克立格估计量Z(s)转变成含有变量的函数,形成析取克立格模型(DisjunctiveKriging)。第68页,课件共112页,创作于2023年2月通常同一个样点有多个变量值,某一变量的空间分布经常与其他变量密切相关,基于多个变量的克立格模型便形成了协同克立格模型(Cokriging)。某些变量Z1测定可能比较昂贵,所以数据点较稀,而另一些Z2易于获得因而观测值较多。如果Z1和Z2空间相关,那么就可以利用Z2的空间变异信息获取Z1的分布状况,其中Z1称为主变量,Z2称为协同变量。除了描述各自自相关性之外,协同克立格还需要分析两个变量的交叉相关性。第69页,课件共112页,创作于2023年2月ArcGIS中空间插值方法第70页,课件共112页,创作于2023年2月离散空间表示连续空间表示第71页,课件共112页,创作于2023年2月第72页,课件共112页,创作于2023年2月GeostatisticalAnalyst数据探索:分析数据是否服从正态分布,是否存在某种趋势等;在ArcGIS地统计分析模块中,内嵌了多种探索性空间数据分析工具,包括Histogram(直方图)VoronoiMap(Voronoi地图)NormalQQPlot(正态QQPlot分布图)GeneralQQPlot(普通QQPlot分布图)TrendAnalysis(趋势分析)Semivariogram/CovarianceCloud(半变异/协方差函数云)CrosscovarianceCloud(正交协方差函数云)。统计分析向导:选择内插方法和数据集界面参数选择界面精度评定界面生成数据子集地统计分析及结果验证第73页,课件共112页,创作于2023年2月

在大尺度区域(小比例尺)研究中,土壤性质的测定数据往往在局部呈正态分布,而在整个研究区内并不呈正态分布或对数正态分布,表现明显的趋势效应现象(在某些方向表现出明显的常数、一阶或二阶函数变化);需要去除趋势效应,使得数据在整个研究区域内呈现正态分布。具有这种分布现象的数据常被称为呈多项式(Polynomal)分布的数据。趋势效应第74页,课件共112页,创作于2023年2月数据探索直方图理论上克立格分析要求数据为正态分布,但实际调查数据较难保证为正态分布。在计算前一般需要进行正态分布转换,常用的方法有Box-Cox、对数等正态变换。Log变换第75页,课件共112页,创作于2023年2月正态分布转换Box-Cox转换/幂转换

Y(s)=(Z(s)λ-1)/λ,λ≠0

若λ=1/2为平方根转换,这是Box-Cox变换的一个特例。对数变换

Y(s)=ln(Z(s)),其中Z(s)>0,ln为自然对数对数变换实际上是Box-Cox变换在λ=0时的特例。当数据呈偏态分布或有少数特大值点时常用对数变换。反正弦变换

Y(s)=sin-1(Z(s)),其中Z(s)介于0、1之间。当数据是比例数据或百分数时可用这种变换方式。第76页,课件共112页,创作于2023年2月Voronoi图Voronoi地图是由在样点周围形成的一系列多边形组成的。某一样点的Voronoi多边形按下述方法生成:多边形内任何位置距这一样点的距离都比该多边形到其它样点的距离要将要近。Voronoi多边形生成之后,相邻的点就被定义为其Voronoi多边形与选择样点的Voronoi多边形具有公共边的其它样点。第77页,课件共112页,创作于2023年2月数据探索QQPlot分布图QQ图提供了另外一种度量数据正态分布的方法,利用QQ图,可以将现有数据的分布与标准正态分布对比,如果数据越接近一条直线,则它越接近于服从正态分布。第78页,课件共112页,创作于2023年2月趋势分析趋势分析工具提供用户研究区采样点转换为以感兴趣的属性值为高度的三维透视图,允许用户从不同视角分析采样数据集的全局趋势。第79页,课件共112页,创作于2023年2月变异分析工具半变异/协方差函数云,表示的是数据集中所有样点对的理论半变异值和协方差,并把它们用两点间距离的函数来表示,用此函数作图来表示。第80页,课件共112页,创作于2023年2月无方向协方差云有方向协方差云第81页,课件共112页,创作于2023年2月检验数据分布:用直方图检测数据的分布用NormalQQplot图检测数据分布

寻找数据离群值全局离群值是对于数据集中所有点来讲,具有很高或很低的值的观测样点。

局部离群值对于整个数据集处于正常范围,但与其相邻点比较偏高或偏低。

真实异常值需要保留,错误异常值剔除数据分析第82页,课件共112页,创作于2023年2月全局趋势分析:空间趋势反映了空间物体在空间区域上变化的主体特征,它主要揭示空间物体的总体规律,而忽略局部的变异。趋势面分析是根据空间抽样数据,拟合一个数学曲面,用该数学曲面来反映空间分布的变化情况。空间自相关及方向变异:半变异/协方差函数云图就是这种相似性的定量化表示多数据集协变分析:主要通过分析多因素(数据集)关联特征,在地统计空间分析中可以有效利用这种相关特征增强建模效果,如协同克立格插值分析。第83页,课件共112页,创作于2023年2月第84页,课件共112页,创作于2023年2月第85页,课件共112页,创作于2023年2月第86页,课件共112页,创作于2023年2月第87页,课件共112页,创作于2023年2月第88页,课件共112页,创作于2023年2月第89页,课件共112页,创作于2023年2月克立格插值的交叉验证

交叉验证使用全部数据来评价自相关模型,每次预留一个数据样点,然后预测该点的值。最后根据每一个点的测量值和预测值进行统计计算,可以用以下统计量来衡量预测的好坏。平均预测误差(Meanpredictionerror,ME)标准预测误差(Meanstandardizedpredictionerror,MSE)均方根预测误差(Root-mean-squarepredictionerrors,RMSE)平均标准差(AveragestandardError,ASE)均方根标准误差(Root-mean-squarestandardizederrors,RMSSE)第90页,课件共112页,创作于2023年2月验证样本集验证方法第91页,课件共112页,创作于2023年2月

测定点实测值为Z(xi),预测值为Z’(xi),二者的标准化值分别为Z1(xi)和Z2(xi),平均误差ME(MeanError)标准化平均误差MSE(MeanStandardizedError)平均标准误差ASE(AverageStandardError)验证的参数第92页,课件共112页,创作于2023年2月均方根误差RMSE(Root-Mean-SquareError)标准化均方根误差RMSSE(Root-Mean-SquareStandardizedError)第93页,课件共112页,创作于2023年2月通常在确定一个“最好的”预测表面之前会生成很多表面,用户可以系统地比较每个预测表面,去除那些“最坏的”,直到剩下最后两个表面相互进行比较。断定在这种情况下两个表面中哪个是最好的。变异函数模型评价计算(h)散点图,分别用不同模型拟合,得到模型参数值及SSQ(离差平方和),选取SSQ最小的模型类型,最后用交叉验证法来确定模型的参数。第94页,课件共112页,创作于2023年2月样本数量影响

克立格分析方法需要较多的数据。一般认为,该数据量不应该小于100,计算中的样本对最小不应小于20,否则结果可能不稳定。不同变异函数模型和参数的影响影响变异函数的基本参数有四个:块金,基台,变程和变异函数类型。基台值的变化,相当于考虑了各向异性的影响。最佳的变程会使误差具有最小值。变异函数类型

不同的函数类型对结果的影响很大。合适函数的确定,不仅要考虑拟合的精度,而且要考虑是否符合数据所代表的物理过程。在地质学上经常使用球状模型,但是对于生物学而言,指数模型可能更合适一些。注意的问题第95页,课件共112页,创作于2023年2月模型参数的选择标准平均误差ME的绝对值最接近于0标准化平均误差MSE最接近于0平均标准误差ASE与均方根误差RMSE最接近标准化均方根误差RMSSE最接近于1对于具有同一模型,但相关参数设置不同的两个表面来说,MSE趋于0,而且RMSE尽量小是首要的,其次是RMSE与ASE接近或RMSSE趋近于1;对于采用不同模型的两个表面来说,RMSE与ASE接近或RMSSE趋近于1要优先于MSE尽量小这个条件。第96页,课件共112页,创作于2023年2月主要内容基本概念空间变异性分析(半变异函数)空间插值方法(Kriging方法)其它研究方法第97页,课件共112页,创作于2023年2月几何分形最基本的研究对象是几何物体的形态,根据欧氏几何理论,几何物体可以区分为零维、一维、二维、三维等,数学上的点、线、面、体,就是典型的维数为0,1,2,3的几何物体,物体的维数是以整数表示的。但是整数表示的维数往往不能充分反映几何物体的某些持性,例如一条曲线和一条直线都是一维的,但曲线的形态比直线要复杂得多,其所携带的信息可能也要多得多。分形与分数维方法空间尺度变化规律研究第98页,课件共112页,创作于2023年2月随着步长的变化,曲线长度也发生变化,但变化率并不相等,这一特性是受曲线的一个参数所控制的,这个参数就是用分数表示的曲线的维数——分数维,又称H-B维(Hausdorff-Besicovitch),同时分数维的大小描述了物体的复杂程度。第99页,课件共112页,创作于2023年2月考虑到不同尺度的土壤变异是否有其相似性可以用分数维的概念去描述。土壤空间变异虽然是极为不规则和复杂的,却可以用随机分数维去表达。分数维法在揭示土壤复杂变异中的相似性中是很有参考价值的。土壤空间变异中往往不存在严格的自相似性,但存在着近似的或统计意义上的自相似性,导致分维数描述土壤空间变异往往不够稳定;同时,这种空间变异的自相似性通常只存在于一定的尺度范同内,一旦超过了这个尺度范同,其自相似性就不复存在。第100页,课件共112页,创作于2023年2月尺度方差分析尺度方差分析是Mo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论