空间内插方法比较_第1页
空间内插方法比较_第2页
空间内插方法比较_第3页
空间内插方法比较_第4页
空间内插方法比较_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

./

加权平均插的结果随使用的函数及其参数、采样点的分布、窗口的大小等的不同而变化。通常使用的采样点数为6—8点。对于不规则分布的采样点需要不断地改变窗口的大小、形状和方向,以获取一定数量的采样点。空间插方法比较<空间统计学>摘要:空间插可以分为几何方法、统计方法、空间统计方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法。介绍了每一种方法的适用围、算法和优缺点。指出没有绝对最优的空间插方法,必须对数据进行空间探索分析,根据数据的特点,选择最优方法;同时,应对插结果做严格的检验。开发通用空间插软件、智能化插以及加强相关基础研究将是空间插研究的重点。1空间插根据已知地理空间的特性探索未知地理空间的特性是许多地理研究的第一步,也是地理学的基本问题。常规方法无法对空间中所有点进行观测,但是我们可以获得一定数量的空间样本,这些样本反映了空间分布的全部或部分特征,并可以据此预测未知地理空间的特征。在这一意义上,空间插可以被定义为根据已知的空间数据估计〔预测未知空间的数据值。其目标可以归纳为:①缺值估计:估计某一点缺失的观测数据,以提高数据密度;②插等值线:以等值线的形式直观地显示数据的空间分布;③数据格网化:把无规则分布的空间数据插为规则分布的空间数据集,如规则矩形格网、三角网等。空间插对于观测台站十分稀少,而台站分布又非常不合理的地区具有十分重要的实际意义。这些地区的常规观测常常不能满足要求,在这种情况下,利用有限的常规观测估计合理的空间分布,或尽可能地提高数据密度就成为迫切要求。在这些方面,缺值估计和数据格网化将发挥重要的作用。<1>缺值估计。各种科学考察中形式多样的短期观测是提高数据观测密度的重要方式,无形中起到了加密台站的作用;而且由于这些考察常常到达人迹罕至的高海拔和极地等区域,有助于了解区域观测变量的完整空间分布。但是,这些观测序列往往很短,短则数十天,长不过几年。如何利用周围台站的长序列观测资料和短期观测本身的信息,将观测变量插补到长序列是一个重要问题。<2>数据格网化。规则格网能够更好地反映连续分布的空间现象,并对他们的变化作出模拟。现代地球科学模型和气候模型,如GCM〔一般环流模型,都要求与GIS数据模型和遥感数据高度兼容的空间数据集。格网化的数据,尤其是规则矩形格网,已成为目前地学模型的主要数据形式。因此,对已知观测台站的观测数据进行空间插,得到格网化数据是模型的第一步。空间插一般包括这样几个过程:①插方法〔模型的选择;②空间数据的探索分析,包括对数据的均值、方差、协方差、独立性和变异函数的估计等;③插方法评价;④重新选择插方法,直到合理;⑤插。因此,通过比较而选择一个合用的、适合于数据空间分布特点的插方法是空间插的关键。本文将空间插分类为几何方法、统计方法、空间统计方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法,通过比较研究,指出每一种方法的适用围、算法和优缺点。2空间插方法比较空间插可依据:①确定或随机;②点与面;③全局或局部等标准分类。本文依据插方法的基本假设和数学本质,把空间插分类为以下几种方法。2.1几何方法是最简单的空间插方法。几何方法基于"地理学第一定律"的基本假设,即邻近的区域比距离远的区域更相似。几何方法的优点是计算开销少,具有普适性,不需要根据数据的特点对方法加以调整。当样本数据的密度足够大时,几何方法一般能达到满意的精度。几何方法的最大问题是,无法对误差进行理论估计。最常用的几何方法有泰森多边形〔最近距离法和反距离加权方法。泰森多边形〔最近距离法泰森多边形用于生成"领地"或控制区域。实际上,尽管泰森多边形产生于气候学领域,它却特别适合于专题数据的插,因为它生成专题与专题之间明显的边界,不会有不同级别之间的中间现象。泰森多边形的算法非常简单,未采样点的值等于与它距离最近的采样点的值。反距离加权方法反距离加权法是最常用的空间插方法之一。它认为与未采样点距离最近的若干个点对未采样点值的贡献最大,其贡献与距离成反比。可用下式表示:<1>式中,Z是估计值,Zi是第i〔i=1,…,n个样本,Di是距离,p是距离的幂,它显著影响插的结果,它的选择标准是最小平均绝对误差。Husar等的研究结果表明,幂越高,插结果越具有平滑的效果。2.2统计方法其基本假设是,一系列空间数据相互相关,预测值的趋势和周期是与它相关的其它变量的函数。统计方法的优点是计算开销不大,有一定的理论基础,能够对误差作出整体上的估计。但是,其前提是一定要有好的采样设计,如果采样过程不能反映出表面变化的重要因素,如周期性和趋势,则插一定不能取得好的效果。常用的统计方法有趋势面方法和多元回归方法。趋势面趋势面根据有限的观测数据拟合曲面,进行插。它适用于:①能以空间的视点诠释趋势和残差;②观测有限,插也基于有限的数据。当趋势和残差分别能与区域和局部尺度的空间过程相联系时,趋势面分析最有用。趋势面方法可以被定义为:y=Aθ+e<2>式中,y是n×1维矩阵,对应于n个样本;A是n个样本的坐标矩阵;θ是趋势面参数矩阵。A和θ依赖于趋势面的次数。趋势面的次数是它最重要的特征。e是残差,通常是一个独立随机变量。当残差是随机独立时,统计检验有效;但实际上,趋势面中的残差常是自相关〔特别是趋势面的次数较低时,因此,检验是显著有偏差的。残差的空间自相关可以用随机过程模型模拟。由于趋势面的以上特性,它的目标有时并非最佳拟合,而是把数据分成区域趋势组分和局部的残差。多元回归在各种统计方法中,使用较多的是回归分析,其特点是不需要分布的先验知识。多元回归在数学形式上与趋势面很相似,但是,它们又有着显著的不同。首先,在趋势面分析中,A是坐标矩阵,而在回归分析中,它可以是任意变量。其次,在趋势面方法中,模型的拟合严格地遵从自常数、一次、二次、立方等的顺序,主要的问题是确定模型的次数,因此,趋势面分析有在的多重共线性问题;而在多元回归中,尽管也存在多重共线性,但它并非在的,可以通过逐步回归解决,因此,相对于趋势面的选择次数,多元回归的核心问题是选择变量〔主成分分析等方法有助于选择变量和区分模型。2.3空间统计〔Geostatistics方法空间统计又称地质统计学,于20世纪50年代初开始形成,60年代在法国统计学家Matheron的大量理论研究工作基础上逐渐趋于成熟。其基本假设是建立在空间相关的先验模型之上的。假定空间随机变量具有二阶平稳性,或者是服从空间统计的本征假设〔intrinsichypothesis。则它具有这样的性质:距离较近的采样点比距离远的采样点更相似,相似的程度、或空间协方差的大小,是通过点对的平均方差度量的。点对差异的方差大小只与采样点间的距离有关,而与它们的绝对位置无关。空间统计插的最大优点是以空间统计学作为其坚实的理论基础,可以克服插中误差难以分析的问题,能够对误差做出逐点的理论估计;它也不会产生回归分析的边界效应。缺点是复杂,计算量大,尤其是变异函数〔variogram是几个标准变异函数模型的组合时,计算量很大;另一个缺点是变异函数需要根据经验人为选定。空间统计方法以Kriging及其各种变种〔Cokriging等为代表。Kriging插<1Kriging插的公式Kriging插由南非地质学家Krige发明,并因此而命名。Matheron给出了Kriging的一般公式。Kriging插的公式为:<3>式中,z<xi>为观测值,它们分别位于区域xi位置;x0是一个未采样点;λi为权,并且其和等于1。即<4>选取λi,使z⌒<x0>的估计无偏,并且使方差σ[DD<-*2]⌒[][DD>]2e小于任意观测值线形组合的方差。最小方差由下式给定:<5>它由下式得到:<6>式中,γ<xi,xj>是z在采样点xi和xj之间的半方差〔semi-variance,γ<xj,x0>是z在采样点xi和未知点x0之间的半方差,这些量都从适宜的变异函数得到。φ是极小化处理时的拉格朗日乘数。估计半方差是一个较为复杂的过程,这一过程称为空间数据探索分析〔ESDA。<2空间数据探索分析〔ESDA对于Kriging插而言,空间数据探索分析的目标是建立半方差γ<h>和点对之间的空间距离h之间的关系,即变异函数。由于空间统计的本征假设可以表示为以下两个公式:·任意两个距离为h的两点间的差值的数学期望为0:EZ<x>-Z<x+h>〕=0<7>·任意两个距离为h的两点间的差值的方差最小:Var〔Z<x>-Z<x+h>〕=E{ε'<x>-ε'<x+h>〕2}=2γ<h><8>因此,由下式估计半方差γ<h>:<9>这一关系即变异函数。它提供了插、优化采样的有用信息。Kriging插的第一步是根据样本找到适合的变异函数理论模型。最常用的变异函数模型有:nugget、球面、指数、高斯、阻尼正弦、幂和线形模型。其中,前几种模型在一定的围达到极大方差,而线形模型的方差增长没有极限。以下是几种基本变异函数的形式,这些变异函数的特性分别是:·Nugget模型缺乏空间相关。·球面模型空间相关随距离的增长逐渐衰减,当距离>θ后,空间相关消失。·指数模型空间相关随距离的增长以指数形式衰减,相关性消失于无穷远。θ表示距离,在此距离上95%的变量的可变性趋于稳定。·高斯模型空间相关随距离的增长而衰减,相关性消失于无穷远。曲线起始一段的形状是抛物线,表示变量的空间变化非常平滑。·阻尼正弦模型阻尼正弦模型适宜于周期性变化的空间变量,但其变化强度随距离的增长而衰减。θ表示周期。·线性模型空间可变性随距离的增长而呈线性地增长,不会在某一距离稳定下来。变异函数的形式是插质量的关键。需要注意的是,由于不同的区域有不同的空间模式,因而也就有不同的变异函数。而空间插都有一个隐含的假定,即空间是连续的,因此,在选择变异函数模型之前,检查数据以确定空间连续性是十分必要的。Cokriging插Cokriging〔共协kriging插的基本原理与Kriging相同,但它通过考虑一个以上变量而优化估计;插由于考虑了变量之间的关系而得到改善。例如,在估计温度、降水等气候变量时,海拔高度是附加的重要变量。Cokriging插包括以下过程:①确定多个观测值之间空间相关的特征;②借助于变异函数和交叉变异函数〔crossvariogram,对相关建模;③利用这些函数估计插值。除公式<7>、<8>外,Cokriging引入一个新的假定,即两个变量之间差值的方差最小。Var〔Z<x>-Zk<x>〕=2γk<h>〔10式中,Zk<x>是与估计值Z<x>相关的第k个变量。Cokriging中引入交叉变异函数,它是两个不同变量之间的相关随距离变化的函数。它与简单变异函数不同,前者的形式是方差,因此总为正或零;而后者的形式为协方差,因此可以为正、负或零。如果两个变量向相反的方向变化,交叉变异函数为负;如果两个变量的变化相独立,交叉变异函数为零。交叉变异函数的形式为:<11>Cokriging插的关键是估计交叉变异函数,以分析变量自身以及变量之间的空间相关。Cokriging的其它过程都是与Kriging一致的。2.4函数方法是使用函数逼近曲面的一种方法。函数方法在空间插领域大多用于一些特殊场合,如利用高密度的高程数据产生等高线、为提高格网数据的空间分辨率而插数据等。对于利用有限的观测数据进行缺值预测和插格网,函数方法多不适合,因为它难以满足插的精度,也难以估计误差。函数方法的特点是不需要对空间结构的预先估计、不需要做统计假设。缺点是难以对误差进行估计,点稀时效果不好。常用的函数方法有:傅里叶级数、样条函数、双线性插、立方卷积法等。傅里叶级数对于周期性的数据序列,如海浪,可以利用傅里叶级数将它们分解为正弦波和余弦波。样条函数方法样条函数是使用函数逼近曲面的一种方法。样条函数易操作,计算量不大,它与空间统计方法相比具有以下特点,不需要对空间方差的结构做预先估计;不需要做统计假设,而这些假设往往是难以估计和验证的;同时,当表面很平滑时,也不牺牲精度。样条函数适合于非常平滑的表面,一般要求有连续的一阶和二阶导数;它适合于根据很密的点插等值线,特别是从不规则三角网〔TIN插等值线。样条函数的缺点是难以对误差进行估计,点稀时效果不好。样条函数的种类很多,最常用的有B样条、力样条和薄盘样条等。双线性插双线性插和立方卷积法都主要用于网格数据的插〔重采样,一般很少用于根据离散数据插空间分布。它使用与待估计网格距离最近的4个网格值,线性插获得新的网格值。双线性插方法的优点是数据重采样后的结果较为平滑,没有阶跃效应,同时具有较高的精度。缺点是网格被平均化,具有低频滤波的效果;边缘被平滑,有些极值丢失了。立方卷积法是最常使用的网格数据插方法之一。它使用与待估计网格距离最近的16个网格值,根据立方卷积公式计算输出。立方卷积公式有几个不同版本,有的产生低通滤波的效果,有的产生高通滤波的效果,较好的方法应该在高频信息和低频信息的取舍间取得平衡。立方卷积法的优点是采样结果的统计信息〔均值和方差与原数据的相似程度比其他采样方法高。缺点是数据值被改变,因此不能用于类型数据〔专题图的插。立方卷积法特别适宜于显著改变了网格尺寸,但要保持原数据统计特性的数据插,如数字高程数据的重采样。2.5随机模拟方法其基本假设与空间统计方法不同,随机模拟认为地理空间具有非平稳性,是空间异质的。它通过空间分布现象的可选的、等概率的、数值表达〔地图来对空间不确定性建模。对应不确定性,可以接受可选的多个答案。与空间统计方法不同,随机模拟方法不是产生唯一的估计结果,它产生一系列可选的结果,它们都与实际数据一致,而且相关模型将它们联系起来。随机模拟方法的最大优点是定义了各种随机变量之间的空间相关,这类相关可以根据相邻数据把高度不确定性的先验分布更新为低不确定性的后验分布。缺点是建模困难,计算量大。常用的随机模拟方法有高斯过程、马尔科夫过程、蒙特卡罗方法、人工神经网络方法等。2.6确定性模拟其基本假设是变量的空间分布受物理定律控制,因此,可以使用物理模型或半经验、半物理的模型模拟空间分布。对于这一类插,常常是使用有限的观测值获得一些必须的经验参数,再把这些参数代入到物理模型之中。典型的例子是,GCM是一个纯物理模型,但它的参数化使用了经验方法。在山区气候变量的插过程中,也大量使用这种方法。确定性模拟的最大优点即它的确定性,它不依赖或很少依赖观测样本。但空间现象是否可以被确定性地预测以及我们是否可以持这一乐观的信念十分值得怀疑。2.7综合方法是以上几种方法的综合。对于空间变量,一般能够用不同的方法分别对结构化变量、随机变量和观测误差〔残差建模。王劲峰把空间变量分解为:空间变量=趋势+周期+随机+噪声〔12并分别用统计方法、谱函数、人工神经网络和随机过程建模描述相应的成分。综合方法还适宜于能够得到辅助性数据,如遥感数据的场合。通过从辅助性数据中提取空间模式,在合理的数据结构,如四叉树的支持下,划分空间同质的区域,从而逼近最佳的预测值。3结论与建议3.1结论〔1空间插可依据其基本假设和数学本质分类为:几何方法、统计方法、空间统计方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法。〔2空间插是极为重要的GIS空间分析方法。对于观测台站稀少,而测点分布又极不合理的地区,空间插是研究这些区域空间变量空间分布的基本方法,是建立空间模型的前提之一。〔3空间数据探索分析是分析地理数据的重要工具,它的一个重要目标是估计空间变量的变异函数。变异函数反映空间相关随距离变化的特征,可以用几个基本变异函数模型描述。根据变异函数,可以判断数据是否具有平稳性,是否符合空间统计的本征假设。〔4本文比较了主要的空间插方法,分析了各种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论