版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、空间数据的插值用各种方法采集的空间数据往往是按用户自己的要求获取的采样观测值,亦既数据集合是由感兴趣的区域的随机点或规则网点上的观测值组成的。但有时用户却需要获取未观测点上的数据,而已观测点上的数据的空间分布使我们有可能从已知点的数据推算出未知点的数据值。在已观测点的区域估算未观测点的数据的过程称为插;在已观测点的区域外估算未观测点的数据的过程称为外推。空间数据的插和外推在GIS中使用十分普遍。一般情况下,空间位置越靠近的点越有可能获得与实际值相似的数据,而空间位置越远的点则获得与实际值相似的数据的可能性越小。下面介绍一些常用的插方法。1、边界插使用边界插法时,首先要假定任何重要的变化都发生在区域的边界上,边界的变化则是均匀的、同质的。边界插的方法之一是泰森多边形法。泰森多边形法的基本原理是,未知点的最佳值由最邻近的观测值产生。如图4-6-1所示。泰森多边形的生成算法见§ 5.7。2、趋势面分析趋势面分析是一种多项式回归分析技术。多项式回归的基本思想是用多项式表示线或面,按最小二乘法原理对数据点进行拟合,拟合时假定数据点的空间坐标X、Y为独立变量,而表示特征值的Z坐标为因变量。当数据为一维时,可用回归线近似表示为:其中,a0、a1为多项式的系数。当n个采样点方差和为最小时,则认为线性回归方程与被拟合曲线达到了最佳配准,如图4-6-2左图所示,即:当数据以更为复杂的方式变化时,如图 4-6-2右图所示。在这种情况下,需要用到二次或高次多项式:(二次曲线)在GIS中,数据往往是二维的,在这种情况下,需要用到二元二次或高次多项式:(二次曲面)多项式的次数并非越高越好,超过3次的多元多项式往往会导致奇异解,因此,通常使用二次多项式。趋势面是一种平滑函数,难以正好通过原始数据点,除非数据点数和多项式的系数的个数正好相同。这就是说,多重回归中的残差属正常分布的独立误差,而且趋势面拟合产生的偏差几乎都具有一定程度的空间非相关性。3、局部插在GIS中,实际的连续空间表面很难用一种数学多项式来描述,因此,往往使用局部插技术,即利用局部围的已知采样点的数据插出未知点的数据。常用的有线性插、双线性多项式插、双三次多项式(样条函数)插。、线性插线性插的多项式函数为:只要将插点周围的 3个数据点的数据值带入多项式,即可解算出系数
a0、a1、a2。(2)、双线性多项式插双线性多项式插的多项式函数为:只要将插点周围的 4个数据点的数据值带入多项式,即可解算出系数
a0、a1、a2、a3。如果数据是按正方形格网点布置的(如图 4-6-3),则可用简单的公式即可计算出存点的数据值。设正方形的四个角点为A、B、C、D,其相应的特征值为ZA、ZB、ZC、ZD,P点相对于A点的坐标为dX、dY,则插值点的特征值Z为:(3)、双三次多项式(样条函数)插双三次多项式是一种样条函数。样条函数是一种分段函数,对于 n次多项式,在边界处其数连续。因此,样条函数每次只用少量的数据点,故插速度很快;样条函数通过所有的数据点,故可用于精确的插,可以保留微地貌特征;样条函数的 n-1阶导数连续,故可用于平滑处理。双三次多项式插的多项式函数为:
n-1
阶导将插点周围的 16个点的数据带入多项式,可计算出所有的系数。4、移动平均法在未知点X处插变量Z的值时,最常用的方法之一是在局部围 (或称窗口)计算个数据点的平均值。既:对于二维平面的移动平均法也可用相同的公式,但位置 Xi应被坐标矢量 Xi代替。窗口的大小对插的结果有决定性的影响。小窗口将增强近距离数据的影响;大窗口将增强远距离数据的影响,减小近距离数据的影响。当观测点的相互位置越近, 其数据的相似性越强;当观测点的相互位置越远, 其数据的相似性越低。因此,在应用移动平均法时,根据采样点到插点的距离加权计算是很自然的。这就是加权移动平均法,即:其中,λi 是采样点i对应的权值,常取的形式有:加权平均插的结果随使用的函数及其参数、采样点的分布、窗口的大小等的不同而变化。通常使用的采样点数为6—8点。对于不规则分布的采样点需要不断地改变窗口的大小、形状和方向,以获取一定数量的采样点。空间插方法比较(空间统计学)摘要:空间插可以分为几何方法、统计方法、空间统计方法、函数方法、随机 模拟方法、物理模型模拟方法和综合方法。介绍了每一种方法的适用围、算法和优缺点。指出没有绝对最优的空间插方法,必须对数据进行空间探索分析,根据数据的特点,选择最优方法;同时,应对插结果做严格的检验。开发通用空间插软件、智能化插以及加强相关基础研究将是空间插研究的重点。空间插根据已知地理空间的特性探索未知地理空间的特性是许多地理研究的第一步,也是地理学的 基本问题。常规方法无法对空间中所有点进行观测,但是我们可以获得一定数量的空间样本,这些样本反映了空间分布的全部或部分特征, 并可以据此预测未知地理空间的特征。 在这 一意义上,空间插可以被定义为根据已知的空间数据估计(预测)未知空间的数据值。其目标可以归纳为:①缺值估计:估计某一点缺失的观测数据,以提高数据密度;②插等值线:以等值线的形式直观地显示数据的空间分布;③数据格网化:把无规则分布的空间数据插为规则分布的空间数据集,如规则矩形格网、三角网等。空间插对于观测台站十分稀少,而台站分布又非常不合理的地区具有十分重要的实际意义 。这些地区的常规观测常常不能满足要求,在这种情况下,利用有限的常规观测估计合理的空间分布,或尽可能地提高数据密度就成为迫切要求。在这些方面,缺值估计和数据格网化 将发挥重要的作用。(1) 缺值估计。各种科学考察中形式多样的短期观测是提高数据观测密度的重要方式, 无形中起到了加密台站的作用;而且由于这些考察常常到达人迹罕至的高海拔和极地等区域 ,有助于了解区域观测变量的完整空间分布。但是,这些观测序列往往很短,短则数十天,长不过几年。如何利用周围台站的长序列观测资料和短期观测本身的信息,将观测变量插 补到长序列是一个重要问题。数据格网化。规则格网能够更好地反映连续分布的空间现象,并对他们的变化作出模拟。现代地球科学模型和气候模型,如GCM(一般环流模型),都要求与GIS数据模型和遥感数据高度兼容的空间数据集。格网化的数据,尤其是规则矩形格网,已成为目前地学模型的主要数据形式。因此,对已知观测台站的观测数据进行空间插,得到格网化数据是模型的第一步。空间插一般包括这样几个过程:①插方法(模型)的选择;②空间数据的探索分析,包括对数据的均值、方差、协方差、独立性和变异函数的估计等;③插方法评价;④重新选择插方法,直到合理;⑤插。因此,通过比较而选择一个合用的、适合于数据空间分布特点的插方法是空间插的关键。本文将空间插分类为几何方法、统计方法、空间统计方法、函数方法、随机模拟方法、物理模型模拟方法和综合方法,通过比较研究,指出每一种方法的适用围、算法和优缺点。空间插方法比较空间插可依据:①确定或随机;②点与面;③全局或局部等标准分类。本文依据插方法的基本假设和数学本质,把空间插分类为以下几种方法。2.1几何方法是最简单的空间插方法。 几何方法基于“地理学第一定律”的基本假设, 即邻近的区域比距离远的区域更相似。几何方法的优点是计算开销少,具有普适性,不需要根据数据的特点对方法加以调整。当样本数据的密度足够大时,几何方法一般能达到满 意的精度。几何方法的最大问题是,无法对误差进行理论估计。最常用的几何方法有泰森多边形(最近距离法)和反距离加权方法。 泰森多边形(最近距离法)泰森多边形用于生成“领地”或控制区域。实际上,尽管泰森多边形产生于气候学领域,它却特别适合于专题数据的插,因为它生成专题与专题之间明显的边界,不会有不同级别之间的中间现象。泰森多边形的算法非常简单,未采样点的值等于与它距离最近的 采样点的值。 反距离加权方法反距离加权法是最常用的空间插方法之一。 它认为与未采样点距离最近的若干个 点对未采样点值的贡献最大,其贡献与距离成反比。可用下式表示:式中,Z是估计值,Zi是第i(i=1,⋯,n)个样本,Di是距离,p是距离的幂,它显著影响插的结果,它的选择标准是最小平均绝对误差。Husar等的研究结果表明,幂越高,插结果越具有平滑的效果。2.2统计方法其基本假设是,一系列空间数据相互相关,预测值的趋势和周期是与它相关的其它变量的函数。 统计方法的优点是计算开销不大,有一定的理论基础,能够对误差作出整体上的估计。 但是,其前提是一定要有好的采样设计,如果采样过程不能反映出表面变化的重要因素,如周期性和趋势,则插一定不能取得好的效果。常用的统计方法有趋势面方法和多元回归方法。 趋势面趋势面根据有限的观测数据拟合曲面,进行插。它适用于:①能以空间的视点诠释趋势和残差;②观测有限,插也基于有限的数据。 当趋势和残差分别能与区域和局部尺度的空间
过程相联系时,趋势面分析最有用。趋势面方法可以被定义为:
y=Aθ+e(2)式中,y是n×1维矩阵,对应于
n个样本;A是n个样本的坐标矩阵;θ
是趋势面参数矩阵。
A和θ依赖于趋势面的次数。趋势面的次数是它最重要的特征。是残差,通常是一个独立随机变量。当残差是随机独立时,统计检验有效;但实际上,趋势面中的残差常是自相关(特别是趋势面的次数较低时),因此,检验是显著有偏差的。残差的空间自相关可以用随机过程模型模拟。由于趋势面的以上特性,它的目标有时并非最佳拟合,而是把数据分成区域趋势组分和局部的残差。 多元回归在各种统计方法中,使用较多的是回归分析,其特点是不需要分布的先验知识。多元回归在数学形式上与趋势面很相似,但是,它们又有着显著的不同。首先,在趋势面分析中, A是坐标矩阵,而在回归分析中,它可以是任意变量。其次,在趋势面方法中,模 型的拟合严格地遵从自常数、一次、二次、立方等的顺序,主要的问题是确定模型的次数, 因此,趋势面分析有在的多重共线性问题;而在多元回归中,尽管也存在多重共线性,但它并非在的,可以通过逐步回归解决,因此,相对于趋势面的选择次数,多元回归的核心 问题是选择变量(主成分分析等方法有助于选择变量)和区分模型。2.3空间统计(Geostatistics )方法空间统计又称地质统计学,于 20世纪50年代初开始形成, 60年代在 法国统计学家 Matheron的大量理论研究工作基础上逐渐趋于成熟。其基本假设是建立在空间相关的先验模型之上的。假定空间随机变量具有二阶平稳性,或者是服从空间统计的本征假设( intrinsic hypothesis 。则它具有这样的性质:距离较近的采样点比距离远的采样点更相似,相似的程度、或空间协方差的大小,是通过点对的平均方差度量的。点对差异的方差大小只与采样点间的距离有关, 而与它们的绝对位置无 关。空间统计插的最大优点是以空间统计学作为其坚实的理论基础,可以克服插中误差难以分析的问题, 能够对误差做出逐点的理论估计;它也不会产生回归分析的边界效应。缺点是复杂,计算量大,尤其是变异函数(
variogram
)是几个标准变异函数模型的组合时,计算量很大;另一
个缺点是变异函数需要根据经验人为选定。空间统计方法以Kriging
及其各种变种(
Cokriging
等)为代表。
插(1)Kriging
插的公式
Kriging
插由南非地质学家
Krige
发明,并因此而命名。Matheron
给出了
Kriging的一般公式。Kriging
插的公式为:式中,z(xi)为观测值,它们分别位于区域xi位置;x0是一个未采样点;λi为权,并且其和等于1。即(4) 选取λi,使 z⌒(x0)的估计无偏,并且使方差 σ[DD(-*2]⌒[][DD)] 2 e小于任意观测值线形组合的方差。最小方差由下式给定:它由下式得到:(6) 式中,γ(xi
,xj)
是z在采样点
xi和xj
之间的半方差(
semi-variance
),γ(xj,x0)
是z在采样点
xi
和未知点
x0之间的半方差,这些量都从适宜的变异函数得到。φ
是极小化处理时的拉格朗日乘数。估计半方差是一个较为复杂的过程,这一过程称为空间数据探索分析( ESDA)。(2) 空间数据探索分析( ESDA)对于Kriging插而言,空间数据探索分析的目标是建立半方差γ(h)和点对之间的空间距离h之间的关系,即变异函数。由于空间统计的本征假设可以表示为以下两个公式:·任意两个距离为h的两点间的差值的数学期望为0:EZ(x)-Z(x+h)〕=0(7)·任意两个距离为h的两点间的差值的方差最小:Var〔Z(x)-Z(x+h)〕=E{ε'(x)-ε'(x+h)〕2}=2γ(h)(8)因此,由下式估计半方差γ(h):(9)这一关系即变异函数。它提供了插、优化采样的有用信息。Kriging插的第一步是根据样本找到适合的变异函数理论模型。最常用的变异函数模型有:nugget、球面、指数、高斯、阻尼正弦、幂和线形模型。其中,前几种模型在一定的围达到极大方差,而线形模型的方差增长没有极限。以下是几种基本变异函数的形式,这些变异函数的特性分别是:·Nugget模型缺乏空间相关。·球面模型空间相关随距离的增长逐渐衰减,当距离>θ后,空间相关消失。·指数模型空间相关随距离的增长以指数形式衰减,相关性消失于无穷远。θ表示距离,在此距离上95%的变量的可变性趋于稳定。·高斯模型空间相关随距离的增长而衰减,相关性消失于无穷远。曲线起始一段的形状是抛物线,表示变量的空间变化非常平滑。 ·阻尼正弦模型阻尼正弦模型适宜于周期性变化的空间变量, 但其变化强度随距离的增长而衰减。θ 表示周期。·线性模型空间可变性随距离的增长而呈线性地增长,不会在某一距离稳定下来。变异函数的形式是插质量的关键。需要注意的是,由于不同的区域有不同的空间模式,因而也就有不同的变异函数。而空间插都有一个隐含的假定,即空间是连续的,因此,在选择变异函数模型之前,检查数据以确定空间连续性是十分必要的。 插Cokriging (共协kriging )插的基本原理与 Kriging 相同,但它通过考虑一个以上变量而优化估计;插由于考虑了变量之间的关系而得到改善。例如,在估计温度、降水等气候变
量时,海拔高度是附加的重要变量。Cokriging
插包括以下过程:①确定多个观测值之间
空间相关的特征;②借助于变异函数和交叉变异函数(
cross
variogram
),对相关建模;
③利用这些函数估计插值。除公式(7)
、(8)
外,Cokriging
引入一个新的假定,即两个变量之间差值的方差最小。Var〔Z(x)-Zk(x)
〕=2γk(h)
(10)式中,Zk(x)
是与估计值
Z(x)
相关的第
k个变量。Cokriging
中引入交叉变异函数, 它是两个不同变量之间的相关随距离变化的函数。
它与简单
变异函数不同,前者的形式是方差,因此总为正或零;而后者的形式为协方差,因此可以为 正、负或零。如果两个变量向相反的方向变化,交叉变异函数为负;如果两个变量的变化相独立,交叉变异函数为零。交叉变异函数的形式为: (11)Cokriging 插的关键是估计交叉变异函数, 以分析变量自身以及变量之间的空间相关。 Cokriging 的其它过程都是与Kriging 一致的。2.4函数方法是使用函数逼近曲面的一种方法。函数方法在空间插领域大多用于一些特殊场合,如利用 高密度的高程数据产生等高线、为提高格网数据的空间分辨率而插数据等。对于利用有限的观测数据进行缺值预测和插格网,函数方法多不适合,因为它难以满足插的精度,也 难以估计误差。函数方法的特点是不需要对空间结构的预先估计、不需要做统计假设。缺点是难以对误差进行估计,点稀时效果不好。常用的函数方法有:傅里叶级数、样条函数、双线性插、立方卷积法等。 傅里叶级数对于周期性的数据序列,如海浪,可以利用傅里叶级数将它们分解为正弦波和余弦波。 样条函数方法样条函数是使用函数逼近曲面的一种方法。样条函数易操作,计算量不大,它与空间统计方 法相比具有以下特点,不需要对空间方差的结构做预先估计;不需要做统计假设,而这些假设往往是难以估计和验证的;同时,当表面很平滑时,也不牺牲精度。样条函数适合于非常平滑的表面,一般要求有连续的一阶和二阶导数;它适合于根据很密的 点插等值线,特别是从不规则三角网( TIN)插等值线。样条函数的缺点是难以对误差进行估计,点稀时效果不好。样条函数的种类很多,最常用的有 B样条、力样条和薄盘样条等。 双线性插双线性插和立方卷积法都主要用于网格数据的插(重采样),一般很少用于根据离散数据插空间分布。它使用与待估计网格距离最近的4个网格值,线性插获得新的网格值。双线性插方法的优点是数据重采样后的结果较为平滑,没有阶跃效应,同时具有较高的精度。缺点是网格被平均化,具有低频滤波的效果;边缘被平滑,有些极值丢失了。2.4.4立方卷积法是最常使用的网格数据插方法之一。它使用与待估计网格距离最近的16个网格值,根据立方卷积公式计算输出。立方卷积公式有几个不同版本,有的产生低通滤波的效果,有的产生高通滤波的效果,较好的方法应该在高频信息和低频信息的取舍间取得平衡。立方卷积法的优点是采样结果的统计信息(均值和方差)与原数据的相似程度比其他采样方法高。缺点是数据值被改变,因此不能用于类型数据(专题图)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国大型三机一体除湿干燥机境外融资报告
- 2024-2030年中国型钢行业产量预测及投资规模分析报告
- 2024-2030年中国地质锤行业应用动态与前景趋势预测报告
- 2024-2030年中国呼吸麻醉机行业发展形势及投资潜力研究报告
- 2024-2030年中国双杆挂烫机行业销售状况及营销渠道策略报告
- 集团公司危险作业指导手册 第15项-高辐射作业安全指导手册
- 2024年度企业劳动合同劳动合同续签及变更管理规范6篇
- 2024年环保设备与钢材交易之居间委托合同
- 2024年房地产开发项目投资入股合同范本3篇
- 2024年度教育产业联营合作协议书3篇
- 图文转换-图表(小题训练)(解析版)-2025年部编版中考语文一轮复习
- 七上语文期末考试复习计划表
- 2024儿童青少年抑郁治疗与康复痛点调研报告 -基于患者家长群体的调研
- 大数据+治理智慧树知到期末考试答案章节答案2024年广州大学
- 江苏省建筑与装饰工程计价定额(2014)电子表格版
- 山东省烟台市2023-2024学年高二上学期期末考试数学试卷(含答案)
- 2024年中国铁路南宁局集团招聘笔试参考题库含答案解析
- 国家开放大学化工节能课程-复习资料期末复习题
- GB 18613-2020 电动机能效限定值及能效等级
- 小学写字阅读考核实施方案
- 起重机传动装置的设计
评论
0/150
提交评论