空间数据的处理_第1页
空间数据的处理_第2页
空间数据的处理_第3页
空间数据的处理_第4页
空间数据的处理_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于空间数据的处理1第1页,课件共86页,创作于2023年2月2内容提要第一节空间数据处理的目的和内容第二节空间数据的编辑第三节空间数据的坐标变换第四节空间数据的插值第五节矢量数据向栅格数据的转换第六节栅格数据向矢量数据的转换第2页,课件共86页,创作于2023年2月3第一节空间数据处理的目的和内容1、目的(1)数据的净化;(2)数据的规范化。第3页,课件共86页,创作于2023年2月42、内容(1)编辑处理;(2)变换处理;(3)编码和压缩处理;(4)数据的插值;(5)数据类型的转换。返回第4页,课件共86页,创作于2023年2月5第二节空间数据的编辑1、概述编辑是对输入的数据进行检查、改错、更新及加工,以得到净化的数据。图形数据的编辑分两种:[1]图形参数编辑:线型、宽、色,符号尺寸、颜色,面域图案及颜色等设定。[2]几何数据编辑:点、线、面和目标的编辑。第5页,课件共86页,创作于2023年2月62、空间数据编辑的内容(1)修改错误数据图形数据错误:点、线的丢失、重复、形状错误等;属性数据错误;图形与属性数据配合错误等。错误太多时,重新输入更省时间。第6页,课件共86页,创作于2023年2月7(2)空间数据的更新通过编辑更新数据,确保现势性。(3)空间数据的预处理和后处理预处理:拓扑关系建立、曲线光滑、图幅拼接等;后处理:图形整饰,如经纬线生成,图例标注等。第7页,课件共86页,创作于2023年2月8

(4)图幅的拼接[1]统一坐标,规范属性[2]相邻图幅编号个位表示横向顺序,十位表示纵向顺序。第8页,课件共86页,创作于2023年2月9

[3]图幅间坐标数据的匹配同名边界点坐标应在允许范围内,弧段左右多边形号相同或相反。不匹配时:A.修改数据库中点的坐标;B.先对准两幅图的一条边缘线,再调整其它线段。

[4]删除公共边界返回第9页,课件共86页,创作于2023年2月10(1)平移变换x*=x+dxy*=y+dy其中,dx、dy分别为x,y方向平移量,相应的向量形式为:[x*,y*]=[x,y]+[dx,dy]第三节空间数据的坐标变换1.图形的几何变换第10页,课件共86页,创作于2023年2月11

(2)比例变换x*=x.Sxy*=y.Sy其中:Sx,Sy分别为x,y方向的比例系数,矩阵为:[x*,y*]=[x,y].Sx00Sy第11页,课件共86页,创作于2023年2月12(3)旋转变换将点(x,y)旋转角

x=A.cos,y=A.sinx*=A.cos(+)=A.(cos.cos-sin.sin)=x.con-y.siny*=A.sin(+)=A(sin.con+con.sin)=x.sin+y.con矩阵为:

[x*,y*]=[x,y].consin-sincon第12页,课件共86页,创作于2023年2月132.投影变换投影变换会变形。投影变换是一复杂的数学运算。可用软件转换。返回第13页,课件共86页,创作于2023年2月14第四节空间数据的插值空间插值(内插)是用已知点的数值估算未知点的数值的过程。例如,在一个没有记录数据的地点,其降水量可通过对附近气象站已知降水量记录的插值来估算出来。在GIS应用中,空间插值主要用于栅格数据,估算出格网中每个单元的值。因此,空间插值是将点数据转换成面数据的一种方法。第14页,课件共86页,创作于2023年2月15连续空间:采用渐变模型-点插值。离散空间:邻近元法-区域插值。第15页,课件共86页,创作于2023年2月16一、点插值整体拟合:模型由研究区域内所有采样点上的全部特征观测值建立。(全局方法)局部拟合:用邻近的数据点来估计未知点的值。(局部方法)返回第16页,课件共86页,创作于2023年2月171、全局方法利用每个可利用的控制点来构建一个方程或模型,该模型可用于估算未知数值。(1)趋势面分析

趋势面分析用多项式方程拟合已知数值的点。该方程又称趋势面模型,线性趋势面方程:zx,y=b0+b1x+b2y特征值z是x和y的函数。系数b由控制点估算。其拟合程度可用相关系数确定。每个已知点观测值和估算值之间的偏差或残差可以计算出来。第17页,课件共86页,创作于2023年2月18拟合更复杂的面要求更高次的趋势面模型,如三次趋势面方程:zx,y=b0+b1x+b2y+b3x2+b4xy+b5y2+b6x3+b7x2y+b8xy2+b9y3三次面包含山和谷。统计检验能用于比较几种可选模型的拟合程度。GIS软件包如ARC/INFO提供了多达12次趋势面模型。图13.3是由105个数据点构建的爱达荷州年平均降水量的三阶趋势面等值线图。第18页,课件共86页,创作于2023年2月19第19页,课件共86页,创作于2023年2月20

(2)回归模型

回归模型把方程中的一个因变量与多个自变量联系起来,而后可用于预测或估算。例:用雪水量(SWE)作为因变量,位置和地形变量作为自变量,其流域模型的表达形式如下:SWE=b0+blEASTING+b2SOUTHING+b3ELEV+b4PLANl000

这里EASTING和SOUTHING分别对应一个高程格网的行数和列数,ELEV是高程值,PLANl000是表面曲率的测度。第20页,课件共86页,创作于2023年2月212局部方法该方法用一组控制点样本来估算未知值,因此控制点对该方法十分重要。第一要点是用于估算的控制点个数。GIS软件包通常允许用户自己确定控制点的个数或用默认值(7~12个)。你也许认为控制点越多,估算结果越精确。然而这种设想的正确与否取决于控制点的分布与要估算单元的关系以及空间自相关程度。控制点越多通常意味着估算越通用化。第21页,课件共86页,创作于2023年2月22

控制点个数确定之后,下一步就是控制点选择。简单办法是用离估算点最近的点作为控制点,另一种办法是用半径来选择控制点,半径的大小必须根据控制点的分布来调整。例如,ARC/INFO和ArcView都提供了这两种方法。其他方法考虑了方向因素,例如,象限法或八方向法。象限法是从围绕每个要估算单元的四个方向选择控制点,八方向法是从八个方向来选择控制点。第22页,课件共86页,创作于2023年2月23

(1)泰森多边形泰森(Thiessen)多边形围绕已知点样本构建而成,使得在泰森多边形内的任意点与多边形内的已知点更接近,而不是与其他已知点接近。泰森多边形最初用于估算区域降水量的平均值。第23页,课件共86页,创作于2023年2月24泰森多边形要求在已知点之间构建初始三角形,亦即连接已知点形成三角形。因为连接点的方法不同,形成的三角形也不同。与构建不规则三角网相似,德劳内三角测量常用于构建泰森多边形。德劳内三角网测量确保了每个已知点都与它最近的点相接,这样就使得三角形尽量接近等边。经过三角形每条边的中点画垂线,连接起来就可以很容易地构建泰森多边形(图13.4)。泰森多边形也称为冯罗诺(Voronoi)多边形。第24页,课件共86页,创作于2023年2月25第25页,课件共86页,创作于2023年2月26(2)密度估算密度估算基于点的分布及其已知值来量测格网的密度。一种简单密度估算方法是将格网置于点分布图上,将落在每个单元的点列表,将点值加和,将单元的点值总和除以单元大小,就估算得每个单元的密度。第26页,课件共86页,创作于2023年2月27图13.5显示一个简单密度估算的例子。输入是以50m间距标绘的看到鹿的地点的分布。每个鹿的地点有一个计数值,表示在该地一只鹿被看到多少次。输出是密度格网:单元大小是lhm2,密度用每公顷看到的次数来表示。第27页,课件共86页,创作于2023年2月28核估算(kernelestimation)是一种不同的密度估算方法,它用核函数联系每一个点或观测点。表达为双变量概率密度函数,核函数看起来像是一个隆起(bump),以一个点为中心在一个定义的带宽或窗口范围内逐渐减小到0(图13.6)。核函数和带宽决定了隆起的形状,其形状反过来决定了在估算中的平滑量。在点x上的核密度估算值是带宽范围内位于观测点xi上的隆起部分的总和。第28页,课件共86页,创作于2023年2月29(x-xi)和(y-yi)是带宽范围内的点x和观测点xi之间的x、y坐标的偏差。第29页,课件共86页,创作于2023年2月30使用与简单估算方法相同的输入数据,图13.7显示核估算法构建的密度格网输出结果。格网上的密度值是期望值(输出值的平均数)而不是概率。虽然图13.7和图13.5间的差别不明显,但核估算法通常能产生比简单估算法更平滑的密度面。第30页,课件共86页,创作于2023年2月31(3)反距离权重插值该方法假设未知值的点受较近控制点的影响比较远控制点的影响更大。影响的程度(或权重)用点之间距离乘方的倒数表示。乘方为1.0意味着点之间数值变化率为恒定,该方法称为线性插值法。乘方为2.0或更高则意味着越靠近已知点,数值的变化率越大,远离已知点趋于平稳。

第31页,课件共86页,创作于2023年2月32式中:z0是点0的估计值;zi是控制点i的z值;di是控制点i与点0间的距离;s是在估算中用到的控制点的数目;k是指定的幂。第32页,课件共86页,创作于2023年2月33图13.8显示对爱达荷州105个气象站点数据由反距离平方方法建立的年平均降水量曲面。图13.9显示曲面的等雨量线图。第33页,课件共86页,创作于2023年2月34(4)薄板样条函数法薄板样条函数(Thin-platesplines)建立一个通过控制点的面,并使所有点的坡度变化最小。换言之,薄板样条函数以最小曲率面拟合控制点。薄板样条函数的估计值由下式计算:第34页,课件共86页,创作于2023年2月35Q(x,y)=∑Aidi2logdi+a+bx+cy式中:x和y是要被插值的点的x、y坐标;di2=(x-xi)2+(y-yi)2;xi和yi是控制点i的x、y坐标。薄板样条函数包括二个部分:(a+bx+cy)表示局部趋势函数,di2logdi表示基本函数,可获得最小曲率的面。系数Ai、a、b和c由以下线性方程组决定:式中:n为控制点的数目,fi为控制点i的已知值,系数的计算要求n+3联立方程.第35页,课件共86页,创作于2023年2月36

薄板样条函数的一个主要问题是在数据贫乏地区的坡度较大,常出现过伸(overshoots)。用于校正过伸的方法包括薄板张力样条(thin-piatesplineswithtension),规则样条(regularizedsplines)和规则张力样条(regularizedsplineswithtension)等。第36页,课件共86页,创作于2023年2月37规则样条函数的近似值与薄板样条函数有相同的局部趋势函数,但是基本函数取不同形式:式中τ是样条法中要用到的权重;d是待定值的点和控制点i间的距离,c是常数0.577215;K0(d/τ)是修正的零次贝塞耳(Besscl)函数.它可由一个多项式方程估计。τ值通常设为0~0.5之间.因为更大的τ值会导致数据贫乏地区趋于过伸。ARC/INFO和ArcView采用的默认τ值为0.1.Q(x,y)=∑Aidi2logdi+a+bx+cy第37页,课件共86页,创作于2023年2月38薄板张力样条(thin-platesplineswithtension)法表达式:式中:ф是本张力法要用到的权重。如果ф的权重被设为接近于0,则用张力法与基本薄板样条法得到的估计值相似。ARC/INFO和ArcView采用的默认ф值为0.1。第38页,课件共86页,创作于2023年2月39

薄板样条函数及其变种适用于平滑和连续的面。样条法也适用于气候数据的插值。图13.10,13.11分别显示用规则样条函数和张力样条函数法建立的年均降水量面。两幅地图中的等雨量线都很平滑,比图13.9的等雨量线(用反距离平方插值法建立的)更为平滑。在数据贫乏地区用样条法插值的结果可能会比实际情况偏大,如图13.10的北爱达荷45in等雨量线所例证的。第39页,课件共86页,创作于2023年2月40第40页,课件共86页,创作于2023年2月41(5)克里金法克里金法(Kriging)是由南非采矿工程师D.G.Krigee创立的一种用于空间插值的地理统计方法。克里金法的原理是假设某种属性的空间变化既不是完全随机也不是完全确定。空间变化可能包括三种影响因素:空间相关因素,代表区域变量的变化;偏移或结构,代表趋势;还有随机误差。偏移出现与否和对区域变量的解释导致了不同克里金法的出现。第41页,课件共86页,创作于2023年2月421.普通克里金法假设不存在偏移,普通克里金法关注于空间相关因素。衡量所选已知点之间空间相关程度的测度是半方差(semivariance),由下式计算:h是已知点之间的距离,n样本点的数量,z是属性值。第42页,课件共86页,创作于2023年2月43在不同距离的半方差值算出后,绘成半方差图,y轴代表偏差,x轴代表已知点之间的距离。半方差可分成三部分:熔核(nugget)、值域(range)和基台(sill)。熔核是在距离为0处的半方差,代表无关的空间噪音。值域是半方差的空间相关部分,它显示半方差随着距离递增。超过值域范围,半方差趋平于相对恒定值。达到恒定的半方差称为基台(sill)。第43页,课件共86页,创作于2023年2月44第44页,课件共86页,创作于2023年2月45半方差图(semivariogram)将半方差与距离关联起来。它可单独用作空间相关的测度。但在克里金法中用作插值器(interpolator),半方差图必须与数学函数或模型拟合。例如,ARC/INFO提供了五种模型:高斯、线性、球面、圆形和指数模型。拟合的半方差图便可用于估算任何给定距离的半方差。第45页,课件共86页,创作于2023年2月46普通克里金法在空间插值中直接使用拟合半方差图。估算某点的z值的通用方程是:式中:z0是估计值,zx是已知点的值;Wx是与每个已知点关联的权重;s是用于估算的已知点的数目。权重可由对一组联立方程的求解得到,例如,下列联立方程是由三个已知点估算一个未知点的值所必须的:第46页,课件共86页,创作于2023年2月47

式中:γ(hij)是已知点i和j间的半方差,γ(hi0)是已知点和未知点之间的半方差,λ是拉格朗日系数,它的加入是为了确保把估算误差降到最小。上面的方程可改写成矩阵形式:第47页,课件共86页,创作于2023年2月48将左边的逆矩阵乘以右边的矩阵,可解得权重向量。一旦知道了权重,方程(13.17)便可用估算z0:

z0=z1W1+z2W2+z3W3第48页,课件共86页,创作于2023年2月49上例表明在克里金法中用的权重不仅包括估算点和已知点之间的半方差,而且包括已知点之间的半方差。这与反距离权重插值法不同,后者只用适用于已知点和估算点的权重。克里金法和其他局部方法之间的另一个重要区别是:克里金法对每个估算点产生一个方差测度来衡量估算值的可靠性。上例中,方差可由下式计算:

第49页,课件共86页,创作于2023年2月50图13.14显示由线性模型普通克里金法生成的年平均降水量曲面。图13.15显示克里金曲面的标准差分布。数据贫乏地区的标准差最高,例如,爱达荷州的西南角。第50页,课件共86页,创作于2023年2月512.通用克里金法通用克里金法(UniversalKriging)假设除了已知点之间的空间关系外,空间变量在z值上还有偏移或有结构因素。一般地说,通用克里金法具体表现为一个趋势,例如,在克里金过程中的一个趋势面方程。ARC/INFO提供两种通用克里金法。Universal1使用一个平面,定义为如下一阶多项式:第51页,课件共86页,创作于2023年2月52M=b1xi+b2yi式中:M是偏移;xi和yi是已知点i的x和y坐标;b1和b2是要估计的偏移系数。Universal2用二阶曲面,它被定义为一个二阶多项式:M=b1xi+b2yi+b3x2+b4xiyi+b5y2系数bi必须按权重估算,这意味着通用克里金法比普通克里金法要求更多的联立方程用于估算未知值。第52页,课件共86页,创作于2023年2月53

图13.17显示用通用克里金法与线性偏移建立的年均降水量曲面,图13.18显示在克里金曲面上标准差的分布。两幅地图与基于线性模型克里金法建立的地图相似。主要的不同是在爱达荷州西南角出现了负值,这是因为通用克里金模型中线性偏移而导致插值不准的结果。第53页,课件共86页,创作于2023年2月543.其他克里金法除了普通克里金法和通用克里金法,还有其他的克里金法,例如:克里金块内插法(blockkriging)和联合克里金法(co-kriging)。克里金块内插法估算某个小范围内或块内的一个变量的平均值,联合克里金法在插值时增加次要变量,这些次要变量与主要变量有相关关系。这种方法的原理是:变量之间的相关关系能用于提高主要变量的预测值精度。例如,用联合克里金法,在降水量插值中,将高程作为一个附加变量会获得更好结果。第54页,课件共86页,创作于2023年2月55(6)各种局部方法的比较用相同数据集,不同的局部方法会产生不同的结果。图13.19显示规则样条函数和距离倒转平方法两种方法得出不同的年平均降水量估算结果。图13.20显示用线性模型普通克里金法和规则样条函数得出的不同结果。虽然普通克里金法与规则样条函数两种方法间的差异比规则样条函数与倒转距离平方法间的差异更小,但这两幅地图有相似的总体模式。另外,正负误差多于3in的,都位于数据贫乏地区。这说明不管用哪种方法插值,都不能代替观测数据。第55页,课件共86页,创作于2023年2月56第56页,课件共86页,创作于2023年2月57

将估算值的差别绘成地图并不能确定哪种插值方法更精确。交叉验证(cross-validation)分析通常用于确定不同插值方法的精度。对每一种插值方法,交叉验证分析重复从已知数值集中删除一个已知点的过程,用剩下的已知点估算被删除点的数值,并计算估算值与已知值的误差。然后计算出误差统计值用于评价插值方法的精度。例如,交叉验证分析表明,在消除高程倾向克里金法(elevation-detrendedkriging)或联合克里金法(co-kriging)中用高程作为x、y位置的附加变量,产生了比克里金法好的结果。第57页,课件共86页,创作于2023年2月58

评定不同插值法精度的另一种方法是将已知点分成两部分样本:一部分样本用于给每种插值方法建模,另一部分样本用于检测各种方法的精度。如果已知点的数目太少,则这种样本分离的方法不适用。

第58页,课件共86页,创作于2023年2月59二、区域插值适用于离散空间数据。区域插值是从一种已知的分区数据中推断出同一地区的另一种分区数值的插值方法。第59页,课件共86页,创作于2023年2月60

第60页,课件共86页,创作于2023年2月61(1)叠置法认为源区和目标区内数据均匀分布。求解时,将目标区叠置到源区上,求出源区和目标区之间的交集。目标区计算公式:

nUDi=USj

Dj

j=1其中:UDi为目标区第i分区的值,i=1,2......m;USj为源区第j个分区的值,j=1,2,.....n;Dj

为第i个目标分区同有第j个源区的面积比。第61页,课件共86页,创作于2023年2月62

UD1=35x(3/7)+30x(2/6)=25UD2=35x(4/7)+10x(1/3)=23.3UD3=30x(4/6)+10x(2/3)=26.6返回第62页,课件共86页,创作于2023年2月63

(2)比重法将源区的统计数据从同质性变成非同质性,再进行区域插值。[1]叠置格网,确定精度。[2]将源区各分区的平均数赋予各格网点(图a)。第63页,课件共86页,创作于2023年2月64[3]计算相邻的四(八)个格网点的平均值(图b)。第64页,课件共86页,创作于2023年2月65[4]以分区为单位将[3]的平均值相加,得值为Us`,计算各分区系数pi=Us/Us`,Usi为源区i分区的人口数。并将各个格网点值乘以pi,得调整后的格网值(图c)。第65页,课件共86页,创作于2023年2月66[5]不断循环2,3,4步,直到pi接近1(>0.99)为止,便可计算目标区的内插值(图d)。例如,Ud1区的内插值=5.5+5.3+5.5+5.2+4.5=26返回第66页,课件共86页,创作于2023年2月67第五节矢量数据向栅格数据的转换先要确定分辨率。矢量数据是直角坐标,原点在左下方;栅格数据是行列坐标,原点在左上方。第67页,课件共86页,创作于2023年2月68

其转换公式为:⊿X=(Xmax-Xmin)/J⊿Y=(Ymax-Ymin)/I⊿X,⊿Y表示栅格边长。I、J为行、列数。第68页,课件共86页,创作于2023年2月69例如:已知某一地区x方向为15km,y方向为30km,现要把该地区的地块图转换成栅格数据。要求栅格的分辨率为30mx30m,则:行数I=30km/30m=1000列数J=15km/30m=500第69页,课件共86页,创作于2023年2月70一、边界代数法转换的关键是对矢量表示的多边形边界内的所有栅格赋予多边形编码,形成栅格数据阵列。面的填充是根据边界的拓扑信息,通过加减运算将边界位置信息动态地赋予各栅格。实现的前提是知道拓扑关系。第70页,课件共86页,创作于2023年2月71

填充过程:沿边界前进方向y值上升时为上行,y值下降时为下行。上行时填充值为左多边形号减右多边形号,下行时填充值为右多边形减左多边形号,将每次填充值同该处的原始值作代数运算得到最终填充属性值。第71页,课件共86页,创作于2023年2月72N1N2弧上行,左-右为0-1=-1。弧左边栅格值为-1第72页,课件共86页,创作于2023年2月73N2N3弧下行,右-左为2-0=2,弧左边栅格值加2第73页,课件共86页,创作于2023年2月74N3N1弧下行,右-左=3-0=3。弧左边栅格加3第74页,课件共86页,创作于2023年2月75N1N4弧上行,左-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论