3地理信息系统的空间数据结构_第1页
3地理信息系统的空间数据结构_第2页
3地理信息系统的空间数据结构_第3页
3地理信息系统的空间数据结构_第4页
3地理信息系统的空间数据结构_第5页
已阅读5页,还剩126页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章地理信息系统的空间数据结构1空间对象实体类型2地理空间数据类型3地理信息的空间关系4地理信息空间数据结构5空间数据组织6空间元数据(metadata)1第1节

空间对象实体类型空间对象一般按地形维数进行归类划分点:零维线:一维面:二维体:三维时间:通常以第四维表达,但目前GIS还很难处理时间属性。空间对象的维数与比例尺是相关的!2地理空间实体的表达地理空间实体包括点(point)、线(line)、面(polygon)、曲面(surface)和体(volume)等多种数据类型。这些数据类型的表达关系到计算机识别、存储、处理的可能性和有效性。31点实体有位置,无方向、宽度和长度;抽象的点美国佛罗里达洲地震监测站2002年9月该洲可能的500个地震位置42线实体有长度,但无宽度和高度用来描述线状实体,通常在网络分析中使用较多度量实体距离香港城市道路网分布53面实体具有长和宽的目标通常用来表示自然或人工的封闭多边形一般分为连续面和不连续面中国土地利用分布图(不连续面)6空间对象:面(续)连续变化曲面:如地形起伏,整个曲面在空间上曲率变化连续。不连续变化曲面:如土壤、森林、草原、土地利用等,属性变化发生在边界上,面的内部是同质的。74空间对象:体有长、宽、高的目标通常用来表示人工或自然的三维目标,如建筑、矿体等三维目标香港理工大学校园建筑8第2节地理空间数据类型地理数据的基本特征地理数据的来源地理空间数据类型空间数据的组织91地理数据的基本特征空间特征表示实体的空间位置或现在所处的地理位置。空间特征又称定位特征或几何特征,一般用坐标数据表示。属性特征表示实体的特征。如名称、分类、质量特征和数量特征等。时间特征

描述实体随时间的变化,其变化的周期有超短周期的、短期的、中期的、长期的和超长期的。102地理数据的来源地图数据

地图是地理信息的主要载体,同时也是地理信息系统最重要得信息源遥感数据各种遥感数据及其制成的图像资料(航片、卫片)包含着及其丰富的地理内容,尤其是先进的卫星遥感技术的广泛应用,能为地理信息系统提供源源不断的、现势性很强的数据统计数据、实测数据及各种文字报告各种地理要素的统计数据、实验和各种观测数据、研究报告等11地形数据来源于地形等高线图的数字化,已建立的数字高程模型(DEM)和其他实测的地形数据等。元数据来源于由各类纯数据通过调查、推理、分析和总结得到的有关数据的数据,例如数据来源、数据权属、数据产生的时间、数据精度、数据分辨率、源数据比例尺、数据转换方法等。123地理空间数据的类型类型数据:居民点、交通线、土地类型分布等面域数据:多边形中心点、行政区域界限和行政单元网络数据:道路交叉点、街道和街区等样本数据:气象站、航线和野外样方的分布区等曲面数据:高程点、等高线和等值区域文本数据:如地名、河流名和区域名称符号数据:点状符号、线状符号和面状符号等图象数据:航空、航天图象,野外摄影照片等多媒体数据:音频数据、视频数据13空间数据的计算机表示:(1)将地理要素或实体抽象为点、线、面类型(2)逻辑上抽象为不同的专题或图层;(3)相同区域的若干个图层构成图幅,若干个图幅构成完整的数据库。4地理空间数据的组织14第3节地理信息的空间关系拓扑关系(TopologicalSpatialRelationship)方向关系(OrderSpatialrelationship)顺序度量关系(MetricSpatialRelationship)距离151地理空间数据的拓扑关系关于空间数据的拓扑关系

拓扑结构是明确定义空间数据结构关系的一种数学方法,在地理信息系统中不但用于空间数据的编辑和组织,在空间数据的分析与应用中都具有重要意义。拓扑变量与不变量

拓扑(Topology)一词来自于希腊文,意为“形状的研究”。研究在拓扑变换下能够保持不变的几何属性—拓扑属性。16拓扑邻接:元素之间的拓扑关系。拓扑关联:元素之间的拓扑关系。拓扑包含:元素之间的拓扑关系。1)地理空间数据的拓扑关系不同类同类同类不同级17N1е1е2е5е6е4е7е3P1P3P2P4N4N3N5N2拓扑邻接:N1/N2,N1/N3,N1/N4;P1/P3;P2/P3拓扑关联:N1/е1、е3、е6;P1/е1、е5、е6拓扑包含:P3与P418相邻相交重合相离包含点—点点—线点—面线—面面—面线—线192)地理空间数据拓扑关系应用价值(1)确定地理实体间的相对空间位置,无需坐标和距离(2)利于空间要素查询(3)重建地理实体20面域与弧段的拓扑关系面域 弧段 P1 a,b,c,-gP2 b,d,f P3 c,f,e P4 g

结点与弧段的拓扑关系结点 弧段 A a,c,e B a,d,b C d,e,f D b,f,c E g

弧段与结点的拓扑关系弧段 结点 a A,B b B,D c D,A d B,C e C,A f C,D g E,E 弧段与面域的拓扑关系弧段左邻面右邻面b P2 P1c P3 P1d P0 P2e P0 P3f P3 P2g P1 abcdefgACBDEP4P1P2P33)地理空间数据拓扑关系的表示21-disjoint-inside-touch-equals-covers-overlapRelations(area/area)Setrepresentation:S1:dC

∩dUS2:dC

U°S3:C°∩

dUS4:C°∩

U°S1-S4empty/notemptyIntheory16options,of

which6arereallydifferent拓扑关系描述——4I模型(Egenhofer,1991)22拓扑关系描述——9I模型(Egenhofer,1991)23拓扑关系描述——九交模型(Egenhofer,1991)□

A的内部和B的内部的交,记作□

A的内部和B的边界的交,记作□

A的内部和B的外部的交,记作□

A的边界和B的内部的交,记作□

A的边界和B的边界的交,记作□

A的边界和B的外部的交,记作□

A的外部和B的内部的交,记作□

A的外部和B的边界的交,记作□

A的外部和B的外部的交,记作24DisjointMeetOverlapContainEqualCoveredByInsideCover面与面间有效的拓扑关系共有8个拓扑关系描述——面/面拓扑关系(Egenhofer,1991)25拓扑关系描述——线/面拓扑关系(Egenhofer,1991)LR11LR12LR13LR22LR31LR32LR33LR42LR44LR46LR62LR64LR66LR71LR72LR73LR74LR75LR76线与面间有效的拓扑关系共有19个26拓扑关系描述——线/线拓扑关系(Egenhofer,1991)LL1LL2LL3LL4LL5LL6LL7LL8LL9LL10LL11LL12LL13LL14LL15LL16LL17LL18LL19LL20LL21线与线间有效的拓扑关系共有33个,这里只给出了21个27拓扑关系描述——Voronoi图模型(陈军等,2001)□九交模型的缺点:

九交模型中的外部太大。对于一个面积有限的空间目标而言,它的外部是无限的。这导致任意两个目标的外部的交总是非空。ABABBAC28

外部的无限性,导致目标的外部与边界和内部是线性相关的,使得外部在九交模型中的作用不是很明显。

只能描述简单目标(不带洞而单一的实体)间的拓扑关系,而不能描述复杂目标(带洞或由几个分离目标组成的目标)间的拓扑关系。294)拓扑关系的存储空间数据的拓扑关系比较复杂,通过分析知道,在这些拓扑关系中有些关系要存储,有些关系不必要存储,而是在应用时,通过实时操作运算求解出来。但通过操作运算求解拓扑关系所要计算工作量较大。

30二、地理空间信息的方向关系方向关系:地理事物在空间中的相互方位和排列顺序。描述空间实体的方向关系,对于点状空间实体只要计算两点之间的连线与某一基准方向的夹角即可,该夹角称为连线的方位角。基准方向通常有真子午线方向、磁子午线方向和坐标纵线方向三种。同样计算点状和线状空间实体、点状和面状空间实体时,只需将线状和面状空间实体视为由它们的中心所形成的点状实体,然后按点状实体来求解方向关系即可。31三、地理空间信息的度量关系度量空间关系主要是指空间对象之间的距离关系。这种距离关系可以定量地描述为特定空间中的某种距离,如A实体距离B实体100m。也可以应用与距离概念相关的术语,如远近等进行定性的描述。

欧几里德距离

曼哈顿距离

时间距离32在相对较小的地理空间中,采用笛卡儿坐标系,定义地理空间中所有点的集合,组成笛卡儿平面,记为R2。在R2中,任意两点(χi,уi)和(χj,уj)间的欧几里德距离d(i,j)如下:

地理空间中所有点间的欧几里德距离函数组成度量空间s。度量空间具有如下特点:(1)如i和j代表不同的点,则,d(i,j)≥0的条件在欧几里德空间中总得到满足。

(2)对称性,即,d(i,j)=d(j,i)。

(3)三角不等性,即,给定s中的任意3个距离m,n,l,则存在如下关系式:

m+n≥l33

曼哈顿距离是指两点在南北方向上的距离加上在东西方向上的距离,即:曼哈顿距离又称为出租车距离。曼哈顿距离的度量性质与欧氏距离的性质相同,保持对称性和三角不等式成立。曼哈顿距离只适用于讨论具有规则布局的城市街道的相关问题。34

时间距离(旅行时间距离)是根据从空间中一点到达另一点所需时间进行度量的。时间距离不具有前述欧几里德距离和曼哈顿距离的度量空间性质,即其对称性,三角形不等式不一定成立。35第4节地理信息空间数据结构空间数据结构矢量数据结构栅格数据结构栅格结构与矢量结构的比较36是什么样的数据结构,关键看空间点的表达,因为点是构成地理空间特征实体的基本要素。如果采用一个没有大小的点(坐标)来表达基本点要素,称为矢量表示方法。如果采用一个有固定大小的点(面元)来表达基本点要素,称为栅格表示法。它们分别对应着矢量数据模型和栅格数据模型。第4节地理信息空间数据结构37矢量和栅格结构是计算机描述空间实体的两种最基本的方式。Yijx1y1x2y2xiyixn

yn第4节地理信息空间数据结构38矢量数据RepresentgeographicphenomenawithPointsLinesPolygonsObjectsrepresentedas

nodes(X,Ypoints)and

connectinglines,attributes

ofobjectsattached

asdatabasetables.usefulforrepresentingandstoringdiscretefeaturessuchasbuildings,pipes,orparcelboundaries.39Spatiallocationsareexplicit.Relationshipsbetweenentities/objectsareimplicit.Vectorscanstoreinformationabouttopology.MuchdatacomesinthisformDigitizedmappingTracinganddigitizingGPS,Etc.BestforfeatureswithdiscreteboundariesPropertylinesPoliticalboundariesTransportation矢量数据的特点—定位明显,属性隐含40点(Point):又称为元素(Element),是一个数据点,具有一对(x、y)坐标和至少一个属性。线(Line):是具有相同属性的点的轨迹,由一个坐标对序列表示,坐标对顺序与线的开头有关,线上每个点有不多于二个邻点。面(Area):是具有相同属性的点的轨迹,以(x、y)坐标对的集合表示,起点坐标与终点坐标相同,面内点具有至少一个相同属性。区域(Region):空间上相邻或重叠的点、线、面要素可以按一定的地理意义组成区域。矢量数据基本类型(X,Y)(X2,Y2)(X3,Y3)(X4,Y4)(X5,Y5)LinePoint(X5,Y5)(X,Y)(X2,Y2)(X4,Y4)(X3,Y3)Polygon(X,Y)411、简单矢量数据结构在简单数据结构中,空间数据按照以基本的空间对象(点、线或多边形)为单元进行单独组织,不含有拓扑关系数据,最典型的是面条(Spaghetti)结构。点目标(x,y)

线目标(x1y1,x2y2,…….xnyn)

面目标(x1y1,x2y2,…….xnyn,x1y1)42优点:(1)数据结构简单,直观,便于用户接受;(2)便于系统的维护和更新。缺点:(1)数据冗余度大,如多边形公共边重复存储,但没有存储多边形之间的关系。相邻多边形易产生伪多边形。解决的办法是建立多边形边界表;(2)缺乏拓扑信息,如邻域信息等,不便于拓扑分析(临时建立拓扑关系);(3)对岛处理能力差,无法建立外多边形的关系。43目前的GIS领域中,拓扑结构是得到最广泛应用的空间数据结构。这种数据结构借助了数学中拓扑学的原理来描述空间事物。包括双重独立地图编码法、多边形转换器以及地理编码和参照系统的拓扑集成等;其共同特点是:点是相互独立的,点连成线,线构成面。2、拓扑型的数据结构44起点终点中间点弧段1弧段3弧段2弧段4点:面:弧:45双重独立地图编码,简称DIME结构(DualIndependentMapEncoding)。它是由美国人口调查局建立起来的为人口调查目的而设计的一种拓扑编码方法,是一种把几何量度信息(直角坐标)与拓扑逻辑信息结合起来的系统。也可用于土地利用等多种信息系统的编辑和分析,是GIS发展早期使用的一种拓扑编码方式。

DIME文件的基本元素是连接两个端点(结点)的一条线段(街段)、线段始结点和终结点标识符、这两个结点的坐标及线段两侧的区域代码(左区号和右区号)。在这种结构中,线段通常被认为是直线型的,复杂的曲线由一系列逼近曲线的直线段来表示。结点与结点或者面域与面域之间为邻接关系,而结点与线段或面域与线段之间为关联关系,利用这种拓扑关系来组织数据,可以有效地进行数据存储正确性检查,同时便于对数据进行更新和检索。4647优点:1)描述点、线、面的空间关系不完全依赖于具体坐标位置;2)所表达的空间关系信息丰富、简洁;3)便于做多边形和多边形的叠合;4)便于检查数据输入过程中的错误;缺点:1)拓扑关系的建立复杂;2)数据结构本身比较复杂。

2、拓扑型的数据结构48在权衡是否采用拓扑结构时,主要看将来所需要的空间查询和分析是否复杂,当面和边界线之间的相互关系查询,面和面的相邻查询,面和面、线和面的叠合分析对用户比较重要时,应采用拓扑结构,反之可采用非拓扑的简单结构。从目前的趋势看,以分析功能为主的矢量型地理信息系统软件产品,越来越多地采用拓扑型结构。2、拓扑型的数据结构49曲面是指连续分布现象的覆盖表面,具有这种覆盖表面的要素有地形、降水量、温度、磁场等。表示和存储这些要素的基本要求是必须便于连续现象在任一点的内插计算,因此常采用不规则三角网来拟合连续分布现象的覆盖表面,称为TIN(TriangulatedIrregularNetwork)数据结构。这种基于TIN的曲面数据结构,通常用于数字地形的表示,或者按照曲面要素的实测点分布,将它们连成三角网,三角网中的每个三角形要求尽量接近等边形状,并保证由最临近的点构成的三角形,即三角形的边长之和最小。在所有可能的三角网中,狄洛尼(Delaunay)三角网在地形拟合方面表现最为出色,因此常用于TIN的生成。3、曲面数据结构50泰森多边形(Thiessenpolygon)泰森多边形是荷兰气候学家A.H.Thiessen提出的一种计算区域降雨量的方法。在某个区域内雨量观测站总是以孤立点散布的,在地图上作所有相邻观测点连线的垂直平分线,由这些平分线构成的包围每个观测点的多边形就是所谓的泰森多边形。在泰森多边形的边界上任取一点,到相邻两个观测点的距离是相同的,而多边形内的任意点到该多边形内的观测点距离最近。虚线构成的多边形就是泰森多边形。泰森多边形每个顶点是每个三角形的外接圆圆心。泰森多边形也称为Voronoi图,或dirichlet图51阜阳春运:车站吸引区划分52拓扑关系描述——Voronoi图模型(陈军等,2001)□基于Voronoi图的九交模型■每一个空间对象的Voronoi图都可以被分成三部分,即Voronoi区域,空间对象的边界,空间对象的内部。

V9I模型用对象的Voronoi区域代替九交模型中的外部,而对象的边界和内部与九交模型保持一致。V9I定义:■若两个空间对象相邻时,非空;若被其它目标隔开,则为空,因而空V9I模型用可以区分相邻和相离两种拓扑关系,而9交模型把二者均描述为相离。53栅格数据Representtheworldsurfaceintoaregulargridofcells.Rasterdataincludes:imagesusefulforstoringandanalyzingdatathatiscontinuousacrossanarea.Grids54栅格数据的表达RealworldGridPointLineAreaValue=0=1=2=3RowColumnTrianglesHexagonsRASTER55固定大小的正方形,空间事物就按其在网格中什么行、什么列、取什么值来表示。在靠近事物边界的位置,按四舍五入原则决定单元取值。网格基本单元的大小,对地图的分辨率和计算精度起关键作用。数据量的增加和分辨率的提高成平方关系。因此计算机的储存量和空间信息的分辨率之间就有很大矛盾。栅格数据的表达56栅格数据结构:坐标系与描述参数Y:列X:行西南角格网坐标(XWS,YWS)格网分辨率57点线面58SPOTXS20m*20m

牡丹水庫bandG,R,IR栅格数据结构59A.OBC中心点法重要性法长度占优法面积占优法栅格结构数据中混合像元的处理方案二:方案一:缩小栅格单元的面积60栅格结构的扫描顺序行序列列序列行主序列

Morton序列

Hilbert序列61SpaceFillingCurves0123colrow32100150123colrow32100150123colrow32100150150123colrow32100150123colrow32100150123col015row32100123col015row3210RowRowprimeSpiralPeanoGrayHilbertCantor/DiagonalSierpinski/Triangle62

Morton序列000044402228888222288882422888824428888244048880440448804004444063Z-orderinghaslongdiagonaljumpsinspaceHilbertcurvespreservedistancesbetterHilbertcurves64栅格结构编码方法直接栅格编码链码(chainEncoding)游程长编码(Run_lengthEncoding)四叉树编码(quad_treeEncoding)651、直接栅格编码直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码,可以每行从左到右逐像元记录,也可奇数行从左到右而偶数行由右向左记录,为了特定的目的还可采用其他特殊的顺序。

02255555222225550000033322223355002333550033335300033333000033330,2,2,5,5,5,5,5;2,2,2,2,2,5,5,5;2,2,2,2,3,3,5,5;0,0,2,3,3,3,5,5;0,0,3,3,3,3,5,3;0,0,0,3,3,3,3,3;0,0,0,0,3,3,3,3;0,0,0,0,0,3,3,3。66由起点位置和一系列在基本方向的单位矢量给出每个后续点相对其前继点的可能的8个基本方向之一表示。8个基本方向自0°开始按逆时针方向代码分别为0,1,2,3,4,5,6,7。单位矢量的长度默认为一个栅格单元。2、链码1234507600107670110067链码编码:

2,2

,6,7,6,0,6,5123450760500000000500000000000000500000000550000000500000050000000000000链码编码示例683、游程长度编码(1)只在各行(或列)数据的属性发生变化时依次记录该属性以及相同属性重复的个数(游程编码);0225555522222555000003332222335500233355003333530003333300003333沿行方向进行编码:(0,1),(2,2),(5,5);(2,5),(5,3);(2,4),(3,2),(5,2);(0,2),(2,1),(3,3),(5,2);(0,2),(3,4),(5,1),(3,1);(0,3),(3,5);(0,4),(3,4);(0,5),(3,3)。69(2)逐个记录各行(或列)属性发生变化的位置和相应属性。0225555522222555000003332222335500233355003333530003333300003333沿列方向进行编码:(1,0),(2,2),(4,0);(1,2),(4,0);(1,2),(5,3),(6,0);(1,5),(2,2),(4,3),(7,0);(1,5),(2,2),(3,3),(8,0);(1,5),(3,3);(1,5),(6,3);(1,5),(5,3)。70

4、块码采用方形区域作为记录单元,数据编码由初始位置行列号加上半径,再加上记录单元的属性组成。0225555522222555000003332222335500233355003333530003333300003333(1,1,1,0),(1,2,2,2),(1,4,1,5),(1,5,1,5),(1,6,2,5),(1,8,1,5);(2,1,1,2),(2,4,1,2),(2,5,1,2),(2,8,1,5);(3,3,1,2),(3,4,1,2),(3,5,2,3),(3,7,2,5);(4,1,2,0),(4,3,1,2),(4,4,1,3);(5,3,1,3),(5,4,2,3),(5,6,1,3),(5,7,1,5),(5,8,1,3);(6,1,3,0),(6,6,3,3);(7,4,1,0),(7,5,1,3);(8,4,1,0),(8,5,1,0)。715、四叉树编码

是根据栅格数据二维空间分布的特点,将空间区域按照4个象限进行递归分割(2n×2n,且n>1),直到子象限的数值单调为止,最后得到一棵四分叉的倒向树。四叉树分解,各子象限大小不完全一样,但都是同属性栅格单元组成的子块,其中最上面的一个结点叫做根结点,它对应于整个图形。不能再分的结点称为叶子结点,可能落在不同的层上,该结点代表子象限单一的代码,所有叶子结点所代表的方形区域覆盖了整个图形。从上到下,从左到右为叶子结点编号,最下面的一排数字表示各子区的代码。为了保证四叉树分解能不断的进行下去,要求图形必须为2n×2n的栅格阵列。n为极限分割次数,n+1是四叉树最大层数或最大高度。72四分树结构示意图四叉树编码具有可变的分辨率,并且有区域性质,压缩数据灵活,许多运算可以在编码数据上直接实现,大大地提高了运算效率,是优秀的栅格压缩编码之一。73一幅2nx2n栅格阵列的图用四叉树分割时,具有的最大深度为n,即可分为0,1,2,3…n层每一层的栅格宽度,即每层边上包含的最大栅格数,反映了所在叶结点表示的正方形集合的大小,其值为:2(最大深度-当前层次)四叉树的特点例:一幅23×23

的栅格阵列,它具有的最大深度为3,可能层次分别为0,1,2,3。其中:第0层边长上的最大栅格数为2(3-0)=8

第1层边长上的最大栅格数为2(3-1)=4

第2层边长上的最大栅格数为2(3-2)=2

第3层边长上的最大栅格数为2(3-3)=174111100001111000011100000111000003344400033444000334400003344000011011010344004034000层1层2层3层(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)(15)(16)(17)(18)(19)75从上到下递归分割

常规四叉树除了记录叶结点之外,还要记录中间结点。结点之间借助指针联系,每个结点需要用六个量表达,即四个叶结点指针、一个父结点指针和一个结点的属性或灰度值。这些指针不仅增加了数据储存量,而且增加了操作的复杂性。在GIS和图象处理中不用常规四叉树,而用线性四叉树。(1)常规四叉树的特点760225555522222555000003332222335500233355003333530003333300003333①②③④⑤⑥⑦⑧⑨⑩11121314151617181920212223242526272829303132333637383934354000003

33033333530022232222022225255533355西南东南西北东北常规四叉树77线性四叉树同常规四叉树不同线性四叉树同常规四叉树不同在于存储方式不同。在线性四叉树中只记录叶结点信息,如叶结点的位置、大小、格网值,不存储中间结点。线性四叉树中仅对叶结点信息进行编码,这种编码号称地址码(位置码),以表示它所处的位置。地址码隐含了叶结点的位置和深度信息。(2)线性四叉树78几种线性四叉树的编码a.基于四进制的线性四叉树编码0层1层2层3层(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)(15)(16)(17)(18)(19)79你能找出何种规律?JJIxbIIIybMQ码行号列号012345671111101011001110100000010100111000010111011100200301201310211103112113020021030031120210121130131022023032033122311123032133200201210211300410030131031120220321221330251013033123132202212302313206110321330331222223232233322711132333233380先将栅格的行列号转换为二进制,得二进制行号Iyb,列号Ixb,则M=2×Iyb+Ixb

如结点7:

M=2*011+011=033行列号—>四进制81若该位的编码值为0,1,则行号Iyb值为0;若该位的编码值为2,3,则行号Iyb值为1;若该位的编码值为0,2,则列号Ixb值为0;若该位的编码值为1,3,则列号Ixb值为1;

如:M码为:103

二进制行值Iyb为:001

二进制列值Ixb为:101四进制—>行列号82b.基于十进制的线性四叉树编码morton码的求解方法设十进制表示的行、列号在计算机内部的二进制数分别为则十进制的morton码实际上是II、JJ的二进制交叉结合的结果,即将得到的二进制数M转换为十进制数就可以得到相应的morton码了。83

I=5=0101J=7=0111

Morton=00110111=(55)10MD码的计算实例例如,某栅格单元的行号

I=5,列号J=7,Morton码的计算如下图所示:

84(2)四叉树的十进制编码属性值004 08 112 013 014 115 116 032 136 140 044 048 149 050 051 052 056 060 0位置码85(3)四叉树编码的优缺点优点:

从两维对数据进行了压缩,以表示面状地物的数量特征;阵列各部分的分辨率是可变的,边界复杂部分四叉树分级较多,分辨率高,运算效率也高;便于在多边形中嵌套异类小多边形的表示。缺点:要求图象格网必须是2n*2n目前四叉树主要用在数据索引、图幅索引等,它是一种有前途的栅格编码866、八叉树编码八叉树结构就是将空间区域不断地分解为八个同样大小的子区域(即将一个六面的立方体再分解为八个相同大小的小立方体),同—区域的属性相同。八叉树主要用来解决地理信息系统中的三维问题。87直接栅格编码:简单直观,是压缩编码方法的逻辑原型(栅格文件);链码:压缩效率较高,以接近矢量结构,对边界的运算比较方便,但不具有区域性质,区域运算较难;游程长度编码:在很大程度上压缩数据,又最大限度的保留了原始栅格结构,编码解码十分容易,十分适合于微机地理信息系统采用;块码和四叉树编码:具有区域性质,又具有可变的分辨率,有较高的压缩效率,四叉树编码可以直接进行大量图形图象运算,效率较高,是很有前途的编码方法。88栅格数据结构的特点用单元填满空间数据结构简单,存储方便有限的多重属性(栅格取值应整数)分辨率的提高和数据量之间呈平方指数关系为了减少数据量,产生了多种压缩存储量的数据结构金字塔索引,加快显示89矢量模型栅格模型优点优点1.数据存储量小2.空间位置精度高3.空间关系描述全面,对线状、网络状事物的分析方便4.空间和属性数据综合查询与更新方便5.普通地图可直接手工数字化1.数据结构简单2.多种地图叠合分析方便3.容易描述边界复杂、模糊的事物,便于处理三维连续表面4.能直接处理数字图象信息5.能直接用栅格状设备输出图形三、矢量、栅格数据的优缺点比较矢量结构:位置明显,属性隐含栅格结构:属性明显,位置隐含90缺点缺点1.数据储存量大2.空间位置精度低3.难以表达线状、网络状的事物4.输出地图不美观5.普通地图须按矢量方式数字化1.数据结构复杂2.多种地图叠合分析较困难3.边界复杂模糊的事物难以描述4.不能直接处理数字图象信息三、矢量、栅格数据的优缺点比较91矢量栅格一体化数据结构对用矢量方法表示的线状实体,是不是也可以采用格网空间填充法来表示,即在数字化一个线状实体时,除记录原始取样点外,还记录所通过的栅格??同样,每个面状地物除记录它的多边形边界外,还记录中间包含的栅格??92有多种形式,最简单也最实用的是不对矢量结构数据和栅格结构数据做任何特殊处理,直接将他们分别存储在同一个GIS的空间数据库系统中,并通过共同的ID号将各空间对象的矢量数据,栅格数据及属性数据关联在一起。1.矢栅混合模式93实体ID矢量数据栅格数据属性数据缺点:矢量和栅格两套数据均要无遗漏的在系统中存储,会给系统的存储空间带来压力941.3.11.用遥感影像更新地图数据952.矢栅一体化模式为了解决失栅混合增加存储空间这一问题,并更加有效的将矢量、栅格数据结构结合起来,龚健雅提出了矢栅一体化模式,其理论基础是多级格网方法,三个基本约定和线形四叉树编码。96多级格网:

包括粗格网,基本格网和细分格网三个层次粗格网建立空间索引。基本格网的大小与常规栅格划分要求一致;细分格网是在点、线经过的基本栅格上再进一步划分为16*16或256*256的小格网,以增加栅格的空间分辨率,从而提高点线表达精度。9725625698粗格网、基本格网和细分格网均采用线性四叉树编码,并采用三个Morton码(M0,M1,M2)表示。其中:M0表示点所在或线所通过的粗格网的Morton码,是研究区的整体编码。M1表示点所在或线通过的基本栅格的morton码,也是研究区内的整体编码。M2表示点所在或线所通过的细分栅格的morton码,是基本栅格内的局部编码99矢栅数据一体化结构的实质是将矢量方法表示的线性实体,除记录原始取样点之外,还记录中间包含的栅格,使其既保存矢量特性,又具有栅格性质。由于栅格数据结构的精度低,通常用细分格网的方法,来提高点、线、面状目标边界线数据的表达精度。

为了建立矢量与栅格一体化数据结构,要对点、线、面目标数据结构的存储要求作如下的统一约定:矢量栅格一体化数据结构100(1)对点状目标,因为没有形状和面积,在计算机内部只需要表示该点的一个位置数据及与结点关联的弧段信息。(2)对线状目标,它有形状,但没有面积,在计算机内部需用一组格网来填满整个路径,并表示该弧段相关的拓扑信息。(3)对面状目标,它既有形状,又有面积,在计算机内部需表示由格网填满路径的一组边界和由边界组成的紧凑空间。101举例:点IDM1M2关联的弧段弧ID起点ID终点ID左域ID右域ID中间点坐标(M1,M2)序列据此,点状地物、线状地物和面状地物的“矢量化”数据记录方式如下:点状地物:用(M1,M2)代替(x,y)线状地物:用(M1,M2)代替(x,y)记录中间点102面域ID边界ID序列面域内点指针……面域内点指针位置面域内点坐标(M1,M2)序列面状地物:除了要用Morton码即(M1,M2)代替(x,y)记录面状地物边界原始采样点的“拐点”(即中间点)位置,以及它们所穿过的所有基本格网的交线位置之外,还要用链指针记录多边形的内部栅格。103点标识号M1M2高程z….1002510026…..….43105….….40827725….….432463…..点状目标及其数据结构104结点点标识号M1M2高程z关联弧段…….….………..……..1002643425141101,202,10310027501141256205,201,301,…..……………..……….……….结点及其数据结构105弧段及其数据结构弧段标识始结点终结点左区右区中间点串(M1,M2,Z)….….….…..….…..20044100271002630024ф58,77,56;92,55,777,….…..….…..……….……106面状地物及其数据结构多边形标识号关联弧段面块头指针…….…………30018128,125,1260………….……………01451620236789121011二维行程M码循环指针属性值二维行程M码循环指针属性值08712816122016020362548107空间数据结构的建立根据用户需求,确定数据项目根据数据项目,确定数据源数据分类和编码确定数据模型和数据结构类型数据输入与编辑操作第五节空间数据组织108第5节空间数据组织一、空间数据的分类与编码为什么要进行分类与编码?1、空间数据分类:根据系统功能及国家规范和标准,将具有不同属性或特征的要素区别开来的过程,以便从逻辑上将空间数据组织为不同的信息层,为数据应用做准备。具体分类时:1)首先根据图形原则,将空间数据分为点、线、面三种类型;2)根据对象原则,例如河流和道路,同为线状要素,但分属于不同的地理对象,应分为不同的类。109我国基础地理信息数据分为:测量控制点、水系、居民地、交通、管线、境界、地形与土质、植被8个大类,然后再细分小类;2、空间数据的编码指将数据分类的结果,用一种易于计算机和人识别的符号系统表示出来的过程。编码的结果是形成代码。目的:提供空间数据地理分类和特征描述,便于数据输入、存储与管理以及系统间的数据交换和共享。1101、层次分类编码分类对象的从属和层次关系有明确的分类对象类别和严格的隶属关系2、多源分类编码按空间对象不同特性进行分类并编码代码之间没有隶属关系,反映对象特性具有较大的信息量,有利于空间分析111二、空间数据的组织以纸为媒介的地图是按“专题”来组织地理信息的。当一张图上表达的内容太多时,还要分成几张。地图既是储存信息的载体,又是表达信息的形式。如果把地图计算机化,那么储存信息和表达信息的双重功能就被分开,前者以数据方式储存起来,后者用图形、图像、文字报告方式来显示。112目前,通常的做法是用“层”的概念来分别存储不同专题的空间信息,即每一层存放一种专题或一类信息,并有一组对应的数据文件。一幅地图分层的多少,应根据应用上的要求、计算机硬件的存储量、处理速度,以及软件的限制来决定。113114115当图纸幅面太大或比例尺太大时,可在分层的基础上再分“幅”。从而把每次处理工作局限在一个小范围内。当需要跨越多幅地图时,利用软件的功能自动地将一幅幅图拼接起来,而访问数据库的人并不需要做拼接的操作,也不会感到查询、分析的结果是拼起来的。地图数据集中存放、没有分割的方法受到的限制体现在以下几个方面:116磁盘的容量有限。数据库不安全。万一系统出现故障,或操作不慎,可能会破坏整个地理范围内的数据库。数据库维护不便。局部范围的数据更新,往往要处理整个大范围的数据库,尤其是拓扑结构、四分树结构、游程长度编码结构的更新,要花费很多的计算时间。查询分析效率不高。查询分析多数是在局部范围内进行,数据文件越大,查找局部数据的相对时间越长。117

空间数据的编码:是指将数据分类的结果,用一种易于被计算机和人识别的符号系统表示出来的过程,编码的结果是形成代码。代码由数字或字符组成。例如,我国基础地理信息数据的分类代码由六位数字组成,其代码结构如下所示:× × ×× × ×大类码小类码一级代码二级代码识别位大类码、小类码、一级代码和二级代码分别用数字顺序排列。识别位由用户自行定义,以便于扩充。1181.空间元数据目前空间数据的共享问题十分突出,计算机技术的发展为空间数据的共享提供了技术基础。作为数据的生产者必需要有效地对数据进行管理和维护;作为数据的使用者必需要全面快速地访问、获取、管理空间数据。第6节空间元数据(metadata)1191)什么是元数据元数据是“数据的数据”,是关于数据和信息资源的描述信息,它描述数据的内容、质量、条件、和其它特征,使数据充分发挥作用,在实现数据共享方面十分重要。

空间元数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论