第七章_地理信息系统的数据结构_第1页
第七章_地理信息系统的数据结构_第2页
第七章_地理信息系统的数据结构_第3页
第七章_地理信息系统的数据结构_第4页
第七章_地理信息系统的数据结构_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 地理信息系统的数据结构o 1 地理空间及其表达o 2 地理空间数据及其特征o 3 空间数据结构的类型o 4 空间数据结构的建立 o 上至大气电离层,下至地幔莫霍面,有着广阔上至大气电离层,下至地幔莫霍面,有着广阔的范围。的范围。o 但在但在GISGIS中地理空间一般指的是地球表层,其基中地理空间一般指的是地球表层,其基准是陆地表面和大洋表面,它是人类活动频繁准是陆地表面和大洋表面,它是人类活动频繁发生的区域,是人地关系最为复杂、紧密的区发生的区域,是人地关系最为复杂、紧密的区域。域。地球模型地球表面水准面大地水准面铅垂线地球椭球体地理坐标系地理坐标系NSQ 赤道纬线本初子午线EA 平面

2、坐标系平面坐标系直接建立在球体上的地理坐标,用经度和纬度表达地理对象位置建立在平面上的直角坐标系统,用(x,y)表达地理对象位置投影坐标系统坐标系统高程系统高程系统任意水准面大地水准面HAHA铅垂线AHBHBhAB水准原点水准原点19851985国家高国家高程基准,程基准,72.260472.2604米米黄海海面黄海海面1952-19791952-1979年平年平均海水面为均海水面为0 0米米地图投影:投影实质地图投影:投影实质 建立地球椭球面上各点的大地坐标,按照一定建立地球椭球面上各点的大地坐标,按照一定的数学法则,变换为平面上相应点的平面直的数学法则,变换为平面上相应点的平面直角坐标。角

3、坐标。 我国常用地图投影我国常用地图投影1 1:100100万:兰勃投影(正轴等积割圆锥投影)万:兰勃投影(正轴等积割圆锥投影) 大部分分省图、大多数同级比例尺也大部分分省图、大多数同级比例尺也 采用兰勃投影采用兰勃投影1 1:5050万、万、1 1:2525万、万、1 1:1010万、万、1 1:5 5万、万、1 1:2.52.5万、万、1:11:1万、万、1 1:50005000:高斯:高斯克吕格投影。克吕格投影。湖泊河道居民地返回一、GIS空间数据的分类按数据来源按数据来源按数据结构按数据结构按数据特征按数据特征按几何特征按几何特征按数据发布形式按数据发布形式地图数据影像数据文本数据矢量

4、数据栅格数据空间数据非空间属性数据点线面、曲面体数字线画图数字栅格图数字高程模型数字正射影像图矢量数据栅格数据数字高程二、空间数据基本特征空间特征空间特征用以描述事物或现象的地理用以描述事物或现象的地理 位置以及空间位置相互关系位置以及空间位置相互关系属属 性性 特特 征征用以描述事物或现象的特性用以描述事物或现象的特性时时 间间 特特 征征用以描述事物或现象随时间的变化用以描述事物或现象随时间的变化三、空间数据的拓扑关系三、空间数据的拓扑关系什么叫拓扑?什么叫拓扑?TopologyTopology一词来自希腊文一词来自希腊文,它的原意是,它的原意是“形状的研形状的研究究”。拓扑学是几何学的。

5、拓扑学是几何学的一个分支,它研究在拓扑一个分支,它研究在拓扑变换下能保持不变的几何变换下能保持不变的几何属性属性拓扑属性。拓扑属性。拓扑邻接:拓扑邻接: 元素之间的拓扑关系。元素之间的拓扑关系。拓扑关联:拓扑关联: 元素之间的拓扑关系。元素之间的拓扑关系。拓扑包含:拓扑包含: 元素之间的拓扑关系。元素之间的拓扑关系。拓扑关系的类型拓扑关系的类型不不 同同 类类同同 类类同类不同级同类不同级N11256473P1P3P2P4N4N3N5N2拓扑邻接:拓扑邻接:N N1 1/ /N N2 2 , ,N N1 1/ /N N3 3 , ,N N1 1/ /N N4 4 ; ;P P1 1/ /P P

6、3 3 ; ;P P2 2/ /P P3 3拓扑关联:拓扑关联:N N1 1/1 1、3 3 、6 6 ;P P1 1/1 1、5 5 、6 6 拓扑包含:拓扑包含:P P3 3与与P P4 4空间拓扑关系表达空间拓扑关系表达关系表关系表abcdefgACBDEP4P0P1P2P3多边形与弧段的拓扑关系多边形弧 段P1a, b, c, -gP2b, d, fP3c, f, eP4g节点与弧段的拓扑关系节 点弧 段Aa, c, eBa, d, bCd, e, fDb, f, cEg 弧段与节点的拓扑关系弧 段节 点aA , BbB , DcD , AdB , CeC , AfC , DgE ,

7、E弧段与多边形的拓扑关系弧段 左多边形 右多边形aP0P1bP2P1cP3P1dP0P2eP0P3fP3P2gP1返回返回XYijx1 y1x2 y2xi yixn yn数据结构即指数据组织的形式,是适合于计算机存储、数据结构即指数据组织的形式,是适合于计算机存储、管理和处理的数据逻辑结构。管理和处理的数据逻辑结构。对空间数据则是地理实体的空对空间数据则是地理实体的空间排列方式和相互关系的抽象描述。间排列方式和相互关系的抽象描述。第三节第三节 空间数据结构的类型空间数据结构的类型p矢量数据结构矢量数据结构p栅格数据结构栅格数据结构p栅格结构与矢量结构的比较栅格结构与矢量结构的比较一、矢量数据结

8、构(一)实体数据结构n 矢量数据的简单数据结构分别按点、线、面三种基本形式来描述。实例ArcView Shape文件: .shp 主文件 .shx 索引文件 .dbf 表文件MapinfoTab文件(二)拓扑数据结构 拓扑数据结构的关键是拓扑关系的表示拓扑关系的表示,而几何数据的表示可参照矢量数据的简单数据结构简单数据结构。在目前的GIS中,主要表示基本的拓扑关系,而且表示方法不尽相同。下面举一表示矢量数据拓扑关系的例子。商品化较好的商品化较好的GISGIS软件的数据库数据组织都具有完整的拓朴结构:软件的数据库数据组织都具有完整的拓朴结构:(如(如ARC/INFOARC/INFO)矢量拓朴编码

9、方法软件举例:)矢量拓朴编码方法软件举例: Topology Topology 拓朴学拓朴学 Topological RelationTopological Relation 从上至下(从上至下(poly-ARC-Node)poly-ARC-Node)的拓朴关系(图的拓朴关系(图b).b).得到明确得到明确表达或从下至上(表达或从下至上(Node-ARC-poly)Node-ARC-poly) 用关系表列出这种拓用关系表列出这种拓朴关系。朴关系。Topological relation configration table.polygon-ARC Topological relation b=

10、b(a)面块面块弧段弧段B1B2B3B4A1 A2 A3 A2 A5 A6A3 A4 A7A6 A7 A8 ARC-Node Topology a=a(n);Node-ARC topology n=n(a)弧段 点 点弧段 A1A2A3A4A5A6A7A8 N1 N2N2 N3N1 N3N1 N4N2 N5N3 N5N3 N4N4 N5 N1N2N3N4N5 A1 A3 A4A1 A2 A5A2 A3 A6 A7A4 A7 A8A5 A6 A8ARC-polygon topoly a=a(b) 弧段LPOLY RPOLY A1A2A3A4A5A6A7A8 0 B2B1B30 B2B4b4 B1

11、B1B30B2B4B30ARC/INFOARC/INFO中的弧段数据结构中的弧段数据结构弧段弧段IDFnodeTonodeLpolyRpolyarc coordinationA1A2A3A4A5A6A7A8N1N2N1N1N2N3N3N4N2N3N3N4N5N5N4N50B2B1B30B2B4B4B1B1B30B2B4B30Xn1,Yn1.Xn2,Yn2Xn2,Yn2.Xn3,Yn3Xn1,Yn1.Xn3,Yn3Xn1,Yn1.Xn4,Yn4Xn2,Yn2.Xn5,Yn5Xn3,Yn3.Xn5,Yn5Xn3,Yn3.Xn4,Yn4Xn4,Yn4.Xn5,Yn5返回返回栅格数据结构栅格数据结构

12、栅格数据栅格数据: :栅格数据结构就是像元阵列,每个栅格数据结构就是像元阵列,每个像元的行列号确定位置,用像元值表示空间像元的行列号确定位置,用像元值表示空间对象的类型、等级等特征。每个栅格单元只对象的类型、等级等特征。每个栅格单元只能存在一个值。能存在一个值。 位置很容易隐含位置很容易隐含 代码代表实体的属性或属性的编码代码代表实体的属性或属性的编码 (a)三角形(b) 菱形(c) 六边形点点线线面面对于栅格数据结构对于栅格数据结构点:为一个像元点:为一个像元线:在一定方向上线:在一定方向上连接成串的相邻像连接成串的相邻像元集合。元集合。面:聚集在一起的面:聚集在一起的相邻像元集合。相邻像元

13、集合。栅格数据结构:栅格数据结构:坐标系与描述参数坐标系与描述参数Y:列X:行西南角格网坐标(XWS,YWS)格网分辨率栅格尺寸的选择:栅格尺寸的选择:栅格数据单元值确定栅格数据单元值确定CAB百分比法面积占优重要性中心点法A连续分布地理要素C具有特殊意义的较小地物A分类较细、地物斑块较小AB为了逼近原始数据为了逼近原始数据精度,除了采用这精度,除了采用这几种取值方法外,几种取值方法外,还可以采用缩小单还可以采用缩小单个栅格单元的面积,个栅格单元的面积,增加栅格单元总数增加栅格单元总数的方法的方法 abc345abc几何偏差属性偏差 三角形的面积为6个平方单位,而右图中则为7个平方单位,这种误

14、差随像元的增大而增加。 编码方法o 直接编码方法o 压缩编码方法直接编码方法o 将栅格数据看成一个矩阵,逐行逐列记录代码。直接编码方法的缺点是随着栅格尺寸的缩小,数据量也将呈几何级数递增。 0 0 0 0 0 0 20 1 0 0 0 2 0 0 0 0 0 2 0 0 2 2 2 2 0 0 0 0 0 0 0 0 0 0 0 0 3 3 0 3 0 0 3 3 3 3 3 3ResolutionSize = 7x7x4 = 196Size = 10 x10 x4 = 400压缩编码o 为了能以尽可能少的数据量记录尽可能多的信息,目前有一系列栅格数据压缩编码方法,如链码、游程长度编码、块码、

15、四叉树编码等,其类型又有无损压缩编码和有损压缩编码之分。o 无损压缩编码是指编码过程中没有任何信息损失,通过解码可以恢复原来的信息。有损压缩编码是指为了提高编码效率,最大限度地压缩数据,在压缩过程中损失一部分信息。 栅格数据结构:栅格数据结构:压缩编码方案压缩编码方案AAAAARAAARAAARAARAAAAAAAAAGGAAGGGGGGGAGGGAGGAAAAAARAAAARAAARRAAA143258761234567801234567起点行列号,单位矢量R: (1,5),3,2,2,3,3,2,3链式编码游程长度编码逐行编码数据结构: 行号, 属性, 重复次数1:A, 4; R, 5;A

16、, 8块状编码正方形区域为记录单元数据结构: 初始位置, 半径, 属性(1,1,3,A),(1,4,1,A),(1,5,1,R),(1,6,2,A),NE SWNWSEGGGGAGGAAGAAA四叉树编码1.链式编码边界链码E / 0EN /7N / 6WN / 5W / 4WS / 3ES / 1S / 23,1,7,0,1,2,3,4,5,64,1,6,7,0,1,2,3,4,52.游程长度编码o 所谓游程是指按行的顺序连续且属性值相同的若干栅格。o 游程长度的记录方式有两种 记录每个游程起(迄)列号 记录每个游程象元数2.游程长度编码 逐行记录每个游程的迄点列号5,5A,2,B,5A,1

17、,C,4,A,5D,1,C,3,A,5D,2,C,3,A,5D,2,A,52.游程长度编码记录每个游程象元数5,5A,2,B,3A,1,C,3,A,1D,1,C,2,A,2D,2,C,1,A,2D,2,A,32.游程长度编码记录每个游程象元数5,52,A3,B1,A3,C1,A1,D2,C2,A2.游程压缩编码结构o 这种数据结构特别适用于二值图像的表示,如下图所示(游程编码能否压缩数据量,主要决定于栅格数据的性质,通常可通过事先测试,计算图的数据冗余度Re )2.游程压缩编码结构3. 块式编码o 块式编码是将游程扩大到两维情况,把多边形范围划分成若干具有同一属性的正方形,然后对各个正方形进行

18、编码。o 块式编码的数据结构由初始位置(行列号)、半径和属性代码组成。3. 块式编码M M R M M M M MM M M R R M M M1 2 3 4 5 6 7 81 2 3 4 5 6 7 8M M R M M M M MM M R R M R M MM R R R R R R MM R R R R R R MM R R R R R R MM R R R R R R MM M R R R R R MM M M R R M M MM M R R R R R MM M R R M R M MM R R R R R R MM R R R R R R MM R R R R R R MM R

19、 R R R R R M3. 块式编码1,1,2,M;1,3,1,R;1,4,1,M;1,5,1,M;1,6,1,M;1,7,2,M2,3,2,R;2,5,1,M;2,6,1,R3,1,1,M;3,2,1,R;3,5,3,R;3,8,1,M4,1,1,M;4,2,2,R;4,4,1,R ; 4,8,1,M5,1,1,M;5,4,1,R;5,8,1,MM M R M M M M MM M M R R M M M1 2 3 4 5 6 7 81 2 3 4 5 6 7 8M M R R R R R MM M R R M R M MM R R R R R R MM R R R R R R MM R

20、R R R R R MM R R R R R R M4.四叉树编码结构o 四叉树编码结构的基本思想是首先把一幅图像或一幅栅格地图(2n*2n,n1)等分成四部分,逐块检查其格网值,如果某个子区的所有格网都具有相同的值,则这个子区就不再往下分割,否则,把这个区域在分割成四个子区域,递归的分割下去,直到每个子块都只含有相同的灰度或属性值为止。这样最后结果可得到一颗四分叉的倒向树。四叉树编码正是通过这种树状结构来记录和压缩栅格数据,以此种结构实现查询,修改和量算等操作。如图4-19所示的栅格数据,经过四叉树编码得到图4-20所示。 一、四叉树数据结构一、四叉树数据结构 四叉树的分割思想是把一幅图象或

21、栅格地图按四叉树的分割思想是把一幅图象或栅格地图按 2k2k ,k1,等分成四部分,等分成四部分,逐块检查其格网值,如果某个子区的所有格网都含有相同的值,则这个子区不再逐块检查其格网值,如果某个子区的所有格网都含有相同的值,则这个子区不再往下分割;否则,把这个子区再分成四个子区,这样递归地分割,直到每个子块往下分割;否则,把这个子区再分成四个子区,这样递归地分割,直到每个子块都含有相同的值为止都含有相同的值为止 。 不能再分的块构称为树的叶结点, 有值的叶结点为黑结点, 没有值的结点为白结点。 K 为树的高度, 图中 k=3。 四叉树的存储可按常规叶结点的顺序存储,称为常规四叉树。按特定叶结点

22、顺序存储的称为线性四叉树。 1、常规四叉树的存储结构、常规四叉树的存储结构 常规四叉树除了记录叶结点外,还要记录中间接点,需要记录中间结点与上常规四叉树除了记录叶结点外,还要记录中间接点,需要记录中间结点与上一级结点和四个子结点的指针,共需要记录六个量。指针不仅增加了存储量,而一级结点和四个子结点的指针,共需要记录六个量。指针不仅增加了存储量,而且增加了对树的操作的复杂性。且增加了对树的操作的复杂性。 2、线性四叉树的存储结构、线性四叉树的存储结构 线性四叉树只记录叶结点信息,不记录中间结点。不过叶结点的编码要包含叶结线性四叉树只记录叶结点信息,不记录中间结点。不过叶结点的编码要包含叶结点在树

23、种的位置信息。因此对叶结点的地址编码非常重要。最常用的地址编码有点在树种的位置信息。因此对叶结点的地址编码非常重要。最常用的地址编码有四进制和十进制的四进制和十进制的 Morton码。四进制的编码如图码。四进制的编码如图 morton编码如下:编码如下: 对于下图的栅格图像: 对应的morton编码的四叉树为: morton码的计算如下:以第码的计算如下:以第5行第行第7列的栅格为例:列的栅格为例: 第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法二、栅格数据的压缩二、栅格数据的压缩 3、四叉树编码、四叉树编码 这样就可将用行列表示的二维图像,用这样就可将用行列表示的二维图像,用 M

24、orton码写成一维数码写成一维数 据,通过据,通过 Morton 码就可知道象元的位置。码就可知道象元的位置。 把一幅把一幅2 n2 n 的图像压缩成线性四叉树的过程为:的图像压缩成线性四叉树的过程为: 1按按 Morton 码把图象读入一维数组。码把图象读入一维数组。 2相邻的四个象元比较,一致的合并,只记录第一个象元的相邻的四个象元比较,一致的合并,只记录第一个象元的 Morton 码。码。 3比较所形成的大块,相同的再合并,直到不能合并为止。比较所形成的大块,相同的再合并,直到不能合并为止。 对用上述线性四叉树的编码方法所形成的数据还可进一步用游程长度编对用上述线性四叉树的编码方法所形

25、成的数据还可进一步用游程长度编码压缩。压缩时只记录第一个象元的码压缩。压缩时只记录第一个象元的Morton码。码。 例:例: 第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法二、栅格数据的压缩二、栅格数据的压缩 3、四叉树编码、四叉树编码 其处理过程如下页:其处理过程如下页:第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法二、栅格数据的压缩二、栅格数据的压缩 3、四叉树编码、四叉树编码 四叉树编码四叉树编码 解码时,根据解码时,根据 Morton 码,就可知道象元在图像中的位置。从码,就可知道象元在图像中的位置。从左上角,本左上角,本Morton 码和下一个码和下一个 Mo

26、rton 码之差即为象元个数。知道码之差即为象元个数。知道了象元的个数和象元的位置就可恢复出图像了。了象元的个数和象元的位置就可恢复出图像了。 线性四叉树编码的优点是:压缩效率高,压缩和解压缩比较方便,线性四叉树编码的优点是:压缩效率高,压缩和解压缩比较方便,阵列各部分的分辩率可不同,既可精确地表示图形结构,又可减少存贮阵列各部分的分辩率可不同,既可精确地表示图形结构,又可减少存贮量,易于进行大部分图形操作和运算。缺点是:不利于形状分析和模式量,易于进行大部分图形操作和运算。缺点是:不利于形状分析和模式识别,即具有图形编码的不定性,如同一形状和大小的多边形可得出完识别,即具有图形编码的不定性,

27、如同一形状和大小的多边形可得出完全不同的四叉树结构。全不同的四叉树结构。栅格结构与矢量结构的比较 优点缺点栅格矢量数据结构简单与遥感数据匹配 空间分析过程简单 数据量大输出效果受像素尺寸影响投影变换困难表示拓扑关系困难数据量小拓扑关系易建立地图输出效果好数据结构复杂与遥感数据不匹配软件和硬件成本较高某些空间分析处理较复杂地图叠置分析时间较长 数字高程模型数据结构数字高程模型数据结构o 数字高程模型数据结构,是指对连续分布现象的覆盖要素,如地形、降水量、温度、磁场等连续现象在任一点的内插计算。为了进行内插计算,经常采用不规则三角网来拟和连续分布现象的覆盖表面,称为TIN(Triangulated

28、 Irregular Network)数据结构。o 这种在TIN中的曲面数据结构,常用于数字地形的表示。 o 利用TIN的曲面数据结构,可以方便的进行地形分析,如坡度和坡向信息提取,填挖方计算,阴影和地形通视分析,等高线生成。返回返回三、数字高程模型数据结构o 数字高程模型数据结构是数字地形表示的数字高程模型数据结构是数字地形表示的2.5维表面模维表面模型的一种数据结构。在型的一种数据结构。在GIS中,对地形的分析以及其他中,对地形的分析以及其他专题分析中具有重要作用。它有两种存储形式,一是规专题分析中具有重要作用。它有两种存储形式,一是规则格网点的形式,二是不规则三角网形式。前者实际上则格网

29、点的形式,二是不规则三角网形式。前者实际上是一种栅格数据结构形式,后者是一种单一面的简单拓是一种栅格数据结构形式,后者是一种单一面的简单拓扑矢量数据结构形式。扑矢量数据结构形式。泰森多边形格网点数据结构o 离散高程点o 规则格网点o 数字高程矩阵不连续变化曲面:如土壤、森林、草原、土地利用等,属性变化发生在边界上,面的内部是同质的。连续变化曲面:如地形起伏,整个曲面在空间上曲率变化连续。规则格网点的表达n不连续表面(surface) :表示一种不连续的空间分布,例如地形变化、也可以描述其他的分布(人口、温度.)n栅格本身就可以表达不连续的表面。1111111 11111111111111 11

30、 1111113333333333333333333333322 22 2 2 22222 22 2 22222 22 2 22222 222 222 222 222 222 222 222 222 222 222 222 222 222 222 2 222 22 2 222 2222222 222222222 22222 22222 22222222222 222 222 222 222222222 222222不规则三角网数据结构o不规则三角网TIN, Triangulated Irregular Network :特殊的矢量(拓扑)网络模型。o原始数据是矢量样本点,将样本点用直线相互连接,形成不规则的三角形网络,网络的结点就是样本点,如果每个样本点有自己的高程值,每个三角形就相当于三维空间中的一个斜面。#n划分三角形的原理:通常使用Delaunay三角网,最小角最大,最大限度地保证网中三角形满足近似等边(角)性,避免过于狭长和尖锐的三角形的出现 nTIN模型最常用的对象是地形,也可以用在某些自然环境、社会经济领域。数字地形模型o 格网点数据结构简单,但表达地形的精度较差,与影象的叠加吻合不好,对地形变化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论