第二章 地理信息系统的数据结构_第1页
第二章 地理信息系统的数据结构_第2页
第二章 地理信息系统的数据结构_第3页
第二章 地理信息系统的数据结构_第4页
第二章 地理信息系统的数据结构_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、复习,举例说明什么是数据和信息? 地理数据的特点? 地理信息系统的组成部分?主要功能有哪些?,第二章 地理信息系统的数据结构,地理实体的表达 位置 几何形态( 矢量数据模型和栅格数据模型) 、属性 相互之间的关系 空间数据的其他数据结构类型 矢量数据结构 曲面数据结构 栅格数据结构,位置,地理空间的概念 地理空间一般指上至大气电离层,下至地壳与地幔交界的莫霍面之间的空间区域。 地理空间定位框架即大地测量控制,由平面控制网和高程控制网组成; 目前,我国采用的大地坐标系为1980年中国国家大地坐标系,现在规定的高程起算基准面为1985国家高程基准。 GIS的任何空间数据都必须纳入一个统一的空间参照

2、系统中,以实现不同来源数据的融合、连接与统一;,地理实体的几何形状和空间分布,计算机中空间实体的表达 在计算机中,现实世界是以各种数字和字符形式来表达和记录的; 对现实世界的各类空间对象的表达有两种方法,分别称为矢量表示法(矢量数据模型)和栅格表示法(栅格数据模型),如下图。,流,路,点:位置:(x,y),线:位置: (x1,y1),(x2,y2),(xn,yn),面:位置:(x1,y1),(x2,y2),(xi,yi),(xn,yn),为使计算机能够处理数据,矢量数据模型的数据准备一般包括以下2个基本步骤: 首先,用点及其x, y坐标来表示空间要素如点、线和面; 其次将几何对象及其空间关系组

3、织成数字化数据文件,使得计算机可以访问、编译和处理。,矢量数据结构,矢量数据结构是利用欧几里得几何学中的点、线、面及其组合体来表示地理实体空间分布的一种数据组织方式;,点:零维 线:一维 面:二维 体:三维 时间:通常以第四维表达,注意:空间对象的维数与比例尺是相关的。 例如河流的上游可能被表示为单线,但是其下游却可能被表示为一个面。,矢量数据结构分为简单数据结构(点、线、面)、拓扑数据结构(描述实体间空间位置关系)和曲面数据结构(体),例如以ESRI 公司的数据格式为例: Shape文件(简单数据结构) Coverage文件(拓扑数据结构) TIN(曲面数据结构),地理实体之间相互关系,地物

4、对象或地理实体使用点、线、面和体表达后,这些实体之间的关系如何来描述? 例如人在社会的关系 为什么要描述这种关系呢?地理学第一定律(Toblers First Law或者Toblers First Law of Geography)all attribute values on a geographic surface are related to each other, but closer values are more strongly related than are more distant ones。 地理事物或属性在空间分布上互为相关,存在集聚(clustering)、随机(ra

5、ndom)、规则(Regularity)分布。,拓扑关系 拓扑是定义空间关系的一种数学过程,是将空间关系量化的过程。常被解释为通过图论这一数学分支,用图表或图形来研究几何对象排列及其相互关系(Wilson和Watkins,1990)。拓扑是研究几何对象在弯曲或拉伸等变换下仍保持不变的性质(Massey,1967)。 简单地说,地理图形要素之间的各种关联、邻接以及包含等空间关系的总和就是拓扑关系(Topology) 。,(构成拓扑关系的)拓扑元素,拓扑线段(arc),结点(node),多边形(poly),该线段中间不与其它线段存在联系,拓扑线段的两个端点,分别为首结点、尾结点,由数条拓扑线段连接

6、而成,拓扑关系的种类,拓扑邻接:N1/N2, N1/N3 , N1/N4 ; P1/P3; P2/P3 拓扑关联: N1/e1、e3、e6; P1/e1、e5、e6 拓扑包含: P3与P4,补充:欧 拉 公 式,体:拓扑元素量、顶点和面之间的关系:V+F-E=2,(1),V=4 F=4 E=6,V=8 F=6 E=12,V=6 F=8 E=12,V=9 F=8 E=15,复习题,地理空间的概念?如何在地理空间中定位? 在GIS中,如何表达地理空间实体? 空间数据的拓扑关系?,GIS中的拓扑关系的表达,拓扑关系具体可由4个关系表来表示: (1)面弧关系: (2)弧-结点关系: (3)结点弧关系:

7、 (4) 弧面关系:,面与弧段的拓扑关系 面 域弧 段 P1a, b, c, -g P2b, d, f P3c, f, e P4g,结点与弧段的拓扑关系 结 点弧 段 Aa, c, e Ba, d, b Cd, e, f Db, f, c Eg,弧段与结点的拓扑关系 弧段结 点 aA , B bB , D cD , A dB , C eC , A fC , D gE , E,弧段与面的拓扑关系 弧段 左邻面 右邻面 a P0 P1 b P2 P1 c P3 P1 d P0 P2 e P0 P3 f P3 P2 g P1,基于拓扑的数据集需要增加数据文件来存储要素间的空间关系。数据集中构建拓扑关

8、系有什么好处?,两个主要优势: 首先,是能确保数据质量。可用于发觉未正确接合的线、未正确闭合的多边形,以及数据地图上的其他数字化错误。比如最短路径分析需要道路正确相会,如果在假定连续的道路上存在一个缝隙,将会导致分析时避开缝隙而选择迂回路径。 其次,拓扑可强化GIS分析。比如交通容量分析中交通容量的测定是有方向性的。,拓扑的重要性,ESRI产品中采用的标准非拓扑数据格式称为Shapefile。它没有描述几何对象空间关系的文件。非拓扑数据有2个主要优势: 首先非拓扑矢量数据能比拓扑数据更快速地在计算机屏幕上显示出来。 第二,非拓扑数据具有非专有性和互操作性,意味着非拓扑数据可以在不同软件之间通用

9、。,ESRI产品中采用的标准拓扑数据格式有Coverage和Geodatabase模型(具有25种拓扑规则)。,关于拓扑的决定取决于GIS项目需求。,曲面数据模型(2.5维表达),曲面是指连续分布现象的覆盖表面,具有这种覆盖表面的要素有地形、降水量、温度和磁场等。表达和存储这些要素的基本要求是必须便于计算连续现象在任一点的数值。通常用如不规则三角网(triangulated irregular network , TIN)和规则格网(Grid)表达。,全球温度图,每隔22年黑子磁场,TIN的基本组成要素包括点、线和面。点要素具有x,y(表示位置)和z值(表示海拔高度)的高程点。 由构成三角形的

10、三个点的x、y和z值可计算得每个三角形的坡度和坡向。根据这些不规则的采样高程点, 用德老内(Delaunay)三角测量来构造初始的TIN,它是一个与其最近两个相邻点连接以尽可能形成等角三角形的反复过程(Watson和Philip,1984)。 TIN曲面通常用于数字地形的三维建模和显示,可以方便地进行地形分析,如坡度和坡向信息的提取,填挖方计算,阴影和地形通视分析,等高线自动生成和三维显示等。,毗连关系表,数据文件,三角形编号,生成的TIN由三种几何对象组成:三角形(区域)、点(节点)和线(边界)。 TIN数据结构包括三角形编号、每个毗连三角形的编号和数据文件,数据文件列表显示点、边界以及每个

11、高程点的x,y和z值。,日程,栅格数据模型 矢量数据与栅格数据的比较,空间数据按其存储格式分为两类: 矢量数据 栅格数据,栅格数据模型,栅格数据模型用规则网格来覆盖整个空间,然后在各个格网单元内赋以空间对象相应颜色、符号、数字、灰度值的一种数据组织方式。,实际就是像元阵列,每个像元由行列确定它的位置。由于栅格结构是按一定的规则排列的,行列坐标可以很容易地转为其它坐标系下的坐标。栅格结构表示的地表是不连续的,是量化和近似离散的数据。每一个单元格对应一个相应的地块。,点,面,线,点:为一个像元 线:在一定方向上连接成串的像元集合。 面:聚集在一起的像元集合,思考,划分研究区的网格除了正方形外,还可

12、不可以是其他的规则形状? 格网划多大合适? 格网的属性如何确定?比如说格网内包含不止一个地理实体。,栅格数据的表达 可以有多种形状,但是在现实中一般为正方形 各个栅格点大小一致,像元大小:栅格点大小越小,分辨率越高,(1)原则:应能有效地逼近空间对象的分布特征,又减少数据的冗余度。格网太大,忽略较小图斑,信息丢失。一般讲实体特征愈复杂,栅格尺寸越小,分辨率愈高,然而栅格数据量愈大计算机成本就越高,处理速度越慢。,(2)方法:用保证最小多边形的精度标准来确定尺寸经验公式: h为栅格单元边长 Ai为区域所有多边形的面积。,是不是不管三七二十一,分辨率越高越好?,栅格代码(像元值)的确定:当一个栅格

13、单元内有多个可选属性值时,按一定方法来确定栅格属性值。,1、中心点法:取位于栅格中心的属性值为该栅格的属性值 2、面积占优法:栅格单元属性值为面积最大者。 3、 重要性法:定义属性类型的重要级别,取重要的属性值为栅格属性值,常用于有重要意义而面积较小的要素,特别是点、线地理要素。 4、长度占优法:每个栅格单元的值由该栅格中线段最长的实体的属性来确定。,栅格数据结构 栅格矩阵结构 链式编码(ChainCodes) 游程编码结构 四叉树数据结构 八叉树数据结构 十六叉树数据结构,直接编码,压缩编码,栅格数据,5,5 A, A, B, B, B A, C, C, C, A D, C, C, A, A

14、 D, D, C, A, A D, D, A, A, A,栅格矩阵编码 就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码。 可以每行都从左到右逐个象元进行记录,也可以奇数行地从左到右而偶数行地从右向左记录,为了特定目的还可采用其他特殊的顺序。,演示:使用ToolBox中工具转换成文本。,游程长度编码 所谓游程是指按行的顺序连续且属性值相同的若干栅格。 游程长度的记录方式有两种: 记录每个游程起(迄)列号 记录每个游程象元数, 逐行记录每个游程的迄点列号,5,5 A,2,B,5 A,1,C,4,A,5 D,1,C,3,A,5 D,2,C,3,A,5 D,2,A,5,方式一:,记录每个游

15、程象元数,5,5 A,2,B,3 A,1,C,3,A,1 D,1,C,2,A,2 D,2,C,1,A,2 D,2,A,3,方式二(推荐):,复习,(判断)栅格数据模型使用的规则网格可以正方形,也可以是正三角形或正六边形。 (简答)栅格数据的网格大小和文件存储量有什么关系?如何确定合适的网格大小? (简答)当一个网格单元内有多个可选属性值时,如何来确定栅格属性值?后页附图 (问答)计算机中栅格数据结构存储类型有哪几种?请用栅格矩阵编码和游程编码方式表示下图中的栅格数据。,四叉树编码 四叉树又称四元树或四分树,是最有效的栅格数据压缩编码方法之一。四分树将整个图像区域逐步分解为一系列方形区域,且每一

16、个方形区域具有单一的属性。最小区域为一个象元。,区域分割原则: 将欲分解区域等分为四个象限,再根据各个象限的象元值是否单一决定要不要再分。如果单一则不再分割,否则同法再分,直到所有象限的象元属性值相同为止。,M M R M M M M M,M M R R M R M M,M R R R R R R M,M R R R R R R M,M R R R R R R M,M R R R R R R M,M M R R R R R M,M M M R R M M M,1 2 3 4 5 6 7 8,1 2 3 4 5 6 7 8,区域分割方法,在四叉树中,不能再分的结点称为叶子结点,可再分的结点称为树

17、杈结点。,四叉树编码方法,“R”的四叉树编码 (012,013,02,030,031,032)(102,103,120,122,123,13) (20,210,211,213,220,230,231)(302,31,320,321),复习题,以下栅格数据结构的存储类型中,( )属于非压缩存储。 A、栅格矩阵 B、游程编码 C、四叉树 D、八叉树 简述四叉树编码的思路?根据下图画出四叉树并写出属性值M的编码。 GIS中曲面的定义?如何表示曲面(表示曲面的方法有)?,栅格数据模型的特点,属性明显 数据中直接记录了数据属性或指向数据属性的 指针,因而我们可以直接得到地物的属性代码。 定位隐含 所在位置则根据行列号转换为相应的坐标,定位是根据数据在数据集中的位置得到的。栅格结构是按一定的规则排列的,所表示的实体的位置很容易隐含在格网文件的存储结构中。,栅格数据结构简单 结构容易实现,算法简单,且易于扩充、修改,也很直观,特别是易于同遥感影像的结合处理,给地理空间数据处理带来了极大的方便。,矢量数据结构的特点,用离散的点描述空间对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论