第二章 GIS中数据_第1页
第二章 GIS中数据_第2页
第二章 GIS中数据_第3页
第二章 GIS中数据_第4页
第二章 GIS中数据_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章GIS中的数据

GIS的数据空间数据(图):表示要素的空间位置、几何特征属性数据(文):表示要素的非几何特性,包括文字属性、表格、其他非几何数据(声音、动画、影像等等)空间数据的特征空间特征:表示现象的空间位置或现在所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示,例如笛卡尔坐标等。属性特征:表示实际现象或特征,例如变量、级别、数量特征和名称等等。时间特征:指现象或物体随时间的变化,其变化的周期有超短期的、短期的、中期的、长期的等等。三个侧面空间特征是GIS区别于其它的软件的根本特征是由于地物或现象的空间分布所带来通常是通过特定空间参照系下的坐标直接表达基于坐标的派生数据定量的度量信息:面积、周长、质心、距离等定性的空间关系:拓扑关系、方位关系时间特征空间数据涉及时间特征的几个方面地物的生命周期(产生、消亡)地物的移动(移动点)属性的时效性相关的问题时间关系时空关系时态GIS数据模型是其关键(时空立方体模型等)属性特征地物所固有的,不是由于地物空间分布所带来的特征如某地的年降雨量、土地酸碱类型、人口密度、交通流量、空气污染程度等。这类特征在其它类型的信息系统中均可存储和处理专题属性特征通常以数字、符号、文本和图像等形式来表示空间数据与属性数据空间数据的时态特征数据结构、数据管理设计数据结构——如何在计算机中表达空间信息,让计算机识别设计数据管理——如何组织,整合数据——计算机的文件结构:数据存储、排序、查询——数据库结构:文件的组合,较复杂的数据处理方法——图形数据结构:表达图形数据——GIS系统的数据结构、管理:管理多层数据、管理数据库一、属性数据的储存和管理文件系统、数据库管理系统1.单个文件的存储、检索、组织简单文件:未按规则组织,按输入先后顺序存放,检索使用不易顺序排列文件:顺序排列、检索方便。必须按顺序输入索引文件:购物指南,字典索引。

文件系统和数据库管理系统

2.多个文件:存储、检索、组织第一种方式(没有数据库情况下)的特点用户必须知道文件的内部结构改进处理,往往要改进文件结构某个文件结构的变化,引起众多程序的修改随着数据越来越多,与其针对每一个应用开发不同的程序,还不如提取其中的共性,集中起来开发一套通用的管理工具。于是产生了数据库。

文件系统和数据库管理系统第二种方式(有数据库)特点数据与应用相对独立用户数据共享(数据可以和DBMS相脱离)使用方便软件复杂、效率低用户可以直接使用文件ArcGIS可以使用这种方式文件系统和数据库管理系统

第三种方式的特点数据保密性好软件更复杂数据库管理软件要求高大型专业数据库,Oracle,Sybase,SQLServer等用户不能直接使用文件ArcGIS可以使用第三种方式进行管理、维护

(ArcCatalog)文件系统和数据库管理系统数据库:就是多个文件的集合。数据库结构=数据库管理系统(DBMS,DatabaseManageSystem):适用于管理多个文件的数据结构属性数据的存储和管理就是以数据库形式进行三种基本的数据结构:层次型数据库、网络型数据库、关系型数据库。关系型数据库是目前使用最多的是数据库类型基于关系模型的数据库——关系型数据库目前的GIS中一般都是采用关系型数据库存储、管理属性数据以表为基础:行(Record,记录)列(Field,属性、数据项、字段、关键字段)字段类型:(数值型、字符型、日期型、逻辑型…)CODELANDUSEFARDENSITYGREENHEIGHTA3-1G120.000.000.000.00A3-2C250.8025.0030.0015.00A3-3C250.8025.0030.0015.00A3-4C410.000.000.0012.00A3-5C250.8025.0030.0015.00关系型数据库的维护行:删除、添加、改属性值列:更名、删除、增加、改类型、改宽度表:增加、删除、更名关系型数据库的优缺点容易理解、直观易懂、查询灵活维护方便查询效率相对较慢(连接查询处理工作量大,要靠索引数据)DBMS在GIS中的应用从1970年代开始,1981年ESRI发布的ARC/INFO,是第一个将DBMS与GIS结合在一起的系统。二、空间数据模型如何在GIS中表达空间数据如何在GIS中表达空间数据?需要解决的3个方面问题:对象的空间位置对象的几何特性与其他对象之间的相对关系2维的空间要素都可以归纳为三种基本对象:点:point0维线:line,arc2维面(多边形):polygon2维空间对象:点有位置,无宽度和长度;抽象的点美国加利福尼亚州地震监测站2002年9月该洲可能的500个地震位置空间对象:线有长度,但无宽度和高度用来描述线状实体香港城市道路网分布空间对象:面具有长和宽的目标通常用来表示自然或人工的封闭多边形一般分为连续面和不连续面中国土地利用分布图(不连续面)空间事物类型典型对象典型属性图形图象表达形式1)点学校、环保监测站规模、有关监测指标点状符号2)线道路、电缆、水系交通量、电压、水质线型3)面(多边形)地块、行政区土地使用、人口填充符号、边界线栅格空间数据模型栅格数据结构定义:栅格结构是最简单、最直接的空间数据结构,是以规则的阵列来表示空间地物或现象分布的数据组织,组织中的每个数据表示地物或现象的非几何属性特征。特点:属性明显,定位隐含数据结构简单,易于遥感数据结合,但数据量大几何和属性偏差面向位置的数据结构,难以建立空间对象之间的关系abc345abcac距离:7/4(5)面积:7(6)几何偏差属性偏差三角形的面积为6个平方单位,而右图中则为7个平方单位,这种误差随像元的增大而增加。点线面栅格数据模型坐标系与描述参数行西南角格网坐标(XWS,YWS)格网分辨率格网方向列栅格数据模型用单元填满空间,每一个单元是一个小的正方形,称为grid。用同一种方法,实现了点、线、面三种对象的表达。笛卡尔坐标系早期的GIS大多数采用栅格数据模型行西南角格网坐标(XWS,YWS)格网分辨率格网方向列栅格数据单元值确定CAB百分比法面积占优重要性中心点法A连续分布地理要素C具有特殊意义的较小地物A分类较细、地物斑块较小AB为了逼近原始数据精度,除了采用这几种取值方法外,还可以采用缩小单个栅格单元的面积,增加栅格单元总数的方法栅格数据模型中,如何将属性数据赋予空间数据方法一:每一个网格单元都赋予一个数值。(简单,但无法有多重属性)需要表达多重属性就必须建立多个栅格图层土地产权地形土地使用建筑物ZYX栅格数据模型中,如何将属性数据赋予空间数据?方法二:网格单元与DBMS相连接,一个网格单元就可以有多重属性。多种压缩存储量的数据结构

分辨率的提高和数据量之间呈平方指数关系分辨率与精度的问题。如果精度越大、分辨率大,数据量就越大。为了减少数据量,产生了多种压缩存储量的数据结构栅格数据的压缩目的:减少数据量。通过某种编码的方法,达到减少数据长度的目的。多种压缩编码栅格数据结构栅格数据结构:压缩编码方案AAAAARAAARAAARAARAAAAAAAAAGGAAGGGGGGGAGGGAGGAAAAAARAAAARAAARRAAA143258761234567801234567起点行列号,单位矢量R:(1,5),3,2,2,3,3,2,3链式编码游程长度编码逐行编码数据结构:行号,属性,重复次数1,A,4,R,1,A,4块状编码正方形区域为记录单元数据结构:初始位置,半径,属性(1,1,3,A),(1,5,1,R),(1,6,2,A),…NESWNWSEGGGGAGGAAGAAA四分树编码链码优点:

链式编码对多边形的表示具有很强的数据压缩能力,且具有一定的运算功能,如面积和周长计算等,探测边界急弯和凹进部分等都比较容易,比较适于存储图形数据。缺点:

对叠置运算如组合、相交等则很难实施,对局部修改将改变整体结构,效率较低,而且由于链码以每个区域为单位存储边界,相邻区域的公共边界被重复存储会产生冗余。游程长度编码其实现方法有两种一种编码方案是,只在各行(或列)数据的代码发生变化时依次记录该代码以及相同的代码重复的个数,从而实现数据的压缩。

另一种游程长度编码方案就是逐个记录各行(或列)代码发生变化的位置和相应代码

游程长度编码示例按第一种编码方法,此数据游程长度编码:(0,1),(4,2),(7,5);(4,5),(7,3);(4,4),(8,2),(7,2);(0,2),(4,1),(8,3),(7,2);(0,2),(8,4),(7,1),(8,1);(0,3)(8,5),(0,4),(8,4);(0,5),(8,3)。用44个整数表达了原始数据中的64个栅格。游程长度编码示例按第二种编码方法,此数据游程长度编码(沿列方向):(1,0),(2,4),(4,0),(1,4),(4,0);(1,4),(5,8),(6,0);(1,7),(2,4),(4,8),(7,0);(1,7),(2,4),(3,8),(8,0);(1,7),(3,8);(1,7),(6,8);(1,7),(5,8)。

游程长度编码优缺点优点压缩效率较高,且易于进行检索,叠加合并等操作,运算简单,适用于机器存储容量小,数据需大量压缩,而又要避免复杂的编码解码运算增加处理和操作时间的情况

缺点对于图斑破碎,属性和边界多变的数据压缩效率较低,甚至压缩后的数据量比原始数据还大。

3.块码

块码是游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单位的代码组成。块码编码示例其块码编码为:(1,1,1,0),(1,2,2,4),(1,4,1,7),(1,5,1,7),(1,6,2,7),(1,8,1,7),(2,1,1,4),(2,4,1,4),(2,5,1,4),(2,8,1,7),(3,1,1,4),(3,2,1,4),(3,3,1,4),(3,4,1,4),(3,5,2,8),(3,7,2,7),(4,1,2,0),(4,3,1,4),(4,4,1,8),(5,3,1,8),(5,4,2,8),(5,6,1,8),(5,7,1,7),(5,8,1,8),(6,1,3,0),(6,6,3,8),(7,4,1,0),(7,5,1,8),(8,4,1,0),(8,5,1,0)四叉树编码四叉树编码又称为四分树、四元树编码。它是一种更有效地压编数据的方法。它将2n×2n像元阵列连续进行4等分,一直分到正方形的大小正好与象元的大小相等为止(如下图),而块状结构则用四叉树描述,习惯上称为四叉树编码。四叉树编码的优缺点优点:四叉树编码具有可变的分辨率,树的深度随数据的破碎程度而变化,并且有区域性质,压缩数据灵活,许多数据和转换运算可以在编码数据上直接实现,大大地提高了运算效率,并支持拓扑“洞”(嵌套多边形)的表达,是优秀的栅格压缩编码之一。缺点:其最大不足是其不稳定性,即同样的原始数据应用不同的算法进行编码可能会得到不同的编码结果。不利于数据分析。常见栅格压缩编码方法总结:链码的压缩效率较高,已经近矢量结构,对边界的运算比较方便,但不具有区域的性质,区域运算困难。游程长度编码既可以在很大程度上压缩数据,又最大限度地保留了原始栅格结构,编码解码十分容易。但对破碎数据处理效果不好。块码和四叉树编码具有区域性质,又具有可变的分辨率,有较高的压缩效率,但运算效率是其瓶颈。其中四叉树编码可以直接进行大量图形图像运算,效率较高,是很有前途的方法。矢量空间数据模型

矢量数据结构定义:矢量数据结构是通过记录坐标的方式,尽可能地将点、线、面地理实体表现得精确无误。矢量数据能更精确地定义位置、长度和大小。特点:定位明显、属性隐含。用拓扑关系描述空间对象之间的关系面向目标操作,精度高,数据冗余度小与遥感等图象数据难以结合输出图形质量号,精度高矢量数据模型采用平面解析几何的方法来描述空间对象。矢量数据模型核心是坐标点。点:只有位置没有大小。线:一系列坐标点组成,曲线用短直线拟合。多边形(面):线首尾相接,围成的闭合多边形。点:(x,y)

线:(x1,y1),(x2,y2),…,(xn,yn)

面(x1,y1),(x2,y2),…,(xi,yi),…,(x1,y2)

属性数据与空间数据关联使用关系型数据库DBMS一个空间要素对应数据库的一条记录使用多个字段表达多重属性。矢量数据结构的编码坐标序列法树状索引编码法拓扑结构编码法点实体线实体矢量数据编码唯一标识码是系统排列序号;线标识码可以标识线的类型;起始点和终止点号可直接用坐标表示;显示信息是显示时的文本或符号等;与线相联系的非几何属性可以直接存储于线文件中,也可单独存储,而由标识码联接查找。面实体多边形矢量编码,不但要表示位置和属性,更重要的是能表达区域的拓扑特征,如形状、邻域和层次结构等,以便使这些基本的空间单元可以作为专题图的资料进行显示和操作。1、简单的矢量数据结构—坐标序列法只记录空间对象的位置坐标和属性信息,不记录拓扑关系。存储:独立存储:空间对象位置直接跟随空间对象;点位字典:点坐标独立存储,线、面由点号组成特征无拓扑关系,主要用于显示、输出及一般查询公共边重复存储,存在数据冗余,难以保证数据独立性和一致性多边形分解和合并不易进行,邻域处理较复杂;处理嵌套多边形比较麻烦适用范围:制图及一般查询,不适合复杂的空间分析矢量数据结构编码的基本内容

标识码属性码空间对象编码唯一连接空间和属性数据数据库独立编码点:(x,y)线:(x1,y1),(x2,y2),…,(xn,yn)面:(x1,y1

),(x2,y2

),…,(x1,y1

)点位字典点:点号文件线:点号串面:点号串点号XY1112223344………n5566存储方法简单的矢量数据结构—坐标序列法多边形 数据项 A

(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),(x6,y6),(x7,y7),(x8,y8),(x9,y9),(x1,y1)

B(x1,y1),(x9,y9),(x8,y8),(x17,y17),(x16,y16),(15,y15),(x14,y14),(x13,y13)(x12,y12),(x11,y11),(x10,y10),(x1,y1) C(x24,y24),(x25,y25),(x26,y26),(x27,y27),(x28,y28),(x29,y29),(x30,y30),(x31,y31),(x24,y24) D

(x19,y19),(x20,y20),(x21,y21),(x22,y22),(x23,y23),(x15,y15),(x16,y16),(x19,y19) E

(x5,y5),(x18,y18),(x19,y19),(x16,y16),(x17,y17),(x8,y8),(x7,y7),(x6,y6),(x5,y5)坐标序列法的优缺点优点文件结构简单,易于实现以多边形为单位的运算和显示缺点多边形之间的公共边界被数字化和存储两次,由此产生冗余和碎屑多边形;每个多边形自成体系而缺少邻域信息,难以进行邻域处理,如消除某两个多边形之间的共同边界;岛只作为一个单个的图形建造,没有与外包多边形的联系;不易检查拓扑错误。这种方法可用于简单的粗精度制图系统中。2、树状索引编码法采用树状索引以减少数据冗余并间接增加邻域信息,方法是对所有边界点进行数字化,将坐标对以顺序方式存储,由点索引与边界线号相联系,以线索引与各多边形相联系,形成树状索引结构索引式线与多边形之间的树状索引点与多边形之间的树状索引树状索引编码法示例形成的文件记录树状索引编码法的优势和不足消除了相邻多边形边界的数据冗余和不一致的问题,邻域信息和岛状信息可以通过对多边形文件的线索引处理得到,但是比较繁琐,因而给相邻函数运算,消除无用边,处理岛状信息以及检查拓扑关系带来一定的困难,而且两个编码表都需要以人工方式建立,工作量大且容易出错。3、拓扑结构编码法要彻底解决邻域和岛状信息处理问题必须建立一个完整的拓扑关系结构,这种结构应包括以下内容:唯一标识,多边形标识,外包多边形指针,邻接多边形指针,边界链接,范围(最大和最小x、y坐标值,即外包矩形信息)。采用拓扑结构编码可以较好地解决空间关系查询等问题,但增加了算法的复杂性和数据库的大小。1)双重独立坐标地图编码(DIME)线号左多边形右多边形起点终点aOA18bOA21cOB32dOB43eOB54fOC65gOC76hOC87iCA89jCB95kCD1210lCD1112mCD1011nBA92这种数据结构除了通过线文件生成面文件外,还需要点文件链状双重独立坐标地图编码链状双重独立坐标地图编码数据结构是DIME数据结构的一种改进。在DIME中,一条边只能用直线两端点的序号及相邻的面域来表示,而在链状数据结构中,将若干直线段合为一个弧段(或链段),每个弧段可以有许多中间点。在链状双重独立坐标地图编码数据结构中,主要有四个文件:多边形文件、弧段文件、弧段坐标文件、结点文件。链状双重独立坐标地图编码多边形文件多边形号 弧段号 周长面积中心点坐标 A h,b,a B g,f,c,h,-j C j D e,i,f E e,i,d,b

弧段文件弧段号 起始点 终结点 左多边形 右多边形 a 5 1 O Ab 8 5 E Ac 16 8 E Bd 19 5 O Ee 15 19 O Df 15 16 D Bg 1 15 O Bh 8 1 A Bi 16 19 D Ej 31 31 B C 弧段坐标文件弧段号 点号 a 5,4,3,2,1 b 8,7,6,5 c 16,17,8 d 19,18,5 e 15,23,22,21,20,19 f 15,16, g 1,10,11,12,13,14,15 h 8,9,1 i 16,19 j 31,30,29,28,27,26,25,24,31 矢量数据结构的属性数据表达属性特征表达类别特征:类型编码说明信息:属性数据结构和表格属性表的内容取决于用户图形数据和属性数据的连接通过目标识别符或内部记录号实现。矢量数据结构的属性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论