空间数据管理课件_第1页
空间数据管理课件_第2页
空间数据管理课件_第3页
空间数据管理课件_第4页
空间数据管理课件_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

空间数据管理

1.空间数据库地理信息系统的内容及其功能与一般管理信息系统的区别,是数据具有空间分布的性质。对地理信息系统来讲,不仅数据本身具有空间属性,系统的分析和应用也无不与地理环境直接关联。系统的这一基本特征,深刻地影响着数据的结构、数据库的设计、分析算法和软件,以及系统的输入和输出。1.1地理信息系统与一般信息系统的比较1.1.1两者的区别1)在硬件上,为了处理图形和图像数据,系统需要配置专门的输入和输出设备,如数字化仪、绘图机、图形图像的显示设备等。2)在软件上,则要求研制专门的图形和图像数据的分析算法和处理软件,这些算法和软件又直接和数据的结构及数据库的管理方法有关。1.空间数据库3)在信息处理的内容和采用目的方面,一般的管理信息系统,主要是查询检索和统计分析,处理的结果,大多是制成某种规定格式的表格数据,而地理信息系统,除了基本的信息检索和统计分析外,主要用于分析研究资源的合理开发利用,制定区域发展规划,地区的综合治理方案,对环境进行动态的监视和预测预报,为国民经济建设中的决策提供科学依据,为生产实践提供信息和指导。1.空间数据库1.1.2两者共同之处两者都是以计算机为核心的信息处理系统,都具有数据量大和数据之间关系复杂的特点,也都随着数据库技术的发展在不断的改进和完善。1.空间数据库1.2空间数据库1.2.1数据库的概念数据库就是为一定目的服务,以特定的数据存储的相关联的数据集合,它是数据管理的高级阶段,是从文件管理系统发展而来的。为了直观地理解数据库,可以把数据库作如下比较:

表7-1:数据库与图书馆比较1.空间数据库1.2.2空间数据库特点1)数据量特别大2)不仅有属性数据,还有大量的空间数据3)数据应用广泛1.空间数据库1.2.3数据库管理系统数据库管理系统是在文件处理系统的基础上进一步发展的系统。DBMS在用户应用程序和数据文件之间起到了桥梁作用。DBMS的最大优点是提供了两者之间的数据独立性,即应用程序访问数据文件时,不必知道数据文件的物理存储结构。当数据文件的存储结构改变时,不必改变应用程序。1.空间数据库2)GIS数据管理方法主要4种类型(2.1)对不同的应用模型开发独立的数据管理服务,这是一种基于文件管理的处理方法。(2.2)在商业化的DBMS基础上开发附加系统。开发一个附加软件用于存储和管理空间数据和空间分析,使用DBMS管理属性数据。1.空间数据库(2.3)使用现有的DBMS,通常是以DBMS为核心,对系统的功能进行必要扩充,空间数据和属性数据在同一个DBMS管理之下。需要增加足够数量的软件和功能来提供空间功能和图形显示功能。(2.4)重新设计一个具有空间数据和属性数据管理和分析功能的数据库系统。

1.空间数据库1.3数据与文件组织数据是现实世界中信息的载体,是信息的具体表达形式,为了表达有意义的信息内容,数据必须按照一定的方式进行组织和存储。1.3.1数据组织的分级数据库中的数据组织一般可以分为四级:数据项、记录、文件和数据库。1.空间数据库1.3.2数据间的逻辑联系数据间的逻辑联系主要是指记录与记录之间的联系。记录是表示现实世界中的实体的。实体之间存在着一种或多种联系,这样的联系必然要反映到记录之间的联系上来。数据之间的逻辑联系主要有三种:一对一的联系;一对多的联系;多对多的联系。1.空间数据库1.3.3常用数据文件图7-1:非顺序文件操作系统实现的文件组织方式,可以分为顺序文件、索引文件、直接文件和倒排文件。1.空间数据库1)顺序文件顺序文件(图7-2)是最简单的文件组织形式,对记录按照主关键字的顺序进行组织。

图7-2:顺序文件1.空间数据库2)索引文件索引文件除了存储记录本身(主文件)以外,还建立了若干索引表,这种带有索引表的文件叫索引文件。索引表中列出记录关键字和记录在文件中的位置(地址)。读取记录时,只要提供记录的关键字值,系统通过查找索引表获得记录的位置,然后取出该记录。1.空间数据库3)直接文件直接文件又称随机文件,其存储是根据记录关键字的值,通过某种转换方法得到一个物理存储位置,然后把记录存储在该位置上。查找时,通过同样的转换方法,可以直接得到所需要的记录。4)倒排文件倒排文件是带有辅索引的文件,其中辅索引是按照一些辅关键字来组织索引的(注意:索引文件是按照记录的主关键字来构造索引的,也叫主索引)。倒排文件是一种多关键字的索引文件,其中的索引不能唯一标识记录,往往同一索引指向若干记录。1.空间数据库1.4GIS的内部数据结构内部数据结构基本上可分为两大类:矢量结构和栅格结构(也可以称为矢量模型和栅格模型)(图7-3)。两类结构都可用来描述地理实体的点、线、面三种基本类型。1.空间数据库在地理信息系统的空间数据结构中,栅格结构的编码方式主要有直接栅格编码、链码、游程长度编码、块码、四叉树码等;矢量结构主要有坐标序列编码、树状索引编码和二元拓扑编码等编码方法。1.空间数据库

图7-3:矢量结构和栅格结构1.空间数据库1.4.1矢量模型在矢量模型中,现实世界的要素位置和范围可以采用点、线或面表达,与它们在地图上表示相似,每一个实体的位置是用它们在坐标参考系统中的空间位置(坐标)定义。点、线和多边形用于表达不规则的地理实体在现实世界的状态。矢量模型中的空间实体与要表达的现实世界中的空间实体具有一定的对应关系。1.空间数据库1.4.2栅格模型在栅格模型中,地理实体的位置和状态是用它们占据的栅格的行、列来定义的。每个栅格的大小代表了定义的空间分辨率。由于位置是由栅格行列号定义的,所以特定的位置由距它最近的栅格记录决定。栅格的值表达了这个位置上物体的类型或状态。采用栅格方法,空间被划分成大量规则格网,而且每个栅格取值可能不一样。空间单元是栅格,每一个栅格对应于一个特定的空间位置,如地表的一个区域,栅格的值表达了这个位置的状态。1.空间数据库2.栅格数据结构及其编码2.栅格数据结构及其编码2.1栅格数据结构2.1.1定义栅格结构是最简单最直接的空间数据结构,是指将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为一个象元或象素由行、列定义,并包含一个代码表示该象素的属性类型或量值,或仅仅包括指向其属性记录的指针。因此,栅格结构是以规则的阵列来表示空间地物或现象分布的数据组织,组织中的每个数据表示地物或现象的非几何属性特征。(a)点(b)线(c)面

图7-4:点、线、区域的格网2.栅格数据结构及其编码2.1.2特点栅格结构的显著特点是:属性明显,定位隐含,即数据直接记录属性的指针或属性本身,而所在位置则根据行列号转换为相应的坐标,也就是说定位是根据数据在数据集中的位置得到的。这种结构容易实现,算法简单,且易于扩充、修改,也很直观,特别是易于同遥感影像的结合处理,给地理空间数据处理带来了极大的方便。2.栅格数据结构及其编码2.2决定栅格单元代码的方式在决定栅格代码时尽量保持地表的真实性,保证最大的信息容量。图7-5所示的一块矩形地表区域,内部含有A、B、C三种地物类型,O点为中心点,将这个矩形区域近似地表示为栅格结构中的一个栅格单元时,可根据需要,采取如下的方式之一来决定栅格单元的代码。图7-5:栅格单元代码的确定2.栅格数据结构及其编码2.2.1中心点法用处于栅格中心处的地物类型或现象特性决定栅格代码,在图7-5所示的矩形区域中,中心点O落在代码为C的地物范围内,按中心点法的规则,该矩形区域相应的栅格单元代码为C,中心点法常用于具有连续分布特性的地理要素,如降雨量分布、人口密度图等。2.栅格数据结构及其编码2.2.2面积占优法以占矩形区域面积最大的地物类型或现象特性决定栅格单元的代码,在图7-5所示的例子中,显见B类地物所占面积最大,故相应栅格代码定为B。面积占优法常用于分类较细,地物类别斑块较小的情况。2.栅格数据结构及其编码2.2.3重要性法根据栅格内不同地物的重要性,选取最重要的地物类型决定相应的栅格单元代码,假设图7-5中A类最重要的地物类型,即A比B和C类更为重要,则栅格单元的代码应为A。重要性法常用于具有特殊意义而面积较小的地理要素,特别是点、线状地理要素,如城镇、交通枢纽、交通线、河流水系等,在栅格中代码应尽量表示这些重要地物。2.栅格数据结构及其编码2.2.4百分比法根据矩形区域内各地理要素所占面积的百分比数确定栅格单元的代码,如可记面积最大的两类BA,也可以根据B类和A类所占面积百分比数在代码中加入数字。2.栅格数据结构及其编码2.3编码方法2.3.1直接栅格编码直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码,可以每行都从左到右逐个象元记录,也可以奇数行地从左到右而偶数行地从右向左记录,为了特定目的还可采用其他特殊的顺序(图7-6)。2.栅格数据结构及其编码

图7-6:一些常用的栅格排列顺序2.栅格数据结构及其编码2.3.2压缩编码方法目前有一系列栅格数据压缩编码方法,如键码、游程长度编码、块码和四叉树编码等。其目的,就是用尽可能少的数据量记录尽可能多的信息,其类型又有信息无损编码和信息有损编码之分。2.栅格数据结构及其编码1)链码(ChainCodes)链码又称为弗里曼链码[Freeman]或边界链码,优点,链码可以有效地压缩栅格数据,而且对于估算面积、长度、转折方向的凹凸度等运算十分方便,比较适合于存储图形数据。缺点是对边界进行合并和插入等修改编辑工作比较困难,对局部的修改将改变整体结构,效率较低,而且由于链码以每个区域为单位存储边界,相邻区域的边界将被重复存储而产生冗余。2.栅格数据结构及其编码2)游程长度编码游程长度编码是栅格数据压缩的重要编码方法,它的基本思路是:对于一幅栅格图像,常常有行(或列)方向上相邻的若干点具有相同的属性代码,因而可采取某种方法压缩那些重复的记录内容。2.栅格数据结构及其编码3)块码块码是游程长度编码扩展到二维的情况,采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格,数据结构由初始位置(行、列号)和半径,再加上记录单位的代码组成。2.栅格数据结构及其编码4)四叉树四叉树又称四元树或四分树,是最有效的栅格数据压缩编码方法之一,绝大部分图形操作和运算都可以直接在四叉树结构上实现,因此四叉树编码既压缩了数据量,又可大大提高图形操作的效率。四叉树将整个图像区逐步分解为一系列被单一类型区域内含的方形区域,最小的方形区域为一个栅格象元,分割的原则是,将图像区域划分为四个大小相同的象限,而每个象限又可根据一定规则判断是否继续等分为次一层的四个象限,其终止判据是,不管是哪一层上的象限,只要划分到仅代表一种地物或符合既定要求的少数几种地物时,则不再继续划分,否则一直划分到单个栅格象元为止。2.栅格数据结构及其编码(a)块码分割(b)四叉树分割2.栅格数据结构及其编码

(c)b的四叉树编码

图7-7:四叉树编码2.栅格数据结构及其编码四叉树编码具有可变的分辨率,并且有区域性质,压缩数据灵活,许多运算可以在编码数据上直接实现,大大地提高了运算效率,是优秀的栅格压缩编码之一。2.栅格数据结构及其编码3.矢量数据结构及其编码3.1矢量数据结构3.1.1定义矢量结构,即通过记录坐标的方式尽可能精确地表示点、线、多边形等地理实体,坐标空间设为连续,允许任意位置、长度和面积的精确定义。3.1.2特点矢量结构的特点是:定位明显、属性隐含,其定位是根据坐标直接存储的,而属性则一般存于文件头或数据结构中某些特定的位置上。3.矢量数据结构及其编码这种特点使得其图形运算的算法总体上比栅格数据结构复杂的多,有些甚至难以实现,当然有些地方也有所便利和独到之处,在计算长度、面积、形状和图形编辑、几何变换操作中,矢量结构有很高的效率和精度,而在叠加运算、邻域搜索等操作时则比较困难。3.矢量数据结构及其编码3.2编码方法3.2.1点实体3.2.2线实体

图7-8:(a)点实体的编码,(b)线实体的编码3.矢量数据结构及其编码3.2.3多边形1)坐标序列法(Spaghetti方式)图7-9:坐标序列法表示的多边形3.矢量数据结构及其编码坐标序列法文件结构简单,易于实现以多边形为单位的运算和显示。这种方法的缺点是:(1.1)多边形之间的公共边界被数字化和存储两次,由此产生冗余和碎屑多边形;(1.2)每个多边形自成体系而缺少邻域信息,难以进行邻域处理,如消除某两个多边形之间的共同边界;(1.3)岛只作为一个单个的图形建造,没有与外包多边形的联系;(1.4)不易检查拓扑错误。这种方法可用于简单的粗精度制图系统中。3.矢量数据结构及其编码2)树状索引编码法该法采用树状索引以减少数据冗余并间接增加邻域信息,方法是对所有边界点进行数字化,将坐标对以顺序方式存储,由点索引与边界线号相联系,以线索引与各多边形相联系,形成树状索引结构。

图7-10:线与多边形之间的树状索引3.矢量数据结构及其编码

图7-11:点与边界线之间的树状索引3.矢量数据结构及其编码3)拓扑结构编码法要彻底解决邻域和岛状信息处理问题必须建立一个完整的拓扑关系结构,这种结构应包括以下内容:唯一标识,多边形标识,外包多边形指针,邻接多边形指针,边界链接,范围(最大和最小x、y坐标值)。采用拓扑结构编码可以较好地解决空间关系查询等问题,但增加了算法的复杂性和数据库的大小。3.矢量数据结构及其编码矢量编码最重要的是信息的完整性和运算的灵活性,这是由矢量结构自身的特点所决定的,目前并无统一的最佳的矢量结构编码方法,在具体工作中应根据数据的特点和任务的要求而灵活设计。3.矢量数据结构及其编码4.矢栅结构的比较及转换算法4.1栅格结构与矢量结构的比较栅格结构与矢量结构似乎是两种截然不同的空间数据结构,栅格结构“属性明显、位置隐含”,而矢量结构“位置明显、属性隐含”,栅格数据操作总的来说比较容易实现,尤其是作为斑块图件的表示更易于为人们接受;而矢量数据操作则比较复杂,许多分析操作(如两张地图的覆盖操作,点或线状地物的邻域搜索等)用矢量结构实现十分困难,矢量结构表达线状地物是比较直观的,而面状地物则是通过对边界的描述而表达。4.矢栅结构的比较及转换算法无论哪种结构,数据精度和数据量都是一对矛盾,要提高精度,栅格结构需要更多的栅格单元,而矢量结构则需记录更多的线段结点。一般来说,栅格结构只是矢量结构在某种程度上的一种近似,如果要使栅格结构描述的图件取得与矢量结构同样的精度,甚至仅仅在量值上接近,则数据也要比后者大得多。

表7-2:矢量格式与栅格格式的比较4.矢栅结构的比较及转换算法4.2相互转换算法矢量结构与网格结构的相互转换,是地理信息系统的基本功能之一,目前已经发展了许多高效的转换算法;但是,从栅格数据到矢量数据的转换,特别是扫描图像的自动识别,仍然是目前研究的重点。4.矢栅结构的比较及转换算法点状实体,每个实体仅由一个坐标对表示,其矢量结构和栅格结构的相互转换基本上只是坐标精度变换问题,不存在太大的技术问题。线实体的矢量结构由一系列坐标对表示,在变为栅格结构时,除把序列中坐标对变为栅格行列坐标外,还需根据栅格精度要求,在坐标点之间插满一系列栅格点,这也容易由两点式直线方程得到。线实体由栅格结构变为矢量结构与将多边形边界表示为矢量结构相似,因此以下重点讨论多边形(面实体)的矢量结构与栅格结构相互转换。4.矢栅结构的比较及转换算法4.2.1矢量格式向栅格格式的转换矢量格式向栅格格式转换又称为多边形填充,就是在矢量表示的多边形边界内部的所有栅格点上赋以相应的多边形编码,从而形成类似图7-4的栅格数据阵列。几种主要的算法描述如下:4.矢栅结构的比较及转换算法1)内部点扩散算法该算法由每个多边形一个内部点(种子点)开始,向其八个方向的邻点扩散,判断各个新加入点是否在多边形边界上,如果是边界上,则该新加入点不作为种子点,否则把非边界点的邻点作为新的种子点与原有种子点一起进行新的扩散运算,并将该种子点赋以该多边形的编号。重复上述过程直到所有种子点填满该多边形并遇到边界停止为止。扩散算法程序设计比较复杂,并且在一定的栅格精度上,如果复杂图形的同一多边形的两条边界落在同一个或相邻的两个栅格内,会造成多边形不连通,这样一个种子点不能完成整个多边形的填充。4.矢栅结构的比较及转换算法2)复数积分算法对全部栅格阵列逐个栅格单元地判断该栅格归属的多边形编码,判别方法是由待判点对每个多边形的封闭边界计算复数积分,对某个多边形,如果积分值为2

r,则该待判点属于此多边形,赋以多边形编号,否则在此多边形外部,不属于该多边形。4.矢栅结构的比较及转换算法3)射线算法和扫描算法射线算法可逐点判断数据栅格点在某多边形之外或在多边形内,由待判点向图外某点引射线,判断该射线与某多边形所有边界相交的总次数,如相交偶数次,则待判点在该多边形外部,如为奇数次,则待判点在该多边形内部(图7-12)。采用射线算法,要注意的是:射线与多边形边界相交时,有一些特殊情况会影响交点的个数,必须予以排除(图7-13)。4.矢栅结构的比较及转换算法扫描算法是射线算法的改进,将射线改为沿栅格阵列列或行方向扫描线,判断与射线算法相似。扫描算法省去了计算射线与多边形边界交点的大量运算,大大提高了效率。

图7-12:射线算法4.矢栅结构的比较及转换算法

图7-13:射线算法的特殊情况4.矢栅结构的比较及转换算法4)边界代数算法边界代数多边形填充算法是一种基于积分思想的矢量格式向栅格格式转换算法,它适合于记录拓扑关系的多边形矢量数据转换为栅格结构。图7-15表示转换单个多边形的情况,多边形编号为a,模仿积分求多边形区域面积的过程,初始化的栅格阵列各栅格值为零,以栅格行列为参考坐标轴,由多边形边界上某点开始顺时针搜索边界线,当边界上行时(图7-15-a),位于该边界左侧的具有相同行坐标的所有栅格被减去a;当边界下行时(图7-15-b),该边界左边(前进方向看为右侧)所有栅格点加一个值a,边界搜索完毕则完成了多边形的转换。4.矢栅结构的比较及转换算法

图7-15:单个多边形的转换4.矢栅结构的比较及转换算法

图7-16:多个多边形的转换4.矢栅结构的比较及转换算法边界代数法与前述其他算法的不同之处,在于它不是逐点判断与边界的关系完成转换,而是根据边界的拓扑信息,通过简单的加减代数运算将边界位置信息动态地赋给各栅格点,实现了矢量格式到栅格格式的高速转换,而不需要考虑边界与搜索轨迹之间的关系,因此算法简单、可靠性好,各边界弧段只被搜索一次,避免了重复计算。4.矢栅结构的比较及转换算法4.2.2栅格格式向矢量格式的转换多边形栅格格式向矢量格式转换就是提取以相同的编号的栅格集合表示的多边形区域的边界和边界的拓扑关系,并表示由多个小直线段组成的矢量格式边界线的过程。4.矢栅结构的比较及转换算法1)转换步骤栅格格式向矢量格式转换包括以下四个步骤:(1.1)多边形边界提取(1.2)边界线追踪(1.3)拓扑关系生成(1.4)去除多余点及曲线圆滑4.矢栅结构的比较及转换算法2)多边形栅格转矢量的双边界搜索算法算法的基本思想是通过边界提取,将左右多边形信息保存在边界点上,每条边界弧段由两个并行的边界链组成,分别记录该边界弧段的左右多边形编号。边界线搜索采用2*2栅格窗口,在每个窗口内的四个栅格数据的模式,可以唯一地确定下一个窗口的搜索方向和该弧段的拓扑关系,极大地加快了搜索速度,拓扑关系也很容易建立。4.矢栅结构的比较及转换算法具体步骤如下:(2.1)边界点和结点提取(2.2)边界线搜索与左右多边形信息记录(2.3)多余点去除4.矢栅结构的比较及转换算法5.空间索引机制5.1索引概念空间索引就是指依据空间对象的位置和形状或空间对象之间的某种空间关系按一定的顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。5.2索引类型5.2.1格网型空间索引格网型空间索引思路比较简单了,容易理解和实现。其基本思想是将研究区域用横竖线条划分大小相等和不等的格网,记录每一个格网所包含的空间实体。当用户进行空间查询时,首先计算出用户查询对象所在格网,然后再在该网格中快速查询所选空间实体,这样一来就大大地加速了空间索引的查询速度。5.空间索引机制5.2.2BSP树空间索引BSP树是一种二叉树,它将空间逐级进行一分为二的划分(图7-19)。BSP树能很好地与空间数据库中空间对象的分布情况相适应,但对一般情况而言,BSP树深度较大,对各种操作均有不利影响。5.空间索引机制

图7-19:BSP树5.空间索引机制5.2.3KDB树空间索引KDB树是B树向多维空间的一种发展。它对于多维空间中的点进行索引具有较好的动态特性,删除和增加空间点对象也可以很方便地实现;其缺点是不直接支持占据一定空间范围的地物要素,如二维空间中的线和面。5.空间索引机制5.2.4R树和R+树R树根据地物的最小外包矩形建立(图7-20),可以直接对空间中占据一定范围的空间对象进行索引。R树的每一个结点N都对应着磁盘页D(N)和区域I(N),如果结点不是叶结点,则该结点的所有子结点的区域都在区域I(N)的范围之内,而且存储在磁盘页D(N)中;如果结点是叶结点,那么磁盘页D(N)中存储的将是区域

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论