第2讲-空间数据组织与计算机表达_第1页
第2讲-空间数据组织与计算机表达_第2页
第2讲-空间数据组织与计算机表达_第3页
第2讲-空间数据组织与计算机表达_第4页
第2讲-空间数据组织与计算机表达_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2讲空间数据组织与计算机表达从本讲起,我们将从各方面具体地探讨地理信息系统。本讲首先讨论,GIS怎样在计算机里组织地理空间数据,以表达地理空间事物和现象。这是学习后面章节的基础。本讲内容如下:第一节从地理空间对象到计算机世界第二节矢量空间数据模型及结构第三节栅格空间数据模型及结构第四节基于两种数据结构的进一步讨论第一节从地理空间对象到计算机世界一、从现实世界到计算机世界本小节简介利用计算机模拟现实世界中事物或现象的一般概念,帮助读者理解GIS常用的“空间数据模型”和“空间数据结构”等概念。现实世界计算机世界1、模型与概念模型客观世界无限丰富多彩,任何研究都必须将所关注的局部世界加以简化和抽象。对现实世界的抽象和简化表达,通常称为模型。模型的详尽程度不尽相同。通常把对现实世界的第一层简化和抽象,为概念模型。概念模型给出所研究的主要事物的概念及其相互联系的框架。在计算机应用以前的自然科学中,人们在概念模型的基础上,建立数学模型,进行基于解析表达式或数学方程的计算。面对人面对计算机从现实世界到计算机世界的转化过程,可以大体分为:

概念模型、数据模型、数据结构和文件格式四个主要层次。a=6378137m

b=6356752.3m

或a=6378137m

1/f=298.25763781376356752.32、数据模型

数据模型(datamodel)的概念主要来自于计算机科学的数据库系统理论。数据库是为现实世界的一部分(用户单位)服务的。为此,数据库技术首先借助概念模型,把握用户世界中的实体及其相互联系的概念框架。概念模型按平常人的思维方式建立,以方便用户理解和交流,不依赖于具体的计算机系统。为了具体地定义和操作数据库中数据,指导计算机运作,还要将概念模型转化为数据模型(图2—1)。数据模型通常由三要素组成:数据结构、数据操作和完整性约束条件。其中最基本的要素是数据结构。3、数据结构数据结构具体指同一类数据元素中各元素之间的相互关系,包括三个组分:数据的逻辑结构,数据的存储结构和数据的运算。数据的逻辑结构是对数据之间逻辑关系的描述,有时也简称为数据结构;数据的存储结构又称为物理结构,是数据的逻辑结构在计算机存储器中的实现;数据的运算是在数据的逻辑结构上定义的、物理结构上实现的操作算法。例如,数据间的逻辑结构可能是线性结构(结点间是一对一的关系)、树形结构(一对多关系)和网状结构(多对多关系)等,可采用顺序、链接、索引或散列等存储方法,并定义和实施检索、插入、删除、更新、排序等操作算法。数据结构和数据库系统做的都是计算机数据的组织工作。但是,数据结构的工作更“基层”一些,且不涉及具体的用户;而数据库系统涉及较大数据集合的组织和管理,其应用与具体用户有关,因而涉及到模拟、表达客观世界局部的问题。数据结构有时就称为数据组织,而数据库系统到达“数据管理”的层次。4、文件格式

数据结构处理数据元素关系和操作的共性。在相同的数据结构下,不同软件厂商或数据生产者,还会采取不同的具体形式来组织、存储数据,即采取不同的文件格式。例如,图像结构的数据就有TIF、BMP和JEG等数十种文件格式。文件格式涉及到更具体、实际的数据组织问题,这也是地理信息系统在组织和运作地理空间数据时必须处理好的一个环节。二、GIS中地理空间数据组织的主要对象从地理空间现实到计算机世界,一般有概念模型、数据模型、数据结构和文件格式几个层次。这个过程也称地理空间数据建模。本小节主要从概念模型的层次上,讨论地理空间数据建模的研究对象和表达对象。注意,地理空间是人类生活的空间,现有的大量学科,包括地球科学各分支和地球科学以外的其他学科,绝大部分的研究对象实际上都是地球表层空间中的事物和现象,因此,不确切地说,地理信息科学的数据建模对象是地表空间现象或事物。地理信息科学只能从自己特定的视角对地理空间实体进行数据建模和研究。1、数值计算领域的地理空间数据组织地理信息科学的数据建模,主要是对非数值计算领域而言的。事实上,同一般数据一样,地理空间数据的组织和处理,在数值计算和非数值计算领域中也有明显不同。在地球科学中的一些领域,人们抽象出用方程表达的数学模型,设计解方程的计算机算法,编出程序,求得结果,从而得知物理量怎样因空间位置而异,怎样随时间而变化:

求解的物理量(即属性)=f(x,y,z,t)这里,(x,y,z)表示地理空间位置,t表示时间。在数值计算领域,地理空间数据依据方程的要求而组织,结构相对简单。地球科学中需要进行数值计算的,主要有两类方程。一类是数理统计方程,另一类是数学物理方程。在地学实际研究工作中,还常常既采用数学物理方程,又采用数理统计方程,借助于计算机,各尽其用,达到解决问题的目的。利用计算机求解方程的数值计算,在很多涉及地理空间数据运作的地球科学和其他学科中,发挥着重要的作用。2、GIS所抽象、表达的地理事物和现象

GIS怎样组织数据以模拟地理事物和现象呢?

地球表层物质和运动极其复杂,不难理解,为了用计算机研究没有方程表达的地理事物和现象的时空分布、组合和发展变化,地理信息科学首先必须把所关注的地物抽取出来,并加以简化、抽象,建立概念模型,以便计算机表达各种地理事物或实体的空间位置、形状和属性,以及它们之间的空间相互关系和其他相互联系。

我们将GIS所抽象、表达的地理事物和现象,称为空间对象;空间对象的位置相互关系,称为空间关系。以上例可见,为了表达空间对象及其空间关系,我们还必须用几何手段去描述空间对象本身的形状及其所占的空间位置。同时,用属性数据去说明空间对象及它们之间的空间关系和其他相互联系。这就是GIS数据建模的主要对象。地理空间数据组织方式数值计算方式枚举方式数理方程按对象枚举按空间区块枚举矢量数据栅格数据三、空间对象和空间关系1、空间对象一部分空间对象本身的大小在研究中可以忽略,因而可以用一个点来表示;另一些具有不可忽略的空间延展性,它们需要用线、面、体或体表面来表示。这里,体或体表面指三维的空间形体,体具有不等于零的体积;而面在GIS中,请特别注意,一般指平面地图上之区域(英文常用area),或者围成区域的闭合曲线,即多边形(polygon)。之所以称为多边形,是因为地理信息系统中的曲线,实际上是由很多足够小的线段组成的(荧屏上放大时,曲线的局部都表现为折线),看上去的闭合曲线实质上是很多小线段首尾相连形成的多边形。总之,空间对象可以采取零维(点)、一维(线)、二维(面)和三维(体或三维曲面)等不同空间维数的几何形体来表达。从这个角度,空间对象可分为点状、线状、面状和体状空间对象。除空间维数特性外,空间对象还可以从其复杂性、规则性、人为性等角度认识或区分。矢量本身是数学上的概念,运用到地理信息系统中,则不同的空间特征具有不同的矢量维数。矢量表达法集中表现了地理实体的形状特征以及不同实体之间的空间关系分布。0维矢量----各种各样的点类

0维矢量即空间中的一个点。点在二维欧氏空间中用唯一的实数对(x,y)来表示,在三维欧氏空间中用唯一的数组(x,y,z)来表示。在数学上,点没有大小、方向。1维矢量------各种各样的线类一维矢量表示空间中的一个线划要素,或者空间对象之间的边界,亦称为弧段、链。在二维欧氏空间中用一组离散化实数点对来表示:(x1,y1),(x2,y2),(x3,y3),……,(xn,yn)n>1在三维空间中则表示为:

(x1,y1,z1),(x2,y2,z2),(x3,y3,z3),……,(xn,yn,zn)其中(x1,y1)或(x1,y1,z1)是起始点,(xn,yn)或(xn,yn,zn)是终止点。2维矢量------各种各样的面类二维矢量表示空间的一个面状要素,在二维欧氏平面上是指由一组闭合弧段所包围的空间区域。由于面状要素是由闭合的弧段所界定的,故二维矢量又称为多边形。二维矢量的特征参数:面积、凸凹性、单调性、走向、倾角和倾向在三维欧氏空间中表达的二维矢量,就是指空间曲面。表示非常复杂,实现的方法多种多样。一种就是等高线表示法。第二种为剖面表示法。3维矢量:指三维空间中的实体,也就是由一组或多组闭合曲面所包围的空间对象。2、空间关系空间关系是指地理空间实体对象之间的空间相互作用关系。空间关系通常分为三大类:拓扑空间关系、顺序空间关系和度量空间关系(1)拓扑空间关系(Topologicalspatialrelations):用来描述空间实体之间的相邻、包含和相交等空间关系拓扑空间关系在地理信息系统和空间数据库的研究与应用中具有十分重要的意义。拓扑空间关系的形式化描述是建立在点集拓扑理论基础上的。这里我们详细介绍各种空间目标的拓扑空间关系,包括面-面、面-点、面-线、线-线、线-点、点-点等多种形式上的空间关系,而每一种形式的空间关系又包含更多的子形式。拓扑空间关系Topolgy一词来自于希腊文,它的原意是“形状的研究”。拓扑特性指在拓扑变换(任意伸缩或变形,但不扭结或折叠)下能够保持不变的几何属性。地理空间关系的研究所特别关注的几个重要拓扑特性是连接性、包含和邻接性。●连接性(Connectivity):弧段在结点处的相互联接关系弧段与结点的拓扑关系(arc-nodetopology)表现了连接性。每个弧段都有一个起始端点和一个终止端点,从起始端点到终止端点表示了弧段的方向,而所有弧段的端点序列则定义了弧段与结点的拓扑关系,计算机就是通过在端点序列中找到弧段之间的共同结点来判断弧段与弧段之间是否存在连接性。多边形区域定义(areadefination):多个弧段首尾相连构成了多边形的内部域。多边形与弧段的拓扑关系(polygon-arctopology)表现了多边形区域定义。在矢量模型中,多边形区域是由一系列弧段序列组成的。如下图所示,多边形F是由弧段7,8,9,10组成其中弧段7形成了多边形的内岛。●邻接性(Contiguity):通过定义弧段的左右边及其方向性来判断弧段左右多边形的邻接性。弧段的左与右的拓扑关系(Left-RightTopology)表现了邻接性。一个具有方向性的弧段,沿弧段方向有左边和右边之分。计算机依据弧段的左边与右边的关系来判断位于该弧段两边多边形的邻接性。图中B多边形和C多边形分别在弧段6的左边和右边,具有邻接性。●包含关系(Containment):是指空间图形中,面状实体中所包含的其它面状实体或线状、点状实体的关系。面状实体中包含面状实体可分三种情况:简单包含、多层包含和等价包含包含关系可通过计算判别通过计算点对多边形各个边的夹角,即可判断点是否位于多边形内。若折线的所有端点都位于某一多边形内,则该折线完全包含于该多边形内;同理可判断区与区的包含关系。●弧段方向性:基于结点一弧段一多边形(node-arc-polgyon)的拓扑分析,描述了空间实体之间的连接性和邻接性。但是,它对于两种不同的空间配置仍有可能给出相同的拓扑关系描述,组合图理论解决了这一空间配置的二意性组织问题。为解决组合图问题,定义由结点和弧段形成的组合图边界网络遵守如下规则:弧段具有方向性,若沿着弧段运动时,由弧段组成的多边形对象总是位于弧段的右边,弧段的这一运动方向就是弧段的正方向;当弧段运动至某个结点时,以结点为轴按反时针方向旋转,选取尚未走过的弧段正方向离开结点的几个弧段中的第一个弧段;由上规则跟踪完所有弧段为止。(2)顺序空间关系(orderspatialrelationship):描述空间实体之间在空间上的排列次序,如实体之间的前后、左右和东、南、西、北等方位关系与拓扑空间关系相比,顺序空间关系的研究目前尚未尽如人意。我们常用上下左右、前后左右、东南西北等方向性名词来描述空间实体间的顺序关系。同拓扑空间关系的形式化描述方式类似,也可以按面-面、面-点、面-线、线-线、线-点、点-点等多种组合方式来考虑不同类型的空间实体间的顺序空间关系。计算点状空间实体之间的顺序空间关系比较容易,只要计算两点连线与某一基准方向的夹角即可。同样在计算点状空间实体和线状空间实体、点状和面状空间实体的顺序空产关系时,只需将线状和面状空间实体视为由它们的中心所表成的点状实体,然后转化为求点状实体间的顺序空间关系,所不同的是要计算点状实体是否落入面状或线状实体之中(如果是这种情况,则不考虑顺序空间关系)。

在计算线状空间实体之间以及线状和面状、面状空间实体之间的顺序空间关系时,情况就变得相当复杂。当空间实体之间的距离很大时,此时实体的大小和形状对它们之间的顺序空间关系没有影响,则可将其转化为点,其顺序空间关系也就转化为其中心点之间的顺序空间关系。但是当它们之间距离较小并且其外接多边形尚未相交时,算法变的非常复杂,目前还没有很好的解决办法。(3)度量空间关系(Metricspatialrelationship):用于描述空间实体之间的距离等关系度量空间关系主要是指空间对象之间的距离关系。用以定量地描述特定空间中的某种距离,如A实体距离B实体200m,也可用与距离概念相关的术语,如远近等进行定性地描述。四、有关地理空间数据结构和模型学习的几点总体说明1、关于属性数据的组织地理空间数据包括大量的属性数据。属性数据可分为两类:一类是说明空间对象本身性质的数据,大部分属性数据属于此类。这一类属性数据的组织有一个基本要求,就是要保证它们能与相应的空间对象相挂联。另一类属性数据说明其他的附加信息,如分折统计结果以及为输入输出服务的数据等,它们并不一定属于某一个具体的空间对象。属性数据可以采取数字和文字等形式。数字形式的属性数据在计算机中很容易组织;文字形式的属性数据,特别当其较长时,计算机处理就不甚方便。为此,文字形式的属性数据常常被转化为数字形式来处理。一种最常见的例子是建立各种分类系统的“编码系统”,即用一系列数字来代表文字类型。例如,在土地资源管理信息系统中,“土地利用现状”是一种基本的属性;每一地块的“土地利用现状”属性值,必须按照国家的土地利用现状分类系统来取定。在该分类系统中,国家不仅给出每一种土地类的名称和详细定义,还规定了每一种分类的标准编码,以方便于计算机运作。2、GIS可视化要求和传统美术的两种基本技法可视化是GIS的基本要求,地理学及地图学是人类科学可视化的先驱领域,而地理信息系统从很大程度上说是地图学的延伸。空间数据建模既然要求可视化,即利用图形图像手段来表现地理空间现象和事物,那么,它就必然与美术有相通之处。美术主要是在二维平面上表现周围的三维世界。在表现的基本思路上,可归结为两种类型:其一可称为涂抹方式,油画、水粉画和摄影作品是其典型的例子。这种技法试图表现所观察到的世界的每个细部。---空间枚举另一种技法可称为线条方式,如卡通画、连环画、漫画和中国画中的工笔画:这种技法重在表现画家所关注的空间实体(包括其组成部分)的线条,而忽略线条以外的其他世界。---对象枚举3、两种基本空间数据模型或结构,及其与计算机图形图像的关系空间数据模型经多年研究发展,虽已有较丰富内容,但其中两种最常用最基本的模型,即二维平面上的矢量数据模型和栅格数据模型,以及基于这两种模型的矢量型GIS技术和栅格型GIS技术,分别与上述两种美术技法对应。在本章下面几节中将看到,矢量数据模型或矢量GIS技术对应于线条方式的美术技法,它只表现主要空间实体及其组成部分的轮廓线条;而栅格数据模型或栅格GIS技术对应于涂抹方式的美术技法,它将整个画面分为规整网格,并通过每个网格单元的明暗或色调来表现空间实体的界限和形态。

在计算机科学技术中,也有两个分支采用上述两种基本思路进行可视化表达。一种相当于线条方式的美术技法,称为计算机图形学(graphics)或技术;另一种相当于涂抹方式的美术技法,称为图像处理(imageprocessing)。由于可视化表达的需要,GIS与生俱来就与计算机图形图像处理技术结下不解之缘。GIS不等同于图形图像技术,因为可视化并非GIS的全部,GIS还要应用数据库等其他的计算机技术,来处理大量属性数据及其与空间位置特征的挂联问题,以进行空间分析,提取信息,获取知识等。第二节矢量空间数据模型及结构一、矢量空间数据模型建立在二维平面上的矢量数据模型是目前GIS领域应用最广泛的、与传统地图表达最为接近的空间数据模型。矢量模型采用点、线和多边形(闭合的线)来刻画所关注的空间对象的轮廓、空间位置及其几何关系,同时组织好属性数据,以便与空间特征数据共同描述地理事物及其相互联系。为了用计算机来实现这种表达,矢量数据模型通常包括下述构成成分(图2—4):12341、二维空间坐标系建立在平面上的二维坐标系是表达空间对象的形状和空间位置的基础。GIS矢量数据模型中的二维空间坐标系可以是普通的平面坐标系,也可以是实际地表上的大地或地理坐标系。采用普通坐标系的地图也可以表达地物之间的相对布局,但归根结底还是要转换到地理坐标系中。基于平面坐标系,矢量数据模型利用位置坐标(x,y)或者其组合来表达点状、线状和面状(多边形)空间对象的形状、位置和它们之间的空间几何关系。矢量数据模型中的坐标,原则上可任意取值,在精(密)度上也没有限制,这一点与必须等间隔取坐标值的栅格数据模型不同。

空间坐标(x,y)数据及其组合,称为几何数据。我们说过,地理空间数据是空间特征(或位置)数据与属性数据之和。这里的几何数据,就是空间特征数据的主要表现形式(少部分空间位置特征,如拓扑特征等也用属性数据来描述)。空间坐标(x,y)是易于在计算机中运作的数据。2、几何数据也称图形数据。在矢量数据模型中,模拟点状、线状和面状空间对象之形状、位置及其位置关系的几何数据分别组织如下:●对于本身的大小在研究中可以忽略的空间对象,用一个几何点坐标(x,y)来表达之。●对于本身宽度在研究中可以忽略的空间对象,用一串有序点的坐标(x1,y1),(x2,y2),(x3,y3),...,(xn,yn)来表达之。线状空间对象在输出设备上输出时,按顺序用线段连接相邻各点,即可可视化地表现一条线。只要相邻点的密度足够高,就可以满意地模拟任意形状的曲线。●对于面状空间对象(区域),用首尾相连的一连串点坐标

(x1,y1),(x2,y2),…,(xi,yi),…,(xn,yn),(x1,y1)来表现其边界轮廓。面状对象同线状对象一样,也是用一串坐标来描述之;但不同的是,这一串坐标的首尾是同一点坐标(x1,y1),输出时表现为一闭合的线----多边形。3、属性数据属性数据通常用关系表的形式来组织。属性数据可分为“基本属性数据”和“说明数据”两种类别。大多数属性数据都是基本属性数据。基本属性数据中,多数又是描述空间对象本身各种性质的数据,还有一些是描述某些空间位置关系和进一层空间关系的数据。注意,空间位置关系虽然主要靠几何数据及其可视化来表达,但有时也需要用属性数据来描述,如一些拓扑特征等。进一层空间关系指基于位置关系的,空间对象间的其他内在联系,例如1.4.1.4中的空间结构特征等。说明数据是除基本属性数据外,为GIS组织或运作服务的属性数据。例如,一种典型的说明数据是描述空间对象的输出符号和注记的数据。正如传统地图一样,矢量数据模型的GIS在输出时,要用符号和注记来可视化地表现空间对象的主要属性特征。如干道用较粗的红线,乡村小道用细红线等。区域或面状对象则可以填充不同朗图案和色彩、此外,点、线、面空间对象还需要文字注记,如河流线旁标注“黄河”等。显然,为了矢量模型的GIS系统能在具体点、线、面上赋予正确的符号和注记,必须给出相应的说明数据。几何数据属性数据按属性数据方式组织4、唯一标识符

矢量数据模型中几何数据和属性数据常分别储存。为了保证地理对象的空间特征数据与属性数据之间的一一对应的挂联关系,必须对所有点、线和多边形赋予唯一的标识符或标识码(identifier,ID)。一种常用的方法是,为每一点、线和多边形编号(唯一序号),并用之作为标识符,例如,将某条线编为第9条线,“9”就是这条线及其属性的标识码;将某条多边形编为第12号多边形,“12”就是这个多边形及其属性的标识码等。基于唯一标识符的链接在计算机中可以通过指针等方式来实现。以上四种成分构成了GIS的矢量空间数据模型的一般内容。地理属性数据及其通过唯一标识符与几何数据的挂联关系,以及地理坐标转换,是一般计算机图形处理所没有的GIS的特色内容。在矢量数据模型这个总框架下,还有不同的矢量数据组织方式,或不同的数据结构。下面将给出几种有代表性的数据结构,它们不仅有实用意义,而且有利于理解基本概念。二、有代表性的矢量空间数据结构1、Spaghetti结构,即实体型数据结构早期的GIS软件,以及现在的一些桌面绘图或制图系统常采用这种结构。Spaghetti结构主要面向多边形来组织数据,并将多边形边界看做是线的简单闭合;不从属于任何多边形的线和点才另外组织。因此,这种方法有时称为环状多边形数据结构。空间点用(x,y)或(x,y,z)坐标对表示;线用两个或两个以上有序坐标对表示;面由一条或多条首尾相连的线(或弧段)组成。点:(X,Y)或

(X,Y,Z)----三维线:(X1,Y1),(X2,Y2),......,(Xn,Yn)n>=2面:(X1,Y1),(X2,Y2),......,(Xn,Yn),(X1,Y1)n>=3特点:直观、简单,实体数据自成一体,拓扑关系隐含;公共边界两次存储,数据冗余,不一致;不能显式表达实体间的拓扑关系;不能表示含岛(孔洞)的复杂多边形2、索引编码结构实体型结构的改进型。先对所有边界点坐标按顺序建立点坐标文件,再建立多边形---弧段索引文件、弧段---点索引文件。特点:简单,所有点坐标只需存贮一次,减少数据冗余和不一致;增加了两个索引文件,拓扑关系不明朗;不能显式表达实体间的拓扑关系;不能表示含岛(孔洞)的复杂多边形3、拓扑空间数据结构拓扑空间数据结构是目前较完备的矢量数据结构,其数据组织的要点如下:●线(line或arc)由结点(node)定义,结点或者是一条线的尽端,或者是线的交点,包括一条线自身闭合时的交点。这就与Spaghetti结构有明显不同。●每个多边形由一个外环,以及零个或多个内环组成。●线是有方向的,在线的数据中,按线的方向,列出包含组成它的结点和所有中间点的坐标序列。●多边形的数据只记录围成它的若干条线的线号,而不再列出其边界坐标串;但是,每个多边形内部设置一个唯一的标签(label),标签点的坐标含在多边形的数据中;多边形的属性数据将挂联到该标签上。●独立点状地物的数据(点坐标和其属性数据)单独组织。●点、线和多边形之间的拓扑关系用若干属性数据来描述。4、拓扑关系及其表达拓扑矢量数据结构中表达的拓扑关系主要有三种。●线拓扑。线拓外体现线与其结点的联结关系,和以其为公共边的两个多边形的邻接关系。数据组织的一般形式是:在一条线的数据中,列出该条线的“起始结点”和“终结点”的序号,以表现该线与其结点的联结关系;另方面,列出该条线左面的多边形和右多边形的序号,以表现该两个多边形在这条线两侧的邻接关系,这里,左和右是从该线方向看去的左和右。拓扑矢量数据结构中“线的方向”之意义:线没有方向,就谈不上起始结点和终结点,也不能确定左多边形和右多边形;线没有方向,更谈不上是“矢量”。●结点拓扑。表现在该结点上的各线的联结关系。数据组织的常用形式是,在一个点的数据中,给出交于该点的各条线的线号;同时,在线序号前加正负号,以表示该条线是起始于此,还是终止于此。●多边形拓扑。表现多边形与围成其边界的诸线条的构成关系,也能表现多边形之间的包含关系,即“岛”关系(如果有的话)。数据组织的常用形式是,在一个多边形数据中,列出构成其边界的各条线的序号。例如图2—5中,V号多边形是II号多边形所包含的“岛”;围成V号多边形的是7号线,围成II号多边形的各条线的序号是1、3、6、9和10(外环),以及7号(内环)。内、外环关系还可用某些专门编码来标识。此外,多边形拓扑常在线序号前加上正负号,以表示该条线围绕该多边形是顺时针还是反时针方向。特点:拓扑信息(空间关系)明确定义;空间查询方便;消除数据冗余;建立拓扑关系需时间、空间、工作量;简单操作相对慢拓扑编码的弧段坐标文件拓扑编码的节点文件拓扑编码的弧段文件

拓扑编码的多边形文件三、不同格式的拓扑结构数据实例1、不同格式的拓扑结构数据国际上采用拓扑数据结构比较有名的软件有美国ESRI公司(EnvironmentalSystemResearchInstitute,Inc.)的Arc/Info软件和Intergraph公司的MGE(ModuleGISEnvironment)软件等;比较有名的拓扑数据供应商有美国人口调查局(CensusBureau)和美国地质测量所USGS(U.S.GeologicalSurvey,有时也译为调查局)。美国人口调查局建立的双重独立地图编码系统DIME(DualIndependentMapEncoding)是世界上最早的拓扑数据,其提供的人口调查数据(TIGER)成为很多社会科学研究的基础。大多数GIS书籍都有关于DIME和TIGER的介绍,读者很容易找到并参阅之。

USGS是美国地形图的主要提供者,它所提供的数字产品中有一种常称为DLG(digitalLinegraphics,译为数字线划图)格式的数据。该数据特别适宜作为拓扑数据结构的教学实例,同时还有利于帮助学生理解“数据格式”概念及其与“数据结构”概念的关系。B、DLG数据格式及其实例

DLG数据以文本文件的形式提供。仍以图2—5为例,该图的DLG数据如表2—2所示。由于该图尚未赋属性,数据中有很多值为0。我们仅需专注于这里DLG数据的非零部分,以便具体理解DLG数据的格式及其拓扑表达。

DLG数据依次由四个部分组成:●第一部分。“文件头”,1至15行,描述该DLG数据的生产日期、地点、人员、经纬度范围等。●第二部分。从第16行起为各结点(node)和独立地物点的数据,每一点的数据占2行,皆以字母N开头,其非零数据依次为:点序号、点的坐标、以该点为端点的线的数目和序号(若为终结点,该线号为负)。●第三部分。紧接结点数据,为多边形或区域(area)数据。每一多边形的数据占2行,皆以字母A开头,其非零数据依次为:多边形序号、其标签点的坐标、围成该多边形的线的数目和各条线的序号,其中反时针转的线的序号为负。●第四部分:线(line)数据,皆以字母L开头。这是DLG中数据量最多的部分,因为这里包含众多的点坐标。每条线的非零数据依次为:线序号、起始点序号、终结点序号,左多边形序号、右多边形序号、所含的点(包括两端点)的数目和坐标序列。C、Arc/Info的拓扑数据表达Arc/Info多年来一直是主导GIS技术潮流的最重要的大型GIS软件,其数据模型和结构包含较丰富的内容,这里仅介绍其中有关拓扑结构的部分,着重比较它与DLG数据格式不同的特点。在Arc/Info中,几何坐标数据采取多种存储形式,而属性数据和部分拓扑数据放在关系表中另行存储。图2—5中各条线在Arc/Info中的属性表将如表2—3所示。点、线和多边形的属性表中皆有专门的序号(称为内部ID号,多数情况下与表头的记录号一致)作为每一点、线和多边形的唯一标识符。通过它,每一点、线和多边形的属性一一对应地链接到其坐标数据上。内部ID线拓扑数据4、再谈数据结构和文件(或数据)格式同样是采取拓扑数据结构,不同数据商和软件商还会有自己具体的数据组织形式。这就是文件(或数据)格式。事实上,上述实例不仅是为了帮助认识拓扑数据结构,而且也是为了对“数据结构”和”文件(或数据)格式”这两层概念有一个具体的认识。这一认识具有重要的意义。在GIS实践中,经常遇到需要将不同数据结构或格式的软件平台集成应用的情况。这个问题也即现在整个计算机领域都甚为关注的“互操作性”(interoperability)问题。可惜的是,由于地理空间数据的特殊复杂性,同一般计算机应用领域相比,GIS领域在互操作性方面的进展要滞后甚多,GIS实践中不同软件平台兼容并用的困难,不同数据结构或格式的数据相互转换的麻烦,一直是GIS领域发展的一个严重瓶颈,成为当前地理信息科学领域需要重点研究解决的课题之一。四、矢量结构的数据的输入、编辑和输出1、矢量结构的数据的获取和输入矢量结构的地理空间数据输入,包括空间位置数据和属性数据的输入。文字、数字形式的属性数据之输入与一般计算机数据一样。在空间位置数据中,拓扑等空间关系数据,通常是在数据输入以后进行数据编辑整理的结果。因此,这里需要着重谈的是空间坐标数据的输入。在这一方面,矢量数据结构一般采取下述四种途径:●人机交互,直接从计算机键盘或鼠标输入。●直接采用现成的矢量结构电子数据。现成的矢量数据通常有两类。一类是软件商和数据商提供的数据,数据转为自己的格式后,直接应用。另一类是GIS系统的建设者自己利用现代化数字测量仪器采集到的地物坐标的电子数据,这些数据连同相关属性数据,作为数据文件一般能直接输入到GIS系统中。●从栅格数据文件转换而来。这一点将在本章后面讲述。●通过手扶跟踪数字化仪输入。输入方法:A、数字化仪跟踪:早期的主体方法,获取矢量数据,精度相对低,数字化地图数字化操作三步:选取三个参考点确定数字化文件相对于数字化板的位置;选定控制点,确定从平面坐标到输入地图的投影坐标的转换参数;以点、线和数据流模式采集数据影响精度三因素:控制点的数量与精度;地图纸张伸缩;操作者的技术空间坐标与属性建立联系的工作可与数字化同步。多边形数字化有三种模式:全多边形模式;手工拓扑关系建立;自动拓扑关系建立B、栅格扫描:获取栅格数据像片等图像类:直接扫描为栅格数据地图类矢量图形:扫描后在矢量化地图矢量化:A扫描获取栅格图像;B二值化或分色,并进行栅格编辑;C自动/交互追踪矢量化;D建立多边形标识;E矢量编辑,完成输入2、矢量结构数据的前处理和编辑输入计算机的矢量数据一般都有很多不足,如有重叠、短缺、不规范和不美观,以及尚无基本几何数据(长度、面积等)、拓扑结构等,不能直接应用,需要经过一番处理,再加上属性数据,才能满足进一步的数据处理和分析的需要。这种为用户准备好基本达到要求的数据处理,有时称为数据的前处理或预处理(preprocessing)。注意,预处理是计算机数据处理的一环,并不包括计算机输入前的数据准备工作。在矢量数据的前处理工作中,有些工作是通过计算机程序自动完成的;但更多的数据整理工作需要进行人机交互,即用户利用GIS软件平台的某些功能,通过人工干预来整理数据。这种人机交互整理矢量数据的工作,通常称为矢量数据编辑,其中大量的工作是几何图形的编辑。实际的前处理工作常是人机交互整理和程序自动处理反复结合的过程。下面具体介绍常见的矢量结构数据前处理和编辑工作的内容。3、一般矢量数据的前处理和编辑一般矢量数据的前处理主要有三类工作。第一是基本度量计算。基本度量计算指空间度量关系的计算,如线的长度、多边形的周长与面积、两点间距离与方向、点到线的距离等的计算。通常由计算机程序自动完成。第二是一般的图形编辑。大多需在图形软件平台上进行人工干预。●点、线、面实体的增加、删除、移动、拷贝、平移、旋转等。●在线或多边形边界中删除、增加或移动其中间点(顶点或节点)。此编辑的目的是改变线或多边形的形状。●曲线光滑处理,通过计算机程序自动增加中间点,使线或多边形边界变圆滑。●曲线化简,是在保持一条曲线基本形状的前提下,删节曲线中过密的中间点,以减小数据冗余。●点、线、多边形的连接、咬合或合并。●窗口裁剪,利用一个矩形框或多边形去裁剪图形。●图幅接边,是将两幅相邻地图边界上不一致之处吻合起来的工作,不仅要求两边地物在几何上吻合,在属性上也要一致。●撤销与恢复编辑。第三种前处理工作是属性数据输入。由于矢量结构数据需要做很多前处理及编辑工作,GIS的属性数据的输入常在编辑工作告一段落之后进行;但通常不可能一蹴而就,属性数据输入和图形编辑常常是一个反复交替的过程。4.拓扑结构数据的前处理和编辑同非拓扑数据相比,拓扑数据要额外做不少的前处理和编辑工作。●让未到位的线咬合,应当接上的结点吻合(snap)。●计算线的交点,这些交点加上线条之端点构成拓扑数据中的结点,进而定义每一条线(或弧段),以及结点和线之间的拓扑关系。●用线或弧段装配并定义多边形,建立线和多边形之间的拓扑关系。●为每个多边形制造唯一的标签点,并进行点在多边形内的判别。●建立点状、线状和多边形地物的属性表,表中给出某些基本度量计算结果(线长度、多边形面积等)或拓扑数据。●删除多余的多边形。特别是重复数字化或不同来源地图叠合等原因,会导致同一地物有重叠弧线,如图2—8b所示。重叠弧线会形成一连串莫须有的细碎多边形,需要去除之。●清除不必要的秃结点和假结点。秃结点指弧线的端点,如图2—5中的结点②和图2—8c中的B点。自然界中有不少真实的地物表现为秃结点,如街道死胡同、河流源头等;但也有很多秃结点是多余的。能查错,但不能改错5.矢量结构的数据的输出

GIS输出有两种主要形式:荧屏输出和硬拷贝输出。后者一般指通过绘图仪和打印机等设备在纸张上输出。目前绝大多数情况是,矢量结构数据都是转换为栅格数据结构的形式输出。在矢量数据输出方面,更值得注意的问题是地图符号和注记的输出。用符号和注记来可视化地表现空间对象的主要属性特征。为此,矢量形式的GIS软件通常业已制作或准备好很多种表达点、线和面状地物的符号和注记素材,并有指挥栅格形式的输出设备动作的功能。符号包括点状符号、线状符号和面状符号。符号和注记一般也是矢量图形,如矩形、圆圈或其他图案,以及矢量汉字等。在具体的矢量地图数据输出时,用户或者采用软件平台现有的符号和注记材料,或者再加工生成新符号;同时,还要给出制图对象的说明数据,具体指定哪一类地物采用哪一种符号或注记,以及怎样实施等。这样,输出设备将在不同属性的点、线和面的位置上,分别绘出指定色调和图案的符号;并在指定的位置处绘出注记。矢量数据的输出内容非常丰富,将在第六章专门阐述。第三节栅格空间数据模型及结构一、栅格空间数据模型建立在二维平面上的栅格(raster)数据模型采用相当于涂抹画的表达方式,或图像方式,通过画面上每个单元的明暗或色调来表现空间实体的界限和形态。为了用计算机来实现这种表达,GIS栅格数据模型通常包括下述构成成分(参见图2—9):栅格数据模型将所研究的平面或地面区域划分为规整的格网(grid)--格网的单元,即每一网格,通常为正方形,也可是矩形、三角形、六边形等,英文常称为pixel,有时也称cell,中文一般称为像元(有时也称像素)。栅格数据模型的规整格网本身就可以看做是一种直角坐标网,或坐标网的一部分;空间位置数据隐含在格网的行、列数之中,或者说,像元记录的顺序已经隐含了空间坐标;行、列数加上4个位置参数(图2—10c),所有像元空间位置就可确定。但是,像元坐标取值是分立的或离散的,坐标值以∆x和∆y为单位等间隔地增减,而不能像矢量模型的坐标数据那样任意、连续地取值。这是栅格数据模型与矢量数据模型的一个明显差别。二、完全栅格空间数据结构完全栅格数据结构又称为简单栅格数据结构,它主要相对于压缩的栅格数据结构而言。完全栅格结构原封不动地采取规整的矩阵数组形式;而压缩结构则将矩阵用某种精简方式来记录。二、完全栅格空间数据结构1.数据量及其与精度的关系完全栅格数据结构的数据量容易由下式计算:数据量(字节):

像元总数*每个像元(属性数据)所占字节数

=行数*列数*每个像元所占字节数采用栅格数据模型时,首先要处理的主要是数据量与精度的矛盾。精度提高到n倍,数据量提高到n2倍2.不同地学应用类型的栅格数据3.多重属性下的栅格数据结构栅格图像中一个格子只能放置一个数值,即一个栅格图像只能表达一种因子属性(如地类或植被),而实践中经常涉及多重因子属性的研究,进行多因子综合分析等。栅格数据结构解决这个问题的主要办法是:采用多层(Layer)栅格数据,每一层栅格数据采用完全一致的格网,分别表达某一种因子属性。注意,矢量数据也常需要采用多层表达方式,例如对同一地区绘制各种专题地图。但应当看到,一幅矢量地图可以表达不止一种因子属性(例如交通、水系等属性可以同时绘于一幅图中),而栅格图像每一幅只能表达一种因子属性。因此,当涉及不止一种因子属性的分析研究时,栅格数据更加需要多层表达方式。在GIS实践中经常遇到的多层栅格数据主要有两种类型。其一是多因子综合分析。另一种常用的多层栅格数据是多波段遥感数据。4.多层栅指数据结构的文件格式多层的完全栅格数据结构可以采取不同的文件格式。其中一种常用的格式是每一层栅格图像按正常行列序形成一个文件,一个接一个文件存放;这种方式在遥感图像处理中称为波段顺序(BSQ)格式。另一种常用格式是逐行格式(BIL)。在BIL数据中,所有波段逐行交叉排列,共同形成一个文件。该文件的第1行是第一波段第1行;接下第2行是第二波段的第1行;再接下是第三波段第1行,……所有波段的第1行依次排好后,再依次排列所有波段的第2行,然后依次排列所有波段的第3行,……如此等等。这种格式有利于多重图像的叠合分析或操作,因为同一行像元的多重属性值的物理地址相近。多重属性的栅格数据也可用另一种格式来组织,即采取一个栅格图像加上属性表的方式。该属性表中的每一行记录着每一像元的多重属性;而在该栅格图像中,像元的值则是指向属性表中相应记录的指针。这样,也比较容易找到任何像元的多重属性值。三、压缩的栅格空间数据结构压缩栅格数据的必要性从图2—10所示的栅格数据一目了然,在那里,很多像元取相同数值,数据冗余明显。压缩的栅格数据结构就是对完全栅格数据结构采取简化方法来记录的结果。下面介绍几种不同的压缩方法导致的压缩结构。1.游程长度编码(Run_LengthEncoding)或块码游程长度编码和块码适宜于压缩像元属性值连接的、成片的相同的栅格数据,压缩方法简单,且能极大地减少存储空间。游程编码的压缩规则是将同一行(也可按列,但多数按行进行)中具有相同居性值的邻近像元组织在一起,称为一个游程。每个游程用一对数字表达,其中第一个数字为游程长度(所延续的列数),第二个数字为这一游程像元的属性值。每个新行都以新的游程开始。编码特点:简单、多对一,减少存储,增加运算,压缩效率受完全栅格结构的扫描顺序影响较大块式编码:二维游程编码2、链式编码(ChainEncoding):又称Freemon编码,是用从某一起点开始沿8个基本方向前进的单位矢量链来表示线状地物或多边形的边界。单位矢量长度为一个栅格单元的边长或对角线的长度,每个后续点位于前继点的8个基本方向之一。如下图多边形4,起点(3,8),链码为:334557001每个链码只需3个bit,可起到数据压缩作用。链式编码对长度、面积的运算能力较强,类似矢量,但不具有区域的性质,难以实现区域的空间运算。链码或链式编码特别适合于表达线状空间对象(线状地物和多边形边界)的栅格数据3、四叉树编码(Quarter-treeEncoding):又称为四分树或四象限编码。它要求图像为边长等于2的整数幂(2n)的正方形(不符合这个条件可通过补零凑齐)。其编码思路是,空间区域逐次四分,直至所分区域为单一属性。特点:各部分空间分辨率可变;多边形及孔洞表示方便,易有效计算特征,易转换,可直接叠合;不稳定四、栅格数据的采集、输入和输出1.栅格数据结构在GIS输入和输出上的优势在GIS的输入输出上,栅格模式明显优于矢量模式。原因二:数据结构简单,用数字矩阵来表达,数据文件按顺序隐含像元的地址,非常适宜于输入、输出设备的点阵方式运作;在地学以外领域,特别是多媒体和互联网领域的应用,比矢量数据要广泛得多。目前GIS领域无论是输入还是输出,栅格模式的设备占主要地位。2.栅格数据的采集、输入地学中栅格结构的数据获取和输入途径主要有下述四种:第一种是人工方式。第二,从矢量数据直接转换。第三种途径是遥感数据。遥感数据作为电子数据可直接转换。第四,扫描数字化。扫描数字化通过数字扫描设备(扫描仪)将硬拷贝(纸张、薄膜等)上的图形图像,转化为栅格数据。3.栅格数据的输出栅格数据的输出是栅格数据每个像元之值转化为输出画面上相应点位处灰度值的过程。栅格数据模型相当于涂抹画的表达方式,栅格图像通过画面上每个单元的明暗或色调来表现空间实体的界限和形态。由于栅格数据结构用数字矩阵来表达,而许多输出设备也是基于栅格模式,栅格结构数据输出时,人们不难利用每一个像元之值来直接或间接地控制输出的强度,使输出画面上相应点位处产生需要的灰度值。第四节基于两种数据结构的进一步讨论一、矢量和栅格数据结构的比较分析矢量数据模型数据存储量小,空间位置精度高空间关系描述全面,对线状、网络状事物的分析方便空间和属性数据综合查询与更新方便普通地图可直接手工数字化与测绘数据易于结合数据结构复杂多种地图叠合分析较困难难以描述边界复杂、模糊的事物不能直接处理数字图像信息拓扑结构建立复杂,工作量大栅格数据模型数据结构简单多种地图叠合分析方便容易描述边界复杂、模糊的事物,便于处理三维连续表面能直接处理数字图像信息数据存储量巨大空间位置精度低难以表达对线状、网络状事物输出地图不美观空间变换效果差,费时与时俱进矢量和栅格数据结构的选择栅格GIS与矢量GIS之一体化,并不改变两种数据结构各有所长的事实。在GIS实践中,必须在两种数据结构中作出恰当选择。矢量和栅格模型数据结构选择原则在矢量和栅格模型之间选择时应根据实际应用对象的特点来决定。

在大多数情况下,GIS应用部门需要应用地图及其查询分析。因此,矢量数据结构通常是不可缺少的。但是,有些用户还同时需要进行地表景观的三维显示和分析,那就必须加上应用栅格数据结构。还有些用户,特别是进行较大范围较小比例尺的自然资源、环境、农业、林业、地质等区域问题研究的用户,常常需要采用遥感数据,那就更需要将栅格数据结构与矢量结构相结合。他们常常将遥感图像处理所提取的分类分区和线状地物等信息,从栅格形式转换到矢量结构的软件平台上,绘制矢量地图。采用什么数据结构还要视条件而定。具体情况具体分析,尽可能在许可的条件下发挥矢量结构和栅格结构的长处。没有多少选择余地二、栅格、矢量数据结构的相互转换1.矢量数据向栅指数据转换的主要步骤

矢量数据向栅格数据的转换,称为矢量栅格化(rasterization)。人工方式获取栅格数据的方法,即在需要数字化的地图上,蒙上范围与地图相同的规整格网的透明薄膜,然后根据每一个格子所对应的地图上的内容,来确定该网格的属性值。矢量栅格化的转换思路与此非常类似。具体转换过程可以概括为如下几个步骤:第一步,准备好矢量数据或矢量地图。第二步,构架一个与地图等大小的格网,根据精度需要与条件许可,选取好适当的格网密度或分辨率。第三步,根据地图上的点、线、多边形相对这个格网的配置及其属性来确定数组变量每一个像元的数值。最后,将上述矩阵数组结果存储于某种所需的图像格式中,从而形成可以在相应软件平台上显示的栅格图像。2.点状、线状和面状空间对象矢量数据的栅格化●第一,点状对象的栅格化。点状对象的栅格化十分简单:该点落入哪个像元,就根据该点状对象的特性赋予该像元属性值。●第二,线状对象的栅格化,也称为弧段栅格化。线状对象在矢量数据中,除属性外,是一连串(x,y)值。弧段栅格化要求对每两个相邻的(x,y)之间的线段所穿过的像元赋值;但必须保证赋值的任何线状地物像元之间在北、东北、东,……西北8个方位上的单一连接关系。●第三,多边形对象的栅格化。又称为多边形填充,它要进行两方面工作。其一是决定多边形边界所穿过的像元应归于那一边的多边形(分区)。另一件工作是自动探测哪些像元位于哪个多边形的内部,以便根据该多边形的特性给这些像元赋属性值。3.栅格格式的遥感分类图像向矢量数据的转换栅格数据向矢量数据转换也称为栅格矢量化(vec

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论