第三部分地理空间数据的获取与处理二_第1页
第三部分地理空间数据的获取与处理二_第2页
第三部分地理空间数据的获取与处理二_第3页
第三部分地理空间数据的获取与处理二_第4页
第三部分地理空间数据的获取与处理二_第5页
已阅读5页,还剩104页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三部分第三部分 地理空间数据的获取与处理地理空间数据的获取与处理(二)第十一章第十一章 空间数据的处理方法空间数据的处理方法o GIS中空间数据的处理方法涉及图形数据和栅格数据。其中关于图形方面的算法主要来自计算机图形学,栅格数据的处理方法主要来自图象处理或遥感图象处理原理与方法等。这里主要介绍拓扑关系的自动生成算法、空间数据的压缩算法、空间数据的格式转换、矢量和栅格数据转换等。第一节第一节 图形屏幕编辑的基本操作算法图形屏幕编辑的基本操作算法o 图形编辑的关键是点、线、面的捕捉,即如何根据光标的位置找到需要编辑的要素,以及图形编辑的数据组织。下面分别作简要介绍。第一节第一节 图形屏幕编辑的

2、基本操作算法图形屏幕编辑的基本操作算法o一、点的捕捉算法一、点的捕捉算法 图形编辑是在计算机屏幕上图形编辑是在计算机屏幕上进行的,因此首先应把图幅进行的,因此首先应把图幅的坐标转换为当前屏幕状态的坐标转换为当前屏幕状态的坐标系和比例尺。设光标的坐标系和比例尺。设光标点为点为S(x,y),图幅上某一,图幅上某一点状要素的坐标为点状要素的坐标为A(X,Y),则可设一捕捉半径则可设一捕捉半径D(通常为通常为35个象素,这主要由屏幕个象素,这主要由屏幕的分辩率和屏幕的尺寸决定的分辩率和屏幕的尺寸决定)。若若S和和A的距离的距离d小于小于D则认则认为捕捉成功,即认为找到的为捕捉成功,即认为找到的点是点是

3、A,否则失败,继续搜索,否则失败,继续搜索其它点。其它点。 第一节第一节 图形屏幕编辑的基本操作算法图形屏幕编辑的基本操作算法o 二、线的捕捉算法二、线的捕捉算法 设光标点坐标为S(x, y),D为捕捉半径,线的坐标为(x1,y1),(x2,y2),(xn,yn)。通过计算S到该线的每个直线段的距离di 。在实际的捕捉中,可每计算一个距离di就进行一次比较,若diD,则捕捉成功,不需再进行下面直线段到点S的距离计算了。 第一节第一节 图形屏幕编辑的基本操作算法图形屏幕编辑的基本操作算法o 为了加快线捕捉的速度,可以把不可能被光标捕捉到的线以简单算法去除。如图,对一条线可求出其最大最小坐标值Xm

4、in,Ymin,Xmax,Ymax,对由此构成的矩形再向外扩D的距离,若光标点S落在该矩形内,才可能捕捉到该条线,因而通过简单的比较运算就可去除大量的不可能捕捉到的情况。 第一节第一节 图形屏幕编辑的基本操作算法图形屏幕编辑的基本操作算法o 对于线段与光标点也应该采用类似的方法处理。即在对一个线段进行捕捉时,应先检查光标点是否可能捕捉到该线段。即对由线段两端点组成的矩形再往外扩D的距离,构成新的矩形,若S落在该矩形内,才计算点到该直线段的距离,否则应放弃该直线段,而取下一直线段继续搜索。 第一节第一节 图形屏幕编辑的基本操作算法图形屏幕编辑的基本操作算法o 可以看出计算量较大,速度较慢,因此可

5、按如下方法计算。即从S(x,y)向线段(x1,y1)(x2,y2)作水平和垂直方向的射线,取dx,dy的最小值作为S点到该线段的近似距离。由此可大大减小运算量,提高搜索速度。计算方法为:第一节第一节 图形屏幕编辑的基本操作算法图形屏幕编辑的基本操作算法o 三、面的捕捉算法三、面的捕捉算法 面的捕捉实际上就是判断光标点S(x,y)是否在多边形内,若在多边形内则说明捕捉到。判断点是否在多边形内的算法主要有垂线法或转角法,这里介绍垂线法。第一节第一节 图形屏幕编辑的基本操作算法图形屏幕编辑的基本操作算法o 垂线法的基本思想是从光标点引垂线(实际上可以是任意方向的射线),计算与多边形的交点个数。若交点

6、个数为奇数则说明该点在多边形内;若交点个数为偶数,则该点在多边形外。第一节第一节 图形屏幕编辑的基本操作算法图形屏幕编辑的基本操作算法o 为了加速搜索速度,可先找出该多边形的外接矩形,即由该多边形的最大最小坐标值构成的矩形,如上图。若光标点落在该矩形中,才有可能捕捉到该面,否则放弃对该多边形的进一步计算和判断,即不需进行作垂线并求交点个数的复杂运算。通过这一步骤,可去除大量不可能捕捉的情况,大大减少了运算量,提高了系统的响应速度。 第一节第一节 图形屏幕编辑的基本操作算法图形屏幕编辑的基本操作算法o 在计算垂线与多边形的交点个数时,并不需要每次都对每一线段进行交点坐标的具体计算。对不可能有交点

7、的线段应通过简单的坐标比较迅速去除。 第一节第一节 图形屏幕编辑的基本操作算法图形屏幕编辑的基本操作算法o 多边形的边分别为18,而其中只有第3、7条边可能与S所引的垂直方向的射线相交。即若直线段为(x1,y1)(x2,y2)时,若x1xx2,或x2xx1时才有可能与垂线相交,这样就可不对1,2,4,5,6,8边进行继续的交点判断了。第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o 矢量数据拓扑关系在空间数据的查询与分析中非常重要,矢量数据拓扑关系自动建立的算法是GIS中的关键算法之一,下面介绍其实现的基本步骤和要点。第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关

8、系自动生成o 一、欧拉定理一、欧拉定理 对于一个多边形图形,其结点数n,弧段数a,和多边形数b之间满足函数关系:bancbnac12c b包含边界里面和外面多边形 b仅包含边界里面多边形 第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o 欧拉定理的用途是用于拓扑检验,可以发现点、线、面的不匹配情况和多余或遗漏图形元素,出现这些情况时,公式等式就不成立。但满足等式的图形,并不能说明图形关系不存在错误。第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o 二、点、线拓扑关系的建立二、点、线拓扑关系的建立 它的实质是建立结点弧段、弧段结点的关系表格,有两种方案:(

9、1)在图形采集和编辑时自动建立。主要记录两个数据文件:一个记录结点所关联的弧段,即结点弧段列表;另一个记录弧段的两个端点(起、始结点)的列表。数字化时,自动判断新的弧段周围是否有已存在的结点,若有,将其结点编号登记,若没有,产生一个新的结点,并进行登记。(2)在图形采集和编辑后自动建立。第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o 三、多边形矢量数据自动拓扑关系自动建立三、多边形矢量数据自动拓扑关系自动建立 多边形有四种基本图形: 第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o 1、 多边形矢量数据多边形矢量数据自动拓扑的步骤自动拓扑的步骤 主要是

10、找出在链的中间主要是找出在链的中间相交,而不是在端点相交,而不是在端点相交的情况,自动切相交的情况,自动切成新链;把链按一定成新链;把链按一定顺序存储,如按最大顺序存储,如按最大或最小的或最小的x或或y坐标的坐标的顺序,这样查找和检顺序,这样查找和检索都比较方便,然后索都比较方便,然后把链按顺序编号。把链按顺序编号。 链中间相交 第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o (2)结点匹配)结点匹配 结点匹配是指把一定限差内的链的端点作为一个结点,其坐标值取多个端点的平均值。然后,对结点顺序编号。 结点匹配 第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动

11、生成(3)检查多边形是否闭合)检查多边形是否闭合 检查多边形是否闭合可以通检查多边形是否闭合可以通过判断一条链的端点是否过判断一条链的端点是否有与之匹配的端点来进行。有与之匹配的端点来进行。 弧弧a的端点的端点P没有与之匹配没有与之匹配的端点,因此无法用该条的端点,因此无法用该条链与其它链组成闭合多边链与其它链组成闭合多边形。形。 第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o 2、多边形矢量数据自动、多边形矢量数据自动拓扑的算法拓扑的算法 (1)建立多边形拓扑关系)建立多边形拓扑关系的概念的概念 1顺时针方向构多边形顺时针方向构多边形 所谓顺时针方向构多边所谓顺时针方向

12、构多边形是指多边形在链的右形是指多边形在链的右侧(图侧(图a),多边形在闭),多边形在闭合曲线内。逆时针方向合曲线内。逆时针方向构多边形是指多边形在构多边形是指多边形在链的左侧(图链的左侧(图b),多边),多边形在闭合曲线外。形在闭合曲线外。顺时针构建的多边形 (a) 逆时针构建的多边形 (b) 第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o 2最靠右边的链 最靠右边的链是指从链的一个端点出发,在这条链的方向上最右边的第一条链,实质上它也是左边最近链,a的最右边的链为d。找最靠右边的链可通过计算链的方向和夹角实现。第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系

13、自动生成o 3多边形面积的计算 设构成多边形的坐标串为(xi, yi ),i1,2,n,则多边形的面积A可用如下公式求出:第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o 当多边形由顺时针方向构成时,面积为正;反之,面积为负 .第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o (2)建立多边形的基本过程 1顺序取一个结点为起始结点,取完为止;取过该结点的任一条链作为起始链 2取这条链的另一结点,找这个结点上,靠这条链最右边的链,作为下一条链。 3是否回到起点:是,已形成一多边形,记录之,并转4;否,转2。 4取起始点上开始的,刚才所形成多边形的最后一条边

14、作为新的起始链,转2;若这条链已用过两次,即已成为两个多边形的边,则转1。第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o 例如 :1从P1结点开始,起始链定为P1P2;从P2点算起,P1P2最右边的链为P2P5;从P5算起,P2P5最右边 的链为P5P1。所以,形成的多边形为P1P2P5P1。2从P1结点开始,以P1P5为起始链,形成的多边形为P1P5P4P1。3从P1开始,以P1P4为起始链形成的多边形为P1P4P3P2P1。4这时P1为结点的所有链均被使用了两次,因而转向下一个结点P2,继续进行多边形追踪,直至所有的结点取完。共可追踪出五个多边形,即A1、A2、A3、

15、A4、A5。第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o (3)岛的判断)岛的判断 岛的判断即指找出多边形互相包含的情况,也即寻找多边形的连通边界。 第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o 根据上述追踪多边形的方法,单多边形(即由单条链或由多条链顺序构成的,不与其它多边形相交的多边形,被追踪了两次,因为每条链必须使用两次,所以,多边形的一个面积是为正的,另一个是为负的。如果一个多边形包含另一多边形,则必然是面积正的多边形包含面积负的多边形。所以,解决多边形包含问题的步骤为:第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成

16、1计算所有多边形的面积。 2分别对面积为正的多边形和面积为负的多边形排序。3从面积为正的多边形中,顺序取每个多边形,取完为止。若负面积多边形个数为0,则结束。4找出该多边形所包含的所有面积为负的多边形,并把这些面积为负的多边形加入到包含它们的多边形中,转3。第二节第二节 空间数据的拓扑关系自动生成空间数据的拓扑关系自动生成o (4)确定多边形的属性)确定多边形的属性 在追踪出每个多边形的坐标后,经常需确定该多边形的属性。如果在原始矢量数据中,每个多边形有内点,则可以把内点与多边形匹配后,把内点的属性赋于多边形。由于内点的个数必然与多边形的个数一致,所以,还可用来检查拓扑的正确性。如果没有内点,

17、则必须通过人机交互,对每个多边形赋属性。第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o 数据压缩的目的是删除冗余数据,减少数据的存贮量,节省存贮空间,加快后继处理的速度。在GIS数据存储中具有重要作用。分为矢量数据压缩和栅格数据压缩方法。第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o 一、矢量数据的压缩一、矢量数据的压缩(简化简化) 矢量数据压缩是有损压缩。当数字化采集的点过密时,经常需要删除一些交点,简化数据。下面介绍几种常用的矢量数据的压缩算法,以及它们之间的异同点。第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o1、道格拉斯、道格拉斯普克法普克法(

18、DouglasPeucker) 当数字化的图形如 图,需要删除一些交点时,可以采用该方法。其算法思想是:对每一条曲线的首末点虚连一条直线,求所有点与直线的距离,并找出最大距离值d-max,用d-max与限差D相比: 若d-maxD,这条曲线上的中间点全部舍去; 若d-maxD,保留d-max对应的坐标点,并以该点为界,把曲线分为两部分,对这两部分重复使用该方法。第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o 2、垂距法、垂距法 如图,垂距法的算法思想是:每次顺序取曲线上的三个点,计算中间点与其它两点连线的垂线距离d,并与限差D比较。若dD,则中间点去掉;若dD,则中间点保留。然后

19、顺序取下三个点继续处理,直到这条线结束。d-maxd-maxd-max第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o 3、 光栏法光栏法 如图,光栏法的算法思想是:定义一个扇形区域,通过判断曲线上的点在扇形外还是在扇形内,确定保留还是舍去。 第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o 二、栅格数据的压缩二、栅格数据的压缩1、直接栅格编码、直接栅格编码 将栅格数据看作一个数据矩阵,逐行将栅格数据看作一个数据矩阵,逐行(或逐或逐列列)记录代码,可以每行都从左到右记录,记录代码,可以每行都从左到右记录,也可以奇数行从左到右,偶数行从右到左。也可以奇数行从左到右,偶数行

20、从右到左。 第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法ABBBBBBBAAAAAAAA栅格数据 第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o 栅格数据可存储记录为:(AAAAABBBAABBAABB)。o 这种记录栅格数据的文件常称为栅格文件,且常在文件头中存有该栅格数据的长和宽,即行数和列数和两方向的密度。这样,具体的象元值就可连续存储了。其特点是处理方便,但没有压缩。 第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o 2、游程长度、游程长度(行程行程)编码编码 地理数据往往有较强的相关性,也就是说相邻象元的值往往是相同的。 游程长度编码的基本思想

21、是:按行扫描,将相邻等值的象元合并,并记录代码的重复个数。 第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法 其编码为(A4 A1 B3 A2 B2 A2 B2)。 若在行与行之间不间断地连续编码,则为(A5 B3 A2 B2 A2 B2)。 ABBBBBBBAAAAAAAA第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o 对于游程长度编码,区域越大,数据的相关性越强,则压缩越大。其特点是,压缩效率较高,叠加、合并等运算简单,编码和解码运算快。 第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o 3、四叉树编码、四叉树编码 四叉树编码是最有效的栅格数据压缩编码方

22、法之一,在GIS中有广泛的应用。 第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法行号 5= 0 1 0 1列号 7= 0 1 1 1Morton 码=0 0 1 1 0 1 1 1=55十进制Morton码的编码 第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o这样就可将用行列表示的二维图像,用Morton码写成一维数据,通过Morton码就可知道象元的位置。 把一幅2 n2 n的图像压缩成线性四叉树的过程为:1按Morton码把图象读入一维数组。2相邻的四个象元比较,一致的合并,只记录第一个象元的Morton码

23、。3比较所形成的大块,相同的再合并,直到不能合并为止。 对用上述线性四叉树的编码方法所形成的数据还可进一步用游程长度编码压缩。压缩时只记录第一个象元的Morton码。第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o 例:ABBBBBBBAAAAAAAA0213891011121314154567四叉树Morton码编码结果 第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法第三节第三节 空间数据的压缩编码方法空间数据的压缩编码方法o 解码时,根据Morton码,就可知道象元在图像中的位置。从左上角,本Morton码和下一个Morton码之差即为象元个数。知道了象元的个数和象

24、元的位置就可恢复出图像了。o 线性四叉树编码的优点是:压缩效率高,压缩和解压缩比较方便,阵列各部分的分辩率可不同,既可精确地表示图形结构,又可减少存贮量,易于进行大部分图形操作和运算。缺点是:不利于形状分析和模式识别,即具有图形编码的不定性,如同一形状和大小的多边形可得出完全不同的四叉树结构。第四节第四节 空间数据的格式转换空间数据的格式转换o 因GIS软件的原因,不同的GIS软件对空间数据定义和存储结构的差别,GIS数据库中的数据格式之间存在不兼容的问题。即不同的GIS软件所支持的数据存储格式不能直接相互利用。需经过格式转换才能相互被对方使用。第四节第四节 空间数据的格式转换空间数据的格式转

25、换o 一、数据格式转换的内容一、数据格式转换的内容o 数据格式转换的内容包括三个方面的内容:n 空间定位信息,即几何信息,主要是实体的坐标。n 空间关系信息,几何实体之间的拓扑或几何关系数据。n 属性信息,几何实体的属性说明数据。第四节第四节 空间数据的格式转换空间数据的格式转换o 二、数据格式转换的方式二、数据格式转换的方式o 主要有三种方式:第四节第四节 空间数据的格式转换空间数据的格式转换o 1、通过外部数据交换、通过外部数据交换文件进行。文件进行。o 大部分GIS工具软件都定义了外部交换文件格式, 软件名称外部交换格式ARCINFOE00;MapInfoMID;AutoCADDXF;M

26、GEASCII Loader第四节第四节 空间数据的格式转换空间数据的格式转换外部交换格式转换 B,11,11,25第四节第四节 空间数据的格式转换空间数据的格式转换o 2、通过标准空间数据文件转换、通过标准空间数据文件转换o 在系统之间进行数据格式转换的另一种解决方案是,定义标准的空间数据交换文件标准,每个GIS软件都按这个标准提供外部交换格式,并且提供读入标准格式的软件。这样系统之间的数据交换经过二次转换即可完成。第四节第四节 空间数据的格式转换空间数据的格式转换标准数据文件交换 第四节第四节 空间数据的格式转换空间数据的格式转换o 3、通过标准的、通过标准的API函数进行转换函数进行转换

27、o 上述两种方式都是经过文件实现的数据转换方式。如果GIS软件都提供直接读取对方存储格式的API函数,则系统之间的转换只需一次转换即可完成 。第四节第四节 空间数据的格式转换空间数据的格式转换函数转换 第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换o 由于矢量数据和栅格数据各自的优点和互补性,矢量到栅格、栅格到矢量的转换的情况在GIS中经常发生。第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换o 一、矢量一、矢量栅格转换栅格转换o 由于矢量数据的点到栅格数据的点只是简单的坐标变换,所以,这里主要介绍线和面(多边形)的矢量数据向栅格数据的转换。第五节第五节 矢量数据

28、和栅格数据的转换矢量数据和栅格数据的转换o 1、线的栅格化方法、线的栅格化方法o 线是由多个直线段组成的,因此,线的栅格化的核心就是直线段如何由矢量数据转换为栅格数据 。第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换o 设直线段的两端点坐标转换到栅格数据的坐标系后为(xA,yA),(xB,yB)。 第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换o2、面、面(多边形多边形)的栅格化方法的栅格化方法 多边形的栅格化方法主要有三种算法。(1)内部点扩散法 由一个内部的种子点,向其4个方向的邻点扩散。判断新加入的点是否在多边形边界上,如果是,不作为种子点,否则当作新的种

29、子点,直到区域填满,无种子点为止。 该算法比较复杂,而且可能造成阻塞而造成扩散不能完成(如图),此外若多边形不完全闭合时,会扩散出去。第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换o (2)扫描法 如图,按扫描线的顺序,计算多边形与扫描线的相交区间,再用相应的属性值填充这些区间,即完成了多边形的栅格化。第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换o (3)边填充算法o 其基本思想是:对于每一条扫描线和每条多边形边上的交点,将该扫描线上交点右方的所有象素取原属性值之补。对多边形的每条边作此处理,多边形的方向任意。如图,是一个简单的例子。第五节第五节 矢量数据和栅

30、格数据的转换矢量数据和栅格数据的转换o 二、二、 栅格栅格矢量转换矢量转换 栅格数据到矢量数据转换的一般过程可描述为:o 1、二值化、二值化 由于扫描后的图像是以不同灰度级存储的,为了进行栅格数据矢量化的转换,需压缩为两级(0和1),称为二值化。地图扫描灰度影像直方图 第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换o 2、二值图像的预处理、二值图像的预处理 对于扫描输入的图幅,由于原稿不干净等原因,总是会出现一些飞白、污点、线划边缘凹凸不平等。 图象预处理 第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换o 3、细化、细化 所谓细化就是将二值图像象元阵列逐步剥除轮

31、廓边缘的点,使之成为线划宽度只有一个象元的骨架图形。细化后的图形骨架既保留了原图形的绝大部分特征,又便于下一步的跟踪处理。 细化的基本过程是:(1)确定需细化的象元集合;(2)移去不是骨架的象元;(3)重复,直到仅剩骨架象元。第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换(1)、(2)是可剥去的,而(3)、(4)的中心点是不可剥去的。 第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换o 如果是对扫描后的地图图像进行细化处理,应符合下列基本要求:(1)保持原线划的连续性;(2)线宽只为一个象元;(3)细划后的骨架应是原线划的中心线;(4)保持图形的原有特征。第五节第

32、五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换o 4、追踪、追踪细化后的二值图像形成了骨架图,追踪就是把骨架转换为矢量图形的坐标序列。其基本步骤为:(1)从左向右,从上向下搜索线划起始点,并记下坐标。(2)朝该点的8个方向追踪点,若没有,则本条线的追踪结束,转(1)进行下条线的追踪;否则记下坐标。(3)把搜索点移到新取的点上,转(2)。o 注意的是,已追踪点应作标记,防止重复追踪。第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换o 5、拓扑化、拓扑化为了进行拓扑化,需找出线的端点和结点,以及孤立点。(1)孤立点:8邻城中没有为1的象元。如图(1)。(2)端点:8邻城中只有

33、一个为1的象元。如图(2)。(3)结点:8邻城中有三个或三个以上为1的象元。如图(3)。第五节第五节 矢量数据和栅格数据的转换矢量数据和栅格数据的转换拓扑化 第十二章第十二章 地理空间数据的质量地理空间数据的质量o GIS数据质量的研究是GIS的重要研究内容之一。长期以来,对GIS数据及其分析结果的误差分析和处理方法的研究,一直处于滞后状况,缺乏评定GIS的数据质量以及分析结果的可靠性的必要方法。第一节第一节 GIS数据质量的概念数据质量的概念o 关于数据质量研究的目的、意义、内容和类型以及评定数据质量的指标构成了数据质量的整体概念。关于评定指标,不同的数据使用目的,可能存在差别。第一节第一节

34、 GIS数据质量的概念数据质量的概念o 一、什么是一、什么是GIS的数据质量的数据质量 GIS的数据质量是指GIS中空间数据(几何数据和属性数据)在表达空间位置、属性和时间特征时所能达到的准确性、一致性、完整性以及三者统一性的程度。第一节第一节 GIS数据质量的概念数据质量的概念o二、二、GIS数据质量研究的目的数据质量研究的目的 GIS数据质量研究的目的是建立一套空间数据的分析和处理的体系,包括误差源的确定、误差的鉴别和度量方法、误差传播的模型、控制和削弱误差的方法等,使未来的GIS在提供产品的同时,附带提供产品的质量指标,即建立GIS产品的合格证制度。 从应用的角度,可把GIS数据质量的研

35、究分为两大问题。当GIS录入数据的误差和各种操作中引入的误差已知时,计算GIS最终生成产品的误差大小的过程称为正演问题。而根据用户对GIS产品所提出的误差限值要求,确定GIS录入数据的质量称为反演问题。显然,误差传播机制是解决正反演问题的关键。第一节第一节 GIS数据质量的概念数据质量的概念o 三、研究三、研究GIS数据质量的意义数据质量的意义 研究GIS数据质量对于评定GIS的算法、减少GIS设计与开发的盲目性都具有重要意义。如果不考虑GIS的数据质量,那么当用户发现GIS的结论与实际的地理状况相差较大时,GIS会失去信誉。第一节第一节 GIS数据质量的概念数据质量的概念o四、四、GIS的数

36、据质量的内容和类型的数据质量的内容和类型1、GIS数据质量的基本内容数据质量的基本内容GIS数据质量包含如下五个方面:(1)位置精度:如数学基础、平面精度、高程精度等,用以描述几何数据的质量。(2)属性精度:如要素分类的正确性、属性编码的正确性、注记的正确性等,用以反映属性数据的质量。(3)逻辑一致性:如多边形的闭合精度、结点匹配精度、拓扑关系的正确性等。(4)完备性:如数据分类的完备性、实体类型的完备性、属性数据的完备性、注记的完整性等。(5)现势性:如数据的采集时间、数据的更新时间等。第一节第一节 GIS数据质量的概念数据质量的概念o 2、空间数据的误差类型、空间数据的误差类型o GIS空

37、间数据的误差可分为源误差和处理误差。第一节第一节 GIS数据质量的概念数据质量的概念o(1) 源误差源误差是指数据采集和录入中产生的误差,包括:1遥感数据:摄影平台、传感器的结构及稳定性、分辩率等。2测量数据:人差(对中误差、读数误差等)、仪差(仪器不完善、缺乏校验、未作改正等)、环境(气候、信号干扰等)。3属性数据:数据的录入、数据库的操作等。4GPS数据:信号的精度、接收机精度、定位方法、处理算法等。5地图:控制点精度,编绘、清绘、制图综合等的精度。6地图数字化精度:纸张变形、数字化仪精度、操作员的技能等。第一节第一节 GIS数据质量的概念数据质量的概念o (2) 处理误差处理误差是指GI

38、S对空间数据进行处理时产生的误差,例如在下列处理中产生的误差就是处理误差。1几何纠正;几何纠正所用控制点的精度、纠正的数学模型精度是产生这类误差的主要原因。2坐标变换;控制点的布局、精度、转换的数学模型是产生这类误差的主要原因。3几何数据的编辑;在编辑过程中,结点、线的移动,交点的增加、删除、移动等都会产生编辑误差。第一节第一节 GIS数据质量的概念数据质量的概念4属性数据的编辑;属性取值的合理性是主要误差产生原因。5空间分析(如多边形叠置等);叠加算法的自动取舍、误差容限的给定是主要原因。6图形化简(如数据压缩);压缩算法是主要原因。7数据格式转换;数据格式转换会丢失数据信息,如拓扑关系信息

39、、属性信息等。8计算机截断误差;与算法规则有关。9空间内插;与内插的算法有关,与数据点的分布有关。10矢量栅格数据的相互转换。与算法有关,与二值化和细线化有关。二值化和细线化会影响线的中心位置的确定。栅格分辨率也是影响因素。第一节第一节 GIS数据质量的概念数据质量的概念o (3) GIS中的误差传播误差传播是指对有误差的数据,经过处理生成的GIS产品也存在着误差。误差传播在GIS中可归结为三种方式。1代数关系下的误差传播:这是指对有误差的数据进行代数运算后,所得结果的误差。2逻辑关系下的误差传播:即指在GIS中对数据进行逻辑交、并等运算所引起的误差传播,如叠置分析时的误差传播。3推理关系下的

40、误差传播:这是指不精确推理所造成的误差。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o 数据质量的研究涉及数据问题的检查方法、评价方法和标准等内容。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o 一、GIS数据质量问题的检查方法数据质量问题的检查方法 发现数据错误,探测数据精度和准确性,是研究数据质量的前提。GIS中对数据质量检查的方法主要有直接评价、间接评价和非定量描述等。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o 1、 直接评价法直接评价法(1)用计算机程序自动检测 某些类型的错误可以用计算机软件自动发现,数据中不符合要求的数据项的百分率或平均质量等

41、级也可由计算机软件算出。例如,可以检测文件格式是否符合规范、编码是否正确、数据是否超出范围等。 (2)随机抽样检测 在确定抽样方案时,应考虑数据的空间相关性。 第二节第二节 GIS数据质量的研究方法数据质量的研究方法o 2、间接评价法、间接评价法 所谓间接评价法是指通过外部知识或信息进行推理来确定空间数据的质量的方法。用于推理的外部知识或信息如用途、数据历史记录、数据源的质量、数据生产的方法、误差传递模型等。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o 3、非定量描述法、非定量描述法 非定量描述法是指通过对数据质量的各组成部分的评价结果进行的综合分析来确定数据的总体质量的方法。第

42、二节第二节 GIS数据质量的研究方法数据质量的研究方法o 二、研究二、研究GIS数据质量的常用方法数据质量的常用方法o 1、敏感度分析法、敏感度分析法 一般而言,精确确定GIS数据的实际误差非常困难。为了从理论上了解输出结果如何随输入数据的变化而变化,可以通过人为地在输入数据中加上扰动值来检验输出结果对这些扰动值的敏感程度。然后根据适合度分析,由置信域来衡量由输入数据的误差所引起的输出数据的变化。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o 为了确定置信域,需要进行地理敏感度测试,以便发现由输入数据的变化引起输出数据变化的程度,即敏感度。这种研究方法得到的并不是输出结果的真实误差

43、,而是输出结果的变化范围。对于某些难以确定实际误差的情况,这种方法是行之有效的。o 在GIS中,敏感度检验一般有以下几种:地理敏感度、属性敏感度、面积敏感度、多边形敏感度、增删图层敏感度等。敏感度分析法是一种间接测定GIS产品可靠性的方法。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o 2、尺度不变空间分析法、尺度不变空间分析法o 地理数据的分析结果应与所采用的空间坐标系统无关,即为尺度不变空间分析,包括比例不变和平移不变。尺度不变是数理统计中常用的一个准则,一方面在能保证用不同的方法能得到一致的结果,另一方面又可在同一尺度下合理地衡量估值的精度。o 也就是说,尺度不变空间分析法使

44、GIS的空间分析结果与空间位置的参考系无关,以防止由基准问题而引起分析结果的变化。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o 3、Monte Carlo实验仿真实验仿真o 由于GIS的数据来源繁多,种类复杂,既有描述空间拓扑关系的几何数据,又有描述空间物体内涵的属性数据。对于属性数据的精度往往只能用打分或不确定度来表示。对于不同的用户,由于专业领域的限制和需要,数据可靠性的评价标准并不相同。因此,想用一个简单的、固定不变的统计模型来描述GIS的误差规律似乎是不可能的。在对所研究问题的背景不十分了解的情况下,Monte Carlo实验仿真是一种有效的方法。第二节第二节 GIS数据

45、质量的研究方法数据质量的研究方法o Monte Carlo实验仿真首先根据经验对数据误差的种类和分布模式进行假设,然后利用计算机进行模拟试验,将所得结果与实际结果进行比较,找出与实际结果最接近的模型。对于某些无法用数学公式描述的过程,用这种方法可以得到实用公式,也可检验理论研究的正确性。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o 4、空间滤波、空间滤波 获取空间数据的方法可能是不同的,既可以采用连续方式采集,也可采用离散方式采集。这些数据采集的过程可以看成是随机采样,其中包含倾向性部分和随机性部分。前者代表所采集物体的实际信息,而后者是由观测噪声引起的。第二节第二节 GIS数据

46、质量的研究方法数据质量的研究方法o 空间滤波可分为高通滤波和低通滤波。高通滤波是从含有噪声的数据中分离出噪声信息;低通滤波是从含有噪声的数据中提取信号。例如经高通滤波后可得到一随机噪声场,然后用随机过程理论等方法求得数据的误差。o 对GIS数据质量的研究,传统的概率论和数理统计是其最基本的理论基础,同时还需要信息论、模糊逻辑、人工智能、数学规划、随机过程、分形几何等理论与方法的支持。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o三、数据采集中数据质量的评价内容三、数据采集中数据质量的评价内容 GIS中数据采集的方法通常可分为直接方法和间接方法两种。直接方法是指直接从野外采集,以获取

47、观测数据、图像等,间接方法是指从已有的图件上进行采集。o 直接方法获 取的数据受人差、仪差、环境等的影响,但已有传统的方法可以解决。间接方法获取的数据中,除了含有直接方法中的误差外,还有展绘控制点的误差、编绘的误差、制图综合的误差,数字化的误差等。o 地图数字化是获取矢量数据的主要方法之一,也是GIS中的重要误差源,是GIS数据质量研究的重点之一。在地图数字化中,原图固有误差和数字化过程中引入的误差是两个主要的误差源。下面对地图数字化的数据误差作一分析。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o1、地图固有误差的来源和类型、地图固有误差的来源和类型 在地图的固有误差中,除了含有

48、控制点和碎部点引入的误差外,至少存在下列误差:(1)控制点展绘误差 展绘控制点是成图的第一步。当对地图的精度要求不高时,该项误差可不考虑。(2)编绘误差通常点状特征的编绘精度优于线状特征的编绘精度,即使都是线状特征,如果分辨率或宽度不同,编绘精度也不同。(3)绘图误差绘图误差是在绘图过程中产生的,其误差范围为0.060.18mm.。(4)综合误差综合误差的大小取决于特征的类型和复杂程度,又取决于采用的制图综合方法,如取舍、移位、夸大等,因此,综合误差极难量化。第二节第二节 GIS数据质量的研究方法数据质量的研究方法(5)地图复制误差和分版套合误差 这些都是地图印刷中产生的误差,如地图复制误差的

49、均方差为0.10.2mm。(6)绘图材料的变形误差 地图一般印在纸上,随着温度和湿度的变化,纸张的尺寸也会变化。由于纸张在印刷时温度升高,纸张长度会伸长1.5%,宽度会伸长2.5%;而当纸张干燥和冷却后,其长度和宽度又分别收缩0.5%和0.75%。因此,在地图印刷完成后,图纸在长、宽方向上的净伸长分别为0.99%和1.73%。(7)特征的定义自然界中的许多特征并无明确的界限。例如,海岸线的位置、森林的边界等,但在地图上却有明确的位置。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o2、数字化的误差、数字化的误差 目前的地图数字化方式主要有跟踪数字化和扫描数字化两种。数字化的精度主要受数字化仪的精度、数字化方式、操作员的水平、数字化软件的算法等的影响,常采用下列方法进行评价。 (1)自动回归法 在对线划进行跟踪数字化的过程中,每隔一定时间和距离就记录一次坐标值,因此可以认为这些数据是序列相关的。即某一点误差的大小,除受该点本身的影响外,还受前一点误差的影响。 由于跟踪数字化不仅是一个随机序列,而且是一个时间序列,因此可用数理统计中的时间序列分析法来确定数字化的误差。第二节第二节 GIS数据质量的研究方法数据质量的研究方法o (2)Band法 Band法又称误差带方法,即在一条数字化线的两侧,各定义宽为的范围,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论