GIS软件工程_08GIS软件数据工程_第1页
GIS软件工程_08GIS软件数据工程_第2页
GIS软件工程_08GIS软件数据工程_第3页
GIS软件工程_08GIS软件数据工程_第4页
GIS软件工程_08GIS软件数据工程_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第8章 基本内容介绍。 教学要求:。 重点:。 GIS的数据源:地图数据 ,遥感数据, 统计数据,实测数据,数字数据,文字报告和立法文件。8.1 概述8.1.1 GIS的数据源现实世界现实世界文字报告、文字报告、遥感图象等遥感图象等数据源数据源? ?数据源的审查过程:(1)确定数据的内容。(2)确定数据的格式。(3)确定数据的精度。8.1.2 数据源的审查过程 1. GIS的数据组成 (1) 属性数据属性数据指能够通过传统表格形式进行描述的文本数值型信息。(2)空间数据空间数据指矢量或栅格形式表示的具有空间意义的图件。(3)多媒体数据8.1.3 GIS数据组成和特点(4)文档数据文档数据指具有

2、强制性的法律法规和规划方案说明等的电子文档。 2.数据特点(1)来源广泛(2)数据性质差别大(3)数据存在强关联1)空间数据和属性数据共同表示实体的空间属性和非空间属性。2)属性数据之间的关联,在数据库中体现为关联表。3)空间数据内部存在的空间关系,包括位置关系和拓扑关系。(4)数据更新快,历史数据丰富(5)一些数据具有法律意义(6)具有空间分散性和逻辑一致性要求3.数据使用的特点(1)数据使用并发性强(2)用户数据需求差异大(3)共享性强(4)与并行系统紧密结合 1.空间特征空间特征指空间物体的位置、形状和大小等几何特征,以及与相邻物体的拓扑关系。2.专题特征专题特征指的是除了时间和空间特征

3、以外的空间现象的其他特征。3.时间特征空间数据总是在某一特定时间或时间段内采集得到或计算产生的,因此时间可被看成一个专题特征。 8.2 空间数据的特征8.2.1 空间数据的基本特征 量测的尺度由粗略至详细依次可分为四个层次:命名(类型)、次序、间隔以及比例。(1)命名式的测量尺度只对特定现象进行标识,赋予一定的数值或符号而不定量描述。(2)次序测量尺度是基于对现象进行排序来标识的。(3)间隔测量尺度指无真零值而测量单位的间隔是相等的数据。(4)比例测量尺度指有真零值而测量单位的间隔是相等的数据。命名数据或次序数据便于使用,理解,而不够精确;间隔数据或比例数据与之相反。8.2.2 空间数据的测量

4、尺度数据源可分为原始数据(第一手数据)或处理加工后的数据(第二手数据),又可将数据源分为非电子数据和电子数据两类。第一手数据资料经解译、编辑和处理后,就变成第二手数据,这类数据包括地图、表格、书和杂志中的地理编码数据。 8.2.3 空间数据的来源空间数据的类型:(1)类型数据(2)面域数据(3)网络数据(4)样本数据(5)曲面数据(6)文本数据(7)符号数据空间数据的表示可采用X,Y平面坐标,地理经纬度或者网格法等方法表示。8.2.4 空间数据的类型和表示方法8.3 GIS数据的规范化和标准化数据流的调查分析是建立新系统逻辑模型的基础,而数据信息的规范化和标准化,则是数据流调查分析的依据。通过

5、数据流的调查分析,一方面要根据系统的信息需求确定数据源,另一方面要按照数据信息的不同来源,研究它们的数量、质量、精度和时间特征,以及它们与数据规范化和标准化基本要求相吻合的程度,以确定数据处理的内容、范围和方法。地理数据规范化和标准化的内容有:统一的空间定位框架、统一的数据分类标准、统一的数据编码系统、统一的数据记录格式、统一的数据采集原则和统一的数据测量标准。统一的空间定位框架是为各种数据信息的输入、输出和匹配的处理提供共同的地理坐标基础。该基础可归纳为地理坐标、网络坐标和投影坐标。我国GIS所采用的投影应与国家基本图系列所采用的投影相一致,即1:1万至1:50万比例尺图幅采用高斯克吕格投影

6、是一种保角投影,在每一副图范围内无角度变形,其最大长度变形不超过0.14,面积变形不超过0.28,精度可满足使用要求。小于1:100万比例尺的图幅采用等角圆锥投影。8.3.1 统一的空间定位框架 格网系统的选择有基本格网、加密格网、合并格网和辅助格网四种划分方法。1.基本格网,分为三级(1)一级格网(1:10000000图幅)(2)二级格网(1:100000图幅)(3)三级格网(1:10000 图幅)2.加密格网,分为六级(1)1/2格网(1:5000图幅)(2)1/4格网(1:2500图幅)(3)1/8格网(1:1000图幅)(4)1/16格网(1:500图幅)(5)1/96格网(1:100

7、图幅)(6)1/384格网(1:25图幅)3.合并格网,分为五级(1)2倍格网(1:25000图幅)(2)4倍格网(1:50000图幅)(3)16倍格网(1:200000 图幅)(4)24倍格网(1:250000图幅)(5)48倍格网(1:500000图幅)4.辅助格网,指对于从1:100001:50000比例尺的数据文件,通过采用平面直角坐标作为辅助格网。8.3.2 统一的数据分类标准 信息分类体系采用宏观的全国分类系统与详细的专业系统之间相递归的分类方案,即低一级的分类系统必须能归并和综合到高一级的分类系统之中。首先,按社会环境、自然环境、资源与能源三大类,作为第一层。其次,按环境因素和资

8、源类别的主要特征与基本差异,再划分为十四个二级类。第三,按每一个二级类包括的最主要的内容,作为第三级类别。最后,按各个区域的地理特点和用户需求,拟定区域的分类系统和每一专业类型的具体分类标准。8.3.3 统一的数据编码系统 制定系统编码应遵循的原则:(1)系统性:指信息系统中空间信息的编码应统一规划、统筹安排。(2)一致性:指任何专业名词、术语的定义必须严格保持概念的一致。(3)科学性:指编码能可靠地识别数据信息的分类。(4)标准化:指代码的内容和长度必须一致,码位的分配及格式必须一致。(5)扩展性:指系统编码码位应留有充足的余地。(6)适用性:以较少的码位提供丰富的参考信息。数据记录格式是指

9、GIS的原始数据和输出数据在磁性介质内的记录方式,对不同来源和不同形式的数据,都必须按照标准的记录格式记录,以保证系统对各种数据信息的接纳、处理和共享。数据记录格式包括多边形数据格式、栅格数据格式的影像数据格式。多边形数据记录格式采用弧段为基本的逻辑单元,其数据文件将由结点文件、弧段属性文件、弧段坐标文件和多边形文件所组成。栅格数据记录格式采用同质数据串作为基本的逻辑单元。 8.3.4 统一的数据记录格式8.3.5 统一的数据采集原则数据采集应遵循的原则:(1)只采集、存储基本的原始数据,不存储派生数据,根据应用的频度、实现最小的冗余。(2)各级统计部门提供的数据为最基本数据,当其他部门提供的

10、数据与它有矛盾时,以统计部门的为准。(3)统计部门未进行统计的指标,以各地最直接的专业部门提供的数据为准。数据采集应遵循的原则:(4)当上级部门和下级部门提供的数据有出入时,以上级部门核准的数据为准。(5)对未进行统计的数据,需经多个专家研究,取得与实际情况相符的数据。(6)地理地图应以最新出版的实测地图为准,专题图最好采用比例尺一致的区域系列图作为图形库的基本数据。 8.4 地理信息的分类和编码分类是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程。地理信息分类码主要用于对数据进行存储、管理、检索和交换。在设计和建立GIS数据库时,利用分类码实现对数据的

11、有效组织和存储。在采集数据时,利用分类码作为用户标识码输入数据。在维护管理数据库时,利用分类码检索数据的精度和完整性,对数据层进行调整或重新组织。8.4.1 地理信息的分类和编码的意义8.4.2 地理信息的分类和编码的原则地理信息的分类和编码的原则:(1)科学性(2)系统性(3)稳定性(4)不受比例尺限制(5)兼容性(6)完整性和可扩展性(7)适用性(8)灵活性地理信息分类与编码的基本方法:1.线分类法(级分类法)线分类法将初始的分类对象按所选定的若干个属性或特征依次分成若干个层级目录,并编排成一个有层次的、逐级展开的分类体系。线分类法的优点:容量较大,层次性好,使用方便。线分类法的缺点:分类

12、结构一经确定,不易改动,当分类层次较多时,代码位数较长。8.4.3 地理信息分类与编码的基本方法2.面分类法面分类法是将给定的分类对象按选定的若干个属性或特征分成彼此互不依赖、互不相干的若干方面,每个面中又可分成许多彼此独立的若干个类目。面分类法的优点:具有较大的弹性,一个面内类目的改变,不会影响其他面,且适用性强,易于添加和修改类目。面分类法的缺点:不能充分利用容量。 信息编码是将信息分类的结果用一种易于被计算机和人识别的符号体系表示出来的过程,是人们统一认识、统一观点、相互交换信息的一种技术手段。 1.地理实体与地理目标的类型 (1)地理实体GIS地理数据库是地理实体的集合,是一种与现实的

13、地理世界保持一定相识性的实体模型。地理实体即地理数据库中的实体,是一种在现实世界中不能再划分为同类现象的现象。地理目标即实体在地理数据库中的表示。地理目标的表示方法随比例尺、目的等情况的变化而变化。8.4.4 地理实体的分类(2)地理实体的类型地理实体的类型:1)点状实体指只有特定的位置,而没有长度的实体。2)线状实体指有长度的实体。3)面状实体(多边形、区域)是对湖泊、岛屿、地块等一类现象的描述。4)体状实体用于描述三维空间中的现象与物体,它具有长度、宽度及高度等属性。 (3)地理目标的类型地理目标是地理实体在计算机系统内的表示,地理目标的类型可按空间维来定义。0维:有位置无长度的目标,如点

14、。1维:有长度的目标,一般由两个或多个0维目标组成,如线。2维:有长和宽的目标,如多边形。3维:有长、宽和高的目标,如三维立体。 (4)地理实体的描述编码:用于区别不同的实体。编码包括分类码和标识码。分类码标识实体所属的类别,标识码对每个实体进行标识,是惟一的,用于区别不同的实体。位置:用坐标值的形式给出实体的空间位置。类型:指明该地理实体属于哪一种实体类型,或由哪些实体类型组成。行为:指明该地理实体可以具有哪些行为和功能。属性:指明该地理实体所对应的非空间信息。说明:说明实体数据的来源、质量等相关信息。关系:与其他实体的关系信息。(5)地理实体时间维的描述当地理实体的空间位置随时间变化时,这

15、时必须把地理实体的空间特征的变化也记录下来,同时对实体进行时间标记。2.几何数据的分类几何数据分为矢量数据和栅格数据两种类型。 3.地理目标数据的分层地理目标数据可按某种属性特征形成一个数据层,即图层。图层是描述某一地理区域的某一属性特征的数据集。地理目标数据的分层方法:(1)按专题分层每个图层对应一个专题,包含某一种或某一类数据。(2)按时间序列分层把不同时间或时期的数据分别构成各个数据层。地理目标数据分层的目的是为了便于空间数据的管理、查询、显示、分析等。8.4.5 地理实体属性数据的编码1.属性数据的含义属性数据是描述实体数据的属性特征的数据。在属性数据中,有一部分是与几何数据的表示密切

16、有关的。例如,道路的等级、类型等,决定着道路符号的形状、色彩、尺寸等。在GIS中,通常把这部分属性数据用编码的形式表示,并与几何数据一起管理起来。 2.属性数据的分级(1)分级的基本原则1)确定分级数的基本原则分级数应符合数值估计精度的要求。分级数应顾及可视化的效果。分级数应符合数据的分布特征。在满足精度前提下,应尽可能选择较少的分级数。2)确定分级界线的基本原则保持数据的分布特征。在任何一个等级内都必须有数据,任何数据都必须落在某一个等级内。尽可能采用有规则变化的分级界线。分级界线应当凑整。(2)分级的基本方法分级的基本方法:数学方法。标准的分级方法。定性的分级方法。 3.属性数据的编码编码

17、:是指确定属性数据的代码的方法和过程。 代码:是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。 编码的直接产物就是代码,而分类分级则是编码的基础。(1)代码的功能1)鉴别:代码代表对象的名称,是鉴别对象的惟一标识。2)分类:当按对象的属性分类并分别赋予不同的类别代码时,代码又可作为区分分类对象类别的标识。 3)排序:当按对象产生的时间、所占的空间或其他方面的顺序关系排列并分别赋予不同的代码时,代码又可作为区别对象排序的标识。(2)编码的基本原则1)惟一性2)合理性3)可扩性4)简单性5)适用性6)规范性(3)代码的类型代码的类型是指代码符号的表示形式

18、,其类型有数字型、字母型、数字和字母混合型。(4)GIS中代码的种类 GIS中代码分为两种,即分类码和标识码。分类码是根据地理信息分类体系设计出的各专业信息的分类代码,用以标识不同类别的数据,根据它可以从数据中查询出所需类别的全部数据。标识码是在分类码的基础上,对每类数据设计出其全部或主要实体的识别代码,用以对某一类数据中的某个实体,进行个体查询检索。(5)编码方法举例1)标识码示例2)分类码示例标识码由定位分区和各要素实体代码两个主要码段构成。(1)根据各个城市空间分布特点和习惯,将城市划分为若干基本单元,即定位分区。每个分区给定一个惟一的代码,称为定位分区代码。(2)对于不同要素实体,根据

19、它们各自的数量、质量和分布特征,采用若干位字符数字混合码作为要素实体代码。8.4.6 地理信息实体的标识码结构8.4.7 城市地理实体的标识码方案1.城市定位分区的划分与编号(1)区:定位区可以行政区划分作为基础。(2)带:以全市的几条区域主干道为主,将全市划分为若干带,用一位数字表示,由西向东或由南向北顺序编码。(3)片:每个基础单元被其他主干道和干道进一步分割成片。片号由两位数字码表示,按由西向东,由南向北的顺序编码。2.地块、宗地和建筑物标识码(1)地块标识码地块指不被城市道路穿越,土地性质单一的一块连续完整的规划城市用地,地块是规划信息中最小的公共图形单元。地块标识码由定位分区代码和地

20、块号构成。(2)宗地识别码宗地是独立权属单位的用地,宗地识别码由定位分区代码和宗地码构成。(3)建筑物识别码建筑物以“栋”作为统计单位。建筑物识别码由地块识别码和建筑物序号构成。3.道路和路段识别码道路是地理信息中重要的定位基础。道路与路段识别码应能反映道路的地理位置、走向、性质和路段。编码原则:(1)道路走向码规定南北向1东北西南向2东西向3东南西北向4(2)道路序号规定主干道在全市范围内统一编号,路序号从01开始,其他干道路序号顺次递减。在主干道识别码中,其定位分区代码均为0。(3)关于路段序号规定路段序号为一位数字。识别码的前七位构成道路识别码,全部八位构成路段识别码。4.路口识别码路口

21、识别码由定位分区代码与路口序号组成。5.综合管线标识码采用道路识别码作为其定位码。序号为沿道路延伸的同类管线顺序号,一般为1。数据源是建立GIS数据库所需各种数据的来源。数据源选择应考虑:(1)数据源的内容。(2)数据源的精度和质量。(3)数据源现势性。(4)数据源加工难易程度。(5)数据源介质。(6)数据源形式。8.5 数据预处理8.5.1 数据源的选择8.5.4 预处理的基本内容预处理的基本内容:(1)现势更新。(2)专题地图转绘。(3)图面处理。(4)统计报表整理。(5)数据转换。(6)制作预处理图。8.5.5 图幅数据的处理图幅数据的处理的目的是获得与地图直角坐标一致的数据,并且使得不

22、同地图的投影坐标取得统一。图幅数据的处理就是图幅内x,y坐标数据的变换。图幅数据的坐标变换包括:1、比例尺变换2、变形误差改正3、坐标旋转和平移4、投影变换8.5.6 空间数据的压缩处理1.栅格数据的压缩栅格数据的压缩方法:(1)游程长度压缩编码法。(2)四叉树压缩编码法。2.图形数据的综合图形数据的综合是由于数据属性的重新分类和空间图形的化简而伴随需要的一种数据压缩形式,它包括相邻界线的删除和共同属性的合并。8.5.7 空间数据类型的转换空间数据类型的转换包括:(1)矢量向栅格转换点:简单的坐标变换 。线:线的栅格化 。面:线的栅格化 +面填充。 面(多边形)的填充方法 : 内部点扩散法、扫

23、描法、射线法、复数积分法、边界代数算法 。 (2)栅格向矢量转换从栅格单元转换为几何图形的过程为矢量化;要求(矢量化过程应保持):1)栅-矢转换为拓扑转换,即保持实体原有的连通性、邻接性等;2)转换实体保持正确的外形。方法:1)实际应用中大多数采用人工矢量化法,如扫描矢量化,该法工作量大,成为GIS数据输入、更新的瓶颈问题之一。2)程序转化转换 8.6 数据采集数据采集:就是将空间实体的图形数据和属性数据输入到地理数据库。数据采集的工作分为:(1)野外数据的采集。(2)图形数据的采集。(3)属性数据的采集。(4)图形数据和属性数据的连接。8.6.1 野外数据的采集方法1.GPS方法GPS技术是

24、依靠导航卫星来决定地球上某一位置坐标的技术。2.摄影测量方法使用摄影测量方法应考虑:(1)控制点(2)比例尺(3)提取的特征(4)数字正射影像数据(5)多边形数据的提取(6)目前主要三种测量方法:立体测图仪法、正射影像图生成、软拷贝摄影测量。3.测量数据8.6.2 地图数据的采集方法地图数据是GIS主要的信息源,对它的采集主要是指对地图进行数字化。地图数字化是指将地图转换为可为计算机系统识别的数据文件,这种数据文件符合一定的数据格式,其有特定的比例尺和精度,包含各空间要素在某一坐标系统中的位置和属性,可通过接收其格式的软件系统管理、提取、分析和编辑制图。数据采集方法:1.手工方法用于录入栅格和

25、矢量地图以及统计和实测数据。2.手扶跟踪数字化(1)手扶跟踪数字化仪根据采集数据的方式分为机械式、超声波式和全电子式。(2)数字化过程将需数字化的图件固定在数字化板上,然后设定数字化范围,输入有关参数,设定特征码清单,选择数字化方式,就可以按地图要素的类别分别实施图形数字化。地图跟踪数字化软件的基本功能:1)图幅信息录入和管理功能。2)特征码清单设置。3)数字化键值设置。4)数字化参数定义。5)数字化方式的选择。6)控制点输入功能。3.自动扫描数字化(1)地图扫描设备地图扫描设备是用来将地图按一定精度转换为栅格格式数据文件的硬件装置,栅格数据文件中每个像元表示地图上一个矩阵区域的反射或投射强度

26、。扫描仪是直接把图形和图像扫描输入到计算机中,以象素信息进行存储表示的设备。常用地图扫描设备有CCD摄像机和电子扫描仪两类。(2)扫描过程扫描时,必须先进行扫描参数的设置,包括:1)扫描模式的设置,对地形图的扫描一般采用二值扫描,或灰度扫描。2)扫描分辨率的设置,根据扫描要求,对地形图的扫描一般采用300dpi或更高的分辨率。3)针对一些特殊的需要,还可以调整亮度、对比度、色调、GAMMA(反差系数)值等。4)设定扫描范围(3)扫描数据处理1)二值化主要通过彩色分类、色度变换、局部或整体域值技术实现扫描数据的二值化,以便压缩数据和提取线划信息。2)细化细化将扫描影像中的线划减细为中心的单像元线

27、,为矢量化做准备。3)矢量化及冗余去除矢量化可以在细化图像的基础上通过搜索八领域完成。4)断线修复通过判断断点距离、断线方向、属性和拓扑关系等可以实现部分自动修复。5)要素提取要素提取的内容:a.空间要素提取b.填充晕线提取c.字符符号提取要素提取主要通过颜色、结构、方向、尺寸、形状、交角、线宽、位置、线数以及上下文关系的检测实现。6)符号识别7)属性赋值(4)交互式地图扫描数字化人机交互需完成的任务:1)编辑修改扫描栅格数据,剔除噪声、粘连和不能识别及难以提取的符号和空间要素。2)对矢量化后的矢量数据进行编辑,修改错误、连接断线、剔除无用的要素。3)指定用于自动识别不同类型空间要素所需的各种

28、参数及空间范围。4)交互式追踪提取某些空间要素。5)空间要素部分或全部属性赋值。属性数据即空间实体的特征数据,一般包括名称、等级、数量、代码等多种形式。属性数据常常包括统计数据、遥感影像数据、实测数据、和其他系统的数据。属性数据的采集方法:(1)键入法。(2)使用光学的字符识别技术。(3)在数字化或矢量化的过程中赋值。(4)人工编辑。(5)影像处理和信息提取。(6)数据通信。8.6.3 属性数据的采集方法1.空间数据输入的误差空间数据输入的误差:(1)几何数据的不完整或重复。(2)几何数据的位置不正确。(3)比例尺不正确。(4)变形。(5)几何数据和属性数据的连接有误。(6)属性数据错误。8.

29、6.4 空间数据的检索2.空间数据的检查空间数据的检查方法:(1)通过图形实体与其属性的联合显示,发现数字化中的遗漏、重复、不匹配等错误。(2)在屏幕上用地图要素对应的符号显示数字化的结果,对照原图检查错误。(3)把数字化的结果绘图输出在透明材料上,然后与原图叠加以便发现错误。(4)对等高线,通过确定最低和最高等高线的高程及等高距,编制软件来检查高程的赋值是否正确。(5)对于面状要素,可在建立拓扑关系时,根据多边形是否闭合来检查,或根据多边形与多边形内点的匹配来检查等。(6)对于属性数据,通常是在屏幕上逐表逐行检查,也可打印出来检查。(7)对于属性数据还可编写检核程序。(8)对于图纸变形引起的误差,应使用几何纠正进行处理。3.图形显示GIS提供以下功能:(1)符号设计与符号库建立功能。(2)符号设置功能。(3)注记配置功能。(4)图形显示功能。(5)查询功能。(6)绘图输出功能。格式转换分为不同数据介质之间的转换和数据结构间的转换。对于栅格结构,当同时要使用二种及二种以上组织形式的数据时,便要将其转换为对当前工作适用的统一的格式。对于矢量结构,有弧、节点组织形式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论