第五讲 元数据与空间数据质量_第1页
第五讲 元数据与空间数据质量_第2页
第五讲 元数据与空间数据质量_第3页
第五讲 元数据与空间数据质量_第4页
第五讲 元数据与空间数据质量_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Page

1第5讲元数据与空间数据质量Page

2元数据与空间数据质量

学习目标:1、理解元数据的概念,了解空间数据元数据所用到的概念;2、了解空间数据元数据的分类和标准;3、了解空间数据元数据的获取方法;4、弄清为什么在地理信息系统中使用元数据5、说明空间数据元数据的应用6、理解空间数据质量及其相关概念7、了解空间数据质量评价的标准,并分析造成数据质量问题的来源8、说明控制空间数据质量的措施Page

3第一节空间数据的元数据一、元数据概念与分类二、空间数据元数据所涉及的概念三、空间数据元数据的标准四、空间数据元数据的获取与管理五、空间数据元数据的应用Page

4一、元数据概念与分类元数据(Metadata)“meta”是一希腊语词根,意思是“改变”,“Metadata”一词的原意是关于数据变化的描述。一般都认为元数据就是“关于数据的数据”,即关于数据的描述性数据信息。在地理空间数据中,元数据说明数据内容、质量、状况和其他有关特征的背景信息。

(联想:纸质地图的元数据)随着计算机技术和GIS技术发展,特别是网络通信技术的发展,空间数据共享日益普遍。管理和访问大型数据集的复杂性正成为数据生产者和用户面临的突出问题。在这种情况下,空间数据的内容、质量、状况等元数据信息变得更加重要。地理信息元数据标准和操作工具已经成为空间空间数据基础设施的一个重要组成部分。Page

5元数据产生背景一、元数据概念与分类1、元数据概念元数据:是关于数据变化的描述,是描述数据的数据,它应尽可能多地反映数据集自身的特征规律,以便于用户对数据的准确、高效与充分的开发与利用。关于元数据认识的共同点是:元数据的目的是促进数据集的高效利用,并为计算机辅助软件工程服务。Page

6Page

72、元数据的内容元数据的内容包括:

(1)对数据的描述,对数据集中各数据项,数据来源、数据所有者、数据序代(数据生产历史)等的说明;

(2)对数据质量的描述,如数据精度、数据的逻辑一致性、数据完整性、分辨率、源数据的比例尺等;(3)对数据处理的说明,如量纲的转换等;

(4)对数据转换方法的描述;

(5)对数据库的更新、集成方法等的说明。Page

83、元数据的主要作用(1)帮助数据生产单位有效地管理和维护空间数据,建立数据文档;(2)提供有关数据生产单位数据存储、数据分类、数据内容、数据质量、数据交换网络及数据销售等方面的信息,便于用户查询检索地理空间数据;(3)提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息;(4)帮助用户了解数据,以便就数据是否能满足其需求作出正确的判断;(5)提供有关信息,以便用户处理和转换有用的数据。Page

94、元数据的表达形式

元数据的表达形式:元数据也是一种数据,在形式上与其他数据没有区别,它可以以数据存在的任何一种形式存在。主要的形式是与元数据内容标准相一致的数字形式,数字形式的元数据可以用多种方法建立、存储和使用。(1)最基本的方法是文本文件。(2)元数据的另一种形式是用超文本链接标示语言(HTML)编写的超文本文件,用户可用浏览器查阅元数据。(3)用通用标示语言(SGML)建立元数据。SGML提供一种有效的方法连接元数据便于在空间数据交换网络上查询。Page

105、元数据的分类

分类原则不同,元数据的分类体系和内容将会有很大的差异,主要分类方法有:根据元数据的内容分类根据元数据描述对象分类根据数据在系统中的作用分类根据元数据的作用分类

Page

11(1)根据元数据的内容分类科研型元数据:主要目标是帮助用户获取各种来源的数据及其相关信息,主要任务是帮助科研工作者高效获取所需数据。评估型元数据:主要服务于数据利用的评价。模型元数据:用于描述数据模型的元数据,与描述数据的元数据在结构上大致相同。Page

12(2)根据元数据描述对象分类数据层元数据:指描述数据集中每个数据的元数据。属性元数据:关于属性数据的元数据。实体元数据:是描述整个数据集的元数据。Page

13(3)根据数据在系统中的作用分类系统级别元数据:指用于实现文件系统特征或管理文件系统中数据的信息。应用层元数据:指有助于用户查找、评估、访问和管理数据等与数据用户有关的信息。Page

14(4)根据元数据的作用分类说明元数据:是为用户使用数据服务的元数据。多为描述性信息,侧重数据库的说明。控制元数据:是用于计算机操作流程控制的元数据,这类元数据有一定的关键词和特定的句法来实现。Page

15二、空间数据元数据所涉及的概念空间数据:用于确定具有自然特征或者人工建筑特征的地理实体的地理位置、属性及其便捷的信息;类型:在元数据标准中,数据类型指该数据能接收的值的类型;对象:

对地理实体的部分或整体的数字表达;实体类型:对于具有相似地理特征的地理实体集合的定义和描述;点:

用于位置确定的零维地理对象;结点:

拓扑连接两个或多个链或环的一维对象;标识点:

显示地图或图表时,用于特征标识的参考点;Page

16线:

一维对象的一般术语;线段:

两个点之间的直线段;弧:

由数学表达式确定的点集组成的弧状曲线;链:

两个结点之间的拓扑关联;链环:

非相切线段或由结点区分的弧段构成的有方向无分支序列;环:

封闭状不相切链环或弧段序列;多边形:

在二维平面中由封闭弧段包围的区域;二、空间数据元数据所涉及的概念Page

17外多边形:

数据覆盖区域内最外侧的多边形,其面积是其他所有多边形的面积之和;内部区域:

不包括其边界的区域;格网:

组成一规则或近似规则的棋盘状镶嵌表面的格网集合,或者组成一规则或近似规则的棋盘状镶嵌表面的点集合;格网单元:

表示格网最小可分要素的二维对象;矢量:

有方向线的组合;栅格:

同一格网或数字影像的一个或多个叠加层;二、空间数据元数据所涉及的概念Page

18像元:

二维图形要素,它是数字影像最小要素;栅格对象:

一个或多个影像或格网,每一个影像或格网表示一个数据层,各层之间相应的格网单元或像元一致且相互套准;图形:

与预定义的限制规则一致的零维、一维和二维有拓扑相关的对象集;数据层:

集成到一起的面域分布空间数据集,它用于表示一个主体中的实体,或者有一公共属性或属性值的空间对象的联合;二、空间数据元数据所涉及的概念Page

19层:

在有序系统中数据层、级别或梯度序列;纬度:

在中央经线上度量,以角度单位度量离开赤道的距离;经度:

经线面到格林威治中央经线面的角度距离;经圈:

穿过地球两极的地球的大圆圈;坐标:

在笛卡尔坐标系中沿平行X轴和Y轴测量的坐标值;投影:

将地球球面坐标中的空间特征(集)转化到平面坐标体系时使用的数学转换方法;二、空间数据元数据所涉及的概念Page

20投影参数:

对数据集进行投影操作时用于控制投影误差、变形实际分布的参考特征;地图:空间现象的空间表征,通常以平面图形表示;现象:

事实、发生的事件、状态等;分辨率:由涉及到或使用的测量工具或分析方法能区分开的两个独立测量或计算的值的最小差值;质量:

数据符合一定使用要求的基本或独特的性质;二、空间数据元数据所涉及的概念Page

21详述:

用一对数或三个数分别直接描述水平位置和三维位置的方法;介质:

用于记录、存储或传递数据的物理设备。二、空间数据元数据所涉及的概念Page

22三、空间数据元数据的标准

空间数据元数据标准的建立是空间数据标准化的前提和保证,只有建立起规范的空间数据元数据才能有效利用空间数据。目前,空间数据元数据已形成了一些区域性或部门性的标准。下表为有关空间数据元数据的几个现有主要标准。Page

23三、空间数据元数据的标准元数据标准名称建立标准的组织CSDGM地球空间数据元数据内容标准FGDC,美国联邦空间数据委员会GDDD数据集描述方法MEGRIN,欧洲地图事务组织CGSB空间数据集描述CSC,加拿大标准委员会CEN地学信息—数据描述—元数据CEN/TC287DIF目录交换格式NASAISO地理信息ISO/TC211Page

24三、空间数据元数据的标准

美国联邦空间数据委员会(FGDC)的空间数据元数据内容标准的影响较大,该标准用于确定地学空间数据库的元数据内容。该标准于1992年7月开始起草,1994年7月8日,FGDC正式确认该标准。该标准将地学领域中应用的空间数据元数据分为7个部分,它们是:数据标识信息、数据质量信息、空间数据组织信息、空间参照系统信息、地理实体及属性信息、数据传播及共享信息和元数据参考信息。元数据标准化这一问题逐渐成为共享地学信息的热点。元数据标准依赖于信息共享标准的理论。Page

25三、空间数据元数据的标准Page

26四、空间数据元数据的获取与管理

空间数据的地理特征要求对数据的各种操作,从数据获取、数据处理、数据存储、数据分析、数据更新等方面应有一套面向地理对象的方法,相应的空间数据元数据的内容和相关的操作也就具有了不同于其它类数据元数据的特点。空间数据元数据的获取空间数据元数据的管理Page

271、空间数据元数据的获取

获取分为三个阶段:数据收集前、数据收集中和数据收集后。对于模型元数据,这三个阶段分别是模型形成前、模型形成中和模型形成后。第一阶段的元数据是根据要建设的数据库的内容而设计的元数据,内容包括:(1)普通元数据;(2)专指性元数据;

Page

281、空间数据元数据的获取第二阶段的元数据随数据的形式同步产生。第三阶段的元数据是在上述数据收集到以后,根据需要产生的。获取方法:(1)键盘输入法:一般工作量大且易出错,如有可能应尽量避免。(2)关联表法:是通过公共项(字段)从已存在的元数据或数据中获取有关的元数据。(3)测量法:易使用且出错少。(4)计算法:由其他元数据或数据计算得到的元数据。(5)推理法:根据数据的特征获取元数据。在元数据获取的不同阶段,使用的方法也有差异。在第一阶段主要是键盘输入法和关联表法;第二阶段主要是采样测量法;第三阶段主要是计算法和推理法。Page

292、空间数据元数据的管理

空间数据元数据的理论和方法涉及到数据库和元数据两方面。由于元数据的内容、形式的差异,元数据的管理与数据涉及的领域有关,它通过建立不同数据领域基础上的元数据信息系统实现的。在元数据管理系统中,物理层存放数据与元数据,该层由一些软件通过一定的逻辑关系与逻辑层关联起来。在概念层中用描述语言及模型定义了许多概念,如实体名称、允许属性值的类型、缺省值、允许输入与输出的内容、元数据的变化、操作模型等。通过这些概念及其限制特征,经过与逻辑层关联可获取、更新物理层的元数据及数据。Page

30五、空间数据元数据的应用使用元数据的原因空间数据元数据的应用Page

311、使用元数据的原因完整性:元数据可以帮助实现类与类之间的相互印证。可扩展性:动态变化元数据信息可以有意地延伸一种计算机语言或者数据库特征的语义。特殊化:元数据可以表达继承机制的信息。安全性:类的信息表示为元数据,在系统运行时,可以被类检测者访问。查错功能:在查错时使用元数据信息,有助于检测可运行应用系统的解释和修改状态。浏览功能:为数据的控制开发浏览器时,为显示数据,要求能解译数据的结构,而这些信息是以元数据来表达的。程序生成:如果允许访问元数据,则可以利用关于结构的信息自动生成程序。Page

322、空间数据元数据的应用帮助用户获取数据:通过元数据,用户可以对空间数据库进行浏览、检索和研究等。空间数据质量控制:无论是统计数据还是空间数据都存在数据精度问题。影响空间数据精度的原因主要有两个方面:一是源数据精度;二是数据加工处理过程中精度质量的控制情况。空间数据质量控制的主要内容有:(1)由准确定义的数据字典,说明数据的组成、各部分的名称和表征的内容等。(2)保证数据逻辑科学地集成,要求数据按一定逻辑关系有效地组合。(3)有足够的说明数据来源、数据的加工处理过程、数据解译的信息。Page

332、空间数据元数据的应用在数据集成中的应用:数据集层次的元数据记录了数据格式、空间坐标体系、数据的表达形式、数据类型等信息;系统层次和应用层次的元数据则记录了数据使用软硬件环境、数据使用规范、数据标准等信息。这些信息在数据集成的一系列处理中,如数据空间匹配、属性一致化处理、数据在各平台之间的转换使用等是必需的。这些信息能够使系统有效地控制系统中的数据流。数据存储和功能实现:元数据系统用于数据库的管理,可以避免数据的重复存储,通过元数据建立的逻辑数据索引可以高效查询检索分布式数据库中任何物理存储的数据,减少用户查询数据库及获取数据的时间,从而降低数据库的费用。Page

34第二节空间数据的质量空间数据质量的概念空间数据质量评价空间数据质量问题的来源与分析数据质量控制Page

35一、空间数据质量的概念空间数据:是对有关空间位置、专题特征及时间信息的符号纪录,是对现实世界中空间特征和过程的抽象表达。空间数据质量:空间数据在表达实体空间位置、特征和实践所能达到的准确性、一致性、完整性和三者统一性的程度,以及数据适应于不同应用的能力。Page

36二、空间数据质量评价与数据质量相关的几个概念空间数据质量标准Page

371、相关概念误差:

数据与真值之间的差异准确度:测量值与真值之间的接近程度精度:

对现象描述的详细程度不确定性:关于空间过程和特征不能准确确定的程度,在真值不可测或无法知道时,取代误差。空间分辨率:两个可测量数值之间最小的可辨识的差异。比例尺:地图上一个记录的距离和它所表现的“真实世界的”距离之间的一个比例。Page

382、空间数据质量标准

空间数据质量标准是生产、使用和评价空间数据的依据。数据质量是数据整体性能的综合体现。其主要内容如下:数据说明:要求对空间数据的来源、数据内容及其处理过程等作出准确、全面和详尽的说明。位置精度:指空间实体的坐标数据与实体真实位置的接近程度,常表现为空间三维坐标数据的精度。属性精度:指空间实体的属性值与其真值相符的程度。它取决于地理数据的类型,常常与位置精度有关。时间精度:指时间的现势性。可以通过数据更新的时间和频度来体现。Page

392、空间数据质量标准逻辑一致性:指地理数据关系上的可靠性,包括数据结构、数据内容,以及拓扑性质上的内在一致性。完整性:指地理数据在范围、内容及结构等方面满足所有要求的完整程度,包括数据范围、空间实体类型、空间关系分类、属性特征分类等方面的完整性。表达形式的合理性:指数据抽象、数据表达与实体的吻合性,包括空间特征、专题特征和时间特征表达的合理性等。:Page

40三、空间数据质量问题的来源与分析源误差

空间现象自身存在的不稳定性

空间现象的表达操作误差空间数据使用中的误差Page

41Page

421、源误差地面测量数字数据的误差地图数字化数据的误差遥感数据的误差Page

43(1)地面测量数字数据的误差

来源于地面测量的数字数据中含有控制测量和碎部测量误差。其中控制点误差又受控制网的参考基准、网形和观测精度以及观测费用等因素的影响。碎部点误差除继承了控制点的误差外,还受自身的观测方法、观测精度和地界的人为判断,以及地物地貌的取舍等因素的影响。当然,原始观测误差受观测仪器、观测者和外界环境三种因素影响。地面测量数据中的误差可以表现为随机误差、系统误差或粗差。一般而言,粗差可采用可靠性理论探测剔除,系统误差可采用实验方法校正或建立系统误差模型处理,随机误差可采用随机模型,如最小二乘法平差处理。利用误差传播规律可求得点坐标的方差—协方差矩阵或误差椭圆(球)元素来表达点坐标数据的精度。

测量方面的误差通常考虑的是:系统误差、操作误差和偶然误差。Page

44(2)地图数字化数据的误差

地图数字化是GIS数据来源之一,原图固有误差和数字化过程误差是地图数字化数据误差的主要来源。原图固有误差除含有上述地面控制测量和碎部测量的全部误差外,还含有制图误差。制图误差数字化误差Page

45①制图误差控制点展绘误差:展绘控制点是成图的第一步。编绘误差:地形图的编绘一般用摄影测量手段把各种原始资料化为同一比例尺的过程,其中所引入的误差大约在0.30~0.33毫米之间。绘图误差:这项误差是在绘图过程中产生的。综合误差:地图综合误差的大小取决于特征的类型与复杂程度,故该项误差极难量化。Page

46①制图误差地图复制误差:地图复制误差的均方差为0.1~0.2毫米。分色版套合误差:该项误差的均方差为0.17~0.30毫米。绘图材料的变形误差:地图一般印刷于纸质载体上,随着温度和湿度的变化,纸的尺寸也会改变。归化到同一比例尺所引起的误差:地图的比例尺是指真实的主比例尺,在将地图数字化或从地图量距时,必须利用适当的比例尺因子进行修正。Page

47①制图误差特征的定义:自然界的许多特征并无明确的界限。特征定义会引起特征位置的某些不确定性,但并非所有的特征都有此误差。特征夸大误差:为了增强地图的易读性,有时需要夸大某些特征,因为它们在图上难以按其真实情况表示。由于很难知道制图过程中各种误差间的关系以及图纸尺寸的不稳定性,因此,很难准确地评价原图固有误差。Page

48②数字化误差

数字化方式主要有手扶跟踪数字化和扫描数字化。在生产实践中,采用扫描数字化,然后屏幕半自动化跟踪。线划跟踪与扫描数字化所引起的平面误差较小,只是在扫描时,要素结合处出现的误差较大。手扶跟踪数字化引起的误差主要与被数字化的要素对象、作业员和数字化仪有关。要素对象:要素本身的宽度、密度和复杂程度对数字化误差有显著影响。Page

49②数字化误差作业员:作业员的经验与技能主要表现在选择最佳点位、跟踪曲线和判断十字丝与目标重合程度的能力等方面。数字化仪:数字化仪的分辨率对数字化误差有决定性影响。一般在选择数字化仪时采用经济实用的原则。Page

50(3)遥感数据误差

遥感数据的误差积累过程可以分为:数据获取误差、数据预处理误差和人工判读误差等。数据获取误差:遥感资料获取时存在着多种误差。其中有些误差源是可控的,有些则是不可控的,可控的数据获取误差又包括几何误差和遥感平台误差。数据预处理误差:数据预处理包括利用地面控制对原始数据进行的几何校正、图像增强和分类等。这些预处理会引入各种各样的误差。Page

51(3)遥感数据误差人工判读误差:在数据分析和判读阶段会引入人工判读误差。在GIS中使用遥感数据时,人工判读会影响随后的地图分析结果。Page

522、操作误差

除了地图原始录入数据本身带有的源误差外,空间数据处理操作中还会引入新误差。由计算机字长引起的误差

空间数据处理中的误差在计算机中,数据是由一定字长的编码表示的。舍入误差是由计算机字长引起的一种误差。除了数据处理精度外,数据存储精度也与计算机字长有关。Page

53(1)空间数据处理中的误差投影变换:地图投影是三维地球椭球面到二维平面的拓扑变换。在不同投影形式下,地理特征的位置、面积和方向的表现会有误差。数据格式转换:在矢量格式和栅格格式之间的转换中,数据所表达的空间特征的位置具有差异性。数据抽象:在数据发生比例尺变换时,对数据进行聚类、归并、合并等操作时产生的误差。建立

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论