4.地质图空间数据库数据模型与空间数据库质量基本概念.ppt_第1页
4.地质图空间数据库数据模型与空间数据库质量基本概念.ppt_第2页
4.地质图空间数据库数据模型与空间数据库质量基本概念.ppt_第3页
4.地质图空间数据库数据模型与空间数据库质量基本概念.ppt_第4页
4.地质图空间数据库数据模型与空间数据库质量基本概念.ppt_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、李超岭LCHAOLINGMAIL.CGS.GOV.CN中国地质调查局发展研究中心,2009年12月10日,空间数据库技术与空间数据库质量,内容提纲,一、数据模型的基本概念 二、数据模型发展现状与趋势 三、地质图空间数据库数据模型特点 四、地质图空间数据库标准主要内容 五、地质空间要素编码体系 六、空间数据库质量基本概念 七、空间数据评价要求与示范,一、数据模型的基本概念,数据模型是一种数据(实体)、数据(实体)之间的联系以及有关语义约束规则的形式化描述,属数据管理的范畴。 通俗地说,数据模型规定数据的内容、结构、行为和语义。 (1)内容定义应该包括什么,不包括什么; (2)结构是描述数据之间的

2、关系; (3)行为用可执行的操作表示; (4)语义则对属性域的有效性进行约束,如数据类型、取值范围(包括代码范围)以及缺省值等,关系,根据ISO 19109通用要素模型的定义,空间对象类之间主要存在两种关系。一种是泛化/特化关系,即类继承关系;二是关联。对象常用的关联又分两种类型:聚集(分为强聚集、弱聚集)、空间与拓扑。 继承是面向对象技术的重要特征,通过类继承子类继承父类的属性和行为,并增加新的属性和行为以实现类的扩展。该特征对地学数据模型具有特殊的意义。在基础地学数据模型的基础上,可通过要素或对象类的扩展建立具体数据库的数据模型,使得具体数据库的内容既有自己的特色,又可在主要内容上与基础数

3、据模型保持一致。这种机制有利于实现基础数据模型的指导作用,有利于多源数据的集成与共享(下页图)。,关系,键,实体的有些属性不仅仅能够描述她,还能唯一地区别她。实体的唯一特性可能通过一个属性来表达,也可能由许多属性组合起来表达。这些特性称为主键。当主键由多个特性组成时,则称为复合键。当有一个主键选择集合时,每种选择都被称为候选键。,域与基数,域即属性域:是属性有效值的规则,用于限制在对象类的任何具体属性允许的值。每个要素类有一个属性域的集合,属性域可分为缺省值、值的范围、代码范围等。通过对属性域的有效性检查,可减少数据输入的错误。 基数:A类对象与B类对象在数量上的对应称为基数。主要包括4种基本

4、基数,即一对一、一对多、多对一和多对多。,面向对象的数据模型的基本概念,从现实世界中客观存在的事物(即对象)出发,尽可能运用人类的自然思维方式构造的,具有下列特征的数据模型称为面向对象的数据模型: (1)类是对象的抽象描述,具有相同属性和行为的对象可归为一类; (2)类用属性、行为和关系描述。属性描述静态特征,行为描述动态特征; (3)对象的静态特征与动态特征结合在一起称为封装,使其成为不可分割的独立单位; (4)可描述对象间的各种关系:如多重性、聚集、复合、组合以及空间关系和拓扑关系等。支持各种空间分析以及用简单对象构成复杂对象等; (5)通过不同程度上的抽象,类可分为超类和子类。子类继承超

5、类的属性与行为。通过这种类继承可支持类的扩展;,二、当前数据模型的发展趋势与研究现状,第一代:基于文件图形管理方式 第二代:基于文件图形与属性管理方式 第三代:地理数据模型(面向对象) 数据库从集中式向分布式、个人数据库向大型数据库发展是当前数据库技术发展一大趋势。,2020/8/19,10,数据模型技术发展的特点,(1)地理数据库模型的物理建模越来越接近逻辑建模,地理数据库数据对象与逻辑数据模型的对象越来越相同。地理数据库模型,不需要任何编码,可以执行大多数用户的行为。大多数用户的行为可以通过属性域、确定规则和软件提供的框架功能提供。这些都是当前大型GIS空间数据发展的趋势。 (2)数据模型

6、是一种数据(实体)、数据(实体)之间的联系以及有关语义约束规则的形式化描述,属数据管理的范畴。随着技术的发展,应用的深入,在更大的范围及更多的领域实现数据集成与共享的需求越来越迫切,导致数据模型的研究已从研究建立单个数据库的数据模型向研究建立专题或领域数据模型发展。,2020/8/19,11,数据模型技术发展的特点,(3)两种主要的建模方法:ER建模方法与面向对象的建模方法。 (4)从现实世界中客观存在的事物(即对象)出发,尽可能运用人类的自然思维方式构造面向对象的数据模型.,英国、美国、加拿大、德国等国家在数据模型的研究进展与现状(2004-2005),在研究我国新一代地质图数据模型的同时,

7、走访了英国、加拿大、德国等国家,对他们在数据模型方面的研究与技术进行了跟踪与分析。 如BGS,在数据模型中,具有集中式、统一科学语言(语义) 编码、数据模型与比例尺无关的特点,现已用4000万英镑改造新的数据模型(10年),其新的数据模型与我国新一代的数据模型基本一致。 又如,德国在制作1/50万欧洲地质图时,也非常注意地质图数据模型的研究,在德国地质调查局1/50万欧洲地质图工作室里,我们详细的研究和讨论了1/50万欧洲地质图的数据模型,发现总体框架与我国新一代的数据模型基本一致,说明了国外也在积极的采用新一代的数据模型,也证明了我国新一代的数据模型确实代表了当前技术发展的趋势。,2020/

8、8/19,13,数据建模技术路线,1、基于大型数据库技术的原则 基于数据库技术的地质或地学数据模型与个人地理数据库模型不同之处是: 基于数据库技术的地质图数据模型要实现一个多用户多源、异构集成的GIS系统,需要从一个好的数据模型设计和数据库协调开始。而个人地理数据库不需要协调。 2、 采用UML建模表示法 采用UML命名法或命采用名空间。 3、使用三层模型的方法进行研究 概念信息模型、逻辑数据模型和物理数据模型分析阶段所提交的最重要的内容是概念信息模型。该模型只应当描绘出具体领域或者应用的实体。在概念模型被转换成逻辑数据模型时,需要增加对象来支持物理的事件和实现事件,同时要解决基数,并进行规范

9、化和有选择的反规范化技术。从逻辑数据模型转向物理数据模型过程中,地学数据模型要充分考虑软件所提供的技术支持。,数据建模技术路线,(4)通过组成地质图基本要素类和对象类出发,处理和把握存储与组织的关系,不是直接存储关联的结果或是某一项目最终的结果,而是采用关联、依赖、组合和继承来描述对象之间的关系规则来构成新的关联集合的技术,大大增强了数据库服务能力。,RGMAP,数据库建模趋势,传统问题:单个项目,数据孤岛,数据库群,领域数据模型,语义的一致性,元实体1,关联、组合(聚集与组成)、依赖、继承,逻辑实体A,逻辑实体B,逻辑实体N,元实体1,元实体N,物理层,数据库模型建模技术,第一步:建立包括地

10、质实体的空间要素与非空间特性信息的建模、语法、语义、机制和约定。形成地质信息内容标准. 第二步:对内容标准进行适当的裁减,然后按照应用模式规则生成了地质各专业的通用数据模型. 第三步:用户可以根据的地质信息内容标准和地质各专业的通用信息数据模型及实现规范,通过扩展形成地质各专业的信息数据模型。,2020/8/19,17,以往建模问题,在已有数据模型或建模中,由于侧重于项目需求的建模,加上受于个人数据库技术的限制,使领域内的数据建模在数据(实体)、数据(实体)之间的联系以及有关语义约束规则的形式化描述,数据模型规定数据的内容、结构、行为和语义缺乏一致性描述,一定程度上影响了为地质科学数据的共同理

11、解提供基础,使基础数据模型可以被设计成能够适合各种数据结构数据的结构能力也相当有限。 目前,开始了基于第四代数据模型的研究与应用(包括地质领域本体)。,地理数据库模型,地理数据库模型采用面向对象技术。把研究的实体作为对象,并把对象分为要素类和对象类,通过关系类定义要素类与要素类、对象类与对象类、要素类与对象类的关系。是当前最先进的空间数据库数据模型之一。地理数据库模型是当前空间数据库模型的典型代表。目前,ESEI已率先ARCGIS9实现。 MAPGIS7目前在数据模型的改造也以地理数据库模型为原型。,地理数据库模型,1.要素 现实世界中现象的抽象; 真实世界中的地理对象在地图上的表示; 要素具

12、有几何和属性; 地理数据库中有几何类型字段的对象; 地理数据库中要素被存储在要素类中; 2.要素类 相同类型要素的几何; 要素分类的概念性表示; 一种描述地理要素的格式分类; 在地理数据库中具有几何信息的对象类就叫要素类;,2020/8/19,20,地理数据库模型基本构架,(1)地理数据库可存储多个要素数据集(矢量数据)、多个栅格数据集、多个TIN数据集; 对象、要素和关系类的数据根据不同的特征和应用要求既可置于要素数据集之内,也可置于要素数据集之外; (2)具有平面拓扑关系(线与面的平面拓扑是一个区域的连续覆盖、且要素之间具有公共边界)的要素必须在同一数据集内; (3)几何网络主要指管网、交

13、通的路网、地理信息的水系 (4)对属性域的限制及有效性规则为保证系统效率,应直接置于数据库下。,三、地质图空间数据库技术特点,1.建立国家地质图类数据模型系统 通过概念信息模型、逻辑数据模型和物理数据模型的分析与研究基础上获得数据模型建模方法,在确定和研究描述粒度、空间粒度、语义粒度、存储粒度的基础上,根据地质图属于基础数据库类原则,建立了由15个基本要素类,8个综合要素类、12个对象类组成的地质图空间数据模型。并给出了地质图的数据(实体)、数据(实体)之间的联系以及有关语义约束规则的形式化描述,对数据模型规定数据的内容、结构、行为和语义进行一致性的描述。,国家地质图类数据模型系统 发明专利,

14、特点2.突出了数据关系,通过组成地质图基本要素类和对象类出发,处理和把握存储与组织的关系,不是直接存储关联的结果或是某一项目最终的结果,而是采用关联、依赖、组合和继承来描述对象之间的关系规则来构成新的关联集合的技术,大大增强了数据库服务能力。如根据不同的需求,通过关系类建立要素类和对象类之间的关系,可以根据关联、依赖、组合和继承来描述对象之间的关系规则构成的新关联集合,大大的扩大了数据库应用的灵活性和增强了应用目的性。,3 建立了空间粒度、描述粒度、语义粒度、存储粒度的相互关系、分割,借用“语法与语义”的定义: 语法是指语言中词与词相互结合的结构方式和结构关系。 而语义是指语言的单位所表示的客

15、观事物及其相互之间的关系。 语法是形式,语义是内容。内容决定形式,形式又反作用与内容。,本次建模通过空间粒度、描述粒度、语义粒度、存储粒度的相互关系与分割技术的研究,实现了与比例尺无关的地质图数据模型。,空间粒度、描述粒度、语义粒度、存储粒度的相互关系、分割,地质图“语法”结构 在数字地质图中,语法是描述组成地质图中地质体与地质体相互关系的结构方式和结构关系,重点是解决要素与对象的结构方式与关系 (规则). 通过不同比例尺地质调查的工作要求,确定以下粒度: 语义的粒度-即描述地质体的内容的详细程度 空间的粒度-即描述地质实体的空间位置与形态的详细程度 这种语法结构与语义的粒度的所构成的描述地质

16、图的结构方式和结构关系,通过数据模型的组织(存储粒度-既数据库群的组织与关系约束),解决了与比例尺无关的地质图数据模型,空间粒度、描述粒度、语义粒度、存储粒度的相互关系、分割,存储粒度: 采用面向对象数据库技术,通过要素类、对象类及其关系的数据模型设计,把基于语义的粒度控制下与比例尺无关的地质调查描述的结构方式和结构关系进行组织和存储,其最大的特点是,通过组成地质调查的基本要素类和对象类出发,处理和把握存储与组织的关系,不是直接存储关联的结果或是某一(集合)实体属性最终的结果,而是采用关联、依赖、组合和继承来描述对象之间的关系规则,通过规则可构成更多新的关联集合实体,真正实现数据模型与比例尺无

17、关的目的。,空间粒度、描述粒度、语义粒度、存储粒度的相互关系、分割,特点4:完整的拓扑关系,合理解决拓扑关系带来的一系列问题。采用要素数据类与要素数据集的数据模型来解决过去图层所带来的拓扑关系不合理的问题。采用(空间)对象类-要素类的概念,合理的解决分类与空间数据表达的人为性。如同物异类、点状实体表达为面实体。,特点5-6,5.易于操作 采用(非空间)对象类解决了非空间实体的数据组织。通过关系(基数),使属性更加容易维护和扩展。 6. 建立了子类型,提高了信息组织完整性和灵活多样性 提出了地质点、面、线要素类和对象类的子类型的概念。通常一个要素类所有对象有相同的行为和属性,但并不是所有的对象共

18、享相同的属性域。当一个要素类的对象使用不同的属性域时,使用不同属性域的对象就构成要素类的子类型。该概念的应用大大的提高了信息组织完整性和灵活多样性。,7 在数据模型中定义了关系类的规则,在在本标准中,采用关联、依赖、组合和继承来描述对象之间的关系规则构成的关联集合,在建立要素类与对象类的关系类时,增加了必须遵循编码原则(即是关系类的命名原则)。,8 开发了基于空间数据库建库流程的空间数据库建库工具,(1)自动继承实际材料图要素类的空间数据和属性数据 (2)自动继承实际材料图要素类的属性数据到全部对象类数据 (3)自动继承实际材料图要素类的属性数据到指定对象类数据 (4)要素类数据输入 (5)对

19、象类数据输入 (6)自动给要素类赋ID值 (7)选择产状合并到空间数据库(产状无属性) (8)选择1:20万地质图数据合并到空间数据库,特点9:实现不同比例尺地质图具有相同的数据库结构,建立1/50000、1/250000比例尺统一描述的地质图数据库。也能适用于其它比例尺的地质图空间数据建库。实现不同比例尺地质图具有相同的数据库结构。 考虑了数据继承的因素,提供多种机制,允许用户按规则挂接自己的数据库。,特点10:建立了地质图空间数据库建库的业务流程化,结合数字填图技术,在完全实现野外路线观测过程的全数字化描述的基础上,以当前第三代地理数据库模型,通过PRB数据流“栈”与不同阶段数据模型的关系

20、(图2),创建PRB数据流“栈”与不同阶段数据模型继承和传递的技术, 通过野外路线数据库、野外总图数据库、实际材料图数据库、剖面数据库不同阶段数据库的互通(图3)创建地质图空间数据库。,四、地质图空间数据库标准 (2006版)内容组成,面向对象的类的通用描述框架(基于ISO 19109与ISO 19107),地质图空间数据库建模依据,ARCGIS 1999-,地理数据库体系的数据组织模型,地理数据库模型采用面向对象技术。把研究的实体作为对象,并把对象分为要素类和对象类,通过关系类定义要素类与要素类、对象类与对象类、要素类与对象类的关系。,地质图空间数据库组织模型,地质图空间数据库组织模型把地质

21、图数据组织成关系型的数据对象:对象类、要素类、关系类、综合要素类和要素数据集。 一个对象类在地理数据库是一个表,存储非空间数据。一个要素类是具有相同几何类型和相同属性的要素的集合。一个要素数据集是共享空间参考系统的要素类的集合。关系类是由一个关系规则构成的关联集合(可以用关联、依赖、组合和继承来描述对象之间的关系规则)。综合要素类与要素类相同,是共享空间参考系统的多个要素类的集合,在地质图数据模型中,由复合地质点、面、线要素实体类构成。不具其他要素类构成拓扑关系。该数据模型对空间要素的定义更接近于现实世界,这种面向对象的数据模型,使用户可以根据具体的需要进行扩展,具有用户可定定义的特征(指对象

22、类)。,标准主要内容,根据地质图属于基础数据库类原则, 本次标准在开始构架框架时, 通过专家的讨论建议专题图内容不列入考虑的内容。因此,本标准对于地质图空间数据库而言,建立了15个基本要素类,8个综合要素类、12个对象类。若干独立要素类。,地质图空间数据库数据模型,15 个 基 本 要 素 类,8 个 综 合 要 素 类,12 个 对 象 类,5 个 独 立 要 素 类,1要素数据集,要素数据集是共享空间参考系统的要素类的集合。 在地质图数据模型中,由地质点、面、线要素实体类构成。一个要素数据集的空间参考指定了它的坐标系统、空间域和精度。坐标系统:可以是地理坐标、UTM坐标、平面坐标。空间域:

23、描述X,Y坐标范围、测量范围、Z范围,空间域描述了最大的空间范围。 要素数据集或独立要素的空间参考确定后,坐标系统可以改变,空间域则是固定的。,2子类型,地质点、面、线要素类还可以有子类型。即一个要素类或表中的所有对象有相同的行为和属性,但并不是所有的对象共享相同的属性域。当一个要素类或表中的对象使用不同的属性域时,使用不同属性域的对象就构成要素类或表的子类型。一个对象的子类型是由其子类型代码值决定的,子类型代码以整型字段存储在要素类或表中,每一个子类型在给定的字段可以有它自己的缺省值集合和属性域,并且关联有不同的连接规则。当需要通过缺省值、属性域、连接规则、关系规则区分对象时,就需要对单一的

24、要素类或表建立不同的子类型。当根据不同的行为、属性、访问权限或对象来区分对象时,必须建立另外的要素类。,3独立要素类,在地理数据库中建立一个不属于任何要素数据集的要素类。其特点是独立要素类需要建立自己的空间参考坐标系统,并设定自己的投影系统参数和/X/Y域。在地质图数据模型中,图例及图饰部分属于独立要素类。,4关系类,地理数据库中对象之间的关联称为关系。关系可以存在于空间对象(要素类中的要素)之间,非空间对象(表中的行)之间,以及空间对象和非空间对象之间。 关系类可以有一个关系规则构成的关联集合(可以用关联、依赖、组合和继承来描述对象之间的关系规则),关系规则控制源类中的那些对象子类型可以同目

25、标类中哪些对象子类型相关联,也可以用于指定所有允许的子类型的有效基数范围。 关联: 组合:聚集与组成 依赖: 继承:,5对象类,在数据库中, 对象类是一个表,存储非空间数据。在地质图数据模型中,一般一个要素类对应多个对象类。当一个表中的对象使用不同的属性域时,可以使用子类型来构成不同属性域的对象类。,6综合要素类,与要素类相同,是共享空间参考系统的要素类的集合。在地质图数据模型中,由复合地质点、面、线要素实体类构成。不具其他要素类构成拓扑关系。,地质图空间数据库标准 说明,见标准正文 从第八章开始,1 地质体面实体(_GeoPolygon) 含戈壁沙漠;冰川与终年积雪;面状水体与沼泽等参加空间

26、拓扑的地理实体 2 地质(界)线(_GeoLine) 3 脉岩(点)(_Dike) 4 蚀变(点)(_Alteration_Pnt) 5 矿产地(点)(_Mineral_Pnt) 6 产状(_Attitude) 7 样品(_Sample),8 摄像(照片)(_Photograph) 9 素描(_Sketch) 10 化石(_Fossil) 11 同位素测年(_Isotope) 12 火山口(_Crater) 13 钻孔(_Drillhole) 14 泉(_Spring) 15 河、湖、海、水库岸线(_Line_Geography),基本要素数据集,地质体面实体:除地质体之外还包含戈壁、沙漠、冰

27、川与终年积雪、面状水体与沼泽等参加空间拓扑的地理实体 。 地质界线:包含地层界线、完整的断层(遥感解译断层中未经地质勘查证实的和隐伏断层放入整饰图层)、参加拓扑的水体界线 。 河、湖、海、水库岸线:包含1:25万地形图中所有的水体界线。,综合要素数据集,1 构造变形带(_Tectzone) 2 蚀变带(面)(_Alteration_Polygon) 3 变质相带(_Metamor_Facies) 4 混合岩化带(_Migmatite_Zone) 5 矿化带(_Mineral_Zone) 6 火山岩相带(_Volca_Facies) 7 大型滑坡(崩塌)体(_Landslide) 8 标准图框(

28、内图框)(_Map_Frame),综合要素类与要素类相同,是共享空间参考系统的要素类的集合。在地质图数据模型中,由复合地质点、面、线要素实体类构成。不与其他要素类构成拓扑关系。,综合要素类与基本要素类共享空间参照系。 除标准图框外,其他七类综合要素类都用多边形表示,不参与空间拓朴,与地质体面实体为覆盖关系。,对象数据集,1 沉积(火山)岩岩石地层单位(_Strata) 2 侵入岩岩石年代单位(_Intru_Litho_Chrono) 3 侵入岩谱系单位(_Intru_Pedigree) 4 变质岩地(岩)层单位(_Metamorphic) 5 特殊地质体(_Special_Geobody) 6

29、 非正式地层单位(_Inf_Strata),7 断层(_Fault) 8 脉岩(面)(_Dike_Object) 9 戈壁沙漠(_Desert) 10 冰川与终年积雪(_Firn_Glacier) 11 面状水域与沼泽(_Water_Region) 12 图幅基本信息(_Sheet_Mapinfo),断层对象类从地质界线( _GEOLINE.wl )中提取 图幅基本信息从标准图框(_MAP_FRAME.wl )中提取 其它10个对象类皆从地质体面实体(_GEOPOLYGON.wp)中提取,(四)独立要素类,是一个不属于任何要素数据集的要素类 在地质图空间数据库中建立一个不属于任何要素数据集的要

30、素类。其特点是独立要素类需要建立自己的空间参考坐标系统,并设定自己的投影系统参数和/X/Y域。,在地质图数据模型中,图例及图饰部分(如:接图表、图例、综合柱状图、责任表、图切剖面、其他角图等)属于独立要素类。该独立要素类可采用平面坐标系。,五、地质空间要素编码体系,1、代码要解决的问题 2、空间数据库分类方法 3、编码原则 4、中国地质矿产本体代码结构与编码规则,一、代码要解决的问题,分类编码主要解决以下5个层次的问题: 第一层次,解决数据库命名空间问题。 第二层次,解决要素类名称或对象类名称数据库命名空间或代码的问题 第三层次,解决要素(要素是组成要素类的属性)和对象名称据库命名空间和代码问

31、题,相当于数据库中的字段名称或具体的属性值 第四层次,解决要素和对象的取值的代码和值域,相当于数据库中的每一个记录中的每一个字段的具体的属性值 第五层次,解决要素和对象的每个实体的唯一代码,代码组成一定和分类代码有关,有利于应用人员识别该实体的物理意义,并保证唯一性。在空间数据库中,二、空间数据库分类方法,1、分类法 Classification method 用分类号表达主体概念,依据知识分类将主题概念组织、排列成类目体系,主要以类目体系的自身结构显示概念之间关系的标引语言。 2、主题法subject indexing 用受控的自然语言语词直接表达主题概念,按语词字排列主题概念。 3、本体分

32、类法 Ootology classification 基于本体理论体系的分类方法(明确、形式化、共享、概念化-知识体系)。 4、等级体系法method of grading systematic classification 以知识分类为基础,依据概念限定的逻辑划分方法,把实体内容相同特征和形式因素概括为一类,并加以组织形成层层隶属的等级树状结构体系。,空间数据库分类方法,5线分类法 method of linear classification 将分类对象按所选定的若干个属性(或特征),逐次地分成相应的若干个层级,每个层级又分为若干类目,同一分支的层级类目之间构成并列关系,不同层级类目之间构

33、成隶属关系GB/T 10113-2003。 6面分类法 method of faceted classification 选定分类对象的若干属性(或特征),将分类对象按每一属性(或特征)划分成一组独立的类目,每一组类目构成一个“面”。再按一定顺序将各个“面”平行排列。使用时根据需要将有关“面”中的相应类目按“面”的指定排列顺序组配在一起,形成一个新的类目GB/T 10113-2003。 7分面组配法method of composite classification 把实体所涉及到的知识领域划分为几个基本范畴,根据基本范畴详尽列举各种简单概念,并配予相应的号码。在进行标引时,根据实体所涉及的范

34、畴进行有序配组,构成信息资源的隐含体系,也称后组式分类法。著名的组配式分类法有冒号分类法(印度图书馆学家),布立斯书目分类法(英国分类法研究小组)。,空间数据库分类方法,8体系-组配法 method of systematic- composite classification 是体系分类法和分面组配法结构相互渗透和结合的产物,在体系列举类目的结构基础上,广泛采用组配方法,因此也称为半分面法。较著名的有欧洲各国使用的国际十进分类法,特点是复分组配。 9混合分类法 method of commingling classification 将线分类法和面分类法组合使用,以其中一种分类法为主,另一种

35、做补充的信息分类发GB/T 10113-2003。,中国地质领域本体基本类目分类代码,中国地质领域本体基本类目分类代码,三、编码规则(1),基本原则: (1)编码以有含义代码为主,无含义代码为辅的原则。 (2)基本领域大纲采用约定顺序码原则,在此基础上,下位类采用系列顺序码的原则。 (3)在实体编码中,采用并置码与组合码联合使用的原则(复合、部分有依赖与层次)。 (4)在用于描述实体的属性为主编码中(如数据库字段名称、数据库名称等),采用字母格式代码的原则, 代码的格式以英文主题词方式(带采用Pascal 大小写命名形式约束缩写规则)。,三、编码规则(2),中国地质领域本体分类编码结构由领域整

36、体编码、典型类独立编码、要素或对象的实体代码结构体系构成。其编码规则如下: 1、领域整体编码体系采用缩写码编码规则。 2、二级类目编码规则:一二级类目通指为数据库名称或数据库表名称,如地质领域基本大纲名称、要素类名称或对象类名称。该类目代码采用主题法标引。具体要求: 采用地质本体分类术语中的英文主体词; 如果主题词单词过长,缩减方式采用Pascal 大小写命名形式。Pascal 大小写命名形式是指名称中单词的第一个字母大写:GeologicalMap, TopographicalMap。,三、编码规则(3),由于目前大多数空间数据库(或软件)多采用水平分幅,垂直分层的特点,导致数据组织具有主题

37、(地质本体分类)+空间位置(图幅)结合的特点,因此,如果编码规则仅提供主题法标引,很难满足当前软件对数据组织的要求。所以,在考虑要素类名称或对象类名称的编码规则时,在地质本体分类的基础上,应增加空间与时间(版本)编码的要素(见7.2说明)。,三、编码规则(4),3、三至N级类目的编码原则: 三至N级三四级类目通常包括数据库表的表名、数据库表结构的字段名称和数据库中要素或对象实体的属性值等。其规则如下: 数据库表的表名、数据库表结构的字段名称的编码规则, 与二级类目编码规则相同。 数据库中要素或对象实体的属性值的编码规则,采用本分类法编码规则。 已经在地质领域常用或引用其他领域的分类代码,应尽量

38、保持继承,并在相关的编码中留有空间位置。,三、编码规则(5),4、典型类独立编码规则:在长期应用过程中,形成一套相对独立、规范和成熟的分类和代码体系,如国际分幅、地质年代表等。典型类独立编码体系采用层次码编和组合码规则。 (1)对规范和成熟的分类和代码体系就直接引用,对不够规范或未形成成熟的编码,仍按整个地质领域的分类系统的规则进行编码。典型类独立编码体系为采用现有的国家标准代码体系提供了基础。 (2)典型类独立编码主要是为实体编码或属性值编码使用 5、要素或对象的实体代码结构体系采用组合码编码规则。实体代码结构体系采用不定长结构。除了采用整个地质领域的分类系统的规则外,考虑了交替引用的标识、

39、典型类独立代码、和顺序码组合的特点。这是与其它编码不同的地方。前25位为基本实体编码位。,中国地质矿产本体代码结构与编码规则,中国地质领域本体代码结构设计为不定长结构。每一个本体术语代码的长度取决与该术语所在的级数。中国地质领域本体分类体系,其代码长度最大可达到64位。领域大纲、基本类目和主表1(三级-N级)的编码作如下规定: 领域大纲是地质领域的专业分类入口,其编码采用两位,与编码规则与代码GB/T 9649相同,部分大纲术语不同,但采用相同的编码规则,既取术语主要两个汉字拼音字头。以字头拼音为代码,大写,两位(易理解可读) 。 本编码系统采用了通用复分表技术,以$和一个大写字母组合(如$A

40、,$B,$Z)代表具共用明显特征的地质本体.如,地质年代表,区域年代地层表代码。 基本类目是领域大纲的下位类,采用1位数字与字母顺序编码。采取8进制规则,即用91,991,9991替代。,中国地质矿产本体代码结构与编码规则,主表1是三级至-N级分类属性表。 由2位构成。01,02,89 ,A0-A9,B0-B9,Z0-Z9,AA-AZ,BA-BZ,ZA-ZZ可考虑一位字母,如果超过1025个分类树,可采取8进制规则,即用91,991,9991替代。如果是引用,则需(1)以和一个大写字母组合构成本层术语的代码;(2)列出被引用的代码。,中国地质矿产本体代码结构与编码规则,要素(实体)类代码编码规

41、则,该规则是为要素类和对象类数据组织而专门规定的代码规则。其特点是在分类的基础上,加上了空间和时间(版本)的因子。,典型类独立代码编码规则,典型类独立编码采用以下规则 (1)采用已经成熟(数字国土项目大多项目正在使用,但还不是标准)的或是已经标准化的代码方式 (2)本次对尚未标准化的典型类独立类仍采用层累制编码规则。 (3)在实体编码中,如果是典型类独立代码,采用$加字母的方式给予区别,实体代码结构与编码规则,实体代码结构体系采用不定长结构,见图。具体规则如下说明: 第一位:国家级代码。 第二至四位:领域大纲与基本类目代码 。共三位。 第五至六位:空间标识码(1位),如果是典型类独立代码,用$

42、A,.$Z标识。 第七至十六位:空间区域代码(10位)。 第十七位:实体序号标签(分隔符)用N表示。 第十八至二十五位:实体顺序号。 第二十六位:时间(或详细分类编码)标识。T表示时间(12位到分)。C表示地质领域本体从4级到25级分类代码。 第二十七至六十四位(不定长):时间或地质领域本体从4级到25级分类代码。,数据模型(字典)语义约束规则的形式化描述内容说明,数据模型(字典)语义约束规则的形式化表述说明如下: 要素类名称:该数据是图层文件,要素类的中文名称; 要素类代码:该数据是图层文件,要素类的具体文件名,可以是英文也可以是中文; 数据库代码:该数据是属性数据库,数据库的具体文件名,可

43、以是英文也可以是中文; 实体名称:该数据文件以DBF方式组织,实体名称是该DBF的中文名称; 实体代码:该数据文件以DBF方式组织,实体代码是该DBF的文件名; 空间数据类型:指点线面类型;,数据模型(字典)语义约束规则的形式化描述内容说明,数据类型:指数据存储的类型数据存储的类型,一般包括字符型(C)、单精度数值(S)、双精度数值(D)、长整形(L)、整形等(I),对于特殊系统的数据类型,需要明确说明; 数据存储长度:存储于某一特定系统平台的字节数,为系统默认值; 数据显示长度:数据用于信息表达的长度,字符型数据说明字符个数,数值型数据说明小数点前后的位数,如F8.2,不确定长度的数据项需明

44、确说明; 约束条件:确定数据项是否填写,按照以下三类规定,可选(O)、必选(M)、条件必选(C);若为必选(M)时,可填写是否为空(NOT NULL); 默认值/初始值:确定数据项在初始状态下的值; 值域范围:明确给出数据项的取值范围;,数据模型(字典)语义约束规则的形式化描述内容说明,数据项描述:对需要进一步说明的数据项进行描述。对于特殊表达格式的数据项也需在此说明,如多数值表达的分隔符,特殊符号的表达描述等; 主关键字名称:用以标识记录的唯一性,并用于和其它实体进行关联的数据项的名称; 子关键字名称:和主关键字一起用以标识记录的唯一性,并用于和其它实体进行关联的数据项的名称; 索引键名称:

45、用于按照一定规律排序的数据项的名称;,(一)拓扑关系定义要素(图元)之间的连通性或相邻的关系成为拓扑关系。,空间实体之间的拓扑关系,点、线、面三类实体的关系可以有六种组合,即点与点,点与线,点与面,线与线,线与面,面与面,这些组合表示了实体间拓扑关系的相邻性、连接性、闭合性、一致性等,是地理空间数据处理的依据。,六、空间数据质量的概念与内容,(二)描述空间数据特征的基本术语,ARC NODE . VERTEX PSEUDO DANGLING NODE LABLE USER-ID TIC RMS ERR,(三)COVERAGE 的重要容限值,1、 Fuzzy Tolerance(坐标距离容限)

46、弧段坐标之间的最小距离。用CLEAN 时,间距小于坐标距离容差的两个或两个以上的坐标点就合并成一个(包括VERTEX、NOTE及弧段之间) 2、 Dangle Length(悬挂长度) 一段悬挂线段,其左右两边是同一个多边形。用CLEAN 命令使任何短于该长度的悬挂线段都删去。,3、 Node Match Tolerance(结点结合容限) 结点相互连接的距离 4、Weed Tolerance(坐标间隔距离) 用于平滑线段坐标点。采用Douglas-Pucker算法平滑各线段的坐标点,从线段起始出发到各个顶点产生一条趋势线,而坐标间隔距离即用来判明那些落在趋势线容差范围之内该删去的顶点。 5、

47、 RMS(残余均方误差-控制点转绘误差) 该值必须小于0.003。这是当控制点(TIC)用来把地图固定在数字化仪上时自动计算出来的RMS 值代表了数字化仪光标获取COVERAGE 上的控制点位置精度。,坐标距离容限,坐标距离容限,坐标间隔距离,坐标间隔距离,坐标间隔距离,结点结合容限NODE MATCH,BUILD,加入ID,Build 加入ID,(四) GIS数据的质量特征,1具有地理位置的空间实体,它是GIS系统中属性数据描述的对象。GIS把地理实体抽象地用点、线、面(多边形)三个基本特征来表示 2描述实体的属性 3空间实体之间的拓扑关系,点、线、面三类实体的关系可以有六种组合 这三个基本

48、内容决定了GIS的质量控制分别包含了空间数据的质量控制、属性数据的质量控制、空间实体之间关系和空间数据与属性数据之间关系的质量控制。,(四)GIS数据的质量特性:,1、空间数据的质量特性 数据位置的精度将直接影响数据库的应用,在质量控制检查中,对数据的位置精度进行严格的检查和分析是十分重要的一环。 (1)数学基础 图廓点、公里网、经纬网交点、控制点等的坐标值应正确 (2)平面精度 由内业数字化(及扫描矢量化)采集数据的数字产品,其误差以偏离中心位置为衡量标准,主要地物的误差不得超过02mm,次要地物的误差不得超过03mm,线状目标位移中误差不得大于020mm。 (3)高程精度 内业数字化采集的

49、数字地图其高程点的高程值正确。等高线的高程不应与相邻高程点的高程或地物产生地理适应性矛盾,并能显示该地区的地貌形态特征。,2、属性数据的质量特性,(1)描述空间数据的属性项定义(包括名称、类型、长度等)必须正确,属性表中各数据项的属性取值及其单位不得有异常。 (2)标识码是区分标识空间数据的码,必须唯一有效、不重复。描述每个地理实体特征的各种属性数据应正确。 (3)空间数据与描述它的属性数据之间一一对应的联接关系须正确,也即空间数据与属性数据必须具有正确的相关性,具有一个以上属性表时,各属性表之间的相关性和网络层次应当正确描述和建立。,3、空间数据之间的关系(与制图区别),(1)空间实体的点线

50、面类型定义必须正确( 岩脉)。 (2)保证多边形空间实体的封闭性。 (3)保证线状空间实体的连接性。 (4)保证编码不重复(组合实体、基础图形要素)。 (5)保证符合组合实体间和基础图形要素之间的关系原则,其中包括: 连接如地质界线连接或分段路线的连接。 相交如地质界线与分段路线的相交; 共享地质体边线共享; 落于ROUTing落于相应的地质体内; 包含大地质体包含小地质体。 (6)保证不出现悬挂节点和伪节点,所有线状要素相交处,都应建立节点。 (7)每个线状要素必须既有从左侧相关于它的面域,又有从右侧相关于它的面域。 保证空间数据之间拓扑关系的正确性是实现GIS系统数据处理和分析的基础,它的

51、质量特性是GIS区别于CAD系统的重要内容之一。,4、数据编辑处理过程中的质量特性,(1)要素类 每个图形要素必须按定义赋予一定的图名(或号),同一元素不能赋予一个以上图层名,每一图层只有一种要素。 (2)完备性 GIS系统中的图形数据和属性数据,包括注记不得有错漏和偏移,数据必须完备,每组数据文件应该完整。 (3)唯一性 图形数据必须具有唯一性,不得有重复重叠。 (4)自然接边 (5)图饰质量 其数据结构要适应 GIS的拓扑化处理和空间分析,需要时也可以生成满足国家制图标准的地图, (6)数据转换 不同采集系统之间的数据转换,转换过程中要保证数据精度、空间数据间的拓扑关系、空间数据与属性数据

52、的联接关系不丢失。,七、空间数据检查总体要求(1),(一)数据完整性与整体性检查总体要求 1、完整性的含义与完整性的必要性,在本项目评价中,完整性指数据库的类型、数量(记录)与业务报告的相匹配。二者缺一不可。如果类型全,但记录不全,提交的数据库意义不大,或不可用。类型不全,数据记录全,提供的数据库可用,但会使数据综合信息的价值变小,故也不允许。,(一)数据完整性与整体性检查总体要求,2、整体性含义与把握,数据质量是针对图幅数据库验收的,因此保障数据的关系具有整体性,如路线观测数据,PRB总图、实际材料图、地质图空间数据库的应是完整的,整体性通过关系来约束。其约束或整体性是通过下面来描述的:不能可以看到PRB总图,但没有野外PRB数据;数据目录组织应按系统的目录进行组织;PRB路线与扩展机制的数据内容的绑定(素描、照片、产状),如果路线存在,但相关的数据没有,显然数据的整体性没有;有等值线图,没有形成等值线的原始数据,即直接给定中间数据,违反建库总体要求(抓两头,放中间)的原则。,(一)数据完整性与整体性检查总体要求,3、工作量检查与统计(依据:按报告中提供的技术指标),(1)路线长度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论