第六讲 GIS的数据库设计_第1页
第六讲 GIS的数据库设计_第2页
第六讲 GIS的数据库设计_第3页
第六讲 GIS的数据库设计_第4页
第六讲 GIS的数据库设计_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六讲地理信息系统数据库设计与管理程承旗北京大学遥感与地理信息系统研究所GIS数据库

一般来说数据库的集合存放有下面几个要求:1)最小冗余度原则;数据尽可能不重复。2)应用程序对数据资源的共享原则:以最优的方式服务于一个或多个应用程序。3)数据独立性原则:数据的存放尽可能地独立于使用它的应用程序。统一管理原则:能够用一个软件统一管理这些数据。

分享式数据库分享式数据库的优点可以从以下几个方面来概括:1)灵活性增强。2)用户应用程序的共同开发。3)维护的分享。4)减少数据的冗余度。GIS数据库设计的概念

GIS数据库设计过程第一步 需求分析第二步 原型概念化设计第三步 GIS数据库的详细设计第四步 自动化方案制定第五步 试点项目实施第六步 数据库总体实施用户需求分析

GIS数据库开发应该主要了解下面的内容:1)明白即将开发的GIS所支持的各种功能;2)了解系统要求的数据内容和行为;3)了解数据之间的关系和优先次序;这些信息有利于制定数据库的开发实施计划。4)了解数据库和GIS的整体要求和蓝图。现状调查

1)在访谈以前将各种问题以表格、问卷或其他书面形式写出来。2)避免不必要的细节,着重了解预定的内容。3)整个访谈应由GIS专业技术人员掌握,控制进度,保持良好的访谈气氛。4)尽可能在对方工作的地方进行,以便对方可以随时提供必要的资料和过程。5)让对方告知轻重次序,以便于在实施过程中决定执行次序。6)注意负面意见,但不要急于作答。7)对于自己不熟悉的领域可以使用录音机、录相、照相等。需要了解的内容通常可以分成机构的模式、日常操作、数据、专业人员、软件和硬件这六大类。调查内容的组织的分析

(1)现有机构的组织结构图;1)现有机构的功能示意图;2)现有机构的人员组织及功能示意图;3)现有数据内容及来源清单;4)现有数据及其功能参照表;5)现有软硬设备关系图。除了以上6种内容以外,还应当包括下面三种;6)人员培训计划;7)GIS的输出产品;8)实施的进度计划。分析结果报告分析结果报告通常要包括以下几个部分:1)机构运作的逻辑数据流程图;2)对于整个数据流程的每步过程,数据的输入是如何转换成数据的输出;3)各主要处理均应当以任务的形式出现;4)各主要处理的步骤应简单明地注明。(2)建立GIS系统获得的各种产品

各类GIS产品通常可以包括地图、报表、文件、应用软件包、屏幕查询或是更新的数据库等。(3)硬件资源表

包括:硬件名称、操作系统、主要功能、所属部门、运行状况等。

(4)软件资源表

包括:软件名称、所属单位、操作平台、主要功能、参与的应用、运行状况等。(5)专业人员清单

主要包括:人员名称、所属部门职务、主要职责范围、技术优势、经验层次、目前工资等。(6)数据功能参照表

I:InputO:Output(7)数据来源清单

数据功能参照表(8)部门功能清单

概念化设计

1)数据库的宏观地理定义:主要指对数据库比例尺、地图投影和坐标系统的定义。2)数据库的地理特征设计;对于各种地理特征有关的属性数据中以什么几何形式表达进行设计。3)数据库表格及其关系的设计表达:对与地理特征有关的属性数据在数据库中表达方式的设计。4)数据库总体设计的评定;根据数据库的应用目的和数据内容及使用方式来评价前面三步的设计结果,进行统筹的考量。5)数据库概念模型的起草;将GIS数据库的概念设计起草成正式的文件,作为后面详细设计时参考。数据库的宏观地理定义

宏观地理定义通常包括以下三个内容:比例尺、地图投影和坐标系统。1)比例尺比例尺是指地图和地表上长度的对应关系,它是地图或数据精度和详细程度的标志。2)地图投影和地理坐标系统设计数据库时可以有以下几种选择1)将所有数据放入一个带。2)将各带分别存放。3)选择不同的地图投影。4)选择使用地理坐标系统。地图投影选择的几个原则:

1)任何地图投影均有变形。2)等形投影保持小区域内不变,但任何一种投影不能保证大范围内的不变。3)等面积投影保持同比例的情况下面积不变。4)等距离投影保持某种距离上下不变,但任何一种投影均不可能保持一幅地图上任何两点的距离均是不变的。等方向投影保持地图上的方位角与真实方位角相同。

投影和坐标系统选择的一般原则:

1)在经常需要投影变换而且覆盖面积较大的情况下,应该使用地理坐标系统。2)笛卡儿坐标系统对于小面积和一个固定的坐标系最为适合。3)根据研究区的形状来选择变形最小的投影。4)如果有地区标准的话,应该使用地区标准。5)如果研究区的面积很重要时,可以考虑使用一种等面积的投影进行面积计算,而数据在存储时可以使用另外一种投影。数据库数据模型的确定1)数据库数据的组织

GIS中数据组织结构的分析主要包括:①数据分层;②数据在各层次上表达的形式及其格式;③数据属性信息的内容。数据分层的考虑因素①具有同样的特性,即数据有相同的属性信息。②比例尺的一致性。③该层数据会有同样的使用目的和方式。④不同部门的数据通常应该放入不同的层,便于维护。⑤数据库中需要不同级别安全处理的数据。⑥数据库中的各类数据的更新可能使用各种不同的数据源,在分层中,使用不同数据源更新的数据也应分层进行存储,以便于更新。⑦即使是同一类型的数据,有时其属性特征也不相同,所以也应该分层存储。2)空间数据库属性表与属性关系设计

步骤:①设计相互关联的表格;②对数据表进行规范化;③定义主关键项和外部关键项;④使用实体关系模型来定义关系;⑤关系表的再规范化。(1)设计相互关联的表格

●唯一性:在每个表中,每个记录的关键项均必须是唯一的;●不变性:不含有其他方面的信息;●纯粹性:不含有其他方面的信息;●不重复性:不会被重复使用,即某一个值被删除后,不会再被使用;●可获得性:需要时便可以拿来到此信息。(2)空间数据的均衡化

将数据库中各关系表进行分解,使其变成更简单、更稳定的一套关系表的过程叫数据库的均衡化。(3)使用实体—关系模型来帮助关系表的规范化①首先要识别实体。②决定实体间的关系。③决定各实体的关键项。④将其汇成连通的图表。(4)逻辑数据图

(5)概念化设计的书面报告

文件内容应该将所有的数据内容加以详细的概述。对数据库的数据模型和内容加以描述,即分层和表格关系。在能够使用图表的情况下尽量使用图表。很多详细的内容可以放入附录之中,以保持文本主体的清晰。假若时间允许,可以提供一个原型以更清楚地表示整个设计的概念。

GIS数据库的详细设计主要包括五个方面的内容:●数据源的选择;●各种数据集的评价;●各数据集的设计;●数据字典的产生;●数据库具体存储和管理结构的设计。数据源的选择

来源:①地图;②航空象片;③GPS接收的数据;④卫星象片;⑥现有的各种电子数据文件;⑥照片;⑦各种记录性文件等。1)国家各机构生产和维护的数据2)省级政府生产和维护的数据3)各级地方政府生产和维护的数据4)商业团体的数据5)非赢利性机构生产的数据各种数据的评价

1)数据一般状况评价

①数据的目前状态:包括数据是否已有电子版,工是否有机构正在生产数据电子版。②数据是否是一种标准形式:主要指该类数据是否在各政府机构式或商业团体生产的数据的标准化之列。③数据是否可以直接GIS使用:常常某些数据需要经过一定的处理以后才能与数据库中定义的数据相符合。④数据的原始性;有些数据是由其他更原始的数据推导、综合而来。⑤数据的可替代性:常常对一种所需要的数据来说,会有多种来源,有些容易获得,有些则较难在决定使用哪一种时,应该将各种可能来源的数据均加以收集并仔细比较,再做定论。⑥数据与其他数据一致性:覆盖的地区是否一致比例尺是否相同,数据的地理控制点是否符合数据库的要求,在整个地区是否一致,投影是否与要求符合等

已存在的电子版数据的评价原则1)数据格式:数据格式是一个很重要的因素,如果不与数据库设计的要求相吻合,势必要进行数据转换。2)拓扑关系:GIS数据要求数据的特征之间保持应有的拓扑关系。3)数据分辩率:对于栅格数据,数据的分辩率是指象元的大小。4)数据覆盖面及一致性:该数据是否能够覆盖整个的工作地区。5)数据的可获得性:包括数据存储的媒介,适用的计算机平台和是否可以购买及免费提供。6)样本数据:在数据评判过程,如果能够有机会获得该数据的样本将会对数据的感性认识大大地提高。7)自动化过程实施的考虑:通常现有的数字化数据并不完全符合某一数据库设计的要求,可能需要做不同程度的加工才能入库。8)数据的元数据信息是否完全:元数据是不关数的重要信息,它的顾在与否及质量直接影响到该数据的价值。2、数据空间特征的评价

1)空间特征的表达方式。2)空间特征的连续性和闭合性。3)表示规则的比较。4)空间数据地理控制信息的比较。5)空间地理数据的系列性。6)分类方法的比较和评价。7)地理参考系统的一致性。3、数据属性特征的评价

1)属性的存在性。2)属性数据与空间位置的匹配。3)属性数据的编码系统。4)属性数据的现适性。空间数据层的设计

1)属性数据类型的设计2)编码标准的设计数据字典

1)数据字典的内容2)数据文件的命名方法3)数据字典的元数据内容。数据字典

1)数据字典的内容①

数据库的总体组织结构;②

数据库总体设计的框架;③

数据层的详细内容定义及结构;④

数据命名的定义;⑤

元数据内容等。数据字典中各数据层的详细内容定义及结构:●标题类信息:名称、类型、数据质量;●各层的有关文件、表、各表的项及各项的定义、有效值范围等;●地理参考方面要求满足的情况;●其它有便于说明和理解的文字或图表等;●各层空间及属性的质量控制规范;●各层编号系统与其它各标准编号系统的关系;●各层数据的使用与各应用类型的关系等。数据流图

1、数据源点和数据终点2、加工(数据处理/变换)3、数据流4、文件(数据存储)具体步骤如下:

1)确定系统边界,画出顶层数据流图。2)自项向下,对每个加工进行内部分解,画出分层数据流图。3)对数据流图进行复查求精。在分层数据流图求精过程中应该注意以下问题:①

检查流入、流出加工的数据流的连续性。②

控制单张数据流图的复杂性③

父图与子图的数据平衡④

终止加工分解的条件⑤

局部文件⑥

分解层次的均匀性问题数据词典

1、

数据流条目

数据流名称 [别名列表] 数据流组成 [来源][去向] [处理特点(使用频率,数据量等)] [其他注释(格式、位置等)]〈数据流名称〉=数据项[〈逻辑操作符〉数据项]例1:学生成绩单=课程编码+课程名+[任课教师1指导教师]+{学号+姓名+成绩(+备注)}在描述数据流组成时,常用符号有:=,+,[1],{},()= 表示“定义为(等价于)”+ 表示“与”[1] 括号内用“1”分割的各项目选择出现一项() 括号内部分可以不出现{} 括号内部部分重复出现2.数据项条目

例 数据流“仓储事务”中的数据项“零件”可以定义为数据项 零件零件=零件号+零件名称+规格+(备注)数据项 零件号零件号=Pxxxxxxx说明:零件号由字母P开头的8个字符组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论