GIS数据库更新信息传播软件工具设计和实现_第1页
GIS数据库更新信息传播软件工具设计和实现_第2页
GIS数据库更新信息传播软件工具设计和实现_第3页
GIS数据库更新信息传播软件工具设计和实现_第4页
GIS数据库更新信息传播软件工具设计和实现_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 . GIS数据库更新信息传播软件工具设计与实现王育红(理工大学测绘与国土信息工程学院,市世纪大道2001号,454003)摘 要:针对现有GIS软件工具缺乏相应的功能模块,不支持批处理,需要大量的人机交互,不能满足GIS数据库更新信息自动高效传播要求的缺陷,采用ArcEngine组件技术设计实现了一个专门的更新传播工具。该工具通过自动地执行更新传播过程中的模式匹配、变化提取、更新集成等操作,能够有效地提高更新传播的效率,弥补现有软件的不足。关键词:更新传播、模式匹配、变化提取、更新集成当前GIS的核心已从数据生产转为数据更新,数据更新关系着GIS的可持续发展1。随着世界各国测绘部门和相关机构

2、对基础地理数据库更新工作的持续开展2,更新信息传播问题,即如何利用新版基础地理数据库中的更新数据快速高效地更新用户数据库的问题,已成为生产部门、应用机构以与学术界共同关注的热点问题之一3-4。由于应用需求、建库目的、专业背景等方面的不同,应用部门经常要对首次获得的基础地理数据库副本,进行一定的重构、转换、集成、扩展等处理之后方可建立用户数据库。这些处理使得基础地理数据库和用户数据库,即使是对一样的实现地物地形的描述和表达,也往往在数据模型、数据模式、数据实例等方面存在一系列的差异或冲突5。上述差异的存在导致更新传播的具体实施变得相当复杂,不能简单地通过“新图层直接替换旧图层”或“新数据直接替换

3、旧数据”的方式加以实现,因为,这样将破坏用户数据库的自治性、完整性、正确性和一致性等特性,最终导致在其之上建立的应用系统不能正常运行。一般来说,实现更新信息传播需要模式匹配、变化提取、实体识别和更新集成等四个操作环节的支持6。然而,由于现有GIS软件缺乏针对性的自动批处理模块,更新传播的具体实施只能靠操作员手动完成,效率低,易出错,很难满足GIS数据库更新自动高效的要求。1系统框架和功能设计针对现有GIS软件的局限性,目前主要有独立开发、宿主型二次开发和基于GIS组件的二次开发等三种可选方式,来设计和实现针对更新传播的专用软件工具系统。相对来讲,基于GIS组件的开发方式既可以充分利用GIS工具

4、软件对空间数据库的管理、分析功能,又可以利用其它可视化开发语言具高效、方便等编程优点,不仅能大大提高应用系统的开发效率,而且开发出来的应用程序具有更好的外观效果,更强大的数据库功能,而且可靠性好、易于移植、便于维护。基于这些分析,本文以目前非常流行的ArcEgine组件为基础,来开发和设计更新传播软件工具。1.1系统框架如图1所示,更新传播软件工具采用GIS组件ArcEngine与面向对象编程语言Visual Basic 2005二次集成开发方式构建而成。其中,ArcEngine组件提供诸如空间数据管理、图形操作、数据查询等通用的GIS基本功能;而更新更新传播专有的功能模块,如模式匹配、变化检

5、测、更新集成采用Visual Basic语言开发实现;另外,还通过自制组件以与其他界面辅助组件开发实现了分析处理结果的可视化模块,以便于对分析结果的检查、核对和更正。1.2系统功能1)基本的GIS空间数据显示、查询、编辑等功能。系统不仅提供放大、缩小、全图、漫游等基本的地图操作显示功能、而且利用地图列表可控制地图窗口的显示容、状态、顺序等,并能根据用户需要设置相应的显示样式。系统提供了多种的查询方式,用户可以检索、浏览空间信息和属性字段信息。系统提供了常规的数据编辑工具,使用户能够手动方式对其数据进行更新,主要包括单个实体的添加、删除、修改(移动对象,操作结点,改变属性值等)、分割以与多实体的

6、置换、合并等操作。这些功能一般在如图2所示的子窗口中加以实现。图2 数据管理窗口 图3 模式匹配窗口2)模式匹配功能。模式匹配,是指从两个数据库模式中确定语义相关的对应模式元素(要素类和属性等),并声明其具体映射关系的过程。模式匹配是更新信息自动传播的基础处理环节,它所取得的匹配结果可被用于指导和简化其他处理操作,保证基础地理数据库中的变化信息被充分准确提取和集成。系统分别设计了相应的图形用户界面和自动化向导工具来完成更新传播中的模式匹配操作。其中,模式匹配图形界面(如图3所示)不仅支持以拖线方式手动建立模式映射关系,而且可以显示和查看自动向导产生的匹配结果,并进行相应的修改和调整。GIS数据

7、库模式间包含两种不同层次的匹配关系:一种是要素类与要素类之间匹配(用图3中部第一条直线表示),另一种是属性与属性间的匹配(用图3中的其他条直线表示)。 图4 变化信息窗口3)变化提取功能。通过比较新版源数据和旧版目标数据之间对应实体的几何图形和属性信息判断其是否发生变化,并将诸如新增、消失、合并、分解、几何变化、属性变化等变化类型的实体与其相关信息列在如图4所示的窗口中,以供用户做最终的检查、核对和筛选。4)更新集成功能。根据模式匹配映射关系以与源数据和目标数据之间的实体对应性,可通过添加、删除、修改等三种基本更新算子与其组合将检核确认后的更新变化信息集成到目标数据中。整个过程以自动生成的命令

8、脚本加以描述,能够以批处理的方式自动运行。2软件功能的自动化实现本节将进一步介绍上述主要功能的自动化实现算法和基本原理。2.1基于空间实例的模式匹配为实现GIS数据库模式的自动匹配,我们根据GIS数据库的特点以与模式匹配的应用背景,提出了一种基于空间实例统计相似性的模式自动匹配方法。该方法的基本步骤如下7:1)在目标数据库中一个要素类的实例集合中,随机地抽取若干个实体样品,并采用较小的缓冲半径生成这些样品的缓冲区,然后依次在源数据库的每个要素类查找落在这些缓冲区中的对应候选实体,最后通过比较几何类型、候选实体个数、大小、长度等信息,建立采样实体和候选实体的对应关系,如图5所示。图5. 对应实体

9、抽样识别示例2)根据对应实体抽样识别结果,计算要素类的相似性,并匹配语义相关的要素类。假设在源要素类S中抽样选取了s个实体,而在目标要素类T中发现了t个与之对应的实体,则两个要素的相似性CSim(S,T)为: (1)如果源数据库和目标数据库分别共用m和n个要素类,采用公式(1)分别两两计算要素类的相似性,将形成一个m×n的要素类相似矩阵(i=1,,m;j=1,,n)。对于给定阈值,如果,则断定源数据库中第i个要素类和目标数据库中第j个要素类匹配。3)根据对应实体的属性值,在已匹配的要素类之间,计算其属性相似性,并确定相关的属性匹配。对于分别来自源要素类和目标要素类的两个数字型属性A和

10、B,其在n对对应实体中的属性值分别为ai和bi(i=1,n),则其相似性为: (2)式中:。对于分别来自源要素类和目标要素类的两个字符型属性A和B,其在n对对应实体中的属性值分别为ai和bi(i=1,n),则其的相似性为: (3)式中,为属性值ai和bi之间的编辑距离,和分别为属性值ai和bi的字符长度。对于来自源要素类的数值型(或字符型)属性A和来自源要素类的字符型(或数值型)属性B(例如,图5中的T和Grade),如果其可能的取值数目一样,则采用下式计算其相似性: (4)式中,和为分别属性值ai和bi出现的概率,为属性值ai和bi同时出现的联合概率。;。假设两个匹配要素类中分别存在m和n个

11、属性,根据属性的类型分别采用上述公式两两计算属性之间的相似性,将形成一个m×n的属性相似矩阵(i=1,,m;j=1,,n)。对于给定的阈值,如果,并且,则第i个属性和第j个属性匹配。在确定模式匹配关系之后,为保证匹配的质量以与进一步的应用,可以采用手动方式检核和更正模式匹配结果,并声明匹配元素之间具体的映射关系。2.2 面向变化提取的实体识别目前主要快照差分法、时间戳法、触发器法、日志法等四种变化信息提取方法8。其中,快照差分法因具有通用性高、不需要其他外部辅助设施的支持等特点,而被广泛采用,它主要通过比较不同时期的数据集快照来获取其中的更新变化信息。实现该方法的关键是如何高效地在两

12、个快照之间识别和发现代表同一现实事物的对应实体,即实体识别。在更新传播背景下,由于源要素类和目标要素类时间跨度比较大,同一空间实体的在不同要素类的描述信息(几何图形、属性值、拓扑关系等)可能差别较大,因此仅通过比较某一种类型的信息来识别实体是否对应,很容易产生遗漏或错配情况。为此,本文提出了一种基于多源信息的空间实体识别方法。假设S和T分别代表源数据库和目标数据库中相关要素类中的实体集合,和分别表示为S和T中的属性字段,对于实体,令表示实体的在属性上的值,表示实体的在属性上的值,表示和为对应实体。首先,通过比较语义一样属性的值,来识别要素类间的一部分对应实体。对于实体,如果属性Am和Bn含义一

13、样,和存在且唯一,并且,则。然后,根据实体的几何类型,通过比较实体的几何特征或拓扑关系,识别发现要素类间所遗漏的对应实体。1)对应两个点状实体,如果两者之间的距离小于给定阈值,则认为二者对应。2)对于两个线状实体,先以较小缓冲半径生成其中一实体的缓冲区,然后计算另一实体落在该缓冲区的所有子段长度之和与该实体总长度之比,如果该阈值大于给定阈值,则两实体对应。3)对于两个面状实体,如果两者相较部分的面积大于0,则认为二者对应。根据识别发现的对应实体关系,可以进一步提取源要素类中更新变化信息,其具体规则如下:1)对于未发现实体与之对应的源要素类中的实体,则认为其为新增实体。2)对于未发现实体与之对应

14、的目标要素类中的实体,则认为其为消失实体。3)对于源要素类中的一个实体,如果仅在目标要素类发现一个实体与之对应,则需要进一步比较两实体的形状、属性、位置等特征,以确定实体是现状、位置、属性发生了变化,或是根本没有发生变化。4)对于源要素类中的一个实体,如果在目标要素类发现多个实体与之对应,则源要素类中的这个实体为合并实体。5)对于源要素类中的多个实体,如果在目标要素类仅发现一个实体与之对应,则源要素类中这些实体为分解实体。6)对于源源要素类中的多个实体,如果在目标源要素类也发现多个实体与之对应,则源要素类这些实体为聚集实体。2.3 模式和实体映射引导下的更新集成根据模式映射和实体对应关系,可通

15、过添加、删除、修改等三个基本操作算子与其组合,将提取的更新变化信息集成到相应的目标要素类中,以使其也具有良好的现势性。现定义三个操作算子的基本形式如下:Intsert (FeatureClass,ID):在名称为FeatureClass的数据集中插入一个标识符为ID的实体;Update (FeatureClass,x,FieldName,FieldValue):修改要素类FeatureClass中标号为x的实体的FieldName属性值为FieldValue;Delete (FeaturClass,x):删除数据集FeatureClass中标号为x的实体。假设源要素类S和目标要素类之间存在形如

16、和两个属性映射关系,对S中不同类型的变化信息,为保证集成后数据尽可能完整正确,可采用如下形式的操作指令将其集成到T中:1)对于消失实体,可直接执行Delete(T.name, t.id);2)对于新增实体,应执行一个操作序列,记作E(s) =Insert(T.name, id=y); Update(T.name, y, Shape, s.shape), Update(T.name, y, A1, f1(s.a1 ), Update(T.name, y, A2, f2(s.a2, s.a3 );3)对于在属性A1变化的实体和与之对应的匹配实体,可直接执行Update(T.name, t.id,

17、A1 , f1 (s.a1),同样,对于几何变化,可直接执行Update(T.name, t.id, Shape, s.shape);4)对于分解实体和与之对应的实体集。首先应该从选择一个主实体s1,然后执行相应的操作序列,记作E (t) =Update (T.name, t.id, Shape, s1.shape),Update (T.name, t.id, A1 , f1 (s1.a1), Update (T.name, y, A2, f2(s1.a2, s1.a3 ), E(s2) , E(s3) , ., E(sn),其中sk, k =1, 2, 3, ., |;5)对于合并实体集和与

18、之对应的实体匹配,应该执行的操作操作序列可表示为:E(s)=Delete(T.name, t1.id),Delete(T.name, t2.id), ., Delete(T.name, tm.id), E(s) ,其中tk, k =1, 2, 3, ., |。6)对于聚集实体集和与之对应的实体集,应该执行的操作可表示为:E()= Delete(T.name, t1.id),Delete(T.name, t2.id), ., Delete (T.name, tm.id), E(s2) , E(s3) , ., E(sn),其中ti, i =1, 2, 3, ., |;sj, j =1, 2, 3

19、, ., |。3 结语针对实现中的具体需要,本文讨论了更新传播软件工具的开发策略和主要功能,以与更新传播中主要操作的自动化处理实现方式。当然,系统还有一定的局限和不足,在1对多、多对多类型的属性匹配、更新一致性检测和维护等方面尚需做进一步的补充和完善。致:本文得到国家自然科学基金项目(40337055)、国家科技支撑项目(2006BAJ05A14),省科技计划重点攻关项目(1),省教育厅自然科学研究计划项目(2009B420001),理工大学博士基金项目(B2008-49)的资助。参考文献1 Fritsch D., GIS Data Revision and RealityC, Keynote Speech in Joint ISPRS Commission Workshop on Dynamic and Multi-dimensional GIS, Beijing, 1999。2 捷,军,基础地理信息数据库更新的若干思考J,测绘通报,2000(5):1-3。3 Spery Laurent, A Framework for Update Process in GISC, Proceedings of the 3rd International Conference

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论