基于GIS的空间数据挖掘研究综述_第1页
基于GIS的空间数据挖掘研究综述_第2页
基于GIS的空间数据挖掘研究综述_第3页
基于GIS的空间数据挖掘研究综述_第4页
基于GIS的空间数据挖掘研究综述_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、科技信息年第期数据挖掘技术是数据量急剧膨胀的需求,有着较强的实用性,所以尽管这项技术刚刚起步,但己经成功地应用于科学研究、市场营销、金融投资、欺诈检测、医学、体育等方面,并在更为广泛的领域中显示出了诱人的前景。空间数据挖掘就是其中的一个很有发展前景的应用领域。随着大量空间数据从遥感、地理信息系统、多媒体系统、医学和卫星图像等多种应用中收集出来,这些数据的复杂程度和数量都远远超出人脑的分析能力。空间数据库具有保存这些由空间数据类型和对象之间的空间关系来表示空间对象的能力。因此,近年来数据挖掘的研究己从关系型和事务型数据库扩展到空间数据库,即研究如何从空间数据库中去发现隐含的知识。空间数据挖掘的定

2、义和特点所谓空间数据挖掘(,简称),或称从空间数据库中发现知识,是指从空间数据库中提取用户感兴趣的空间模式与特征、空间与非空间数据的普遍关系及其它一些隐含在数据库中的普遍的数据特征。空间数据挖掘作为数据挖掘的一个重要分支,其数据结构和处理问题的方法等方面存在一些与数据挖掘的明显差异,形成了独有的特点。等对空间数据挖掘和传统的数据挖掘进行了全面的比较,得出四个方面的差异:()空间数据的复杂性空间数据包括用于描述空间对象的空间属性数据,这些数据包含空间对象位置信息以及空间对象之间拓扑关系、距离关系和方位关系等。同时,空间数据对象之间的关系比一般的关系数据库中的数据对象之间的关系要复杂得多、隐蔽得多

3、,也使得空间数据挖掘的复杂性大大增强。传统的数据挖掘方法难以有效的处理和分析空间属性数据。()统计学基础统计分析的一个基本假设是数据样本的产生是独立的,但空间数据集中关于样本的独立性的假设却往往不能成立。实际上,空间数据的样本往往是自相关的,例如一个地区的经济发展水平和临近地区有相似。这种空间依赖关系的产生源于所研究对象的内在关系,忽视了这一特性的传统数据挖掘方法无法充分有效得发挥作用。()可发现知识类型与数据挖掘可发现广义型知识、分类型知识、关联型知识和预测型知识相对应,空间数据挖掘发现的知识主要有四种:、空间聚类和分类;、空间离群点挖掘;、空间关联规则;、预测。()算法过程空间数据库存储的

4、对象是大量的地理图形数据,而且空间数据库系统的数据结构和存取方法比一般的关系数据库系统更加复杂,这使得空间数据库系统的规模往往较大,因此运算效率问题尤为突出。另一方面,空间数据挖掘的算法处理的是空间对象,不可避免的要用到一些针对空间数据对象的操作,例如空间对象的联接、地图覆盖、最近邻查询等。因此,空间数据对象的访问方式和数据结构也是一个关键问题。此外,空间数据挖掘的结果一般包含空间对象,往往是一些图形信息,它不同于通常的关系数据库中的结果,很难用文字表示清楚。因此空间数据挖掘的可视化也是一个很重要的问题。空间数据空间数据的分类的操作对象是地理实体数据。地理实体是指空间地理数据库中的实体,是一种

5、在现实世界中不能再划分为同类现象的现象。例如一个城市可以看成一个地理实体,因为它可以划分为若干区域如区、街道等,但这些区域不能再被称为城市。空间数据描述的信息包括两部分:一种是描述地理实体空间位置、几何形状以及实体之间空间关系的空间属性信息,另一种是描述地理实体其他属性的描述性信息。对应这两种信息,引入两个新的概念:空间谓词与非空间谓词。空间数据模型为了方便地理实体在空间数据库中的存储,必须先建立空间数据模型,即空间数据特征的抽象。数据模型分为三个层次:概念数据模型、逻辑数据模型和物理数据模型。中最常用的概念数据模型为矢量模型和栅格模型:()矢量模型:用点、线、面表达现实世界,点用空间坐标对表

6、示,线由一串坐标对组成,面是由线组成的闭合多边形。矢量模型显式地表达这些目标及部分空间关系(如相邻、包含、连通等),集中体现了地理实体的形状特征以及不同实体之间的空间分布关系。()栅格模型:把整个空间用规则或不规则的空间单元覆盖,如用矩形、三角形或六边形等空间单元()或像元()来表达。点是一个像元,线由一串彼此相连的像元组成,面是相邻的像元组成,栅格模型集中描述了地理实体的级别分布特征以及位置,并隐含地表达地理实体间的空间关系。与空间数据挖掘的集成与空间数据挖掘的集成模式集成问题的关键是如何共享中的数据。为解决两者之间的联接、查询和管理的问题,解决的方法主要有三种方式:混合式、扩展式和开放式。

7、在研究与空间数据挖掘集成的问题时,也应分别对待。与空间数据挖掘集成的模式主要有三种:()松散耦合式,也称外部空间数据挖掘模式。这种模式基本上将当作一个空间数据库看待,在环境外部借助其它软件或计算机语言进行空间数据挖掘,其与之间采用数据通讯的方式联系。该方式的优点是开发费用低,风险小,易实现,保持了数据挖掘技术的专业特色;缺点是效率低,对于非专业人员的掌握和应用有一定难度。()嵌入式,又称内部空间数据挖掘模式。以为主,加入空间数据挖掘模块,即在中将空间数据挖掘技术融合到空间分析功能中去。采用现有软件与分析软件包来构造空间数据挖掘模块,具有系统稳定、开发周期短、费用低等优点。()混合式,是前两种方

8、法的结合。即尽可能利用提供的功能,最大限度的减少用户自行开发的工作量和难度,又保持外部空间数据挖掘模式的灵活性。主要的空间数据挖掘系统目前空间数据挖掘系统较少,国际上有代表性的原型系统主要有以下三个:()加拿大大学计算机科学系的教授领导的小组在,平台上建立了空间数据挖掘的原型系统。它是该小组所研发的关系型数据挖掘系统的空间数据挖掘的扩展模块,包含三大功能模块:空间数据立方体构建模块、空间联机分析处理模块和空间数据挖掘模块。该系统使用空间数据挖掘语言,采用()体系结构,其空间数据服务器包括、等。()由美国著名的公司开发的(下转第页)基于的空间数据挖掘研究综述杨霞(成都职业技术学院国际软件学院教师

9、四川成都)摘要:空间数据挖掘是数据挖掘的一个重要分支,它对于理解空间数据,寻找空间数据之间、空间与非空间数据之间内在关系,以简洁方式表达空间数据规律起着重要作用。关键字:;空间数据挖掘;空间数据计算机与信息技术科技信息年第期科在进行客户服务器程序开发时,首先要建立一个数据源,建立数据源是进行远程视图或使用函数进行数据访问的基础。首先在服务器中建立一个数据库,其服务器为,在这里我们用的是函数建立一个数据源为的程序代码:;,;,;,;”()”连接数库”()”()”(,)(,)(“无法建立数据源!”,”提示”)由上我们已经建立了一个名为的数据源,下面我们使用的命令建立一个到数据源的连接来进行数据访问

10、的多项参数设置,如异步传输、连接超时等。程序代码如下:“”“”(“”,”,”,”);(“建立连接成功!“);(“建立连接失败!“);此程序建立了一个名为到数据源用户名是,密码为空的连接。在建立一个远程视图,添加上述建立的的连接,即可访问服务器端的数据库中的表了。当然,基于在客户服务器程序的开发远中,只是提供了这样的一种可能性,我们在具体开发中还要用到很多技术来优化这种模式,譬如视图的缓冲技术等,当然这些程序可以通过提供的图表方式来完成,但相比起让用户进行这些操作,用函数构建数据源和命令来建立连接来显得更简单、更实用。参考文献程序设计教程:刘瑞新等编著实用教程:张宏华如何用构建一个客户服务器程序

11、麻建(河南煤炭卫生学校附属医院河南平顶山)摘要:是微软公司开发的一个集编程语言和数据库为一体的关系型数据库,其作为中小型数据库的开发有着开发周期短、效率高、成本低等特点,而且随着计算机网络的广泛运用,基于一些数据库开发的应用程序也多起来,而客户服务器程序设计是极力推广的一种程序开发模式,在中就附带了的个人版本。而为解决数据的安全性、并发处理和海量存储提供了可能。关键词:;客户服务器程序;:,(上接第页)的接口,提供了用来分析空间数据中指定的类的工具。但是,采用的是一种解释型的脚本语言,它的功能的实现比用慢,因此只适合小型数据库应用系统。(),是专门的可视化的空间数据分析工具,与其开发公司所开发的数据挖掘工具结合使用。能够完成数据挖掘任务并且拥有自己的表现数据挖掘结果的非图形界面,和的动态链接把传统的数据挖掘与地图可视化结合了起来。国内有代表性的系统由中国科学技术大学开发的是,它以为空间数据管理平台,采用和开发挖掘算法模块,通过自动化方式进行集成。总结空间数据挖掘需要大量的空间数据作为挖掘对象,更为重要的是空间数据挖掘需要通过实际的应用来体现其辅助决策的强

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论