第四章数字地球的关键技术要点课件_第1页
第四章数字地球的关键技术要点课件_第2页
第四章数字地球的关键技术要点课件_第3页
第四章数字地球的关键技术要点课件_第4页
第四章数字地球的关键技术要点课件_第5页
已阅读5页,还剩195页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章数字地球的关键技术第四章数字地球的关键技术一、高分辨率卫星遥感数据的快速获取技术一、高分辨率卫星遥感数据的快速获取技术

高分辨率卫星遥感数据的快速获取技术主要包括两个方面:一是高分辨率数据,如1米分辨率以上的遥感数据;二是快速获取,即高时间分辨率。高分辨率卫星遥感数据的快速获取技术主要包括两个方面:

卫星遥感是数字地球获取数据的主要手段。卫星遥感包括不同轨道高度、不同分辨率的气象卫星系列、海洋卫星系列、陆地卫星系列、测地卫星系列以及小卫星系列;空间分辨率从0.5米到4000米;光谱范围从紫外、可见光、红外到微波;波段可达到240个以上。卫星遥感是数字地球获取数据的主要手段。卫星遥感包括不遥感卫星图遥感卫星图美国IKONOSⅡ

卫星中国北京1米美国IKONOSⅡ卫星中国北京1米分辨率由低到高的遥感影像64米/像素分辨率由低到高的遥感影像64米/像素分辨率由低到高的遥感影像32米/像素分辨率由低到高的遥感影像32米/像素分辨率由低到高的遥感影像16米/像素分辨率由低到高的遥感影像16米/像素分辨率由低到高的遥感影像8米/像素分辨率由低到高的遥感影像8米/像素分辨率由低到高的遥感影像4米/像素分辨率由低到高的遥感影像4米/像素分辨率由低到高的遥感影像2米/像素分辨率由低到高的遥感影像2米/像素罗马梵蒂冈大教堂,0.7m,真彩色罗马梵蒂冈大教堂,0.7m,真彩色911遭恐怖分子袭击前后纽约世贸大楼的比较受破坏的范围高耸的世贸中心姊妹楼及其辅助大楼已不复存在911遭恐怖分子袭击前后纽约世贸大楼的比较受破坏的范围高耸奋进号航天飞机外观图60m长桅杆从航天飞机上伸出,顶端安装有另一个天线(还有一个在飞机上,这两个天线形成立体象对)SRTM2000.2奋进号航天飞机外观图60m长桅杆从航天飞机上伸出,顶端安装有奋进号发回的立体图奋进号发回的立体图第四章数字地球的关键技术要点课件加拿大RadarSAT影像加拿大RadarSAT影像二、海量数据的快速处理与

存储技术

二、海量数据的快速处理与

存储技术

要对全球数据进行处理和虚拟显示,需要有超大型计算机。这样的超大型计算机目前只有少数国家才有。对于大多数国家来说,只有采用多台低档计算机连网并行处理的方法来处理海量的数据。要对全球数据进行处理和虚拟显示,需要有超大型计

并行计算通常是指一个任务的各个部分并行同时地进行计算,而不是顺序地执行。这种计算要求各部分的数据相关性小。如果各部分有前后的因果关系,即一个部分的计算结果(输出)必须作为另一部分的输入,则不能进行并行计算。在图像处理中,通常一幅图像的各部分的相关性小,没有时间上的因果关系,可以作并行处理。在地理空间信息处理中,有很多情况可用并行处理方法。并行计算通常是指一个任务的各个部分并行同时地

海量数据的存储目前依赖于分布式存储系统。分布式数据库及分布式存储建设是数据管理的趋势。不同部门、不同行业、不同地区应分别建立自己的数据库,不但为了应用的方便,而且也为数据采集、数据更新和数据处理与管理的方便。不同专业的数据库应由不同专业的部门建设和管理,这样才能发挥各自的特长,避免集中式系统带来的管理困难和网络阻塞。海量数据的存储目前依赖于分布式存储系统。分布三、高速计算机信息网络技术

三、高速计算机信息网络技术网络技术在数字地球技术中占有十分重要的地位,网络技术是确保数字地球的信息畅通和共享的必要条件。数字地球的网络技术的发展方向,主要有三大趋势:宽带化;无线化;综合化或集成化只有宽带化才能满足日益增长和海量信息的传输;只有无线化才能真正做到“网络的无处不在和无时不在”和“随时随地实现通信”的理想;只有实现综合化或集成化,才能实现自动操作所有的、分散的电子设备,才能实现自动遥控和智能化。网络技术在数字地球技术中占有十分重要的地位,网络技术是确保数

计算机网络,是指将空间位置不同,尤其是地理位置不同的、具有独立功能的多个计算机系统,用通信技术(包括通信设备和线路)连接起来,并以网络协议、网络操作系统等网络软件实现网络资源(如硬件、软件及信息或数据等)实现共享的技术系统。

什么是计算机网络?

计算机网络,是指将空间位置不同,尤其是地理位置计算机网络类型按通信距离的原则可以划分为局域网(LAN)和广域网(WAN);按网络的拓扑结合原则,可划分为环形网和总线形网等;按通信介质原则划分,可以分为双绞线网、同轴电缆网、光纤(OpticalFiber)网和卫星网(无线网)按信号频带占用方式为原则,可以分为基带网和宽带网计算机网络类型按通信距离的原则可以划分为局域网(LAN)和广最常用的两种网络形式

现代通信技术出现了两大组合类型:一种是有线互联网(wiredInternet),又称固定互联网(StableInternet)和移动互联网(MobileInternet)技术。这是目前最常用的两种网络形式。最常用的两种网络形式现代通信技术出现了两大组合有线互联网(wiredInternet)又称固定互联网(StableInternet),也就是光纤-光缆网技术。主要包括以下几种类型:狭带光缆:每条可供6万人(3万+3万)同时通话(第一代)宽带光缆:每条可供6000万人(3000万+3000万)同时通话(第二代)波分光缆:每条可供60000万人(30000万+30000万)同时通话(第三代)密集波分光缆:为第四代现代通信技术。有线互联网(wiredInternet)又称固定互联网(SInternetI的最快调制解调器传输速度只有每秒56千比特InternetII传递信息的速度,将达到每秒2.4吉比特InternetIII,即波分复用技术网络(WDM-Internet),它可以不用铺设新的光缆,就能增加现有的网络带宽。该技术在同一条光缆上,同时发出不同的光信号,按照不同的光的颜色(即波长)传输信号。每一个信号就形成了一条能够运载各自信息流的独立通道。利用波分复用技术发送一个附加光信号,就能把带宽增加一倍。将来在同一光缆上,可以传输8种、16种、32种、40种、甚至80种波长的信号。InternetIV,(DWCDMA-Internet),密集波分复用光缆互联网。InternetI的最快调制解调器传输速度只有每秒56千比无线互联网(移动互联网)

卫星移动互联网(Sat-mobile-Internet)也叫远程移动互联网(Tele-mobile-internet)。它是一种通信卫星与光纤-光缆有线互联网相结合的一种通信方式,或独立的直接和通信卫星相联结的互联网。无线互联网(移动互联网)卫星移动互联网(Sat无线互联网(移动互联网)Teledesic计划:Teledesic系统是美国微软(Microsoft)公司和麦考(McCaw)蜂窝通信公司提出的一项庞大的计划,耗资90亿美元,计划发射924颗卫星(其中84颗备用),其主要目标瞄准宽带业务,充分利用信息高速公路多媒体技术,建造一个覆盖全球的宽带卫星通信网“:Intemetinthesky"(空中因特网,就像把光缆架设在空中一样,让任何人都能获得双向的、交互式多媒体宽带业务。后来Teledesic系统设计经过了简化,从最初的840颗卫星,减至288颗卫星,分布在12个轨道,轨道高度l375km。1998年8月,Teledesic系统同摩托罗拉公司的Celestri系统合并成一个系统,统称’reledesic系统,将方案修改为120颗卫星加6颗在轨备份卫星。无线互联网(移动互联网)Teledesic计划:Tele短程移动互联网(移动局域网)

短程移动互联网是最具有前途的移动通信技术。它需要三个基本功能:移动的计算机计算(MobileComputing)、移动接入(MobileConnection)及移动通信(MobileCommunication),简称3MC功能。短程移动互联网(移动局域网)短程移动互联网是最WAP

WAP(WirelessApplicationProtocal),是无线通信与互联网相结合的应用平台,用户通过移动电话(手机)直接操作接入Internet-web,手机用户可通过浏览获取在线(online)信息和E-mail等web上的服务,实现享受Web的信息资源和使用电子商务等。WAPWAP(WirelessApplicatioWAP

WAP是一个开放的全球性的无线通信与Web相结合的应用平台,它使得拥有无线终端设备的,如移动电话或笔记本电脑用户可以方便、快捷地访问交互式接入和信息服务。WAP的工作模式与Web的工作模式接近,完全支持Internet接入。WAP还能支持多种类型的承载业务如GSM(电路交换系统)、GPRS(通用分组无线业务)、CDMA(网络扩频技术)等。WAPWAP是一个开放的全球性的无线通信与Web相结合蓝牙(BlueTooth)

蓝牙(BlueTooth)是一项短程无线连接标准,旨在取代信息服务之间的有线连接,实现电子设备之间的无线互联,以便确保大多数常见的计算机和通信设备之间可以方便地进行无线通信。蓝牙是通过不同电子设备内置具有相同的协议的发射与接收设备,就可以进行一不定期范围内的无线通信,也可以在固定与移动设备通信环境之间建立连接的技术。如可以把蓝牙技术引入移动电话、笔记本电脑、掌上电脑等便携式电脑和固定的个人电脑(PC)进行交互通信;也可以与打印机、个人数字助理(PDA)、传真机(FAX)、游戏机相连接,在短距离内,无需任何电缆连接就可以实现无线通信。蓝牙(BlueTooth)蓝牙(Blue第三代移动通信(3G)

第三代移动通信(3G)是指传输速率高达2Mb/s的宽带超媒体业务,支持高质量的语音、分组数据、多媒体业务和多用户速率的无线通信。3G作为宽带移动通信,将手机变为集语言、图像、图形、数据传输等诸多应用于一体的信息终端。移动电话不仅是一般的通话工具,而且具有个人电脑(PC)的功能,将给人类的生产和生活带来了巨大的变革。第三代移动通信(3G)第三代移动通信(3G)是指传输栅格网技术栅格网技术

栅格计算(GridComputing)或计算栅格(ComputingGrid)又称“

GreatGlobalGrid”即GGG,简称“栅格网”或“格网”,是指用网络相连接的、分布在不同地理位置上计算机或计算机群的数据和计算资源共享应用的计算机网络技术。栅格计算并不是抛弃和取代互联网-万维网(WorldWideWeb,即WWW),而是在它们的基础上升华为格网,而且和互联网-万维网相比,格网的性能更高、功能更强、应用更广。栅格计算(GridComputing)或计算栅格(

传统互联网实现了计算机硬件的连通,万维网实现了网页的连通,而格网则试图实现互联网上所有的资源的全面连通,其中包括计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等。简单地说,格网是把整个互联网整合成一台巨大的超级计算机,实现各种资源的全面共享。传统互联网实现了计算机硬件的连通,万维网实现了

格网是利用宽带互联网或专用网络将不同地理分布的计算资源、存储资源、通信资源、软件资源、信息资源、知识资源、和人力资源连成一个逻辑整体,就像一台超级计算机一样,为用户提供一体化信息服务,最终实现在网络这个虚拟环境上的资源共享和协同工作。信息格网与目前Web服务的主要不同之处在于,它把分布在不同地理位置上的计算设备、数据、信息、知识、软件等组织成一个逻辑整体,各个应用领域可以在此基础上进行各自的应用目的,如空间信息格网、生物信息格网。格网技术将成为引导网络进入下一波信息革命大潮的主线。其基本特征是万维网升级为格网。格网(GGG)被称为第三代互联网。(第二代:WWW)。格网是利用宽带互联网或专用网络将不同地理分布的

近年来,一些发达国家对格网的研究十分重视。SUN公司在2000年9月发行了格网引擎(GridEngine)软件;IBM在2001年投资40亿美元开展格网计算领域的研究,计划开发超级格网计算机,其运算速度为13.6万亿次/秒,存储能力达600万亿字节;惠普公司宣布计划推出Coolbase软件,使用户可以通过互联网共享各种计算设备;Compaq公司(康柏公司)在2001年推出了一种平台格网套装软件;Oracle公司也已开发了用于格网的软件;微软公司正在研制格网界面标准……近年来,一些发达国家对格网的研究十分重视。SU

日本政府在2002年5月投资700亿日元开发超大型格网计算机系统,其速度达300万亿次/秒;英国政府已投入1亿英镑用来研制英国国家格网;中国科学院计算技术研究所建立了专门的格网研究队伍,制定了旨在开发计算格网的“织女星计划”。日本政府在2002年5月投资700亿日元开发超大型格网空间信息格网(SIG)空间信息格网(SIG)

所谓空间信息格网就是利用现有的空间信息基础设施、空间信息网络协议规范,为用户提供一体化空间信息应用服务的智能化信息平台。在这个平台上,空间信息处理是分布式协作的和智能化的,用户可以通过单一的逻辑门户(Portal)访问所有空间信息资源。在空间信息格网中,各种空间信息资源被统一管理和使用。用户可以通过空间信息格网门户透明地使用整个网络上的空间信息资源,而不用在成千上万个网站中搜索自己想要的空间信息。所谓空间信息格网就是利用现有的空间信息基础设

空间信息网格追求的最终目标是把Internet上的空间信息服务站点连接起来实现服务点播(ServiceOnDemand)和一步到位的服务(OneClickisEnough)。从某种意义上来说,数字地球就是一个全球性的空间信息格网,数字城市是这个全球性的空间信息格网的格网节点。空间信息网格追求的最终目标是把Internet上空间信息格网的研究重点空间信息格网的体系结构空间信息表示和空间元信息(Metainfo)空间信息的连通性和一致性空间信息格网安全空间信息格网的智能化等空间信息格网的研究重点空间信息格网的体系结构四、超媒体与分布式空间信息系统技术四、超媒体与分布式空间信息系统技术地理信息技术3DGIS(三维地理信息系统)ComGIS(组件式GIS)WebGIS(网络GIS)TGIS(时态GIS)IGIS(智能GIS)InteroperableGIS(互操作GIS)VRGIS(虚拟现实GIS)。。。地理信息技术3DGIS(三维地理信息系统)五、地理信息的分布式计算

五、地理信息的分布式计算

地理信息的本质特征是区域空间上的分布性,具有明显的地理参考。可以根据行政区划、自然地理区域、坐标系统、地名、地址或数码(邮政编码、电话号码)来识别它们。地理数据是分布在空间上的,对这些区域上的数据的采集、管理、维护和处理是分布的、相对独立的和并行的。地理信息的本质特征是区域空间上的分布性,具有明显的地

对地理信息处理的基础研究已形成一门地理信息科学。对地理信息的处理涉及到广泛的学科和技术(测绘、地理、计算机、通信、认知科学、人工智能等),同时也涉及最前沿的信息处理技术,分布式计算技术就是其中之一。对地理信息处理的基础研究已形成一门地理信息科学。对地

目前不同的部门拥有不同的地理信息,应用部门完全可能把地理信息系统和应用系统建立在不同的分布式计算平台(DCP)上和应用不同的数据库。地理信息分布式计算要解决的问题是确定不同的分布式计算平台(DCP)之上需要建立哪些通用的地理信息服务功能,进一步在不同的分布式计算平台之间及不同的数据库之间实现信息的互操作,使地理信息技术融于主流的信息技术。目前不同的部门拥有不同的地理信息,应用部门完第四章数字地球的关键技术要点课件六、地球数据的无级比例尺

信息综合技术六、地球数据的无级比例尺

信息综合技术

随着GIS在各应用领域的不断深入,现有GIS数据处理技术已不能满足空间时代与信息社会的需要,其中一个重要方面就是GIS无法解决矢量空间数据随比例尺变化而产生的信息量增减的问题,即无级比例尺GIS空间信息压缩与复现的问题。解决该问题的根本出路在于实现GIS制图综合自动化,但是由于地图内容的综合要受到比例尺、制图区域地理特征以及制图符号等诸多要素的影响,而这些因素无法用简单的数学和逻辑语言进行描述,致使目前GIS制图综合仍停留在专业人员手工数字化采编阶段。这样不但影响了空间信息的定位精度及表达的客观性,而且极大地限制了空间数据的处理速度。随着GIS在各应用领域的不断深入,现有GIS何谓无级比例尺GIS?

所谓无级比例尺GIS是以一个大比例尺数据库为基础数据源,在一定区域内空间对象的信息量随比例尺变化而自动增减,从而使得GIS空间信息的压缩和复现与比例尺自适应的一种信息处理技术。

何谓无级比例尺GIS?所谓无级比例尺GIS是以一个大比无级比例尺信息综合的关键技术无级比例尺GIS数据库面向空间对象的地理实体分类无级比例尺GIS地理信息编码无级比例尺GIS信息综合模型无级比例尺GIS的图形语义模型库WebGIS无级比例尺数据管理组件无级比例尺信息综合的关键技术无级比例尺GIS数据库七、空间数据仓库

七、空间数据仓库何谓空间数据仓库?数据仓库是网络数据库的管理系统及其应用系统。空间数据仓库是指支持管理和决策过程的、面向主题的、集成的和随时间而变化的、持久的和具有空间坐标的地球数据的集合。何谓空间数据仓库?数据仓库是网络数据库的管理系统及其应用系统数据仓库的特点它可以根据用户的需求组织和提供数据,而一般数据库的用户只能根据数据库中现存的数据来选择所需数据。数据仓库必须管理大量的信息,需要在不同层次上管理信息,需提供概括和聚集机制来管理数据,包括当前的和历史的数据等,所以数据仓库的数据量远远大于一般数据库的数据量。数据仓库的特点它可以根据用户的需求组织和提供数据,而一般数据数据仓库的特点由于数据仓库的数据分散在由网络连接起来的不同的存储介质或数据库中,所以管理功能特别重要。数据仓库可将数据概括和聚集,并以易于人们理解的方式提供出来。概括和聚集对于理解大量信息是十分关键的。数据仓库从许多存储格式不同、版本不同、数据语义不同的许多数据库中取得数据或信息进行集成,并使之关联。在操作这些数据或信息时,要涉及到多个应用程序,所以数据仓库必须收集、组织和处理这些来自不同应用程序、不同数据库的信息。数据仓库的特点由于数据仓库的数据分散在由网络连接起来的不同的数据仓库数据的复杂性来源于不同地点、不同部门、通过网络Internet/Intranet获得的分布式数据库的数据,其来源十分复杂,它们的类型、格式、精度、编码等存在很大的差别。由于信息源存在着差异、格式的差异(如专题地图与遥感图像)、多重数据定义等,使应用过程中的各种处理变得复杂。数据仓库数据的复杂性来源于不同地点、不同部门、通过网络Int为了解决分布式数据的异构问题,实现地理数据的共享的目的,必须要有统一的标准和规范,或者能相互转换、相互翻译,这对数据仓库来说尤其重要。目前国际标准化组织(ISO)欧洲标准化委员会(CEN)、美国联邦地理数据委员会(FGDC)和开放地理信息系统协会(OGC)组织大量的人力、物力在研究这些问题。为了解决分布式数据的异构问题,实现地理数据的共享的目的,必须第四章数字地球的关键技术要点课件八、数据挖掘八、数据挖掘1、数据挖掘的概念数据挖掘就是要从大量的数据中挖掘出隐含的、未知的、可能感兴趣的、对决策有价值的知识和规则。

1、数据挖掘的概念数据挖掘就是要从大量的数据中挖掘出隐含的、2、数据挖掘的相关学科

数据挖掘是一交叉学科,涉及到诸如机器学习、模式识别、统计学、数据库、联机分析、模糊逻辑、人工神经网络、不确定推理、数据可视化等学科。特别是它可以被看成是数据库理论和机器学习的交叉科学。数据挖掘的核心概念是人工智能领域中的机器学习。2、数据挖掘的相关学科数据挖掘是一交叉学科,3、数据挖掘的分类

按挖掘的数据库分类不同的数据库其数据的描述、组织和存储方式都不相同,一般可以分为关系数据库、事务数据库、面向对象数据库、空间数据库、时间数据库、多媒体数据库、主动数据库、internet信息库等。数据挖掘可以按所挖掘的数据库的不同而划分为不同的种类,其中从关系数据库中挖掘知识,是使用的最为广泛的一种,也是最为成熟的一类数据挖掘技术。3、数据挖掘的分类按挖掘的数据库分类3、数据挖掘的分类按挖掘出的知识分类一般情况下,数据挖掘可以挖掘出的知识包括:关联规则、特征规则、分类规则、聚类规则、序列模式、数据综合和概括、总结规则、趋势分析、偏差分析、模式分析等。3、数据挖掘的分类按挖掘出的知识分类3、数据挖掘的分类

按挖掘时用的技术方法分类数据挖掘可以用到的技术方法很多,主要包括:统计分析方法、遗传算法、粗集方法、决策树、人工神经网络、模糊逻辑、规则归纳、聚类分析和模式识别、最近邻技术、可视化技术等。3、数据挖掘的分类按挖掘时用的技术方法分类4、已有数据挖掘工具(1)IBM推出的数据挖掘技术:IBM开发了一套称为IntelligentMiner的数据挖掘产品,用来帮助业务分析策划人员从数据中发掘出各种假设。IBM的IntelligentMiner是少数可以建立六种模式的工具,这六种模式是:分类、回归、时间序列、聚类、关联以及顺序模式。同时IBM的IntelligentMiner还可以连接这六种模式,大大提高了数据挖掘(DataMining)的效率。4、已有数据挖掘工具(1)IBM推出的数据挖掘技术:IB已有数据挖掘工具(2)

Microsoft的数据挖掘技术:Microsoft的方案是提供一个数据分析平台--SQLServer2000,而不是一个单独的DM算法。这样一个平台可以为应用问题提供一个基本结构,以便应用于多种不同的应用背景。这个分析平台也为多种技术和工具的集成提供了可能。另外,Microsoft还提供了一个应用编程接口(OLEDBFORDM),使得数据挖掘有可能成为一项普及技术。

Microsoft的新研究目标就是使得数据库系统达到自调整和自我管理。在MicrosoftSQLServer中所加入的自调整部件能使数据库主动适应应用需求,而不是象以前由应用适应数据库。已有数据挖掘工具(2)Microsoft的数据挖掘技术:已有数据挖掘工具(3)AC2

是由CyrilWay等人开发的一组由C/C++编写的工具,包括:

Clementine数据挖掘工具包,曾两次获得英国政府SMART创新奖,它的应用包括企业营销中的客户划分、欺诈检测、信用评估、利润预测等;

DataEngine是使用模糊技术、神经网络和传统的统计方法进行数据分析的软件产品,它已被用于预测、数据库营销、质量控制、过程分析和诊断等领域。

DataScope可将数据库中的数据内容转化为分析图表,它可以应用于运行、财务、客户、产品、科研等各类数据库,以揭示隐藏的商业机会、有趣的相互关系,从而产生新的科学发现和商业成果。已有数据挖掘工具(3)AC2是由CyrilWay等人开已有数据挖掘工具其它常用的工具还有MLC++、Nuggets、LEVEL5Quest、MineSet(SGI)、Partek、SE-Learn、Snob、SuperQuery、WINROSA、XmdvTool等。已有数据挖掘工具其它常用的工具还有MLC++、Nuggets5、数据挖掘的应用从人口数据库中,不仅可以得到所需的各种统计数据,如得出某一地区、某一年龄段的文化程度分布,某地区的出生率和死亡率等,而且还能得出有助于人口控制的种种政策和决策。医疗数据挖掘可用于病历、病人行为特征的分析,以及用于药方管理等,以安排治疗方案、判断药方的有效性等。5、数据挖掘的应用从人口数据库中,不仅可以得到所需的各种统5、数据挖掘的应用司法数据挖掘可用于案件调查、案例分析、犯罪监控等等,还可以用于犯罪行为特征的分析。在特定数据库中输入一定数量的典型犯罪案例,就能得出若干条刑法条文,并能依此对新案例进行自动判刑。5、数据挖掘的应用司法数据挖掘可用于案件调查、案例分析、犯罪

有时,人们常常把DM(Data

Mining)和KDD(KnowledgeDiscoveryinDatabases)等同起来。一般来说KDD侧重于目的和结果,而DM侧重于处理过程和方法。有时,人们常常把DM(DataMining)和6、空间数据挖掘

空间数据挖掘(SpatialDataMining,SDM)是指从空间数据库中提取用户感兴趣的空间模式与特征、空间与非空间数据的普遍关系及其它一些隐含在数据库中的普遍的数据特征,它是对KDD-KnowledgeDiscoveryinDatabases)

技术在空间数据库方面应用的延伸。6、空间数据挖掘空间数据挖掘(Spatial7、空间数据挖掘的方法数学统计方法使用这种方法一般是首先建立一个数学模型或统计模型,然后根据这种模型提取出有关的知识。例如,可由训练数据建立一个Bnyesian网,然后,根据该网的一些参数及联系权值提取出相关的知识。统计方法一直是分析空间数据的常用方法,有着较强的理论基础,拥有大量的算法,可有效地处理数字型数据。统计方法难以处理字符型数据。应用统计方法需要有领域知识和统计知识,一般由具有统计经验的领域专家来完成。7、空间数据挖掘的方法数学统计方法7、空间数据挖掘的方法归纳方法即对数据进行概括和综合,归纳出高层次的模式或特征。归纳法一般需要背景知识,常以概念树的形式给出。在GIS数据库中,有属性概念树和空间关系概念树两类。7、空间数据挖掘的方法归纳方法7、空间数据挖掘的方法聚类方法聚类分析方法按一定的距离或相似性测度将数据分成一系列相互区分的组,它与归纳法不同之处在于不需要背景知识而直接发现一些有意义的结构与模式。经典统计学中的聚类分析方法对属性数据库中的大数据量存在速度慢、效率低的问题,对图形数据库应发展空间聚类方法分析方法,空间分析方法可采用拓扑结构分析、空间缓冲区及距离分析、叠置分析等方法,旨在发现目标在空间上的相连、相邻和共生等关联关系。7、空间数据挖掘的方法聚类方法7、空间数据挖掘的方法Rough集方法Rough集理论(RoughSetsTheory)是波兰华沙大学Z.Pawlak教授在1982年提出的一种智能数据决策分析工具,被广泛研究并应用于不精确、不确定、不完全的信息的分类分析和知识获取。Rough集理论为GIS的属性分析和知识发现开辟了一条新途径,可用于GIS数据库属性表的一致性分析、属性的重要性、属性依赖、属性表简化、最小决策和分类算法生成,使得在保持普遍化数据内涵的前提条件下最大限度地精炼知识。7、空间数据挖掘的方法Rough集方法7、空间数据挖掘的方法云理论云理论是用于处理不确定性的一种新理论,由云模型(cloudmodel)、不确定性推理(reasoningunderuncertainty)和云变换(cloudtransform)三大支柱构成。云理论将模糊性和随机性结合起来,弥补了作为模糊集理论基石的隶属函数概念的固有缺陷,为DM中定量与定性相结合的处理方法奠定了基础。7、空间数据挖掘的方法云理论8、空间数据挖掘技术的应用地理数据的深层挖掘例如数字高程模型除了反映高程外,还与地质岩性与构造有关;土壤或植物能够反映气候情况;地理数据的关联分析有些空间数据的隐含的知识需要通过若干个不同类型的物体的组合,通过关联分析后才能获得隐含的知识。如在对遥感影象分析时,位于河边的建筑物可能是码头,位于山顶的建筑物可能是天文台,铁路一定有车站,道路过河一定有桥梁或渡船,学校一定有操场等。8、空间数据挖掘技术的应用地理数据的深层挖掘8、空间数据挖掘技术的应用地理数据的聚类分析某些不同属性的空间数据之间差别不大,只有将它们放在一起进行对比分析才能将它们区别。如马尾松与油松外形相似,只有将其对比后才发现它们的针叶有长有短。在遥感影象上判别一条河流是否发生了洪水,单凭一个时相影象难以确定,它需要通过与枯水期、平水期的影象进行对比分析和叠加比较才能确定。地理数据的分类算法遥感影象的分类算法包括最小距离分类、相似分类、线性判别分析、最大自然比分类、比较识别分类及集群分析等。8、空间数据挖掘技术的应用地理数据的聚类分析8、空间数据挖掘技术的应用地理数据的联机集成挖掘对分布式数据库与地理信息系统进行集成挖掘,从分布式数据库中提取所需的数据进行关联分析、聚集分析和分类。地理数据的知识挖掘的智能代理。在空间数据的知识挖掘过程中需要知识模型,主要是概念模型或物理模型,如DEM与岩性、构造、地貌、气候、土地利用的关系模型等。8、空间数据挖掘技术的应用地理数据的联机集成挖掘第四章数字地球的关键技术要点课件第四章数字地球的关键技术要点课件九、多种数据的融合技术九、多种数据的融合技术

融合(Fusion)与集成(Integration)的区别是:集成是指多种数据的叠加,叠加的集成数据中,仍保存着原来的数据的特征,如影像地图;融合是指多种数据经合成后,不再保留原来数据的单个特征,而产生一种新的综合数据,如假彩色合成影像。集成的数据没有产生根本的变化,而融合的数据产生了根本的变化,产生了新的数据。融合(Fusion)与集成(Integrat第四章数字地球的关键技术要点课件十、数字地球的仿真与虚拟现实技术十、数字地球的仿真与虚拟现实技术

虚拟现实(VirtualReality)是指运用计算机技术生成一个逼真的、具有视觉、听觉、触觉的感观世界。人们可以直接对这个生成的虚拟实体进行考察和操纵。

虚拟现实(VirtualReality)是指运用计虚拟现实的关键技术包括以下几个方面:动态环境建模技术。虚拟环境的建立是虚拟现实技术的核心内容。动态环境建模技术的目的是获取实际环境的三维数据,并根据应用的需要,利用获取的三维数据建立相应的虚拟环境模型。实时三维图形生成技术。三维图形的生成技术已经较为成熟,其关键是如何实现“实时”生成。为了达到实时的目的,至少要保证图形的刷新率不低于15幅/秒,最好是高于30幅/秒。在不降低图形的质量和复杂度的前提下,如何提高刷新频率将是该技术的研究内容。虚拟现实的关键技术包括以下几个方面:立体显示和传感器技术。虚拟现实的交互能力依赖于立体显示和传感器技术的发展。现有的虚拟现实还远远不能满足系统的需要,例如,数据手套有延迟大、分辨率低、作用范围小、使用不便等缺点;虚拟现实设备的跟踪精度和跟踪范围也有待提高,因此有必要开发新的三维显示技术。应用系统开发工具。虚拟现实应用的关键是寻找合适的场合和对象,即如何发挥想象力和创造力。选择适当的应用对象可以大幅度提高生产效率、减轻劳动强度、提高产品开发质量。为了达到这一目的,必须研究虚拟现实的开发工具。例如,虚拟现实系统开发平台、分布式虚拟现实技术等。立体显示和传感器技术。虚拟现实的交互能力依赖于立体显示和传感第四章数字地球的关键技术要点课件

VR技术和GIS技术的结合(VR-GIS)已成为公认的数字城市的关键技术。虚拟现实和三维模拟是数字城市表现的主要形式,虚拟现实技术的应用很广泛,如建筑物视觉效果的评估,城镇设计和城市信息系统、气候、环境和电波传播的模拟等。VR技术和GIS技术的结合(VR-GIS)已成VR的特点用计算机生成一个逼真的物体,具有三维视觉、立体听觉和触觉的效果;用户可以通过五官、四肢与虚拟实体进行交互,如移动由计算机生成的虚拟物体,并产生符合物理的、力学的和生物原理的行为和逼真的感觉;虚拟技术具有从外到内或从内到外观察数据空间的特征,在不同空间漫游。而一般数据可视化,仅仅是从计算机的监视器上从外到内观察数据空间,缺乏临场感;往往需要借助三维传感技术(如数字头盔、手套及外衣等)为用户提供一个可操作的环境,并在这环境中自由漫游;VR的特点用计算机生成一个逼真的物体,具有三维视觉、立体听觉仿真技术的特点用户对虚拟的物体只有视觉或听觉,没有触觉。用户没有亲临其境的感觉,只有旁观者的感觉。不存在交互作用。如用户推动计算机环境中的物体,不会产生符合物理的、力学的行为或动作。仿真技术的特点用户对虚拟的物体只有视觉或听觉,没有触觉。THEENDTHEEND第四章数字地球的关键技术第四章数字地球的关键技术一、高分辨率卫星遥感数据的快速获取技术一、高分辨率卫星遥感数据的快速获取技术

高分辨率卫星遥感数据的快速获取技术主要包括两个方面:一是高分辨率数据,如1米分辨率以上的遥感数据;二是快速获取,即高时间分辨率。高分辨率卫星遥感数据的快速获取技术主要包括两个方面:

卫星遥感是数字地球获取数据的主要手段。卫星遥感包括不同轨道高度、不同分辨率的气象卫星系列、海洋卫星系列、陆地卫星系列、测地卫星系列以及小卫星系列;空间分辨率从0.5米到4000米;光谱范围从紫外、可见光、红外到微波;波段可达到240个以上。卫星遥感是数字地球获取数据的主要手段。卫星遥感包括不遥感卫星图遥感卫星图美国IKONOSⅡ

卫星中国北京1米美国IKONOSⅡ卫星中国北京1米分辨率由低到高的遥感影像64米/像素分辨率由低到高的遥感影像64米/像素分辨率由低到高的遥感影像32米/像素分辨率由低到高的遥感影像32米/像素分辨率由低到高的遥感影像16米/像素分辨率由低到高的遥感影像16米/像素分辨率由低到高的遥感影像8米/像素分辨率由低到高的遥感影像8米/像素分辨率由低到高的遥感影像4米/像素分辨率由低到高的遥感影像4米/像素分辨率由低到高的遥感影像2米/像素分辨率由低到高的遥感影像2米/像素罗马梵蒂冈大教堂,0.7m,真彩色罗马梵蒂冈大教堂,0.7m,真彩色911遭恐怖分子袭击前后纽约世贸大楼的比较受破坏的范围高耸的世贸中心姊妹楼及其辅助大楼已不复存在911遭恐怖分子袭击前后纽约世贸大楼的比较受破坏的范围高耸奋进号航天飞机外观图60m长桅杆从航天飞机上伸出,顶端安装有另一个天线(还有一个在飞机上,这两个天线形成立体象对)SRTM2000.2奋进号航天飞机外观图60m长桅杆从航天飞机上伸出,顶端安装有奋进号发回的立体图奋进号发回的立体图第四章数字地球的关键技术要点课件加拿大RadarSAT影像加拿大RadarSAT影像二、海量数据的快速处理与

存储技术

二、海量数据的快速处理与

存储技术

要对全球数据进行处理和虚拟显示,需要有超大型计算机。这样的超大型计算机目前只有少数国家才有。对于大多数国家来说,只有采用多台低档计算机连网并行处理的方法来处理海量的数据。要对全球数据进行处理和虚拟显示,需要有超大型计

并行计算通常是指一个任务的各个部分并行同时地进行计算,而不是顺序地执行。这种计算要求各部分的数据相关性小。如果各部分有前后的因果关系,即一个部分的计算结果(输出)必须作为另一部分的输入,则不能进行并行计算。在图像处理中,通常一幅图像的各部分的相关性小,没有时间上的因果关系,可以作并行处理。在地理空间信息处理中,有很多情况可用并行处理方法。并行计算通常是指一个任务的各个部分并行同时地

海量数据的存储目前依赖于分布式存储系统。分布式数据库及分布式存储建设是数据管理的趋势。不同部门、不同行业、不同地区应分别建立自己的数据库,不但为了应用的方便,而且也为数据采集、数据更新和数据处理与管理的方便。不同专业的数据库应由不同专业的部门建设和管理,这样才能发挥各自的特长,避免集中式系统带来的管理困难和网络阻塞。海量数据的存储目前依赖于分布式存储系统。分布三、高速计算机信息网络技术

三、高速计算机信息网络技术网络技术在数字地球技术中占有十分重要的地位,网络技术是确保数字地球的信息畅通和共享的必要条件。数字地球的网络技术的发展方向,主要有三大趋势:宽带化;无线化;综合化或集成化只有宽带化才能满足日益增长和海量信息的传输;只有无线化才能真正做到“网络的无处不在和无时不在”和“随时随地实现通信”的理想;只有实现综合化或集成化,才能实现自动操作所有的、分散的电子设备,才能实现自动遥控和智能化。网络技术在数字地球技术中占有十分重要的地位,网络技术是确保数

计算机网络,是指将空间位置不同,尤其是地理位置不同的、具有独立功能的多个计算机系统,用通信技术(包括通信设备和线路)连接起来,并以网络协议、网络操作系统等网络软件实现网络资源(如硬件、软件及信息或数据等)实现共享的技术系统。

什么是计算机网络?

计算机网络,是指将空间位置不同,尤其是地理位置计算机网络类型按通信距离的原则可以划分为局域网(LAN)和广域网(WAN);按网络的拓扑结合原则,可划分为环形网和总线形网等;按通信介质原则划分,可以分为双绞线网、同轴电缆网、光纤(OpticalFiber)网和卫星网(无线网)按信号频带占用方式为原则,可以分为基带网和宽带网计算机网络类型按通信距离的原则可以划分为局域网(LAN)和广最常用的两种网络形式

现代通信技术出现了两大组合类型:一种是有线互联网(wiredInternet),又称固定互联网(StableInternet)和移动互联网(MobileInternet)技术。这是目前最常用的两种网络形式。最常用的两种网络形式现代通信技术出现了两大组合有线互联网(wiredInternet)又称固定互联网(StableInternet),也就是光纤-光缆网技术。主要包括以下几种类型:狭带光缆:每条可供6万人(3万+3万)同时通话(第一代)宽带光缆:每条可供6000万人(3000万+3000万)同时通话(第二代)波分光缆:每条可供60000万人(30000万+30000万)同时通话(第三代)密集波分光缆:为第四代现代通信技术。有线互联网(wiredInternet)又称固定互联网(SInternetI的最快调制解调器传输速度只有每秒56千比特InternetII传递信息的速度,将达到每秒2.4吉比特InternetIII,即波分复用技术网络(WDM-Internet),它可以不用铺设新的光缆,就能增加现有的网络带宽。该技术在同一条光缆上,同时发出不同的光信号,按照不同的光的颜色(即波长)传输信号。每一个信号就形成了一条能够运载各自信息流的独立通道。利用波分复用技术发送一个附加光信号,就能把带宽增加一倍。将来在同一光缆上,可以传输8种、16种、32种、40种、甚至80种波长的信号。InternetIV,(DWCDMA-Internet),密集波分复用光缆互联网。InternetI的最快调制解调器传输速度只有每秒56千比无线互联网(移动互联网)

卫星移动互联网(Sat-mobile-Internet)也叫远程移动互联网(Tele-mobile-internet)。它是一种通信卫星与光纤-光缆有线互联网相结合的一种通信方式,或独立的直接和通信卫星相联结的互联网。无线互联网(移动互联网)卫星移动互联网(Sat无线互联网(移动互联网)Teledesic计划:Teledesic系统是美国微软(Microsoft)公司和麦考(McCaw)蜂窝通信公司提出的一项庞大的计划,耗资90亿美元,计划发射924颗卫星(其中84颗备用),其主要目标瞄准宽带业务,充分利用信息高速公路多媒体技术,建造一个覆盖全球的宽带卫星通信网“:Intemetinthesky"(空中因特网,就像把光缆架设在空中一样,让任何人都能获得双向的、交互式多媒体宽带业务。后来Teledesic系统设计经过了简化,从最初的840颗卫星,减至288颗卫星,分布在12个轨道,轨道高度l375km。1998年8月,Teledesic系统同摩托罗拉公司的Celestri系统合并成一个系统,统称’reledesic系统,将方案修改为120颗卫星加6颗在轨备份卫星。无线互联网(移动互联网)Teledesic计划:Tele短程移动互联网(移动局域网)

短程移动互联网是最具有前途的移动通信技术。它需要三个基本功能:移动的计算机计算(MobileComputing)、移动接入(MobileConnection)及移动通信(MobileCommunication),简称3MC功能。短程移动互联网(移动局域网)短程移动互联网是最WAP

WAP(WirelessApplicationProtocal),是无线通信与互联网相结合的应用平台,用户通过移动电话(手机)直接操作接入Internet-web,手机用户可通过浏览获取在线(online)信息和E-mail等web上的服务,实现享受Web的信息资源和使用电子商务等。WAPWAP(WirelessApplicatioWAP

WAP是一个开放的全球性的无线通信与Web相结合的应用平台,它使得拥有无线终端设备的,如移动电话或笔记本电脑用户可以方便、快捷地访问交互式接入和信息服务。WAP的工作模式与Web的工作模式接近,完全支持Internet接入。WAP还能支持多种类型的承载业务如GSM(电路交换系统)、GPRS(通用分组无线业务)、CDMA(网络扩频技术)等。WAPWAP是一个开放的全球性的无线通信与Web相结合蓝牙(BlueTooth)

蓝牙(BlueTooth)是一项短程无线连接标准,旨在取代信息服务之间的有线连接,实现电子设备之间的无线互联,以便确保大多数常见的计算机和通信设备之间可以方便地进行无线通信。蓝牙是通过不同电子设备内置具有相同的协议的发射与接收设备,就可以进行一不定期范围内的无线通信,也可以在固定与移动设备通信环境之间建立连接的技术。如可以把蓝牙技术引入移动电话、笔记本电脑、掌上电脑等便携式电脑和固定的个人电脑(PC)进行交互通信;也可以与打印机、个人数字助理(PDA)、传真机(FAX)、游戏机相连接,在短距离内,无需任何电缆连接就可以实现无线通信。蓝牙(BlueTooth)蓝牙(Blue第三代移动通信(3G)

第三代移动通信(3G)是指传输速率高达2Mb/s的宽带超媒体业务,支持高质量的语音、分组数据、多媒体业务和多用户速率的无线通信。3G作为宽带移动通信,将手机变为集语言、图像、图形、数据传输等诸多应用于一体的信息终端。移动电话不仅是一般的通话工具,而且具有个人电脑(PC)的功能,将给人类的生产和生活带来了巨大的变革。第三代移动通信(3G)第三代移动通信(3G)是指传输栅格网技术栅格网技术

栅格计算(GridComputing)或计算栅格(ComputingGrid)又称“

GreatGlobalGrid”即GGG,简称“栅格网”或“格网”,是指用网络相连接的、分布在不同地理位置上计算机或计算机群的数据和计算资源共享应用的计算机网络技术。栅格计算并不是抛弃和取代互联网-万维网(WorldWideWeb,即WWW),而是在它们的基础上升华为格网,而且和互联网-万维网相比,格网的性能更高、功能更强、应用更广。栅格计算(GridComputing)或计算栅格(

传统互联网实现了计算机硬件的连通,万维网实现了网页的连通,而格网则试图实现互联网上所有的资源的全面连通,其中包括计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等。简单地说,格网是把整个互联网整合成一台巨大的超级计算机,实现各种资源的全面共享。传统互联网实现了计算机硬件的连通,万维网实现了

格网是利用宽带互联网或专用网络将不同地理分布的计算资源、存储资源、通信资源、软件资源、信息资源、知识资源、和人力资源连成一个逻辑整体,就像一台超级计算机一样,为用户提供一体化信息服务,最终实现在网络这个虚拟环境上的资源共享和协同工作。信息格网与目前Web服务的主要不同之处在于,它把分布在不同地理位置上的计算设备、数据、信息、知识、软件等组织成一个逻辑整体,各个应用领域可以在此基础上进行各自的应用目的,如空间信息格网、生物信息格网。格网技术将成为引导网络进入下一波信息革命大潮的主线。其基本特征是万维网升级为格网。格网(GGG)被称为第三代互联网。(第二代:WWW)。格网是利用宽带互联网或专用网络将不同地理分布的

近年来,一些发达国家对格网的研究十分重视。SUN公司在2000年9月发行了格网引擎(GridEngine)软件;IBM在2001年投资40亿美元开展格网计算领域的研究,计划开发超级格网计算机,其运算速度为13.6万亿次/秒,存储能力达600万亿字节;惠普公司宣布计划推出Coolbase软件,使用户可以通过互联网共享各种计算设备;Compaq公司(康柏公司)在2001年推出了一种平台格网套装软件;Oracle公司也已开发了用于格网的软件;微软公司正在研制格网界面标准……近年来,一些发达国家对格网的研究十分重视。SU

日本政府在2002年5月投资700亿日元开发超大型格网计算机系统,其速度达300万亿次/秒;英国政府已投入1亿英镑用来研制英国国家格网;中国科学院计算技术研究所建立了专门的格网研究队伍,制定了旨在开发计算格网的“织女星计划”。日本政府在2002年5月投资700亿日元开发超大型格网空间信息格网(SIG)空间信息格网(SIG)

所谓空间信息格网就是利用现有的空间信息基础设施、空间信息网络协议规范,为用户提供一体化空间信息应用服务的智能化信息平台。在这个平台上,空间信息处理是分布式协作的和智能化的,用户可以通过单一的逻辑门户(Portal)访问所有空间信息资源。在空间信息格网中,各种空间信息资源被统一管理和使用。用户可以通过空间信息格网门户透明地使用整个网络上的空间信息资源,而不用在成千上万个网站中搜索自己想要的空间信息。所谓空间信息格网就是利用现有的空间信息基础设

空间信息网格追求的最终目标是把Internet上的空间信息服务站点连接起来实现服务点播(ServiceOnDemand)和一步到位的服务(OneClickisEnough)。从某种意义上来说,数字地球就是一个全球性的空间信息格网,数字城市是这个全球性的空间信息格网的格网节点。空间信息网格追求的最终目标是把Internet上空间信息格网的研究重点空间信息格网的体系结构空间信息表示和空间元信息(Metainfo)空间信息的连通性和一致性空间信息格网安全空间信息格网的智能化等空间信息格网的研究重点空间信息格网的体系结构四、超媒体与分布式空间信息系统技术四、超媒体与分布式空间信息系统技术地理信息技术3DGIS(三维地理信息系统)ComGIS(组件式GIS)WebGIS(网络GIS)TGIS(时态GIS)IGIS(智能GIS)InteroperableGIS(互操作GIS)VRGIS(虚拟现实GIS)。。。地理信息技术3DGIS(三维地理信息系统)五、地理信息的分布式计算

五、地理信息的分布式计算

地理信息的本质特征是区域空间上的分布性,具有明显的地理参考。可以根据行政区划、自然地理区域、坐标系统、地名、地址或数码(邮政编码、电话号码)来识别它们。地理数据是分布在空间上的,对这些区域上的数据的采集、管理、维护和处理是分布的、相对独立的和并行的。地理信息的本质特征是区域空间上的分布性,具有明显的地

对地理信息处理的基础研究已形成一门地理信息科学。对地理信息的处理涉及到广泛的学科和技术(测绘、地理、计算机、通信、认知科学、人工智能等),同时也涉及最前沿的信息处理技术,分布式计算技术就是其中之一。对地理信息处理的基础研究已形成一门地理信息科学。对地

目前不同的部门拥有不同的地理信息,应用部门完全可能把地理信息系统和应用系统建立在不同的分布式计算平台(DCP)上和应用不同的数据库。地理信息分布式计算要解决的问题是确定不同的分布式计算平台(DCP)之上需要建立哪些通用的地理信息服务功能,进一步在不同的分布式计算平台之间及不同的数据库之间实现信息的互操作,使地理信息技术融于主流的信息技术。目前不同的部门拥有不同的地理信息,应用部门完第四章数字地球的关键技术要点课件六、地球数据的无级比例尺

信息综合技术六、地球数据的无级比例尺

信息综合技术

随着GIS在各应用领域的不断深入,现有GIS数据处理技术已不能满足空间时代与信息社会的需要,其中一个重要方面就是GIS无法解决矢量空间数据随比例尺变化而产生的信息量增减的问题,即无级比例尺GIS空间信息压缩与复现的问题。解决该问题的根本出路在于实现GIS制图综合自动化,但是由于地图内容的综合要受到比例尺、制图区域地理特征以及制图符号等诸多要素的影响,而这些因素无法用简单的数学和逻辑语言进行描述,致使目前GIS制图综合仍停留在专业人员手工数字化采编阶段。这样不但影响了空间信息的定位精度及表达的客观性,而且极大地限制了空间数据的处理速度。随着GIS在各应用领域的不断深入,现有GIS何谓无级比例尺GIS?

所谓无级比例尺GIS是以一个大比例尺数据库为基础数据源,在一定区域内空间对象的信息量随比例尺变化而自动增减,从而使得GIS空间信息的压缩和复现与比例尺自适应的一种信息处理技术。

何谓无级比例尺GIS?所谓无级比例尺GIS是以一个大比无级比例尺信息综合的关键技术无级比例尺GIS数据库面向空间对象的地理实体分类无级比例尺GIS地理信息编码无级比例尺GIS信息综合模型无级比例尺GIS的图形语义模型库WebGIS无级比例尺数据管理组件无级比例尺信息综合的关键技术无级比例尺GIS数据库七、空间数据仓库

七、空间数据仓库何谓空间数据仓库?数据仓库是网络数据库的管理系统及其应用系统。空间数据仓库是指支持管理和决策过程的、面向主题的、集成的和随时间而变化的、持久的和具有空间坐标的地球数据的集合。何谓空间数据仓库?数据仓库是网络数据库的管理系统及其应用系统数据仓库的特点它可以根据用户的需求组织和提供数据,而一般数据库的用户只能根据数据库中现存的数据来选择所需数据。数据仓库必须管理大量的信息,需要在不同层次上管理信息,需提供概括和聚集机制来管理数据,包括当前的和历史的数据等,所以数据仓库的数据量远远大于一般数据库的数据量。数据仓库的特点它可以根据用户的需求组织和提供数据,而一般数据数据仓库的特点由于数据仓库的数据分散在由网络连接起来的不同的存储介质或数据库中,所以管理功能特别重要。数据仓库可将数据概括和聚集,并以易于人们理解的方式提供出来。概括和聚集对于理解大量信息是十分关键的。数据仓库从许多存储格式不同、版本不同、数据语义不同的许多数据库中取得数据或信息进行集成,并使之关联。在操作这些数据或信息时,要涉及到多个应用程序,所以数据仓库必须收集、组织和处理这些来自不同应用程序、不同数据库的信息。数据仓库的特点由于数据仓库的数据分散在由网络连接起来的不同的数据仓库数据的复杂性来源于不同地点、不同部门、通过网络Internet/Intranet获得的分布式数据库的数据,其来源十分复杂,它们的类型、格式、精度、编码等存在很大的差别。由于信息源存在着差异、格式的差异(如专题地图与遥感图像)、多重数据定义等,使应用过程中的各种处理变得复杂。数据仓库数据的复杂性来源于不同地点、不同部门、通过网络Int为了解决分布式数据的异构问题,实现地理数据的共享的目的,必须要有统一的标准和规范,或者能相互转换、相互翻译,这对数据仓库来说尤其重要。目前国际标准化组织(ISO)欧洲标准化委员会(CEN)、美国联邦地理数据委员会(FGDC)和开放地理信息系统协会(OGC)组织大量的人力、物力在研究这些问题。为了解决分布式数据的异构问题,实现地理数据的共享的目的,必须第四章数字地球的关键技术要点课件八、数据挖掘八、数据挖掘1、数据挖掘的概念数据挖掘就是要从大量的数据中挖掘出隐含的、未知的、可能感兴趣的、对决策有价值的知识和规则。

1、数据挖掘的概念数据挖掘就是要从大量的数据中挖掘出隐含的、2、数据挖掘的相关学科

数据挖掘是一交叉学科,涉及到诸如机器学习、模式识别、统计学、数据库、联机分析、模糊逻辑、人工神经网络、不确定推理、数据可视化等学科。特别是它可以被看成是数据库理论和机器学习的交叉科学。数据挖掘的核心概念是人工智能领域中的机器学习。2、数据挖掘的相关学科数据挖掘是一交叉学科,3、数据挖掘的分类

按挖掘的数据库分类不同的数据库其数据的描述、组织和存储方式都不相同,一般可以分为关系数据库、事务数据库、面向对象数据库、空间数据库、时间数据库、多媒体数据库、主动数据库、internet信息库等。数据挖掘可以按所挖掘的数据库的不同而划分为不同的种类,其中从关系数据库中挖掘知识,是使用的最为广泛的一种,也是最为成熟的一类数据挖掘技术。3、数据挖掘的分类按挖掘的数据库分类3、数据挖掘的分类按挖掘出的知识分类一般情况下,数据挖掘可以挖掘出的知识包括:关联规则、特征规则、分类规则、聚类规则、序列模式、数据综合和概括、总结规则、趋势分析、偏差分析、模式分析等。3、数据挖掘的分类按挖掘出的知识分类3、数据挖掘的分类

按挖掘时用的技术方法分类数据挖掘可以用到的技术方法很多,主要包括:统计分析方法、遗传算法、粗集方法、决策树、人工神经网络、模糊逻辑、规则归纳、聚类分析和模式识别、最近邻技术、可视化技术等。3、数据挖掘的分类按挖掘时用的技术方法分类4、已有数据挖掘工具(1)IBM推出的数据挖掘技术:IBM开发了一套称为IntelligentMiner的数据挖掘产品,用来帮助业务分析策划人员从数据中发掘出各种假设。IBM的IntelligentMiner是少数可以建立六种模式的工具,这六种模式是:分类、回归、时间序列、聚类、关联以及顺序模式。同时IBM的IntelligentMiner还可以连接这六种模式,大大提高了数据挖掘(DataMining)的效率。4、已有数据挖掘工具(1)IBM推出的数据挖掘技术:IB已有数据挖掘工具(2)

Microsoft的数据挖掘技术:Microsoft的方案是提供一个数据分析平台--SQLServer2000,而不是一个单独的DM算法。这样一个平台可以为应用问题提供一个基本结构,以便应用于多种不同的应用背景。这个分析平台也为多种技术和工具的集成提供了可能。另外,Microsoft还提供了一个应用编程接口(OLEDBFORDM),使得数据挖掘有可能成为一项普及技术。

Microsoft的新研究目标就是使得数据库系统达到自调整和自我管理。在MicrosoftSQLServer中所加入的自调整部件能使数据库主动适应应用需求,而不是象以前由应用适应数据库。已有数据挖掘工具(2)Microsoft的数据挖掘技术:已有数据挖掘工具(3)AC2

是由CyrilWay等人开发的一组由C/C++编写的工具,包括:

Clementine数据挖掘工具包,曾两次获得英国政府SMART创新奖,它的应用包括企业营销中的客户划分、欺诈检测、信用评估、利润预测等;

DataEngine是使用模糊技术、神经网络和传统的统计方法进行数据分析的软件产品,它已被用于预测、数据库营销、质量控制、过程分析和诊断等领域。

DataScope可将数据库中的数据内容转化为分析图表,它可以应用于运行、财务、客户、产品、科研等各类数据库,以揭示隐藏的商业机会、有趣的相互关系,从而产生新的科学发现和商业成果。已有数据挖掘工具(3)AC2是由CyrilWay等人开已有数据挖掘工具其它常用的工具还有MLC++、Nuggets、LEVEL5Quest、MineSet(SGI)、Partek、SE-Learn、Snob、SuperQuery、WINROSA、XmdvTool等。已有数据挖掘工具其它常用的工具还有MLC++、Nuggets5、数据挖掘的应用从人口数据库中,不仅可以得到所需的各种统计数据,如得出某一地区、某一年龄段的文化程度分布,某地区的出生率和死亡率等,而且还能得出有助于人口控制的种种政策和决策。医疗数据挖掘可用于病历、病人行为特征的分析,以及用于药方管理等,以安排治疗方案、判断药方的有效性等。5、数据挖掘的应用从人口数据库中,不仅可以得到所需的各种统5、数据挖掘的应用司法数据挖掘可用于案件调查、案例分析、犯罪监控等等,还可以用于犯罪行为特征的分析。在特定数据库中输入一定数量的典型犯罪案例,就能得出若干条刑法条文,并能依此对新案例进行自动判刑。5、数据挖掘的应用司法数据挖掘可用于案件调查、案例分析、犯罪

有时,人们常常把DM(Data

Mining)和KDD(KnowledgeDiscoveryinDatabases)等同起来。一般来说KDD侧重于目的和结果,而DM侧重于处理过程和方法。有时,人们常常把DM(DataMining)和6、空间数据挖掘

空间数据挖掘(SpatialDataMining,SDM)是指从空间数据库中提取用户感兴趣的空间模式与特征、空间与非空间数据的普遍关系及其它一些隐含在数据库中的普遍的数据特征,它是对KDD-KnowledgeDiscoveryinDatabases)

技术在空间数据库方面应用的延伸。6、空间数据挖掘空间数据挖掘(Spatial7、空间数据挖掘的方法数学统计方法使用这种方法一般是首先建立一个数学模型或统计模型,然后根据这种模型提取出有关的知识。例如,可由训练数据建立一个Bnyesian网,然后,根据该网的一些参数及联系权值提取出相关的知识。统计方法一直是分析空间数据的常用方法,有着较强的理论基础,拥有大量的算法,可有效地处理数字型数据。统计方法难以处理字符型数据。应用统计方法需要有领域知识和统计知识,一般由具有统计经验的领域专家来完成。7、空间数据挖掘的方法数学统计方法7、空间数据挖掘的方法归纳方法即对数据进行概括和综合,归纳出高层次的模式或特征。归纳法一般需要背景知识,常以概念树的形式给出。在GIS数据库中,有属性概念树和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论