classifing and mining and spatial data(中山大学gis课件)_第1页
classifing and mining and spatial data(中山大学gis课件)_第2页
classifing and mining and spatial data(中山大学gis课件)_第3页
classifing and mining and spatial data(中山大学gis课件)_第4页
classifing and mining and spatial data(中山大学gis课件)_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四讲GIS空间数据分类与挖掘,中山大学 遥感与地理信息工程系,一、GIS的数据,众所周知:GIS的一个重要组成部分就是数据。 数据类型:在开发一个特定的GIS时,要根据应用需求确定对各类数据的要求(交通,规划,国土等)。 数据挖掘:随着GIS产业化的深入发展,越来越多的数据资料被不同数据生产部门数字化,因此需要根据用户需求进行选择,提取,加工和处理,以变成有效的信息和知识过程。 数据质量:数据质量是指数据适用于不同应用能力的数据。,一、数据类型,空间数据的基本特征,空间数据描述:现实世界各种现象的三大基本特征:空间、时间和专题属性。,空间特征,空间特征:指空间物体的位置、形状和大小等几何特征

2、,以及与相邻物体的拓扑关系。 人类对空间目标的定位一般不是通过记忆其空间坐标确定的,而是确定某一目标与其他更熟悉的目标间的空间位置关系进行定位的,而这种关系往往也就是拓扑关系。,时间特征,时间特征:是指空间数据总是在某一特定时间或时间段内采集得到或计算产生的,因此,GIS数据是动态的空间数据,必须进行动态更新和维护。,专题特征,专题特征(属性):指的是除了时间和空间特征以外的空间现象的其他特征。 如地形的坡度、坡向、某地的年降雨量、土地酸碱度、土地覆盖类型、人口密度、交通流量、空气污染程度等,数据的测量尺度,对不确定现象的测量:就是根据一定的标准对其赋值或打分(模糊分析法)。 命名式的测量尺度

3、:也称作类型测量尺度,只对特定现象进行标识,赋予一定的数值或符号而不定量描述(定性分析法:如大中小企业定点分布)。 次序测量尺度:是基于对现象进行排序来标识的(分级统计法:如人口分级统计)。 比例测量尺度的测量值:指那些有真零值的数据(函数值法)。,GIS数据种类,1、基础制图数据 基础制图数据包括地形数据和人文景观数据。 1)图像结构(栅格)DOM,DRG 2)拓扑图形结构(矢量)DLG 2、自然资源数据 3、调查统计数据 4、数字高程(地面)模型数据(DEM,DTM) 获取和存贮高程数据的方法有4种基本方法:规则格网法、离散等高线法、断面量测法和不规则三角网法。 5、法律文档数据 6、已有

4、系统数据,全球定位系统概念,所谓全球定位系统(GPS,Global Position System)是利用人造地球卫星来进行定位的。利用人造卫星不仅可以实现全球性的或区域性的高精度定位,而且还可以综合用于通信、交通管制、气象服务等,所以在军事和民用方面得到了广泛的应用。 世界上第一个实用的卫星定位系统,是美国研制的子午仪(Transit)卫星导航系统,它于1964年正式投入使用,主要为美国海军服务,1967年对民用部门开放。,全球定位系统概念,GPS系统可在全球范围内/全天候为海上、陆上、空中、空间的用户连续地提供高精度的位置、速度和时间信息,并且有良好的抗干扰和保密性能。对导航定位、武器使用

5、、交通管制、大地测量,以及精密测量等均具有重要意义。世界上一些科技发达国家都把发展GPS系统,作为促进整个无线电导航现代化的核心,把建成GPS系统作为无线电导航领域进入二十一世纪的重要标志之一。,全球定位系统概念,全球定位系统(GPS): 卫星如何测距? GPS接收机如何与卫星同步产生伪码? GPS的误差与微分纠正 GPS系统:美国NAVSTAR GPS TRANSIT 俄国GLONASS 欧空局GEOSTAR,全球定位系统概念,GPS系统有21颗工作卫星,平均配置在6个轨道上。卫星发射用伪随机码(伪码)调制的二种频率(L1、L2)的信号,L11575.42MHz,L21227.6MHz。用户

6、设备用测量到几颗卫星的距离的方法,来确定观察点的位置。它能连续提供三维位置(经度、纬度、高度)、三维速度和时间,实现近乎实时的导航定位。双频发射是为了供用户设备消除电离层对传播的影响。,R-=c,全球定位系统概念,伪码有P码、Y码、C/A码三种。P码(或Y码)信号,定位精度高、保密性好,仅供美军和特许用户使用,实时定位精度约为10米。C/A码信号,供一般用户使用,定位精度将受到控制,计划限制在100米(2drms)范围。为了能获得更好的定位精度,已经相继采取了一些措施。例如,C/A码采用差分GPS技术,可以达到米级的定位精度;供测地用的采用无码技术的用户设备,可以达到厘米级的相对定位精度。,全

7、球定位系统概念,陆地 卫星在高约20183公里的近圆形轨道上运行,周期约12小时,每颗卫星绕地球运行二圈时,地球恰好绕其轴转一周。这样,每颗卫星每一个恒星日有1-2次通过同一地点的上空。这样的安排,使每一颗卫星每天至少能通过一个地面控制站的上空,因此地面控制站可全设在美国国内。由于恒星日(23小时56分03.6秒)与平阳日之差,卫星经过同一地点的时间,每天约要提前4分钟。,R-=c,航空遥感像片,立体像对上测量高度并建立地面坐标系 1)航空像片相对定向,建立航空像片坐标系; 2)测量像点视差计算像点高度; 3)建立地面坐标系。 航空像片坐标向通用的地图投影坐标系的转换为 正射影像。 航测数字影

8、像目前可以有两种方式获得: 一是用高精度扫描仪对航空像片扫描得到数字影像; 二是用数字摄影机直接得到数字影像。,航天遥感数据,航天遥感数据有下列优点: 1)增大了观测范围。 2)能够提供大范围的瞬间静态图像。 3)能够进行大面积重复性观测,即使是人类难以到达的偏远地区也能够做到这一点。 4)大大加宽了人眼所能观察的光谱范围。 5)空间详细程度高(分辨率达0.2米)。,遥感图像空间分辩率,名义分辩率=图像某行对应于地面的实际距离/该行的象元素 雷达是一种自身发射电磁能又回收这种能量的主动式系统,它又分为真实孔径雷达和合成孔径雷达。 雷达图像有两种分辩率:一种是由其发送信号脉冲持续的时间和信号传播

9、方向与地面的夹角决定的,称为距离分辩率。另一种分辩率是由雷达波束的宽度和地物离飞行底线的距离决定的,而波束宽度又与雷达波长成正比,与天线的长度成反比,这种分辩率被称为方位分辩率。,数据特点,扫描式传感器所获图像 侧视雷达图像 常见的卫星数据: 目前世界上常用的卫星数据仍然是美国的陆地卫星(Landsat)专题制图仪(ThematicMapper,TM)、诺阿气象卫星的甚高分辩率辐射仪(NOAA-AVHRR)和法国SPOT卫星的较高分辩率传感器(HRV)数据及美国的SPACEIMAGING的IKNOS高分辨率卫星数据。,地图概念,地图一般分为普通地图和专题地图 普通地图:是一般性的参考图,它主要

10、用来表达七方面内容;居民地、道路、行政边界(境界)、地形、及地表覆盖(植被)、水系(江河湖海等)和典型目标物(独立地物)。,地图概念,专题地图:突出反映某一种或几种地图要素的地图。 天气预测图以天气类型、温度和降水空间分布为主的地图; 旅游图以介绍旅游景点位置和交通状况为主的地图; 交通图以介绍街区和公共交通状况为主的地图; 地铁线路图反映地铁站点位置、路径、中转位置等为主的地图;,地图概念,地势图以反映地形起伏和山脉高程为主的地图; 反映自然条件的专题地图有;地质图、土壤图、气候图、植被图、太阳能分布图、风能分布图、洋流图、潮汐图等; 反映经济状况的专题图有:交通图、工业图、农业图、商业图、

11、贸易图、水利图、电力图、渔业图、林业图、牧业图等。,地图符号,地图制作过程,地图的制作大致可分下列步骤: 1)调查分析地图用户的要求; 2)确定制图目标,确定比例尺、投影、内容、设计符号、编制地图规范; 3)收集数据、野外测量、像片判读、问卷调查; 4)对数据进行鉴别、分析处理; 5)转绘数据到基础底图上; 6)进行地图综合,先选样区试验再对整个制图区域进行综合; 7)进行地图编制; 8)检查质量,检验精度等; 9)修改后制版印刷。,地图综合,取舍实际上贯穿于整个制图过程中,它包括: 分类:指的是将同样的或类似的制图对象划入一组。 简化:实际上,取舍、分类和符号化都是为了简化细部. 符号化:由

12、于不可能将所有制图对象的实际形状按比例缩小到地图上,所以地图上要用符号。符号又分为两类:抽象符号或象形符号。 地图综合分为两部分: 1)图形综合 对点状、线状、面状符号的综合需要不同的方法。 2)内容综合 内容综合有两个方面:取舍和分类。,二、数据挖掘,数据采集,一、空间图形数据的采集 二、非空间属性数据的采集 三、空间数据和非空间数据的连接,空间图形数据的采集,1、手扶跟踪数字化输入 1)数字化过程 2)数字化方式 数字化有两种基本方式:流方式和点方式。 3、数字化仪的其它输入功能 4、矢量到栅格数据的转换 5、数字化的精度 6、数据共享,扫描数据处理过程,二值化:将彩色或灰度扫描数据的像元

13、用1位即用0和1表示。 细化:将扫描图中的线划减细为分辨单元宽的线划。 矢量化:将栅格数据转换为矢量数据。 断线修复:由于扫描质量的影响或删除了某些符号造成一些矢量线不连续,连接断线即为断线修复。,扫描数据处理过程(续),要素提取:选择需要的要素,剔除不需要的要素和噪声。 符号识别:提取出符号的特征。 属性赋值:对矢量化的要素赋予属性特征值。,确定GIS数据需求,寻找数据源,进行数据挖掘,大地测量控制 地籍测量 航空测量 遥感室外调查(土壤、植被、交通等) 定点观察(地球物理、气象、水文、生态等) 地形图 人口普查 工业/经济调查 基础设施 (通讯、电力、运输、医疗、教育等),有无所需的数据内

14、容,提取信息,模型和知识,三、数据质量,数据质量,数据质量是指数据适用于不同应用的能力。,数据质量的基本特点,1)准确度(Accuracy)即测量值与真值之间的接近程度,可用 误差来衡量。 2)精度(Precision):即对现象描述的详细程度。 3)不确定性(Uncertainty):指某现象不能精确测得,当真值不可测或无法知道时,我们就无法确定误差,因而用不确定性取代 误差。 4)相容性(Compatibility):指两个来源的数据在同一个应用中使用的难易程度。,数据质量的基本特点,5)一致性(Consistency):指对同一现象或同类现象的表达一致程度。 6)完整性(Complete

15、ness):指具有同一准确度和精度的数据在类型上和特定空间范围内是否完整的程度。 7)可得性(Accessibility):指获取或使用数据的容易程度。 8)现势性(Timeliness):指数据反映客观现象目前状况的程度。,1、空间数据质量的评价内容,1、微观部分 1)定位精度; 2)属性精度; 3)逻辑一致性;4)分解力。 2、宏观部分 1)完整性;2)时间性;3)数据档案; 4) 适用性,数据的误差类型,数据误差 地形图的位置误差; 地形图的属性误差; 时域误差; 逻辑不一致性误差; 不完整性误差;,数据的误差类型,数据转换和处理的误差: 数字化误差; 格式转换误差; 不同GIS系统间数

16、据转换误差;,数据的误差类型,应用分析时的误差: 数据层叠加时的冗余多边形; 数据应用时,由应用模型引进的误差。 这些误差分类对于了解误差分布特点、误差和处理方法、产生误差的特点有很多好处。,常见的误差原因,1)空间数据不完整主要因为数字化不完整。 2)空间位置误差可能是较小的位移,也可能是较大的粗差。 3)空间数据的比例尺错误和误差大多是在数字化时用了错误的比例因子引起的。,常见的误差原因,4)空间数据的变形误差来源有原数字化材料上的各种变形误差。 5)空间与非空间数据的连接错误通常是在数字化时给空间实体输入了错误的识别符。 6)在非空间数据本来完整无缺的情况下,数据库中发生数据不全的现象主

17、要是键盘输入错误和漏输数据;数字化前的准备工作中编码不完全或编码错误等。,2、数据的检核和存贮,一、一般检查 二、误差检核 三、橡皮板变换和弯曲 四、数据检核 五、数据编辑 1、修改各类差错 2、数据更新 六、数据存贮,几何误差的检测和表达,1)点误差 2)线误差,属性误差,1)确定抽样方法 系统抽样;等间距布点; 随机抽样;对整个区域随机布点; 分区抽样;按一定的样点个数在划分的每个区域随机布点; 系统分区随机抽样:对整个区域内等面积分区,并在区内随机布点。 2)确定抽样数 1)使用其他方法确定每个样本的属性做为参考数据 2)建立误差矩阵,计算各种精确定度或误差的方法,下面列出几个常用指标:

18、 总准确度:对角线样点数之和除以总样点数; 生产者准确度;每个属性值的正确样点数除以该属性值总的验证样点数(列合计); 使用者准确度:每个属性值的正确样点数除以该属性值的总数(行合计); 错判误码差(Commission Error):使用者准确度; 遗漏误差(Omission Error);生产者准确度;,大比例尺GIS数据采集 质量控制,一个GIS项目的成功与否,数据采集是至关重要的。大比例尺GIS数据量大,必须考虑尽可能的提高效率及保证数据质量。扫描矢量化对以纸介质图的数字化仍然是一个很有效的方法,在INTERGRAPH的GIS软件MAPPINGOFFICEGISOFFICE基础上结合实

19、际情况,提出了一套高效的与数据检查手段及严格的质量控制方案,保证了数据高效高质量的采集入库。,数据采集是基础GIS工程建设的关键,若采集的数据不合要求,整个GIS的应用就无法正确的展开,前期的工作及投入将变成极大的浪费。大比例尺图形数据的GIS工程尤其如此。一个城市的基础GIS数据量往往达到1000G以上的量级,若在数据采集阶段未能严格控制数据的质量,则采集工程中的各种错误会严重影响后续的应用,主要从下面的几点来控制数据的质量: 1.是否满足制图要求; 2.每个图形要素是否为指定的GIS要素; 3.各种要素的符号信息是否赋在正确的图 层,颜色、宽度等是否为指定的标准; 4.每个注记是否对应正确的对象,地名注 记是否作了正确的标识等:,GIS要素检查,该步骤主要判断是否各种图素均标识为正确的C1S要素,检查的同样要打开矢量图及栅格底图,由于一张图上信息量大,若要逐一浏

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论