GIS课件(2015)第八讲 GIS中的数据质量(3学时)_第1页
GIS课件(2015)第八讲 GIS中的数据质量(3学时)_第2页
GIS课件(2015)第八讲 GIS中的数据质量(3学时)_第3页
GIS课件(2015)第八讲 GIS中的数据质量(3学时)_第4页
GIS课件(2015)第八讲 GIS中的数据质量(3学时)_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章GIS中的数据

第六章空间数据获取与处理《地理信息系统》第八讲思考题1、描述地理实体本身的大小、名称等的数据为:()A.属性数据B.几何数据C.关系数据D.统计数据2、theProjectionofAzimuth是指

。3、从图中可以看出什么?本讲提要第五章GIS中的数据第一节数据涵义与数据类型(二)第二节数据的测量尺度第三节GIS的数据质量第四节空间数据的元数据第六章空间数据获取与处理第一节地图数字化

第一节

数据涵义与数据类型GIS第五章GIS中的数据此客机为廉价航空德国之翼运营,24日在法国南部阿尔卑斯地区滑雪胜地附近坠毁。图中红色虚线为预定航线,紫线为实际航线。

中国淡水资源总量分布图(2012)中国粮棉油产量分布图(2012)揭示过去描述现在展望未来时间数据

三、空间数据的表示方法

表示地理现象的空间数据可细分为:

1、类型数据:如点、线、面、体数据;

2、面域数据:如农作物种植区、湖泊等;

3、网络数据:如农田、水系等;

4、样本数据:气象站、环境监测站等;

5、曲面数据:如等高线和等值区域、梯田地形;

6、文本数据:如地名、河流名称等;

7、符号数据:如点状符号、线状符号和面状符号等。图

GIS

中各种数据以及其表现空间数据:平原微丘地形数据林木、茶叶、毛竹、板栗、稻米、有机鱼等特产表1全国森林资源清查情况(1989-2013)

森林清查次序森林面积(亿hm2)森林蓄积量(亿m3)人均森林蓄积(m3)森林覆盖率(%)第4次(1989-1993)1.34101.48.613.9第5次(1994-1998)1.59第6次(1999-2003)1.75124.69.418.2第7次(2004-2008)1.95第8次(2009-2013)2.08151.411.121.6数据来源:中国林业网(http:///)溧阳市瓦屋山林场林相图

溧阳市瓦屋山林场乔木林地

溧阳市瓦屋山林场竹林

溧阳市瓦屋山林场湖泊

云台山高程:624.4米江苏云台山古称郁州山,唐宋时称苍梧山,位于连云港东北30多公里处。它从西到东分前、中、后云台山,其中前云台山范围最大,地势最高,山中有166座高峰。主峰玉女峰为江苏最高山峰。

夫地形者,兵之助也。

——古代军事家孙武《孙子·地形篇》孙武(约公元前545年—公元前470年),字长卿,齐国乐安人,春秋时期著名军事家、政治家,尊称兵圣。后人尊称其为孙子、孙武子、百世兵家之师、东方兵学鼻祖。

第二节数据的测量尺度GIS第五章GIS中的数据

测量尺度可分四个层次,由粗至细依次为:

(1)命名量

(2)次序量

(3)间隔量

(4)比例

一、命名(Nominal)量

定性而非定量,不能进行任何算术运算。只有“等于”或“不等于”两种形式。

如可用不同数值(1,2……)表示不同土地利用类型、植被类型或岩石类型。

二、次序(Ordinal)量

线性坐标上不按值的大小,而是按顺序排列的数,如事故发生危险程度级别由大到小被标为1,2,3,…,级别序号越低,其危险性越大。

序数值相互之间可比较大小,但不能进行加、减、乘、除等算术运算。暴雪预警信号蓝色(12小时内降雪量将达4毫米以上)黄色(12小时内降雪量将达6毫米以上)橙色(6小时内降雪量将达10毫米以上)红色(6小时内降雪量将达15毫米以上)

三、间隔(Interval)量

按间隔表示相对位置的数。其相互之间可比较大小,且差值大小有意义。

其无真的零值,如温度、海拔等。而降水量是比例数据,有真的零值。

间隔数据可用于加、减、乘、除等运算,且可求算术平均。

摄氏→华氏:

F=(9/5)×C+32

华氏→摄氏:

C=(5/9)×(F-32)

40℃=104F

150F=65.6℃

75F=23.9℃主要城市月平均气温单位:摄氏度市名1月2月3月4月5月6月7月8月9月10月11月12月年平均

气温南京市18.721.427.628.726.824.817.413.63.816.3无锡市18.521.227.529.614.94.917.1徐州市-27.425.722.215.911.01.514.9常州市18.020.927.329.127.525.317.514.03.916.4苏州市3.04.19.318.321.027.029.528.226.418.715.04.917.1南通市16.920.526.728.827.625.418.414.84.616.5连云港市0.51.07.116.620.426.627.225.922.416.811.92.014.8淮安市0.01.07.316.725.622.816.3盐城市15.419.426.027.225.923.116.411.71.914.6扬州市

18.021.227.428.526.824.416.0镇江市17.520.826.928.326.724.617.413.63.716.0泰州市17.020.526.927.826.423.916.913.03.115.6宿迁市-17.020.426.627.025.221.815.311.11.514.4

四、比例

比例测量尺度的测量值指那些有真零值且测量单位间隔是相等的数据。如年降雨量、人口密度、发病率等。

与某一固定点的比值计算,支持多种算术操作,如加、减、乘、除等。主要城市月降水量单位:毫米市名1月2月3月4月5月6月7月8月9月10月11月12月全年累计南京市25.571.143.880.958.663.6235.9214.985.837.962.911.4992.3无锡市49.6100.133.674.869.171.5120.2174.6114.838.188.413.4948.2徐州市6.631.725.922.117.885.9526.9190.9185.821.438.49.51162.9常州市129.395.238.5107.2171.185.448.731.821.0889.6苏州市70.9134.137.683.4119.633.7133.4195.198.31019.5南通市46.384.532.257.123.930.291.3248.3110.549.935.413.5823.1连云港市25.549.2149.0303.0333.2239.310.923.09.71200.3淮安市16.024.5131.9312.4449.3133.610.915.522.71216.8盐城市26.954.941.742.039.350.3274.5359.4174.816.719.520.91120.9扬州市27.065.958.8114.927.1112.8224.5352.2110.337.430.721.21182.8镇江市33.377.939.6103.351.9172.4157.5195.289.240.745.317.51023.8泰州市32.266.953.888.626.5162.8140.9180.7144.020.316.116.3949.1宿迁市10.038.640.221.729.190.9306.5285.1116.87.437.112.8996.2

图各种数据测量尺度以及其制图表现丰县沛县铜山邳州睢宁新沂东海赣榆连云港市灌云灌南宿豫沭阳泗阳泗洪徐州市宿迁市淮阴涟水响水滨海盱眙洪泽楚州淮安市金湖阜宁射阳建湖盐都大丰东台盐城市宝应高邮仪征邗江江都扬州市兴化姜堰泰州市泰兴靖江六合江浦江宁溧水高淳南京市海安如东如皋通州南通市海门启东句容丹徒扬中丹阳镇江市张家港常熟太仓吴县苏州市昆山吴江江阴锡山无锡市宜兴溧阳金坛武进常州市苏北灌溉总渠(淮河)长江口春季气温上升快,秋季降温较早;春秋两季光照充足,昼夜温差大;夏季炎热雨水集中,冬季寒冷干燥。淮北硬(软)白冬中筋强筋麦区1600万亩占50%,年产近600万吨碟形洼平原,自然生态条件优越,气候温暖湿润,土壤肥沃,栽培条件好。里下河硬红冬优质中筋麦区600万亩占16%,年产200多万吨热量资源和降水丰富,丘陵土质和土壤肥力较差,易脱力早衰。太湖地区土壤条件好,但地下水位高,降水较多,湿害严重。太湖、丘陵硬红冬兼作软红冬中筋弱筋麦区300万亩占近10%,年产近100万吨小麦生长后期温度偏低,温差偏小,降水相对较多,土壤沙性强,盐分含量高,保肥供肥能力差。沿江沿海软红冬优质弱筋麦区800万亩占25%,年产近300万吨江苏优质专用小麦种植区域基本稳定

???

第三节GIS的数据质量GIS第五章GIS中的数据

一、数据质量的内涵

(一)准确性(Accuracy)

即一个测量值与真实值间的接近程度。可用误差来衡量。如判定模拟值与实测值的拟合程度,可用RRMSE≤5%来衡量。

(二)精度(Precision)

即对现象描述的详细程度。如对同样两点,精度低的数据并不一定准确度也低。表

不同土种不施氮空白区水稻基础产量模型及其模拟值与实测值的统计检验土类土种不施氮空白区水稻基础产量模型R2平均相对误差MRE(%)RMSE(kg·hm-2)RRMSE(%)潮土腰黑砂土Y=1659.63243+349.83061x1-2811.77008x2+9.97892x3+25.60743x4+8.10509x50.6690*0.0580356.16.70扰动砂土Y=86.31878+271.93082x1-625.91667x2+22.19290x3-37.39121x4+19.16958x50.7157**0.0085330.86.07砂土Y=1579.18782+399.45272x1+161.55226x2-26.93049x3-41.89660x4+6.09515x50.8961**0.0064191.23.64薄层砂土Y=82.03110+512.25685x1+71.27776x2-3.58481x3-15.70972x4-19.41612x50.9174**0.0018255.15.00水稻土小粉浆土Y=740.05784+183.77308x1-828.71950x2+13.23665x3-21.46484x4+10.46487x50.9248**0.0021167.33.00腰黑勤泥土Y=1828.46233+228.10532x1+233.13204x2-23.51262x3+45.34464x4+7.65570x50.7827**0.0017237.43.94勤泥土Y=48.28059+170.51688x1+183.48971x2+15.47069x3-5.39287x4-0.01206x50.7918**0.0006297.94.88底黑勤泥土Y=1220.62761+214.47783x1-27.89279x2-2.22676x3+11.44843x4+0.06312x50.8352**0.0040156.02.63

(三)空间分辨率(SpatialResolution)

分辨率是两个可测量数值间最小可辩识差异。地图上线很少以小于0.1mm宽度来画。

米、分米、厘米、毫米、丝米、忽米、微米、纳米(10亿分之一米,4倍原子大小)级

(四)比例尺(Scale)—有哪些类型?

比例尺是地图上一个记录的距离和它所表现的“真实世界”的距离之间的一个比例。

(五)误差(Error)

位置误差,即点、线或多边形位置误差;属性误差;位置和属性误差间的关系。

(六)不确定性(Uncertainty)

包括空间位置的不确定性、属性不确定性、时域不确定性、逻辑上的不一致性及数据的不完整性。我国自行研制的国际标准电子海图

显示系统页面截图

二、空间数据质量问题的来源

(一)空间现象自身存在的不稳定性

海啸海岛位移经纬度变化

(二)空间现象的表达

如由椭球体到平面投影转换会产生误差。

GPS仪有设计精度之别(米级、亚米级、毫米级)。静态定位:毫米级动态定位:厘米级时间测量:毫微秒级速度测量:厘米级数据采集时间:1min±

(三)空间数据处理中的误差

1、投影变换:长度、面积、角度变形

2、地图数字化和扫描后矢量化处理(拼接)

3、数据格式转换(MapInfo通用转换器)

4、建立拓扑关系

5、数据叠加操作和更新

6、各种数据集互操作

7、数据处理过程中误差的传递和扩散等

(四)空间数据使用中的误差

一是对数据的解释过程。如元数据。

二是缺少文档。如缺少取样测定方法、数据定义等描述信息。表数据的主要误差来源数据处理过程

误差来源数据搜集野外测量误差:仪器误差、记录误差遥感数据误差:辐射和几何纠正误差、信息提取误差地图数据误差:原始数据误差、坐标转换、制图综合及印刷数据输入数字化误差:仪器误差、操作误差不同系统格式转换误差:栅格-矢量转换、三角网(TIN)-等值线转换数据存储数值精度不够:经纬度空间精度不够:每个格网点太大、地图最小制图单元太大数据处理分类间隔不合理:样本大小与组数(如样本数50,5-10组)多层数据叠合引起的误差传播:插值误差、多源数据综合分析误差比例尺太小引起的误差数据输出输出设备不精确引起的误差输出的媒介不稳定造成的误差数据使用对数据所包含的信息的误解对数据信息使用不当数据点过少导致空间插值误差SpatialinterpolationAprocessofusingpointswithknownvaluestoestimatevaluesatotherpoints.Spatialinterpolationisthereforeameansofcreatingsurfacedatafromsamplepointssothatthesurfacedatacanbeusedforanalysisandmodeling.Thiessen/inversedistanceweighted/

splines/kriging

三、常见空间数据误差分析

(一)误差类型

1、几何误差:地理测绘误差;

2、属性误差:设备试剂、人为误差等;

3、时间误差:时钟准确度、时差问题;

4、逻辑误差:区域多边形重叠等。

各种

逻辑误差出口重叠归并时间

图曲线的误差分布(二)地图数据的质量问题

包括地图固有误差及图纸变形、图形数字化等误差。

无错不成书,国家图书奖,1/10000错别字,6西格玛管理6理念(零缺陷思想):

不同水平下的残次品的概率

水平(生产能力)每100万个产品的次品数量2308537(合格69.146%)366807(合格93.319%)46210(合格99.379%)5233(合格99.977%)63.4(合格99.99966%)思考题1、蒙牛公司采用瑞典利乐无菌枕包装:每1万袋牛奶产品可能有1件是次品(破袋、牛奶变质——可调换)。请问其西格玛水平。2、中华人民共和国种子标准中规定,种子纯度98%以上(杂株2%)。请问其西格玛水平。

(三)RS数据的质量问题

1、遥感观测过程存在精确度和准确度限制,主要表现为空间分辨率、几何畸变和辐射误差。

2、遥感图像处理和解译过程,主要产生空间位置和属性误差。

(四)外业测量数据的质量问题

是指使用大地测量、GPS(易测:对讲机+GPS)、摄影测量等方法得到的空间位置信息。

主要存在空间数据的位置误差,包括系统误差、操作误差和偶然误差。泰山水准测量

在恒山架设仪器

易测——打造中华测量精品第一剑莫问(即装即用)第二剑游龙(进攻)——超远通讯第三剑青干(防守)第四剑竞星(性能优越)第五剑日月(无所不在)第六剑舍神(无所不能)第七剑天瀑(无畏,来去自如)

第四节空间数据的元数据GIS第五章GIS中的数据

Metadata译成元数据,是描述数据的数据。具有共享性,确保数据一致性。

地理空间数据中,元数据是说明数据内容、质量、状况和其他有关特征的背景信息。

纸质地图的元数据主要表现为地图类型、地图图例,包括图名、空间参照系和图廓坐标、地图内容说明、比例尺和精度、编制出版单位和日期或更新日期、销售信息等。

条码由一组黑白或彩色间隔的条形符号组成,是一种利用光电扫描阅读设备给计算机输入数据的特殊代码。我国国别代码为690-695,中国香港489,中国澳门958,中国台湾471,美国和加拿大00-13,德国40-44,日本45、49,英国50。一般,企业及其商品的识别代码(标准版,由13位数字组成)分别由前缀码(即国别代码)、企业代码、商品代码和校验码组成。

元数据的主要作用可归纳为如下方面:

1、帮助数据生产单位有效管理和维护空间数据、建立数据文档,并保证后续人员对数据情况了解;

2、提供有关数据生产单位数据存储、分类、内容、质量、交换网络等方面的信息,便于用户查询检索地理空间数据;

3、帮助用户了解数据,以便就数据是否能满足其需求作出正确判断;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论