版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 第二章 地理数据的采集及处理 第1页,共51页。一、地理系统二、地理数据的类型和表达三、地理数据的来源四、地理数据的变换五、地理数据的分布特征第2页,共51页。一、地理系统1. 系统的概念地理系统是地球表面的岩石圈、水圈、生物圈和人类活动相互作用的物质、能量和信息运动系统。什么是“系统”?系统是由相互作用和相互依赖的若干组成部分(要素)结合而成的具有特定功能的整体。在这个定义中包括了系统、要素、结构、功能四个概念,表明了要素与要素、要素与系统、系统与环境三方面的关系。 第3页,共51页。2. 系统的结构和功能系统的结构是指不随时间发生变化的系统要素之间的联系。系统的功能是指系统在包含它的超系
2、统中起的作用和承担的任务。第4页,共51页。3. 系统分类自然系统和人造系统 实体系统和抽象(概念)系统 静态系统和动态系统 开放系统和封闭系统 全球系统和区域系统 第5页,共51页。4. 地理系统的特点系统性、整体性、综合性区域性、开放性、层次性随机性、动态性 第6页,共51页。二、地理数据的类型和表达1. 地理数据类型将所有的地理数据划分为两大基本类型,即空间数据(spatial data)和属性数据(attribute dada)。 属性数据又可以进一步分为两种类型,即定量数据和定性数据。第7页,共51页。空间数据,主要用于描述地理实体、地理要素、地理现象、地理事件及地理过程产生、存在和
3、发展的地理位置、区域范围及空间联系。坐标,是描述空间数据的基本手段,一般用经纬度坐标或者公里网来表示。对于空间数据的表达,可以将其归纳为点、线、面三种几何实体以及描述他们之间空间联系的拓扑关系。定量数据:是用数量表示的地理数据,如温度,人口数量,人均收入等。定性数据:只表征地理要素性质上的差异,而没有数量的变化。但是,通过“数量化方法”可以对一定的地理要素予以赋值。通常采用二分法,即以二元数据1和0来表示。比如,性别 第8页,共51页。 三种基本的地理几何实体及其组合 第9页,共51页。城市A城市B城市C城市D城市E城市A1101城市B1110城市C1110城市D0111城市E1001表2.1
4、 二元数据注:1表示两城市之间通航; 0表示两城市之间不通航。第10页,共51页。2. 地理数据的表达方式 表格法区域地理要素x1x2xn区域1x11x12x1n区域2x21x22x2n区域mxm1xm2xmn第11页,共51页。年平均气温/年降水量/mm 土地面积/hm2 人口/人 国内生产总值/万元区域1 8.0 500.2 245.6 1 210 2 678.28 区域2 7.6498.61064.1 0232 015.47区域36.5550.9894.38481 754.56区域38.5586.4668.76541 365.46表2.2 各区域的自然及经济社会指标第12页,共51页。年
5、 份19961997199819992000耕地复种指数120.40113.56126.54132.76121.43农业发展指数100115.68124.50135.69129.56表2.3 某地区耕地复种指数和农业发展指数第13页,共51页。三、地理数据的来源 来自观测、测量部门的有关专业数据。比如,来自水文观测站的有关水文数据;来自气象观测站的有关气象数据;来自环境监测部门的空气、水质数据等。来自统计年鉴、统计公报中的有关自然资源及社会经济发展数据。比如,从各级政府统计部门公布和出版的统计年鉴中,可以得到当地的耕地面积、各类农作物播种面积、粮食产量、人口、劳动力、工业投资和产值、国内生产总
6、值等。来自有关单位或者个人的不定期的典型调查数据、抽样调查数据。比如,来自城乡抽样调查队的城市、农村家庭收支数据;来自有关有关单位或者个人的某一方面的专题调查数据等等。来自政府公报、政府文件中的有关数据。来自档案、图书等文献资料中的有关数据。来自互联网中的有关共享数据。地图图件。主要包括各种比例尺的地形图、影像地图、专题地图等。遥感数据。主要包括各种航空遥感数据和卫星遥感数据。其他来源的有关数据。 第14页,共51页。地理矩阵 m个地点或地区;n个地理特征值第15页,共51页。四、地理数据的变换1. 定性数据转换成定量数据有序数据(ordinal data)转换二元数据转换2. 数据本身变换对
7、原始数据需要消除量纲(或单位),转换为可比较的数据序列。目前,原始数据的变换有以下几种常用方法:对数变换、模数变换、指数变换、概率变换、滑动平均法等等第16页,共51页。五、地理数据的分布特征1. 地理数据的统计整理 基本步骤: 统计分组,就是根据研究目的,按照一定的分组标志将地理数据分成若干组。 计算各组数据的频数、频率,编制统计分组表。 作分布图。第17页,共51页。统计分组按质量标志按数量标志离散型变量连续型变量单项式组距式等距不等距等距不等距第18页,共51页。例1 根据 表2.4 上海市100年降水量,说明统计分组和绘制频数图表。 974.81002.61588.1770.71008
8、.91206.81271.51101.91341.213311085.41184.41113.41203.91170.7975.41462.3947.81416709.21147.59351016.31031.61105.7849.91233.41008.61063.81004.91086.21022.51330.91439.41236.51083.11288.71115.81217.51320.71078.11203.414801269.91049.21318.4119210161508.21159.61021.3986.1794.71318.31171.21161.7791.21143.8
9、1602951.41003.2840.41061.49581025.212651196.51120.71659.3942.71123.3910.21393.51208.61305.51242.11572.31416.91253.81282.3982.11388.51057.51282.81472.71011.71214.81193.41139.51012.41237.6903.61025.51121.8807.8815.61180.11105989.4900.9第19页,共51页。 1)找出原始数据中的最大值、最小值,并求出全距range 2)把全距按组的宽度一致性原则恰当地分组,即确定组数、
10、组距、组限和组中值 n=1+3.32lgN N为样本容量 组距=全距/组数 3)求出落在每个组距中的观察值数目,即求出组频数frequency和频率。 4)绘制频率分布图,有三种形式,即直方图(frequency histogram )、频数多边形图和累计频数分布曲线第20页,共51页。组序试定界限修订界限组中值频数频率(%)累计频数累计频率(%)1649.7-768.7649.7-768.6709.211112768.7-887.7768.7-887.6828.277883887.7-1006.7887.7-1006.6947.21616242441006.7-1125.71006.7-11
11、25.61066.42727515151125.7-1244.71125.7-1244.61185.22222737361244.7-1363.71244.7-1363.61304.21414878771363.7-1482.71363.7-1482.61423.288959581482.7-1601.71482.7-1601.61542.233989891601.7-1720.71601.7-1720.61661.222100100第21页,共51页。 频数分布的直方图 :第22页,共51页。 将上图各组的频数分布从组中值位置用折线连接起来,得到频数分布曲线图: 第23页,共51页。累积频数
12、分布图第24页,共51页。2. 几种常用的统计指标与参数描述地理数据集中程度的指标描述地理数据分布离散程度的指标描述地理数据分布特征的参数第25页,共51页。描述地理数据集中程度的指标平均值 反映了地理数据一般水平。计算方法: 未分组的地理数据 分组的地理数据 (2.1)(2.2)加权平均数第26页,共51页。上海市100年降水量第27页,共51页。中位数 对于未分组的地理数据,样本数n为奇数时,中位数是位置排在第(n+1)/2位的数据;样本数n为偶数时,中位数是排在中间位置的两个数据的平均值。 分组的地理数据,中位数的计算方法: 确定中位数所在的组位置,按下述公式计算中位数 或(2.3)(2
13、.4)第28页,共51页。在式(2.3)和 (2.4)中:Me代表中位数;L为中位数所在组的下限值;U为中位数所在组的上限值;fm为中位数所在组的频数;Sm-1为中位数所在组以下的累计频数;Sm+1为中位数所在组以上的累计频数;d为中位数所在组的组距。第29页,共51页。众数 众数就是出现频数最多的那个数,计算方法分为以下两种情况: 未分组的地理数据,可以根据每一个数据出现的频数大小直接确定众数。 对于已经分组的地理数据,中位数的计算步骤如下: 确定频数最多的组为众数所在组。 按以下公式计算众数 或(2.5)(2.6)第30页,共51页。在式(2.5)和 (2.6)中:M0代表众数;L为众数所
14、在组的下限值;U为众数所在组的上限值;1为众数组频数与下一组频数之差;2为众数组频数与上一组频数之差;d为众数所在组的组距。第31页,共51页。上海市100年降水量中位数众数第32页,共51页。例2:表2.5给出了某农场各农田地块的面积,试计算其平均值、中位数和众数。 地块编号 123456789101112平均值中位数众数面积/hm2 12835035555072408529657554.2552.550 应按照未分组数据计算其平均值、中位数和众数,计算结果见上表最后三列。 表2.5 某农场各农田地块的面积 第33页,共51页。例3:表2.5给出了中国西部地区某城市2000年家庭月收入的抽样
15、调查结果,试计算其平均值、中位数和众数。家庭月收入/元户数向上累计频数向下累计频数2 0003 0003003002 1303 0004 0001 3001 6001 8304 0005 0002001 8005305 0006 0001501 9503306 0007 0001002 0501807 0008 000502 100808 0009 000302 13030合 计2130表2.5 中国西部地区某城市2000年家庭月收入的 抽样调查结果 第34页,共51页。 解题步骤: (1)用公式(2.2)计算平均数 (2)计算中位数。先确定中位数所在组的位置,再按照公式(2.3)或者(2.4
16、)计算中位数 Me =3 588.46(元)=3 899.06(元) 第35页,共51页。 (3)计算众数,先确定众数所在组,再按照公式(2.5)或(2.6)计算众数。 显然,众数所在组应该在第二组。 众数M0 =3 476.19 (元)。第36页,共51页。描述地理数据分布离散程度的指标极差 指所有数据中最大值与最小值之差,计算公式为离差 指每一个地理数据与平均值的差,计算公式为离差平方和 它从总体上衡量一组地理数据与平均值的离散程度,其计算公式为 (2.9) (2.8) (2.7) 第37页,共51页。方差与标准差 方差是从平均概况衡量一组地理数据与平均值的离散程度。方差计算公式为 标准差
17、为方差的平方根,计算公式为(2.10)( 2.11) 第38页,共51页。 如果以样本方差对标准差进行无偏估计,则计算公式为(2.12) 第39页,共51页。变异系数 变异系数表示地理数据的相对变化(波动)程度,其计算公式(2.13)第40页,共51页。变差系数也称变异系数,用它来衡量地理要素在时间和空间上的相对变化(波动)的程度。如果两个数量级不相同的地理要素,虽然其相对变化程度相同,但其方差、标准差却一定是不相同的。数量级大的要比数量级小的要素的方差、标准差大。这只要把任意一个地理要素的数列与把它的各项数值扩大任意倍的数列作比较,就可以看得很清楚。它们的方差、标准差差别显著,但相对波动程度
18、完全相同的。因此,用变差系数来衡量相对波动的程度第41页,共51页。用百分数表示的地理要素在时间与空间的相对变化(被动)程度很直观,并且在空间分析时,还可以作出变差系数的等值线图,以表示各区域一种地理要崇的相对稳定状况。比如,各地区人口出生率、自然增长率的相对稳定状况以及城乡入口比例的相对波动程度等都可以用变异系数来衡量。它还是衡量农作物产量稳定程度、线路上客运量相对波动程度以及各项自然要素的稳定程度的指标。第42页,共51页。例如:对于表2.4.2中的数据,分别计算极差、离差、离差平方和、方差、标准差、标准差的无偏估计,以及变异系数。 地块编号 123456789101112平均值中位数众数
19、面积/hm212835035555072408529657554.2552.550表2.4.2 某农场各农田地块的面积第43页,共51页。 步骤 : (1)按照公式(2.4.7)计算极差 (2)按照公式(2.4.8)计算离差,结果见表2.4.4。 序号123456789101112面积128350355550724085296575离差-42.25 28.75-4.25 -19.25 0.75 -4.25 17.75-14.25 30.75-25.25 10.7520.75 表2.4.4 地理数据的离差 第44页,共51页。(3)按照公式(2.9)计算离差平方和 (4)按照公式(2.10)计算方差 (5)按照公式(2.11)计算标准差 (6)按照公式(2.12)计算标准差的无偏估计 (7)按照公式(2.13)计算变异系数 5 666.2521.729 90.418 4第45页,共51页。描述地理数据分布特征的参数 偏度系数 测度地理数据分布的不对称性情况,刻画以平均值为中心的偏向情况,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 探秘书海:字里行间的智慧
- 一年来的财务工作总结
- 2023年员工三级安全培训考试题及完整答案(全优)
- 2023年-2024年项目安全培训考试题含答案(精练)
- 2023-2024年项目部安全管理人员安全培训考试题原创题
- 2023-2024年企业主要负责人安全培训考试题答案可打印
- 新生军训心得体会400字10篇
- 科学实验教学
- 药物代谢预测与智能模拟研究-洞察分析
- 铁路运营成本控制-洞察分析
- 通力电梯KCE电气系统学习指南
- 风电场岗位任职资格考试题库大全-下(填空题2-2)
- 九年级数学特长生选拔考试试题
- 幼儿园交通安全宣传课件PPT
- 门窗施工组织设计与方案
- 健身健美(课堂PPT)
- (完整版)财务管理学课后习题答案-人大版
- 锚索试验总结(共11页)
- 移动脚手架安全交底
- 人教版“课标”教材《统计与概率》教学内容、具体目标和要求
- 矩形钢板水箱的设计与计算
评论
0/150
提交评论