版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据准备与数据预处理数据准备与数据预处理中国地质调查局发展研究中心二一二年十一月我们经常使用的数据表文件格式包括TXT文件、Excel文件、Access文件、dBase文件、FoxPro文件等等。其中,较为常用的当属MS Office的Excel格式与Access格式,这里也推荐大家使用这两种格式进行数据整理。MS Excel,是一种专门用于数据管理和数据分析等操作的电子表格软件,它可以以电子表格的方式进行各种统计计算、分析和管理等操作,推荐使用它进行数据编辑工作。Excel工作簿文件扩展名为 .xlsExcel工作簿文件版本有3、4、5-7(97)、97-2003、2007考虑兼容性问题,目
2、前推荐使用打过SP2补丁的 MS Office 2003版 工作薄:在默认情况下,启动Excel后就自动打开了一个工作薄,其中默认包含三张工作表,最多可保存255张工作表。可根据需要在工作薄中插入和删除工作表。 工作表工作表是工作薄窗口中的表格,它是Excel的基本工作平面和电子表格。工作表的行号用1、2表示,最多可达65536行,列用A、B、Z、AA、AB表示,最多可达256列。 单元格:单元格最多能保存32000个字符。 单元格数据输入(1)输入数字:输入分数前先输入0和空格,否则Excel容易将其作为日期处理;Excel中数字右对齐;要把输入的数字作为文本处理,前面增加一个撇号()。 单
3、元格数据输入(2)输入文本:Excel中文本左对齐。(3)输入日期和时间:Ctrl;可输入当前日期;CtrlShift;可输入当前时间。 自动填充数据(1)在单元格区域内填充相同的数据(2)在单元格区域内填充数据序列(3)创建和填充自定义序列:利用“工具”菜单“选项”命令的“自定义序列”选项卡。 单元格的数据类型(1)数值:元素含量、工作程度、日期、时间等数据都属于数值类型的数据,数值类型数据主要用于各种数学计算。(2)文本:说明性 、解释性的数据描述称为文本类型。如汉字、英文。而如电话号码、编码、邮编等描述性的数字也应该作为文本类型而不是数值类型来处理。(3)公式:公式都以“”开头,可以是简
4、单的数学公式,也可以是包含各种Excel函数的式子。 公式的使用(1)公式的组成:Excel工作表中的公式最多可以由1024个字符组成,公式以“=”开头,后面可以由以下5种元素组成:运算符、单元格引用、数值或文本、工作表函数和括号。(2)运算符:Excel包含算术运算符、比较运算符、文本运算符和引用运算符。算术运算符:、*、/、比较运算符:=、=、=、,运算结果为逻辑值True或者False。文本运算符:&,用来将一个或多个文本连接成一个组合文本。 公式的输入:(1)选定需要输入公式的单元格;(2)在所选的单元格中输入等号。如果单击了“编辑公式”或 “插入函数”按钮,将自动插入一个等号;(3)
5、公式输入完后,按回车键,Excel自动计算并将计算结果显示在单元格中,公式内容显示在编辑栏中;(4)按Ctrl+(公式审核),可使单元格在显示公式内容与结果之间进行切换。 使用函数进行计算(1)函数的组成函数的名称:如SUM()、AVERAGE()等。 函数的参数:参数可以是数字、文本、逻辑值、数组、错误值(如#N/A)或单元格引用,也可以是常量、公式或其它函数。 Excel常用函数一览函数名功 能用途示例AVERAGE 求算术平均值数据计算COUNTIF统计某个单元格区域中符合指定条件的单元格数目条件统计IF根据对指定条件的逻辑判断的真假结果,返回相对应条件触发的计算结果条件计算INT将数值
6、向下取整为最接近的整数数据计算LEFT从字符串的第一个字符开始,截取指定数目的字符数截取字符MAX求出一组数中的最大值数据计算MIN求出一组数中的最小值数据计算NOW给出当前系统日期和时间显示时间日期RIGHT从字符串的最后一个字符开始,截取指定数目的字符数字符截取SUBTOTAL 返回列表或数据库中的分类汇总分类汇总SUM求出一组数值的和数据计算SUMIF计算符合指定条件的单元格区域内的数值和条件数据计算TEXT根据指定的数值格式将相应的数字转换为文本形式数值文本转换TODAY给出系统日期显示日期WEEKDAY 给出指定日期对应的星期数星期计算 函数说明(举例)(1) AVERAGE:返回参
7、数的平均值(算术平均值)。 语法: AVERAGE(number1,number2,.)Number1, number2, .为需要计算平均值的 1 到 30 个参数。说明:参数可以是数字,或者是包含数字的名称、数组或引用。(2)LEFT:基于所指定的字符数返回文本字符串中的第一个或前几个字符。 语法: LEFT(text,num_chars) 数据排序(1)排序原则:当对数据排序时,Excel会遵循以下的原则:被指定为关键字的列上有完全相同项的行将保持其原始次序排序列中有空白单元格的行会被放置在排序的数据清单的最后隐藏行不会被移动,除非它们是分级显示的一部分;排序选项,如选定的列、顺序和方向
8、等,在最后一次排序后会被保存下来; 如果指定一列以上作关键字排序,主要列中有完全相同项的行会根据指定的第二列作排序,第二列中有完全相同项的行会根据指定的第三列作排序。(2)按列排序:利用“数据”菜单上的“排序”命令。(3)使用排序工具:利用工具栏上的“递增”和“递减”排序按钮。 Access是MS Office的另一重要组件,是当今流行的数据库软件之一。 Access数据库属于关系型数据库,是一种比较优秀的单文件数据库载体,建议利用它进行数据规范化和数据校验。Access的优点:支持Web功能的信息共享易于查询和使用可用于复杂的信息管理开发具有交互的数据库窗口可自动更正名称具有子数据表功能可与
9、Excel共享数据具有数据访问页共享组件的集成MS SQL Server交互性 Access数据库中的对象Access数据库提供了七种对象来完成数据库的功能。这些对象为表、查询、窗体、报表、页、宏、模块。 Access数据库在计算机中以数据库文件(.mdb)存储。这些对象的操作在数据库窗口中进行。这七种对象中,表用来存储数据查询是对数据进行查看和分析窗体为数据的输入等操作设置友好的外观报表以格式化的形式来对外展示数据数据访问页将数据发布Web上宏将自动完成一组操作模块能自动完成常规任务并创建业务解决方案Access数据库文件对于数据的操作,基本在表对象操作界面下完成可使用右键菜单中的导入功能,
10、进行数据的校验数据准备格式(TXT):数据常见错误:n表头不止一行,或有合并单元格;n数值类型字段下的记录含有字符;n数据文件保存时所用的软件版本过低,或文件本身有损坏。检查方法:导入至Access文件,会自动对记录中有问题的项列出来。练习:整理自己的常用数据,检查并修正数据错误 数据是用以载荷信息的载体。它可以是记录下来的某种可以识别的物理符号,数据的具体形式多种多样,如文本、图像、声音等都可以归入数据的范畴。 在GIS中,按照其特征,数据可分为三种类型:空间特征数据(定位数据)时间属性数据(尺度数据)专题属性数据(非定位数据)属性特征数据 空间数据(坐标、属性) 已存在的数据表,如Exce
11、l格式、Access格式、TXT格式、dBase格式等等,均可以直接在“应用工程”中进行导入点击进入应用工程数据处理模块从数据预处理菜单进入通用数据导入功能菜单 表数据导入功能,可导入的表数据格式包括: TXT Excel Access Foxpro DBase 数据导入界面:1.选择格式2.选择分区3.选择文件夹4.选中文件5.点击选择按钮 数据导入界面:在弹出窗口中选择数据表 数据导入界面:可双击添加单个数据项可选择全部数据项给定你所使用的特征值 数据导入界面:可双击删除一项可取消全部数据项给定导入后存储的表名最后点击“导入”按钮,可完成操作可通过“工作区数据整理”查看数据对于已经导入了的
12、数据表,可通过“工作区数据整理”查看若需查看工作区中已存在的网格数据,可选中“删除网格数据”选中表后,可点击“数据表浏览”按钮查看该数据表数据已经导入到应用工程的表,可以通过“工作区数据表转出”的功能,导出为各种格式的文件 数据格式设置步骤1.选择数据表2.设置坐标字段3.选择转出个格式 4.给定新的文件名5.点击保存,完成格式转换已经导入到应用工程的表,可以通过“工作区数据表转出”的功能,导出为各种格式的文件12345练习:设置“JS应用km”为当前应用工程,将实习数据文件夹中“原始数据江苏数据公里江苏物化探.mdb”文件所存放的四个表,导入到“JS应用km”应用工程中最正确的“地图”:地球
13、仪应用上的困难:占空间大度量非常不便携带储存不方便投影建立坐标系统的意义:将立体的地球仪变为二维的图纸存在问题:变形、误差地理坐标(最矛盾的坐标系)关键词:经度,纬度参心坐标系(最经典的坐标系)关键词:北京54,西安80,B,L,H地心坐标系(最准确的坐标系)关键词:GPS,WGS84,x,y,z地方独立坐标系(最不准的坐标系)地理坐标 经纬度,只有角度,没有距离,无法丈量,无法精确定位。只能依靠其它坐标系统的定位值转换得到。参心坐标系 以参考椭球的几何中心为原点的大地坐标系。 经过天文大地网整体平差后,我国目前形成了三种参心坐标系,即1954年北京坐标系(局部平差成果),1980年西安坐标系
14、和1954年北京坐标系(整体平差转换值)。地心坐标系 以地球质心为原点建立的空间直角坐标系,或以球心与地球质心重合的地球椭球面为基准面所建立的大地坐标系。这是一种为了满足远程武器和航天技术发展需要而建立的一种大地坐标系统。 由于卫星导航系统的全球性,它的点位坐标易于获得,加之定位的高精度,空间数据格式统一,为“3S”技术的广泛应用提供了良好的基础。因此现在人们倾向于用地心坐标系来代替参心坐标系和地方独立坐标系。但参心坐标系目前仍在使用,而且预计在今后较长一段时间还将并存。 有关的三个概念:p椭球系p投影系p坐标系p椭球系地球是表面不规则的近似椭球体,重力也不均匀。建立大地水准面(表征地球形状与
15、大小的物理面,是一个重力位的等值面)要定义地球椭球体的地心、长轴、短轴,相应的经纬线,使其形状非常接近相对于短轴旋转对称的椭球。 p投影系地球椭球体面转换为平面,建立地球表面上的点与投影平面上点之间的一一对应关系。正、横、斜轴方位投影正、横、斜轴圆柱投影正、横、斜轴圆锥投影正轴投影经纬线形状 高斯投影 由德国数学家高斯提出,后经克吕格扩充并推导出计算公式,故称为高斯-克吕格投影,简称高斯投影,为了控制变形,本投影采用分带的方法 6度分带从格林威治零度经线起,每6度分为一个投影带,全球共分为60个投影带 由于高斯-克吕格投影每一个投影带的坐标都是对本带坐标原点的相对值,所以各带的坐标完全相同,使
16、用时只需变一个带号即可p坐标系(参心坐标系) 北京54坐标系: 解放后,为了建立我国天文大地网,鉴于当时历史条件,在东北黑龙江边境上同苏联大地网联测,推算出其坐标作为我国天文大地网的起算数据;随后,通过锁网的大地坐标计算,推算出北京点的坐标,并定名为1954年北京坐标系。因此,1954年北京坐标系是苏联1942年坐标系的延伸,其原点不在北京,而在苏联普尔科沃。该坐标系采用克拉索夫斯基椭球作为参考椭球,高程系统采用正常高,以1956年黄海平均海水面为基准缺点:误差累计较大、参考椭球和国际不一致p坐标系(参心坐标系) 西安80坐标系: 1978年4月召开的“全国天文大地网平差会议”上决定建立我国新
17、的坐标系,称为1980年国家大地坐标系。其大地原点设在西安西北的永乐镇,简称西安原点。椭球参数选用1975年国际大地测量与地球物理联合会第16界大会的推荐值。简称IUUG-75地球椭球参数或IAG-75地球椭球p坐标系(地心坐标系) 这类坐标系是GPS常采用的坐标系 WGS-84坐标系: 1984年世界大地坐标系,是一种国际协议坐标系,其椭球采用国际大地测量与地球物理联合会第17届大会测量常数推荐值,地心坐标精度为米级。 ITRS: 国际地球参考系,由IERS(国际地球自转服务组织)所定义的一个协议地球参照系,地心坐标精度达到了厘米级。 存在不同的坐标系,就存在坐标转换的问题。 坐标转换,存在
18、严密性问题,即在同一个椭球里的坐标转换都是严密的,而在不同的椭球之间的转换这时不严密的。如: 北京54的大地坐标,转换到北京54的高斯平面直角坐标,其转换过程是严密的。 北京54的大地坐标,转换到WGS-84的大地坐标,其转换过程是不严密的。 因此,不同比例尺的数据,由于精度要求不一样,对于坐标转换的方法的选择,也会不同。 对于精度要求较高,又是不同椭球体间的坐标转换,在局部地区的采用的常用办法是相似变换法,常说的三参数法,七参数法,比较严密的是用七参数的相似变换法(X平移,Y平移,Z平移,X旋转,Y旋转,Z旋转,尺度变化K),要求得七参数需要在一个地区3个以上的已知点。如果区域范围不大,也可
19、以用三参数,即X平移,Y平移,Z平移,而将其它参数视为0,所以三参数只是七参数的一种特例。其它还有四参数法、二参数法等等。在实际操作中,还要取决于选取的公共点是否合理,并保证其足够的精度。 对于需要进行坐标转换的数据,可将数据表导入本系统,通过“地理坐标投影变换”进行坐标转换 系统提供了15种常用的坐标转换模型,可以实现单点、数据表和图形数据空间坐标间的转换。 坐标转换设置步骤1.选择文件类型,一般选择“工作区数据表”2.选择数据表名,如“化探”3.确定坐标项,如“经度”、“纬度” 4.给定新的坐标名,如“横坐标”、“纵坐标”5.选择输入的投影模型与参数6.选择输出的投影模型与参数7.操作坐标转换,转换的坐标将存放在给定的新坐标项中1234567 需要提示注意的内容:新坐标项名称不要和原有字段冲突,特别是y和元素钇(Y)高斯投影分为带带号的和不带带号的,不带带号的需要填写中央经线单位因子,公里或度填1,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- JJF 2168-2024盐雾试验箱校准规范
- 2024年国际汽车销售代理合同
- 2024年度保险代理协议
- 2024年害虫防治定期服务协议
- 2024区块链技术应用与合作合同
- 2024年专业同声传译合作协议
- 2024版蔬菜采购合同书文书
- 2024区块链技术研发公司与金融机构之间的数字货币发行与交易合同
- 2024民间私人贷款合同范本个人民间贷款合同范本
- 2024年个性化金融服务系统建设合同
- 《城市轨道交通桥梁养护技术规范》
- 《水土保持技术》课件-项目八 拦渣措施
- 机动车检测站违规检验整改报告
- 2024年建筑电工复审考试题库附答案
- 2024年4月自考04737C++程序设计试题及答案含评分参考
- 睡眠医学智慧树知到期末考试答案章节答案2024年广州医科大学
- GB/T 17259-2024机动车用液化石油气钢瓶
- 国开(河北)2024年《中外政治思想史》形成性考核1-4答案
- 床边护理带教体会
- 2024年社区工作者考试必背1000题题库及必背答案
- MOOC 微型计算机原理与接口技术-南京邮电大学 中国大学慕课答案
评论
0/150
提交评论