版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息技术实践《信息技术实践》课程组数据处理与图表展示课程目标1.了解数据处理的一般步骤和过程2.掌握数据处理的常用方法3.掌握tableau数据分析软件的基本操作内容第一节数据清洗第二节数据加工第三节数据抽样第七章数据处理与图表展示4第四节tableau与图表展示数据预处理在对数据进行正式处理(计算)之前,根据后续数据处理(计算)的要求,对原始数据集进行审计、清洗、变换、集成、脱敏、归约和标注等一系列处理活动。数据预处理的目的是提升数据质量,并将数据形态更加符合某一算法需求,进而达到提升数据计算的效果和降低其复杂度的目的。对于数据挖掘和分析人员来说,数据预处理工作常常占据了整个数据分析项目70%左右的工作量。7.1数据清洗数据清洗就是将多余重复的数据筛选清除掉,将缺失的数据补充完整,将错误的数据纠正或删除。清洗数据包括三部分:清除掉不必要的重复数据、填充缺失的数据、检测逻辑错误的数据,数据清洗的目的是为后面的数据加工提供完整、简洁、正确的数据。67.1.1重复数据的处理1.数据工具法2.高级筛选法3.函数法4.条件格式法课堂实践参见课本第三章77.1.2错误数据的处理事前处理——设计数据录入规则1.数据有效性事后处理——数据检查和更改2.条件格式3.函数法4.查找与替换7.1.3缺失数据处理数据缺失是指数据在收集过程中某个或某些属性的值不完整。如果缺失值太多,说明数据收集过程中存在问题,可以接受的标准是缺失值在10%以下。缺失值产生的原因多种多样,如市场调查中被调查人拒绝回答相关问题或回答问题无效,录入人员失误,机器故障等都可能造成数据缺失。9处理数据缺失方法一:用一个样本统计量的值代替缺失值,最典型的做法是使用该变量的样本平均值代替缺失值。方法二:用一个统计模型计算出来的值去代替缺失值。方法三:将有缺失值的记录删除,这样将导致样本量的减少。方法四:将有缺失的记录保留,只在相应的分析中做必要的排除。课堂实践107.2数据加工一、数据抽取二、字段合并三、字段匹配四、数据计算五、数据分组六、数据转换117.2.1数据抽取1、菜单法(数据-分列)2、函数法(LEFT\RIGHT)例:right(A2,6)
课堂实践127.2.2字段合并字段合并是将多个字段的文字或数字合并成一个单元格,最常用的是CONCATENATE()函数。CONCATENATE(A1,B1)函数的作用是将A1单元格里的内容与B1单元格里的内容合并到一起,如有多列合并只需在后面添加相应的单元格名称即可。课堂实践=CONCATENATE()137.2.3字段匹配VLOOKUP(lookup_value,table_array,col_index_num,range_lookup),其中参数lookup_value是要在表格或区域的第一列中查找,table_array代表查找的范围,也就是说在哪里查找,可以跨表,也可在同一个表中查找,col_index_num为返回第二个参数table_array表中的第col_index_num列的值,range_lookup代表模糊查找还是精确查找,range_lookup值为TRUE代表模糊匹配,为FALSE代表精确匹配。课堂实践=VLOOKUP(A2,发货表!A:B,2,FALSE)147.2.4数据计算简单计算【=B2+C2】函数计算(自动求和、平均数)课堂实践157.2.5数据分组所谓数据分组,就是根据数据的类别或数值的大小进行分组。Excel实现数据分组主要用If()函数或VLOOKUP()函数来实现。课堂实践=IF(D2>60,"老年",IF(D2>35,"中年","青年"))167.2.6数据转换数据转换分为数据表的行列互换及数据类型的互换。对于数据表的行列互换,有时我们需要根据表格及需求把数据的行列进行互换以达到更方便的分析目的,数据表的行列互换可以采用选择性粘贴实现课堂实践177.3数据抽样数据抽样就是从海量的数据中抽取样本,数据抽样是指从数据样本中按照随机原则选取一部分对象作为样本进行分析,以此推论总体状况的一种分析方法,在数据抽样中,常用的是RAND函数。课堂实践18课堂练习题1、结合企业案例数据—发货表,清除表中所有的重复数据。2、结合企业案例数据—员工信息离职员工表,抽取出离职员工的出生年月日,并计算离职年限。3、结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年版:企业间短期资金互助协议书3篇
- 2024年气体供气新协议3篇
- 北师大版四年级上册数学第三单元 乘法 测试卷及参考答案(巩固)
- 工地建筑材料采购协议(33篇)
- 部编版2023-2024学年四年级上册语文期末核心素养评价试卷(含答案)
- 设备品质保证书模板
- 诚信无罪保证书
- 详解劳务分包结算单编制要点
- 财务代理费用协议
- 质量与安全同行各类安全保证书
- 5.5 跨学科实践:制作望远镜到西安 八年级物理上册人教版2024
- 医院改扩建工程可行性研究报告(论证后)
- 2024水样采集与保存方法
- 借款协议(父母借款给子女买房协议)(二篇)
- 糖尿病患者体重管理专家共识(2024年版)解读
- 4D厨房区域区间管理责任卡
- 针灸推拿学专业大学生职业生涯规划书
- 设备故障报修维修记录单
- 发展经济学-马春文主编-课后习题集答案解析
- 海南省槟榔水肥一体化应用模式及配套技术
- 关于整治我校周边环境的请示报告5篇
评论
0/150
提交评论