第3章 数据的处理_第1页
第3章 数据的处理_第2页
第3章 数据的处理_第3页
第3章 数据的处理_第4页
第3章 数据的处理_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

础主讲人:XXX第三章数据的处理3.1数据清洗3.2数据加工3.3数据修整3.4练习知识目标:

1.了解数据不一致、数据错误、数据缺失、数据重复给数据分析工作带来的危害。2.理解用移动平均法修整数据的思路。3.熟练掌握Excel内置函数Vlookup、Index、Match、If、Isodd、Int、Round、Left、Right、Mid、Year、Month、Day、Weekday、Today、Date的功能和参数要求。

技能目标:

1.灵活通过“查找和替换”对话框以及函数对数据进行一致性处理。2.熟练运用字段分列对字段进行拆分、变形。3.灵活运用Excel公式与函数对数据进行抽取、匹配、转换、计算、修整。4.熟练运用数据分析工具“移动平均”进行数据修整。素质目标:

1.认识数据处理的重要性,培养重视基础工作的职业素养。2.灵活掌握数据处理的各种方法和技巧,培养创新意识。3.熟练掌握Excel各种内置函数的功能和应用,践行强国先强己的责任担当。

数据清洗3.1数据清洗就是对格式错误的数据进行纠正,将错误的数据纠正或删除,将缺失的数据补充完整,将重复的数据删除。数据清洗第三章

数据的处理3.1数据清洗3.1.1数据一致性处理第三章

数据的处理3.1数据清洗图3-1-1数据格式不一致的资料数据一致性处理第三章

数据的处理3.1数据清洗1清洗出生日期清洗身高2案例操作(39-42页)3.1.2缺失数据处理第三章

数据的处理3.1数据清洗

数据清单中,单元格如果出现空值,就认为数据存在缺失。缺失数据的处理方法通常有以下3种:

用样本均值(或众数、中位数)代替缺失数据;

将有缺失数据的记录删除;

保留该记录,在要用到该数据做分析时,将其临时删除案例操作(42-43页)3.1.3重复数据处理第三章

数据的处理3.1数据清洗

重复数据是指每个字段都完全相同的记录。如果一条记录重复出现,会影响分析的结果,因此在分析数据之前必须将重复记录删除案例操作(43页)数据加工3.2数据加工的手段主要有第三章

数据的处理3.2数据加工字段分列字段匹配数据转换数据计算字段抽取3.2.1字段分列第三章

数据的处理3.2数据加工所谓字段分列,就是将一个字段分成多个字段。案例操作(44-46页)3.2.2字段抽取第三章

数据的处理3.2数据加工字段抽取是指利用原数据清单中某些字段的部分信息得到一个新字段。1.字符串抽取函数

常用的字符串抽取函数有Left、Right、Mid。

Left(文本字符串,截取的长度)——从文本字符串的左边截取指定个数的字符。

Right(文本字符串,截取的长度)——从文本字符串的右边截取指定个数的字符。

Mid(文本字符串,起点位置,截取的长度)——从文本字符串的中间某个位置开始,截取指定个数的字符。案例操作(46页)第三章

数据的处理3.2数据加工2.日期抽取函数

常用的日期抽取函数有Year、Month、Day、Weekday。

Year(日期)——从日期型数据中提取年份。

Month(日期)——从日期型数据中提取月份(1~12)。

Day(日期)——从日期型数据中提取日(1~31)。

Weekday(日期,2)——返回日期型数据的星期(1~7)。1表示星期一,2表示星期二,3表示星期三,4表示星期四,5表示星期五,6表示星期六,7表示星期天。案例操作(47页)3.2.3字段匹配第三章

数据的处理3.2数据加工1.精确匹配2.模糊匹配3.Index+Match匹配案例操作(47-49页)案例操作(49-50页)案例操作(51页)3.2.4数据转换第三章

数据的处理3.2数据加工1.数据转置2.多列转一列3.一列转多列案例操作(52页)案例操作(52-53页)案例操作(53-54页)3.2.5数据计算第三章

数据的处理3.2数据加工

有时候,我们需要的数据并不存在于数据清单中,而是要通过对其他字段进行数学计算或函数计算来获取。案例操作(54-56页)数据修整3.3第三章

数据的处理3.3数据修整

在一段较长的时间内,由于普通的、持续的、决定性等基本因素的作用,总体往往呈现逐渐向上(见图3-3-1)或向下变动的趋势。图3-3-1明显的向上趋势第三章

数据的处理3.3数据修整

在这样的趋势中,也不排除受一些偶然因素或不规则因素的影响,出现与整体趋势相差很大的极端数据,如图3-3-2中箭头所指的数据。如果直接对这些极端数据进行数据分析,分析的结果可能不准确,所以有必要用一定的数学方法对这些数据进行加工,使数据长期变化的趋势更加明显,为预测总体的未来提供更准确的依据。图3-3-2局部的数据异动第三章

数据的处理3.3数据修整下面介绍如何使用移动平均法对数据进行修整。

移动平均法就是从时间数列的第一位数值开始,按一定项数求平均数,逐项移动,形成一个新的动态数列。常用的移动平均法有三项移动平均法和四项移动平均法。第三章

数据的处理3.3数据修整3.3.1三项移动平均法例1计算图3-3-3所示的表格中销售额的三项移动平均数案例操作(57-58页)第三章

数据的处理3.3数据修整3.3.2四项移动平均法例2:计算图3-3-3所示的表格中销售额的四项移动平均数。案例操作(58-60页)注意

:若采用奇数项移动平均,平均值对准原时间数列的居中项数,一次可得趋势值;若采用偶数项移动平均,平均值未对准原时间数列的居中项数,需再通过一次移动平均进行正位。第三章

数据的处理3.3数据修整3.3.3加载Excel分析工具库

在Excel中,还可以用分析工具库完成移动平均数的计算。默认情况下,Excel并没有安装分析工具库,下面介绍分析工具库的加载。操作(60-62页)练习3.4(1)打开“数据处理-课后练习.xlsx”文件,在“成绩查询”工作表中分别用Vlookup函数和Index函数查询高考分数,如图3-4-2所示。操作题第三章

数据的处理3.4练习图3-4-2高考分数查询(2)打开“数据处理-课后练习.xlsx”文件,计算“转化率”工作表中各种商品各环节的转化率(见图3-4-3)。其中“加购物车”环节的转化率=加购物车人数/浏览人数,“交易”环节的转化率=交易人数/加购物车人数。操作题第三章

数据的处理3.4练习图3-4-3转化率计算(3)打开“数据处理-课后练习.xlsx”文件,计算“上市公司”工作表(见图3-4-4)中各企业上市的天数和上市的年数。操作题第三章

数据的处理3.4练习图3-4-4“上市公司”工作表(4)打开“数据处理-课后练习.xlsx”文件,将“数据分列”工作表中A列数据的“姓名”“家庭地址”“邮编”分列显示在C、D、E列,结果如图3-4-5所示。操作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论