第3章数据的图表展示_第1页
第3章数据的图表展示_第2页
第3章数据的图表展示_第3页
第3章数据的图表展示_第4页
第3章数据的图表展示_第5页
已阅读5页,还剩123页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第 3 章章 数据的图表展示数据的图表展示学习目标学习目标了解数据预处理的内容和目的了解数据预处理的内容和目的掌握分类和顺序数据的整理与显示方法掌握分类和顺序数据的整理与显示方法掌握数值型数据的整理与显示方法掌握数值型数据的整理与显示方法用用Excel作作频数分布表和图形频数分布表和图形合理使用图表合理使用图表数据的预处理数据的预处理数据审核数据审核完整性审核n应调查的单位或个体是否有遗漏所有的调查项目或变量是否填写齐全准确性审核n数据是否真实反映实际情况,内容是否符合实际n数据是否有错误,计算是否正确等数据的审核数据的审核二手数据二手数据(second hand data)适用性审核n弄清

2、楚数据的来源、数据的口径以及有关的背景材料n确定数据是否符合自己分析研究的需要时效性审核n尽可能使用最新的数据确认是否有必要做进一步的加工整理数据筛选与排序数据筛选与排序数据筛选数据筛选(data filter)当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除用用Excel进行数据筛选进行数据筛选 数据筛选数据筛选(data filter)条件条件区域区域筛选筛选的结果的结果:下面通过一个实例说明用下面通过一个实例说明用Exce

3、lExcel进行数据的排序的过程。进行数据的排序的过程。 【例3-2】有一张6名学生的学习成绩所构成的数据清单(单位:分)。试按总成绩的递增顺序递增顺序按列排序按列排序。 分析:分析:所谓按列排序就是根据一列或几列中的数据清单进行排序。排序时,Excel将按指定字段的值和指定的【升序升序】、【降序降序】排序,次序重新设定行行。操作步骤如下:操作步骤如下:单击数据区域内的任何一个单元格。选取【数据数据】菜单中的【排序排序】命令,出现【排序排序】对话框,如图所示。排序排序的结果的结果: 当对数据清单按列进行排序且只有一个排序关键字时,可以直接使用标准工具栏中的【升序升序】或【降序降序】工具按钮来完

4、成排序。操作步骤如下:操作步骤如下:单击排序字段中的任意一个单元格。单击工具栏中的“升序”或“降序”工具按钮。按行排序:按行排序: 通常情况下,Excel是按列排序的,但也可以按行排序。所谓按行排序就是根据一行或几行中的数据清单进行排序。排序时,Excel将按指定行的值和指定的“升序”或“降序”排序,次序重新设定列。数据透视表数据透视表数据透视表数据透视表(pivot table )可以从复杂的数据中提取有用的信息可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图形成一个符合需要的交叉表(列联表)在利用数据透视表时,数据源表中的首行必须有列标题数据透视表数据透视表(用用Excel创建

5、数据透视表创建数据透视表)第第1步:步:在Excel工作表中建立数据清单第第2步:步:选中数据清单中的任意单元格,并选择【数据】菜单 中的【数据透视表和数据透视图】第第3步:步:确定数据源区域第第4步:步:在【向导3步骤之3】中选择数据透视表的输出位置 。然后选择【布局】第第5步:步:在【向导布局】对话框中,依次将”分类变量“拖至左边的“行”区域,上边的“列”区域,将需要汇总的“变量” 拖至“数据区域”第第6步:步:然后单击【确定】,自动返回【向导3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表 演示p40例3.2、例3.3下面介绍频数分布表例如,例如,企业按经济类型分组:企业按经济

6、类型分组:国有企业国有企业 集体企业集体企业 个体企业个体企业 其它企业其它企业学生按考分分组:学生按考分分组:6060分以下分以下 (不及格)(不及格)60607070分分 (及格)(及格)70708080分分 (中等)(中等)80809090分分 (良好)(良好)9090100100分(优秀)分(优秀) 499及以下 500 999 1000 2999 3000及以上 600 700 700 800 800 1200 1200 1500 组限:组限:组距分组中,每一区间两端的值为组限。组距分组中,每一区间两端的值为组限。其中,每组最大变量值称为上限上限, 每组最小变量值称为下限下限。如:如

7、:工人按工资分组:企业按人数分组:上限上限下限下限上限上限下限下限 当某单位的变量值刚好等于相邻两组的上下限时,一般把此值归到作为下限的那一组中,即遵循“上限不在其内上限不在其内”的原则。 600 700 700 800 800 1200 1200 1500 如:如:工人按工资分组: 此时,700是第一组上限,是第二组下限。根据“上限不在其内上限不在其内”的原则,700应属于第二组。组数(组数(K K):):是指在组距分组中,将全体变量是指在组距分组中,将全体变量值划分为多少组(分组的数目)。值划分为多少组(分组的数目)。组距(组距(d d):):是指每组变量值的变动范围。是指每组变量值的变动

8、范围。 组距组距 = = 本组上限本组上限 前组上限前组上限 组距与组数的关系:组距与组数的关系:组组数数全全距距组组距距全距(全距(R R) = = 最大变量值最大变量值 最小变量值最小变量值 组距与组数一般是用组距与组数一般是用整数整数表示。表示。全距(全距(R R) = = 最大变量值最大变量值 最小变量值最小变量值 分类数据的整理与图示分类数据的整理与图示分类数据的整理分类数据的整理(基本过程基本过程)1. 列出各类别分类数据的整理分类数据的整理(可计算的统计量可计算的统计量)分类数据整理分类数据整理频数分布表频数分布表 (例题分析例题分析)分类数据的图示分类数据的图示条形图条形图 (

9、例题分析例题分析)分类数据的图示分类数据的图示对比条形图对比条形图(side-by-side bar chart )分类变量在不同时间或不同空间上有多个取值对比分类变量的取值在不同时间或不同空间上的差异或变化趋势分类数据的图示分类数据的图示对比条形图对比条形图 (例题分析例题分析)按各类别数据出现的频数多少排序后绘制的柱形图 主要用于展示分类数据的分布分类数据的图示分类数据的图示饼图饼图 (例题分析例题分析)不同品牌饮料的构成不同品牌饮料的构成可口可乐30%旭日升冰茶22%汇源果汁12%百事可乐18%露露18%顺序数据的整理与图示顺序数据的整理与图示顺序数据的整理顺序数据的整理(可计算的统计量

10、可计算的统计量)顺序数据的频数分布表顺序数据的频数分布表(例题分析例题分析)顺序数据的频数分布表顺序数据的频数分布表 (例题分析例题分析)顺序数据的图示顺序数据的图示累计频数分布图累计频数分布图 (例题分析例题分析)243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向上累积向上累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向下累积向下累积环形图环形图(doughnut chart)环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示与饼图类似

11、,但又有区别n饼图只能显示一个总体各部分所占的比例n环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环用于结构比较研究 用于展示分类和顺序数据环形图环形图 (例题分析例题分析)8%36%31%15%7%33%26%21%13%10% 非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价数据分组数据分组个变量值作为一组适合于离散型数据,且变量值较少的情况2、组距分组组距分组组距分组 (要点要点)组距分组组距分组(步骤步骤)组距分组组距分组(步骤步骤)组距分组组距分组(几个概念几个概念)频数分布表的编制频数分布表的编制

12、(例题分析例题分析)等距分组表等距分组表(上下组限重叠上下组限重叠)等距分组表等距分组表(上下组限间断上下组限间断)等距分组表等距分组表(使用开口组使用开口组)分组数据分组数据直方图直方图(histogram)分组数据的图示分组数据的图示(直方图的绘制直方图的绘制)分组数据分组数据直方图直方图(直方图与条形图的区别直方图与条形图的区别)分组数据分组数据直方图直方图(直方图与条形图的区别直方图与条形图的区别)未分组数据未分组数据茎叶图茎叶图(stem-and-leaf display)未分组数据未分组数据茎叶图茎叶图(stem-and-leaf display)未分组数据未分组数据茎叶图茎叶图(

13、例题分析例题分析)未分组数据未分组数据单批数据箱线图单批数据箱线图(箱线图的构成箱线图的构成)未分组数据未分组数据单批数据箱线图单批数据箱线图(例题分析例题分析)分布的形状与箱线图分布的形状与箱线图未分组数据未分组数据多批数据箱线图多批数据箱线图 (例题分析例题分析)未分组数据未分组数据多批数据箱线图多批数据箱线图(例题分析例题分析)Min-Max25%-75%Median value455565758595105英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础min-max25%-75%median value455565758595105学生1学生2学生3学生4学生5

14、学生6学生7学生8学生9学生10学生11未分组数据未分组数据多批数据箱线图多批数据箱线图 (例题分析例题分析)时间序列数据时间序列数据线图线图 (例题分析例题分析) 时间序列数据时间序列数据线图线图 (例题分析例题分析)两个变量间的关系两个变量间的关系二维散点图二维散点图(2D Scatterplots)展示两个变量之间的关系用横轴代表变量x,纵轴代表变量y,每组数据(xi , yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图两个变量间的关系两个变量间的关系二维散点图二维散点图(2D Scatterplots)显 示 三个 变 量之 间 的关系图 中 数据 点 的大 小 依赖 于 第三 个 变量也称为蜘蛛图(spider chart)显示多个变量的图示方法在显示或对比各变量的数值总和时十分有用假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比可用于研究多个样本之间的相似程度多变量数据多变量数据雷达图雷达图(雷达图的制作雷达图的制作)多变量数据多变量数据雷达图雷达图 (例题分析例题分析)多变量数据多变量数据雷达图雷达图 (例题分析例题分析)数据类型及图示数据类型及图示 (小结小结)数据类型数据类型品质数据品质数据数值型数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论