统计学数据的图表展示ppt课件.ppt_第1页
统计学数据的图表展示ppt课件.ppt_第2页
统计学数据的图表展示ppt课件.ppt_第3页
统计学数据的图表展示ppt课件.ppt_第4页
统计学数据的图表展示ppt课件.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章数据的图表展示,1,学习目的和要求通过本章学习,掌握统计数据的分类及数据的整理。重点掌握统计分组的方法和次数分布表的编制。能熟练运用统计软件对数据进行整理。,2,3.1数据的预处理,3.1.1数据审核检查数据中是否有错误。,适用性,时效性,完整性审核,准确性审核,应调查的单位是否有遗漏所有的调查项目是否填写齐全,数据是否有错误是否存在异常值,应尽可能使用最新的统计数据,来源、口径以及有关的背景材料是否符合自己分析研究的需要,3,3.1.2数据筛选3.1.3数据排序:发现数据的基本特征把定量数据按从大到小或从小到大的顺序排列,把定性数据按习惯的文字顺序排列,便于我们研究其条理方法:升序和降序,例3.1,4,3.1.4数据透视表,例3.2,5,品质数据,数量数据,6,1,2,3,4,量化等级,功能包容,1,2,3,4,四个测定层次的比较,7,3.2品质数据的整理与展示,3.2.1分类数据的整理与展示1.频数与频数分布频数:落在各类别中的数据个数。频数分布:将各类别及落在其中的相应频数列出,用表格形式表现出来。例3.3,8,2.分类数据的图示(1)条形图是用宽度相同的条形的高度或长短来表示数据变动的图形条形图有单式、复式等形式在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率例3.3,9,(2)帕累托图不同类别的数据根据其频率降序排列的,并在同一张图中画出累积百分比图用双直角坐标系表示,左边纵坐标表示频数,右边纵坐标表示频率,10,(3)饼图用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用,例3.3,11,(4)环形图环形图是由两个及两个以上大小不一的饼图叠在一起,挖去中间的部分所构成的图形,12,3.2.2顺序数据的整理与图示1.累积频数和累积频率累积频数:将各有序类别或组的频数逐级累加所得到的频数。分:向上累积和向下累积。累积频率:将各有序类别或组的百分比逐级累加。分:向上累积和向下累积。例3.5,13,3.3数值型数据的整理与展示,3.3.1数据分组将原始数据按照某种标准分成不同的组别,用于观察数据的分布特征,分组方法,单变量值分组,组距分组,14,组距分组与不等距分组(在表现频数分布上的差异),等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征和规律不等距分组各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度(频数密度频数/组距)反映频数分布的实际状况,15,统计分组,基本原则:组内同质性,组间差异性作用:(1)划分现象的类型(2)表明总体内部的结构及整个结构的类型和特征(3)揭示现象间的依存关系,16,1.按分组标志个数不同1)简单分组:把总体只按一个标志分组2)复合分组:对同一总体选择两个或两个以上标志层叠起来进行分组。例如,可以同时选择学科、学制、性别三个标志对某学院全体在校学生这个总体进行分组。2.按分组标志种类不同1)品质标志分组2)数量标志分组,统计分组的形式,A.单项式分组:即变量的一个取值为一组,适用于离散型变量,并且变量的取值较少。,如家庭人口数分组1人2人3人4人5人6人,17,2)数量标志分组,B组距式分组:即每一组有一个上限值和一个下限值所形成的区间,适用于连续性变量,或离散型变量且变量的取值较多不便一一列举的情况。,按销售额分组(万元)50以下50200200400400600600800800以上,例:对商店按销售额进行分组,18,组距分组(要点),将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组,19,组距分组(步骤),确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K确定各组的组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距(最大值-最小值)组数根据分组整理成频数分布表,20,分组中要注意的关键,1.选择分组标志选择分组标志时,一般应考虑原则:根据研究问题的目的和任务选择分组标志在若干标志中,选择能反映问题本质的标志结合现象所处的历史条件具体情况具体分析2.划分各组的界限:在分组标志的变异范围内,划定各相邻组之间的性质界限和数量界限,21,组距分组(几个概念),下限:一个组的最小值上限:一个组的最大值组距:上限与下限之差组中值:下限与上限之间的中点值,22,(闭口组)(缺上限的开口组)(缺下限的开口组),23,实例某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121,24,单变量值分组表,25,等距分组表(上下组限重叠),26,等距分组表(上下组限间断),27,等距分组表(使用开口组),28,3.3.2数值型数据的图示1.分组数据:直方图用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram),29,2.未分组数据:茎叶图和箱线图(1)茎叶图用于显示未分组的原始数据的分布,由“茎”和“叶”两部分构成,其图形是由数字组成的,以该组数据的高位数值作树茎,低位数字作树叶,30,(2)箱线图将一组数据从大到小排列,分别计算出他的上边缘,上四分位数,中位数,下四分位数,下边缘,还有一个异常值。,中位数,QU,X最大值,X最小值,QL,31,不同分布的箱线图,分布的形状与箱线图,32,未分组数据多批数据箱线图,8门课程考试成绩的箱线图,33,34,3.时间序列数据:线图时间一般绘在横轴,指标数据绘在纵轴图形的长宽比例要适当,其长宽比例大致为10:7一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断例3.8,35,4.多变量数据的图示(1)散点图用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式例3.9,36,(2)气泡图展示三个变量之间的关系例3.9,37,(3)雷达图,38,数据类型及图示,39,3.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论