第-3-章-数据的整理与显示1_第1页
第-3-章-数据的整理与显示1_第2页
第-3-章-数据的整理与显示1_第3页
第-3-章-数据的整理与显示1_第4页
第-3-章-数据的整理与显示1_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

合理使用统计表统计应用把数据画图之后,要用用脑袋沃德(AbrahamWald)和许多统计学家一样,在第二次世界大战时也处理了战争与相关的问题。他发明的一些统计方法在战时被视为军事机密。以下是他提出的概念中较简单的一种沃德被咨询飞机上什么部位应该加强钢板时,开始研究从战役中返航的军机上受敌军创伤的弹孔位置。他画了飞机的轮廓,并且标识出弹孔的位置。资料累积一段时间后,几乎把机身各部位都填满了。于是沃德建议,把剩下少数几个没有弹孔的部位补强。因为这些部位被击中的飞机都没有返航数据的预处理数据的审核检查数据中的错误数据的筛选找出符合条件的数据数据排序升序和降序寻找数据的基本特征一、数据审核数据审核—原始数据审核的内容完整性审核应调查的单位或个体是否有遗漏调查项目或指标是否填写齐全准确性审核内容是否真实反映客观实际情况是否有错误:逻辑检查、计算检查数据的审核—二手数据适用性审核数据的来源、口径以及有关的背景材料数据是否符合自己分析研究的需要时效性审核最新的数据确认是否要做进一步的加工整理二、数据筛选数据筛选数据筛选的内容包括将某些不符合要求的数据或有明显错误的数据予以剔除数值型数据的排序递增排序:x(1)<x(2)<…<x(n)递减排序:x(1)>x(2)>…>x(n)数据排序

(方法)用Excel进行数据排序一、统计分组的概念及方法(一)统计分组的概念根据统计研究的目的和客观现象的内在特点,按照一定的标志把被研究总体划分为若干个性质不同但又有联系的组,称为统计分组。(二)统计分组的方法1、按品质标志分组:按研究对象的某种属性特征分组(1)简单分组:人口按性别分组,企业按行业分组,学生按专业分组等等(2)复合分组:对总体按两个或两个以上的标志进行的重叠式分组。例如,我国把社会经济部门分为第一产业、第二产业、第三产业,第一产业又可分为农、林、牧、渔业。复合分组表2、按数量标志分组:按表现总体数量特征的标志进行分组。例如,人口按年龄分组、企业按销售额分组等(1)单项式分组:每组变量值是一个值(2)组距式分组:每组变量值是一个区间。某车间工人产量分组表某地区120家企业按利润分组表二、频数分布频数分布的概念频数(frequency):落在某一组中的数据个数频数分布:把各个组及其相应的频数全部列出,并用表格形式表现出来,称为频数分布。比率(ratio):各组次数与总次数之比。百分比(percentage):将比率乘以100得到的值(一)品质数据的频数分布1、分类数据的频数分布表(1)列出各类别1、分类数据整理—频数分布表

2、顺序数据的整理(1)累积频数(cumulativefrequencies):各类别频数的逐级累加(2)累积频率(cumulativepercentages):各类别频率(百分比)的逐级累加注意:数据源表中的首行必须有列标题数据透视表

(用Excel创建数据透视表)第1步:在Excel工作表中建立数据清单第2步:选中数据清单中的任意单元格,并选择【数据】菜单中的【数据透视表和数据透视图】第3步:确定数据源区域第4步:在【向导—3步骤之3】中选择数据透视表的输出位置。然后选择【布局】第5步:在【向导—布局】对话框中,依次将”分类变量“拖至左边的“行”区域,上边的“列”区域,将需要汇总的“变量”拖至“数据区域”第6步:然后单击【确定】,自动返回【向导—3步骤之3】对话框。然后单击【完成】,即可输出数据透视表分组方法1、单变量值分组(要点)1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况单变量值分组(实例)117122124129124129117130122125123131125127122133126122118124121125123126133130127123118122122134127123125125120123127130126126128128124125123128124125单变量值分组表(实例)2、组距分组(要点)将变量值的一个区间作为一组适合于连续变量或变量值较多遵循“不重不漏”的原则可采用等距分组,或不等距分组组距分组步骤确定组数:可以按Sturges提出的经验公式来确定组距分组(几个概念)1.下限(lowlimit):一个组的最小值2.上限(upperlimit):一个组的最大值3.组距(classwidth):上限与下限之差4.组中值(classmidpoint):下限与上限之间的中点值频数分布表的编制(例题分析)频数分布表的编制步骤确定组数:等距分组表(上下组限重叠)等距分组表(上下组限间断)等距分组表(使用开口组)等距分组表(使用开口组)不等距分组等距分组与不等距分组(在表现频数分布上的差异)等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征和规律不等距分组用宽度相同的条形的高度或长短来表示各类别数据的图形有单式条形图、复式条形图等形式绘制时,各类别可以放在纵轴,称为条形图(barChart),也可以放在横轴,称为柱形图柱形图(例题分析)条形图(例题分析)对比条形图分类变量在不同时间或不同空间上有多个取值对比分类变量的取值在不同时间或不同空间上的差异或变化趋势对比条形图(例题分析)(二)饼图也称圆形图,是用圆形及圆内扇形的面积来表示数值大小的图形主要用于表示总体或样本的结构(三)环形图环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示环形图与圆形图类似,但又有区别圆形图只能显示一个总体的构成情况环形图则可以同时绘制多个总体的数据系列环形图可用于结构比较研究环形图

(例题分析)直方图用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图直方图下的总面积等于1直方图的绘制直方图与条形图的区别条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的直方图是用面积表示各组频数的多少,矩形的高度表示各组的频数或百分比,宽度表示各组的组距,其高度与宽度均有意义直方图的矩形是连续排列,条形图则是分开排列条形图主要用于展示品质数据,直方图则主要用于展示数值型数据茎叶图用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,图形是由数字组成的高位数值作树茎,个位数字作树叶茎叶图与直方图的区别直方图可观察数据的分布状况,但没有具体的数值茎叶图既能给出数据的分布状况,又保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据该箱线图也称为Median/Quart./Range箱线图单批数据箱线图(箱线图的构成)单批数据箱线图(例题分析)分布的形状与箱线图多批数据箱线图(例题分析)多批数据箱线图(例题分析)多批数据箱线图(例题分析)箱线图—K线图(上证指数K线图)折线图绘制折线图时应注意:时间一般绘在横轴,指标数据绘在纵轴图形的长宽比例要适当,大致为10:7一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断折线图(例题分析)折线图(例题分析)两个变量间的关系—二维散点图展示两个变量之间的关系用横轴代表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图两个变量间的关系—二维散点图三个变量间的关系—气泡图显示三个变量之间的关系图中数据点的大小依赖于第三个变量多变量数据—雷达图也称为蜘蛛图(spiderchart)显示多个变量的图示方法假定各变量的取值具有相同的正负号可用于研究多个样本之间的相似程度多变量数据—雷达图(例题分析)多变量数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论