《统计资料的整理》PPT课件.ppt_第1页
《统计资料的整理》PPT课件.ppt_第2页
《统计资料的整理》PPT课件.ppt_第3页
《统计资料的整理》PPT课件.ppt_第4页
《统计资料的整理》PPT课件.ppt_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 统计资料的整理,第一节统计整理与频数分布 一、统计整理的意义和步骤 二、统计分组 三、频数分布表(分配数列) 第二节 统计表与统计图 一、统计表 二、统计图,授课 内容,第一节 统计整理与频数分布,一、统计整理的意义和步骤 二、统计分组 三、频数分布表,一、统计整理的意义和步骤,统计调查得到的原始资料,1.统计整理,数据搜集,收集的已加工的次级资料,分散的 零乱的,计算范围/ 口径方法不同,数据需要条理化/系统化 必须再加工?,一、统计整理的意义和步骤,统计整理是按照统计目的和任务的要求,根据统计统计对象的特点,对调查的统计资料进行分组、汇总,使其集中化、条理化、系统化的活动或过程 。 统计整理是统计工作的第三阶段。这个阶段是统计调查的继续,统计分析的前提。,1.统计整理,承上启下的作用,一、统计整理的意义和步骤,1.统计整理,统计调查得到的原始资料,整理对象,收集的已加工的次级资料,主要方法,分组,工作内容,分组后计算总体指标,整理目的,系统化、条理化的资料 以图、表、指标的形式展现,分组很重要,可别小瞧哦,一、统计整理的意义和步骤,人们需要系统化的资料才能对总体作出概括性的说明,揭示出总体的内在特征。 承前启后的作用。没有整理,再完备的统计调查都是徒劳,统计分析也无从下手;实现认识飞跃的基础,由个别到全体、由特殊到一般、由现象到本质、由感性到理性的转化。 积累历史资料的必要手段。动态分析的基础。,2.整理的意义,一、统计整理的意义和步骤,审核统计资料。包括:一手资料的完整性、准确性审核,二手资料的时效性、适用性审核 一手资料 完整性审核 检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全 准确性审核 检查数据是否真实反映客观实际情况,内容是否符合实际 检查数据是否有错误,计算是否正确等,3.整理的步骤,二手资料 适用性审核 弄清楚数据的来源、数据的口径以及有关的背景材料 确定数据是否符合自己分析研究的需要 时效性审核 尽可能使用最新的数据 进行统计分组。这是统计整理的关键问题。 进行资料的汇总。这是统计整理的中心内容。 编制统计表或统计图。统计整理的结果。,汇总技术,手工汇总、电子计算机汇总,二、统计分组,概念,根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究对象的总体划分为若干个不同性质的组。,原则,穷尽原则、互斥原则,例1:从业人员按文化程度分组 小学毕业 中学毕业(含中专) 大学毕业,文盲或识字不多 小学毕业 中学毕业(含中专) 大专毕业 大学及大学以上 (),(),对总体而言,统计分组是“分”。 即把总体内部具有相对性质差异的各个部分区分开来 。 对总体单位而言,统计分组则是“合”。 即总体同类单位的集合,注意:统计分组具有“分”与“合”的双重意义,注意:统计分组的组内同质性与组间差异性,统计分组是在总体范围内,通过区分不同单位之间的性质差异,来揭示事物发展的特征和规律。各组之间必须具有性质上的差异。因此,统计分组必须准确地确定各组之间的界限;各组之间的界限应该是质的变化界限。,二、统计分组,作用,作用1:揭示总体内部结构 作用2:区分和判断社会经济现象的类型特征 作用3:揭示变量之间的依存关系,作用1:揭示总体内部结构,结构:整体的构成部分,各部分关系,我国人口城乡和性别结构表,作用2:区分和判断社会经济现象的类型特征,显示了总体的结构比重:反映了各个组成部分对总体的影响和决定程度,从而为判断总体的类型特征提供了依据 。,1980年世界城乡人口分布比较 单位:%,作用3:揭示变量之间的依存关系,按某一变量进行分组,来观察与其相关的其他变量取值的变化特点,从而可以揭示出分组变量与其他相关变量之间在方向上和数量上的相互关系。,二、统计分组,按分组标志的多少不同,简单分组,复合分组,按分组标志的性质不同,品质标志分组,数量标志分组,分组种类,数量标志分组,单项式变量分组,组距式变量分组,等距分组,不等距分组,简单分组,简单分组是指按一个标志进行分组。,复合分组,同一个总体在同一张分组表上,把两个或两个以上标志层叠起来进行分组。,数量标志分组,按数量标志分组也叫变量分组,单项式变量分组,组距式变量分组,组距式变量分组的几个基本概念,组限分组的上限和下限 组距=上限一下限 开口组 闭口组 用组中值代表各组变量的假设前提是“各组变量在各组内均匀分布或对称分布”,闭口组 :2639岁 下限26 上限39 组中值(2639)/2=32.5,开口组 :低于26岁 无下限组 组中值2613/2=19.5,您的年龄: 低于26岁 2639岁 4059岁 60岁以上,开口组,闭口组,全距与组距 等距与异距 组限与组中值 开口组与闭口组 “名义组限”分组 和“实际组限”分组 重叠组限 “上限不在内”原则,例:学生按成绩分组(分),(1)5059 6069 7079 8089 90100,(2)60以下 6070 7080 8090 90以上,组距 =79-70=9,上限:79 下限:70,开口组,闭口组,组中值,组中值,组中值,重叠组限值70归于7080组,实际组限分组,名义组限分组,组距式变量分组的几个基本概念,统计分组的标志选择,1)选择分组标志统计分组的核心问题,分组标志是将总体区分为各个性质不同的组的标准或依据。,选择分组标志的原则是:结合一定的历史条件或经济条件,根据统计研究的目的和任务,选择最能够反映和决定事物本质属性的标志作为分组标志 。,最能够反映和决定事物本质属性的标志,一是影响因素众多的复杂社会经济问题,应选择最主要的、基础性的因素作为分组标志 ;如研究我国经济结构必须选择所有制来来分类; 二是研究具有因果关系的现象时,应选择决定性的因素作为分组标志;例如,在研究社会分配关系时,应选择收入水平作为分组标志,来观察消费、社会财富集中状况等问题 三是具有随机性或偶然性变化特征的现象,应选择相对稳定或可控制性强的特征作为分组标志。例如,农业与选择施肥量作为分组标志,来观察产量的相应变化规律。 四是选择客观标准或规定标准作为分组标志,三、频数分布,1、频数分布(也叫次数分布) 定义:在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各单位在各组间的分布,叫做次数分布,分布在各组的个体单位数叫次数,又称频数。各组次数与总次数之比称比率,又称频率。 组成部分:一是对现象分的组,二是各组上变量出现的次数 分类:根据分组标志特征的不同,分布数列可以分为品质数列与变量数列。,2、频数分布表的编制方法,第一步,在收集到的资料中,找出最小值与最大值,计算全距。 全距=最大值最小值 第二步,确定组距和组数。一般组数确定为5-7组较好,尽量使用奇数组,避免偶数组,对于同一资料,在全距一定的情况下,组数与组距成反比例关系,即,第三步,确定各组组限。 确定组限时,一般是从最低组的下限开始或从最高组的上限开始。最低组的下限不要刚好等于原始资料中的最小值,而应略小于这个最小值;同样,最高组的上限应略高于原始资料中的最大值。特殊情况下,确定组限也可以从中间某组开始。 第四步,汇总各组标志值出现的次数,绘制变量数列表。,下面举例说明频数分布(次数分布、分配数列)的编制方法,设有50名工人某月份完成生产定额的原始资料如下(单位:): 95 91 114 110 118 133 121 146 117 125 108 105 110 107 137 120 145 125 136 127 121 118 103 115 115 141 117 123 118 129 136 101 98 113 113 114 119 126 120 93 122 108 101 105 125 116 122 132 128 127,第一步,计算全距 全距=最大值最小值=14691=55 第二步,确定组距和组数 组距d=全距/组数=55/6=9.17=10,第三步,确定各组组限。 第四步,汇总各组标志值出现的次数,绘制频数分布表。,频数分布表,课堂练习,女性通常在多大年龄结婚?一家地方报纸列出在一周内申请结婚的女性的年龄如下: 30 27 40 30 26 31 24 23 25 29 32 29 22 33 29 46 25 34 19 23 23 44 29 30 25 23 25 27 37 24 22 27 31 24 26 要求:进行统计分组并形成分配数列,观察内在规律,第一步,计算全距 全距=最大值最小值=4619=27 第二步,确定组距和组数 组距d=全距/组数=27/6=4.5=5,第三步,确定各组组限。 第四步,汇总各组标志值出现的次数,绘制频数分布表。,女性结婚年龄分组资料,第二节 统计表与统计图,一、统计表 二、统计图,一、统计表,将统计数据按一定的顺序排列在表格上,就形成了统计表。从广义讲,统计表包括统计工作各阶段所使用的一切表格,有调查表、汇总表和分析表。本部分侧重就表现统计整理结果所用的统计表进行讨论。,从统计表的形式上看,可由总标题、横行标题、纵栏标题和指标数值四部分组成。 此外有些统计表在表下还增列补充资料、注解、附记、资料来源、某些指标的计算方法、填表单位、填表人员以及填表日期等。,统计表的构成,统计表的构成,总标题是表的名称,用以概括统计表中全部统计资料的内容。一般写在表的上端中部。 横行标题是横行的名称,在统计表中通常用来表示各组的名称,它代表统计表所要说明的对象,一般写在表的左方。 纵栏标题是纵栏的名称,在统计表中通常用来表示统计指标的名称。一般写在表的上方。 指标数值列在各横行标题与各纵栏标题的交叉处。统计表中任何一个数字的内容由横行标题和纵栏标题所限定。,统计表的构成,总标题,横行标题,纵栏标题,指标数值,统计表的分类,统计表根据主词是否分组以及分组程度不同,可分为: 1、简单表,是指对总体未作任何分组而形成的统计表,可以有两种形式:一是按总体单位名称排列的统计表;二是按时间顺序排列的统计表。 2、简单分组表,是指总体仅按一个标志分组而形成的统计表。 3、复合分组表,是指总体按两个或两个以上标志进行复合分组而形成的统计表。,统计表,1、我国近年来国内生产总值资料:,2、年日均创国内生产总值:,简单表,复合表,统计表,统计表的编制规则,开口式 上下端线要粗 表内一般不打横线,但合计栏要打横线 主词有计量单位要专列一栏,宾词的计量单位可写在标题旁或下方。 主词分栏用(甲)、(乙)、(丙) 宾词分栏用(1)、(2)、(3) ,二、统计图,即用统计图形来表示次数分布的方法。常用的有以下种: 直方图 折线图 曲线图,1、直方图,直方图,即用直方形的宽度和高度来表示次数分布的图形。,1、直方图,绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(一般标在右方),没有比率的直方图只保留左侧次数。 然后按分布在各组的次数及比率确定各组在纵轴上的坐标,并依据各组组距的宽度与次数的高度绘成直方形。,2、折线图,折线图可以在直方图的基础上,用组中值与次数求坐标点连接而成,它表示次数分布的图形,3、曲线图,曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。它实质上是对应于连续变量的次数或比率分布的函数关系图。 曲线图的绘制方法与折线图基本相同,只是连接各组次数坐标点的线段应当用平滑曲线而不用折线,曲线图,次数分布的主要类型,钟形分布,U 形分布,J形分布,补充部分,EXCEL公式和函数的运用 EXCEL制作统计图和统计表,EXCEL公式,1、公式的基本特性: 公式的输入是以“ = ”开始,公式的计算结果显示在单元格中,公式本身显示在编辑栏中。(工具选项菜单) 如:=1+2+6 (数值计算) =A1+B2 (引用单元格地址),2、常用的EXCEL公式,常用公式 算术运算符:+ - * / % 字符运算符:& 连接符 比较运算符:= = 逻辑运算符:and or not 以函数形式出现 优先级顺序:算术运算符字符运算符比较运算符逻辑函数符(使用括号可确定运算顺序),3、引用方式,1、相对引用 2、绝对引用 3、混合引用 4、跨工作表引用 5、跨区域引用,4、函数的概念,函数是Excel附带的预定义或内置公式 Excel函数共九大类。 数学与三角函数 统计函数 数据库函数 逻辑函数 主要掌握函数功能和使用形式,求统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论