统计数据的整理_第1页
统计数据的整理_第2页
统计数据的整理_第3页
统计数据的整理_第4页
统计数据的整理_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计数据的整理第1页,共67页,2023年,2月20日,星期二

EndofChapter3第2页,共67页,2023年,2月20日,星期二了解统计数据整理意义,熟悉整理的原则和内容,并能进行预处理掌握分组的概念、特点和原则,了解分组的种类掌握频数分布的概念,熟悉频数分布的编制方法掌握统计表的含义及其构成,熟悉统计表的编制学习目的和要求

1第3页,共67页,2023年,2月20日,星期二

分组的概念原则分组的作用频数分布的概念及其构成统计表的编制方法和原则学习重点2第4页,共67页,2023年,2月20日,星期二统计分组的方法频数分布的编制学习难点3第5页,共67页,2023年,2月20日,星期二

统计整理就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。第一节

统计数据整理概述一、统计整理及类型整理的目的:去伪存真、去粗取精分类排序、规则系统分析研究、综合创新第6页,共67页,2023年,2月20日,星期二原始资料综合资料总体单位资料总体资料数据整理整理调查分析作用:承前启后、积累历史资料第7页,共67页,2023年,2月20日,星期二1.定期统计报表数据的整理2.专题性统计数据的整理3.历史统计数据的整理统计整理的类型第8页,共67页,2023年,2月20日,星期二数据整理原则标准性系统性准确性及时性通俗性二、数据整理原则和内容第9页,共67页,2023年,2月20日,星期二数据整理

的内容审核汇总编制统计图表分组第10页,共67页,2023年,2月20日,星期二数据整理的具体步骤数据整理的程序见教材P34第11页,共67页,2023年,2月20日,星期二三、数据的预处理:审核、订正、排序P35适用性第12页,共67页,2023年,2月20日,星期二数据订正第13页,共67页,2023年,2月20日,星期二数据排序第14页,共67页,2023年,2月20日,星期二一、什么是统计分组?

根据统计研究的目的和要求,按照一定的标志把总体划分为若干不同性质的组,称为统计分组。第二节

统计分组25%33%42%分组前分组后第15页,共67页,2023年,2月20日,星期二统计分组有什么作用?1.划分现象的类型第二节

统计分组男人女人婴儿青年老人第16页,共67页,2023年,2月20日,星期二2.揭示现象的内部结构第17页,共67页,2023年,2月20日,星期二3.分析现象间的依存关系身高与体重有关系吗?哇!咦!第18页,共67页,2023年,2月20日,星期二标志的多少二、分组类型标志性质第19页,共67页,2023年,2月20日,星期二经济用途头数产品畜役畜牲畜按经济用途分组经济用途头数

小计公母产品畜役畜合计牲畜按经济用途、雌雄分组简单分组

复合分组

1、按分组标志的多少第20页,共67页,2023年,2月20日,星期二牲畜分组头数一、按经济用途分产品畜役畜二、按雌雄分

去势三、按年龄分仔畜幼畜成年畜分组体系第21页,共67页,2023年,2月20日,星期二属性分组——反映事物属性差异按存款种类分组活期存款定期存款关键:选择分组标志2、按分组标志的性质第22页,共67页,2023年,2月20日,星期二工人按月工资分组300-400400-500500-600600-700700-800关键:选择分组标志和划定各组数量界限变量分组——反映事物数量差异第23页,共67页,2023年,2月20日,星期二三、统计分组原则和方法(一)分组原则穷尽互斥同一第24页,共67页,2023年,2月20日,星期二(二)如何选择分组标志?1.符合统计研究的目的和要求2.选择最能说明事物本质特征的标志分组方法第25页,共67页,2023年,2月20日,星期二(三)划分各组界限?属性分组变量分组第26页,共67页,2023年,2月20日,星期二国民经济中常见分组见教材P40-43第27页,共67页,2023年,2月20日,星期二一、频数分布及种类频数分布:在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,形成总体各单位在各组间的分布。称为频数分布,或次数分布。第三节

频数分布第28页,共67页,2023年,2月20日,星期二始犯心理状态人数(人)f比率(%)f/Σf被迫使糊涂好奇自觉7443314.598.348.3468.73合计48100.0工读学生始犯错误心理状态统计表统计分组频数频率频数分布组别第29页,共67页,2023年,2月20日,星期二

各组的单位数叫频数,记为f。

各组的单位数与总体单位总数之比叫频率。第30页,共67页,2023年,2月20日,星期二频数分布变量分布品质分布单项分布组距分布等距式分布异距式分布频数分布的种类第31页,共67页,2023年,2月20日,星期二

品质频数分布:它是经过属性分组后形成的频数分布,其组别表现为一系列的概念或范畴。第32页,共67页,2023年,2月20日,星期二北京崇文区工读学校学生始犯年龄统计表

变量频数分布:是经过变量分组后形成的分布数列,其组别表现为不同的数值或数域。始犯年龄人数比率(%)10111213141516172414544536421.22.58.733.528.022.42.51.2合计161100.0变量变量值频数频率第33页,共67页,2023年,2月20日,星期二

单项数列:

是以一个变量值为一组编制的变量频数分布。始犯年龄人数比率(%)10111213141516172414544536421.22.58.733.528.022.42.51.2合计161100.0北京市崇文区工读学校学生始犯年龄统计表第34页,共67页,2023年,2月20日,星期二组距数列是以表示一定变动范围的两个变量值构成的组所编制的变量频数分布。第35页,共67页,2023年,2月20日,星期二某公司员工月工资水平分组表按月工资分组(元)人数比率%1000以下1000——15001500——20002000——25002500——30003000以上61423171287.5017.5028.7521.2515.0010.00合计80100.00下开口组上开口组上限下限频数频率组中值组距50050050050050050075012503250225017502750不等距数列分组下上等距数列第36页,共67页,2023年,2月20日,星期二二、累计频数与累计频率按月工资分组(元)人数比率%1000以下1000——15001500——20002000——25002500——30003000以上61423171287.5017.5028.7521.2515.0010.00合计80100.00向上累计人数下上68020437260向下累计人数82037607480第37页,共67页,2023年,2月20日,星期二(一)品质频数分布的编制作属性分组,划分各组界限例见教材P.47-48三、频数分布的编制第38页,共67页,2023年,2月20日,星期二

某班学生的性别构成情况按性别分组人数(人)比重(%)男3075女1025合计40100例:品质数列第39页,共67页,2023年,2月20日,星期二1、单项数列的编制适用范围离散型变量,变量值的种数较少时。步骤将变量值排序

计算频数和频率

编制统计表例见教材P.48-49(二)变量频数分布的编制第40页,共67页,2023年,2月20日,星期二例:单项数列

某厂第二季度工人平均日产量工人平均日产量(件)工人人数(人)比重(%)2108.7031513.0443026.0954034.7862017.39合计115100.00第41页,共67页,2023年,2月20日,星期二2、组距数列的编制适用范围离散型变量,变量值的种数较多时;

连续型变量。第42页,共67页,2023年,2月20日,星期二某班学生统计学考试成绩表考试成绩(分)人数(人)比重(%)50-6025.060-70717.570-801127.580-901230.090-100820.0合计40100.0例:组距数列第43页,共67页,2023年,2月20日,星期二编制步骤排序,确定最大值、最小值,计算全距确定组距数列类型。等距/不等距?确定组数和组距。●●●●●●确定组限和组限表示方法。同限/异限?计算频数、频率,编制统计表第44页,共67页,2023年,2月20日,星期二四、频数分布的类型

钟型分布的特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,其曲线图宛如一口钟。钟型分布第45页,共67页,2023年,2月20日,星期二

(a)正态分布(b)偏态分布正偏(右偏)负偏(左偏)第46页,共67页,2023年,2月20日,星期二

U型分布的形状与钟型分布相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U型分布。如人口死亡率分布,人口总体中,幼儿和老人死亡率高,而中青年死亡率低。U型分布UUU第47页,共67页,2023年,2月20日,星期二

J型分布有两种类型,一种是次数随着变量的增大而增多。另一种呈反J型分布,即次数随着变量增大而减少。J型分布JJJ第48页,共67页,2023年,2月20日,星期二J形分布正J形反J形U形分布第49页,共67页,2023年,2月20日,星期二一、统计表:是以纵横交叉的线条组成的表格来表现统计数据的一种形式。第四节

统计资料的显示第50页,共67页,2023年,2月20日,星期二(一)统计表的结构国别肉类蛋类奶及制品粮食美国俄罗斯日本中国11.3810.687.324.322.32.52.51.244.9756.807.180.5519.5……18.636.9某年世界几个主要粮食和畜产品消费量(斤/人月)总标题纵栏标题数字资料横行标题主词宾词第51页,共67页,2023年,2月20日,星期二按主词是否分组简单表分组表复合表按用途不同整理表调查表分析表(二)统计表的种类第52页,共67页,2023年,2月20日,星期二主要年份农村居民家庭人均纯收入(元)城镇居民家庭人均可支配收入(元)1978198019851990199520002005133.6191.3397.6686.31577.72253.42936.4343.4477.6739.11510.24283.06280.09421.6我国城乡居民家庭人均收入

简单表主词

宾词

第53页,共67页,2023年,2月20日,星期二指标单位198919972004居民家庭恩格尔系数%

城镇

54.546.637.7农村

54.855.147.2居住条件

城市人均住宅建筑面积平方米13.517.825.0农村人均住房面积平方米17.222.527.9交通条件

城镇每百户拥有家用汽车辆

0.192.18农村每百户拥有摩托车辆0.9510.8936.15通信条件

电话普及率部/百人0.988.1150.03移动电话普及率部/百人

1.0725.91每千人拥有公用电话数部0.041.5717.14我国城乡居民生活质量差别分组表第54页,共67页,2023年,2月20日,星期二科学实用简练显目美观如何设计统计表?(三)设计原则第55页,共67页,2023年,2月20日,星期二表式设计表的上下端应以粗线绘制,表内纵横线以细线绘制,表格的左右两端一般不划线,采用“开口式”统计表各纵列、横行须合计时,一般应将合计列在最后如栏数较多,应按顺序编号,主词栏部分可编以甲乙…等序号,宾词栏可编(1)(2)…等序号长方形表格,长与宽之间保持适当比例第56页,共67页,2023年,2月20日,星期二内容设计数字应填写整齐,对准位数。当数字因小而忽略不计时,填写为“0”;当缺某项资料时,用符号“…”表示;没有数字时用符号“-”表示

注明资料来源。必要时,在统计表下加注说明

当全表只有一种计量单位时,可将其写在表头右上方。如表中各栏指标数值计量单位不同,可在横行标题后添一列计量单位标题设计应简明扼要,简练、准确第57页,共67页,2023年,2月20日,星期二二、统计图

1.直方图

第58页,共67页,2023年,2月20日,星期二2.条形图第59页,共67页,2023年,2月20日,星期二

4.曲线图

3.折线图

第60页,共67页,2023年,2月20日,星期二5.饼图

第61页,共67页,2023年,2月20日,星期二第62页,共67页,2023年,2月20日,星期二本章小结频数分布数据的显示数据整理概述统计分组第63页,共67页,2023年,2月20日,星期二一、名词解释二、简答题统计分组变量数列1、简述统计整理的步骤。2、什么是统计分组?它有哪些作用?练习题第64页,共67页,2023年,2月20日,星期二1、统计分组的关键问题是确定组距和组数。()2、复合分组就是选择两个或两个以上的分组标志对同一总体进行的并列分组。()3、按数量标志分组所形成的数列是次数分布数列。()4、各组次数占总体次数的比值通常称为频数。()5、按品质标志分组所形成的数列是次数分布数列。()6、离散型变量既可以编制单项变量数列,也可以编制组距变量数列;连续型变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论