《统计学》第3章统计数据的整理和显示课件_第1页
《统计学》第3章统计数据的整理和显示课件_第2页
《统计学》第3章统计数据的整理和显示课件_第3页
《统计学》第3章统计数据的整理和显示课件_第4页
《统计学》第3章统计数据的整理和显示课件_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计数据的整理和显示§1统计数据整理的概念和步骤§2统计分组§3分配数列§4统计表与统计图第三章统计数据的整理和显示§1统计数据整理的概念和步骤一、统计数据整理的概念:根据统计研究的目的,将统计调查所得的原始数据进行科学的分组和汇总,使之系统化,条理化的工作过程。统计数据整理在统计工作中处于中间阶段,起着承前启后的作用。§1统计数据整理的概念与步骤一、统计数据整理的概念:§1统计数据整理的概念与步骤2二、数据整理的程序设计编制统计数据整理汇总方案统计资料的审核(主要内容:完整性和准确性)资料的分组和汇总编制统计图表统计资料的积累和保管二、数据整理的程序设计编制统计数据整理汇总方案3一、统计分组的概念与原则:1、概念:“分”:就是把同一总体中性质不同的总体单位分配到不同的组里,突出组与组之间的差异性。“组”:就是把同一总体中性质相同的总体单位归并到同一组里,突出组内的同质性。§2统计分组一、统计分组的概念与原则:§2统计分组42、统计分组的原则:穷尽原则:就是使总体中的每一个单位都应有组可归。互斥原则:就是使总体中的任何一个单位只能归属于某一个组,而不能同时或可能归属于几个组。

2、统计分组的原则:穷尽原则:就是使总体中的每一个单位51.划分社会经济现象的类型2.揭示社会经济现象的内部构成3.分析社会经济现象之间的依存关系(二)统计分组的作用1.划分社会经济现象的类型(二)统计分组的作用6例“九五”期间我国国内生产总值构成(%)年份19961997199819992000第一产业

20.4

19.1

18.6

17.6

15.9第二产业

49.5

50.0

49.3

49.4

50.9第三产业

30.1

30.9

32.1

33.0

33.2合计100.0100.0100.0100.0100.0例“九五”期间我国国内生产总值构成(%)年份1996197例耕作深度分组(cm)地块数平均收获率(公斤/亩)10-12

740012-141046014-161654016-1818-20125620680某乡某种农作物的耕作深度与收获率的关系例耕作深度分组(cm)地块数平均收获率(公斤/亩)10-128按分组标志的多少,可分为简单分组和复合分组。按分组标志性质的不同,分为品质分组和数量分组。按分组的作用和任务不同,分为类型分组、结构分组和分析分组。(三)统计分组的种类按分组标志的多少,可分为简单分组和复合分组。(三)统9二、统计分组的方法:统计分组的关键问题:一、选择适当的分组标志。二、合理划分各组之间的界限。1、根据研究的目的确定2、选择最具有代表性的标志3、根据具体的历史条件确定(上限不在内原则)二、统计分组的方法:统计分组的关键问题:1、根据研究的目的确10品质标志分组的方法:按品质标志分组,有的比较简单,分组的标志一经确定,组的名称和组数也随之确定了。如:人口按性别分组,就分为“男”与“女”两组。按品质标志分组,有的就比较复杂。如:国民经济的部门划分,就有三次产业分类、行业分类、机构部门分类。这种比较复杂的分类,一般会有国家统计局和国家标准局统一制定分类标志,代码等。品质标志分组的方法:按品质标志分组,有的比较简单,分组的标志11数量标志分组的方法:分组时各组数量界限的确定必须能反映事物质的差别。根据被研究的现象总体的数量特征,采用适当的分组形式,确定相应的组距、组限。数量标志分组的方法:分组时各组数量界限的确定必须能反映事物质12分组的形式如下:1、单项式分组:

一个变量值代表一组。一般适用于离散变量且变异范围较小。例:工人按日产量分组:

日产量(件)人数208211022252330247252分组的形式如下:1、单项式分组:日产量(件)人数20132、组距式分组:用一段距离代表一组。一般适用于连续变量或变异范围较大的离散变量。例:学生按学习成绩分组:

(1)、等距分组:各组的组距都相等。适用于标志值的变动比较均匀的情况下。(2)、异距分组:各组的组距不完全相同。适用:

a、标志值分布很不均匀

b、标志值相等的量具有不同意义

c、标志值按一定比例发展变化按成绩分组

人数60分以下260—70970—801580—901190分以上3

合计402、组距式分组:用一段距离代表一组。一般适用于连续变量按成14按年龄分组组距不满周岁—1—3岁24—6岁27—12岁5…………60—64岁465—79岁1480—99岁9100岁以上—1982年第三次人口普查年龄的异距分组按年龄分组组距不满周岁—1—3岁24—6岁27—12岁5……15组距分组的组限确定:间断组距分组如:儿童按年龄分组:未满周岁,1~2岁,3~4岁,5~9岁,10~14岁。连续组距分组如:工厂按完成任务的程度分组:100%以下,100%~110%,110%~120%,120%以上。在连续组距的分组时,相邻两组的上、下限是重叠的,如110%。统计中按“上限不在内”原则处理。即,110%统计到作为下限的第三组而不是统计到作为上限的第二组。组距分组的组限确定:间断组距分组16分组形式的总结:品质标志分组数量标志分组单项式分组组距式分组等距式分组异距式分组统计分组分组形式的总结:品质标志分组数量标志分组单项式分组组距式分组17分组中的几个基本概念:(1)全距(R)=数列中的最大值-最小值组距(d)=上限-下限组数:组限上限:一组中的较大值。下限:一组中的较小值分组中的几个基本概念:(1)全距(R)=数列中的最大值-最181、组数的多少与组距的大小有关。在全距一定时,组距大,组数就少;组距小,组数就多。2、组距的确定要根据事物的数量特征来确定。组距如果过大,就会使性质不同的单位归并到了同一组里(破坏了组内的同质性);组距过小,就会使同一性质的单位分到了不同的组里(破坏了组与组之间的差异性)。3、决定组数的多少,并无规则可循,必须凭借经验和对研究对象的认识作出判断。有一个经验公式可供大家参考:【美国学者斯特杰斯创用】n=1+3.322logNn:组数N:总体单位数1、组数的多少与组距的大小有关。在全距一定时,组距大,组数就19分组中的几个基本概念:(2)组中值:上、下限之间的中点数值就是组中值。

开口组与闭口组:

开口组:缺少上限或下限的组。如:60分以下;60—70;…80—90;90分以上。闭口组:上、下限都齐备的组。如:70—80分;500—600公斤;90—100岁分组中的几个基本概念:(2)组中值:上、下限之间的中点数值就20开口组如何计算组中值:缺少上限:组中值=下限+相邻组的组距÷2;如:90分以上,组中值=90+10/2=95缺少下限:

组中值=上限-相邻组的组距÷2;如:60分以下,组中值=60-10/2=55开口组如何计算组中值:21说明:组中值代表该组变量的平均水平,是建立在如下的假设条件下:分配到该组的各总体单位在该组的分布时均匀分布。组中值是假定值,是上限与下限的中间数值。

说明:22一、分配数列的概念:在统计分组的基础上,将总体所有的单位按某一标志进行归类排列。可分为:品质数列和变量数列。分配数列的两个要素:

一是总体按某标志所分的组;二是各组所出现的单位数,即频数,

亦称次数(一般用f来表示)。§3分配数列一、分配数列的概念:§3分配数列23例

某班学生的性别构成情况

按性别分组人数(人)比重(%)男30

75女10

25合计40100品质数列例某班学生的性别构成情况按性别分组人数(人)比24二、变量数列的编制例:某班50名学生“统计学”考试成绩如下:5874856582727683629988699166989577836375646382818672786757848567907182737463979997888097877677858793二、变量数列的编制例:某班50名学生“统计学”考试成绩如下:25第一步:将考试成绩按大小顺序排列。第二步:根据数列的数量特征确定分组的形式。(连续变量组距式分组)第三步:找出数列中的最大值和最小值,计算全距。(最大值:99;最小值:57;全距:42)第四步:确定组数。(根据N=50,n=1+3.3222log50=6.64)第五步:确定组距。(42÷6.64=6.33;组距=10[组距一般取5或10的整倍数])第六步:确定首组的下限和末组的上限。(首组下限=50;末组设为:100)第七步:统计总体单位在各组的分配次数。第一步:将考试成绩按大小顺序排列。26按考试成绩分组人数f频率(%)60以下2460-70102070-80122480-90163290以上1020合计50100某班50名学生“统计学”考试成绩次数分布统计表按考试成绩分组人数f频率(%)60以下2460-7010227三、累计频数与累计频率:向上累计:由标志值小的方向向标志值大的方向累计。表示的意义是:该组上限以下所包含的总体单位是多少。向下累计:由标志值大的方向向标志值小的方向累计。表示的意义是:该组下限以上所包含的总体单位是多少。三、累计频数与累计频率:向上累计:由标志值小的方向向标志值大28某班50名学生“统计学”考试成绩累计次数分布统计表按考试成绩分组人数频率(%)向上累计向下累计人数频率人数频率60以下24245010060-7010201224489670-8012242448387680-9016324080265290以上1020501001020合计50100----某班50名学生“统计学”考试成绩累计次数分布统计表按考试成绩29四、频数分布的类型:钟型分布、U型分

布、J型分布。钟型分布的特征:两头小,中间大。即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。四、频数分布的类型:钟型分布、U型分

布、30U型分布的特征:两头大,中间小。即靠近中间的变量值分布的次数少,靠近两边的变量值分布的次数多。U型分布的特征:31J型分布的特征:正J型分布的特征:次数随着变量的增大而增多。例:投资额按利润率的大小分布。J型分布的特征:正J型分布的特征:32反J型分布的特征:次数随着变量的增大而减少。例:产品产量的增加,产品单位成本下降。反J型分布的特征:33一、统计表(一)、统计表的定义和结构定义:把统计数据按一定的顺序排列在表格上。结构:1、从表式上看:总标题、横行标题、纵行标题、指标数值。

2、从内容上看:主词:总体及其分组。宾词:各个指标(包括指标名称和数值)。

§4统计表与统计图一、统计表§4统计表与统计图34例分组总产值(万元)职工人数(人)劳动生产率(元/人)P123大型中型小型合计

2006年某月某公司各企业劳动生产率统计表(单位)横行标题

主词宾词总标题纵栏标题数据资料(指标数值)例分组总产值(万元)职工人数(人)劳动生产率P123大型中型35(二)、统计表的分类:1、按用途分类:(1)、调查表(2)、整理表或汇总表(3)、分析表2、按主词的结构分类:(1)、简单表(2)、分组表(3)、复合表3、按宾词设计分类:(1)、简单排列表(2)、分组排列表(3)、分组层叠排列表(二)、统计表的分类:1、按用途分类:(1)、调查表2、按主36

(三)、统计表的设计要求:简练、明确、实用、美观、便于比较。

(三)、统计表的设计要求:简练、明确、371、统计表式设计应注意的事项:统计表应设计成长方形表格,注意长与宽的比例。线条的绘制。特别注意统计表的左右两端一般不划线,采用“开口式”。合计栏的设置。一般应放在最后一列或最后一栏。栏数的编号。主词的序号为:甲、乙、丙、丁、……

宾词的序号为:(1)、(2)、(3)(4)……

1、统计表式设计应注意的事项:统计表应设计成长方形表格,注意38指标总量指标(AggregateIndicators)1990199519961997199819992000国内生产总值298.411009.471179.091350.101429.261479.711589.34第一产业99.58261.52284.89304.51298.67284.28283.00第二产业118.53427.19493.21563.40585.38604.39657.51第三产业80.30320.76400.99482.19545.21591.04648.83重庆市1990年—2000年国内生产总值统计表单位:亿元指标总量指标19901995199619971998199939重庆市人民物质文化生活提高情况表(1999—2000)指标计量单位1999年2000年发展速度(%)(甲)(乙)(1)(2)(3)=(2)÷(1)每人每年生活消费(现价)元23362466105.6食用植物油公斤6.56.4799.5城镇住房面积平方米9.5110.72112.7农村住房面积平方米26.6729.58110.9每万人拥有电话部9111390152.6平均每人储蓄存款余额元29593522119.0城镇居民平均每户就业人数人1.771.7297.2重庆市人民物质文化生活提高情况表(1999—2000)指标计402、统计表内容设计应注意的事项标题设计:应简明扼要,用简练而又准确的文字表述统计资料的内容、资料所属的空间和时间。指标数值:表中数值应该填写整齐,对准位数。“0”:表示数字小可略而不计。“…”:表示缺少某项数字。“

—”:表示此栏不应有数字。计量单位:统计表必须注明数字资料的计量单位。

1、全表只有一个计量单位时,应写在表的右上方。

2、各横行计量单位不同,可单列一计量单位栏。

3、各纵列计量单位不同,可在各列的指标后加计量单位。注解或资料来源:为保证统计资料的科学性和严肃性,在统计表的下方应注明资料来源,注解或说明,以便查考。2、统计表内容设计应注意的事项标题设计:应简明扼要,用简练而41年份客运量(万人)客运周转量(万人公里)货运量(万吨)货运周转量(万吨公里)195282.00…134.00315311962964.5612619807.5114739019753602.03401803225.7127633719807845.544170254468.631106294199020332.00106877515545.512452448199539731.00210427022795.703359847199849772.00247618126494.003291566199953290.00255800026390.003379000200057667.00270446027889.083543587重庆市主要年份客、货运量及周转量统计表年份客运量客运周转量(万人公里)货运量货运周转量(万吨公42二、统计图统计图形是用来描述次数分布特征的。常用的图形有三种:直方图、折线图、曲线图。二、统计图统计图形是用来描述次数分布特征的。431.直方图以组距为宽,各组的频数或频率为高,绘制代表各组的直方块,便形成直方图。1.直方图44用宽度相同的条形的高度或长短来表示各类别数据的图形,高度或长短表示各类别的频数。2.条形图用宽度相同的条形的高度或长短来表示各类别数据的图形,45折线图(次数分配曲线图)405060708090100110折线图(次数分配曲线图)40506070809010011046折线图还可用来表示累计次数分布:曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。向下累计向上累计折线图还可用来表示累计次数分布:曲线图是组数趋向于无限多时折47

4.曲线图

如钟型图、U型图和J型图等。4.曲线图

如钟型图、U型图和J型图等。48重庆市2000年城镇经济单位新增就业人员的构成(%)5.饼图重庆市2000年城镇经济单位新增就业人员的构成(%)5.饼496.茎叶图(stem-and-leafdisplay)用于显示未分组的原始数值型数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留一位数字茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息6.茎叶图(stem-and-leafdisplay)用50茎叶图

(例题分析)茎叶图

(例题分析)51本章重点和难点重点:1、统计数据整理

2、统计分组(概念、作用、种类、原则、方法)

3、统计分组的基本概念(全矩、组限、组距、组数以及组中值)

4、分配数列编制

5、统计表的结构、种类以及制表的规则本章重点和难点重点:1、统计数据整理52本章重点和难点难点:1、如何分组

2、“上限不再内”原则

3、累计频数与累计频率本章重点和难点难点:1、如何分组53一、单项选择题1、下列分组中哪个是按品质标志分组()。

A.企业按年生产能力分组B.产品按品种分组

C.家庭按年收入水平分组D.人口按年龄分组2.简单分组和复合分组的区别在于()。

A.选择的分组标志性质不同B.选择的分组标志多少不同

C.组数的多少不同D.组距的大小不同

3.在组距分组时,对于连续型变量,相邻两组的组限()。A.必须是重叠的

B.必须是间断的

C.可以是重叠的,也可以是间断的D.必须取整数一、单项选择题1、下列分组中哪个是按品质标志分组(544.次数分配数列是()。A.按数量标志分组形成的数列B.按品质标志分组形成的数列C.按统计指标分组形成的数列D.按数量标志和品质标志分组形成的数列5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论