复旦大学统计学-第3章-数据的描述性整理课件_第1页
复旦大学统计学-第3章-数据的描述性整理课件_第2页
复旦大学统计学-第3章-数据的描述性整理课件_第3页
复旦大学统计学-第3章-数据的描述性整理课件_第4页
复旦大学统计学-第3章-数据的描述性整理课件_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

面向21世纪课程教材

统计学STATISTICS

高等教育出版社1第三章数据的描述性整理

第一节总量指标和相对指标第二节统计整理的基本理论第三节次数分布第四节统计图第五节统计汇总2第一节总量指标和相对指标

统计指标按其表现形式的不同,可分为总量指标(绝对数统计指标),平均指标(平均数统计指标),相对指标(相对数统计指标)。3一、总量指标(一)总量指标的概念总量指标是反映社会经济现象总规模、总水平或者工作总量的统计指标。总量指标用绝对数形式表现。有时也可以表现为总量之间的绝对差额、增加额或者是减少额。5(二)总量指标的种类1.按其反映现象的内容不同总体单位总量总体标志总量2.按其反映事物的时间状况的不同

时期指标时点指标61.总体单位总量和标志总量总体单位的总数目称作总体单位总量;总体各单位某一数量标志值的总和称作标志总量。总体单位总量与标志总量的区分只有在一个特定的总体中才有意义。7

2.时期性总量指标和时点性总量指标时期指标反映社会经济现象在一段时间内发展变化的总量。时期指标和时期有着直接的关系。时点指标反应现象在某一时刻(瞬间或者时点)状态上的水平。时点指标与时间长短没有直接的关系,且不具有可加性。9时期性指标和时点性指标的区别时期性总量指标和时点性总量指标的特点是:1.从指标数值的大小当中是否包含有时间过程因素来看,时期性总量指标数值的大小与它所反映的时间过程的长短直接有关,它所反映的时间越长,指标数值就越大。时点性总量指标所反映的是事物在时点上停留量,其中不含有时间过程因素。10

2.从前后时间上的数值相加有无实际意义来看,时期性总量指标前后时间上的数值可以相加,相加后的结果有实际意义;而时点性总量指标相加无实际意义。有时将时点性总量指标前后时间上的数值相加,只是为了满足计算上的某种需要。11请对下列指标进行分类a.手机拥有量b.商品库存c.市场占有率d.人口数e.出生人口数f.单位产品成本g.人口出生率h.利税额质量指标:数量指标:时期指标:时点指标:离散变量:连续变量:13二、相对指标

(一)相对指标的意义

1.含义相对指标是由两个有联系的指标数值对比而成的。相对指标通常用相对数形式表示。14

2.作用相对指标的作用在于能够揭示总体内部的结构、比重、比例等等数量关系,以及反应相关事件之间的数量联系程度。152.有名数有名数是将相对数中的分子和分母指标的计量单位同时并列,以表明事物的强度、密度、普遍程度等。例如,人口密度用“人/平方公里”表示;每人平均粮食产量用“公斤/人”表示;每人平均国民生产总值用“元/人”。17(三)相对指标的计算

(一)结构相对指标

结构相对指标,是在分组的基础上,将各组的总量指标与总体的总量指标对比,计算出各组数量在总体中所占的比重,从而反映总体的内部结构状况。其计算公式为:18项目2006年总值(亿元)比重(%)国内生产总值第一产业第二产业第三产业209407247001020048270310011.848.739.5例如,下表资料反映了我国2006年国内生产总值的分配情况。19例如,2006年年末我国总人口为131448万人,其中,男性人口67728万人,女性人口63720万人。人口性别比例=67728/63720=106.29:10021(三)比较相对指标比较相对指标是将同类现象在同一时间不同空间的指标数值进行对比,反映同类现象在不同空间上的差异程度和现象发展的不平衡状况。22(四)计划完成程度相对指标计划完成程度相对指标是将某一指标的实际完成数与计划数(或目标任务数)对比,用以反映计划数的完成程度或用来监督检查计划的执行情况。

23

3.如果计划任务是以比某个基期数增减百分比的形式给出的,则计算计划完成相对数时分子和分母都应包含基数而不能只看增减部分,即此时计算公式可写为:25例题

某企业去年盈利目标是2000万元,实际盈利2120万元。计划劳动生产率应比上年提高5%,而实际提高了10%;计划单位产品成本比上年降低5%,实际降低了2%。试分别求该企业去年的盈利总额、劳动生产率和单位产品成本的计划完成百分比。26(六)强度相对指标

强度相对指标是将同一时间同一空间两个内容不同而有联系的指标数值对比,可以反映现象的强度、密度、普遍程度和经济效益等。29强度相对指标的特点①强度相对数的分子分母一般可以互换,故说明同一问题的强度相对数通常有正指标与逆指标两种形式。如资金利税率是正指标,若将其分子分母互换,每实现一元利税所占用资金量就是逆指标。②强度相对数大多数为有名数(且为复名数),有些也用百分数或千分数等无名数形式表示如外贸依存度、人口死亡率(报告期死亡人数除以报告期平均人数)。③强度相对数常常带有“平均”意义,但统计理论上倾向于把它作为一种相对数而不是平均数。30五种常见的相对指标常见的相对指标动态相对指标比较相对指标计划完成相对指标结构相对指标强度相对指标同种指标同种指标同种指标不同时间的数值对比不同地点的数值对比实际与计划数值对比整体中的一部分/整体同一范围内两个总量指标之比31第二节统计整理的基本理论一、统计整理的意义1.含义

统计整理,是指根据统计研究目的,将统计调查所得的原始资料进行科学的分类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。32

2.意义

统计整理是统计工作过程的第三阶段,是统计调查的继续,是统计分析的前提,它是从对现象的感性认识过渡到对现象理性认识的开始,是这个过程的连续点,并为这个过程提供坚实的基础,它在统计工作中起着承前启后的作用。33

二、统计整理的内容与程序统计数据整理的内容与程序主要包括以下几个方面:

首先,统计数据的预处理——调查资料的审核;其次,统计数据的排序;再次,是统计数据的分组和汇总;最后,是编制统计表和绘制统计图。34

第三节次数分布

一、次数分布的概念

在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在各组间的分布,叫做次数分布。35

分布在各组中的个体单位数叫做次数或频数。各组次数与总次数之比叫做比率或频率。将各组别与次数按一定的次序排列所形成的数列称作次数分布数列,简称分布数列,又称分配数列或频数分配。36

1987年底我国职工构成表按经济类型分组职工人数(万人)比重(%)全民所有制集体所有制其它965434887273.0926.400.54合计13214100.00

组的名称次数(频数)比率(频率)37

任何分布数列都必须满足两个条件:(1)各个组的频率(比率)大于或等于零;(2)各个组的频率之和等于1。38项目2006年总值(亿元)比重(%)国内生产总值第一产业第二产业第三产业209407247001020048270310011.848.739.5例如,下表资料反映了我国2006年国内生产总值的分配情况。39

二、变量数列的类型

统计整理中,根据分组标志的不同,分布数列分为品质分布数列(按品质标志分组所编制的分布数列)和变量分布数列(按数量标志分组所编制的分布数列)。40品质分布数列(1)品质数列是由组的名称和各组的次数两个要素构成的。

(2)品质数列的编制程序一般比较简单,其步骤是:原始数据,归类,合计,制表。41变量分布数列

任何一个变量分布数列都是由各组变量值和各组的次数两个要素构成的。依照各组变量值的表现形式不同,变量分布数列又可以分为单项式分布数列和组距分布数列。42

(一)单项式数列

按每个变量值分别列组,依次分组编制的变量数列叫做单项式变量数列。适用于离散型变量以及变量之间变异幅度不大的情况。43

【例1】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。44日产量(件)X工人数(人)f202122232425263564321合计2445

依组距分组而编制的变量数列叫做组距数列。组距数列中的每个组不是用一个具体的变量值表示,而是用变量值的一定变化范围即各组标志值变动的区间表示。每组标志值变动的区间长度称为组距。

(二)组距数列46

某班学生某学期统计学成绩

按成绩分组学生数60以下360-70870-801080-90590-1004合计3047

组距数列中,各组变量值变动的界限称为组限,组内最大变量值称为上限,最小变量值称为下限。组距就是上限与下限之差,即:组距=组上限-组下限。每一区间中点位置的数值叫做组中值,组中值=(上限+下限)/248

上述公式通常在由连续型组距数列计算组距时使用。而在离散型组距数列中,考虑到离散型组距数列的特点,其组距一般为后组下限与本组下限之差。即:组距=后组下限-本组下限49三、变量数列的编制变量数列的编制可以分为以下5个步骤:1.将数据按大小排序整理;2.指定初始组数和组距;3.确定组限的位置;4.把数据写入各组,计算出各组的频数和频率,绘制出直方图;5.审查直方图是否反映出数据的分布规律。50指定初始组数和组距

美国学者斯特杰斯提出,在总体各单位标志值趋于正态分布的情况下,可以根据总体单位数(N)来确定分组数(n),其公式为:n=1+3.322lgN。缺陷:当N较少时,由该式算得的组数过多;当N较多时,由该式算得的组数过少。

51

组数和组距之间存在着密切的关系。当全距一定时,组数和组距的关系是:组距=全距/组数其中,全距等于最大变量值和最小变量值之差。52确定组限的位置

做法是:仔细审查已经排序整理过的全体数据,找出其中数据密度最大的区间范围,用这个区间范围的中点(或者是靠近中点的适当数值)作为未来统计分组所分各组中某一组的组中值,再根据已经确定的组距计算出该组的上限和下限,并以此组为基础推算出其他各组。53

【例2】某地区20个企业,某年产品销售额利率指标按大小顺序排列如下(%):6.5,9.6,11.3,13.8,15.4,16.2,18.2,18.6,18.6,19.2,19.5,19.7,20.6,20.9,21.9,22.5,24.3,24.9,28.6,29.5。如果拟定组距为10,组数为3。54审查直方图是否反映出数据的分布规律

对数据作组距式分组整理时确定组数的原则是:在能够反映出数据分布规律的情况下,分组数尽可能多一些。55四、累计次数和累计频率在变量分布数列的基础之上,将各组的频数和频率依次累计,形成了累计分布数列。累计分布数列可以分为向上累计(又称上限以下累计)和向下累计(又称下限以上累计)。56

销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向下累计向上累计向下累计5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合计50100————57

一、统计图的意义和绘制原则

统计图是利用统计资料成的几何图形或者具体图,用来说明社会经济现象数量方面的一种形式。第四节统计图58

绘制统计图,应该遵循以下原则:(1)统计图应该能够放映客观实际情况;(2)统计图要简明扼要,主题突出,通俗易懂;(3)要根据不同的统计资料和不同的目的绘制不同的图形,尽量做到内容与形式的协调。59

二、统计图的绘制步骤1.确定绘制统计图的目的2.搜集统计资料3.决定绘制的图式4.绘制图形60三、几种主要统计图的绘制方法

(一)条形图用宽度相同的直条的高低或者长短来表示各项统计指标数值大小的图形。条形图的用途非常广泛。

适用场合:品质标志分组数列和数量标志分组数列中的单项数列。

61条形图按照排列的不同分为垂直条形图(柱图)和水平条形图。根据表现资料的内容不同,可以分为单式条形图、复式条形图和结构条形图。62

6364

条形图的绘制比较简单,基本操作步骤如下:(1)绘制基线(2)绘制尺度线(3)绘制直条65

(二)直方图

关于画法:直条的高等于该组频率密度,宽为各组的组距。关于直条面积:所有直条面积之和等于总频数或总频率(为1)。6667折线图

画法:用直线段依次连结各直条顶端中点,在直方图的左右两侧应各延伸一个相邻组组距的长度,以其中点作为折线图的两个端点。68

(三)圆形图圆形图是以圆形面积或者圆内各扇型面积的大小来表示统计指标数值大小的图形。它可用于各指标数值的比较,也可以圆形面积作为总体,而以圆形内各扇形面积代表总体结构比重,说明总体内部结构和总体内部结构的发展变化。6970

(四)曲线图曲线图也称线图,它是以线条的连续升降表示统计指标数值大小以及变动趋势的图形。曲线图的用途很广,主要用于显示现象在时间上的发展变动、研究现象的分配情况和分析现象之间的依存关系等。7172第四节统计汇总

按照既定方案对数据进行汇总整理所采用的技术手段划记法过录法电子计算机汇总(最常用的方法)73重新列出某市居民户总体的下列资料:74【问题】有一户居民的调查结果如下:职业类别——白领文化程度——大学拥有住宅面积——140平方米是否“双气”齐全——是家庭人口——2人怎样把这些数据输入电子计算机?怎样用Excel工具对全体居民户的调查结果进行汇总整理,完成前面所设计的分组表?75(1)制订品质型标志的标准分类及代码

是否双气齐全职业类别文化程度是1白领1大学及以上1否0蓝领2高中2初中3小学及以下476(2)依据上述标准分类及代码对每一户居民的调查结果进行编码后,把全体居民的调查数据逐户输入Excel工作表7778(3)依照事先的分组设计对数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论