统计数据的整理和显示(new)_第1页
统计数据的整理和显示(new)_第2页
统计数据的整理和显示(new)_第3页
统计数据的整理和显示(new)_第4页
统计数据的整理和显示(new)_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章统计数据的整理和显示统计数据的整理和显示(new)共73页,您现在浏览的是第1页!节统计数据整理概述第二节统计数据分组第三节频数分布第四节数据的显示本章主要内容统计数据的整理和显示(new)共73页,您现在浏览的是第2页!节统计数据整理概述一、统计整理及其类型

统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是种整理。统计数据的整理和显示(new)共73页,您现在浏览的是第3页!

统计整理的意义:

1、统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。统计整理是统计调查的继续,又是统计分析的基础。

2、统计整理还是积累历史资料的必要手段。统计数据的整理和显示(new)共73页,您现在浏览的是第4页!统计资料整理的步骤步,设计和制定统计整理方案。它是对资料整理工作的各个方面各步骤做出具体的安排与规定。第二步,对原始资料进行审核。审核被调查单位的资料是否全部收齐,填报是否缺漏与差错,发现问题,及时解决,以保证资料汇总计算能顺利进行。第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。第五步,对统计资料妥善保存,系统积累。

三、统计整理的步骤统计数据的整理和显示(new)共73页,您现在浏览的是第5页!2.审核资料的正确性:审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有两种:(1)逻辑检查首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。其次,是检查各项目之间有无相互矛盾的地方。统计数据的整理和显示(new)共73页,您现在浏览的是第6页!3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。统计数据的整理和显示(new)共73页,您现在浏览的是第7页!(3)如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。(4)对于严重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。统计数据的整理和显示(new)共73页,您现在浏览的是第8页!二、统计分组的原则(1)穷尽性原则(2)互斥性原则。统计数据的整理和显示(new)共73页,您现在浏览的是第9页!1997年社会固定资产投资分布情况资料来源:《1997年国民经济和社会发展统计公报》,国家统计局按投资主体性质分组投资额(亿元)比重(%)国有经济集体经济城乡居民个人其他1341938733427458153.015.313.618.1合计25300100.0统计数据的整理和显示(new)共73页,您现在浏览的是第10页!例如:按照地理位置不同将我国划分为东部、中部和西部三个地区,可以观察东、中、西三个不同地区经济发展水平和经济资源的差异,以及它们在整个国民经济中所处的不同地位;对人口按照文化程度分组,计算大学及大学以上、大学肄业及在校、高中、初中、小学、不识字或识字很少各组人口所占的比重,就能反映社会人口的文化素质构成情况。如果将不同时期的同一总体的结构相互比较,还可以揭示出总体现象的发展变化规律。统计数据的整理和显示(new)共73页,您现在浏览的是第11页!从表中可以看出,我国1998—2002年,GDP年均增长7.7%,其中产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长8.9%和8.0%。反映在结构中,产业比重下降,二、三产业比重上升。其中产业比重从1997年的19.1%下降到2002年的14.5%,下降了4.6个百分点;第二产业从50%提高到51.8%,上升了1.8个百分点;第三产业从30.9%提高到33.7%,上升了2.8个百分点。它反映着我国产业结构的变化发展过程。统计数据的整理和显示(new)共73页,您现在浏览的是第12页!例如:

将商品流通企业按照流转额分组,可以观察商品流通企业的规模与商品流转费用率之间的关系;将农作物播种面积按施肥量分组,用以观察农作物单产与施肥量之间的关系;将人口按人均收入分组,以观察收入与储蓄之间的关系等等。统计数据的整理和显示(new)共73页,您现在浏览的是第13页!简单分组:对研究现象按一个标志进行分组。复合分组:用两个或两个以上标志对研究现象进行分组。统计数据的整理和显示(new)共73页,您现在浏览的是第14页!五、统计分组的方法

统计分组的关键问题是正确地选择分组标志与划分各组界限。前者主要是指品质标志分组,后者主要是指数量标志分组。(一)分组标志选择的原则要选择能够反映事物本质或主要特征的标志应根据研究的目的与任务选择分组标志根据现象所处的历史条件的变化选择分组标志(二)统计分组的方法按品质标志分组按数量标志分组统计数据的整理和显示(new)共73页,您现在浏览的是第15页!单项式分组与组距式分组单项式分组就是用一个变量值作为一组,形成单项式变量数列。例如,育龄妇女按其生育子女存活数分组,可分为0个、1个、2个、3个、4个、5个等6组。一般适用于离散型变量且变量变动范围不大的场合。组距式分组就是将变量依次划分为几段区间,一段区间表现为”从…

到…

…“距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。例如,反映居民居住水平情况按人均居住面积分组分为:4平方米以下,4~6平方米,6~8平方米,8平方米以上等4组。适用于连续型变量或者变动范围较大的离散型变量。统计数据的整理和显示(new)共73页,您现在浏览的是第16页!“上限不在内”原则变量值只是在整数之间变动的离散型变量,可采用间断式组距分组,也可采用连续组距式分组。如果变量值在一定范围内的表现即可以是整数,也可以是小数等连续型变量,只能采用连续组距式分组。统计数据的整理和显示(new)共73页,您现在浏览的是第17页!六、统计分组体系简单分组与平行分组体系将社会经济总体只选择一个标志分组称为简单分组。对同一总体选择两个或两个以上的标志分别进行简单分组,排列起来,即成为平行分组体系。按年龄分组按文化程度分组20及20岁以下大专及大专以上21~35岁中专、技工36~50岁高中51~55岁初中56~60岁小学、识字不多、文盲统计数据的整理和显示(new)共73页,您现在浏览的是第18页!如果多个复合分组组成的体系就形成了复合分组体系。例如同时选择学科、本科或专科、性别三个标志进行复合分组.理科学生本科学生男学生女学生专科学生男学生女学生文科学生本科学生男学生女学生专科学生男学生女学生统计数据的整理和显示(new)共73页,您现在浏览的是第19页!(二)组数

全距是总体中最大的标志值与最小的标志值之差。组数的多少直接取决于两个因素,一个是总体的全距,另一个是组距。在等距分组的条件下,组数等于全距除以组距。在组距既定的条件下,全距大则组数多,全距小则组数少;在全距既定的条件下,组距大则组数少,组距小则组数多。美国学者斯特杰斯创造了斯特杰斯经验公式:统计数据的整理和显示(new)共73页,您现在浏览的是第20页!第三节分配数列一、分配数列的概念与种类二、分配数列的编制方法三、次数分布的类型统计数据的整理和显示(new)共73页,您现在浏览的是第21页!(二)频数分布的两个要素1.组别:总体按某标志所分的组2.频数(次数)和频率:各组的单位数叫频数,各组的单位数与总体单位总数之比叫频率。频率具有如下两个性质:(1)各组频率都是界于0和1之间的一个分数。即:统计数据的整理和显示(new)共73页,您现在浏览的是第22页!(三)频数分布的种类统计数据的整理和显示(new)共73页,您现在浏览的是第23页!二、变量数列的编制方法举例说明:某工厂生产车间30人工人日产量原始数据如下:

20212124232220212223

24202421222223242221

22232221212222232223统计数据的整理和显示(new)共73页,您现在浏览的是第24页!组距变量数列的编制[例1]对某企业30个工人完成劳动定额的情况进行调查,某原始资料如下(%)

98819584938691102100103105100104108107108106109112114109117125115120119118116129113步:计算全距。(将各变量值由小到大排序,确定某最大值,最小值,并计算全距。)

81848691939598100100102103104105106107108108109109112113114115116117118119120125129统计数据的整理和显示(new)共73页,您现在浏览的是第25页!

本例中的数据为劳动定额的完成情况,属于工作成绩的评定。根据一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以先确定组数为5。在等距分组时,计算组距如下:为了符合习惯和计算方便,组距近似地取10%。第三步:确定组限,最小组的下限(起点值)应低于最小变量值,最大组的上限(终点值)应高于最大变量值。第二,组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化。第三,为了方便计算组限应尽可能取整数,最好是5或10的整倍数。第四,由于变量有连续型变量和离散型变量两种,其组限的确定方法是不同的。统计数据的整理和显示(new)共73页,您现在浏览的是第26页!从此表可以看到,30名工人中,劳动定额完成主要集中在100%—120%之间,占66.7%,在变量数列中标志值构成的数列表示标志值的变动幅度,而频数构成的数列则表示相对的作用程度。频数愈大则组的标志值对于全体标志水平所起的作用也愈大;反之,频数愈小则各组标志值所起的作用也愈小。因此,在整理和分析的时候,我们不但要注意各组标志值的变动范围,而且,也要注意各组标志的作用大小,即频数的大小。将各组单位数和总体单位数相比既可以表明各组标志值对总体的相对作用程度,也可以表明各组标志,也可以表明各组标志值出现的频率的大小。统计数据的整理和显示(new)共73页,您现在浏览的是第27页!根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)和向下累计频数(频率)分布如表。劳动定额完成情况(%)频数(人)频率(%)向上累计向下累计频数(人)频率(%)频数(人)频率(%)80~9090~100100~110110~120120013.340.026.710.03719273010.023.363.390.0100.0302723113100.090.076.736.710.0合计3010.0————统计数据的整理和显示(new)共73页,您现在浏览的是第28页!四、频数分布的类型(一)钟型分布钟型分布的特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,其曲线图宛如一口钟,如下图所示。统计数据的整理和显示(new)共73页,您现在浏览的是第29页!

(a)正态分布(b)偏态分布正偏(右偏)负偏(左偏)统计数据的整理和显示(new)共73页,您现在浏览的是第30页!J型分布

J型分布有两种类型,一种是次数随着变量的增大而增多,如投资按利润率大小分布。另一种呈反J型分布,即次数随着变量增大而减少,如随着产品产量的增加,产品单位成本下降。如下图(c)统计数据的整理和显示(new)共73页,您现在浏览的是第31页!(c)J形分布正J形反J形(d)U形分布统计数据的整理和显示(new)共73页,您现在浏览的是第32页!统计表的结构,从外表形式上看,是由四部分构成

总标题表的名称,用于概括统计表中要说明的内容。横行标题各组的名称,反映总体各组成部分的。纵栏标题分组标志或指标的名称,说明纵行所列各项资料的内容。指标数值统计表的具体内容,每一项数值由相应的横行标题和纵栏标题限定,可以是总体单位数,也可以是标志总量,或者平均数、相对数等,也称数字资料。统计数据的整理和显示(new)共73页,您现在浏览的是第33页!统计表的种类

简单表主词未经过任何分组,反映出总体各单位的名称或按时间顺序简单排列,或同时反映以上内容的统计表。分组表主词按照一定标志分组的统计表,也称简单分组表。复合表主词按照两个或两个以上的标志层叠分组所形成的统计表。统计数据的整理和显示(new)共73页,您现在浏览的是第34页!4、统计表的上下两端用粗线或双线绘制,在有些需要明显分隔的部分也应用粗线或双线,其他则用细线。在横行和合计栏、横行与纵栏标题间要划线。表的左右两端应是开口的,不得划线。5、统计表中如果栏目较多,可以加以编号:一般主词的计量单位栏用(甲)、(乙)、(丙)……等次序编号,宾词各栏用(1)、(2)、(3)………等次序编号。若各栏中统计指标有一定的计算关系,还可以用算式表示之。6、统计表中的数字要注明计量单位。如果表中的数字属同一计量单位,可将计量单位标在表的右上方;如果宾词的计量单位不同,可直接标注在指标名称的旁边或下方;如果主词的计量单位不同,可在横行标题后设计量单位专栏。统计数据的整理和显示(new)共73页,您现在浏览的是第35页!统计图(一)统计图的概念统计图是以图形形象地表现统计资料的一种形式。用统计图表现统计资料,具有鲜明醒目,富于表现,易于理解的特点,因而绘制统计图是统计整理的重要内容之一。统计图可以揭示现象的内部结构和依存关系,显示现象的发展趋势和分布状况,有利于进行统计分析与研究。统计数据的整理和显示(new)共73页,您现在浏览的是第36页!2、面积图面积图是以几何图形的面积表示统计指标数值大小的一种图形。它可以用来比较同类指标的大小,说明总体结构。常用的有正方形图和圆形图两种。图3—5某企业职工人数增长情况400人1997年1600人2002年1992年100人统计数据的整理和显示(new)共73页,您现在浏览的是第37页!3、直方图、散点图、时间序列图某车间计划完成情况曲线图

统计数据的整理和显示(new)共73页,您现在浏览的是第38页!二、统计整理的内容审核分组汇总编制统计图表统计数据的整理和显示(new)共73页,您现在浏览的是第39页!四、数据的预处理(一)数据的审核1.审核资料的完整性和及时性审核资料的完整性,就是看调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。审核资料的及时性,是看填报单位是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。统计数据的整理和显示(new)共73页,您现在浏览的是第40页!(2)计算检查即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。统计数据的整理和显示(new)共73页,您现在浏览的是第41页!(二)资料审核后的订正通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况作如下处理:(1)对于可以肯定的一般错误,应及时代为更正,并通知原报单位。(2)对于可疑之数或无法代为更正的错误,应要求原单位复查更正。统计数据的整理和显示(new)共73页,您现在浏览的是第42页!第二节统计数据的分组一、统计分组的概念

统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。

统计数据的整理和显示(new)共73页,您现在浏览的是第43页!三、统计分组的作用统计分组的主要作用具体表现在以下几个方面。(一)区分现象的不同类型各种现象千差万别,多种多样,并在其发展中表现出不同的性质和特征。通过统计分组,就可以将不同类型现象的性质和特征区分开来,并且经过比较和研究,揭示其发展变化的规律,达到深刻认识总体的目的。统计数据的整理和显示(new)共73页,您现在浏览的是第44页!(二)研究总体的内部结构

按照某种标志将总体划分为若干个不同的组,可以计算出各组数值在总体中所占的比重,或各组之间的比例关系,从而反映出总体的结构状况,加深对现象总体的认识。统计数据的整理和显示(new)共73页,您现在浏览的是第45页!

三次产业增加值结构变化资料来源:《中国统计年鉴》《2003年中国发展报告》,国家统计局2003年版,中国统计出版社。统计数据的整理和显示(new)共73页,您现在浏览的是第46页!(三)分析现象间的依存关系

一切事物都是普遍联系、相互依存的。一种现象的表现,既是它与其他现象相互作用的结果,也会对其他现象的表现产生一定的影响。通过统计分组,可以反映出现象之间的这种依存关系。统计数据的整理和显示(new)共73页,您现在浏览的是第47页!四、分组的种类统计数据的整理和显示(new)共73页,您现在浏览的是第48页!统计数据的整理和显示(new)共73页,您现在浏览的是第49页!1、品质分组的方法例如,人口按性别分为男女两组;高校学生按学科分为文理科两类。2、数量分组的方法分组需要注意的问题:(1)分组时各组数量界限的确定必须能反映事物质的差别;(2)应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。统计数据的整理和显示(new)共73页,您现在浏览的是第50页!间断组距式分组和连续组距式分组凡是组限不相连的分组,称为间断组距式分组。例如,儿童按年龄分组分为:未满1岁,1~2岁,3~4岁,5~9岁,10~14岁。凡是组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限,称为连续组距式分组。例如,工人按工时定额完成程度分组为90~100%,100~110%,110~120%等组。介绍上限、下限、组距、组限。组距式变量数列中,每组区间两端的极值称组限。每一组的两个组限中,较大者叫上限,较小者叫下限。如果各组的组限都齐全,成为闭口组;组限不齐全,即最小组缺下限或最大组缺上限,称为开口组。统计数据的整理和显示(new)共73页,您现在浏览的是第51页!等距分组与异距分组等距分组就是标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。凡是标志值变动比较均匀的情况下,都可采用等距分组。例如,工人的年龄,工龄、工资的分组等。凡是标志值在各组的组距不相等的,称为异距分组。适用范围:①标志值分布很不均匀的场合;②标志值相等的量具有不同意义的场合;例如,生命的每一个月对于新生婴儿和对于成年人是大不一样的。年龄分组:1岁以下按月分组,1~10岁按年分组,11~20岁按5年分组,21岁以上按10年或20年分组等。③标志值按一定比例发展变化的场合。例如,大城市的百货商店营业额差别:从5万到5千万,可采取公比为10的不等距分组:5~50万,50~500万,500~5000万。统计数据的整理和显示(new)共73页,您现在浏览的是第52页!复合分组与复合分组体系复合分组是用两个或两个以上分组标志重叠起来对总体进行的分组。例如统计数据的整理和显示(new)共73页,您现在浏览的是第53页!(一)组距

组距是各组上下限之间的距离,即各组最大标志值与最小标志值之差。在连续组距分组中:组距=上限-下限在间断组距式分组中:组距=本组上限-前组上限(或=本组下限-前组下限或=本组上限-本组下限+1)例如,商店规模按职工人数分组,分为:1~5人,6~10人,11~15人,等等。七、组距、组数与组中值的计算统计数据的整理和显示(new)共73页,您现在浏览的是第54页!(三)组中值组中值:各组中点位置所对应的变量值。其计算公式为:组中值=(适用所有闭口组)

或=(适用上开口组)或=(适用下开口组)统计数据的整理和显示(new)共73页,您现在浏览的是第55页!一、频数分布(一)频数分布在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算各组的单位数称为频数分布,或次数分布。统计数据的整理和显示(new)共73页,您现在浏览的是第56页!(2)各组频率之和等于1。即统计数据的整理和显示(new)共73页,您现在浏览的是第57页!1.品质频数分布:简称为品质数列,它是经过属性分组后形成的频数分布,其组别表现为一系列的概念或范畴。2.变量频数分布:简称为变量数列,它是经过变量分组后形成的分布数列,其组别表现为不同的数值或数域。⑴单项数列:是以一个变量值为一组编制的变量频数分布。⑵组距数列:是以表示一定变动范围的两个变量值构成的组所编制的变量频数分布。统计数据的整理和显示(new)共73页,您现在浏览的是第58页!单项式变量数列,可以直接将每一变量值作为一组,汇总计算各组相应的单位数(次数),并采用表格形式列示即可,例如下表

某工厂生产车间工人按日产量分布(各组变量值)(次数)(频率)日产量工人数比率(%)202122232437106410.023.333.320.113.3合计30100.0统计数据的整理和显示(new)共73页,您现在浏览的是第59页!

变量的最大值是129%最小值是81%

全距=最大值-最小值=129%-81%=48%第二步:确定组数和组距 组距和组数的确定没有顺序规定,即可以先根据数据的变化特征确定组数,也可以在事先对研究对象的性质比较了解的情况下,先确定组数,然后确定组距,但组数必须是整数。

在等距分组时,组距与组数的关系是:

统计数据的整理和显示(new)共73页,您现在浏览的是第60页!第四步:编制频数(频率)分布表。计算本例中各组的频数(工人数)和频率,编制某企业30个工人劳动定额完成情况的分布表:

某企业30个工人劳动定额完成情况分布图表劳动定额完成程度(%)频数(人)频数(%)80—9090—100100—110110—120120013.340.026.710.0合计30100.0统计数据的整理和显示(new)共73页,您现在浏览的是第61页!第五步:计算累计频数和累计频率为了更详细的认识变量的分布特征,还可以计算累计频数和累计频率,编制累计频数和累计频率数列。累计频数和累计频率有向上累计频数(频率)和向下累计频数(频率)两种。向上累计数的意义是:小于各组的该组上限的各组的频数或频率之和;相反,由变量值大的组向变量值小的组累计各组的频数或频率,称为向下累计频数或向下累计频数。向下累计数的意义是:大于及等于该组下限的各组的频数或频数或频率之和。统计数据的整理和显示(new)共73页,您现在浏览的是第62页!三、次数分布的主要类型图3—1图3—2次数分布的主要类型钟形分布

J形分布

U形分布正J形分布

反J形分布

统计数据的整理和显示(new)共73页,您现在浏览的是第63页!1.钟型分布钟形分布是社会经济现象中最常见的分布形式,具体表现为中间隆起,两侧逐渐降低。钟形分布表明数据具有集中的趋势,大多数数据集中在中间,越往两端,数据越少。在远离中心的位置,只有极少数的数据。钟形分布的中间隆起部分称为峰,两侧称为尾。统计数据的整理和显示(new)共73页,您现在浏览的是第64页!

如图(a)所示,其分布特征是以标志变量中心为对称轴,左右两侧对称,两侧变量值分布的次数随着与中间变量值距离的增大而渐次减少。在统计学中,称这种分布为对称分布。而图(b)为非对称分布,它们各有不同方向的偏态,即左偏态分布和右偏态分布。客观实际中,许多社会现象统计总体的分布都趋于对称分布中的正态分布。正态分布是描述统计中的一种主要分布,它在社会经济统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论