统计基础项目化教程第三章统计整理_第1页
统计基础项目化教程第三章统计整理_第2页
统计基础项目化教程第三章统计整理_第3页
统计基础项目化教程第三章统计整理_第4页
统计基础项目化教程第三章统计整理_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计整理第一节统计整理的意义一、

统计整理的意义1、概念:根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化,系统化的工作过程,就是统计整理。实质:去粗取精、去伪存真、由此及彼、由表及里。2023/2/51扬州大学管理学院2、意义:

统计整理在整个统计研究中占有重要的地位。统计整理包括对原始资料和次级资料的整理。统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中发挥着承上启下的作用。2023/2/52扬州大学管理学院二、统计整理的步骤1、对统计调查资料进行审核2、编制统计汇总方案3、根据统计汇总方案,进行实际汇总工作,并进行有关计算4、再一次进行审核5、编制统计图表2023/2/53扬州大学管理学院第二节统计分组

一、统计分组的意义1、概念:

根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同而又有联系的几个部分,称为统计分组。

把统计总体的各个单位按照一个或几个标志划分为若干部分,使同一性质的单位集中起来即“组(合)”,不同性质的单位区分开来即“分”,以便形成“组内同质性,组间差别性”的分组效果。2023/2/54扬州大学管理学院2、意义

(1)区分社会经济现象的类型

亦称类型分组。由于社会经济现象的复杂性,客观上存在着各种不同的社会类型,利用统计分组,就能根据统计研究的目的,将现象区分为各种性质不同的类型,来研究各类现象的数量差异和特征以及相互关系。例如(下表)2023/2/55扬州大学管理学院企业经济类型(品质标志)资金利润率%(被分组指标)国有集体其他5.24.87.6全市工业5.6某地区工业资金利润率的类型差别情况从上表可以看出,其他所有制的工业企业指标最好。国有企业次之,集体企业最差。2023/2/56扬州大学管理学院(2)反映经济现象的内部结构亦称结构分组。现象内部的结构,表明现象内部的组成状况和比率关系。利用统计分组,计算出各组数值在总体中所占的比重,对其进行内部结构研究,来说明现象的基本性质和特征。同时,对现象内部结构的变化进行动态研究,还可以反映总体现象发展变化的过程、趋势和规律。2023/2/57扬州大学管理学院企业经济类型(分组标志)产值(亿元)(被分组指标)国有集体其他754029全市工业144某地区工业企业经济类型产值结构情况反映了该市工业企业经济类型的产值结构状况2023/2/58扬州大学管理学院(3)揭示经济现象的相互依存关系亦称分析分组。社会经济现象之间都存在着不同程度的相互联系、相互制约的依存关系。利用统计分组,可以从数量上揭示出现象之间的这种依存关系。即分析现象中的影响因素和被影响因素,结合分组,来观察影响因素对被影响因素作用的程度和方向。2023/2/59扬州大学管理学院商店按销售额分组(万元)商店数(个)商品流通费用率(%)100以下100—300300—500500—700700—900900以上1012119869.88.77.56.55.85.4

从表中可以看出,随着商品销售规模的扩大,其流通费率在相应降低,两者表现出负依存关系。2023/2/510扬州大学管理学院

二、

统计分组的方法

统计分组的关键在于选择分组标志和确定各组的界限。1、分组标志的选择:

分组标志,即将同质总体区分为不同组的标准或依据。分组标志的选择是统计分组的关键。分组标志一旦选定,就必然突出了总体在该标志下的性质差别,其他的差别看不见了。分组标志选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质,歪曲社会经济的真实情况。2023/2/511扬州大学管理学院

正确选择分组标志的要求:(1)必须根据统计研究的任务及其目的来选择分组标志;(2)必须选择最能反映现象本质区别和内在联系的标志作为分组标志;(3)必须结合现象所处的具体历史条件和经济条件动态地选择分组标志。2023/2/512扬州大学管理学院2、正确确定各组的界限分组标志确定后,就可以进一步在分组标志的变异范围内,具体划分各组的界限。分组标志按其形式的不同,可分为品质标志和数量标志。统计总体可按品质标志分组,也可按数量标志分组。2023/2/513扬州大学管理学院(1)

选择

品质标志分组的方法按品质标志分组即选择反映事物属性差异的品质标志作为分组标志进行分组,当分组标志一旦确定,组名称和组数就确定,不存在组与组之间的界限区分的困难。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。2023/2/514扬州大学管理学院按数量标志分组,其变量有两种类型:离散型变量和连续型变量。离散变量指所描述对象的数量特征可以按一定次序一一列举它的数值;连续变量指所描述的数量特征在一个区间里可以有无限个数值,无法一一列举。根据这两种变量的不同特征,在分组时,对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如居民家庭按儿童数或人口数分组,均可采用单项式分组。(2)选择数量标志分组的方法2023/2/515扬州大学管理学院2023/2/516扬州大学管理学院离散变量如果变量值变动幅度很大,变量值个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定应归并的区间,区间的距离称为组距,这样的分组称为组距式分组。就是说,离散变量根据情况既可用单项式分组,也可用组距式分组。在组距式分组中,相邻组既可以有确定的上下限,也可将相邻组的组限重叠。连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。2023/2/517扬州大学管理学院年龄人数0—2303—6877—1614117—2524826—4047341—60415>6098合计14922023/2/518扬州大学管理学院3、统计分组的种类:

按分组标志的性质分为品质分组和变量分组。(如前面所讲)按分组标志的多少分为简单分组和复合分组。简单分组:只选择一个分组标志进行的分组;复合分组:选择多个分组标志进行的分组,并且层叠在一起。2023/2/519扬州大学管理学院4、统计分组体系:统计分组后所形成的一系列互相联系、互相补充的组的整体称分组体系。分组体系有平行分组体系和复合分组体系两种。平行分组体系是选择两个或两个以上的标志对总体进行一次次简单分组后所形成的体系;复合分组体系就是选择多个分组标志层迭起来的分组形成的体系。2023/2/520扬州大学管理学院平行分组体系:

选择多个分组标志进行多次的简单分组。所有制规模行业工业企业国有及国有控股集体企业股份制企业┅┅大型企业中型企业小型企业机械电子化工冶金2023/2/521扬州大学管理学院复合分组体系:

选择多个分组标志层叠起来进行的分组工业企业国有及国有控股集体企业股份制企业┅┅所有制规模行业大型企业中型企业小型企业机械电子化工冶金┅┅2023/2/522扬州大学管理学院1、按经济类型的划分:可分为:内资:国有、集体、股份合作、联营、有限责任、股份有限、私营、个体、其他内资;港澳台商投资;外商投资等经济类型。2、按三次产业的划分:第一产业:农业;第二产业:工业;第三产业:第一层次:流通部门;第二层次:为生产、生活服务的部门;第三层次:为提高科学文化水平和居民素质服务的部门;第四层次:社会公共服务的部门统计工作中常用的分组(类):2023/2/523扬州大学管理学院3、国民经济行业或部门分类:共16个门类,再依次分为92个大类、368个中类和846个小类,形成四级分类:1)农林牧渔2)采掘业3)制造业4)电力、煤气及自来水业5)建筑业6)地质勘查、水利管理业7)交通运输、仓储及邮电通信业8)批发和零售贸易)餐饮业9)金融、保险业10)房地产业11)社会服务业12)卫生、体育和社会福利业13)教育、文艺及广播电影电视业14)科学研究和综合技术服务业15)国家、政党机关和社会团体16)其他行业2023/2/524扬州大学管理学院4、按机构部门的分类:(1)非金融企业部门;(2)金融企业部门;(3)政府部门;(4)居民住户。其他分类如两大生产部类的划分、两大生产领域的划分、大中小型企业的划分、职业的划分等,在此不一一讲述。2023/2/525扬州大学管理学院第三节分配数列

一、分配数列的概念和种类

1、概念:在统计分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为分配数列。分配数列包括两个要素:总体按某标志所分的组和各组所占有的单位数。

2023/2/526扬州大学管理学院2、分配数列的种类:

根据分组标志的不同,分配数列可以分为品质分配数列和变量分配数列。变量分配数列又有单项式数列和组距式数列之分,与变量分组分为单项式分组和组距式分组是一致的。组距式分组又可分为等距分组与不等距(异距)分组。2023/2/527扬州大学管理学院变量数列离散型单项式组距式等距不等距连续型组距式等距不等距品质数列分配数列2023/2/528扬州大学管理学院二、变量数列的编制

①将原始资料按其数值大小重新排列

只有把得到的原始资料按其数值大小重新排列顺序,才能看出变量分布的集中趋势和特点,为确定全距、组距和组数作准备。

②确定全距

全距是变量值中最大值和最小值的差数。确定全距,主要是确定变量值的变动范围和变动幅度。如果是变动幅度不大的离散变量,可以编制单项式变量数列,如果是变量幅度较大的离散变量或者是连续变量,就要编制组距式变量数列。2023/2/529扬州大学管理学院

③确定组距和组数

组距数列有等距和不等距之分,应视研究对象的特点和目的而定。组距的大小和组数的多少,是互为条件和互相制约的。当全距一定时,组距大,组数就少;组距小,组数就多。

在实际应用中,组距应是整数,最好是5或10的整倍数。在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组距的同质性,尤其是对带有根本性的质量界限,绝不能混淆,否则就失去分组的意义。在等距分组条例下,存在以下关系:组数=全距/组距2023/2/530扬州大学管理学院

④确定组限

组限要根据变量的性质来确定。如果变量值相对集中,无特大或特小的极端数值时,则采用闭口式,使最小组和最大组也都有下限和上限;反之,如果变量值相对比较分散,则采用开口式,使最小组只有上限(用“XX以下”表示),最大组只有下限(用“XX以上”表示)。在采用闭口式时,应做到最小组的下限低于最小变量值,最大组的上限高于最大变量值,但不要过于悬殊。2023/2/531扬州大学管理学院⑤编制变量数列

经过统计分组,明确了全距、组距、组数和组限以后,就可以把变量值归类排列,最后把各组单位数经综合后填入相应的各组次数栏中。

2023/2/532扬州大学管理学院例某地区80户居民消费支出情况单位:元2023/2/533扬州大学管理学院组距=该组的上限-该组的下限斯特奇斯的经验公式(H.A.Sturges)开口组组限的确定:向下开口组下限为该组上限减去相邻组组距;向上开口组上限为该组下限加上相邻组组距。2023/2/534扬州大学管理学院频率的性质:2023/2/535扬州大学管理学院2023/2/536扬州大学管理学院802023/2/537扬州大学管理学院三、次数分布的主要类型:1、各种不同性质的社会现象的次数分布主要有四种类型:钟型分布:两头小、中间大,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。向左偏态向右偏态2023/2/538扬州大学管理学院正J型图反J型图U型分布:两头大、中间小,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多2023/2/539扬州大学管理学院洛伦茨分布(M.Lorenz)

洛伦茨分布曲线是专门用以鉴定社会收入分配的平等程度。收100入累计A百B分0100数家庭累计百分数2023/2/540扬州大学管理学院20世纪初意大利经济学家基尼(C.Gini)根据洛伦茨曲线找出了判断分配平等程度的指标。设实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B。并以A除以A+B的商表示不平等程度。这个数值被称为基尼系数或称洛伦茨系数。2023/2/541扬州大学管理学院如果A为零,基尼系数为零,表示收入分配完全平等;如果B为零则系数为1,收入分配绝对不平等。该系数可在零和1之间取任何值。收入分配越是趋向平等,洛伦茨曲线的弧度越小,基尼系数也越小,反之,收入分配越是趋向不平等,洛伦茨曲线的弧度越大,那么基尼系数也越大。如果个人所得税能使收入均等化,那么,基尼系数即会变小。联合国有关组织规定:若低于0.2表示收入绝对平均;0.2-0.3表示比较平均;0.3-0.4表示相对合理;0.4-0.5表示收入差距较大;0.6以上表示收入差距悬殊。2023/2/542扬州大学管理学院第四节统计表一、统计表的结构把汇总结果的资料按一定的规则在表格上表现出来,这种表格叫统计表。(广义上,任何用以反映统计资料的表格都是统计表)统计表和统计图都是系统地表述数字资料的基本形式统计表的构成:1、从外表形式上看:总标题、横行标题、纵栏标题、数字资料2、从内容上看:主词(列在表的左方)宾词(列在表的右方)2023/2/543扬州大学管理学院二、统计表的种类1、按主次的结构,即主词是否分组和分组的程度,分为简单表、分组表和复合表简单表是主词未经任何分组的统计表分组表是主词按某一标志进行分组的统计表,分组表用来揭示现象不同类型的不同特征,研究总体的内部构成,分析现象之间的依存关系。复合表是主词按两个或两个以上标志进行复合分组的统计表。三、宾词指标的分组配置1、平行配置:指宾词栏中各分组标志彼此分开,各标志的分组指标做平行排列。2、层叠配置:指将各分组标志层叠在一起,使各标志的分组指标有较大的增多。2023/2/544扬州大学管理学院四、统计表的编制原则1、统计表的各种标题,特别是总标题的表达,应该十分简明确切,概括地反映出表的基本内容。2、表的主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各个项目,后列总计。3、如果统计表的栏数较多,通常要编号。4、表中数字应该填写整齐,对准位数。5、统计表中必须注明数字资料的计量单位。6、必要时,统计表应加注说明或解释。7、表格形式为有上下端线,左右开口式。2023/2/545扬州大学管理学院例:某企业工人日产量资料如下(单位:件)要求:1、指出上述变量数列属于哪一种变量数列?这个数列说明什么问题?2、指出统计表中的变量、变量值、上限、下限、次数、频率、总体单位总数3、计算组距和各组组中值日产量分组工人数日产量分组工人数60以下690

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论