统原PP第三章统计整理_第1页
统原PP第三章统计整理_第2页
统原PP第三章统计整理_第3页
统原PP第三章统计整理_第4页
统原PP第三章统计整理_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第三章第三章 统计整理统计整理第一节第一节 统计整理的概念和作用统计整理的概念和作用 一、统计整理的概念一、统计整理的概念统计整理 指根据统计研究的目的,将所搜集到的大量原始资料用 科学的方法进行分组汇总,使之系统化、条理化,成为 能够反映事物总体特征的综合资料的过程。统计整理一 般指初级资料整理,广义的统计整理也包括次级资料的 再整理。手工整理 统计整理一般是为了某项统计研究或统计任务的特定目 的而进行的;由于受计算手段的限制,统计整理的主要 内容是汇总、分组、再加工,整理后的资料主要存储在 纸介质上,然后按既定的目的使用。计算机整理 可以通过建立数据库把这些宝贵的资料加以有序的排 列,储

2、存在磁介质上,然后可以根据多方面、多层次随 时发生的需要,多次使用于不同的目的,从而实现统计 数据的一源多用,信息共享。2使用电子计算机进行统计整理,不仅可以加快计算速度,扩大计算规模,提高计算准确性,而且可以大大增加统计信息的利用率。下面示意图显示计算机整理与手工整理获得信息量的比较。在电子计算机整理条件下,统计整理的概念可以概括如下:统计整理 指根据研究的需要,将统计调查所得的原始资料或已加 工的综合资料进行科学的处理和管理,包括对统计资料 的分组、汇总、加工、传输、存储、更新,使之系统化 条理化,反映事物的总体特征,并在建立数据库的基础 上达到一源多用。3二、统计整理的作用二、统计整理的

3、作用(意义意义)1统计整理是承前启后的环节 统计调查搜集到的统计资料是个 别的、分散的,不能反映总体的综合数量特征,达不 到认识社会经济现象总体的目的。因此在统计调查之 后,统计分析之前,需要把原始资料系统化、条理化, 使其能够反映事物总体特征。2统计整理是认识过程中的一个重要阶段 从认识过程来看,社 会经济统计是一种从个体的实际表现到总体的综合数 量表现的认识过程,也是从对现象的感性认识到对现 象的规律性认识。3统计整理是统计分析的基础工作 统计整理的目的,是为统计 分析准备系统化、条理化的综合资料。统计分析是要 找出事物数量关系的规律性,得到对社会经济现象的 系统的、深刻的认识。统计整理可

4、以从原始数据中获 得大量新的信息,以满足统计分析的需要。4三、统计整理的内容三、统计整理的内容 (一)统计数据处理1.分组 统计分组的目的在于将同质总体中具有不同特点的单位按 一定标准区分为几个不同的类型,从而更深入地研究总体 的特征,这是完成从个体数据向总体数据转化的关键一步。2.汇总 确定统计分组后,还需要将原始数据按分组标志进行综合,这一过程称为统计汇总,在不需要分组时,统计汇总是指 直接对各调查单位的数据进行综合的过程。汇总的结果为 各种总量指标,包括标志总量和总体总量。3.制表 统计资料经过分组、汇总形成了说明总体情况的统计资料 这些资料还需要用一定的形式来表现,统计表是最常用的 表

5、现形式。统计表能有条理地排列统计资料,科学地组织 统计资料、系统地积累统计资料,使人们在利用统计资料 进行分析对比、研究和了解情况时十分方便。5(二)统计数据管理1.传输 传输是指统计数据在不同单位之间的传递、输送。统计数据 传输经历过人工护送、邮寄报表、电话、传真和寄送软盘、 磁带等几种方式,现在用计算机联网、远程通讯传输。2.存储 存储是指如何保存统计数据。传统的保存数据方式是存储在 纸介质上,或者报表、或者资料本,这使得查阅资料很麻烦 新的存储方式主要存放在磁介质或微缩胶片上。统计数据库 的建立,是统计资料的存储和管理的核心,也是统计数据 源多用的关键。3.更新 由于统计信息具有一定的时

6、效性,反映一定内容的统计资料 在段时间以后就会失效,这就要不断补充新的统计资料, 代替己失效的资料,这就是统计资料的更新。4.输出 输出是指统计资料整理结果的表达。数据处理阶段的制表是 一种输出方式,还可以以计算机屏幕显示、打印数字、制图 等不同的方式输出。6第二节第二节 统计整理的组织与技术统计整理的组织与技术 一、统计整理的步骤p42 统计整理首先都做以下两步工作:1设计和编制统计资料整理方案,确定整理工作的具体规划和要 求,这是整理工作的指导性文件。2对原始资料进行审核,审核它们是否准确、完整,如果发现问 题,要进行必要的补充、调整、纠正,这是统计整理的前提。 在手工整理条件下,统计整理

7、的步骤可用下图表示。7在计算机整理条件下,统计整理的步骤可用下图表示。8 3.对调查资料进行分组、汇总、计算对调查资料进行分组、汇总、计算 依照一定标志,对调查资料进行分组。按分组的要求,对各项数字进行汇总,计算分组单位数、总体单位数、分组标志总量和总体标志总量。 4.对汇总后的调查资料审核对汇总后的调查资料审核 对整理好的资料再一次进行审核,改正汇总过程中所发生的各种差错。汇总后审核可以从以下几方面进行: 1)复计审核,即对每个指标数值进行复核计算; 2)表表审核,即审核不同统计表上重复出现的同一指标数值是否一致,对统计表中互有联系的各个指标数值,则审核它们之间是否衔接和符合逻辑性; 3)表

8、实审核,即对汇总得到的指标数值,与了解的实际情况联系起来进行检查; 4)对照审核,即对某些统计、会计、业务三种核算都进行计算的指标数值,应进行相互对照检查,看数字是否相同。 5.编制统计表、绘制统计图编制统计表、绘制统计图 把整理好的统计资料用统计表或统计图的形式表现出来,以简明扼要地表现社会经济现象在数量方面的具体特征和相互关系。9二、统计整理的组织形式二、统计整理的组织形式(一)逐级整理 按照一定的统计管理体制对原始资料自下而上, 逐级地汇总整理。我国现行统计报表较多是采用 这种整理方式,专门调查的资料也有不少是采用 这种整理形式。这种整理形式的优点是可以就地 在较小范围内对数字资料进行及

9、时检查和核对, 资料也能及时提供给各级领导;缺点是汇总层次 多,反复转录,易出现差错。(二)集中整理 把全部原始资料集中在一个机关直接进行整理, 对于十分重要的或要求时效性极高的调查,往往 采取这种整理形式。优点是便于采用计算机整 理,能够提高资料的准确性和利用率;缺点是对原始资料的差错不易及时发现和改正,整理结果不能及时满足本地区、本部门的需要。 (三)逐级整理与集中整理相结合 兼有二者的优点。10三、三、 统计整理的技术统计整理的技术 1、手工整理技术、手工整理技术(1)划记法)划记法 用点、线或其它符号计算各组和总体单位数的方用点、线或其它符号计算各组和总体单位数的方 法,常用的符号有法

10、,常用的符号有“正正”字或字或“册册”等,划记法简便易行,等,划记法简便易行, 但容易出现漏错,只适用于总体单位不太多的情况。但容易出现漏错,只适用于总体单位不太多的情况。(2)过录法)过录法 将分散的原始资料过录到预先设计好的整理表上,将分散的原始资料过录到预先设计好的整理表上, 并计算出各种合计数,然后再填到综合统计表上去。并计算出各种合计数,然后再填到综合统计表上去。过录法汇总的内容比较全面,但工作量比较大。过录法汇总的内容比较全面,但工作量比较大。(3)折叠法)折叠法 将所有的调查表需要汇总的项目及其数值全部折在将所有的调查表需要汇总的项目及其数值全部折在 边上,一张接一张地叠在一起直

11、接加总。这个方法边上,一张接一张地叠在一起直接加总。这个方法 简单易行,报表汇总常用此法,但汇总时必须细致。简单易行,报表汇总常用此法,但汇总时必须细致。(4)卡片法)卡片法 一个调查单位用一张卡片,将这个单位的有关资料一个调查单位用一张卡片,将这个单位的有关资料 全部摘录在卡片上,利用卡片作为分组计数的工具,全部摘录在卡片上,利用卡片作为分组计数的工具, 加总总体单位数和标志值。这个方法比较准确可靠,加总总体单位数和标志值。这个方法比较准确可靠, 但比较费工费时。但比较费工费时。112、计算机数据处理的组织技术、计算机数据处理的组织技术(1)选择计算机软件包或自编程序)选择计算机软件包或自编

12、程序 为一般用户着想软件包中大为一般用户着想软件包中大 部分具有数据处理功能,例如部分具有数据处理功能,例如spss、lotus、 sas、tsp、minitab等。等。(2)编码)编码 统计调查表中有两种信息,一种是数字信息,如某人统计调查表中有两种信息,一种是数字信息,如某人 18周岁,某企业某月总产值为周岁,某企业某月总产值为120万元;另一种万元;另一种 是文字信息,如某人为男性,朝鲜族,高中毕是文字信息,如某人为男性,朝鲜族,高中毕 业。前者可以直接录入计算;后者必须根据统计分组业。前者可以直接录入计算;后者必须根据统计分组 编码的规定,将文字信息转化为数字信息,如男编码的规定,将文

13、字信息转化为数字信息,如男 性编码为性编码为1,朝鲜族为,朝鲜族为10,高中毕业为,高中毕业为03。(3)数据录入)数据录入 编码之后的调查表只有数字符号,采用手工录入编码之后的调查表只有数字符号,采用手工录入 或光电录入。或光电录入。 (4)数据编辑)数据编辑 让计算机对数据进行自动检查或修改,或者让计算机对数据进行自动检查或修改,或者由计由计 算机打印错误清单算机打印错误清单,由人工进行检查更正。,由人工进行检查更正。(5)计算与制表)计算与制表 根据事先编好的程序,对数据进行计算和制表,根据事先编好的程序,对数据进行计算和制表,得出所需要的各种分组汇总表或各种排序表。得出所需要的各种分组

14、汇总表或各种排序表。12第三节第三节 统计分组统计分组一、概念一、概念 根据统计研究的任务和现象的特点,按照一根据统计研究的任务和现象的特点,按照一定的标志把定的标志把 总体划分为若干组成部分,每一部分称为总体划分为若干组成部分,每一部分称为组。组。 就总体而言为就总体而言为“分分”,就个体而言为,就个体而言为“组组”; 以分组标志为准,以分组标志为准,“同者归类,异者区分同者归类,异者区分”二、作用二、作用 1、划分社会现象的不同类型,称为、划分社会现象的不同类型,称为类型分组类型分组; 2、反映社会现象的内部结构,称为、反映社会现象的内部结构,称为结构分组结构分组; 3、分析现象之间的依存

15、关系,称为、分析现象之间的依存关系,称为分析分组分析分组; 4、经过统计分组整理后,可以发现零星分散统、经过统计分组整理后,可以发现零星分散统计资料的特点与规律。计资料的特点与规律。13第三节第三节 统计分组统计分组三、方法三、方法 1、分组标志的选择、分组标志的选择 反映本质特征和内在联系的标志反映本质特征和内在联系的标志1)根据统计研究的目的与任务选择分组标志)根据统计研究的目的与任务选择分组标志如果研究的目的是要分析不同经济类型的企业在总体中的构成,那么就要选如果研究的目的是要分析不同经济类型的企业在总体中的构成,那么就要选择经济类型作为分组标志;如果要研究工业企业规模构成状况,则可以选

16、择择经济类型作为分组标志;如果要研究工业企业规模构成状况,则可以选择产值、固定资产原值等作为分组标志。产值、固定资产原值等作为分组标志。2)要从众多标志中,选择最能反映被研究现象本质特征的标志作分组标志)要从众多标志中,选择最能反映被研究现象本质特征的标志作分组标志职工家庭成员人均收入水平更能反映职工生活水平的高低,更能反映现象的职工家庭成员人均收入水平更能反映职工生活水平的高低,更能反映现象的本质特征,因为,即使某一职工工资水平较高,但如果他赡养的人口数很多本质特征,因为,即使某一职工工资水平较高,但如果他赡养的人口数很多的话,其家庭生活水平也不会很高。的话,其家庭生活水平也不会很高。3)根

17、据现象所处的历史条件或经济条件来选择标志)根据现象所处的历史条件或经济条件来选择标志在生产力水平较低的情况下,用职工人数的多少来表示企业规模的大小比较在生产力水平较低的情况下,用职工人数的多少来表示企业规模的大小比较适当;而在技术进步的历史时期或技术装备比较先进的情况下,有的企业由适当;而在技术进步的历史时期或技术装备比较先进的情况下,有的企业由于采用了机械化生产,虽然职工数不多,但生产能力却很大。于采用了机械化生产,虽然职工数不多,但生产能力却很大。4)此外,在选择分组标志时,还要遵循穷尽性和互斥性两个原则。)此外,在选择分组标志时,还要遵循穷尽性和互斥性两个原则。 2、分组界限的确定、分组

18、界限的确定 相邻组间的性质界限或数量界限相邻组间的性质界限或数量界限 品质标志分组品质标志分组 属性差别属性差别(类型、结构,规定分类标准目录类型、结构,规定分类标准目录) 数量标志分组数量标志分组 数量差异数量差异(分析、质变界限,成绩、计划分析、质变界限,成绩、计划) (1)单项式分组:即每)单项式分组:即每一组只包含一个变量值。一组只包含一个变量值。 (2)组距式分组:即在变量值变异幅度较大时,将变量值取值范围人为的划分为若干个区间 四、统计分组体系四、统计分组体系 对同一总体进行多种分组而形成的相互联系、对同一总体进行多种分组而形成的相互联系、 相互补充的系统,称为分组体系。相互补充的

19、系统,称为分组体系。 1、简单分组和平行分组体系。、简单分组和平行分组体系。2、复合分组和复合分组体系、复合分组和复合分组体系。14简单分组和平行分组体系简单分组和平行分组体系 复合分组和复合分组体系复合分组和复合分组体系按院系分组按院系分组按性别分组按性别分组农学院农学院动科院动科院林学院林学院男男女女学生人数学生人数院院 系系农学院农学院动科院动科院林学院林学院性性 别别男男女女男男女女男男女女男男女女学生人数学生人数15理工科理工科研究生研究生本科生本科生专科生专科生男生男生女生女生男生男生女生女生男生男生女生女生文科文科研究生研究生本科生本科生专科生专科生男生男生女生女生男生男生女生女

20、生男生男生女生女生16第四节第四节 次数分布和统计表次数分布和统计表 、次数分布的概念、次数分布的概念次数分布次数分布 在统计分组的基础上,将总体中的所有单位按组归类整在统计分组的基础上,将总体中的所有单位按组归类整 理,形成总体单位数在各组的分布,叫做次数分布,也理,形成总体单位数在各组的分布,叫做次数分布,也 称为分布数列,或称分配数列。称为分布数列,或称分配数列。频数与频率频数与频率 各组单位的次数,又称频数;各组次数与总次数之比各组单位的次数,又称频数;各组次数与总次数之比 称为频率。称为频率。分分 类类 根据分组标志的不同,分布数列可以分为品质分布数列根据分组标志的不同,分布数列可以

21、分为品质分布数列 和变量分布数列两种。和变量分布数列两种。 按品质标志分组所编制的分布数列叫做按品质标志分组所编制的分布数列叫做品质数列品质数列; 按数量标志分组所编制的分布数列叫按数量标志分组所编制的分布数列叫 做做变量数列变量数列。 (1)单项式分配数列()单项式分配数列(2)组距式分配数列)组距式分配数列 意意 义义 次数分布是统计整理的一种重要形式,它可以表明总体次数分布是统计整理的一种重要形式,它可以表明总体 的分布特征、结构情况,并据以研究总体某一标志的平的分布特征、结构情况,并据以研究总体某一标志的平 均水平及其变动的规律性。均水平及其变动的规律性。17分布数列分布数列品质数列品

22、质数列(品质标志分布数列品质标志分布数列)变量数列变量数列(数量标志数量标志分布数列分布数列)单项数列单项数列 (一个变量值作为一个组一个变量值作为一个组)组距数列组距数列(变量值变量值划分区间划分区间作组作组)等距数列等距数列(各组组各组组距都相等距都相等) (便于对便于对比、计算、比、计算、绘图绘图)上限上限下限下限组限组限开口组开口组闭合组闭合组组距组距=上限上限-下限下限全距全距=组距组距 =组数组数组距组距组中值组中值=下限下限+组距组距2 =上限上限-组距组距2异距数列异距数列(类型分类型分组、结构组、结构分组分组)开口组的组距组中值按照相邻组计算开口组的组距组中值按照相邻组计算1

23、8 在组距数列中,需要明确以下几个概念:在组距数列中,需要明确以下几个概念:l组限:组距数列中,各组的界限称为组限。组限:组距数列中,各组的界限称为组限。组限又分为上限和下限。下限是每组最小组限又分为上限和下限。下限是每组最小的标志值,上限是每组最大的标志值。如的标志值,上限是每组最大的标志值。如标志值标志值150160元一组,元一组,150元和元和160元是元是组限,组限,150元为下限,元为下限,160元为上限。元为上限。 组距数列中,如果各组的组限都齐全,称组距数列中,如果各组的组限都齐全,称为闭口组;若组限不齐全,即有上限缺下为闭口组;若组限不齐全,即有上限缺下限或有下限缺上限,称为开

24、口组。限或有下限缺上限,称为开口组。19l组距:每组下限与上限之间的距离叫组组距:每组下限与上限之间的距离叫组距。每组组距等于上限与下限之差,即距。每组组距等于上限与下限之差,即组距组距= =上限下限。标志值上限下限。标志值150150160160元组元组的组距的组距=160=160元元150150元元=10=10元。元。组距又有两种表现形式:一种是各组组距组距又有两种表现形式:一种是各组组距都相等,称为等距。这样的组距数列称都相等,称为等距。这样的组距数列称为等距数列。一种是各组组距不完全相为等距数列。一种是各组组距不完全相等,称为异距。这样的组距数列称为异等,称为异距。这样的组距数列称为异

25、距数列,也称不等距数列。距数列,也称不等距数列。20l组中值:每组下限与上限之间的中点数组中值:每组下限与上限之间的中点数值叫组中值。组中值等于下限与上限和值叫组中值。组中值等于下限与上限和的一半。的一半。标志值标志值150160元组元组2上限下限即组中值(元)组中值1552160150212邻组组距该组上限缺下限组组中值若若 “ “160160元以下元以下”,则,则 元该组组中值1552101602邻组组距该组下限缺上限组组中值若若 “ “200200元以上元以上”,则,则 元该组组中值20521020022 确定组数时,还可以利用美国学者斯特基斯(hasturges)提出的经验公式。其公式

26、如下: (其中n为标志值项数) 不过这一公式不是在任何情况下都必须遵守的法则,它只适用于总体趋于正态分布的条件下进行等距分组的情况。而且,利用斯特基斯公式确定组数时,如果数据个数少,则确定的组数数值过大;数据个数多,则确定的组数数值过小。所以,在实际工作中,这一公式作为组数确定的参考公式运用是可以的,但不必严格地根据公式所确定的组数执行。nlg322. 31组数23全距、组数和组距的关系用公式表达如下kri minmaxxxrirkmaxxminx组距,全距,组数,最大变量值,最小变量值24 以上计算结果只是一个参考数值,为计算方便,实际工作中一般组距取5或10的整数倍。当然也可以先确定组距,

27、再确定组数。 例如,编制上例某县城40户居民家庭人均月消费性支出分配数列时,其组数确定为: 组数=1+3.322lg40=6.32 因此,可以取整数6为组数。则: (元) 组距可以取为50元。17.486289kri25品质数列品质数列 .性别性别x学生人数学生人数f比重比重(%)男男3060女女2040合计合计50100 x产值产值(万元万元)f比重比重(%)农农 业业5025工工 业业7035建筑业建筑业3015运输业运输业157.5商商 业业3517.5合合 计计20010026按轻工工业分组按轻工工业分组企业数(万个)企业数(万个) 占总数的比重(占总数的比重(% %)轻工业轻工业36

28、6.1366.170.670.6重工业重工业152.4152.429.429.4合计合计518.5518.5100.0100.0表表 我国某年工业企业按轻重工业分组资料我国某年工业企业按轻重工业分组资料27单项数列单项数列.年龄年龄x学生人数学生人数f比重比重19510202040211530221020合计合计50100养猪头数养猪头数x学生人数学生人数f比重比重02512.517537.52804032010合计合计20010028拥有发电机组拥有发电机组(套)(套)发电厂数(个)发电厂数(个)比率(比率(% %)1 1353528.028.02 2484838.438.43 326262

29、0.820.84 412129.69.65 54 43.23.2合计合计125125100.0100.0例如,某电业局发电厂按拥有发电机组的套数分组,例如,某电业局发电厂按拥有发电机组的套数分组,可编成如下变量数列:可编成如下变量数列:29等距数列等距数列.身高分组身高分组(cm)学生人数学生人数f比重比重160以下以下1020160-1702040170-1801530180以上以上510合计合计50100按收入分组按收入分组人口数人口数f比重比重800以下以下1507.5800-1200105052.51200-1600600301600以上以上20010合计合计200010030异距数列

30、异距数列.年龄分组年龄分组人口数人口数f比重比重0-7808.07-161401416-606206260以上以上16016合计合计100010031二、次数分布的表示方法二、次数分布的表示方法 (一)列表法(一)列表法 用统计表来表示次数分布,称为列表法。用统计表来表示次数分布,称为列表法。学生考试成绩组距数列表学生考试成绩组距数列表 频数是分布在各组的学生数,频率是各组学生数与学生总数之比,又叫比重频数是分布在各组的学生数,频率是各组学生数与学生总数之比,又叫比重。分分 数数(上组限上组限不在内不在内) 组中值组中值x 学生数学生数f(频数频数) 比重比重(频率频率)向上累计向上累计次数次

31、数(小小于上限于上限) 向下累计向下累计次数次数(大大于下限于下限) 密度次数密度次数(组次数组次数组距组距) 4050506060707080809090100 455565758595 1581394 0.0250.1250.2000.3250.2250.100 1614273640 40393426134 0.10.50.81.30.90.4 合合 计计 4010004.032累计次数累计次数 把各组次数累计起来叫做累计次数分布,可据以研究在把各组次数累计起来叫做累计次数分布,可据以研究在 一定组限值以上或以下的次数总和。累计次数又分向上一定组限值以上或以下的次数总和。累计次数又分向上

32、累计和向下累计两种。累计和向下累计两种。向上累计向上累计 用小于各组上限的次数累计计算,即从分组资料小值一用小于各组上限的次数累计计算,即从分组资料小值一 端开始累计;端开始累计;向下累计向下累计 用大于各组下限的次数累计计算,即从分组资料大值一用大于各组下限的次数累计计算,即从分组资料大值一 端开始累计,累计次数到总次数止。端开始累计,累计次数到总次数止。密度次数密度次数 密度次数组次数组距。它与比重次数的关系是:在密度次数组次数组距。它与比重次数的关系是:在 等距数列中两者作用相同,但在异距数列中两者作用不等距数列中两者作用相同,但在异距数列中两者作用不 同,在异距数列中的密度次数,可使不

33、可比的次数变为同,在异距数列中的密度次数,可使不可比的次数变为 可比,可比,用可比次数作图或分析计算才有意义用可比次数作图或分析计算才有意义。由于异距。由于异距 数列的密度次数不同于原次数,用这两种次数计算结果数列的密度次数不同于原次数,用这两种次数计算结果 也不同,当以密度次数为准。也不同,当以密度次数为准。33(二)图示法(二)图示法 直观地显示次数分布的特征,可用统计图来表示次数分布,直观地显示次数分布的特征,可用统计图来表示次数分布,这一方法称为图示法。常用的表示次数分布的图形有直方图、折这一方法称为图示法。常用的表示次数分布的图形有直方图、折线图和曲线图。线图和曲线图。1直方图直方图

34、 即用直方形的宽度和高度来表示次数分布的图形。例:即用直方形的宽度和高度来表示次数分布的图形。例:直方图的各直方形的宽度相等,都是等组距直方图的各直方形的宽度相等,都是等组距10分,高度是各组学分,高度是各组学生人数(次数)、各直方形的高低表示各组次数的多少。生人数(次数)、各直方形的高低表示各组次数的多少。34 统计图统计图0 90 100 110 120 130 140 150 0 90 100 110 120 130 140 150 (完成(完成% %)15151010 5 5人人数数直方直方图图 横轴表横轴表示各组示各组组限组限 纵轴表示次纵轴表示次数(一般标数(一般标在左方)和在左方

35、)和比率(一般比率(一般标在右方)标在右方)352折线图折线图 用连续的折线来表示次数分布的图形。例如,用分组用连续的折线来表示次数分布的图形。例如,用分组 资料的组中值作横轴尺度,学生人数(次数)作纵轴尺资料的组中值作横轴尺度,学生人数(次数)作纵轴尺 度,然后用组中值度,然后用组中值x和组次数和组次数f画出坐标点,将各坐标点画出坐标点,将各坐标点 连接起来,就是折线图。也可把各直方形顶边的中点用连接起来,就是折线图。也可把各直方形顶边的中点用 直线连接而成。直线连接而成。36 用折线图还可以表示累计次数的分布,由于累计次数分为向用折线图还可以表示累计次数的分布,由于累计次数分为向上累计和向

36、下累计,也可以画出向上累计次数分布折线图和向下上累计和向下累计,也可以画出向上累计次数分布折线图和向下累计次数分布折线图。图中向上累计折线图用各组上限与累计次累计次数分布折线图。图中向上累计折线图用各组上限与累计次数画坐标点,向下累计折线图用下限画坐标点,把两条累计线画数画坐标点,向下累计折线图用下限画坐标点,把两条累计线画在一个图上,两线有一个交点,在累计次数尺度上是总次数的一在一个图上,两线有一个交点,在累计次数尺度上是总次数的一半(本例为半(本例为= 20人),在分数尺度上为人),在分数尺度上为74.6分,这是本数列的中分,这是本数列的中位数位数me,在此分数上下各有,在此分数上下各有2

37、0人。人。373曲线图曲线图 即用曲线来表示次数分布的图形。变量数列所表达的次即用曲线来表示次数分布的图形。变量数列所表达的次数分布,有经验分布与理论分布之别。根据项数有限的随机样本数分布,有经验分布与理论分布之别。根据项数有限的随机样本编制的变量分组数列所画出的是编制的变量分组数列所画出的是折线图折线图,理论分布是假定资料,理论分布是假定资料项项数无限多,组距无限小时数无限多,组距无限小时经验分布的渐近分布,可用数学方法推经验分布的渐近分布,可用数学方法推导出来,画出的图形是平滑曲线。理论分布在数理统计中有十分导出来,画出的图形是平滑曲线。理论分布在数理统计中有十分重要的用途。重要的用途。3

38、84.圆形图圆形图 圆形图(pie chart)又叫饼形图,是用圆形的面积大小来表示统计资料的图形,多以图形内扇形面积的大小表示现象数值的大小或现象各部分所占的比重的图形结构,例如,根据表3-7的资料可画圆形图,如图3-3所示。圆形图常常用于总体各部分的结构比例。对于显示较少的数据点很有效,但数据量太大时则很难说明问题。39图图3-3 2006年中国国内生产总值结构图年中国国内生产总值结构图资料来源:中国统计年鉴2007,57页。北京:中国统计出版社,200740三、次数分布的主要类型三、次数分布的主要类型 (一)钟形分布(一)钟形分布钟形分布钟形分布 是在社会经济现象中最常见的一种分布类型,

39、特点是是在社会经济现象中最常见的一种分布类型,特点是“两头小、中间大两头小、中间大”,即靠近中间的变量值次数多,靠近两端的,即靠近中间的变量值次数多,靠近两端的变量值次数少,绘成曲线图,就像一口钟,所以称其为钟形分布。变量值次数少,绘成曲线图,就像一口钟,所以称其为钟形分布。钟形分布有对称的和非对称的两种,对称分布有一个最高的次数,钟形分布有对称的和非对称的两种,对称分布有一个最高的次数,在它上下两侧的次数呈对称式下降,正态曲线就是一种对称钟形在它上下两侧的次数呈对称式下降,正态曲线就是一种对称钟形曲线;非对称曲线按其偏斜方向不同而分为负偏(左偏)和正偏曲线;非对称曲线按其偏斜方向不同而分为负

40、偏(左偏)和正偏(右偏)两种,(右偏)两种,负偏负偏是在次数分布高峰的左侧(是在次数分布高峰的左侧(小值小值方向)次数方向)次数偏多,正偏则反之,在次数高峰的右侧(大值方向)次数偏多。偏多,正偏则反之,在次数高峰的右侧(大值方向)次数偏多。41例如,例如,1984年中国农民收入分布就是一种正偏钟形分布,图中显示年中国农民收入分布就是一种正偏钟形分布,图中显示出农民收入分布变化趋势是:高收入人口所占比重显著增加,低出农民收入分布变化趋势是:高收入人口所占比重显著增加,低收入人口所占比重显著下降,人口收入人口所占比重显著下降,人口众数众数由低收入组向较高的收入由低收入组向较高的收入组移动。组移动。

41、中国农民收入分布中国农民收入分布42(二)(二)u形分布形分布所谓所谓u形分布,即靠近中间的变量值分布次数少,靠近两端的变量形分布,即靠近中间的变量值分布次数少,靠近两端的变量值分布的次数多,形成值分布的次数多,形成“两头大、中间小两头大、中间小”的分布特征,绘成曲的分布特征,绘成曲线图,像英文字母线图,像英文字母u,也称为倒钟形分布。,也称为倒钟形分布。例如,人口按年龄分组的死亡率分布,是例如,人口按年龄分组的死亡率分布,是u形分布。两端高、中间形分布。两端高、中间低的低的u形图,表明婴儿死亡率和老年人死亡率都较高,中青年人形图,表明婴儿死亡率和老年人死亡率都较高,中青年人的死亡率低。的死亡

42、率低。u形分布也有对称与非对称之别。形分布也有对称与非对称之别。43(三)(三)j 形分布形分布j形分布的特点是随着变量值的增大,其次数呈单调增加或单调减形分布的特点是随着变量值的增大,其次数呈单调增加或单调减少,可分为正少,可分为正j形分布和反形分布和反j形分布二类。形分布二类。j形分布形分布图中新中国死亡分布曲线(根据图中新中国死亡分布曲线(根据1982年全国人口普查材料)已呈正年全国人口普查材料)已呈正j形,接近于人口低死亡率的模式,说明低年龄组死亡人口所占形,接近于人口低死亡率的模式,说明低年龄组死亡人口所占的比重大大下降,死亡人口的重心移向老年。这是新中国经济发的比重大大下降,死亡人

43、口的重心移向老年。这是新中国经济发展、社会进步的一个重要表现。展、社会进步的一个重要表现。 44(四)洛伦茨分布(四)洛伦茨分布为了研究国民收入、国民财富在国民之间的分配,美国统计学家洛为了研究国民收入、国民财富在国民之间的分配,美国统计学家洛伦茨(伦茨(molorenz)提出了洛伦茨分布曲线,如图所示。横轴)提出了洛伦茨分布曲线,如图所示。横轴oh表示人口(按收入由低到高分组)的累计百分比,纵轴表示人口(按收入由低到高分组)的累计百分比,纵轴om表示收入的累计百分比。假定收入绝对平等,人口累计百分比等表示收入的累计百分比。假定收入绝对平等,人口累计百分比等于收入累计百分比,洛伦茨曲线为对角线

44、于收入累计百分比,洛伦茨曲线为对角线ol。当收入绝对不平。当收入绝对不平等时,等时,1的人口占有的人口占有100的收入,洛伦茨曲线为折线的收入,洛伦茨曲线为折线ohl。实际上,各个国家的收入分配曲线都介于实际上,各个国家的收入分配曲线都介于ol和和ohl之间,为一之间,为一条上凹形曲线。条上凹形曲线。45罗伦茨曲线例罗伦茨曲线例人人 口口 收收 入入人口数人口数频频 率率(%)累计频率累计频率(%)总收入总收入(万元万元)频频 率率(%)累计频率累计频率(%)低低中下中下中中中上中上高高400120012008004001030302010104070901001040505050520252

45、5255255075100合合 计计400010020010046我国我国1978年、年、1989年居民收入分配的洛伦茨曲线图见图。年居民收入分配的洛伦茨曲线图见图。图中的图中的曲线显示,我国居民收入分配的平等度明显大于印度和巴西。从曲线显示,我国居民收入分配的平等度明显大于印度和巴西。从图中还可以看出,图中还可以看出,1989年我国居民收入的差距比年我国居民收入的差距比1978年拉大了一年拉大了一些。这是由于城乡多种经济成份的发展,允许一部分人先富起来些。这是由于城乡多种经济成份的发展,允许一部分人先富起来的政策的贯彻,使得城乡居民的收入差距比过去大了。的政策的贯彻,使得城乡居民的收入差距比

46、过去大了。 图图 312 中国、印度、巴西居民收入分配的洛伦茨曲线中国、印度、巴西居民收入分配的洛伦茨曲线47基尼系数基尼系数 测定收入分配不平均程度的统计指标。测定收入分配不平均程度的统计指标。 1、定义、定义 为不公平面积。为不公平面积。 2、计算、计算 3、意义、意义 w=0 收入分配绝对平均收入分配绝对平均 w=1 收入分配绝对不平均收入分配绝对不平均 0w1 w越趋于越趋于0,收入分配越平均;,收入分配越平均; w越趋于越趋于1,收入分配越不平均。,收入分配越不平均。baassswas48 基尼系数是衡量总体收入差距的重要指标。基尼系数是衡量总体收入差距的重要指标。从从1978年到年

47、到1984年,我国基尼系数稳定在年,我国基尼系数稳定在0.16的水平。而从的水平。而从1984年开始,基尼系数一年开始,基尼系数一路攀升,到路攀升,到2007年已达到年已达到0.473。一般说。一般说0.2之之下叫下叫“高度平等高度平等”,0.2到到0.4叫叫“低度的不平低度的不平等等”,0.4以上叫以上叫“高度不平等高度不平等”,我国现在,我国现在0.473说明不平等的问题已经比较突出。说明不平等的问题已经比较突出。 至于至于2007年以后,我国的基尼系数又达到了年以后,我国的基尼系数又达到了何种何种“新高新高”,几乎所有官方媒体和统计部,几乎所有官方媒体和统计部门保持了相对的沉默,似乎基尼

48、系数到门保持了相对的沉默,似乎基尼系数到0.473以后就停滞不前了。在百姓的生存体会中,以后就停滞不前了。在百姓的生存体会中,这个数据肯定还在继续扩大,事实就是如此。这个数据肯定还在继续扩大,事实就是如此。49 这是这是“世界工资研究世界工资研究”发表的最新统计资发表的最新统计资料料50四、四、 统计表统计表 (一一)统计表的概念和分类统计表的概念和分类统计表统计表 是统计资料的一种表现形式。把统计资料按照一定是统计资料的一种表现形式。把统计资料按照一定 的结构和顺序在表格中表现出来,这种表格叫作统的结构和顺序在表格中表现出来,这种表格叫作统 计表。计表。意意 义义 用统计表来表达数据,比用文

49、字表达更清晰更连贯、用统计表来表达数据,比用文字表达更清晰更连贯、 更简明、更节省篇幅。统计表能以综合的形式提供更简明、更节省篇幅。统计表能以综合的形式提供 系统的统计资料,便于显示数字之间的联系,便于系统的统计资料,便于显示数字之间的联系,便于 进行比较和研究。进行比较和研究。分分 类类 1、统计表按表的用途不同,可分为、统计表按表的用途不同,可分为调查表调查表、整理、整理表、分析表;表、分析表;2、统计表按表的总体分组情况不同,可分、统计表按表的总体分组情况不同,可分为为 简单表、简单分组表、复合表。简单表、简单分组表、复合表。51统计表的种类统计表的种类r 1 1用途不同用途不同r 调查

50、表:调查项目以表格的形式调查表:调查项目以表格的形式表示出来。表示出来。 r 整理表(又称汇总表):对调查整理表(又称汇总表):对调查资料直接整理的结果。资料直接整理的结果。 r 分析表:表述统计分析资料的统分析表:表述统计分析资料的统计表。计表。 521).简单表简单表 指总体未经任何分组的统计表,它把总体单位指总体未经任何分组的统计表,它把总体单位依次依次排列。或者把总体单位按时间次序排列,具有一览表性排列。或者把总体单位按时间次序排列,具有一览表性质。质。 直辖市直辖市总人口总人口其中:市辖县人口其中:市辖县人口北京市北京市天津市天津市上海市上海市10819407878540213341

51、896345698229303345127460r2.对总体是否进行分组及分组情况不同分对总体是否进行分组及分组情况不同分 53 2)简单分组表)简单分组表 指总体仅按某一个标志进行分组的统计表。利用分组指总体仅按某一个标志进行分组的统计表。利用分组表可以揭示不同类型的不同特征,研究总体的内部构成,表可以揭示不同类型的不同特征,研究总体的内部构成,分析现象之间的依存关系等。分析现象之间的依存关系等。 1990年农民家庭平均每人纯收入年农民家庭平均每人纯收入项项 目目金额金额(元元)比重比重()平均每人纯收入平均每人纯收入 从集体经营得到收入从集体经营得到收入 经济联合体得到收入经济联合体得到收

52、入 家庭经营纯收入家庭经营纯收入 其它非生产性收入其它非生产性收入629.79 60.31 2.44518.34 48.701009.580.3982.307.73543)复合表)复合表 复合表是总体按两个或两个以上标志进行复合分组的统计表。复合表是总体按两个或两个以上标志进行复合分组的统计表。复合表把几个标志结合起来,能较深入地分析比较复杂的社会经复合表把几个标志结合起来,能较深入地分析比较复杂的社会经济现象。济现象。 1990年农民家庭平均每人生活消费支出及构成年农民家庭平均每人生活消费支出及构成 项项 目目金额金额(元元)比重比重()平均每人生活消费支平均每人生活消费支出出1生活消费品支

53、出生活消费品支出食品食品衣着衣着燃料燃料住房住房 用品及其它用品及其它 2非商品支出非商品支出538.05497.65295.16 45.06 24.37 69.23 63.83 40.40100.0 92.5 54.9 8.4 4.5 12.9 11.9 7.555r 3.性质不同性质不同r 时间数列表:主词栏中是按时间单位的顺时间数列表:主词栏中是按时间单位的顺序排列的统计表,如表序排列的统计表,如表2929所示。所示。 表表2-9 2-9 我国历年国内生产总值资料我国历年国内生产总值资料年份年份国内生产总值国内生产总值/ /亿元亿元1978197836243624198019804518

54、4518198519858964896419901990185481854819981998793967939656空间数列表:反映在同一时间不同空间范空间数列表:反映在同一时间不同空间范围内(如不同单位、不同地区、不同部门等)围内(如不同单位、不同地区、不同部门等)的资料的统计表,如表的资料的统计表,如表210210所示。所示。 表表2-10 2-10 我国我国19981998年国内生产总值资料年国内生产总值资料产业产业国内生产总值国内生产总值/ /亿元亿元第一产业第一产业1460014600第二产业第二产业3869238692第三产业第三产业2610426104合计合计7939679396

55、57 统计表的结构统计表的结构统计统计表表形式形式内容内容 总标题总标题 横行标题横行标题 纵栏标题纵栏标题 数字资料数字资料 主词主词 宾词宾词 统计表的名称,用以统计表的名称,用以概概括统括统计表中全部统计资料的计表中全部统计资料的内容内容,一般放在表的上端中央一般放在表的上端中央 又称横标目,它表明统计表又称横标目,它表明统计表横行项目的名称横行项目的名称,一般置于,一般置于表的左边表的左边 又称纵标目,它表明又称纵标目,它表明纵栏指纵栏指标名称标名称,一般置于表的右上,一般置于表的右上方方 一般在各横行标题与纵栏标一般在各横行标题与纵栏标题的题的交叉处交叉处,是说明,是说明总体总体(各

56、组)数量特征(各组)数量特征的指标。的指标。 统计表所要说明的对象统计表所要说明的对象,即,即统计总体各个组成部分的名统计总体各个组成部分的名称,一般是指表的标行标题称,一般是指表的标行标题部分部分 。用来用来说明主词的各种统计指标说明主词的各种统计指标,一般指表,一般指表的的纵栏标题和数字资料纵栏标题和数字资料部分部分 。5859宾词的设计宾词的设计 统计表中宾词的设计主要指统计指标的编排。宾词指标的设计在不要求分组的情况下,可以按照指标的主次先后排列;在需要分组时,宾词指标的设计分为简单设计和复合设计。宾词指标的简单设计是将宾词中的各个指标作平行的设置,即指标与指标之间彼此独立。如表3-2

57、1所示6061 宾词指标的复合设计是将说明主词的各个指标按分组标志作层叠的设置,如表3-22所示, 宾词指标的复合设计能够更全面、更深入地描述所研究总体的特征,但由于复合设计中根据分组标志所划分的指标栏目数量呈乘积关系,当分组标志较多时,宾词指标会分得过多过细,容易造成统计表混乱不清。因此,对宾词指标的复合设计应慎重考虑。6263(二二)统计表的设计规则和标准化统计表的设计规则和标准化 1、统计表、统计表形式的设计形式的设计(1) 统计表通常都应设计成纵横线条交叉组成的长方形表格统计表通常都应设计成纵横线条交叉组成的长方形表格, 在计算机处理的条件下,表式设计要考虑计算机输出的条在计算机处理的

58、条件下,表式设计要考虑计算机输出的条件。在手工制表的条件下,统计表除尽量使长宽之间有适件。在手工制表的条件下,统计表除尽量使长宽之间有适当比例,以保持美观之外,应当考虑到印刷开本的条件。当比例,以保持美观之外,应当考虑到印刷开本的条件。(2) 统计表一般采用统计表一般采用开口式开口式, 表的左右两端表的左右两端不画纵线不画纵线,表,表的上的上下通常用粗线封口下通常用粗线封口,统计表的各栏可用(,统计表的各栏可用(1)、()、(2)、)、(3)统一编号。统一编号。(3) 为阅读方便为阅读方便, 主词按次序排列的横行数据一般主词按次序排列的横行数据一般每隔五行要每隔五行要留一个空行留一个空行。(4

59、) 统计表的注解、数字的资料来源等一般都写在表的下面,统计表的注解、数字的资料来源等一般都写在表的下面,以便核查以便核查, 必要时还可附以简要文字说明,以明确统计表必要时还可附以简要文字说明,以明确统计表所反映的主要情况和问题。所反映的主要情况和问题。642、统计表、统计表内容的设计内容的设计(1) 统计表的主语和谓语的安排要通盘考虑,内容不要过分庞杂,统计表的主语和谓语的安排要通盘考虑,内容不要过分庞杂, 最好一个表最好一个表集中说明一个问题集中说明一个问题。如果内容较多,可分成几张表。如果内容较多,可分成几张表。(2) 统计表的总标题和纵横标题都要简明扼要,能恰当地反映表的统计表的总标题和

60、纵横标题都要简明扼要,能恰当地反映表的内容,内容,纵横各栏的排列纵横各栏的排列要注意表述资料的要注意表述资料的逻辑关系逻辑关系,反映现象的,反映现象的内在联系。内在联系。(3) 统计表中的数字要注明计算单位,如果统计表中的数字要注明计算单位,如果全表只有一个统一的计全表只有一个统一的计 算单位算单位,可以列在表的右上角;如,可以列在表的右上角;如各栏的计量单位不同时各栏的计量单位不同时,则应,则应将计量单位标写在将计量单位标写在各纵栏标题的下方或右侧各纵栏标题的下方或右侧;当同行统计资料以;当同行统计资料以同一单位计量,而同一单位计量,而各行的计量单位不同时各行的计量单位不同时,则可在,则可在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论