




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章统计资料的收集、整理与显示数据的收集
数据的整理数据的显示利用EXCEL进行统计整理与描绘统计图有一部电视专题片叫“国家数据”
片子开头就问:数据是什么?
小学生说:“数据是我作业本上的算术题”,家庭主妇说:“我们家的收支帐上都是数据”,营业员说:“数据,是我这里的营业额”。
这些都是数据,但不全是统计数据。第一节数据的收集
美国的一位管理学家曾做过这样的实验,他向一些高层的企业管理者提出这样三个问题:
你每天花费时间最多的工作在哪些方面?你认为每天最重要的事情是什么?你在履行职责时最感困难的是什么?大多数的回答只有两个字:“决策”。而采访许多企业领导,问:你在决策时,最依赖、最信赖的根据是什么?大多数人的回答也只有两个字:“数据”第一节数据的收集数据收集的方法统计调查方式和调查体系统计调查方案的设计间接统计数据的来源一、数据的收集方法(一)数据收集的概念所谓数据收集是根据统计研究的目的,运用科学的方法,有计划、有组织地采集数据的过程。数据收集是统计工作的基础环节。统计数据按来源不同分为第一手资料和第二手资料。第一手资料是通过专门的调查或实验,直接向需要观察的对象收集的反映其情况的统计资料,一般称为原始资料;第二手资料是指对他人调查或实验取得的原始资料进行加工后得到的数据。对原始资料的收集,又称为统计调查。一、数据的收集方法(二)统计调查方法1.直接观察法是指由调查人员到现场对调查对象进行直接查看、测量和计量。直接调查取得的资料准确性较高,但需要大量人力、物力。2.报告法(通讯法)由统计机构将调查表格分发给被调查者,被调查者根据填报要求填写、寄回。在被调查单位有健全的原始记录和核算制度、统计基础较好的条件下,利用报告法能够有效地取得资料。我国现行的统计报表制度采用的就是这种方法。一、数据的收集方法(二)统计调查方法3.登记法登记法由有关的组织机构发出通告,规定当事人在规定事情发生后到该机构登记,填写所需材料。4.采访法采访法是根据被调查者的回答来收集统计资料,这种方法又可分为口头询问法和被调查者自填法两种。口头询问法是由调查人员对被调查者逐一采访,当面填答。被调查者自填法,即调查人员把调查表交给被调查者,向被调查者说明填表的要求和方法,并对有关注意事项加以解释,由被调查者按实际情况一一填写,填好后交给调查人员审核收回。5.实验法是用于收集测试某一新产品、新工艺或新方法使用效果的资料的方法。特点是可以将影响现象的其他因素控制不变,专门观察某一因素的影响。6.网络调查法是传统调查方法和网络的结合,在互联网普及程度越来越高的现代社会,开始得到广泛使用。7.电话访问法是调查人员通过电话向被调查者询问、交谈以获得所需资料。该方法在国外使用广泛,国外流行的有中心控制电话访谈法和电脑辅助电话访谈法(CATI)。二、统计调查方式与统计调查体系(一)统计调查方式1.普查普查是一种专门组织的全面调查,它主要是用以收集某些不能或不宜用定期报表收集的统计资料。对国情国力的调查一般采用普查。例:人口普查、经济普查2.统计报表制度统计报表制度是依照国家有关法规,自上而下地统一布置,以原始记录为依据,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级地定期提供统计资料的一种调查方式。二、统计调查方式与统计调查体系(一)统计调查方式1.普查普查是一种专门组织的全面调查,它主要是用以收集某些不能或不宜用定期报表收集的统计资料。对国情国力的调查一般采用普查。2.统计报表制度统计报表制度是依照国家有关法规,自上而下地统一布置,以原始记录为依据,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级地定期提供统计资料的一种调查方式。二、统计调查方式与统计调查体系(一)统计调查方式3.抽样调查抽样调查是一种非全面调查。通常的抽样调查是指随机抽样调查,即按随机原则从调查对象中抽取部分单位作为样本进行观察,用以推算总体数量特征的一种调查方式。抽样调查有如下特点:第一,样本单位按随机原则抽取,排除了主观因素对选样的影响。第二,根据样本信息对总体的数量特征做出估计。第三,抽样误差可以事先计算并加以控制。抽样调查的适用范围主要有:第一,对一些不可能或不必要进行全面调查的社会现象,采用抽样调查。第二,对普查资料进行必要的核对与修正。二、统计调查方式与统计调查体系(一)统计调查方式4.重点调查重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查。所谓重点单位,是着眼于现象的量的方面而言,尽管这些单位在全部单位中只是一部分,但它们在所研究现象的标志总量中却占有较大的比重,在总体中具有举足轻重的作用。5.典型调查典型调查是一种专门组织的非全面调查。它是根据调查的目的,在对所研究的对象进行初步分析的基础上,有意识地选取若干具有代表性的单位进行调查和研究,借以认识事物发展变化的规律。二、统计调查方式与统计调查体系(二)统计调查体系在计划经济体制下,我国统计调查方式以统计报表制度为主,是一种以全面调查、层层汇总为特征的统计调查体系。改革开放以来,随着社会主义市场经济的发展,社会经济现象空前复杂化和各部门对统计信息的新需求使得传统的统计体系受到挑战。因此,国家统计局已经提出要建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查体系。三、统计调查方案的设计1.确定调查目的和任务2.确定调查对象和调查单位调查对象,是指需要调查的现象总体,由性质相同的许多调查单位组成。调查单位,是指所要调查的具体单位,它是进行调查登记的标志的承担者。报告单位亦称填报单位,是负责向上报告调查内容、提交统计资料的单位。3.确定调查项目和设计调查表调查项目就是调查中所要登记的调查单位的特征。4.确定调查时间和调查期限调查时间是指调查资料所属的时间,又称客观时间。调查期限是进行调查工作的时限,包括收集资料和报送资料的工作所需的时间,又称主观时间。5.确定调查的组织实施计划四、间接统计数据的主要来源对于应用统计的分析人员来说,相当一部分统计数据不必亲自进行统计调查,可取自有关统计部门和机构发布的统计资料。利用第二手数据,第一要注意引用数据的计算口径及其合理性;第二,一定要注明数据的来源,以尊重他人的劳动成果。在我国,公开出版的社会经济统计数据主要来自国家和地方的统计部门。在计算机与网络技术飞速发展的今天,互联网已成为获取统计数据的重要途径。目前我国网上统计数据的主要来源有:中国统计信息网()、中国经济信息网()、中国经济时报网()以及其他相关网站。除了从网上获取数据外,还可以从有关数据库获得有关信息。第二节数据的整理数据整理概述统计分组频数分布频数与频率累计频数与累计频率频数分布的类型一、数据整理概述(一)数据整理的意义统计资料整理就是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,既是统计调查阶段的继续和深入,又是统计分析阶段的基础,起着承前启后的作用。(二)数据整理的内容1.统计资料的审核。2.资料的分组和汇总。3.编制统计表或绘制统计图,描述整理的结果。4.统计资料的积累、保管和公布。二、统计分组(一)统计分组的概念与种类1.统计分组的概念根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。2.统计分组的种类(1)按分组标志的多少,可分为简单分组和复合分组。(2)按分组标志的性质不同,可分为品质分组和数量分组。例:标志人数不及格性别男女及格性别男女复合分组层叠分组标志人数性别男女成绩及格不及格简单分组不层叠二、统计分组(二)统计分组的方法在进行统计分组时,要遵循两个原则:穷尽原则和互斥原则。1.品质分组方法品质分组就是对研究现象按品质(或属性)标志进行分组,数量分组就是对研究现象按数量标志分组。二、统计分组(二)统计分组的方法2.数量分组按数量标志分组,各组数量界限的确定必须能反映事物质的差别,采用适当的分组形式,确定相宜的组距、组限。(1)单项式分组与组距式分组(2)间断组距式分组和连续组距式分组(3)等距分组与异距分组二、统计分组(三)组距式分组中相关指标的计算1.组距。组距式分组中,组距是上下限之间的距离。连续组距分组的组距计算公式是:
(2.1)对于间断式分组的组距的计算,采用如下公式:
(2.2)连续组距式分组的组距大小,也可根据公式(2.2)或(2.3)求得。二、统计分组(三)组距式分组中相关指标的计算2.组数。在实际分组时,可以借助美国学者斯特杰斯(H.A.Sturges)提出的经验公式确定组数与组距:(2.4)(2.5)式中,为组数;为总体单位数;为组距;为全距,即最大变量值与最小变量值之差。15~2425~4445~8990~179180~35956789表2-1分组组数参考表二、统计分组(三)组距式分组中相关指标的计算3.组中值。上下限之间的中点数值称为组中值,连续组距分组的组中值计算公式是:
(2.6)
(2.8)有时在组距式分组数列的两端会使用开放式的组距,开口组的组中值和组距参照相邻组确定。向上开口组中值=下限+相邻组组距/2向下开口组中值=上限-相邻组组距/2三、频数分布(一)频数分布在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,称为频数分布,或次数分布。按品质标志分组所形成的数列即品质分布数列,按数量标志分组所形成的数列叫变量分布数列.(二)分布数列的两个要素分布数列由两个要素构成:一个是总体按某标志所分的组;另一个是各组所出现的单位数,即频数,亦称次数。三、频数分布(三)变量数列的编制现举例说明变量数列的编制过程。【例2-1】根据抽样调查,2010年某地区50户城镇居民家庭的人均月消费额(单位:元)的资料如下。88097012301100118015801210146011701080105011001070137012001630125013601270142011801030960115014101170123012601380151010109609101130114011901260135093014201080101010501250116013201380131012701250三、频数分布(三)变量数列的编制首先对数据按大小进行排序,结果如下:88091093096096097010101010103010501050107010801080110011001130114011501160117011701180118011901200121012301230125012501250126012601270127013101320135013601370138013801410142014201460151015801630三、频数分布(三)变量数列的编制用最大值与最小值相减计算出全距,
对上述资料采用等距分组,分为8组,组距为100,以800为第一组下限。经过整理,得出计算结果如下表。按月消费额分组(元)户数(频数)户数比重(%)(频率)800~90010.02900~100050.101000~110080.161100~1200110.221200~1300110.221300~140070.141400~150040.081500以上30.06合计501.00表2-250户城镇居民家庭的月消费额分布数列四、频数与频率(一)频数和频率1.频数频数是各组所具有的单位个数,一般用表示。2.频率即各组频数与总体单位总和之比,它反映了各组频数的大小对总体所起的作用的相对强度。频率的计算公式如下:(2.9)式中,表示第组的频数。很显然,任何一个分布都必须满足:(1)各组的频率都界于0和1之间。(2)各组频率之和等于1(或100%)。四、频数与频率(一)频数和频率3.频数密度与频率密度在异距分组情况下,由于各组频数的多少还受到组距不同的影响,各组的频数可能会随着组距的扩大而增加,随着组距的缩小而减少。为消除异距分组所造成的这种影响须计算频数密度(或称次数密度)和频率密度,计算公式如下:
(2.10)(2.11)各组频数密度与各组组距乘积之和等于总体单位数,各组频率密度与各组组距乘积之和等于1。五、累计频数与累计频率(一)累计频数(率)分布数列向上累计频数(或频率)分布,其方法是先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。向上累计频数表明某组上限以下的各组单位数之和是多少,向上累计频率表明某组上限以下的各组单位数之和占总体单位数的比重。向下累计频数(或频率)分布,其方法是先列出各组的下限,然后由标志值高的组向标志值低的组依次累计。向下累计频数表明某组下限以上的各组单位数之和是多少,向下累计频率表明某组下限以上的各组单位数之和占总体单位数的比重。五、累计频数与累计频率(一)累计频数(率)分布数列【例2-2】现仍以【例2-1】50户居民家庭月消费额的资料为例,进行向上和向下累计,其结果如下表所示。居民家庭月消费额分组上限向上累计居民家庭月消费额分组下限向下累计频数累计频数频率(%)累计频率(%)频数累计频数频率(%)累计频率(%)9001122800150210010005610129005495981100814162810008441688120011252250110011362272130011362272120011252250140074314861300714142815004478941400478141600249498150023461700150210016001122合计50—100—合计50—100—五、累计频数与累计频率(二)累计频数(率)分布曲线累计频数(频率)分布图分为向上累计频数(频率)分布图和向下累计频数(频率)分布图。不论是向上或向下累计,均以分组变量为横轴,以累计频数(频率)为纵轴。图2-2累计频数(频率)分布示意图五、累计频数与累计频率(三)洛伦茨曲线累计频数(或频率)分布曲线,可用来研究财富、土地和工资收入的分配是否公平。这种累计分布曲线图最早由洛伦茨博士(Dr.M.O.lorenz)提出的,故又称洛伦茨曲线图。其绘制方法如下:1.将分配对象和接受分配者的数量均化成结构相对数并进行向上累计。2.纵轴和横轴均为百分比尺度,纵轴自下而上,用以测定分配的对象。3.根据计算所得的分配对象和接受分配者的累计百分数,在图中标出相应的绘示点,连接备点并使之平滑化,所得曲线即所要求的洛伦茨曲线。1008060402002040
60
80
100人口(%)收入(%)
绝对不平等曲线绝对平等线实际收入分配曲线六、频数分布的类型(一)钟型分布钟型分布的特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,其曲线图宛如一口古钟(Ⅰ)(Ⅱ)(Ⅲ)六、频数分布的类型(二)型分布型分布的形状与钟型分布相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的型分布。1020304050607080100504030
20100死亡率(‰)年龄某地区人口死亡率六、频数分布的类型(三)J型分布型分布有两种类型,一种是次数随着变量的增大而增多,呈正J型分布,另一种是次数随着变量增大而减少,呈反型分布,正J型图反J型图第三节数据的显示统计表统计图一、统计表(一)统计表的定义和结构把经过整理的统计数据按一定的顺序排列在表格上,就形成了统计表。统计表是显示统计数据的重要形式,也是开展统计整理和统计分析的一种重要工具。从形式上看,统计表由总标题,横行标题、纵栏标题和指标数值四部分组成;从内容上看,统计表是由主词和宾词两部分构成。主词是统计表要说明的总体或总体分成的多个组,宾词是说明主词的统计指标。一、统计表(二)统计表的分类1.按用途分类,统计表可分为:调查表、整理表或汇总表、分析表。2.按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、分组表和复合表。3.按宾词设计分类,根据宾词设计不同可分为宾词简单排列、分组平行排列和分组层叠链列等三种。一、统计表(三)统计表的设计统计表设计总的要求是:简练、明确、实用、美观,便以比较。1.统计表式设计应注意事项。(1)统计表应设计成由纵横交叉线条组成的长方形表格,长与宽之间保持适当的比例。(2)线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般不划线,采用“开口式”。(3)合计栏的设置。统计表各纵列若须合计时,一般应将合计列在最后一行,各横行需要合计时,可将合计列在最前一栏或最后一栏。(4)栏数的编号。2.统计表内容设计应注意事项。(1)标题设计。统计表的总标题,横栏、纵栏标题应简明扼要。(2)指标数值。表中数字应该填写整齐,对准位数。(3)计量单位。统计表必须注明数字资料的计量单位。(4)注解或资料来源。二、统计图(一)圆形图与条形图圆形图和条形图主要用于定类数据的图示。1.圆形图。圆形图也称饼形图,是用圆形及圆内扇形的面积来表示数值大小的图形。二、统计图(一)圆形图与条形图2.条形图。条形图是用宽度相同的条形的长度或高度来表示数据类型的图形。二、统计图(二)直方图、折线图和曲线图(1)直方图直方图是用直方形的宽度和高度来表示次数分布的图形。二、统计图(二)直方图、折线图和曲线图(2)折线图折线图可以在直方图的基础上,利用各组的组中值与次数求得坐标点,再用折线将其连接而成。二、统计图(二)直方图、折线图和曲线图(3)曲线图当变量数列的组数无限增多时,曲线便近似地表现为一条平滑曲线。二、统计图(三)茎叶图茎叶图通常用来显示未分组资料的分布特征,它既能显示数据的状态,又能给出每一个原始数值。茎叶图是将每一个数据分为两部分:“茎”和“叶”。通常将数据的高位数值作为茎,低位数值作为叶而依附于茎之上。茎叶88091030606070101010305050708080110000304050607070808090120010303050505060607070131020506070808014102020601510801630第四节利用EXCEL进行统计整理与描绘统计图
编制分布数列绘制统计图一、编制分布数列对于【例2-1】,可以运用EXCEL来编制频数分布、累计频数分布,步骤如下:1.输入数据。A、B、C列为原始输入数据(除最后一组上限用函数求得外),其他列为计算所得数据。消费额放在A2:A51单元格区域,表中未完全显示出来。B列中的各个数据则是使用Frequency函数或[直方图]分析工具编制分布数列所必需的数据。一、编制分布数列图2-14一、编制分布数列2.选定D2:D9,输入公式“=FREQUENCY(A2:A51,B2:B9)”,然后按CRTL+SHIFT+ENTER组合键,即可计算出各组的频数。该函数的第一个参数指定用于编制分布数列的原始数据,第二个参数指定每一组的上限。在D10中输入公式“=SUM(D2:D9)”计算出频数的合计。注意:在使用Excel的Frequency函数编制分布数列时,使用“上限在内”的原则,与本教材介绍的一般统计分组原则有别。若要遵循“上限不在内”原则,在确定Frequency函数所需的分组上限时,应用使其尽量接近统计分组中的上限,但又不与任何的原始数据相同(请参见图2-14中B列数字)。此外,“1500以上”这一组的上限可以使用原始数据的最大值,它可通过函数求得,在B9中输入公式“=MAX(A2:A51)”即可。一、编制分布数列3.计算频率。在E2中输入公式“=D2/D$10*100”,然后选定E2:E9区域,按Ctrl+D组合键,即可将该公式复制到E3:E9区域。4.计算向上累计频数。在F2单元格中输入“=D2”,在F3单元格中输入公式“=D3+F2”,再将公式复制到F4:F9。5.计算向下累计频数。在G9中输入公式“=D9”,在G8单元格输入公式“=G9+D8”,再将公式复制到G2:G7单元格区域即可。可以采用向上填充的方法复制公式,即选定G2:G8单元格区域,然后点击菜单[编辑][填充][向上填充]。二、绘制统计图借助EXCEL绘制统计图,以直方图为例,主要操作步骤如下:1.使用图2-14所示数据,直方图所需数据在C1:E9单元格区域,选定该区域。2.点击菜单[插入][柱形图],在弹出的菜单中选择二维
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宠物饮食成分对健康的影响试题及答案
- 二手车市场调研与分析试题及答案
- 日常诊疗管理流程图解
- 美容师考试与法律法规相关知识及试题答案
- 不同宠物的营养知识库建设试题及答案
- 探讨新药研发中的挑战与解决策略试题及答案
- 2024年国家食品政策调整分析试题及答案
- 深入研究2024计算机基础考题试题及答案
- 2024年美容师考试对于创新能力的全面解读试题及答案
- 浙江省杭州市重点学校2022-2023学年高一下学期期中考试生物学试题(含答案)
- GB/T 36548-2024电化学储能电站接入电网测试规程
- MOOC 计算机组成与CPU设计实验-江苏大学 中国大学慕课答案
- 第一次月考测试卷(试题)-2023-2024学年人教版六年级数学下册
- 生产车间5S稽核评分表
- 室外地下综合管网管道安装工程施工方案(技术标)(1)
- 纳税信用修复申请表
- 最新苏教版五年级数学下册第四单元 数学教案
- 以化妆用品与手法的古今对比探讨昆曲的历史变迁
- 健康档案管理系统
- IEC60826线路设计中文版
- 学生资助政策宣传主题班会PPT课件
评论
0/150
提交评论