统计数据的整理_第1页
统计数据的整理_第2页
统计数据的整理_第3页
统计数据的整理_第4页
统计数据的整理_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计数据的整理一、统计整理(一)定义:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。对已整理过的资料(包括历史资料)进行再加工也属于统计整理。(二)意义:1、通过统计调查可以取得第一手资料,但这种资料只能反映总体各单位的具体情况,是分散、零碎、表面的。要说明总体情况,揭示出总体的内在特征,还需要对这些资料进行加工整理,使之系统化,以便通过综合指标对总体作出概括性的说明。2、统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。统计整理是统计调查的继续,又是统计分析的基础。统计调查所搜集到的资料,只有通过科学的审核、分类、汇总等整理工作,才能使统计在认识社会的过程中,实现由个别到全体、由特殊到一般、由现象到本质、由感性到理性的转化,才能从整体上反映出事物的数量特征。否则统计调查所得的资料再丰富、再完备,其作用也发挥不出来,统计调查就将徒劳无益,统计分析也将无法进行。3、统计整理还是积累历史资料的必要手段。统计研究中经常要用动态分析,这就需要有长期累积的历史资料,而根据积累资料的要求,对已有的统计资料进行筛选,以及按历史的口径对现有的统计资料重新调整、分类和汇总等,都必须通过统计整理工作来完成。(三)程序:1、设计整理方案:分组和分组体系;统计指标2、对搜集到的资料进行审核:对调查资料进行审核是统计整理的第一步,包括以下内容:(1)完整性和及时性完整性,就是看调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。及时性,是看填报单位是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。(2)审核资料的正确性:审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有两种:逻辑检查:首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。例:一张调查表中,年龄是9岁,职业是教师,其中必有一个是错误的。若在某行业的报表中,企业规模为大型,而职工人数则是100人,这其中也必有一错。其次,是检查各项目之间有无相互矛盾的地方。例:企业的净产值大于同期总产值就是明显的逻辑错误。计算检查:即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。例:各分项之和=总计各比例之和=100%3、对数据资料的分组和汇总:根据研究目和统计分析的需要,选择整理的标志,并进行划类分组。统计分组是统计整理的重要内容和统计分析的基础,只有正确的分组才能整理出有科学价值的综合指标,并借助这些指标来揭示现象的本质与规律。在分组的基础上,将各项资料进行汇总,得出反映各组和总体数量特征的各种指标。4、统计资料的显示:即通过编制统计表和绘制统计图,将整理出的资料简捷明了、系统有序地显示出来。5、对统计数据分门别类地积累和保管。二、统计分组(一)统计分组的含义概念:根据社会经济现象的特点和统计研究的目的要求,按照一定的标志把总体划分为若干不同性质的组或类型,称为统计分组。统计分组的对象是总体,统计分组的标志可以是品质标志,也可以是数量标志。统计分组的深层次理解:从分组的性质来看,分组兼有“分和合”双重含义。(1)对于现象总体而言,是“分”,即把总体分为性质相异的若干部分;对于总体单位而言,是“合”,即把性质相同的许多总体单位合为一组。(2)对于分组标志而言,是“分”,即按分组标志将不同的标志表现分为若干组,对于其他标志而言,是“合”,即在一个组内的各单位即使其它标志表现不相同也能结合在一组。由此可见,选择一种分组方法,突出了一种差异,显示了一种矛盾,必然同时掩盖了其他差异,忽略了其他矛盾。不同的分组方法,可能得出不同的结论。缺乏科学根据的分组,不但无法显示事物的根本特征,甚至会把不同性质的事物混淆在一起,歪曲社会经济现象的本质。因此,统计分组必须先对所研究现象本质作全面地、深刻地分析,确定所研究现象类型的属性及其内部差别,而后才能选择反映事物本质的正确的分组标志。(二)统计分组的原则穷尽原则:就是使总体中的每一个单位都有组可归,或者说各分组的空间足以容纳总体所有的单位。例如,文化程度:小学毕业、中学毕业(含中专)、大学毕业文盲及识字不多、小学程度、中学程度、大学及大学以上互斥原则:就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时或可能归属于几个组。例如,服装:男装、女装、童装(三)统计分组的作用区分社会经济现象的类型。社会经济现象千差万别,要了解各种社会经济现象的性质、特点及其相互关系,必须根据某种标志把它们划分为性质不同的类型,以便揭示不同社会经济现象的质的差异。例:国民经济按产业分组;农业分成农、林、牧、渔业各组;这些分组也叫类型分组。如下表是我国城镇居民家庭收入消费性支出按商品类别分组的统计表,它将全部消费品分为八大

类,尽管它们同属于消费品,但在效用上却有“质”的差别。通过这种分类,可以反映我国居民和社会集团的商品性消费中不同类别的商品所占的地位和作用,也为进一步研究我国消费品零售额的水平与结构提供了便利条件。我国城镇居民家庭人均消费支出及构成按商品类别分组零售额(元)构成(%)食品类衣着类家庭设备用品及服务类文化娱乐用品类交通通讯类医疗保健类居住类杂项商品类合计2.揭示社会现象的内部结构。从数量上反映总体内部的结构是统计研究的重要任务。总体的内部结构可体现部分与整体的关系以及各部分之间存在的差别和相互联系,反映事物从量变到质变的过程,帮助人们掌握事物的特征,认识事物的性质。我国人口就业构成变化表(%)产业类别198019902000第一产业68.760.150.0第二产业18.221.422.5第三产业13.118.527.5分析社会现象之间的依存关系。社会经济现象之间广泛地存在着相互依存的关系,如农作物的耕作深度与收成率之间、合理密植与农产量之间、家庭的工资收入与生活费支出之间、工人技术级别与产品质量之间、工人劳动生产率与产品成本之间、市场商品价格与其需求量之间等等,都在一定程度上存在相互依存的关系。所有这些依存关系,都可通过统计分组分析出影响因素与结果因素之间的变动规律。例:商品销售额与流通费用率的关系按销售额分组(万元)商店数(个)流通费用率(%)100以下109.8100〜300128.7300〜500117.5500〜70096.5说明随着商品销售规模的扩大流通率降低(负依存关系)(四)统计分组的种类按分组的作用或目的不同:类型分组、结构分组和分析分组。按分组标志的多少简单分组和平行分组体系简单分组:只用一个标志对总体分组平行分组体系:对同一总体选择两个或两个以上标志分别进行简单分组。复合分组与复合分组体系复合分组:对总体按两个或两个以上的标志进行的重叠式分组,即在按某一标志分组的基础上再按另一标志进一步分组。例:按分组标志的性质不同品质分组:数量分组:(五)统计分组的方法分组标志的选择:根据统计研究的目的和要求选择最合适的标志统计分组是为统计研究服务的,统计研究的目的不同,选择的分组标志也应有所不同。例如,同是以工业部门为研究对象,当研究的目的是为了分析部门中各种规模的企业的生产情况时,应该选择产品数量或生产能力作为分组标志;当研究目的在于确定工业内部比例及平衡关系时,应该以行业为分组标志,将工业部门划分为重工业与轻工业或冶金、电力、化工、机械、纺织、煤炭等工业行业。必须选择最重要的标志作为分组依据社会经济现象纷繁复杂,研究某一问题可能涉及许多标志,科学的统计分组则应从中选择与统计研究的目的、与有关事物的性质或类型关系最密切的标志,即最主要或最本质的标志作为统计分组的依据。例如,根据统计调查资料,研究人民生活水平变动情况时,可供选择的分组标志有:家庭人口数、每户就业人数、每一就业者负担人数、家庭总收入、平均每人月生活费收入等。而其中最能反映人民生活水平变动的标志是平均每人月生活费收入,故应选择这一标志作为分组标志。要考虑到社会经济现象所处的具体历史条件客观事物的特点和内部联系随着条件的变化而不同,因此选择分组标志时,要具体情况具体分析,根据事物的不同条件来选择分组标志。[例如,同是划分企业规模,在劳动密集型的行业或地区,可采用职工人数作为分组标志;而在技术密集型的行业或地区,则应选择固定资产价值或生产能力作为分组标志。]分组界限的划分(分组标志确定后,分组界限便成为数据分组的重要问题)(1)按属性分组时,确定各组的界限有两种情况:①组限是自然形成的或比较明显的;例如,人口按性别、文化程度、党派分组等。②由于存在属性之间的过渡形式,使分组界限难以确定。这种比较复杂的属性分组,国家有关部门都制定有标准的分类目录,分组时可以依据分类目录来确定组限。例如,人口按职业分组,企业按行业分组,产品按经济用途分组等。(2)按变量分组时,应注意以下两点:分组时各组数量界限的确定必须能反映事物质的差别。例如,学生学习成绩分组,不能把55分和65分合为一组,因为这样的分组未区分及格与不及格的质的差别。其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限和组数。三、次数分布与变量数列(一)次数分布:在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算各组的单位数称为频数分布,或次数分布。(二)次数分布的两个要素组名:总体按某标志所分的组频数(次数)和频率:各组的单位数叫频数,各组的单位数与总体单位总数之比叫频率。频率具有如下两个性质:f(1)各组频率都是界于0和1之间的一个分数。即:0Y专Y1(2)各组频率之和等于1。即£§=1(三)次数分布的种类品质分布数列:它是经过属性分组后形成的频数分布,其组别表现为一系列的概念或范畴。例:_某校学生按性别分组表性别学生数(人)比率(%)男234055.32女189044.68合计4230100.00变量分布数列:它是经过变量分组后形成的分布数列,其组别表现为不同的数值或数域。例:某居委会500户家庭按人口分组表按人口分组(人)家庭数(个)比率(%)110225010320040415030550105以上408合计500100⑴单项式数列:是以一个变量值为一组编制的变量频数分布。适用于:离散型变量且变量变动范围不大的场合。例:上表⑵组距式数列:是以表示一定变动范围的两个变量值构成的组所编制的变量频数分布。就是将变量依次划分为几段区间,一段区间表现为“从……到……”距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。区间的距离就是组距。适用于:连续型变量或者变动范围较大的离散型变量。例如,反映居民居住水平情况按人均居住面积分组分为:4平方米以下,4-6平方米,6-8平方米,8平方米以上等4组。再如了解某班学生成绩情况,按成绩进行组距式分组。例:第五次人口普查大陆人口年龄分布按年龄分组人数(万人)比率(%)0〜142897922.8915〜648879370.1565及65以上88116.96合计126583100.00注:上限、下限、组限、组距、组中值、等距、不等距、开口式。(四)变量数列的编制单项式数列的编制(项数不多,变异幅度不大的离散型变量)(1)将原始资料按变量值大小的顺序排列(2)按变量值分成若干组(3)设计整理表,整理出变量值出现的次数例:某班级20名学生周上网次数情况如下(单位:次):35423612334324634125组距式数列的编制(1)排序并计算全距(2)确定组数与组距:变量值比较均匀:等距数列变量值分布不规律:不等距数列有特大特小极端数值:第一组、最后一组为开口式(3)确定组限:-对于正指标:“上限不在内”逆指标:“下限不在内”-对于离散型变量分组:间断分组(组限不相连)例:儿童按年龄分组分为未满1岁,1-2岁,3-4岁,5-9岁,10-14岁。连续型变量分组:重叠分组(组限重叠)例:工人按工时定额完成程度分组分为90-100%,100-110%,110-120%等组。(4)计算次数,编制次数分布表例:根据抽样调查,某月某市50户居民购买消费品支出资料如下(单位:元):83088012301100118015801210146011701080105011001070137012001630_12501360127014201180103087011501410117012301260138015101010860810__1130114011901260135093014201080101010501250116013201380131012701250对上述资料采用等距分组,分为8组,组距为100,以800为第一组下限。经过整理,得出计算结果如下表。某市50户居民某月购买消费品支出情况表单位:元按户月消费品支出额分组(气.)频数(f)i频率800〜90050.10900〜100010.021000〜110080.161100〜1200110.221200〜1300110.221300〜140070.141400〜150040.081500以上30.06合计501.00通过对总体各单位分组而形成变量数列,显示了各单位标志值在各组间的分布状况,从而使杂乱无章的原始数据显示出一定的规律性。从上表可以看出,月消费品支出额在1000-1300元的居民户占全部户数的60%,而低支出和高支出居民户所占比重较小,呈现出一种近似“两头小,中间大”的钟型分布特征。累次频数累次频率向上累计:即先列出各组的上限,然后由标志值低的组向标志值高的组依次累计表明该组上限以下的各组单位数之和或比率向下累

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论