《应用统计基础(第3版)》课件第三章 统计整理_第1页
《应用统计基础(第3版)》课件第三章 统计整理_第2页
《应用统计基础(第3版)》课件第三章 统计整理_第3页
《应用统计基础(第3版)》课件第三章 统计整理_第4页
《应用统计基础(第3版)》课件第三章 统计整理_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计整理本章教学内容第一节统计整理概述第二节统计分组

第三节统计分布第四节统计表第三章统

整理

第一节统计整理概述一、统计整理的概念和意义

1.概念

◆统计整理是根据统计研究的目的和任务,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。

2.意义:

(1)统计整理是统计工作中一个十分重要的中间环节,它既是统计调查阶段的继续,又是统计分析阶段的前提和基础。

(2)统计整理实现了从个别单位的标志值向说明总体数量特征的指标值的过渡,是对社会经济现象从感性认识上升到理性认识的过渡阶段。二、统计整理的原则和步骤(内容)

(一)统计整理的原则:要抓住最基本最能说明问题本质特征的统计分组和统计指标,对统计资料进行加工整理。(二)统计整理的步骤(内容)

1.设计和编制统计整理方案

2.对原始资料进行审核

3.按要求进行分组或分类,编制分配数列

4.根据分组分类情况进行汇总(现在主要采用电脑汇总)和计算,得出各项指标值。

5.编制统计表,用统计表体现分组、汇总的结果

6.做好统计资料的汇编和积累统计整理的步骤制定统计整理方案对原始资料进行审核数据处理制作统计表或统计图统计数据的处理:统计资料的分组、汇总及制表第二节统计分组

一、统计分组的概念

统计分组是根据统计研究的任务和目的,将总体按照一个或几个标志划分为若干个性质不同又有联系的部分。例1:某班学生(20人)总体按性别标志分组情况按性别分组分组前分组后女生8人占40%男生12人占60%例2:

汉族12人,占60%回族5人,占25%满族3人,占15%1.按民族分组20岁5人,占25%21岁5人,占25%22岁2人,占10%2.按年龄分组中共党员8人,占40%团员12人,占60%3.按政治面貌分组23岁8人,占40%4.按性别分组(参前例)则:二、统计分组的意义和作用

统计分组是基本的统计方法之一,通过分组把总体中具有不同性质的单位分开,把性质相同的单位合在一起,保持组内资料的同质性和组间资料的差异性,正确地反映出统计总体的本质特征,以便进一步运用各种统计方法,研究现象的数量表现和数量特征。

统计分组法在统计认识中的作用是多方面的,主要有以下三方面:

1.划分事物的类型:不同类型的事物有不同的特点、性质和规律,只有通过科学的分组才能达到对不同类事物和总体的认识。中小企业分类

2011年6月18日,工业和信息化部、国家统计局、国家发展和改革委员会、财政部联合印发了《关于印发中小企业划型标准规定的通知》:通知中细分了企业规模类型,将企业分为大、中、小、微型。这次划型标准修订重要突破和亮点在于新增加了微型企业标准。小型和微型企业将成为今后政策扶持的重点。2012年宁波市哲学社会科学规划课题:宁波小微企业发展中存在的问题与对策研究2.揭示现象内部结构:一是从静态上来看,各组占总体比重大小的不同,对总体的影响也不同,比重相对大的决定着总体的性质或结构类型;二是从动态上来看,观察各组比重的变化过程能更加深刻的认识现象和事物发展的规律和趋势。——第四、五两章内容

3.分析现象之间的依存关系:不同现象之间的依存关系是一种比较紧密的联系,而统计分组法是分析研究此种关系最基本的一种方法。具体运用时关键是要分清影响因素(自变量)和结果因素(因变量)——第六章内容

『参下例』按企业工人人数分组职工人数企业数(个)工人数(人)销售额

(万元)劳动

生产率500人以下6128010000.781500——10007533054601.0241000人以上56890116001.684合计1813500180601.338例:上表反映了该企业的劳动生产率随着职工人数(规模)的增加而提高,二者之间存在着正依存关系。

耕地按耕作深度分组(厘米)地块数平均收获率(千克/每亩)10-1212-1414-1616-1818-2071016125200230270310340上表反映了该农作物的收获率随耕作深度的加深而提高,显然存在着正依存关系。在社会经济现象中,还有很多存在这种关系,如:收入-消费、人口的文化程度-生育率等等。影响因素结果因素例:中国小微企业生存现状面面观来自:中国质量新闻网

2012-8-24

中国小微企业是给力经济发展的“轻骑兵”,其工业总产值、销售收入、实现利税大约分别占中国经济总量的60%、57%和40%,提供了75%的城镇就业机会。据国家工商总局的数据显示,目前我国西部10省市的小微企业超过160万户,占全国企业实有总户数的16.16%;中部9省市的小微企业超过220万户,占全国企业总户数的22.24%;东部12省市的小微企业超过600万户,占全国企业总户数的61.6%。这些约1000万家小微企业主要密集在长三角地区、珠三角地区和福建省等5个省市。在相继袭来的国际金融危机、欧债危机等经济寒流中,广大的小微企业生存状况如何?他们能否实现转型升级?各地政府尤其是海关、检验检疫等部门怎样扶持小微企业发展……站在浪尖上跳舞

作为国民经济的重要组成部分,小微企业的生存状态直接关系到国民经济的健康发展,但复杂多变的国内外经济形势,让大多数小微企业一直在浪尖上跳舞。据国家统计局对全国3.9万户规模以下工业企业抽样调查,今年一季度,工业小型微型企业经营状况好或很好的比例仅为21.1%,比去年底下降了1.7个百分点。其中,微型企业经营状况好或很好的比例仅为18.3%。企业普遍反映,目前出现了“订单荒”,尤其是广东、浙江、重庆等地制造业出口企业,订单普遍减少了20%~30%。三、统计分组的种类

统计分组可以按照不同的标准进行分类,一般有以下几种分类:

1.按分组标志的性质划分:统计分组分为品质分组和数量分组。品质分组是按品质标志进行的分组。变量分组是按数量标志的分组。

[前例]汉族12人,占60%回族5人,占25%满族3人,占15%1.按民族分组品质分组22岁2人,占10%20岁5人,占25%21岁5人,占25%2.按年龄分组23岁8人,占40%数量分组2.按分组标志的多少划分:统计分组分为简单分组和复合分组。简单分组是对研究的总体仅按一个标志进行的分组;复合分组是对研究的同一总体选择两个或两个以上标志层叠起来进行的分组。

前例:男12人,占60%女8人,占40%按性别分组简单分组:复合分组:男12人女8人按性别分组按政治面貌分组团员4人中共党员4人团员8人中共党员4人按政治面貌分组四、分组体系

1.概念:统计分组体系是指在统计整理中,为研究现象总体的情况而运用多个分组标志对总体进行分组,从而形成一系列相互联系、相互补充的分组体系。

2.分类:平行分组体系和复合分组体系。

★平行分组体系就是对同一总体进行若干次简单分组。『参前例2』

★复合分组体系就是对某一总体进行某种复合分组。『参前』五、分组标志的选择

分组标志的选择是分组的关键。在统计整理中,选择什么样的标志就会形成什么样的分组体系。且分组标志一经确定,就突出了总体在此标志下的性质差异,而掩盖了总体在其他标志下的差异

所以,根据统计研究的目的,在对研究对象进行分析的基础上,抓住具有本质性的区别及反映现象内在联系的标志来作为分组的标志。

例:欲了解我校的师资梯队和水平情况,就应该选取职称标志和年龄标志进行分组。若想了解我校学生的来源情况,就应该选取籍贯标志进行分组。六、统计分组的方法

1.按品质标志分组:

(1)涵义:以品质标志为分组标志,并在品质标志的变异范围内划定各组界限。

(2)具体情况:按品质标志进行的分组,有组与组之间界限明确、划分简单的情况;如学校学生按性别标志分为男、女两组。也有划分较麻烦、归类比较困难的复杂情况。在进行具体分组时,对于复杂情况的划分,国家统计部门已经按有关分类标准,规定了统一的分类目录,对有关内容进行了统一规定,以作为分组的统一依据,供长期使用。

2.按数量标志分组:

(1)涵义:以数量标志为分组标志,确定各组的数量界限,并通过数量上的变化来区分各组的类型和性质。

(2)具体情况:按数量标志进行的分组,有单项式和组距式两种分组方式,具体采用哪一种方式要根据变量的类型和变量值数量多少来定。

①单项式分组。单项式分组是对于变量值较少的离散型变量而言,将变量值依次排列,每一个变量值作为一组。

例如:按人口数对某地居民户进行分组每户人口数户数每户人口数户数13052002100612036597314356810②组距式分组。组距式分组是对于连续型变量和变量值较多的离散型变量而言,将整个变量值依次划分为几个区间,一个区间内的所有变量值作为一组。

例1:某地区的高等院校按在校生人数(离散型变量)分组,可分为999人以下,1000-2999人,3000-4999人,5000人以上等四组。

例2:某班的学生按身高(连续型变量)分组,可分为1.4-1.5米,1.5-1.6米,1.6-1.7米,1.7-1.8米,1.8-1.9米六组。再如企业按产量计划完成程度、利税率分组、工人按劳动生产率分组等。对组距式分组必须要弄清如下几个问题和概念:组距、组数、组限、组中值等。思考

1、统计分组时组数不能太多也不能太少,为什么?2、抽样调查和重点调查、典型调查的根本区别?第三节次数分布一、次数分布及次数的概念

1.次数分布是在统计分组的基础上,将总体的所有单位,按组归并排列,从而形成总体中的各个单位在各组间的分布。又称为分配数列。

2.分布在各组的个体单位数叫次数。次数可以用绝对数表示,即频数;也可以用结构相对数表示,即频率或比率或比重。二、分配数列的种类由于统计分组是按照统计标志进行的,因此,分配数列相应的也有品质分配数列和变量分配数列两种。

1.品质分配数列的含义和编制:

品质分配数列是按照品质标志进行分组所编制的分配数列(简称品质数列)。它由各组名称和次数组成。

例子1:

某班学生的性别构成情况按性别分组绝对数人数比重(%)男女1286040合计20100各组名称频数比率或频率

按性别分组绝对数人数比重(%)汉回满1253602515合计20100各组名称频数比率或频率某班学生的民族构成情况例子2:2.变量分配数列

(1)概念:变量分配数列是按照数量标志进行分组所编制的分配数列(简称变量数列)。它也是由各组名称和次数组成。(2)变量数列的种类:单项式数列和组距式数列。单项式数列是按单项式分组而形成的数列(见例1)。组距式数列是按组距式分组形成的分配数列(见例2)。

例1:

某班学生年龄情况表按年龄分组(岁)人数(人)比重(%)20212223552825251040合计20100例2:某班学生身高情况表

按身高分组(米)人数(人)比重(%)1.4-1.51.5-1.61.6-1.71.7-1.81.8-1.9464422030202010合计20100各组名称频数频率三、变量数列的编制

(一)单项式数列的编制:

单项式数列是对于总体单位数不多的离散型变量而言的,先按每一个变量值分组,列于数列的左方,再将各变量值出现的次数列于数列的右方,即构成单项式数列。在此种数列中,一个变量值就是一组,不存在组距问题,组数即等于变量值的数目。

(参前面的例子1)

(二)组距式数列的编制:

组距式数列是对于连续型变量和变量值较多的离散型变量而言,其基本做法是先将整个变量值依次划分为几个区间,也就是分成几个组,把其列于数列的左方,再将出现在每个区间内的变量值的次数列于数列的右方,即构成组组距式数列。编制这种数列牵涉的问题相对较多。主要有组距、全距、组数、组限、组中值、等距数列和异距数列等问题。

(参前例2和下例)

人口按年龄分组人口数(万人)比重(%)1岁以下1岁-6岁7岁-15岁16岁-60岁60岁以上1512252合计45例:某地区人口分布状况★关于编制此种数列的若干问题:

1.组距:指的是组距数列中各组变量值从小到大的距离,也即是区间的距离和长度。

2.全距:也称极差,指的是全部变量值中,最大值和最小值的差。

4.等距数列和不等距数列:前者是指按照相等的组距划分的组距数列;后者是指按照不相等的组距划分的组距数列。

5.组数:指的是根据一定的组距划分的区间的数目。组数的多少与组距的大小呈反方向变化的关系。在等距数列中有以下关系式:

6.组限:

(1)含义:指的是组距数列中,每个组的两端的变量值。其中每组的最小值叫下限;每组的最大值叫上限。

(2)组限的表示:若变量是离散型,相邻两组的上下限用两个连续自然数表示;若变量是连续型,相邻两组的上下限应用同一变量值表示,即相邻两组的上下限必须重叠,若出现此情况,一般应把此值归入下限的那以组,这也叫做“上组限不在组内的原则”。

(3)开口组和闭口组:若某组变量值同时具有上限和下限称为闭口组;若某组变量值仅具有上限或下限则称为开口组,一般为最高组或最低组。7.组中值:(1)含义:下限与上限之间的中点数值叫组中值。(2)组中值的计算:计算公式:8.等距数列的编制步骤:

(1)将原始资料排序,并计算全距。

(2)确定组数和组距。

(3)确定组限。

(4)计算各组的次数,整理编制次数分布表。

9.异距数列的情况:

第一种办法是将不等组距的次数换算为标准组距次数。标准组距可以选用数列中的最小组组距。

第二种办法是计算次数密度。公式如下:

例:某工厂工人年龄分布情况工人按年龄分组组距人数(人)标准组距人数次数密度25-3030-3535-4545-505510540706510407032.5108146.52合计-185--四、累计次数分布

1.向上累计:是将各组次数和比率由变量值低的组向变量值高的组逐组累计。

2.向下累计:是将各组次数和比率由变量值高的组向变量值低的组逐组累计。

例:某班学生身高情况表按身高分组(米)人数(人)比重(%)1.4-1.51.5-1.61.6-1.71.7-1.81.8-1.8204416610104146418222010020208030505020703020901010100合计20100向上累计向下累计向上累计向下累计五、次数分布的图形表示法

1.直方图

2.曲线图各组组限各组次数六、次数分布的主要类型1.钟型分布2.U型分布3.J型分布第四节统计表一、什么是统计表

1.广义:

用于统计工作各个阶段的任何反映统计资料的表格都是统计表,如用于调查阶段的调查表,用于统计整理阶段的整理表,用于统计分析阶段的分析表等。

2.狭义:专指用于统计整理阶段的整理表,即是指把经过整理汇总的资料,按照一定的顺序集中而有条理地反映出来的一种表格。(参看前面的例子)

3、作用:(1)使大量的统计资料系统化、条理化,更清晰地表述统计资料的内容。(2)便于比较各项目(指标)之间的关系,便于计算。(3)比文字叙述更紧凑、简明、醒目,一目了然。(4)积累和保存统计资料的良好方式。二、怎么样来看统计表(一)统计表的结构10020合计6025151253汉族人数回族人数满族人数比重(%)绝对数(人)按民族分组

例:

某班学生的民族构成情况主词宾词纵栏标题总标题横行标题指标数值1.形式结构:由总标题、横行标题、纵栏标题和指标数值等要素组成。总标题表的名称,用于概括统计表中要说明的内容。横行标题各组的名称,反映总体各组成部分的。纵栏标题分组标志或指标的名称,说明纵行所列各项资料的内容。指标数值统计表的具体内容,每一项数值由相应的横行标题和纵栏标题限定,可以是总体单位数,也可以是标志总量,或者平均数、相对数等,也称数字资料。2.内容结构:由主词和宾词构成主词是统计表所说明的总体,总体的各组或各组的名称。宾词是用于说明主词的各种指标。

(二)统计表的种类

1.按主词的分组情况分类(1)简单表:即主词不经过任何分组的统计表,或是罗列各单位名称或是按时间顺序排列。(参教材中表3-14)(2)分组表:即主词按某一个标志分组的统计表,也就是按简单分组形成的统计表。(参教材中表3-13)(3)复合表:即主词按两个或两个以上的标志进行复合分组的统计表。(参教材中表3-15)注意平行分组体系和复合分组体系。复合表举例

某年某地区工业净产值和职工人数项目净产值(万元)职工人数(人)国有大975013800中860045000小420010050集体大73007500中520010400小44004500合计3945091250宾词指标的设计1简单设计案例:某地区工业企业的工人性别和工龄按所有制形式分组企业数工人人数性别工龄男女1年以下1-3年3-5年5-10年10年以上(甲)(1)(2)(3)(4)(5)(6)(7)(8)(9)国有经济集体经济合计宾词指标的设计2复合设计某地区工业企业的工人性别和工龄企业按所有制分组企业数工人人数工龄1年以下1-3年3-5年5-10年10年以上男女计男女计男女计男女计男女计男女计(甲)(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)(15)(16)(17)(18)(19)国有经济集体经济合计统计表的编制规则

统计表应遵循科学、实用、简练、美观的原则进行设计。

1、统计表通常应设计成由纵横交叉线组成的长方形表格,长宽之间应保持适当的比例。2、统计表的总标题要用概括、简练的文字说明表的内容,并在总标题内或在其下注明资料所属的时间、地区和单位。纵横各栏的排列要注意表述资料的逻辑系统,反映现象的内在联系。3、统计表的主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各项目,再列总计。如果没有必要列出所有项目时,可以先列总计,而后再列其中一部分重要的项目。4、统计表的格式一般是开口式,即表的左右两端不画纵线,上下用粗线或双线封口。在有些需要明显分隔的部分也应用粗线或双线,其他则用细线。在横行和合计栏、横行与纵栏标题间要划线。5、统计表中的指标有一定的计算关系,还可以用算式表示。对于栏数较多的统计表,通常加以编号。一般主词的计量单位栏用(甲)、(乙)、(丙)……等次序编号,宾词各栏用(1)、(2)、(3)………等次序编号。6、统计表中的数字要注明计量单位。如果表中的数字属同一计量单位,可将计量单位标在表的右上方;如果宾词的计量单位不同,可直接标注在纵栏标题的旁边或下方;如果主词的计量单位不同,可在横行标题后设计计量单位专栏。7、统计表中数字应填写整齐,对准位数。一般是右对齐,对于小数应按小数点对齐,且小数点的位数应统一。当数字为0或遇数小可略而不计时,要写上0,不得留空;当缺少某项数字时,用“…”表示;不应有数字时用符号“—”表示;遇有相同数字应照写,不得用“同上”、“同左”或“…”等符号。8、必要时,应在统计表的下端加注说明或注解、资料来源等。统计图:统计资料整理成统计表后,可以比较清晰地展示变量的变化规律。为了使这种规律更有直观性,常采用统计图表示。包括:线图、条形图、圆饼图等第五节统计图线图(Linegraph)(亿元)例:在一项有关住房问题的研究中,研究人员在甲、乙两个城市各抽样调查300户家庭,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”(1)非常不满意;(2)不满意;(3)一般;(4)满意;(5)非常满意。回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意248.0248.0300100.0不满意10836.013244.027692.0一般9331.022575.016856.0满意4515.027090.07525.0非常满意3010.0300100.03010.0合计300100.0————表甲城市家庭对住房状况的评价累计户数(户)累计户数(户)(a)向上累积(b)向下累积图甲城市家庭对住房状况评价的累计频数分布图条形图(Barchart)(亿元)图某城市居民关注不同类型广告的人数分布频数(人)某车间工人日加工零件数的直方图105110115120125130135140日加工零件数(个)频数(人)直方图直方图与条形图的差别

(1)条形图用宽度表示类别,宽度都相等,而直方图用宽度表示组距,宽度可以不相等(2)条形图通常分开排列,而直方图则是连续排列圆饼图(Piechart)图某城市居民关注不同类型广告的人数的构成图甲、乙两城市家庭对住房状况的评价环形图例如:某年我国城乡居民家庭平均每人各项消费支出数据如下表,试绘制雷达图。表某年我国城乡居民家庭平均每人各项消费支出项目城市居民农村居民食品1942.59890.28衣着520.91109.41家庭设备用品及服务316.8985.41医疗保健179.6862.45交通通讯232.9053.92娱乐教育文化服务448.38148.18居住358.64233.23专项商品与服务185.7034.27合计4185.601617.15雷达图图某年我国城乡居民家庭消费支出某集团总公司下属单位2009年9月销售情况如下单位工人数销售额

(万元)完成销

售%单位工人数销售额

(万元)完成销

售%甲一公司32025090丙一公司8070103二公司470360102二公司10090101三公司58041095三公司13010099四公司760980125四公司180130100五公司840720105丁一公司620650100乙一公司800980106二公司9101000104二公司82072093三公司11001250105三公公公司12601440115

合计1350018060

五公据上述资料:1、按计划完成程度分组整理出一个统计表;2、按企业的工人数分组表明企业人数与工人劳动生产率之间的关系。按计划完成程度分组计划完成程度%企业数(个)工人数销售额

(万元)90——100418501480100——110951005250110——1203

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论