大学统计学原理经典第二章统计调查与整理课件_第1页
大学统计学原理经典第二章统计调查与整理课件_第2页
大学统计学原理经典第二章统计调查与整理课件_第3页
大学统计学原理经典第二章统计调查与整理课件_第4页
大学统计学原理经典第二章统计调查与整理课件_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章统计调查与整理

1第一节统计调查方案第二节统计调查的组织形式第三节统计分组第二章统计调查与整理第四节分配数列第五节统计表2①熟悉统计调查方案设计的基本内容;②掌握统计调查的各种组织形式;③理解统计整理的含义、要求与步骤;④理解统计分组的意义,正确掌握统计分组方法;⑤掌握分布数列、尤其是变量数列的编制方法;⑥了解统计表的结构、种类和编制方法;

学习要求3第一节统计调查方案一、统计调查的意义和要求统计调查就是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集各项原始资料的过程。(一)统计调查是人们认识社会的基本方式(二)统计调查是统计工作中的基础环节(三)统计调查理论和方法在统计学原理中占有重要地位4二、统计调查方案设计确定调查对象和调查单位确定调查时间和调查期限制定调查的组织实施计划选择调查方法

确定调查项目确定调查目的统计调查方案的内容5调查对象我们需要进行研究的总体范围。即调查总体。

调查单位也就是总体单位,即所要登记的标志的承担者。填报单位负责上报调查资料的单位。(二)确定调查对象和调查单位举例:2000年人口普查规定:“人口普查对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人”。7注意:调查单位与填报单位的区别:填报单位一般为在行政上、经济上具有一定独立性的单位,而调查单位可以是人、单位、也可以是物。例:要了解全国商业企业的生产经营情况,则:调查对象-----全国所有商业企业调查单位----每一个商业企业报告单位----每一个商业企业例:要了解全国工业企业设备利用情况,则:调查对象-----工业企业的所有设备调查单位-----每一台设备报告单位-----每一个企业8例:全国人口普查调查项目:1982年(第三次):13项人记录、6项户记录1990年(第四次):15项人记录、6项户记录2000年(第五次):26项人记录、23项户记录10要区别调查时间和调查期限的不同:调查时间是指调查资料所属的时间(时点或时期);-调查期限是指调查工作的起讫时间。(四)确定调查时间和调查期限譬如第六次人口普查的调查时间是2010年11月1日0时,而调查期限为10天。11例:1995年第三次全国工业普查,对全部工业企业和外商投资企业(重点是国有企业、乡镇企业和外商投资企业)进行调查,以下说法正确的是()(1)调查对象——全部工业企业和外商投资企业(2)调查单位——每一个工业企业和外商投资企业(3)调查项目——1995年工业生产经营基本情况(包括生产、销售、库存和成本、费用、价格、盈利等情况)、资产负债状况及其构成、生产能力利用及技术装备状况等(4)调查资料所属时间——1995年12(五)制定调查的组织实施计划包括调查机构、调查步骤、人员及组织训练、经费等问题。13直接观察法报告法采访法网上调查法另外,还有电话调查、座谈会、个别深度访谈等方法。(六)选择调查方法14第二节统计调查的组织形式(一)按调查对象包括的范围分类全面调查非全面调查对构成调查对象总体的所有单位一一进行调查。普查、全面统计报表取被研究对象总体的一部分单位进行调查。重点调查、抽样调查、典型调查、非全面统计报表。15组织方式自上而下建立专门的普查机构,配备一定数量的普查人员,对调查单位进行直接登记。如人口普查。

颁发一定的调查表格,由调查单位根据原始记录进行填报,所建立的普查机构对整个普查工作进行组织领导和协调。如我国历次的物资库存普查。17四项原则(1)规定标准时点,以免产生重复或遗漏。(2)正确选择普查期。(3)各调查单位尽可能同时或尽可能短期内进行调查与完成调查任务。(4)普查项目一经确定,不能随意更改,且要注意普查资料的可比性,以提高资料的利用价值。适用情况要耗费大量的人力、物力、财力和时间,一般在需要掌握基本的国情国力,作重大决策时采用。182.统计报表制度按照国家或上级部门统一规定的表式,统一的指标项目、统一的报送程序和报送时间,自下而上逐级提供基本统计资料的一种调查方式。我国统计报表制度近年来进行了一系列的改革,主要分为:7种基层一套表和9套综合报表制度。基层一套表:A农林牧渔企业报表B工业企业报表C建筑工企业报表D交通运输企业报表E批发零售贸易及餐饮业企业报表F服务业企业报表G行政事业单位报表20是在全部调查单位中按照随机原则抽取一部分单位进行调查,根据调查结果推断总体的一种调查方法。3抽样调查特点:1·按随机原则从总体中抽取样本;2·以样本指标(统计量)为依据推断总体21抽样调查适用范围一是用于认识那些不能或难以进行全面调查的总体的数量特征以及具有破坏性的产品质量检测等二是用于认识那些发展变化比较稳定和有规律性而不必进行全面调查的现象总体的数量特征等三是用于收集灵敏度高、时效性强或时间要求紧迫的统计数据四是用于与其他数据收集方式相结合,相互补充和核对224重点调查

在调查对象范围内选择部分重点调查单位搜集统计资料的非全面调查。在总体中,这些单位虽数目不多,

但就调查的标志值来说,

它们的总量在总体中却占有绝对的比重,

能够反映出总体的基本情况。

23重点调查①要了解全国煤炭的生产变化情况,只要对全国几个大型矿务局进行调查,就可以及时地了解全国煤炭生产的基本情况。

②对为数不多的大型钢铁企业进行调查,就可以对全国钢铁产品的产量、品种、质量等变化情况作出基本分析。③对我国32个大中城市的零售商品价格的变化进行调查,可以及时了解全国城市零售商品价格变化的趋势。24重点调查特点(1)重点单位的选择不带有主观因素,但有量的限制。(2)目的在于反映现象总体的基本情况,搜集重点单位详细的调查资料。因此能以较少的投入,较快的速度了解取得某些标志的主要情况或基本趋势。适用情况当调查目的只要求了解总体基本情况、发展趋势,不要求全面数据,而总体中又确实存在着重点单位时,就可以采用这种调查方法。重点调查可以用于不定期的一次性调查,也可以用于经常的连续性调查。25总体单位调查单位统计调查的组织方式27总体单位调查单位报表制度可以全面调查,但通常是调查限定规模以上的总体单位统计调查的组织方式28总体单位调查单位重点调查只调查重点单位(单位数不多但其标志量占标志总量比重较大的单位)统计调查的组织方式30总体单位调查单位典型调查对典型单位进行调查,典型单位的选择并不一定按规模统计调查的组织方式31总体单位调查单位抽样调查按随机原则选择调查单位,各单位被选中的机会相同。统计调查的组织方式32(二)按调查的组织形式分类统计报表制度专门调查(三)按登记事物的连续性分类经常调查一时调查33第三节统计分组一、统计整理的意义和内容二、统计分组的意义和作用三、分组标志的选择四、简单分组、复合分组和分组体系34某班统计学的成绩表序号成绩序号成绩序号成绩序号成绩序号成绩173108119882880377527711792090298538873781275218230743972461137122953174407457314892376328541966921584248933744277778166925953482439188117862686358244829791876275936824551从以上成绩表中,你能看出什么信息?35以下是反映月收入增长的两个图,请问谁的收入增长快?36对统计学的成绩进行统计整理(统计分组)后的表和图序号组限人数160分以下2260-70分2370-80分18480-90分17590分以上6最高分96分最低分51分平均分76.4分37图1和图2的数据来源相同38解决上述问题的途径:统计整理主要任务资料审核、分组、汇总、制表、制图等。分组频数分布统计表统计图39一、统计整理的意义和内容

统计整理是根据统计研究的任务,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过程。

承上启下的作用统计调查统计整理统计分析统计工作40统计整理的意义统计调查所搜集的反映个体的原始资料是分散的,不是集中的;是零碎的,不是系统的。根据这些资料。人们难以从总体上分析和认识社会经济现象的数量表现。至于某些已经加工的综合资料,则往往由于资料在分组方法、总体范围或指标涵义、口径、计算方法等方面不同,而不能满足统计分析的要求,也必须先通过统计整理,才能据以从总体上分析社会经济现象的数量表现。通过统计整理:1.原始资料或次级资料变为综合资料,能够反映总体特征;2.发现和弥补调查工作的遗漏与不足,提高资料的准确性。41

二、统计分组的意义和作用统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。概念25%33%42%42原则穷尽原则、互斥原则例1:从业人员按文化程度分组小学毕业中学毕业(含中专)大学毕业文盲或识字不多小学毕业中学毕业(含中专)大专毕业大学及大学以上穷尽原则是使总体中每一个单位都应有组可归。43互斥原则:在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时或可能归属于几个组。服装分为男装、女装和童装三类符合互斥原则吗?44统计分组的作用

1.划分现象的类型:统计分组的根本作用是将复杂的社会经济现象按照统计认识的要求区分为各个性质不同的组成部分。

2.揭示现象内部结构。现象的内部结构是表明现象本质特点的一个重要方面,将同一总体不同时期的结构联系起来,还可以看到现象的发展趋势和规律。3.分析现象之间的依存关系。通过分组将有相互影响的现象联系起来进行研究,反映它们在数量上的变动规律。例如:商品销售额与流通费用率的关系;居民收入与储蓄额的关系。

45某地区100个百货商店月销售额与流通费用情况销售额(万元)每百元商品销售额中支付的流通费(元)2135363945454647…32936038718.316.917.215.614.714.213.612.9…8.27.17.6按销售额分组(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.546三、分组标志的选择根据研究问题的目的来选择要选择最能反映被研究现象本质特征的标志要结合现象所处的具体历史条件或经济条件来选择1.选择原则471、学生按成绩分组(分):

60以下60——7070——8080——9090以上2、企业按产值计划完成程度分组(%):

100以下100—110110以上例:55-6060-6565-70……95-10055-6565-7575-8585-9595以上(×)(×)95-105105-115115以上(×)48按品质标志分组,就是选择反映事物属性差异的品质标志作为分组标志,并在品质标志的变异范围内划定各组界限,将总体划分成为若干个性质不同的组成部分。例如:人口总体按性别,分为男、女两组;再如:企业总体按所有制,分为全民、集体、合营、个体等组。

按品质标志分组49按数量标志分组,就是选择反映事物数量差异的数量标志为分组标志,并在数量标志的变异范围内划定各组界限,将总体划分为性质不同的若干组成部分。例如,居民家庭按子女数分组,可分为0人(无子女)、1人、2人、3人;等等。

按数量标志分组50例:经调查,某地年末货币流通量为15.3亿元,比上年增加4.5亿元。为了宏观调控,有必要对本地区货币流通量分布状况进行调查。有两种资料整理结果:按地区分组上期本期增减%甲县乙县丙县丁县360002400028000200005200034000410002600044.441.746.730.0合计10800015300041.7(1)(2)按行业结构分组上期本期增减%集团单位库存现金农民手持现金城镇居民手持现金其他流动人口手持现金27000430003100070003500071000370001000029.665.019.042.6合计10800015300041.751

对被研究现象总体只按一个标志进行分组,称为简单分组。如:以产值作为划分企业规模的标志;按文化程度对人口总体进行分组。统计对总体往往要从多方面进行研究,仅仅依赖一个分组标志进行分组是难以满足需要的,必须运用多个分组标志进行多种分组,形成一个分组体系,才能满足需要。

1.简单分组四、简单分组、复合分组和分组体系52对同一总体选择两个或两个以上的标志层叠进行分组,就形成复合分组。例如,为了认识我国高等院校在校学生的基本状况,可以同时选择学科、学制、性别等三个标志进行复合分组,得到如下分组体系。2.复合分组53

54第四节分配数列一、分配数列的概念和种类1概念:在统计分组的基础上,将总体的所有单位按组归类整理,并按一定的顺序排列,形成总体中各个单位在各组间的分布。2根据分组标志的不同,可将分配数列分为:品质数列:按品质标志分组形成为品质数列。变量数列:按数量标志分组成为变量数列。55例:某班学生的性别构成情况按性别分组绝对数人数比重(%)男女30107525合计40100学生的成绩分布学生按成绩分组x学生数(人)f比重(%)f/∑f60以下60-7070-8080-9090以上2820155416403010合计50100变量数列品质数列56变量数列的编制1.单项数列2.组距数列根据总体各单位的变量值进行同类合并,并列出相应的单位数或比重。57

当所包括的变量值较多时,单项数列显得十分繁琐,如下表,难以反映总体内不同性质组成部分的分布特征。这就有必要编制组距数列。58二、组距数列的编制(一)组距和组数在组距数列中,每个组的最大值为组的上限,最小值为组的下限。每个组的上限和下限之间的距离称为组距。59若将上例根据考试成绩的不同,分为不及格与及格两组,可编成如下组距数列(如下表):这个数列也能说明该班统计学考试成绩的基本情况。但是,由于组数过少组距过大,第二组学生成绩相差的幅度太大,看不出学生成绩的分布特征。为了将考试成绩分布情况说明得细致些,按4分为组距分组,编成如下的组距数列确定组距和组数60确定组距和组数61上表则显然又由于组距过小,组数过多,也难以看清学生成绩的分布特征。如果先根据考试成绩性质的不同,在60分的数量界限的基础上,再细致地分为不及格、及格、中等、良好、优秀等五个类型。并将每组组距扩大为10分,编成如下组距数列,则基本上能准确地反映学生成绩的分布特征。确定组距和组数62由此可见,编制组距数列时,不仅要考虑各组的划分是否能区分总体内各组成部分的性质差别,还需要确定适当的组距和组数,才能准确而清晰地反映总体的分布特征。在实际进行分组时,采用等距数列或异距数列,应决定于现象的性质和研究的目的。标志值分布比较均匀时,一般用等距数列;标志值分布很不均匀时,应采用异距数列。确定组距和组数63

组距数列根据组距是否相等,分为等距数列和异距数列两种。等距数列中各组组距都是相等的。异距数列中每组的组距是不等的。各种分组举例如下表:

(二)等距分组与异距分组6465综合上述各种的分组,分配数列的种类可划分为:分配数列品质数列变量数列单项数列组距数列等距数列异距数列661组限:组距两端的数值称组限。组距的上限、下限都齐全的叫闭口组。有上限无下限或有下限无上限的叫开口组。对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠符合“上组限不计入”原则;(三)组限和组中值67工厂每月生产的机床数量工厂(个)f比重(%)f/∑f0-1011-2021-3031-4041-502820155416403010合计50100按离散变量分组68学生按成绩分组学生数(人)f比重(%)f/∑f0-6060-7070-8080-9090以上2820155416403010合计50100按连续变量分组69组中值是组内变量范围的中间数值,通常可根据各组的上限、下限进行简单平均,即:组中值的计算

组距数列掩盖了分布在组内各单位的实际变量值。为了反映各组中个体单位变量值的一般水平,统计工作中往往用组中值来代表它。70

组中值71在编制组距数列时,为了避免出现空白组,同时又能使个别变量离差较大的单位不致于无组可归,往往在首末两组使用“××以下”及“××以上”的不确定组限的形式。这种形式叫做“开口组”。为进行统计分析,有时也要假定开口组的组限,并计算其组中值。一般可按相邻组的组距来计算“开口组”的假定的组限.然后再计算组中值。计算式为,

组中值72①全距与组距②等距与异距③组限与组中值④开口组与闭口组⑤连续组距分组和不连续组距分组重叠组限“上限不在内”原则关于组距式分组的几个问题例:学生按成绩分组(分)

(1)50—6060—70

70—8080—9090—100(2)60以下60—6970—7980—89

90以上组距=80-70=10上限:80下限:70开口组闭口组组中值组中值组中值重叠组限值70归于70—80组不连续组距式分组连续组距式分组73

三、累计次数分布

总体中各单位数在各组间的分布称次数分布。分布在各组的个体单位数叫次数,又称频数。各组次数与总次数之比称比率,又称频率。74

各组名称(常用x表示)两个构成要素

各组次数(有两种表现形式:绝对数也称频数,用f表示相对数称为频率,用f/∑f表示。)按成绩分组X人数f60分以下360-70分870-80分1280-90分1090分以上7合计40各组名称X各组次数f例:75各种不同性质的社会经济现象都有着特殊的次数分布。概括起来,主要有下列三种类型:钟形分布U形分布J形分布四、次数分布的主要类型76(一)钟形分布钟形分布的符征是“两头小、中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少。绘成曲线图,宛如一口古钟。钟形分布具体可分为对称分布和偏态分布。对称分布的特征是中间变量值分布的次数最多,两侧变量值分布的次数则随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布,如图①。

77对称分布中的正态分布最为重要,许多社会经济现象统计总体的分布都趋近于正态分布。例如,农业平均亩产量的分布、零件公差的分布、商品市场价格的分布等。正态分布在社会经济统计学中具有重要意义。在偏态分布中,有不同方向的偏态,如下图所示78(二)U型分布U形分布的特征与钟形分布恰恰相反,靠近两端的变量值分布的次数多,靠近中间的变量值分布的次数少,形成“两头高、中间低”的分布持征。绘成曲线图,像英文字母“U”字。有些社会经济现象的分布表现为U形分布,例如人口死亡率分布。由于人口总体中幼儿死亡率和老年死亡率均较高,而中年死亡率最低,因而按年龄分组的人口死亡率便表现为U形分布。79(三)J形分布

J形分布有两种类型。正J形分布是次数随着变量值的增大而增多,绘成曲线图,犹如英文字母“J”字。反J形分布是次数随着变量值的增大而减少,绘成曲线图,犹如反写的英文字母“J”字,图形如下:在社会经济现象中,有一些统计总体呈J形分布。例如,投资额按利润率大小分布,一般均呈正J形分布;而人口总体按年龄大小分布,则一般均呈反J分布。80统计表的内容可以分为两个组成部分:一部分是统计表所要说明的总体,它可以是各个总体单位的名称、总体的各个组,或者是总体单位的全部,这一部分习惯上称为主词。另一部分则是说明总体的统计指标,包括指标名称和指标数值,这一部分习惯上称为宾词。一、统计表的内容第五节统计表81统计表的内容82

这个统计表说明的总体是某市工业企业,按经济类型分为三个组,并列有合计,这一部分就是主词。工业企业数、总产值是指标名称,和下边的指标数值一起称为宾词。通常,表的主词列在横行标题的位置,宾词中指标名称列在纵栏标题的位置,但有时为了编排合理和阅读方便,也可以互换位置。

统计表的内容83

从统计表的构成要素看,可由总标题、横行标题、纵栏标题和指标数值四部分组成。此外有些统计表在表下还增列补充资料、注解、附记、资料来源、某些指标的计算方法、填表单位、填表人员以及填表日期等。二、统计表的结构84总标题是表的名称,用以概括统计表中全部统计资料的内容。一般写在表的上端中部。横行标题是横行的名称,在统计表中通常用来表示各组的名称,它代表统计表所要说明的对象,一般写在表的左方。纵栏标题是纵栏的名称,在统计表中通常用来表示统计指标的名称。一般写在表的上方。指标数值列在各横行标题与各纵栏标题的交叉处。统计表中任何一个数字的内容由横行标题和纵栏标题所限定。统计表的构成85统计表的构成86三、统计表的种类

统计表根据主词是否分组以及分组程度不同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论