版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1统计学原理、方法及应用2第一章绪论 第一节统计的产生和发展 第二节统计学的研究对象及其特点 第三节统计学有关的基本概念3第一节统计的产生和发展 一、 “统计”一词的涵义 “统计”已成为现实生活中的一个常用词。在不同的场合人们有着各种不同的认识和理解,其通常有以下三种涵义: (1) 统计活动(或统计工作)。即从事对经济、社会、政治、文化、环境、科学技术等各领域数据资料的搜集、整理、描述、分析研究的工作活动过程。 (2) 统计数据(或统计资料)。即统计活动所取得的各种数据按照科学的方法经过加工整理所取得的资料。 (3) 统计理论(或统计学)。即系统研究如何搜集、整理、分析统计数据的理论和方法。
2、4 统计工作实践与 统计资料工作与工作成果关系理论关统 计 学系5二、统计的产生和发展 统计和人类的其他社会实践活动一样,都是随着人类社会经济活动的发展以及治国和管理的需要而产生和发展起来的。 统计最初是用数字说明国家的特征。早在4 000多年前的我国夏朝就曾进行过初步的国情统计。 随着资本主义经济的发展,社会分工日益发达,导致了对统计新的更多更高的需要,统计活动也由财产、人口和军事统计扩展到工业、商业、外贸、金融、交通、海关和保险等领域。 随着统计实践活动的丰富和发展,统计理论逐渐发展和完善起来,并形成了不同的学派,这些学派基本代表了统计学的形成和发展。6(一)政治算术学派 该学派起源于英国
3、伦敦,产生于17世纪中叶。其代表人物是英国的威兼配第(William Petty,16231687)和他的朋友约翰格朗特(J.Graunt,16201674)。配第的政治算术中用算术方法和大量的统计资料对英、法、荷三国的实力进行了比较和分析,“用数字、重量和尺度”来表达自己的思想。因此,马克思认为,配第不仅是“政治经济学之父,在某种程度上也可以说是统计学的创始人”。 另一位约翰格朗特发表了关于死亡公报的自然观察和政治观察,首次提出通过大量观察,可以发现新生婴儿性比例(1413)和不同死因的比例是较为稳定的,他创造性地编制了初具规模的“生命表”,对各种年龄的死亡率与人口寿命作了分析。如果说配第是
4、政府统计的创始人,则格朗特可认为是人口统计的创始人。7(二)记述学派记述学派又称国家学派或国势学派。其代表人物是德国赫尔姆斯太特大学教授赫尔罗康令(H.Conring,16011681)和哥丁根大学教授哥特弗里德阿亨瓦尔(G.Achenwall,17191772)。记述学派因以文学记述和比较国情而得名。阿亨瓦尔把记述和比较国情的国家学定名为“统计学”,他于1749年第一次使用了“统计学”这个名称。他把“国势学”称为“Statistics”,即统计学,这个名词一直延用至今。 8(三)数理统计学派数理统计学派产生于19世纪中叶,其代表人物是比利时的阿道夫凯特勒(A.Quetelet,1796187
5、4)。他第一个把概率论用于研究经济社会现象,使研究经济社会现象的统计方法在“政治算术”所建立的算术的基础上,在准确化的道路上大大跨进了一步。1867年,有人把这一门既是数学又是统计学的新生科学,命名为数理统计学。由于数理统计学发展很快,在国际统计学术领域中地位大大提高,因此,数理统计学派成为现代统计学的主流派。9(四)社会统计学派19世纪后半叶,正当英美等国数理统计学派开始发展的时候,在欧洲又兴起了社会统计学派。社会统计学派以德国为中心,由德国经济学家、统计学家克尼斯(K.G.A.Knies,18211898)创立,主要代表人物有恩格尔(C.L.E.Engel,18211896)、梅尔(G.V
6、.Magr,18411925)等人。融合了国势学派与政治算术学派观点,沿着凯特勒的“基本统计理论”向前发展,认为统计学是研究社会总体而不是个别的社会现象,而且认为由于社会现象的复杂性和整体性,必须对总体进行大量观察和分析,研究其内在联系,才能揭示现象内在规律。 10(五)推断统计学派推断统计学派是指20世纪初至今,数理统计学在随机抽样的基础上建立的以样本特征来推断总体特征的理论和方法,有人称为推断统计学,是数理统计学的进一步发展。 11从以上几个主要统计学有代表性的统计学派的形成和发展时期来看,统计学的产生和发展,可以说经历了三个时期:一是古典统计学时期(17世纪中末叶至18世纪中末叶)。这一
7、时期是统计学的萌芽时期,主要形成了政治算术学派和记述学派。二是近代统计学时期(18世纪末到19世纪末)。这一时期是统计学在理论上的形成和发展时期,形成的学派较多,主要是数理统计学派和社会统计学派。三是现代统计学时期(20世纪初于今)。这一时期是数理统计方法进一步发展并广泛应用于自然科学和社会科学领域时期。也是数理统计学在应用过程中和其他学科结合创新不断产生新的交叉学科或边缘学科的时期。12第二节统计学的研究对象及其特点一、 统计学的研究对象按照唯物辨证法的观点,学科的建立就是以客观现象普遍联系的运动形式为基础,探讨客观现象各种运动形式的具体规律。统计学的研究对象是各种运动形式所表现出的统计数据
8、内在的统计规律,社会经济统计学的研究对象就是社会经济现象所表现出的统计数据内在的统计规律。从性质上来说,社会经济统计学是研究经济社会现象统计数据的搜集、整理和分析的一门方法论学科。13二、社会经济统计学的作用(一)社会经济统计学为描述客观现象的统计规律提供理论和方法对调查所取得的数据资料,由于客观社会经济现象受各种错综复杂因素的影响,使调查来的数据不完全相同, 有一定的差异,为了进一步论证经济规律以及发现和探索新的规律,都需要统计学提供的理论和方法。(二)社会经济统计学为推断客观现象的数量特征提供理论和方法收集到社会经济现象的有关资料,由于种种原因,其准确程度带有随机性,存在误差。而统计学却能
9、够利用误差规律,根据一个随机样本的资料,来推断总体的数量特征。从而提高了统计理论的科学性。 (三)社会经济统计学为社会科学研究提供定量与定性相结合的研究理论和方法对社会经济现象的发展情况、发展规律进行研究和总结, 除利用实质性学科作出分析和判断外,还需要大量数据资料进行数量方面的论证,以支持研究的结论或观点,为此,统计学提供的理论和方法将具有很重要的作用。14三、统计数据的特点(一)具体性统计数据与用于数学中的数字不同。是客观社会经济现象在一定的时间、地点条件下的数量表现,它总是和现象的质的规定性密切结合在一起的。(二)差异性差异性是指数据和数据之间的差别。我们研究客观现象所取得的数据都是有差
10、异的。 统计数据的差异性产生的原因有两方面:一是由偶然的、不确定的因素造成的,另一方面是由于测量误差或登记误差造成的。 (三)规律性统计数据表面上看来是杂乱无章的,实际上有其内在的规律性。在大量随机个体组成的总体中,由于个体的特殊性决定了它们作用的方向程度千差万别,互不相同。如果观测的个体现象数目越大,则每个个体个别偶然性的不同方向、不同程度的差异,必然相互抵消,其影响的作用愈减愈少,从而显露出必然性的作用。 15四、统计学研究的方法论体系社会经济统计学方法论体系是人们在研究中随实践和理论的发展不断改进,创新,并逐步形成的系统化原理体系,具体包括:数据搜集方法数据整理方法数据描述方法数据推断方
11、法统计分析方法等16第三节统计学有关的基本概念一、 总体和总体单位总体是统计所研究对象的全体。凡是客观存在的,具有同一性质的许多个别事物的集合就是统计总体,简称总体。构成总体的个别事物叫总体单位。例如,在工业普查中,“全部工业企业”就是总体,它由所有从事工业生产活动的企业所组成,其中每一个工业企业就是总体单位,这些企业都具有“从事工业生产活动”这个共性。总体按所包括总体单位数多少分为: 有限总体 无限总体 总体和总体单位的概念不是固定不变的,而是随着研究目的和任务的不同,可以进行转换。 17二、标志、变异(一)标志:标志是说明总体单位特征的名称。1、标志按其特征的性质不同,可以分为品质标志和数
12、量标志。品质标志是说明总体单位质的特征的名称,其表现为一种属性,只能用文字表示。如某职工的性别就是品质标志,其表现为“男”属于男性。 数量标志是总体单位量的特征的名称,其表现为一种数值,一般只能用数值表示。如某职工的年龄就是数量标志,其表现为“30岁”,是一种数值。品质标志和数量标志是根据标志本身的性质决定的,它们之间是不能转变的。 2、标志按表现情况不同分为不变标志和可变标志。当一个标志在各总体单位的具体表现都相同时,这个标志就是不变标志。 当一个标志在总体各单位的具体表现不同时,这个标志就是可变标志。不变标志和可变标志是由被研究的总体中总体单位的特征的具体表现所决定的。它随研究对象的不同而
13、变化。18(二)变异变异就是差异或差别。标志在各总体单位之间的表现各不相同,这种差别称为变异。如性别标志表现为男、女,年龄标志表现为20岁、22岁等。变异有属性的变异和数量的变异两种。 19三、变量变量就是可变的数量标志。变量所表现的具体数值叫变量值。例如工资就是变量,具体的工资额80元、90元、100元等就是变量值,也就是数量标志值。变量可作如下的分类:(1) 变量按其变量值是否连续可分为连续变量和离散变量。 连续变量的数值是连续不断的,相邻两值之间可作无限分割,即有小数出现。例如身高、体重、年龄等都是连续变量。离散变量都是以整数位断开的,如人数、工厂数、机器台数等,都只能按整数算,不可能有
14、小数。20三、变量(2) 变量按性质不同可分为确定性变量和随机变量。受某种决定性因素的作用,致使变量沿着一定的方向呈上升或下降的趋势变动,这种变量叫确定性变量。例如一台设备在单位时间生产的零件数始终相同,是受设计因素决定的,这就是确定性变量。 随机变量是指变量值的变化受多种不确定因素的影响、其变化带有很大的偶然性的变量。如,生产的每一个零件的尺寸并不完全相等,仔细测量,其误差大小带有一定的偶然性,这里的零件尺寸就是一个随机变量。 21三、变量(3) 变量按其属性或度量的尺度不同可分为名义变量、顺序变量、等距变量和比率变量。名义变量是说明某一事物与其他事物属性不同或类别差异的变量,也叫属性变量。
15、如学生中的男生、女生只表明性别不同的两类人 顺序变量是指根据事物某一属性的多少或大小次序,将各事物加以排列的变量。例如:对于某项体育比赛的参加者可以根据其运动成绩确定第一名、第二名、第三名; 等距变量则除表明量的大小外,还具有相等单位。温度测量出的气温度数就是一种等距变量。比率变量是指除了可以说出名称、排出顺序、有相等单位之外,还具有绝对零点,可作比率性陈述,身高、体重等就属于这一类变量。 22四、统计指标(一)统计指标的概念与构成要素统计指标是说明总体数量特征的。关于统计指标的概念,有两种不同的理解和两种使用方法。第一,在统计理论设计上所使用的“统计指标”的涵义,是指反映总体现象数量特征的概
16、念。例如:工业增加值、商品销售额、职工总人数等等。按这种理解,统计指标包括三个构成要素,即指标名称、计量单位和计算方法。第二, 实际工作中经常使用的统计指标的涵义,是指反映总体现象数量特征的概念和具体数值。如:2000年全国普查人口数129 533万人,就是统计指标。按这种理解,统计指标除包括上述三个要素外,还包括时间限制、空间限制和指标数值。23(二)统计指标的特点(1) 数量性。统计指标描述的是可以度量的客观现象的量,都是用数值表现的,不存在不能用数值表现的统计指标。(2) 综合性。统计指标说明的对象是总体而不是个体,它是许多个体现象的数量综合的结果。一个人的工资不叫统计指标,反映许多人的
17、工资总额和平均工资才叫做统计指标。(3) 具体性。统计指标并非抽象的概念和数值,它具有客观的经济社会内容,是一定的具体的经济社会现象的量的反映。24(三)统计指标的种类(1) 统计指标按其反映总体的内容不同,分为数量指标和质量指标。反映总体现象绝对数量多少的统计指标叫数量指标。如工业总产值、商品销售额、职工总人数等。反映总体内部数量联系和总体单位水平的指标叫质量指标。如积累与消费的比例、人口密度、平均工资与平均亩产量等。 25(2) 统计指标按其作用和表现形式不同,分为总量指标、相对指标和平均指标。反映总体现象在一定时间、空间条件下的总规模与总水平的指标叫总量指标。如人口数、国民收入、粮食总产
18、量等。 相对指标是由两个有联系的总量指标相比较的结果。如计划完成程度、人口的年龄构成、人口密度等。平均指标是按某个数量标志说明总体单位一般水平的统计指标。如平均工资、平均亩产量等。26(3) 统计指标按其在管理中所起的作用不同,分为考核指标与非考核指标。根据管理的需要,用来评定优劣、考核成绩、决定奖罚的统计指标叫考核指标。非考核指标指的是用来了解情况的统计指标。27(四)指标与标志的区别与联系指标与标志既有区别,又有联系。1. 指标与标志的主要区别(1) 指标是说明总体数量特征的,而标志则是说明总体单位特征的(包括质的特征和量的特征)。(2) 指标都是用数值表示的,而标志有不能用数值表示的品质
19、标志和能用数值表示的数量标志两种。 282. 指标和标志的主要联系(1) 统计指标是根据总体单位的数量标志值或总体单位数的多少汇总而来的。例如某地区工业总产值(即数量指标)就是该地区各企业工业总产值(数量标志值)汇总而来; (2) 指标与标志随研究目的不同,会发生转换关系。当该地区某一个企业作为研究总体,原来反映企业的工业增加值就由数量标志变成数量指标。 29五、统计指标体系(一)统计指标体系的概念若干个相互有联系的统计指标所组成的整体叫统计指标体系。它反映了各指标之间的联系及关系。例如,一个工业企业是人力、物资、资金、生产、供应和销售等相互联系的整体,用一系列统计指标来反映和研究工业企业的全
20、面情况,这就组成了工业企业统计指标体系。单个统计指标仅能反映社会经济总体及其运动的一个侧面,要想全面地反映和研究社会经济总体的情况,就只有使用相互联系的各种统计指标所组成的指标体系,才能避免片面性,使我们获得全面的了解。30(二)社会经济统计指标体系的种类社会经济统计指标体系是国家管理乃至社会管理和经济管理的基础,按照人类社会经济活动的内容可划分为环境、社会、经济、科技四大部分: 环境统计指标体系主要包括地理环境、资源环境、社区环境、环境污染、环境保护五个方面。 社会统计指标体系主要包括社会生活主体(人口和家庭)状况、社会物质生活、社会精神文化生活、社会组织管理四个方面。 经济统计指标体系包括
21、宏观统计指标体系和微观统计指标体系。 科技统计指标体系主要包括科技活动投入、科技活动过程、科技产出成果三个方面。31思考题1. 什么是“统计”?试述统计的产生和发展。2. 如何理解统计学的研究对象?3. 统计数据有何特点?4. 什么是社会经济统计学?属什么性质的学科?5. 社会经济统计学的主要作用是什么? 6. 什么是总体、总体单位、标志、变异?7. 什么是变量?变量有哪些分类?8. 什么是统计指标?指标有哪些特点和种类?9. 指标和标志有什么区别与联系?10. 什么是指标体系?社会经济统计指标体系有哪些种类?32第二章统计数据的搜集 第一节统计调查概述 第二节统计调查方案 第三节各种统计调查
22、方式 33第一节统计调查概述 一、 统计调查的意义 统计调查是按照统计研究的目的,根据统计设计的要求,采取适当的调查方式和科学的调查方法,有计划、有组织地向客观实际搜集原始资料的工作过程。 也包括对次级资料,即已加工过的统计资料进行收集,以便进一步集中加工和进行分析。统计调查在实际的工作、生活中非常重要。 34二、统计调查的种类 统计调查可以分为以下几个种类: (1) 按调查对象范围的不同,可以分为全面调查和非全面调查。 全面调查是对构成调查对象总体的所有总体单位,逐一地进行调查登记的一种调查方式。例如,为了了解某地区工业企业职工状况,就要对该地区工业企业全体职工这一统计总体中所包括的每个总体
23、单位即每位职工都无一例外地加以调查登记,这样的调查就是全面调查。 普查、全面统计报表,都是全面调查。 非全面调查是对构成调查对象的一部分总体单位进行调查登记的一种调查方式。重点调查、抽样调查、典型调查均属于这一类调查。35二、统计调查的种类 (2) 按调查登记的时间是否连续,可以分为经常性调查和一次性调查。 经常性调查是随着时间的推移而连续不断地对调查单位的变化情况进行计量、登记的一种调查方式。例如,产品产量、主要原材料和燃料、动力的消耗等所进行的计量和登记都属于经常性调查。 一次性调查是间隔一定时间,有时是相当长的时间(比如一年以上)对调查单位的某些标志进行计量、登记的一种调查方式。例如,工
24、业企业每月末对其在产品数量、职工人数、库存量等进行一次盘点,登记就是一次性调查。 经常性调查都是定期调查。一次性调查,可以是定期进行的,也可以是不定期进行的。 36二、统计调查的种类 (3) 按组织方式不同,可以分为统计报表和专门调查。 统计报表是按一定的表式和要求,自上而下统一布置,自下而上提供统计资料的一种统计调查方式。 专门调查是为了研究某一专门问题,由进行调查的单位专门组织的调查。这种调查,多属一次性调查,如普查、抽样调查、典型调查等。37二、统计调查的种类 (4) 按调查体系不同,可以分为政府统计调查体系和非政府统计调查体系。 我国政府统计调查体系是在国务院统一领导下,由国家统计局履
25、行中央领导的职能,组织、协调中央一级的职能部门(包括财政部、人民银行和其他专业部门)统计工作的调查体系。 非政府统计调查体系,也称非官方统计,主要是由各种社团、新闻媒体、学术机构以及商业性调查公司所进行的统计活动组成。 38三、统计调查的具体方法 (一)直接观察法:是由调查人员亲自到现场对调查单位进行观察和计量以取得资料的一种调查方法。如调查人员对库存的产品、商品直接地盘点计数,以掌握产品或商品的库存资料等。 (二)报告法:就是报告单位以各种原始记录和核算资料为依据,向有关单位提供调查资料的方法,又称其为凭证法。 (三)采访法:亦称访问法,是指由调查人员根据调查提纲或调查问卷向被调查者提出问题
26、,根据被调查者的答复以取得统计资料的调查方法。 (四)通讯法:指由调查者将调查表邮寄给被调查者,由被调查者根据调查的要求填写并寄回,以取得资料的一种调查方法。 (五)问卷法:是调查者运用统一设计好的询问提纲或调查表,向被调查者了解情况、搜集资料的一种调查方法。 (六)文献法:是根据一定的目的和范围来搜集和摘取文献,以此获得所需资料的方法。 (七)电话调查:是调查人员利用电话和被调查者进行语言交流以获得有关资料。 39第二节统计调查方案 统计调查方案是对整个统计调查工作事先进行统筹规划和全面安排的一个书面文件。 一个完整的统计调查方案应包括以下几方面的内容: 一、 确定调查目的和任务 二、确定调
27、查对象、调查单位、调查范围和方法 三、确定调查表的形式、主要内容和标准 四、确定调查时间和填表登记时间 五、确定调查工作的组织实施计划 六、数据处理和质量控制40第三节 各种统计调查方式 我国的统计调查方式为“以必要的周期性普查为基础,以经常性的抽样调查为主导,同时辅以重点调查、科学推算和全面报表综合运用的调查方式体系”。41一、 普查 (一)普查的意义和特点 普查是专门组织的、一次性的全面调查。它主要用来搜集某些不能或不宜用定期的全面统计报表搜集的统计资料。对于国家从实际出发制定国民经济和社会发展计划及产业政策,加强国民经济管理,安排人民物质和文化生活具有重要的意义。 普查有以下两个主要特点
28、: (1) 普查是专门组织的一次性调查。普查的对象是时点现象。 (2) 普查的内容全面、详细、准确。42一、 普查 (二)普查的组织方式及原则 1、普查的组织方式,按照机构设置情况分为两种: 一种是组织专门的普查机构,派出调查人员,对调查单位直接进行登记。 另一种是由被调查单位填报,即利用企事业单位本身的组织系统完成这项工作。2、按照普查资料汇总特点不同,普查又分为两种:一般普查是采取逐级布置和逐级汇总上报的方法,前后花费时间较长。快速普查无论是布置任务和报送资料,都越过中间环节,由组织领导普查工作的最高机关直接把任务布置到基层单位,各基层单位将资料直接报送到普查工作的最高机关进行汇总,以缩短
29、资料的传递和汇总时间。43二、抽样调查抽样调查是一种非全面调查,它是遵守随机原则从调查对象总体中抽取部分单位进行观察,用以推断总体数量特征的一种调查方式。关于抽样调查的特点和内容,将在第八章详细讨论。44三、重点调查(一)重点调查的概念重点调查是专门组织的非全面调查。它是在调查对象总体中选择其中一部分重点单位所进行的调查。所谓重点单位是指调查单位的标志值在被调查总体的标志总量中占有很大比重的单位。 (二)重点调查的特点一是重点单位的选择是根据研究的任务和目的有意识决定的;二是重点调查的目的是反映现象总体的基本情况。45四、科学推算法科学推算法是根据已有的统计资料或有关部门的行政记录为基础,按照
30、事物之间的内在联系和发展规律进行科学估计和测算的一种间接的搜集统计资料的方式。一般用来修正准确度不高的统计指标或推算出新的统计指标。它既能以较少的投入取得丰富的统计资料,又能减轻被调查者的负担。常用的推算方式有:平衡关系推算法、因素关系推算法、比例关系推算法、差值估算法等。46五、典型调查典型调查是根据调查目的,在对被研究的现象总体进行初步分析的基础上,有意识地选择少数具有典型意义或在某方面具有代表性的单位进行调查,以揭示现象内在联系或变动规律的调查方式。它具有以下两个方面的特征:(1) 调查单位是根据调查目的,有意识地选择出来的典型单位。 (2) 典型调查是一种深入、细致的调查。 典型调查的
31、方式大体可分为两种:一种是对个别典型单位进行调查研究,称为解剖麻雀式的典型调查,这种方式适用于总体各单位之间差异比较小的情况。而当总体各单位之间差异比较大时,宜采用划类选典式的典型调查方式。 47六、统计报表制度 统计报表是我国政府搜集统计资料的一种主要方式。它是按照国家的统计法规定,自上而下地统一布置,自下而上地逐级提供统计数据的一种调查制度。统计报表的种类有:(1) 统计报表按照调查范围不同,分为全面统计报表和非全面统计报表。 (2) 统计报表按照报表内容和实施范围不同,分为国家统计报表、部门统计报表和地方统计报表。 (3) 统计报表按照报送周期长短,分为日报、旬报、月报、季报、半年报和年
32、报。 (4) 统计报表按照填报程序和单位的不同,分为基层报表和综合报表。 48思考与练习1. 什么是统计调查?2. 统计调查的种类和具体方法有哪些?3. 什么是统计调查方案?什么是调查时间、标准时间?4. 什么是调查对象、调查单位和填报单位?5. 什么是普查?6. 什么是统计报表制度?7. 典型调查、重点调查和抽样调查有什么不同?498. 2000年人口普查的标准时间规定为11月1日0时,并以常住人口为普查对象,普查员遇到下面情况,应如何处理?(1) 11月3日在一家调查时,得知这家11月2日死去1人,在普查表上是否应列为“死亡”?(2) 同日在第二家遇到婚礼,10日前新婚夫妇办理好结婚登记,
33、普查员应如何登记这对青年人的“婚否”项目?(3) 11月4日到第三家,这家10月30日出生一小孩,如何登记年龄?(4) 11月4日到第四家,户主告诉调查员他在11月1日已办理离婚手续,对被询问者的婚姻状况应如何填写?9. 指出下列调查的调查对象、调查单位及填报单位:(1) 商业网点调查;(2) 工业企业设备调查。10. 试列举下列调查单位的若干标志:(1) 工业企业;(2) 商店;(3) 居民住宅(供住宅普查用);(4) 科技人员。50第三章统计数据的整理第一节统计数据整理概述第二节统计分组第三节次数分布第四节数据整理的计算机实现第五节洛伦兹曲线和基尼系数第六节统计表51第一节统计数据整理概述
34、一、 统计数据整理的概念统计数据整理也称统计整理,是根据统计研究的目的,将统计调查所得的数据进行科学的加工,使之系统化、条理化,并成为能反映总体数量特征的综合资料的工作过程。52二、统计数据整理的步骤统计数据整理的步骤如下:(1) 设计和编制统计数据资料的汇总方案。 (2) 对搜集到的原始资料进行审核。 (3) 根据研究目的的要求和统计分析的需要,对原始资料进行分组。(4) 进行汇总计算,编制次数分布表。(5) 编制统计表。(6) 进行统计数据资料的汇编,系统地积累历史统计数据。53第二节统计分组一、 统计分组的概念与作用统计分组是根据社会经济现象的内在特点和统计研究的目的,将总体中所有总体单
35、位按一定的标志划分为性质不同的若干个组成部分的一种统计方法。基本要求是:使各组内部保持同质性、各组之间呈现出质的差异性。因此,统计分组的实质是在现象总体内进行的一种定性分类。统计分组的作用表现在以下几个方面:(一)划分社会经济现象的类型(二)反映社会经济现象总体的内部结构(三)研究现象之间在数量上的依存关系54二、分组标志的选择和分组的形式统计分组的关键在于正确选择分组标志和划分各组界限。分组标志是将统计总体划分为若干个性质不同的组成部分的标准或依据。(一)分组标志的选择选择分组标志必须遵循以下原则:1.根据统计研究目的选择分组标志2.选择能反映现象本质特征的主要标志3.结合具体社会历史条件和
36、经济条件选择分组标志55(二)分组的形式分组的形式有简单分组和平行分组体系,复合分组和复合分组体系1.简单分组与平行分组体系对总体只按一个标志进行分组,叫简单分组。选择两个或两个以上的标志分别进行简单分组,就形成了平行分组体系。例如,对工业企业可以分别按经济类型和规模两个标志进行简单分组,得到如下平行分组体系:2.复合分组与复合分组体系对同一个总体选择两个或两个以上的标志层叠分组,叫复合分组;所分各组是在分组标志的基础上层叠排列的,从而形成复合分组体系。 56三、统计分组的方法根据分组标志的特征不同,统计总体可以按品质标志分组,也可以按数量标志分组。(一)按品质标志分组的方法按品质标志分组,就
37、是选择反映事物属性差异的品质标志作为分组的依据,并在品质标志的变异范围内划定各组界限,将总体区分为若干性质不同的组成部分。(二)按数量标志分组的方法按数量标志分组,就是选择反映事物数量差异的数量标志作为分组的依据,并在数量标志的变异范围内划定各组的界限,将总体划分为性质不同的若干组成部分。就具体的分组而言,如果分组标志的变量的变异较小,可以将各个变量值单列一组,这种分组称为单项式分组;如果变量的变异较大,则应该把变量的整个取值范围依次划分为若干区间,一个区间内的所有变量值归为一组。区间的最大值称为上限,最小值称为下限,上限与下限之差为组距。组距=上限-下限。这样的分组称为组距式分组。57第三节
38、次数分布一、 次数分布的概念在统计分组的基础上,将总体中的所有总体单位按组归类整理,形成总体单位数在各组间的分布,就叫次数分布。 分布在各组的总体单位数叫次数,又称频数。各组次数与总次数之比叫比重,又称频率。 58二、次数分布的种类:根据分组标志特征的不同,分布数列可以分为属性分布数列和变量分布数列两种。1、按品质标志分组形成的分布数列叫属性分布数列或品质数列。2、按数量标志分组形成的分布数列叫变量数列。59三、次数分布的编制属性分布数列一般比较稳定,通常均能准确地反映总体的实际分布特征。在变量数列中,由于决定事物性质的数量界限的确定,往往因人的主观认识不同。编制时应考虑以下几个方面的问题:
39、60举例说明次数分布的编制 假定某班学生统计学考试成绩资料如下(见表36)。1.组距与组数当变量值较多时,就有必要编制组距数列。分组时,一般应根据对总体内部情况的定性分析,先确定组数,然后用变量的变动范围(即全距)除以组数来确定组距,并据以划分各组界限。即组距=全距组数=(最大值-最小值)组数等距数列中, 各组的组距相等 异距数列中, 各组的组距不完全相等 根据经验,当资料数为30时,组数可取57组。为计算方便,一般地组距可取5或10的整倍数。612.组限与组中值组限是指在组距数列中,区分各组性质差异的数量界限,用各组变量值中的最小值表示下限,最大值表示上限。 组中值是表明组内各变量值一般水平
40、的一个代表值,通常按下式计算:组中值=(上限+下限)2开口组 :为了避免出现空白组,同时又能使个别变量值离差较大的单位不致于无组可归,往往在首组使用“以下”,在末组使用“以上”的不确定组限的形式 。“开口组”组中值的公式首组组中值=首组上限-相邻组距2末组组中值=末组上限+相邻组距262以表36为例,具体分析编制次数分布:(1)计算全距。全距是总体内最大变量值与最小变量值之差。则全距=99-54=45, (2)确定组数和组距。根据研究的具体要求、对实际情况的了解以及经验判断,组数取5,则组距=全距/组数=45/5=9,即组距可取10较为适合。(3)确定组限和组限表示法。考试成绩为连续变量,故采
41、用上下限重叠式的组限表示法,组限值取整10的数值。(4)计算各组单位数及比重。由于本例采用的是重叠式的组限表示法,故需运用“上限不在本组内”的原则计算各组单位数,根据研究的需要再计算各组比重。 63三、次数分布的特征不同性质的社会经济现象总体的次数分布是不同的,从而显示出不同类型的分布特征。 次数多或比率大的组,其变量值在决定总体数量表现中的作用就大,反之就小。研究各种类型的次数分布特征,对于准确认识不同社会经济性质的变量在形成总体数量表现中的作用有着重要意义。64(一)次数分布的显示方法1.表示法:用统计表的形式显示次数分布 。2.图示法(1) 直方图。直方图是用直方形的宽度和高度来表示次数
42、分布的一种统计图。 (2) 折线图。折线图可以在直方图的基础上,用线段将根据各组组中值与次数高度求出的坐标点顺次连结而成, (3) 曲线图。当变量值非常多,变量数列的组数无限增多时,折线便近似地表现为一条平滑的曲线。 65(二)次数分布的主要类型主要有下列四种类型:1.钟形分布:钟形分布的特征是“两头小中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,绘制成曲线图,宛如一口古钟, 2.水平分布:水平分布的特征是总体内各个变量值分布的次数大体相等,绘制成图形,表现为一条水平线。 3.U形分布 :靠近两端的变量值分布的次数多,靠近中间的变量值分布的次数少,形成“两头高中间低”
43、的分布特征。 4.J形分布:J形分布有两种类型:正J形分布是次数随着变量值的增大而增多;反J形分布次数随着变量值增大而减少 66第四节数据整理的计算机实现运用spss软件对表36的数据进行组距式整理,并绘制条形图。一、 操作步骤1.数据文件的建立(1) 点击FileNewData,新建数据文件。(2) 点击左下角的Variable View,显示变量定义窗口,可进行变量定义。 2.进行组距式整理(1) 点击TransformRecode into Different Viarables,将“成绩”添加到Numeric VariableOutput Variable框中,然后在右侧Output
44、Variable中定义新的变量名 “成绩区间”,然后点击Change按钮。(2) 点击下面Old and New Values定义分组区间上下限,选择左侧 Old Value的Range设定数值范围,在New Value 栏内将这一数值范围用数字表示,然后点击Add添加到OldNew框中,依次添加后点击Continue回到Recode into Different Variables 主菜单中,点击OK即可输出结果。 3.绘制条形图:点击GraphsLegacy DialogsBar,选择直方图的类型,点击Define钮,在出现对话框中,选择变量成绩区间将其添加到 Category Axis中
45、,点击OK,即可输出条形图。二、 输出结果67第五节洛伦兹曲线和基尼系数一、 洛伦兹曲线美国统计学家洛伦兹(Max Otto Lorenz)于1905年提出利用累计百分数曲线,作为研究社会收入分配平均程度的一种图示方法,这种曲线称为洛伦兹曲线。二、基尼系数为了计算收入分配平等程度的高低,意大利经济学家基尼(G.Gini)根据洛伦兹曲线提出了判断收入分配平等程度的指标。其计算公式为:基尼系数 G=A(A+B)式中:A代表绝对平等直线和洛伦兹曲线围成的图形的面积;A+B代表绝对平等直线下的直角三角形面积。显然0G1。G=0,表示收入分配绝对平等;G=1,表示收入分配绝对不平等;0.2G0.3,表示
46、收入分配相对平等;0.3G0.4,表示收入分配较为合理;0.4G0.5,表示收入分配差异较大;0.5G,表示收入分配两极分化。68第六节统计表一、 统计表的概念统计表是以纵横交叉的线条所绘制的表格来表现统计资料的一种形式,是表现统计资料的各种形式中应用得最广泛的一种形式。二、统计表的构成与内容(一)统计表的内容统计表的内容可分为两个组成部分:一部分是统计表所要说明的总体,这一部分内容习惯上称为主词。另一部分则是说明总体的统计指标,包括指标名称和指标数值,这一部分内容习惯上称为宾词。69 (二)统计表的构成统计表是由总标题、横行标题、纵栏标题和指标数值4部分构成, (1)总标题是统计表的名称,用
47、以概括表中全部统计资料的内容。一般写在表的上端中部。(2)横行标题是横行的名称,在统计表中通常用来表示各组的名称,它代表统计表中资料所要说明的对象。一般写在表的左方。(3)纵栏标题是纵栏的名称,在统计表中通常用来表示统计指标名称。一般写在表的上方。(4)指标数值列在各横行标题与各纵栏标题的交叉处。统计表中任何一个数字的内容均由横行标题和纵栏标题所限定。在表下还增列补充资料、注解、附记、资料来源、某些指标的计算方法、填表单位、填表人员以及填表日期等。70三、统计表的分类(一)按作用分类(1) 调查表:指在统计调查中用于登记、搜集原始统计资料的统计表。(2) 汇总表或整理表:指在统计汇总或整理过程
48、中使用的表格和用于表现统计汇总或整理结果的表格, (3) 分析表:指在统计分析中用于对整理所得的统计资料进行定量分析的表格。 71(二)按统计数列的性质分类(1) 空间数列表:指反映在同一时间条件下不同空间范围内的某项或某几项统计数列的表格。 (2) 时间数列表:指反映在同一空间条件下,不同时间阶段上某项或某几项统计数列的表格。 (3) 时空数列结合表:指同时反映上述两方面内容的统计表。即说明某一或某些现象在不同空间内的数量分布,又说明它们在不同时间上的数量变动, 72(三)按分组的情况分类(1) 简单表:指总体未经任何分组,仅排列各单位名称或按时间顺序排列的统计表。(2) 简单分组表:指总体
49、仅按一个标志分组,即应用简单分组形成的统计表。(3) 复合分组表:指总体按两个或两个以上标志进行层叠分组,并在此基础上形成的统计表。 73思考与练习1. 什么是统计数据的整理?统计整理的基本步骤是什么?2. 什么叫统计分组?有何作用?3. 什么是分组标志?分组标志有哪几种?选择分组标志的原则是什么?4. 按品质标志分组有何特点和作用?5. 什么是简单分组和复合分组?它们各有什么特点和作用?6. 什么是变量数列?它分为哪几种?其特点和应用条件是什么?7. 什么是频数密度?为什么要计算频数密度?8. 在编制组织距数列时,如何确定组数、组距和组限?9. 组距数列通常用什么图形来表示?如何绘制不等距数
50、列的次数曲线图?10. 在变量数列中为什么要计算累计次数?试举例说明,并绘制累计次数曲线图。74思考与练习11. 统计表从内容和形式上由哪些部分组成?设计的格式有几种?12. 从对总体的分组情况看,统计表有几种?各有什么作用?13. 再分组练习。某企业工人月工资水平资料如下:某企业工人月工资水平的分组情况按月工资水平分组各组人数占总人数%800元以下148001 000元251 0001 200元381 2001 400元151 400元以上8要求将上述资料调整为以下四个组:1 000元以下;1 3001 500元;1 0001300元;1 500元以上14. 某村2000年和2004年人口及
51、收入资料如下表。某村2000年、2004年人口及收入情况按人均纯收入分组2000年2004年人数(人)人均纯收入(元)人数(人)人均纯收入(元)最低收入组5102.005424.20低收入组82290.2238789.25中低收入组16491.71591 313.14中高收入组10726.0071 654.00高收入组3963.3392 675.33最高收入组21 260.00910 390.44合 计118380.051271 879.98计算2000年和2004年的累积人数、相对累积人数、各组总收入、累积总收入和相对累积总收入。75第四章总量指标和相对指标总量指标、相对指标和平均指标,这三
52、个指标总称为综合指标。本章主要介绍静态条件下总量指标和相对指标的计算和分析 第一节总量指标第二节相对指标第三节平均指标76第一节总量指标一、 总量指标的意义总量指标是反映社会经济现象发展总规模或总水平的综合指标。也叫绝对数或绝对指标,它的数值大小与总体范围大小有关 。在社会经济统计分析中具有重要的作用:(1) 总量指标是对社会经济现象总体认识的起点。 (2) 总量指标是实行社会管理的依据。 (3) 总量指标是计算相对指标和平均指标的基础。 77二、总量指标的种类(1) 总量指标按其反映总体内容的不同,可以分为总体单位总量和总体标志总量。总体单位总量是指总体内全部单位的总数,也称“总体总量”,用
53、来反映总体本身规模的大小。总体标志总量是指总体各单位某一数量标志值的总和。 78(2) 总量指标按其反映的时间性质不同,可以分为时期指标和时点指标。时期指标是反映社会经济现象在一定时期内发展变化结果的总量。时期指标具有以下三个特点:时期指标可以累计。时期指标数值大小与时期长短有直接关系。时期指标的数值靠连续登记取得。时点指标是反映社会经济现象在某一时刻(或瞬间)上所达到的总量。时点指标也具有三个特点:不同时点的指示数值不能累计。时点指标数值大小与时点间隔长短无直接关系。时点指标只能间断计数。79三、总量指标的计量单位总量指标是具有一定经济内容的量,计量的准确与否直接影响到所反映现象的准确性。
54、(一)实物单位:实物单位是根据客观现象的属性而采用的计量单位。有自然单位、度量衡单位、复合单位和标准实物单位等。(二)价值单位价值单位也叫货币单位,是以货币为价值尺度来计量现象总量的计量单位。 (三)劳动量单位劳动量单位是用劳动时间表示的计量单位。常用的有工日和工时两种。 80四、总量指标的计算方法总量指标的计算方法主要有直接计算法、推算法和专家估算法。(1) 直接计量法就是通过统计数据整理,对所有调查单位进行点数、计数或测量等,然后汇总得到总量指标。(2) 推算法是在总量指标不能直接计算或不必直接计算的条件下,根据总量指标之间的数量关系或有关资料进行的推算。(3) 专家估算法是对一些在数量上
55、要求不太精确的现象,根据专家或有实践经验的人通过估算得出总量。 81五、运用总量指标应注意的问题(1)必须对总量指标的含义、范围作出严密的科学界定,这样计算出来的总量指标,才能真实反映客观现象的规模和总水平。 (2)作为实物指标计算总量时,必须注意经济社会现象的同质性。(3)计算总量指标必须注意计量单位的统一性。 82第二节相对指标 一、 相对指标的意义 相对指标是两个相互联系的总量指标之比值,可以反映现象发展过程的程度、结构、速度、密度和普遍程度等,相对指标也称相对数。 相对指标的数值一般有两种表现形式:一是无名数;二是有名数。 (1) 无名数是一种抽象化的数值,多以系数、倍数、成数、百分数
56、和千分数表示。 (2) 有名数是将分子指标和分母指标的计量单位结合使用。 83二、相对指标的作用(1) 相对指标可以反映现象的发展程度、相互关联程度和经济效益大小。 (2) 便于不同时期、不同空间的对比。 84三、相对指标的计算相对指标按其对比的基础不同,可分为结构相对指标,比例相对指标、比较相对指标、强度相对指标、动态相对指标和计划完成程度相对指标等6种。 (一)结构相对指标(结构相对数) 结构相对指标是在分组基础上计算的相对数,它是总体各部分的数值与总体全部数值之比。 结构相对指标=(总体中某一部分数值)总体全部数值结构相对指标可以揭示现象的结构特征,从而认识现象各部分在总体中所占有的地位
57、。结构相对指标也可以反映现象发展变化的情况。结构相对指标也用于反映对人力、物力的利用程度。 85 (二)比例相对指标(比例相对数) 比例相对指标是总体内部各组成部分之间数量对比指标。它可以反映各组成部分之间的联系程度和比例协调关系,其计算公式如下: 比例相对指标=(总体中某一部分的数值)(总体中另一部分的数值)例如,我国第五次人口普查结果中,以女性人数为100,男性人数是女性人数的106.7,即男女比例为106.7100; 86 (三)比较相对指标(比较相对数) 比较相对指标是同类指标在不同空间对比求得的相对数。它可以反映同类指标在不同国家、部门、地区、单位之间的对比关系。其计算公式如下:比较
58、相对指标=某一空间条件下的指标数值另一空间条件下的同类指标数值例如,2004年甲企业产值500万元,乙企业产值400万元,两者对比,甲厂产值为乙厂产值的125%或1.25倍,也可以说乙厂产值是甲厂产值的80%。87 (四)强度相对指标(强度相对数) 强度相对指标是两个性质不同但联系密切的总量指标之比,用来表示不同现象之间的依存性比例关系。其计算公式如下:强度相对指标=某一总量指标另一性质不同但联系密切的总量指标 强度相对指标一般以复名数表示,如人均粮食产量单位是“公斤/人”,人口密度单位是“万人/平方公里”等。也有少数强度相对指标用千分数或百分数表示。例如,人口死亡率等。强度相对指标可以表明一
59、个国家、地区或部门的经济实力强弱程度。 强度相对指标也可用来反映现象分布的密度和普遍程度。 强度相对指标有正指标和逆指标之分。 88 (五)动态相对指标(动态相对数) 动态相对指标是不同时期的两个同类指标之比。用来反映现象在不同时期的发展变化情况,统计上又称为发展速度。其计算公式如下:动态相对指标=报告期水平基期水平 式中,报告期又称计算期即被研究的时期,报告期水平是被研究的对象在报告期的总量指标。作为比较基础的时期称为“基期”。 89(六)计划完成程度相对指标(计划完成相对数)计划完成程度相对指标也称计划完成百分数、计划完成程度指标。它是以现象在某一段时期内实际完成数值与计划任务对比,用以表
60、明计划完成程度的指标。它是计划管理的特有指标,数值一般用百分比表示,其基本公式是:计划完成程度相对指标=实际完成数计划数计划完成程度相对指标的分子与分母是同类指标,且指标的涵义、口径、计算方法等完全一致。 90 在实际工作中,由于计划任务数的表现形式不同,计划完成程度指标的计算也有所不同,计划有短期计划与长期(一般为5年)计划之分,计划任务数有绝对数、相对数、平均数之分。 1.短期计划完成程度的计算 (1) 计划任务数为绝对数。计划任务数大多数是按总量指标规定的。 一种情况是实际完成数与计划数属于同一时期且时间长度相等。其计算公式如下: 计划完成程度=实际完成数计划数 另一种情况是某一段时期的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建省南平市渭田中学高二语文下学期期末试卷含解析
- 福建省南平市太平中学高一数学理测试题含解析
- 2学会宽容(说课稿)统编版道德与法治六年级下册
- 荣耀之路模板
- 专为电销行业定制劳动协议样本(2024年)版B版
- 外包采购分包合同(2篇)
- 复合手术室项目合同(2篇)
- 多平台同步推广合作协议
- 软件技术开发合同完整协议范文
- 20《精彩极了和糟糕透了》说课稿-2024-2025学年五年级上册语文统编版
- 广西钦州市浦北县2023-2024学年七年级上学期期末语文试题
- 技术服务补充协议范本
- 内河避碰条例题库
- 四年级数学(四则混合运算)计算题专项练习与答案
- 促进自然分娩资料课件
- 人际风格的类型
- 医院科室宣传方案
- 高压变频器培训教材
- 《中国居民膳食指南》
- 立式气液分离器计算
- 《有机热载体炉》课件
评论
0/150
提交评论