统计基础知识课件_第1页
统计基础知识课件_第2页
统计基础知识课件_第3页
统计基础知识课件_第4页
统计基础知识课件_第5页
已阅读5页,还剩251页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计基础知识,编 者 娄庆松,目 录 第一章 概 述,第一节 统计的涵义和特点 第二节 统计学中的几个基本概念,第二章 数据的采集与整理,第一节 统计数据的采集 第二节 统计数据的整理 第三节 统计数据的显示,第三章 总体变量分布特征描述,第一节 统计绝对数 第二节 变量分布集中趋势描述 第三节 变量分布离中趋势描述,第四章 抽样技术概述,第一节 抽样技术概念 第二节 抽样调查和抽样误差 第三节 参数估计,第五章 统计对比与因素分析,第一节 统计相对数 第二节 统计指数的概念和种类 第三节 综合法总指数的编制 第四节 指数体系及其因素分析 第五节 平均法总指数的编制,第六章 时间数列分析,第一

2、节 时间数列的概念和种类 第二节 时间数列的水平指标 第三节 时间数列的速度分析 第四节 长期趋势和季节变动,第七章 相关与回归分析,第一节 相关分析 第二节 回归分析,第一章 概 述,学习要点 本章是全书的总领,重点应掌握以下几点: 一、统计与统计学的涵义,统计学的研究对象及性质。 二、社会经济统计学的研究方法及特点。 三、统计学中的几个基本概念。,第一节 统计的涵义和特点,一、统计与统计学 统计是一门研究数据的艺术,取调查或试验的数值称为统计数据。 (一)统计 统计的涵义:人们正确运用统计理论和方法,采集数据、整理数据、分析数据和由数据得出结论的实际操作活动过程。是人们从数据方面对客观世界

3、的一种认识活动过程和结果。因此,统计活动的中心问题就是要获取数据和得出结论,来向人们提供信息。统计信息是统计数据加工的结果。 例如,学习委员在期末考试后,都要统计全班考试人数、各科总成绩、平均分、及格率、优秀率等,这些数字就是来自调查的统计数据。,(二)统计学 统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技巧的方法论科学。它是一门独立的、实用性很强的通用方法论科学。它源于实践、升华实践、指导实践,从而使统计实践活动更科学、严谨、标准和规范。 二、统计学的研究对象和特点 统计学的研究对象是统计研究所要研究的客体,它决定着统计学的研究领域和

4、研究方法。一般地说,统计学的研究对象是客观事物的数量特征和数量关系。人们要认识客观事物,就必须通过调查或试验来采集有关数据,并加以整理、归纳和分析,对客观事物规律性的数量表现作出统计上的解释。 由于统计定量研究具有客观、精确和可检验的特点,所以统计方法就成为实证研究的最重要方法。它广泛应用于自然、社会、经济、科学技术等领域的统计研究。,例如,政府要治理国家、作出决策、执行计划、检查监督、宏观调控等都需要精确可靠的统计资料为基础;企业要开发产品、市场销售、生产管理、质量控制、资金运用、投资评估等都需要统计资料和统计方法的支持;药剂师应用统计方法进行新医药疗效的显著性检验;工程技术人员应用统计方法

5、测定新工艺、新材料的创新成果;天文学家以统计方法为基础预测星体未来的位置;生物学应用统计方法安排转基因作物田间实验;生命学家用统计方法研究基因工程等等。 虽然所研究的问题属于不同领域,存在千差万别,但所根据的统计理论和方法是相通的。因此,统计学的研究具有以下特点: (一)数量性 人们说“统计的语言是数据”指的就是统计的数量性。而统计数据来源于调查或试验,因此统计数据是客观存在的、具体的、有时空条件的量。,(二)总体性 统计学是以客观现象总体的数量方面作为研究对象,就是说统计的数量研究是对总体中各单位普遍存在的数量事实进行大量观察与综合分析,得出反映总体的数量特征。 例如,政府进行决策,就需要进

6、行城镇居民家庭收支调查,目的不在于了解个别居民家庭,而是要反映一个城市、一个社区、一个部门的居民收入水平、收入分配、消费水平、消费结构等等。客观事物的个别现象常常有其特殊性、偶然性,而总体现象则具有相对的普遍性、稳定性、规律性,有助于得到正确的认识。 (三)变异性 客观现象是不断发展变化的,构成总体的个体是互有差异的,这种差异统计称作变异。它有时间上的变异和空间上的变异,有变异才有必要去统计。 例如,一个商店的销售额在时间上每日数额有差异,每个柜台组之间数额有差异。因此,每日每组都要统计销售额。,三、社会经济统计工作过程和职能 (一)统计工作过程 一般可分为,统计设计、数据采集、数据整理、数据

7、分析、数据提供和管理。 (二)统计的职能 统计具有,信息、咨询和监督三大职能。 (三)信息系统 系统,是由一些相互联系、相互作用的若干要素,为实现某一目标而组成的具有一定功能的有机整体。把信息与系统结合起来就组成了信息系统。 信息系统,是指把各种硬件与软件技术,并融合了各种相关理论和管理方法,以信息为处理对象,来进行信息的采集、生成、存储、传输的,人机相结合的系统。,四、社会经济统计研究的基本方法 统计研究着眼于总体的数量特征,所用的基本方法都与总体数量性有关,这些基本方法是: (一)大量观察法 统计所研究的社会经济现象都是已经发生了的事件,并且无法重复实验,因为社会经济现象本质上是反映人与人

8、之间的关系,它客观地存在于现实生活中,要研究这种关系就不能用实验的方法,而必须到社会经济的现实中去做调查、观测,即采用大量观察的方法对总体中的全部或足够多的个体进行调查、观测,来进行综合研究。 因此,大量观察法是指统计研究客观事物的现状及其发展变化过程,要从总体的全部或足够多的个体进行观察和综合分析的一种统计研究基本方法。 例如,普查、抽样调查、统计报表调查等等都是大量观察法的具体应用。,(二)统计分组法 它是根据统计研究的任务和被研究总体内在特点,按照所确定的分类或分组标准,将被研究总体区分为性质不同的类别或组的一种统计研究基本方法。 例如,国民经济分为一产、二产、三产业;按行业分为工业、农

9、业、建筑业等;按核算方法分为货物与服务等等。 一个统计总体是同质性、大量性与差异性的对立统一体,统计分组就是对这三种性质的综合分析。 (三)综合指标法 综合指标是指,统计绝对数、统计相对数和统计平均数。综合指标法是指将这三种指标有机的结合起来对总体的数量特征与数量关系进行全面分析的统计基本方法。 例如,某班学生人数40人,统计期末考试总成绩 3200分,这是统计绝对数;平均成绩80分,这是统计平均数;及格率96%,优秀率25%,这是统计相对数。他们综合说明该班统计科的学习情况。,(四)统计模型法 它是根据一定的理论和假定条件,应用数学方程式去模拟现实经济现象相互关系的一种统计研究基本方法。在第

10、六章与第七章中具体介绍。 (五)统计推断法 从个别到一般,从事实到理论,进行概括的推理方法,逻辑上称为归纳法。常常存在这种情况;人们所能观察到的只是部分或有限的单位,而所需要判断的总体范围却是大量的,甚至是无限的。这就产生了根据部分数据资料对总体数量特征作出判断的问题。以一定的置信标准要求,根据部分数据判断总体数量特征与数量关系的归纳推断方法称为统计推断法。将在第四章中具体介绍。 本节小结 1.统计是指实践活动过程,统计学是指活动过程的理论指导。 2.统计的特点:数量性、总体性、变异性。 3.社会经济统计的基本方法:大量观察法、统计分组法、综合指标法、统计模型法、统计推断法。,第二节 统计学中

11、的几个基本概念,统计是从总体上来研究大量客观现象的数量特征与数量关系。就是说,统计是从对个体单位的观察人手最终得到反映总体数量特征与数量关系的统计资料。因而,在这个活动过程中产生了一系列的统计专业术语:统计总体、总体单位、标志、指标体系等等。这些专业术语是统计学中最基本的概念,也是统计研究对象的具体量化。要求大家深入理解和熟练掌握。 一、统计总体与总体单位 (一)统计总体与总体单位的概念 统计总体就是根据一定目的确定的所要研究现象的全体。它是由客观存在的、具有某种共同性质的、许多个体所构成的整体。构成总体的个体称为总体单位。 统计总体与总体单位,可以是人,可以是事物,也可以是事件或现象等。,(

12、二)统计总体的特点 构成一个统计总体,必须同时具备以下三个特点: 1.同质性 构成总体的各个单位,必须在某些点是具有共性。 2.大量性 构成总体的个体数目要足够多,足够多是根据研究目的决定的。 3.差异性 构成总体的个体,既有共性又有个性,个性是指各单位之间的差异,这些差异有属性上的差异与数量上的差异。 二、统计标志与统计指标 表明总体单位身上特征的名称称为统计标志;表明总体身上特征的名称称为统计指标。,(一)统计标志 1.标志的概念 标志是表明总体单位属性或数量的名称。 2.标志的种类 3.标志的表现 是指在标志名称的后面所列示出来的属性或数量。 例如,“民族”是品质标志名称,汉、回、蒙、藏

13、、,为品质标志的表现;“年龄”是数量标志名称,16岁、17岁、18岁、,为数量标志的表现。 (二)统计指标 1.指标的概念 表明总体综合数量特征与数量关系的数字资料称为指标。,例如,某班某期末学生40名,期末平均成绩80分,优秀率30%,及格率98%。它包括;时间限制、空间范围、指标名称、计算方法、计量单位、具体数值六个要素。 2.指标的种类 三、统计指标体系 若干个相互联系的统计指标构成一个整体系统称为统计指标体系。 它有两种形式: 1.各指间的关系可以用算术式表达。 如: 销售额 = 销售价格 销售量 ; 总产值 = 生产价格 产量 ; 总成本 = 单位成本 产量,2.各指标间关系无法用算

14、术式表达,只能用相互关联、相互补充关系表示。如,国民经济指标体系是由货物与服务众多指标构成,企业经济指标体系是由多项相关指标构成。 四、标志与指标的区别和联系 (一)区别 (二)联系,五、变异与变量 (一)变异 标志在各单位身上的具体表现互有差别;指标在不同时空上数值的差异,统计上称为变异。 (二)变量 数量标志或统计指标的不同取值,统计上称为变量。也就是说标志或指标会出现不同值,包括时间上或空间上不同的值。因此,数量标志和统计指标的名称称为变量,其具体取值称为变量值。 (三)变量的种类 连续变量:可以用小数表示的变量 离散变量:只能用整数表示的变量,六、统计数据的量化尺度 在统计研究中,量化

15、通常是指概念的操作化或概念的运算化。统计数据是对客观现象进行计量的结果,即它是取自调查或试验的值。因此,统计数据按照量化尺度的不同通常可分为: (一)测量值数据,用测量的方法得到的数据 (二)计数值数据,用清点方法获得的数据 (三)排序数据,用排列顺序方法得到的数据 (四)分类数据,用划分类别方法得到的数据,七、本节小结 (一)总体与指标的关系 : (二)总体单位与标志之间的关系 : (三)统计总体、总体单位、统计指标、统计标志四者的关系:,(四)统计指标的分类:,(五)统计标志的分类:,第二章 数据的采集与整理,学习要点 本章是实物操作的第一阶段,应掌握以下几点: 一、数据的直接来源包括:统

16、计调查和科学试验。 二、统计分组与汇总,编制变量分布数列。 三、统计数据的显示。,第一节 统计数据的采集,图2-1简明扼要地展示了数据的来源 图2-1 数据来源 一、统计数据的直接来源 (一)统计调查 统计调查的组织形式入图2-2所示:,全面统计报表 调查 全面调查 普 查 范围 抽样调查 统 非全面调查 重点调查 计 典型调查 调 调查 连续(经常性)调查 查 时间 不连续调查 周期性调查 形 一次性调查 式 定期报表 普 查 组织 抽样调查 形式 专门调查 重点调查 典型调查 图 2-2,1.统计报表制度 它是依照国家有关法规,自上而下统一布置,以一定的原始记录为依据,按照统一表式、统一项

17、目、统一报送时间和程序,自下而上定期提供统计资料的调查组织方式。 它的特点是: (1)资料来源于基层单位原始记录。 (2)逐级上报和汇总。 (3)多为经常性调查。 分为全面报表和非全面报表两种。 2.普查 为了解某种事物在一定时点上的状况,而专门组织的一次性全面调查。 其特点是: (1)它是间断性调查,如逢“0”年份人口普查,逢“3”年份三产普查,逢“5”年份工业普查,逢“7”年份农业普查等。主要用于采集一定时点上的全面数据。,组织形式: (1)建立专门普查机构和普查人员,对普查单位逐一登记。如表2-1所示。 表2-1 人口普查表 本户 省市 县 乡 村 住址自治区市街道居委会居民小组(街巷

18、号) 申报人普查员填报日期户主姓名 (2)被调查单位依据原始记录和核算资料,结合清库盘点,自行填报调查表。如工业普查、三产普查、农业普查、统计单位普查和财产普查等等。,3.抽样调查 从总体中抽取部分单位作为样本进行调查,根据所获得的样本数据估计总体相应数据,作出具有一定可靠程度的推断的统计方法。 它的特点是: (1)按随机原则抽取样本单位,排除了主观因素的影响。 (2)用样本数据推算总体相应数据。 (3)抽样误差可以事先计算并加以控制,具有一定置信度。 随机原则: 完全排除主观因素,每个单位机会均等,抽中与否全凭偶然。具体操作在第四章中详细介绍。,4.重点调查 它是对总体中重点单位进行调查,取

19、得反映总体基本数据的调查方法。 重点单位:它是重点单位数占总体单位数比重小,他们的标志值之和占总体标志值总量的比重大,有举足轻重的作用。例如农作物产量调查、成交额调查、利税额调查等可颁发调查表进行调查。 5.典型调查 对调查对象进行分类划点的基础上,有意识挑选具有代表性的单位进行深入细致的调查。有好典型与坏典型之分。 (二)采集统计数据的具体操作方法 是指从调查单位上取得统计数据的具体做法。 1.直接观察法 调查人员深入现场进行观察、计数、登记、检验等,取得第一手资料。,2.报告法 被调查单位依据原始记录、核算资料、清查盘点,填报统计数据。 3.访问法 调查者通过口头、邮件、网络、报纸杂志等方

20、式向被调查者采集数据。 4.问卷法 利用统一设计的答卷向被调查者采集统计资料。 (三)调查方案设计 统计调查方案一般包括以下内容: 1.调查目的 指在调查中需要解决哪些问题,采集什么资料。 2.调查对象与调查单位 调查对象是指根据调查目的所确定的调查总体;调查单位指在调查对象中所要调查的具体单位。,3.调查单位和调查表 调查提纲是指根据调查目的所列示出的调查项目,主要是标志、指标和指标体系。将调查项目按一定顺序排列在表格中形成调查表。 4.调查时间与期限 调查时间是指资料所属时间;调查期限是指完成调查工作所需时间。 5.组织实施计划 指调查工作的行动部署与具体活动安排。主要包括领导机构建立、调

21、查步骤、参调单位与人员、人员培训与试点、汇总整理办法、资料报送、经费开支和预算等等。 (四)试验 对客观现象的科学观察和科学实验统称为试验。 1.对照实验 设计一个实验来测试某被调查对象的数据,是在一次真实的现场实验中逐步展开,在调查人员控制之下的活动过程,来获取统计数据。,2.观察研究 设计一个调研人员控制之外的实验过程,而调研者只是把观察所发生的情况记录下来。 3.促销实验 在一定条件下,在一定范围内,对某种新产品试销或赠送来摸清用户的反映。 4.改革实验 建立社会主义市场经济体制需要经验,经验不足,就需要通过建立实验区来获得有关数据,推动改革进程。 二、统计数据的间接来源 统计数据的间接

22、来源是指利用他人调查或试验所得的数据,也称次级调查。一般是通过案头作业方式来完成。目前,实施次级调查较好的部门有:交易市场调查、金融市场调查、海关统计调查、财税管理调查、工商城管统计调查等。,具体渠道有: (一)查阅有关出版物 (二)向政府统计结构或调查公司咨询 (三)网上查询 本节小节 1.全面调查与非全面调查的区别:是以所包含的调查单位是总体的全部还是部分为依据,而不是以最后得到的是否为全面资料为依据。因为有的非全面调查其目的仍然是获取总体数据,如,抽样调查。 2.经常性调查和一次性调查的区别:是以调查数据的登记在时间上是否具有连续性为依据。经常性调查是指一段时期内的流量;一次性调查是指某

23、时点上的存量。如表2-1所示。,表2-1 统计调查小结,3.重点、典型、抽样调查的区别: 三者都是非全面调查,它们的区别如表2-2所示。 表2-2,4.调查单位与报告单位的区别: 二者区别如表2-3所示。 表2-3,第二节 统计数据的整理,信息必然是数据,但数据未必是信息。信息是数据的一个子集,只有经过加工整理的数据才能成为信息。本节具体介绍统计数据的加工整理,使之生成统计信息的具体操作。 一、统计数据整理的意义和内容 (一)统计数据整理的意义 根据统计研究目的和任务,对统计调查或科学试验所获得的原始数据进行科学分类、汇总计算,或对次级资料进行再加工,使之生成系统化、条理化、标准化来反映总体数

24、量特征与数量关系的操作过程。 通过统计调查或科学试验所获得的原始数据只能说明总体各单位的具体情况,不能反映总体综合特征。因此,必须通过科学整理才能成为统计信息。,(二)统计数据整理的内容与步骤 1.设计整理方案 主要明确规定出统计分组的方法和要汇总的统计指标与指标体系。 2.数据审查 主要审核原始资料的准确性和完整性。 3.数据分组 根据统计研究的要求,按照选定的分组标志,将审核后的原始数据进行分类或分组。 4.数据汇总与计算 对分组后的数据进行汇总与计算的方法主要有手工汇总和计算机汇总。 (1)手工汇总 用算盘或电子计算器作为工具进行汇总计算。主要方法有划记法、过录法、折叠法和卡片法等。,这

25、里主要介绍划记法或过录法。 划记法:在事先设计好的汇总表上用点、线或划“正”字的方法进行分组汇总计算并将结果填入正式统计表中。 过录法:把调查表中资料一一过录到事先设计好的表格中然后进行汇总计算。 (2)电脑汇总 电脑汇总大体分为六个步骤: 编程编码录入检查制表打印数据存储。可采用SAS软件。 5.编制统计表、绘制统计图。 二、统计分组 (一)统计分组的概念 根据统计研究的要求,按照选定的分组标志,将审核后的原始数据进行分组或分类。 统计分组应遵循“相同者合并,不同者分开”的原则,将相同性质的个体划在同一组内,不同性质的个体划入不同组内,组与组之间的性质是不同的。,理解统计分组的概念要明确以下

26、三点: 1.统计分组的对象是总体; 2.应有分组标志; 3.对总体而言是“分”,总体单位而言是“合”。 (二)统计分组的作用 1.划分现象的类型;2.显示内部结构;3.分析依存关系。 某企业职工情况,(三)统计分组方法 统计分组的关键是选择分组标志与划分各组界限。选择分组标志是确定不同组的标准和依据;划分各组界限是确定相邻组的性质界限或数量界限。 1.按品质标志或数量标志分组 按品质标志分组就是用反映事物属性、性质的标志分组。例如,职工按职称分组、企业按部门分组、学生按性别分组等等。 按数量标志分组是用事物的量作为分组标志,它可以是绝对数、相对数或平均数。 2.按离散变量或连续变量分组 它是根

27、据变量取值类型来分组。离散变量分组,如企业按机器台数分组、旅馆按客房间数分组、医院按病床数分组等等。 连续变量分组,如商店按销售额分组、工厂按产值分组、学生按考试成绩分组等等。,3.简单分组和复合分组 简单分组是按一个标志分组;复合分组是按两个或两个以上标志分组。 三、变量分布数列 (一)变量分布数列的概念 统计分组的过程就是变量分布数列生成的过程。入图2-3。 图 2-3 分布数列生成过程 将组别依次排列,同时列出各组单位数(频数)便生成变量分布数列。它有表格与图示两种显示方式。,(二)变量分布数列的编制方法 1.单项式变量分布数列的编制方法 单项数列是把每个变量值作为一组所生成的数列。例如

28、,某生产组20名工人同种产品日产量如下(单位:件): 16 13 18 15 19 14 17 13 15 17 19 15 17 18 14 16 15 16 17 16 这是一个离散型变量,变量值不多、变动范围不大,宜编制单项式变量分布数列。 (1)按变量值大小顺序排列: 13 13 14 14 15 15 15 15 16 16 16 16 17 17 17 17 18 18 19 19 (2)每种变量值为一组(重复者只取一个)顺序排列: 13 14 15 16 17 18 19 七组 (3)列入表中并汇总计算各组频数,见表2-4所示。,表2-4 20名工人日产量资料(单项式),将表2-

29、4绘制成变量分布图2-4。,2.组距变量数列的编制方法 例如,某班40名学生某科某次考试成绩如下: 54 60 62 97 85 52 83 79 95 80 89 85 77 68 86 93 70 81 78 89 71 89 80 85 75 78 90 66 78 73 82 82 99 77 88 84 75 88 76 80 试编制等距数列。 (1)将数据顺序排列,并判断变量性质。 52 54 60 62 66 68 70 71 73 75 76 77 77 78 78 78 79 80 80 80 81 82 82 83 84 85 85 85 86 88 88 89 89 89

30、 89 90 93 95 97 99 变量性质为连续变量,宜编制组距式变量数列。,(2)计算全距 全距 = 最大变量值 - 最小变量值 该班成绩全距 = 99 52 = 47(分) (3)确定组限、组距和组数 组限是指每组的两端变量值,每个组的起点值称为下限,每个组的终点值称为上限。 组距是指上限值与下限值之差,即组距 = 上限值 - 下限值 组数是指变量数列应划分为多少个组。 确定组距与祖数的具体方法如下: 所使用的全距最小值应略低于实际资料的最小值,自50分开始,最大值应略高于实际资料最大值,最大值取100分。则本例全距为100-50=50。 若组距为5,则 组数 = 全距 组距 = 50

31、 5 = 10 (组) 若组距为10,则 组数 = 50 10 = 5 (组) 本例采用组距为10,组数为5。,(4)列表汇总计算 汇总计算要遵循“不重不漏”的原则。 连续型变量数列相邻两组的组限采用“重限分组”的方法, 即相邻两组之间的组限用同一个数值标记。为了处理好恰巧是组限的变量值的总体单位的归属问题,应按“不含上限,含下限”的原则处理。例如,60分者应归入6070组中,70者应归入7080组中, 80分者应归入8090组中, 90分者应归入90100组中。见表2-5所示。 表2-5 40名学生成绩整理表,将整理表编制成正式表,如表2-6所示。 表2-6 40名学生成绩统计表 组中值是每

32、组的中点数值,计算方法(上限+下限) 2 。如,(50+60)/2 = 55 、(60+70)/2 = 65 、(70+80)/2 = 75 、 (80+90)/2 = 85 、(90+100)/2 = 95 等。,3.开口组变量分布数列的编制 若变量值中有特大或特小的极端值出现时,为避免出现空白组或个别极端值被遗漏,最小组和最大组可采用开口组办法解决,即“以下”、“以上”。并以相邻组组距作为其组距。 例如,某班40名学生考试成绩如下: 36 56 60 60 64 64 64 68 68 68 70 70 75 75 75 75 78 78 78 78 78 78 79 79 79 79 8

33、4 84 85 85 88 88 89 89 89 89 95 95 98 100 编制等距变量数列如表2-7所示。,表2-7 40名学生成绩统计表(开口式) 两个开口组均用邻组组距,即均为10。 60以下组组中值为:上限邻组组距2 = 60102 = 55 90以上组组中值为:下限+邻组组距2 = 90 + 102 = 95,本节小结:,第三节 统计数据的显示,统计数据的显示方法有表格法与图示法两种形式。 一、统计表 (一)统计表的意义 将汇总得到的统计数据按一定顺序排列在表格中,这种表格称为统计表。 (二)统计表的结构 1.形式上:总标题、横行标题、纵栏标题、数字资料。 2.内容上:主词栏

34、、宾词栏。 3.举例:见表2-8、表2-9所示。,总标题 表2-8 2003年社会消费品零售总额 纵栏 标题 横行 数字 标题 资料 主词 宾词,总标题 表2-9 全国税收收入及其构成表 (2003年) 纵栏 标题 横 指 行 标 标 数 题 值 主词栏 宾词栏,(三)统计表的种类 1.按作用 调查表 2.按主词 简单表 分 类 汇总表(整理表) 分 类 分组表 分析表 复合表 3.举例: (1)简单表,主词未经分组,只排列空间顺序如表2-10所示。 表2-10 某年某进出口公司商品收购计划完成情况(单位:万元),统计表的主词按时间顺序排列的简单表,如表2-11所示。 表2-11 某年某企业增

35、加值统计表(单位:百万元),(2)分组表:主词只按一个标志分组的统计表,见表2-12所示。 表2-12 某年全社会固定资产投资统计表,(3)复合表:主词按两个或两个以上标志分组的统计表,见表2-13所示。 表2-13 某年某校在校生人数统计表,在复合分组表中设计横行标题时,应在第一次分组的各组组别下退一、二字填写第二次分组的组别,此时第一次分组的组别就成为第二次分组的个组小计。若需再进行第三、四次分组,均可按此类推。再如表2-14所示。 表2-14 国内生产总值统计表,3.宾词设计分类 按排列形式分类:简单排列、分组排列、层叠排列。 (1)简单排列:宾词不加任何分组,按项目或时间排列。 如表2

36、-15所示。 表2-15 某地区工业企业主要经济指标统计表,(2)平行排列:宾词各栏平行设计,如表2-16、2-17所示。 表2-16 各地社会商品零售总额统计表(单位:亿元),表2-17 某商厦三个商场职工性别和年龄构成统计表,(3)层叠排列:两个或两个以上标志分组后上下层叠起来列示。见表2-18、2-19所示。 表2-18 1998-2002年农村劳动力分布情况,表2-19 某商厦三个商场职工性别和年龄构成统计表 二、统计图 利用几何图形或具体形象来显示统计数据,按表现形式分为几何图、象形图、统计地图等形式。这里不作深入介绍。,第三章 总体变量分布特征描述,学习要点 一、理解总量指标的概念

37、和作用,掌握标志总量与主体单位总量的含义和区别。 二、理解平均指标和变异指标的概念及两者辨证关系。 三、理解并熟练掌握均值、全距、标准差和标准差系数的计算与应用。 四、理解权数的意义和作用。,第一节 统计绝对数,一、统计绝对数的概念 它是表明总体规模的绝对数量,即表明现象大小多少的总量,在社会经济统计中称为总量指标。 统计绝对数多是在试验、调查和整理中直接获得,也有一些是间接或推算得到。 统计绝对数是统计描述的基础数据,是从数量上认识客观事物的起点数据,又是计算统计相对数与统计平均数的基础数据。 在运用统计绝对数时,应注意正确使用计量尺度和计量单位以及准确界定被研究对象的总体范围和口径。 二、

38、统计绝对数的种类 (一)按其描述对象不同可分为:总体单位总数和标志值总量。 如表3-1所示。,表3-1 某生产组25名工人日产量资料,(二)按时间状况分为:时期性总量(流量)和时点性总量。 如表3-2所示。 表3-2 账页 (存量)时点(流量)时期 (存量)时点,(三)统计绝对数的计量单位 1.实物单位 实物单位是根据事物的自然属性和物理属性度量其数量的计量单位,常用的有: (1)自然单位。是按照现象的自然状态来度量其数量的计量单位。例如,人口用“人”、牛用“头”、汽车用“辆”等计量单位。 (2)度量单位。是指国家度量衡制度统一规定的计量单位。例如,重量用“吨”、“克”表示;长度用“公里”、“

39、米”等表示;面积用“平方米”、体积用“立方米”等表示。 (3)复合单位。是指两种单位结合而成的计量单位。例如,发电量用“千瓦时”表示;货运量用“吨公里”表示等等。 (4)双重或多重单位。是指同时采用两种或两种以上计量单位表明某一事物的数量。例如,电动机用“千瓦/台”表示;拖拉机用“马力/台”表示;船舶用“艘/马力/吨”表示等等。,2.货币单位 是用货币来表示的计量单位。例如,我国用人民币元、角、分为计量单位;国际用美元、欧元、日元等表示。 3.劳动时间单位 是用劳动时间来表示的计量单位。例如,工日、工时等。1个工人工作1小时叫做1个工时,8个工时为1个工日。 本节小结: 按内 单位总量:总体内

40、所包含的单位总数 容分 标志总量:总体内所有单位上标志值总和 按时 时期总量(流量):一段时期内的总量 统计绝对数 间分 时点总量(存量):某一时点上的总量 (总量指标) 按计 实物总量 量单 价值总量 位分 劳动时间总量,第二节 变量分布集中趋势描述,集中趋势描述的实质是:找出变量值的集中点或中心值。常用方法有:算术平均数、几何平均数、中位数和众数等。 一、算术平均数 它是同质总体内各单位某类变量分布集中趋势的代表值,它是同质总体内某类变量所有变量值的平均数。 例如, 甲数列:68、69、70、71、72, 乙数列:50、60、70、80、90, 绘制成线段图3-1所示。 50 60 70

41、80 90 甲 乙 图3-1,图3-1显示:甲数列集中程度大,乙数列离散程度大。显然,变量的离散趋势大集中趋势低如乙数列;离散趋势小集中趋势高如甲数列。 算术平均数是测定集中趋势最常用的代表值,它的实质是把同质总体中各单位变量值的差异(离差)正负相互抵消后反映变量集中趋势中心点的代表值。如甲、乙两数列: 甲数列:68、 69、 70、 71、 72, 离差:-2 -1 0 1 2 乙数列:50、 60、 70、 80、 90, 离差:-20 -10 0 10 20 因此,统计平均数是对变量数列围绕中心值分布状况的一种统计描述。,(一)简单算术平均数 用字母表示为: 式中: 算术平均数; xi

42、表示第i个变量值; n 总频数; 加总符号。 代入数值为: 甲: = = 70 乙: = = 70,=,(二)加权算术平均数 1.根据单项变量分布数列计算算术平均数 用字母表示: = 式中:fi第i组的变量值出现的次数,即频数。 利用分组数据计算算术平均数的过程是: (1)表内,根据x栏与f栏内数值计算出xf栏内数值。xf栏为各组变量总值,xf栏的合计数为总体变量总值。 (2)表外,将xf(变量总值)和f(总频数)代入公式,计算出算术平均数 。 例:某生产组10名工人生产甲产品,日产量分组资料 如表3-3所示。试计算工人平均日产量。,表3-3 加权算术平均数计算表 = = = 26 (件) 计

43、算表明,平均日产量26件趋近工人数最多即频数最大的那个变量值30件。若本例各变量值x不变,各组工人数f的分布变化,可得表3-4。,表3-4 加权算术平均数计算表 根据表3-4资料计算平均日产量为: = = 14(件) 计算表明,平均日产量14件趋近工人数最多即频数最大的变量值10件。,由上例可以看出,用分组数据计算平均数,平均值的大小受两个因素影响:一个是各组变量值x,另一个是各组次数即频数f的影响。当各组变量值x不变时,各组次数即频数f对平均值的大小起着权衡轻重的作用。因此,次数f称为权数,这种方法称为加权算术平均法。 权数不仅可以用绝对数f表示,也可用相对数即频率f/f表示。即:,例表3-

44、5所示。 表3-5 加权算术平均数计算表 = = 26(件),2.根据组距式变量分布数列计算加权算术平均数 若掌握组距数列资料,计算方法是:先计算组中值xi ,然后再按上述方法计算加权算术平均数。如表3-6所示。 表3-6 组距数列加权算术平均数计算表,(1)计算组中值: 缺下限组组中值 = 上限邻组组距/2 = 400100/2 = 350(件) 缺上限组组中值 = 下限邻组组距/2 = 800100/2 = 850(件) 上下限齐全组组中值 =(上限+下限)/2 = (500+400)/2 = 450(件) (2)计算平均数 = 34200/60 = 570(件) = 570(件),综上,

45、简单算术平均数与加权算术平均数之间没有根本区别,因为一个变量值乘上一个频数(权数)与多次加总同一个变量值是意义相同的。它们的基本公式都是相同的: 算术平均数 = 变量值总量 / 单位总量 二、算术平均数的变形调和平均数 在实际工作中有时由于资料的原因不能直接计算算术平均数,可采用调和平均数的形式间接算出算术平均数,其计算结果与算术平均数相同。因此,在这种情况下调和平均数的应用是算术平均数的变形形式。如表3-7所示。 表3-7 同种商品价格及销售额资料,调和平均数的计算方法如表3-8所示。 表3-8 调和平均数计算表 m是变量总值,因为m=xf,所以m/x=f是各组频数,m/x是总次数。由此可见

46、,调和平均数是算术平均数的变形形式。 加权调和平均数的计算方法为: 平均价格,调和平均数有以下特点: (1)调和平均数易受极端值影响,当变量呈明显偏态时它的代表性会受影响。 (2)当变量中有0值时,调和平均数无法计算。 三、几何平均数:在第六章中介绍。 四、中位数和众数(略) 本节小节 算 术 由于在计算时所有变量值均参加了计算, 集 平均数 因此,算术平均数能够代表所有的变量 中 平均值 值。算术平均数对极端值反映很灵敏。 趋 调和均值: 调和平均数是算术平均数的变形。 势 中位数是各变量值中央位置的代表值, 测 位置值 中位数 不受极端值影响。众数是出现次数最多 度 众 数 的变量值,不受

47、极端值影响。,第三节 变量分布离中趋势描述,均值是描述变量分布集中趋势,标准差是描述变量分布离中趋势,两者相辅相成共同反映变量分布特征的一对对立统一的代表值。描述离中趋势的代表值常用的有:极差、标准差和离散系数等。 一、极差 极差也称全距,是变量值中最大值与最小值之差。用公式表示为:全距(R)= 最大变量值 - 最小变量值。如: 甲数列: 68 、69 、70 、71 、72 , R = 72-68 = 4 乙数列: 50 、60 、70 、80 、90 , R = 90-50 = 40 组距数列计算全距: 全距(R)= 最高值组上限值 - 最低值组下限值。如表3-9: 表3-9 40名工人日

48、产量资料,R = 100-50 = 50(件) 用离差评价变量的离散状况:极差值越小表明变量值离散范围小,离散程度小,变量值集中,平均数代表性大;极差值越大,表明变量值离散范围大,离散程度大,变量值分散,平均数代表性小。极差值对极端值反映灵敏。 二、方差和标准差 方差和标准差是最重要、最常用的离中程度的度量方法,多用于以算数平均数为集中趋势度量的场合。 (一)方差 它是各变量值相对于平均数 的离差的平方的平均数,方差习惯上用字母“2”表示。它的计算过程是:先用各个变量值xi减去其平均数 ,得出离差xi- 。而离差有正、负之分,为了防止正、负离差相互抵消,可取离差的平方值(xi- )2,最后用离

49、差平方之和除以项数n或总次数f可得方差。,1.简单式方差: 2 = 2.加权式方差: 2 = (二)标准差 标准差是方差的平方根计算公式为: 1.简单式方差: = 2.加权式方差: = (三)标准差的计算方法 1.简单式标准差: 计算过程见表3-10、3-11所示。,表3-10 甲组简单式标准差计算表 = 350/5=70(件) = = 14.14(件),表3-11 乙组简单式标准差计算表 = 350/5=70(件) = 计算表明,乙组比甲组标准差小,则乙组比甲组离中程度小,即乙组变量值分布范围比甲组集中,乙组平均数代表性大。,2.加权式标准差(计算过程如表3-12)。 表3-12 单项数列标

50、准差计算表,计算公式如下: = 400/25 = 16(件) 由组距式变量数列计算标准差见表3-13。 表3-13 组距变量数列标准差计算表 = 3100/100 = 31(千克),= 三、离散系数 若研究的总体不同,或计量单位不同,或平均数相差悬殊,它们离中趋势的绝对数是不可以比较的。为此,要计算离中趋势的相对数,即离散系数。 离散系数有几种,常用的是标准差系数,它是标准差除以平均数表明每单位平均数的离散程度,用百分数表示,是变量分散性的相对程度度量。标准差系数常用字母“V”表示,计算公式为: V = (一)比较总体相同,计量单位不同两组变量数列的离散程度 例如,某市6岁男童体重与身高资料如

51、下: 平均数 标准差 体重: 19.39千克 2.16千克 身高: 115.87厘米 4.86厘米,标准差系数为: 体重: V = 2.16/19.39100% = 11.14% 身高: V = 4.86/115.87100% = 4.19% 计算表明体重变异大于身高变异 (2)比较计量单位相同平均数差异大的两组变量的离散程度 例如,表3-14和表3-15两组资料。 表3-14 成人组身高标准差计算表(单位:厘米),= 168(厘米) = 2.828(厘米) 表3-15 幼儿组身高标准差计算表 = 73(厘米) = 1.414(厘米) 标准差系数为: 成人组 V = 1.68% 幼儿组 V =

52、 1.94% 计算表明成人组身高离散程度小于幼儿组。,(三)比较总体不同,计量单位也不同两组变量的离散程度 例如,甲国某企业员工月平均收入3000美元,标准差180美元;乙国某企业员工月平均收入7500欧元,标准差600欧元,问哪国员工月平均收入离散程度小? 甲国 V = 6% 乙国 V = 8% 计算表明,甲国企业员工月平均收入离散程度小。 本节小结: (一)离散程度的实质 标准差可以概括地、直接地、平均地描述变量发布的离散程度,是各变量值xi距离它们的平均数远近的一种尺度。概率论指出,在正态分布中68%的变量值分布在距离平均数一个值的范围内,95%的变量值分布在距离平均数两个值的范围内,其

53、余的5%远离平均数。,(二)平均数与标准差 平均数通常可用来寻找变量分布的中心值;标准差则度量了各变量值对于平均数的分布程度。两者关系用正态分布图展示: 68% 95% 99%,本章小结: (一)总体变量分布特征的统计描述 将采集到的资料整理成变量数列后,呈现给我们的只是一个总体变量分布形态,进一步研究总体变量分布的规律性,就会发现总体变量分布具有集中趋势和离中趋势两个方面的特征。因此 就需要对总体变量分布特征进行集中趋势和离中趋势的描述 平均指标和变异指标。 平均值算术、调和、几何平均 集中趋势测度 位置值中位数、重数 总体变量 分布特征 绝对数全距 离中趋势测度 平均数标准差 相对数标准差

54、系数,(二)权数的意义 加权算术平均: = 用 对变量值x加权平均; 加权调和平均: = 用 对变量值倒数 加权平均; 加权标准差:= 用 对离差 加权平均。,第四章 抽样技术概述,学习要点 一、理解和掌握抽样调查的概念、特点和作用。 二、掌握抽样技术中常用的基本概念。 三、熟练掌握抽样平均误差的概念、影响因素和计算方法 四、熟练掌握极限抽样误差的概念和计算方法。 五、掌握必要抽样数目的意义和计算。 六、了解全及总体总量指标的推算和抽样调查组织方式。,第一节 抽样技术概念,一、抽样技术的涵义 抽样技术是统计学的重要分支,它已经成为当今世界上最重要的统计方法。它广泛应用于社会、经济、科技和自然等各个领域,成为现代统计学中发展最快、最活跃的一个分支。 抽样技术的完整概念应包括对样本的调查和对总体数据的估计两个方面。这里首先介绍抽样调查,然后介绍总体数据估计的基本理论和方法。 (一)抽样调查 它是一种非全面调查,是根据随机原则从总体中抽取部分单位进行调查。这部分单位称为样本。而这部分单位数目的多少不是随心所欲确定的,是根据一定原则和要求用科学的方法计算来确定。所谓随机原

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论