版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统 计 学 主讲:杨彩虹会计系 学习统计学的目的和要求: 在理解基本概念的基础上,掌握统计资料的搜集、整理以及分析的方法。重点掌握抽样推断、动态分析、指数分析、相关与回归分析方法。统计学内容第一章 总论第二章 统计数据的搜集和整理第三章 数据分布特征的测度第四章 动态数列分析第五章 统计指数第六章 抽样推断第七章 相关与回归分析第八章 综合复习 返回第一章 总论 通过本章学习要求学生了解统计学产生与发展的历史,明确统计学的涵义、研究对象等一些基本问题,重点理解统计学中的几个基本概念。第一节 统计学的产生与发展第二节 统计学的研究对象与研究方法第三节 统计学的基本概念 返回第一节 统计学的产生与
2、发展一、统计的涵义二、统计学的产生和发展三、统计学的分科 返回一、统计的涵义 统计工作: 统计工作者搜集、整理、计算分析或推断统计资料的工作过程。 统计资料: 以文字、图表等形式显示出来,用来说明事物的现状、事物之间的内在联系以及未来发展趋势的数据。 统计学: 是一门研究搜集、整理、分析或推断统计资料的方法论性质的科学。 返回 二、统计学的产生和发展(一)古典统计学时期(17世纪中叶18世纪中叶) 1、政治算术学派1创始人:威廉配第 、格朗特2产生的背景:当时的英国统治阶级为了管理国家、发展经济、争夺世界霸权,需要了解国内外的社会经济状况,于是在英国产生了政治算术学派。3研究方法:从数量方面研
3、究社会经济现象。 返回 2、 国势学派 1创始人:海尔曼康令、阿亨瓦尔 2产生的背景:当时的德国正处于封建制度解体的时期,统治者要了解国内外的政治经济情况,决定国策,在当时封建制的德国产生了国势学派。 3研究方法:对国家重要事项的记述,几乎完全偏重于品质方面而忽视了量的分析。 返回(二)近代统计学时期(18世纪末19世纪末) 1、数理统计学派1创始人:阿道夫凯特勒(比利时)2产生的背景:当时资本主义国家的自然科学有了很大发展,促使英美统计学界尝试用研究自然的方法研究社会经济现象,并引入概率论,产生了数理统计学派.3研究方法:用大数定律从社会经济现象复杂不定的偶然性中寻找其规律性。 返回2、社会
4、统计学派(1)创始人:德国的克尼斯(2)产生的背景:实现了统一的德国,为了发展资本主义、争夺殖民地和海外市场,迫切需要掌握国内外大量的国民经济统计资料,以揭示社会经济现象的规律性,于是在德国形成了社会统计学派。(3)研究方法:在对统计资料进行搜集、整理、分析的基础上,明确现象内部的联系和规律性。 返回(三)现代统计学时期(20世纪初至今) 数理统计学派与社会统计学派逐步融合,成为统一的现代统计学。从20世纪60年代以后,统计学的发展有几个明显的趋势: 1、统计学依赖和吸收的数学方法越来越多; 2、统计学向其它学科领域逐渐渗透; 3、借助电子计算机后,统计学发挥的功效日益增强。 返回(一)从统计
5、方法的构成来看 1.描述统计学研究如何搜集、加工处理、显示及计算分析数据的方法。 2.推断统计学研究如何根据样本数据推断总体数量特征的方法。 返回三、统计学的分科(二)从统计方法的研究和应用角度 1.理论统计学 即数理统计学,主要探讨统计学的数学原理和统计公式的来源。 2.应用统计学 主要探讨如何运用统计方法去解决实际问题。 返回第二节 统计学的研究对象与研究方法 一、统计学的研究对象: 统计学的研究对象是社会现象和自然现象的数量方面,即数量特征和数量关系。 返回(一)统计学的性质: 统计学是一门适用于自然现象和社会现象的方法论性质的学科。(二)研究对象的特点 1.总体性 2.数量性 3.客观
6、性 4.具体性 5.变异性二、统计学的研究方法(一)大量观察法(二)统计分组法(三)综合指标法(四)统计模型分析法(五)统计推断法 返回三、数据的计量尺度(一)定类尺度 = (二)定序尺度 (三)定距尺度 + -(四)定比尺度 第三节 统计学中的基本概念一、统计总体与总体单位二、标志三、指标四、变量 返回一、总体与总体单位 (一)总体 1、概念: 在同一性质基础上结合起来的许多个别事物的整体。 2、种类 (1)有限总体:总体中的单位数是有限的。 (2)无限总体:总体中的单位数是无限的。 3、注意 构成总体的单位必须是同质的; 返回4、总体的特点 (1)同质性:构成总体的各个单位至少具有某种相同
7、的性质。构成全国所有油田这个总体的各个单位经济职能是相同的,都是进行原油生产和加工的。 (2)大量性:总体是由许多单位组成的,仅仅个别或少数单位不能形成总体。 (3)差异性:构成总体的各个单位在诸多方面是不同的。 返回(二)总体单位构成总体的各个单位称为总体单位。(三)总体与总体单位不是固定的 随着研究目的和范围地改变,原来的总体(总体单位)可以变为总体单位(总体)。 返回二、标志 (一)标志和标志表现 标志:是说明总体单位特征的名称。 标志表现:是标志特征在各单位的具体体现。 (二)标志的分类 1、按变异情况 (1)不变标志: 当一个标志在各个单位的具体表现都相同时,称为不变标志,它是构成统
8、计总体的基础; (2)变异标志 当一个标志在各个单位的具体表现不尽相同时,称为变异标志,它是统计研究的主要内容; 返回2、按性质可分为(1)品质标志:说明总体单位质的特征,不能用数值表示。如果总体单位是一位学生,性别、籍贯、是否近视等是品质标志。(2)数量标志:说明总体单位量的特征,是用数值表示的。年龄、身高、以百分制表示的学习成绩等是学生这个总体单位的数量标志 返回三、指标 (一)概念: 指标是说明总体数量特征的名称及数值。 (二)特点: 1、总体性: 2、数量性:所有的指标都可以用数值来表现; 3、综合性:指标的形成都必须经过从个体到总体的过程; 4、具体性:它是一定的具体的社会经济现象的
9、量的反映,说明的是客观存在的已经发生的事实; 返回 (三)分类 1、按说明总体内容的不同: (1)数量指标:反映总体绝对数量多少的指标。其特点是指标数值随总体范围的扩大(缩小)而增大(减小)。 (2)质量指标:说明总体内部数量关系和总体一般水平的指标,一般表现为相对数和平均数。其特点是指标数值大小不随总体范围的变化而增减。 返回2、按作用形式和表现形式不同:(1)总量指标(2)相对指标(3)平均指标 返回(四)指标与标志的关系 1、区别: (1)指标是说明总体特征的,标志是说明总体单位特征的。 (2)指标都是用数值表示的,标志有用数值表示的和不用数值表示的。 2、联系: (1)综合关系,指标数
10、值是总体单位的数量标志值综合汇总而来的。 (2)转换关系,由于研究目的或范围的变化,原来的总体(总体单位)变成总体单位(总体),相应的指标(标志)就变成标志(指标)。 返回 四、变量 1、概念 指可变的数量标志。 变量的具体数值表现称为变量值。 2、种类 (1)按变量值是否连续分为:连续变量、离散变量 (2)按性质分为:确定性变量、随机性变量 返回 第二章 统计数据的搜集和整理 第一节 统计数据的搜集第二节 统计数据的整理第三节 统计数据的显示 返回第一节 统计数据的搜集 一、数据的来源 二、数据的类型 三、统计调查方式 四、统计调查的具体方法 五、统计调查方案返回(一)数据的间接来源 优点:
11、易得到,采集成本低,采集速度快 局限性:相关性、时效性、准确性欠缺(二)数据的直接来源 1、社会现象-调查的方式 2、自然现象-试验的方式一、数据的来源二、数据的类型(一)按计量尺度划分1、定类数据2、定序数据3、定距数据4、定比数据定性数据或品质数据定量数据或数量数据、数值型数据(二)按数据的收集方法、观测数据、实验数据(三)按现象与时间的关系、截面数据、时间序列数据三、统计调查方式(一)定义:根据统计研究的目的要求和任务,运用科学的调查方法,有计划、有组织地想客观实际搜集资料的过程。(二)类别统计调查形式调查范围调查时间组织形式全面调查非全面调查全面统计报表普查抽样调查重点调查典型调查连续
12、调查不连续调查周期性调查一次性调查定期报表专门调查普查抽样调查重点调查典型调查 (三)统计调查方式 1.统计报表 ( (1)概念:统计报表是按照国家有关法规的规定,自上而下统一布置,自下而上地逐级提供基本统计数据的一种调查方式。 (2) 种类:按报送范围不同,有要求调查对象中每个单位都填报的全面报表和只要求调查对象中的一部分单位填报的非全面报表。按报送的周期不同,有日报、月报、季报、年报等。按报表的内容和性质不同,有国家统计报表、部门统计报表、地方统计报表。2.普查 (1)概念:普查是为某一特定目的而专门组织的一次性全面调查。 (2)特点:普查通常是一次性或周期性的。普查一般需要规定统一的标准
13、调查时间,以避免调查数据的重复或遗漏。标准时间一般定在调查对象比较集中,变动相对较小的时间上。普查数据一般比较准确,规范化程度也较高。普查的适用对象比较狭窄,只能调查一些最基本、最一般的现象。 3.抽样调查 抽样调查是从总体中随机抽取一部分单位进行调查,根据其调查结果推断总体数量特征的一种非全面调查方法。4.重点调查 重点调查是从全部单位中选择少数重点单位进行调查,以了解总体的基本情况。5.典型调查 是从研究对象的全部单位中选择一个或几个少数有代表性的单位进行全面深入的调查,用来揭示同类事物的本质规律性。 返回四、统计调查的具体方法 (一)观察法 调查者通过实际观察事情发生的经过和结果,得到自
14、己所需要的资料。 (二)访问法 调查者采用各种询问的方式向被调查者了解情况的一种方法。有(1)面谈访问法(2)电话访问法 (3)邮寄访问法 (三)实验法 控制一个或几个变量,调查另外一个市场变量有关资料的方法。 (四)报告法 被调查单位按照统一要求和表格形式,向有关部门提供统计资料的方法。 返回 (五)文献法 调查人员根据调查方案的内容和要求,收集文献资料的一种方法。(六)网上调查 利用互联网进行调查,获取调查资料的统计调查方法。五、统计调查方案(一)确定调查目的调查研究所要达到的具体目标,解决的问题,具有的社会经济意义。(二)确定调查对象、调查单位和报告单位 1.调查对象:根据调查目的所确定
15、的调查研究的总体。 2.调查单位:构成调查对象的每个单位。 3.报告单位:负责报告调查内容的单位。 返回(三)确定调查内容 调查内容一般以调查表或问卷的形式出现。 1.调查表有单一表和一览表。 2.问卷是一种特殊的调查表,其内容是由一系列问 句所构成的。(四)确定调查时间 包括时期资料所属的时期、时点资料所属的时点和调 查工作的期限。(五)调查的组织和实施 包括调查所采用的方法、组织和实施的具体细则等事 项。 返回第二节 统计数据的整理一、统计整理的概念和意义二、统计分组三、频数分布返回一、统计整理的概念和意义(一)概念: 统计整理是指根据统计研究任务的要求,对调查所搜索的原始资料进行分组、汇
16、总,使其条理化、系统化的工作过程,也包括对加工过的次级资料进行再整理。(二)意义 统计资料整理是统计调查的继续,也是统计分析的前提,在整个统计工作中具有承前启后的作用。(三)统计整理的步骤1.设计和制定统计整理方案2.对原始资料和二手资料进行审核;3.对经过审核的资料进行分组、汇总,计算出总体总量指标;4.将汇总计算的结果,以统计表或统计图的形式表现出来;5.对统计资料妥善保管,系统积累;数据的审核 原始资料二手资料完整性准确性逻辑检查计算检查适用性时效性二、统计分组(一)统计分组的含义 指根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同而又联系的几个部分。
17、 (二)统计分组的种类 1.按分组标志个数不同 (1)简单分组 把总体只按一个标志分组。 (2)复合分组 对同一总体选择两个或两个以上标志层叠起来 进行分组。例如:对全国的工业企业进行简单分组:按经济类型分:全民所有制企业、集体所有制企业、城 乡个体企业按轻重工业分:重工业、轻工业按企业规模大小分:大型企业、中型企业、小型企业全民所有制集体所有制重工业轻工业重工业轻工业大型企业中型企业小型企业复合分组2.按分组标志性质不同(1)按品质标志分组(2)按数量标志分组 A.单项式分组:一个变量值表示一个组的分组。适用于离散型变量且变量的取值不多(或变量值变动幅度比较小)。 例如,职工家庭人口数,其取
18、值不可能很多,且每一个取值都可视为一种类型: 职工家庭人口数 3人 4人 5人 6人 B.组距式分组 把整个变量值依次划分为几个区间,各个变量值按其大小确定所归并的区间,区间的距离称组距。 适用于连续型变量或虽为离散型变量但取值很多,不便一一列举的情况。连续型变量的组距式分组:相邻组的上限和下限必须是重叠的,因此上一组的上限同时也是下一组的下限。 例如:企业按工人工资对工人进行分组如下: 500600元 600-700元 700-800元如果某工人工资为700元,应将他归并到哪一组?“上组限不计入”原则:遇到某单位的标志值刚好等于相邻两组上下限时,一般把次值归并到作为下限的那一组。离散型变量的
19、组距式分组:各组的上下限都可以用确定的数值(整数)表示。因此上下限之间不必重合,只要相互衔接即可。如:5X10,11X16;17X22, 生产小组按人数分组(人) 510 511 1116 1117 1722 1723组距式分组中的有关问题 组限、上限、下限: 开口组和闭口组: 组距:组距=上限-下限 组距式分组有等距分组和异距(不等距)分组;组中值2上限下限组中值闭口组2邻组组距下限组中值缺上限组2邻组组距上限组中值缺下限组合理确定组中值:第一组:50人以下 第二组:50200人 (一)概念:在统计分组的基础上将总体的所有单位按组归类,并把所有的组及其单位数按一定顺序排列起来,用以反映总体单
20、位在各组的分布状况。又称分配数列。 分配数列包含的两要素:总体按某标志所分的组和各组所占有的单位数-次数或频率。(二)分配数列的种类: 1、品质分配数列:按品质标志分组所编成的分配数列。 2、变量分配数列:按数量标志分组所编成的分配数列。(又分单项式数列、组距式数列)三、频数分布(三)分配数列的编制例:对某企业30个工人完成劳动定额的情况进行调查,原始资料如下(%): 98 81 95 84 93 86 91 102 100 103 105 100 104 108 107 108 106 109 112 114 109 117 125 115 120 119 118 116 129 113要求
21、:编制分配数列。第一步:计算全距;全距=最大值-最小值=129-81=48第二步:确定组数和组距等距分组时:组距=全距/组数 组距=48=48/5=9.6105=9.610第三步:确定组限;注意:1、最小组的下限应低于最小变量值,最大组的上限应高于最大变量值;2、组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化;3、为方便计算,组限应尽可能取整数,最好是5或10的整倍数。4、连续型变量和离散型变量组限的确定;第四步:编制频数(频率)分布表 某企业30个工人劳动定额完成情况分布表劳动定额完成程(%)频数(人)频率(%) 80-90310.0 90-100413.3 100-11012
22、40.0 110-120826.7 120-130310.0 合计30100.0第五步:计算累计频数和累计频率; 向上累计频数(频率):由变量值小的向变量值大的组累计频数和频率;表示小于该组上限的各组的频数或频率之和; 向下累计频数(频率):由变量值大的向变量值小的组累计频数和频率;表示大于及等于该组下限的各组的频数或频率之和; 某企业工人完成劳动定额累计分布表劳动定额完成情况频数(人)频率(%)向上累计向下累计频数 (人)频率(%)频数(人)频率(%)80-90310.0310.030100.090-100413.3723.3279001963.32376.711
23、0-120826.72790.01136.7120-130310.030100.0310.0合计30100.0(四)频数分布的主要类型日产日产量量( (件件) )1、钟型分布日日产产量量( (件件)日日产产量量( (件件) )2、型分布3、J型分布(1) 价格价格 返回返回型分布()价格价格第三节 统计数据的显示一、统计表二、统计图(一)定类数据(二)定序数据(三)数值型数据返回(一)统计表的结构按三次产业分国内生产总值(亿元)比上年增长(%) 第一产业 14883 2.9 第二产业 52982 9.9 第三产业 34522 7.3 合 计 102398 8.0横标题纵标题数字资料主词宾词我国
24、2002年国内生产总值一、统计表(二)统计表的种类 1.按主词的结构分类 简单表 城 市 人口数(人)较1982年7月1日0时增长% 北京市 10819407 17.21 天津市 8785402 13.15 上海市 13341896 12.50A、我国三个城市的人口数(1990年7月1日0时)分组表(见表的结构) 复合表 某年末某地区人口资料 按城乡及性别分组 人口数(万人)增长率()(与上年比)城镇人口男性人口女性人口农村人口男性人口女性人口合计 返回2.按宾词的结构分类(见教材)(三)统计表的设计要求1、统计表的标题应简明扼要,能恰当反映表的内容;2、主次和宾词的排列要符合逻辑关系3、栏目
25、较多时,通常要加编号,主词用甲、乙、丙,宾词用1、2、3等编号;4、表的上下端用粗横线,其余用细线,左右两端不封口;5、表内数字填写整齐,位数对准,不能留有空白,缺资料,用表示;6、计量单位相同,可放在表右上角,若不同,应在每个指标后或单列一列;7、统计资料来源以及需附加的说明,可写在表下面,以便考查;二、统计图(一)定类数据 1、条形图(Bar)。 条形图可用于显示离散型变量的次数分布。最主要是显示定类数据和定序数据的频数分布。表表1 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数(人人)比例比例频率频率(%) 商品广告商品广告 服务广告服务广告
26、金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100人数(人)人数(人)5191610211204080120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告广广告告类类型型 图图1 1 某城市居民关注不同类型广告的人数分布某城市居民关注不同类型广告的人数分布2、圆形图(饼图 Pie )。用于显示定类变量的次数分布。饼图主要用于表示总体中各组成部分所占的比例。在绘制饼图时,总体中各部分所占的百分比用圆内的
27、各个扇形面积表示,这些扇形的中心角度,是按各部分比占360度的相同比例确的。 其他广告1.0% 房地产广告8.0% 商品广告56.0% 金融广告4.5% 服务广告25.5% 招生招聘广告5.8%图图2 2 某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成(二)定序数据【例2】表2 甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积 向下累积 户数(户)百分比(%)户数(户)百分比(%) 非常不满意 不满意 一般 满意 非常满意24241081089393454530308 83636313115151010242413213222522527
28、02703003008.08.044.044.075.075.090.090.0100.0100.030030027627616816875753030100.0100.09292565625251010合计合计300300100.0100.0表表3 3 乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数( (户户) )百分比百分比(%)(%)向上累积向上累积 向下累积向下累积 户数户数( (户户) )百分比百分比(%)(%)户数户数( (户户) )百分比百分比(%)(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非
29、常满意212199997878646438387.07.033.033.026.026.021.321.312.712.721211201201981982622623003007.07.040.040.066.066.087.387.3100.0100.03003002792791801801021023838100.0100.093.093.060.060.034.034.012.712.7合计合计300300100.0100.01.累计频数分布图243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向上累积向上累积276168
30、30300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向下累积向下累积2、环形图(1)环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示(2)环形图与圆形图类似,但又有区别:圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环(3)环形图可用于进行比较研究,用于展示定类和定序的数据8%36%31%15%7%33%26%21%13%10% 非常不满意 不满意 一般 满意 非常满意 图图4 4 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价(三)数值型数据 117 122
31、 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121【例例3.33.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用组距式对数据进行分组。1.分组数据(单项式分组)表表4 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表零件数零件数(个个)
32、频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112表5 某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105110110115115120120125125130130135135140358141064610162820128合计50100表表6 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组
33、按零件数分组频数(人)频数(人)频率(频率(%)105109110114115119120124125129130134135139358141064610162820128合计合计50100等距分组 各组频数的分布不受组距大小的影响 可直接根据绝对频数来观察频数分布的特征和规律不等距分组 各组频数的分布受组距大小不同的影响 各组绝对频数的多少不能反映频数分布的实际状况 需要用频数密度(频数密度频数/组距)反映频数分布的实际状况A.直方图我一眼就看出我一眼就看出来了,大多数来了,大多数人的日加工零人的日加工零件数在件数在120120125125之间之间! !折线图下的面积与直方图的面积相等!B
34、.折线图C.曲线图2、未分组数据:茎叶图(扩展的茎叶图)3、时间序列数据:线图表表9 19911998年城乡居民家庭人均收入年城乡居民家庭人均收入年份年份城镇居民城镇居民农村居民农村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6 784.0 921.61221.01577.71926.12091.12162.0020004000600019911992199319941995199619971998城镇居民农村居民收收入入 (元)(元) 图图14 14 城乡居民家庭人
35、均收入城乡居民家庭人均收入4、多变量数据的图示A、散点图(两种变量)B、气泡图(三个变量)C、雷达图(多个变量)【例例6 6】为研究某条河流的污染程度,环保局分别在上游、中游和下游设立取样点,每个取样点化验水中的五项污染指标,所得数据如表13。将各指标用雷达图表示出来,并分析该河流的主要污染源。表表10 不同样本点的化验指标不同样本点的化验指标指标指标1指标指标2指标指标3指标指标4指标指标5上游上游中游中游下游下游4.520.342.175.01.46.8483 36208196 4111214 6350.11101001000指标指标1指标指标2指标指标3指标指标4指标指标5上游中游下游图
36、图15 河流污染指标雷达图河流污染指标雷达图 练习:某百货公司连续40天的商品销售额 (单位:万元)如下:25 26 28 29 30 30 32 33 34 3435 35 36 36 36 36 37 37 37 37 37 38 38 38 39 40 41 42 42 43 43 44 44 44 45 45 46 46 47 49要求(1)根据上面的数据进行适当分组,编制频数分布表,并绘制直方图。(2)绘制茎叶图第三章总量指标和相对指标 通过本章的学习,要求学生在理解总量指标、相对指标的基础上,重点掌握各种指标的计算方法。 第一节总量指标 第二节相对指标返回返回第一节总量指标 一、总
37、量指标的概念及特点 (一)概念:指反映社会经济现象发展的总规模、总水 平的综合指标。 (二)特点: 1.是认识社会经济现象总体的起点; 2.是编制计划、实行经营管理的主要依据; 3.是计算相对指标、平均指标的基础;二、总量指标的计量单位1、实物单位自然单位度量衡单位2 2、货币单位3、劳动单位(工时、工日)三、总量指标的种类(一)按其所反映的内容不同、总体单位总量指标:指总体中所有单位的总数。、总体标志总量指标:指总体中各单位的某种数量标志值总和。(二)按其所反映的时间状况不同 、时期指标:反映现象在某一段时期内发展变化结果的总量。(1)具有可加性;(2)指标数值的大小与所属时期的长短直接相关
38、;(3)必须连续登记而得; 返回、时点指标:反映社会经济现象在某一时刻或某一时点上状况的总量。(1)不具有可加性;(2)数值大小与登记时间的间隔长短无关;(3)不必要经过连续登记而得;一、相对指标的概念 用两个有联系的指标进行对比的比值来反映社会经济现象数量特征和数量关系的综合指标。二、相对指标的表现形式(一)有名数(二)无名数1、系数和倍数2、成数3、百分数4、千分数 返回第二节相对指标三、相对指标的种类及计算 总体中某部分数值 (一)结构相对指标= 100% 总体全部数值一般用百分数表示。总体各组的结构相对指标数值之和等于100%。意义:1.分析总体内部构成状况,说明事物性质和特征;2.不
39、同时间的结构相对数进行对比分析,说明现象的变化过程和规律;3.说明各组在总体的地位和作用。 第六次人口普查结果 大陆地区人口中,0-14岁人口占16.60%;15-59岁人口占70.14%;60岁及以上人口为占13.26%,其中65岁及以上人口为占8.87%。 同2000年第五次全国人口普查相比,0-14岁人口的比重下降6.29个百分点,15-59岁人口的比重上升3.36个百分点,60岁及以上人口的比重上升2.93个百分点,65岁及以上人口的比重上升1.91个百分点。 (二)比例相对指标值总体内另一部分指标数总体内某部分指标数值比例相对指标可用一比几或几比几形式表示,也可用百分数表示。例 人口
40、性别比指标: 人口出生性别比正常值一般在103到107之间。但我国人口的出生性别比,自20世纪80年代中期以来却迅速攀升。 1995年,0岁4岁人口性别比:118.38 2000年,0岁4岁人口性别比:120.17 2003年,0岁4岁人口性别比:121.22 2005年,0岁4岁人口性别比:122.66 2010年,0岁4岁人口性别比:118.06(三)比较相对指标值乙地(或单位)某指标值甲地(或单位)某指标比较相对指标 可用倍数、系数表示。分子分母可以交换。例甲、乙两公司2000年商品销售额分别为: 5.4亿元和3.6亿元则甲公司商品销售额为乙公司的1.5倍注:用总量指标进行计算对比,往往
41、受到总体规模和条件的影响,结果不能准确反映现象的本质差异。 一般采用相对指标或平均指标计算。上例中,如用各公司人均年销售额进行对比:甲公司:216万元/人,乙公司: 232万元/人则比较相对指标216/23.2=0.93=93%甲公司人均年销售额为乙公司的93%。 说明虽然甲公司总销售额比乙公司多,但劳动效率却低于乙公司。(四)动态相对指标100%基期水平报告期水平动态相对指标基期是作为比较标准的基础时期。报告期是用来与基期对比的时期,也称比较期或计算期。此指标也称发展速度。增长速度=发展速度-1。 甲公司2011年的产值是2400万元,2010年的产值是2000万元,则该公司的产值发展速度为
42、120%,即产值增长了20%(增长速度)(五)强度相对指标的指标数值另一有联系但性质不同某一指标数值强度相对指标 单位一般以单位一般以名数和复名数表示,如商品流转次数用“次”表示,地区一定时期人均粮食产量为“公斤/人”. 也可采用百分数、千分数等表示,如资金利税率、人口死亡率。 有些强度相对指标的分子和分母可以互换,形成正指标和逆指标两种计算方法。 例:反映卫生事业对居民服务保证程度的指标: 正指标的数值大小与现象的发展程度或密度成正比,一般指标数值越大越好。 将分子分母互换: 逆指标的数值大小与现象的发展程度或密度成反比 一般指标数值越小越好。人口数(千人)医院床位数(张)每千人口医院床位数
43、 医院床位数(张)人口数(人)数每张医院床位负担人口(六)计划完成相对指标1、基本公式 2、短期计划的检查(1)计划任务数为总量指标 例1:某企业计划规定本年度销售收入达到1000万元,实际为950万元,计划完成相对指标为 %100计划完成指标实际完成指标计划完成相对指标%951000950 (2)计划任务数为平均数 例2:某企业计划某种产品单位成本为50元,实际为45元,计划完成相对指标为 %905045 (3)计划数为相对数 计划完成计划完成%=(1+实际提高率)实际提高率)/(1+计划提高率)计划提高率) 计划完成计划完成%= (1-实际减低率)实际减低率)/(1-计划降低率)计划降低率
44、) 某企业计划劳动生产率今年比去年提高10%,实际提高了15%。计划完成相对指标为 (正指标) 某企业计划某种产品成本今年比去年降低5%,实际降低了6%。计划完成相对指标为 (逆指标)%5 .104%110%115 %95.98%95%94 第四章数据分布特征的测度 通过本章的学习,要求学生在理解平均指标、变异指标概念的基础上,重点掌握各种指标的计算方法。 第一节集中趋势的测度 第二节数据离散趋势的测度 第三节数据偏态与峰度的测度返回第一节 数据集中趋势的测度 平均指标(平均数)是反映现象的一般水平或平均水平的指标。它具有代表性和抽象性。 一、数值平均数 (一)算术平均数 (二)调和平均数 (
45、三)几何平均数 二、位置平均数 (一)众数 (二)中位数 (三)四分位数 返回一、数值平均数 (一)算术平均数1、简单算术平均数计算公式: 应用条件:资料未分组 举例:5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:nxnxxxxxn321 分分平均成绩平均成绩73536558253649075 2、加权算术平均数 计算公式: 应用条件:分组数据 fxfffxfxfxfxxnn332211 ffxffxffxffxffxxnn332211例1:某车间工人人数和日产量情况表:按日产量分组x x工人人数f f日总产量xfxf工人比重(工人比重(% %)x x301301033
46、2264206.434268206.83631083010.838138103.840140104合计1034810034.8 ff平均日产量=348/10=34.8(件)或平均日产量=3+6.4+6.8+10.8+3.8+4=34.8(件) ff例2:某车间职工工资分组情况: 按月工资分组(元)工人数f组中值x工资总额(元)xf工人比重(%)Xf/f200以下 5150 75012.518.75200 300 6250 150015.037.5300 400 20350 700050.0175.0400 5004450 180010.045.0500以上5550 275012.568.75合
47、 计40 13800100.0345职工平均工资=13800/40=345(元)或职工平均工18.75+37.5+175+45+68.75=345(元) ff3、算术平均数的数学性质 (1)各个变量值与其平均数离差之和等于零 (2)各个变量值与其平均数离差平方之和为最小值 (3)给每个变量值增加或减少一个任意数A,则算术平均数也相应增增加或减少这个任意数A。 (4)给每个变量值乘以或除以一个任意数A,则算术平均数也相应扩大或缩小A倍。4、算术平均数的应用(1)如何选择加权算术平均数的权数; A.根据被平均的对象在总体中的重要程度设定权数; B.以次数分布数列中各组变量值出现的次数或频率为权数;
48、 C.根据事物之间的相互关系确定权数;(2)切尾平均数:当总体内存在过大或过小的极端数值,为正确反映总体水平,应将其剔除,然后将其余数值加以平均,称为切尾平均数。文艺、体育比赛中应用较多。(二)调和平均数(H)1、简单调和平均数计算公式:应用条件:资料未分组例:一个人步行两里,走第一里时速度为每小时候10里,走第二里时为每小时20里,则平均速度为: xxxxxnnHn11111321)(31132201101小时小时里里 2、加权调和平均数 计算公式: 应用条件:资料经过分组 例1: xmnnxmnmxmxmxmmmmmH332232111速度 (里/小时) x行走里程 m所需时间 20 1
49、15 2 10 3 合计 6xm201152103103152201 )(2912126103152201小时小时里里平均速度平均速度 例2:某局所属的三个企业的资料:平均产值计划完成程度= 实际产值/计划产值 = m / m/x=37320/36000=103.7% 企业产值计划完成(% ) x实际产值(万元)m计划产值(万元) 甲 100.0 12000 12000 乙 98.0 8820 9000 丙 110.0 16500 15000 合 计 37320 36000 xm(三)几何平均数(G) 1、简单几何平均数 计算公式: 应用条件:资料未分组例:某企业生产某种产品需经三个连续作业车
50、间才能完成nnn321xxxxxG 车间投入量产出量合格率% x 一 1000 800 80 二 800 720 90 三 720 504 7033%450%70%90%80 三个车间平均合格率三个车间平均合格率 =79.58%=79.58%2、加权几何平均数 计算公式: 应用条件:资料经过分组 例:将一笔钱存入银行,存期10年,以复利计息,利率分别是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率。 n21n21ffffnf2f1xxxG年限年利率(%)本利率x年数f15 105% 28 108% 310 110% 31012 112%
51、 2合计 10%77108%112%110%108%105102332平均本利率平均年利率=8.77%二、位置平均数(一)众数(m0)1、概念:总体中出现次数最多的标志值是众数。2、众数的计算(1)未分组资料:哪个变量值出现的次数最多,那个变量值就是众数。 例:7名工人日产量(件)为4、5、6、6、6、7、8。则众数是6。(2)单项式数列按日产量分组(件)工人数(人)2015213022202310)(21mo件件 (3)组距数列确定众数首先将出现次数最多的组确定为众数所在组,再利用插补法求其众数近似值。dLM211odUM212o:表示众数所在组的下限;:表示众数所在组的上限;1: 表示众数
52、所在组次数与前一组次数之差;2: 表示众数所在组次数与后一组次数之差;d: 表示众数所在组的组距。例:已知资料如下,要求确定众数年人均纯收入(千元)农户数(户)5以下2405648067110078700893209以上160合计3000(1)确定众数组(67)(2)计算众数)(6161)7001100()4801100(480110060千元千元 m(二)中位数( me ) 1、含义:把某一标志值按大小顺序排列起来居于 中间位置的那个数就是中位数。 2、计算 (1)由未分组资料确定中位数 首先将标志值按大小顺序排列, Me= 当n为奇数 ; 123nxxxx 12nxMe= ,当n为偶数 1
53、222nnxx(2)单项式变量数列 Me=12fx,当 为奇数 1222ffxx,当 为偶数 ff例:资料如下,要求确定中位数 中位数为第40 名和41名日产量的平均值: (24+24)/2=24(件) 按日产量分组(件)x工人数(人)f累计201010221525243055262580合计80(3)组距数列确定中位数 首先从变量数列的累计频数栏中找出第 /2个单位所在组,即“中位数”组,该组的上下限就规定了中位数的可能取值范围。 假定在中位数组内的各单位是均匀分布的,则 fdfS2fLMm1medfS2fUMm1meL: 表示中位数组的下限;U: 表示中位数组的上限;fm:表示中位数组的次
54、数;Sm-1表示中位数所在组以前各组的 累计次数;Sm+1表示中位数所在组以后各组的 累计次数;d: 表示中位数所在组的组距。例:资料如下,要求确定中位数。年人均纯收入(千元)农户数(户)向上累计次数向下累计次数5以下24024030005648072027606711001820228078700252011808932028404809以上1603000160合计3000(1)计算累计次数(2)确定中位数组(67)(3)确定中位数数值1500230002 f)(71611100720230006千元千元 em(三)四分位数1、含义: 一组数据排序后处于25%和75%位置上的值,称为四分位数
55、。处于25%处的数值称为下四分位数,处于75%处的数值称为上四分位数。2、计算:(1)未分组数据 设下四分位数为QL,上四分位数为,对于未分组的原始数据,各四分位数的位置分别为: 当四分位数的位置不在某一个位置上时,可根据四分位数的位置,按比例分摊四分位数两侧的差值。un+13(n+1)Q44LQ位置位置例:在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据如下(单位:元),1500、750、780、1080、850、960、2000、1250、1630,计算人均月收入的四分位数。解: QL(780850)2815(元) QU(15001630)2156(元) QL和QU之间包含了5
56、0%的数据,因此,我们可以说有一半的家庭人均月收入在8151565元之间。 Ln+19+1Q=2.544的位置U3(n+1)3 (9+1)Q=7.544的位置(2)单项式分组数据(3)组距式分组数据4fLXQ4f3UXQUU1 -UUULL1 -LLLdfS-4f3LQdfS-4fLQ三、平均数之间的关系(一)各种平均数的特点及应用场合 是就全部数据计算的,具有优良的数学性质,实际中应用最为广泛。其主要缺点是易受极端值的影响,对偏态分布其代表性较差。 H主要用于不能直接计算 的数据,易受极端值的影响。 G主要用于计算比率数据的平均数,易受极端值的影响。 不受极端值大小的影响,对偏态分布其代表性
57、较 好。但不是根据所有的变量值计算的. 不受极端值的影响,对偏态分布其代表性较 好.但不是根据所有的变量值计算的. xxemx0m 1、当一组数据中所有数据不尽相同时,据此计算的三种平均数的结果为:算术平均数最大,调和平均数最小,几何平均数居中。它们的关系用公式表示即为: G H,极端值对其影响大小也是如此。2、当一组数据中所有的数据都相同时,据此计算的三种平均数相等。x(二)算术平均数与众数、中位数的关系xem0mxem0m0emmx 对称分布对称分布左偏分布左偏分布右偏分布右偏分布 算术平均数与众数、中位数当频数分布的偏斜程度不是很大时,无论左偏还是右偏,众数与中位数的距离约为算术平均数与
58、中位数距离的两倍。即(Me-M0)=2( -Me)可以得出:x3()32oeeMXXMMX 例:根据某城市住户家庭月收入的抽样调查资料算得众数为2043元,中位数为2271元,问算术平均数为多少?其分布呈何形态? 由已知资料,推算样本的算术平均数为:33 22712043238522eoMMx因为 2385 2271 2043所以,该城市住户家庭月收入分布呈右偏态分布。第二节 数据离散趋势的测度 变异指标是反映总体各标志值间差异程度的,且能衡量总体平均数的代表性。一、定类数据离散程度的测度-异众比率二、定序数据离散程度的测度-四分位差三、数值型数据离散程度的测度(一)全距(二)平均差(三)方差
59、和标准差(四)标准分数 (五)标准差系数 返回 一、定类数据离散趋势的测度-异众比率 (一)定义: 非众数组的频数占总频数的比率,称为异众比率。 (二)作用: 异众比率的作用是衡量众数对一组数据的代表性程度的指标。异众比率越大,说明非众数组的频数占总频数的比重就越大,众数的代表性就越差;反之,异众比率越小,众数的代表性就越好1immriifffVff if为变量值的总频数; mf为众数组的频数; 二、定序数据离散趋势的测度四分位差(一)定义: 上四分位数与下四分位数之差,称为四分位差,亦称为内距或四分间距,用Qd d表示。Qd d=Qu u-QL L(二)作用: 四分位差反映了中间50%数据的
60、离散程度,其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。 三、数值型数据离散趋势的测度绝对数形式的变异指标(一)全距(R) 公式: R =最大值最小值 优点:计算简便 缺点:易受极端值的影响 举例:5名学生的成绩为50、69、76、88、97 则 R=97-50=47(二)平均差(MD) 1、简单平均差(资料未分组) 公式:MD=例:某厂甲、乙两组工人生产某种产品的产量资料如表:平均差计算表1niixxn1375755niixxn甲1niixxnMD甲=6/5=1.2(件)1375755niixxn乙MD乙=1niixxn=80/5=16(件)从计算结果看,甲、乙两组平均生
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中考英语一轮教材复习 八年级(上) Unit 2-1
- 校准化学校体育馆建设项目可行性研究报告
- 《企业会计准则讲座》课件
- 屋面工程施工工艺标准
- 《楞次定律及应用》课件
- 工业园区房产买卖合同模板
- 生态系统的物质循环课件
- 体育公园绿化养护承包合同
- 豪华住宅二手房买卖合同范文
- 药品仓库叉车租赁协议
- GB/T 22082-2024预制混凝土衬砌管片
- 充电电缆产品入市调查研究报告
- 5.5 跨学科实践:制作望远镜教学设计八年级物理上册(人教版2024)
- 2024年时事政治题库附参考答案(综合题)
- 隧道及地下工程基础知识单选题100道及答案解析
- 飞行区维护与保障学习通超星期末考试答案章节答案2024年
- 2024年法律职业资格考试(试卷一)客观题试卷及解答参考
- 2024-2025学年北师大版七年级上册数学期末专项复习:期末压轴题分类(原卷版)
- 低温仓储人员安全行为培训考核试卷
- 广东省佛山市南海区2023-2024学年九年级上学期1月期末物理试题
- 司法考试2024年知识点背诵版-民法
评论
0/150
提交评论