应用统计学教案第3章-数据分布特征描述_第1页
应用统计学教案第3章-数据分布特征描述_第2页
应用统计学教案第3章-数据分布特征描述_第3页
应用统计学教案第3章-数据分布特征描述_第4页
应用统计学教案第3章-数据分布特征描述_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《应用统计学》教案张敏主编PAGEPAGE7第3章数据分布特征描述教学内容3.1总量指标3.2相对指标3.3平均指标3.4变异指标3.5Excel在描述统计中的应用教学要求1.理解总量指标的概念、作用及种类;2.掌握六种相对指标的概念和计算;3.掌握数值平均数和位置平均数的计算方法;4.了解平均差的含义,掌握标准差、方差的计算和运用;5.掌握标志变异系数的计算方法;6.能用以上指标对社会经济现象进行简单分析。教学重点总量指标的概念及种类;相对指标的概念和计算;数值平均数和位置平均数的计算方法;平均差的含义、标准差和方差的计算;标志变异系数的计算教学难点六种相对指标的区别;数值平均数和位置平均数的计算教学方法课堂讲授、课堂讨论、案例分析、课堂练习、上机操作课时数8课时(讲授6课时+课堂练习1课时+上机操作1课时)导入案例平均工资的计算3.1总量指标3.1.1总量指标的概念和作用1.概念总量指标是指反映社会经济现象在一定时间、地点、条件下发展的总规模、总水平的综合指标,又称统计绝对数指标。2.作用第一,总量指标是反映一个国家、地区或一个企业的人力、物力、财力状况和加强宏观经济管理与企业经济核算的基本指标。第二,总量指标是计算相对指标和平均指标的基础指标。3.1.2总量指标的种类1.总体总量和标志总量总量指标按其说明内容的不同,可分为总体总量和标志总量。总体总量是总体内所有单位的总数,它反映总体本身规模的大小。标志总量是总体内各单位某标志值的总和,它反映总体所研究的某一标志规模的大小。2.时期指标和时点指标时期指标和时点指标的不同点如下。(1)时期指标在数量特征上表现为可以将各时期值累计相加,反映的是在这一时间段内社会经济现象发展的规模和水平;而时点指标在数值上相加没有多大的经济意义,仅表现为在某一时刻该社会经济现象所达到的规模和水平。(2)时期指标的数值可以连续统计,如生产部门一月生产的产品为该部门每天生产产品的总和;而时点指标则采用不连续的、间断的登记方法取得,如月末的物资库存数为上月库存数经过一月该物资进出后所达到的实际数。(3)时期指标数值的大小与社会经济现象总体活动时间长短有直接关系,时间越长,其值越大;而时点指标数值的大小与社会经济现象总体活动时间长短无直接关系,如年末的库存数不一定大于月末库存数。3.实物指标、价值指标和劳动量指标总量指标按其计量单位不同,可分为实物指标、价值指标和劳动量指标。3.1.3计算和运用总量指标的原则(1)(2)计算实物总量指标时只有同类的才能相加。(3)使用统一计量单位。(4)总量指标和相对指标、平均指标要结合运用。3.2相对指标3.2.1相对指标的概念和表现形式1.相对指标的概念相对指标是指所研究的社会经济现象中用两个相互联系的总量指标进行对比来反映事物之间数量联系程度的一种统计指标。2.相对指标的表现形式相对指标的表现形式有两种:有名数和无名数。3.2.2相对指标的种类及计算方法根据所研究的指标的性质和目的不同,可以将相对指标分为结构相对数、比例相对数、比较相对数、强度相对数、计划完成相对数和动态相对数等六种。1.结构相对数其计算公式为 (3.1)通过结构相对数,既可以反映总体内部各部分所处的地位及其所起的作用,也可以进一步分析研究现象的发展变化趋势。例3.1某班共有60名学生,其中女生28名,男生32名,求女生和男生在班级人数中所占的比重。解:根据式(3.1)可得女生所占的比重男生所占的比重2.比例相对数其计算公式为 (3.2)例3.2某地区2020年工业总产值为2100.9亿元,其中轻工业产值为1208.2亿元,重工业产值为892.7亿元。求轻工业和重工业产值的比例关系。解:根据式(3.2)可得轻重工业产值的比值=比例相对数也可以反映总体内部的结构状况,总体内部结构合理,则各部分的比例关系协调,就有利于事物的发展。它同结构相对数的差异只是对比方式不同,侧重点不同而已。3.比较相对数其计算公式为 (3.3)例3.32020年江苏地区的税收收入为14064.52亿元,上海地区的税收收入为13052.72亿元,求江苏、上海两地税收收入的比较相对数。解:根据式(3.3)可得两地税收收入比较相对数=计算结果表明,江苏地区的税收收入是上海地区税收收入的1.08倍。计算比较相对数时,分子、分母指标的含义、口径、计算范围和计算单位必须一致。4.强度相对数强度相对数是两个性质不同但有一定联系的总量指标之间的对比,用来表明某一现象在另一现象中发展的强度、密度和普及程度。其计算公式为 (3.4)例3.4某城市人口700万人,有大学65所,求大学密度的正指标和逆指标。解:根据式(3.4)可得大学密度正指标(所/万人)大学密度逆指标(万人/所)正指标的数值越大,表示大学密度越大;逆指标的数值越大,表示大学密度越小。前者从正方向说明现象的密度,后者从反方向说明现象的密度。在实际工作中,一般选择其中一个指标进行计算。5.计划完成相对数其基本计算公式为 (3.5)(1)任务数以绝对数或平均数形式表现。计划指标与实际指标都用总量指标或平均指标表示,其计算公式同计划完成程度指标基本公式(3.5)。例3.5某公司某年计划产品销售额为600万元,该年实际完成650万元,求产品销售额完成相对数。解:根据式(3.5)可得销售额计划完成相对数超额的绝对值=650-600=50(万元)(2)计划完成相对数的派生公式。根据指标性质的不同,派生公式有不同的表达形式。①对于产量、产值增长百分数,计算公式可写成计划完成相对数 (3.6)②对于产品成本降低百分数,计算公式可写成计划完成相对数 (3.7)例3.6某企业计划劳动生产率2020年比2019提高8%,实际提高10%,又企业2019年某种产品单位成本为800元,2020计划规定比2019年下降8%,实际下降6%。试计算该企业2020年与2019年相比劳动生产率计划和成本计划完成情况。解:根据公式(3.6)及公式(3.7)可计算得到劳动生产率提高的计划完成相对数成本降低的计划完成相对数计算结果表明企业2020年实际劳动生产率为计划的101.85%,即超过预期目标,超过了1.85个百分点。2020年实际成本为计划的102.17%,即成本控制并没有达到预期的目标,尚欠2.17个百分点。6.动态相对数动态相对数,是指某一社会经济现象在不同时期两个数值对比的比率。它反映该现象在时间上的发展变化方向和程度,也称为发展速度和指数。其计算公式为动态相对数 (3.8)例3.7某地区2020年工业增加值为120亿元,2019年工业增加值为109亿元,求2020年该地区工业增加值的发展速度。解:根据式(3.8)可得动态相对数计算结果表明,该地区工业增加值增长较快。3.3平均指标3.3.1平均指标的概述1.平均指标的概念平均指标又称统计平均数,简称平均数,是用以反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平的综合指标。2.平均指标的特点根据平均指标的概念,可以看出它具有如下三个特点。(1)同质性(2)代表性(3)抽象性3.平均指标的作用(1)可以反映总体各单位变量分布的集中趋势,用来作为评判事物的标准和依据。(2)可以用来比较同类现象在不同单位的发展水平,以说明生产水平、经济效益或工作质量的差距。(3)用来比较同一单位的同类指标在不同时期的发展状况。(4)可用来分析现象之间的依存关系。4.平均指标的种类可以从不同角度对平均数进行分类。(1)从时间上分静态平均数和动态平均数。(2)从范围上分总平均数和组平均数,在抽样统计中区分全及平均数和样本平均数。(3)从计算方法上分算术平均数、调和平均数、几何平均数、众数和中位数。3.3.2数值平均数1.算术平均数算术平均数(arithmeticmean)是将一组数据的总和除以这组数据的项数所得的结果。它是最常用的数值平均数。(1)简单算术平均数根据未分组的数据计算算术平均数时,其计算公式为 (3.9)式中,为n项数据平均数;xi为第i个单位的标志值(i=1,2,…,n);n为总体单位数;为各单位标志值的总和。例3.8某生产班组5名工人月生产零件数量分别为700、750、800、680、820件,求工人月生产零件的平均水平。解:根据式(3.9)得通过计算可知,工人平均的月产量为750件。(2)加权算术平均数计算公式为 (3.10)式中,xi为数列中第i组的标志值或各组的组中值(对组距式分组数列而言);fi为数列组第i组的频数;为各组的频率;n为分组后的组数。例3.9表3.1车间工人的日产量日产量x(件)工人数f(人)日总产量xf2210220211123126246242711297294116合计601488解:根据式(3.10)可得当收集整理的资料为组距式数列时,则用各组的组中值代表各组标志值来计算加权算术平均数。例3.10经调查某企业100名工人的月工资如表3.2所示,求其平均工资。表3.2某企业100名工人的工资情况月工资(元)人数f(人)组中值x(元)工资总额xf1000~1200101100110001200~1400251300325001400~1600351500525001600~1800201700340001800~200010190019000合计100—149000解:100名工人的月平均工资为例3.11某集团所属10家企业产值计划完成情况的组距变量数列如表3.3所示,求该集团10家企业产值计划平均完成程度。表3.3集团内10家企业产值计划完成情况计划完成程度(%)企业数计划任务数f

(万元)组中值x(%)实际完成数(万元)90~10031009595100~1105800105840110以上2100115115合计101000—1050解:该集团产值计划平均完成程度为例3.12表3.4某厂服装产量情况熟练程度人均产量x(件/人)工人数f

(人)总产量(件)非熟练工300350105000熟练工5401150621000合计—1500726000解:该服装厂的总人均产量为2.调和平均数调和平均数(harmonicmean)也称“倒数平均数”。变量的调和平均数是该变量的各个变量值的倒数()的算术平均数的倒数。在统计工作中往往将调和平均数的计算形式作为算术平均数的变形来使用。其计算公式为 (3.11)式中,式(3.11)称为加权调和平均数公式。特殊地,当mi()全部相等时,加权调和平均数简化为简单调和平均数。一定条件下,加权算术平均数和加权调和平均数存在如下关系: (3.12)例3.13表3.5由表3.4变化而来,根据表3.5求该厂上月人均服装产量。表3.5某厂服装产量情况熟练程度人均产量x(件/人)总产量m(件)工人数(人)非熟练工300105000350熟练工5406210001150合计-7260001500解:该服装厂的总人均产量为例3.14某企业生产甲、乙、丙三种产品的单位成本及总成本的资料如表3.6所示。试求该企业三种产品的平均单位成本为多少?表3.6某企业三种产品的成本分析资料产品名称单位成本x(元/千克)总成本m(元)产品产量(千克)甲10100001000乙20800004000丙25750003000合计—1650008000解:由于单位成本计算方法为单位成本所以要求该企业三种产品的平均单位成本应该采用调和平均数,即三种产品的平均单位成本为3.几何平均数几何平均数(geometricmean)是个变量值连乘积的次方根,它反映现象增长率的平均水平。几何平均数同样有简单几何平均数和加权几何平均数两种形式。几何平均数用于计算平均发展速度、平均合格率、平均本利率等相对数的平均数,这些相对数的连乘积具有实际意义,即是总发展速度、总合格率、总本利率。简单几何平均数适合于未分组数列,其计算公式为 (3.13)式中,xi表示第个单位标志值;n表示变量值项数;表示连乘符号。加权几何平均数适合于分组数列,其计算公式为 (3.14)式中,fi表示第i个单位标志值对应的权数;其他符号意义同公式(3.13)。例3.15某企业产品的加工要依次经过前后衔接的五道工序。本月该企业各加工工序的合格率分别为88%、85%、90%、92%、96%,求这五道工序的平均合格率。解:本例中,后一道工序的合格率是在前一道工序合格品的基础上计算的,因此各工序的合格率具有环比的性质,企业产品的总合格率等于各工序合格率之连乘积。所以,求五道工序的平均合格率应该采用几何平均数的计算公式,即所求的平均合格率应为4.算术平均数、调和平均数和几何平均数的关系从数量关系的角度考虑,如果用同一资料(变量各值不相等)计算以上三种平均数,其结果是算术平均数大于几何平均数,而几何平均数又大于调和平均数。当所有的变量值都相等时,这三种平均数则相等。它们的关系可用不等式表示:≤≤。3.3.3位置平均数1.众数众数(mode)是一种根据位置确定的平均数,它是指在总体单位中,标志值出现次数最多的那个数值,用符号表示。不同类型的数列,众数有不同的确定方法。(1)单项式数列众数的确定这种情况众数的确定比较简单,通过比较数列中标志值出现次数最多的值就是众数。例如,由表3.7可以看出,在某班大学生年龄中,22岁的人数最多,为24人,故22为众数。表3.7某班大学生年龄分布状况年龄(岁)人数(人)2042162224235合计39=SUM(ABOVE)(2)组距式数列众数的计算其下限公式为 (3.15)其上限公式为 (3.16)式中,L为众数所在组(即次数最多的那组)的下限;U为众数所在组(即次数最多的那组)的上限;是众数组次数与其前一组(指与众数组相邻的变量值较小的组)次数之差;是众数组次数与其后一组(指与众数组相邻的变量值较大的组)次数之差;d为众数组的组距。例3.17经调查某地区100名居民的月工资如表3.8所示,求众数。表3.8某地区100名居民的工资情况月工资(元)人数f(人)1200~1400101400~1600251600~1800351800~2000202000~220010合计100解:根据表3.8可知,众数组是“1600~1800”这一组,所以或可以发现,采用上限公式和下限公式计算得到的结果是一致的。(3)众数的特点众数具有如下特点。=1\*GB3①众数所代表的经济现象一般水平不受极端值的影响。这样当标志值存在异常情况时,众数的代表性得到增强。=2\*GB3②众数存在明显的集中趋势。因此当总体单位标志值表现出平均分布的特征时,众数就失去了意义。2.中位数中位数(median)是指将数据由小到大排列后位置居中的数值,用符号Me表示。中位数的确定仅取决于它在分布数列中的位置,因此不受极大值或极小值的影响。像众数一样,中位数也是一种位置平均数。分组数列的中位数对分组数列,中位数的确定步骤分为两步。=1\*GB3①确定中位数所在组。其方法为:首先确定变量数列中点位置;然后计算累计频数,当其值达到或超过时,该组即为中位数所在组。=2\*GB3②寻求该组组距中的某一具体值为中位数。其计算公式为 (3.17)或采用公式: (3.18)式中,为所求中位数;L为中位数组的下限(累积频数达到/2的组即为中位数所在组);U为中位数组的上限;d为中位数组组距;为中位数所在组的频数;为数列频数的总和;为向上累计至中位数所在组前一组(即变量值小于中位数组下限的各组频数的累计数)止的频数;为向下累计至中位数所在组后一组(即变量值大于中位数组上限的各组频数的累计数)止的频数。例3.19经调查某地区100名居民的月工资如表3.9所示,求中位数。表3.9某地区100名居民的工资情况月工资(元)人数f(人)向上累计频数向下累计频数1200~140010101001400~16002535901600~18003570651800~20002090302000~22001010010合计100——解: 根据表3.9中计算得到的累计频数可知,中位数所在组是“1600~1800”这一组,所以或由以上计算结果可知,两者得到的结果一致。3.4标志变异指标3.4.1标志变异指标概念和作用测定离散程度的指标称为标志变异指标。标志变异指标的作用主要体现在以下两个方面。1.可以说明平均数的代表程度平均数是数据分布中心和一般水平的代表值,其代表性强弱取决于变量的变异程度大小。数据分布越分散、离散程度越大,平均数的代表性就越小;反之,数据分布越集中,离散程度越小,平均数的代表性就越大。2.可以测定现象变动的均衡性和稳定性数据之间差异越大,说明变量的稳定性或均衡性越差;反之,数据之间的差异越小,说明变量的稳定性或均衡性越高。3.4.2标志变异指标的测定根据不同的度量方法,可以将标志变异指标分为全距、平均差、标准差及变异系数。1.全距全距(range)是指一组数据中最大值()与最小值()之差,以此来衡量数据变动的总体范围,一般用R表示全距。全距也称为极差。一般说来,全距越小,表明标志值变动越集中;全距越大,表明标志值变动越分散。全距的计算公式如下。对于未分组数列: (3.19)对于组距式数列:R=最高组的上限-最低组的下限 (3.20)例3.20解: =90-42=48(件)由全距的计算公式可以看到,全距受总体中两端极值的影响,与其他值无关,因此不能全面反映标志值的差异程度。尤其在存在极小值和极大值的情况,分析误差较大。因此在实际中全距的应用并不多。2.平均差平均差(averagedeviation)是各个数据与其均值的离差绝对值的算术平均数,反映各个数据与其均值的平均差距,通常用A.D表示。平均差也有两种形式:简单平均差和加权平均差。简单平均差适合于未分组数列,其计算公式为 (3.21)例3.21已知A、B两组学生的成绩如表3.10所示,试分别计算其平均差。表3.10学生成绩资料表A组B组|-||-|70964157817458238018679819合计20—40解:A、B两组学生的算术平均数采用简单算术平均数公式,计算可得=79分,=79分,则由以上计算可知,虽然A、B两组学生的平均成绩相同,但B组计算得到的平均差大,则表明其平均成绩的代表性要较A组差。加权平均差适合于分组数列,其计算公式为 (3.22)例3.22某车间100名工人的日产量资料如表3.11所示,试计算其平均差。表3.11工人日产量资料表日产量(件)工人数(人)f组中值x离差绝对值|-||-|f10以下8521.6172.810~20161511.6185.620~3040251.66430~4024358.4201.640以上124518.4220.8合计100——844.8解:根据资料,这100名工人日产量的算术平均数为则100名工人日产量的平均差为由以上计算可知,总的平均日产量与各组平均日产量之间的平均离差为8.448件。3.标准差标准差(standarddeviation)是指总体各单位标志值与其算术平均数离差平方的算术平均数的平方根,又称均方差。一般用符号表示,其平方称为方差(variance)。总体方差通常用表示。标准差是最重要的变异指标,在统计推断、统计预测、回归分析等许多统计分析中得到广泛应用。根据掌握的资料不同,标准差也有两种形式:简单标准差和加权标准差。简单标准差适合于未分组数列,其计算公式为 (3.23)加权标准差适合于分组数列,其计算公式为 (3.24)对于未分组数列,方差的计算公式为 (3.25)对于分组数列,方差的计算公式为 (3.26)例3.23某组四名学生成绩如表3.12所示,试计算其标准差。表3.12某组四名学生成绩资料学生编号成绩x离差离差平方170-981278-1138239486749合计——140解:根据表3.12所示的资料,应采用简单标准差公式来计算。4名学生成绩的算术平均数为(分)由式(3.23)有例3.24某工厂生产的蓄电池使用寿命如表3.13所示,试计算其标准差。表3.13蓄电池使用寿命资料使用寿命(小时)数量f(个)组中值x离差加权离差平方1000以下2900-6428243281000~120081100-44215629121200~1400161300-2429370241400~1600351500-42617401600~18002317001585741721800~200012190035815379682000以上421005581245456合计100——6743600解:蓄电池的平均使用寿命由加权算术平均数计算得到,其值为由公式(3.24)有在平均水平相等的情况下,通过计算标准差,可以用来比较两个同类社会经济现象平均数的代表性:标准差越大,表明标志变动程度越大,平均数的代表性越弱;标准差越小,表明标志变动程度越小,平均数的代表性越强。4.标志变异系数变异系数是以相对数形式表示的变异指标,一般用V表示。变异指标也称为离散系数,它是通过变异指标中的全距、平均差或标准差与平均数对比得到的。常用的是标准差系数。标准差系数的计算公式为 (3.27)例3.25甲品牌的灯泡平均寿命是1200小时,标准差为258小时;乙品牌的灯泡平均寿命是1150小时,标准差为206小时。试比较这两种品牌灯泡使用寿命的离散程度。可见,甲品牌灯泡使用寿命的标准差系数较大,说明其离散程度较大。3.5Excel在描述统计指标中的应用3.5.1描述统计分析工具数据分析工具库中含有多个分析工具,其中描述统计工具用来生成描述所给数据的标准统计量,包括平均值、标准误差、中位数、众数、标准差、方差、峰度、偏度、最小值、最大值、总和、观测数和置信度等。描述统计分析工具相对于输入公式或通过“插入函数”命令对数据进行描述统计分析,更加简单且容易操作。具体来说,只需要执行“数据分析”命令,然后在分析工具库中选择“描述统计”工具即可。3.5.2实例应用1.实例的数据描述例3.262020年我国31个地区人口数资料如表3.14所示。试用“描述统计”分析工具对其进行分析。表3.142020年全国各地区人口统计(单位:万人)地区总人口地区总人口地区总人口北京2189山东10153安徽6103天津1387河南9936福建4154河北7461湖北5775青海592

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论