统计学基础第五章_第1页
统计学基础第五章_第2页
统计学基础第五章_第3页
统计学基础第五章_第4页
统计学基础第五章_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章平均指标和标志变异指标

平均指标5.1标志变异指标5.25.1平均指标5.1.1平均指标的概念和作用

5.1.2算术平均数5.1.3调和平均数的计算5.1.4几何平均数5.1.5众数5.1.6中位数5.1.1平均指标的概念和作用(一)平均指标的含义(二)平均指标的特点(三)平均指标的作用(四)平均指标的种类(一)平均指标的含义平均指标又称统计平均数,指同质总体某一标志值在一定的时间、地点、条件下所达到的一般水平,是总体的代表值,反映了总体分布的集中趋势。例如,平均成绩、平均工资、工人平均劳动生产率等都属于平均指标。所谓“平均”,实质上是对总体分布(变量数列)的均匀化。最基本的解释是,对总体内的全部标志值进行“截长补短”,使得总体各单位拥有同一水平的数量表现。平均指标是总体分布的特征值之一。它是总体某一变量数列的代表值,是事物发展变化在数量上的共同表现,它依赖于总体各单位的实际数量水平,是对各数量标志值进行抽象概括的结果。(二)平均指标的特点由于平均指标是反映各总体单位的一般水平,抽象概括总体数量特征的指标,因此它具有以下几个特点:(1)总体同质性。(2)一般代表性。(3)数量抽象性。(1)总体同质性。平均指标只能就同类现象计算,也就是平均指标的各个单位必须具有同类性质,这是计算平均指标的基本前提。如果把不同类现象混同起来计算平均数,就会掩盖现象间本质的差别,所得出的结论,必然不符合客观实际的真实情况。例如,在研究全国职工工资收入时,不能把农民收入和个体经营者收入包括在内加以计算,否则就会夸大或缩小全国职工工资收入水平,以致做出错误的判断和结论。又如在计算住校大学生平均每月支出时,便不能将走读学生混入期内,否则会掩盖二者的区别,使平均数失去代表性。(2)一般代表性。平均指标以一般水平代表总体各单位数量标志值的具体表现,反映总体某一数量标志的典型水平或代表性水平。例如某车间某班组有6名工人,他们某天在正常条件下的日产量(单位:件)分别为:20、22、23、23、24、26,他们的平均日产量为(21+22+23+23+24+26)÷6=23(件)。这个23件平均日产量虽然不能说明任何一个工人日产量的实际产量,但却把高产量和低产量拉平了,能够说明总体的一般水平,所以,平均日产量可作为全组每个工人日产量的代表值。(3)数量抽象性。统计平均指标将总体各单位某一数量标志的各个差异数值进行抽象,概括地反映这—数量标志在具体时间、地点、条件下达到的一般水平,使人们看不到先进与落后的差别。例如,某企业职工的平均工资为960元,但各个职工的工工资水平有高有低,高于960元和低于960元的工资相互抵消、截长补短,得出平均工资960元。由此可见,平均数将被研究对象总体各单位的标志值的数量差异抽象化了。(三)平均指标的作用(1)利用平均指标可以将同类现象的一般水平在不同的空间和时间上进行比较。(2)利用平均指标可以分析现象之间的依存关系。(3)平均指标是统计推断的一个重要参数。(四)平均指标的种类平均指标有多种不同的计算方法,因而也有不同的类别。平均指标从反映的时间状况看,分为静态平均指标和动态平均指标:静态平均指标是根据分配数列计算得到的,它主要是反映总体各单位在某一时间内或时点上标志值的一般水平。动态平均指标是根据时间数列计算得到的,它主要是反映同一总体在一段时间内发展变化的一般水平。本章主要研究的是静态平均指标。静态平均指标主要有算术平均指标、调和平均指标、几何平均指标、中位数和众数等。其中前三种平均指标都是根据各单位标志值计算求得,因而称为数值平均数。而中位数和众数却是根据标志值所在的位置来确定,所以又称为位置平均数。5.1.2算术平均数(一)算术平均指标的基本形式(二)算术平均数与强度相对数的区别(三)简单算术平均数(四)加权算术平均数(一)算术平均指标的基本形式算术平均指标是统计中最基本最常用的一种综合指标。它是将总体各单位的标志值相加求其算术总和,然后除以总体单位个数而得。其基本公式为:算术平均数=总体标志总量÷总体单位总量利用公式计算平均数时应注意:(1)公式的分子和分母存在着密切的关系,其分子(标志总量)是由分母中总体单位本身所具有的某种标志值加总而得到的。这是平均指标与强度相对指标最本质的区别;(2)总体标志总量是数量标志值之和,由于品质标志不能相加,因而不能计算算术平均数;(3)算术平均数是一个有名数,计量单位和标志值的计量单位一致。(二)算术平均数与强度相对数的区别在实际社会经济生活中,某些强度相对指标会被误认为平均指标,如“人均粮食占有量”、“人均钢产量”等,虽然这类指标有“人均”二字,有“平均”的含义,但它们不是平均指标,而是强度相对指标,必须弄清二者的区别。算术平均数与强度相对数的区别主要表现在以下两点:(1)分子、分母资料是否属于同一总体范围。平均指标的分母、分子是同一总体的单位总量和某一标志总量,且分子直接依附于分母;强度相对数的分子与分母本质上分别属于两种性质不同但有联系的现象总体;(2)分子与分母数值是否具有一一对应关系。平均指标中分子的标志总量就是分母的单位总量中每一单位的标志值之和,且各个标志值与各个单位一一对应。(三)简单算术平均数在计算算术平均数时,若掌握的资料是总体各单位的标志值,那么就可以将总体各单位的标志值简单相加求得标志总量,然后除以总体单位总量,即得平均数。这种方法通常称为简单算术平均法。用公式表示:式中,x代表算术平均数;x代表各单位标志值;n代表总体单位数;∑x为求和符号。(四)加权算术平均数加权算术平均数一般用来计算分组资料的算术平均数,它是用标志值乘以相应的各组单位数求出各组的标志总量,并加总求得总体标志总量,再除以总体单位总数即得。设有n个标志值x1,x2,…,xn,如果以f1,f2,…,fn为各标志值的权数或次数,则x的加权算术平均数计算公式为:式中,x代表各组标志值;f代表各组单位数。计算加权算术平均数时有两种情况:一是单项式变量数列计算;二是组距式数列计算。1.根据单项式变量数列计算算术平均数由单项式变量数列计算算术平均数,是将各组的标志值乘以相应的各组的单位数,求出各组标志总量,并加总得出总体的标志总量,同时把各组单位数相加求出总体单位总数,然后,再用总体单位总数去除总体标志总量,即得算术平均数。2.根据组距式变量数列计算算术平均数如果掌握的是组距数列资料,其计算方法与上述方法基本相同,有一点不同的是,组距数列以各组的组中值作为变量值。利用组中值计算平均数有一定的假定性,首先假定各个组的标志值在组内的分布式均匀的,但实际上各组内的标志值分布不会绝对均匀。其次如果组距数列上下两组是开口组,还假定他们与同临组组距相仿,这与实际也有出入,所以根据组距数列计算出的加权算术平均数只是近似值。(五)算术平均数的数学性质和应用1.算术平均数的数学性质2.算术平均数的简便运算1.算术平均数的数学性质(1)算术平均数与变量值个数的乘积等于各变量值之和。简单算术平均数:(2)若将各变量值x均加减上一常数A,则新平均数等于原平均数加减A。简单算术平均数:(3)若将各变量值x均乘以某一常数i,则新的平均数等于原平均数乘以i。简单算术平均数:

(4)各变量值x对算术平均数x的离差之和等于0。简单算术平均数:加权算术平均数:(5)各变量值与平均数离差的平方和最小。2.算术平均数的简便运算在计算算术平均数时,有时由于被平均的标志值较大,计算繁琐,有必要采用简捷法计算。其基本上思路是:通过变量值的线性变换,将原变量数列的标志值简化,由此简化算术平均数的计算过程。根据数学性质(2),可把原来较大的数值运算变为简单的数值运算,所得结果再变换为数据的平均数。以上数学性质也可以综合运用,使计算过程更加简化。根据数学性质(2)、(3),推导出算术平均数的简算公式:(六)简单算术平均数与加权算术平均数的关系简单算术平均数与加权算术平均数均为计算算术平均数的基本形式。二者的区别:一是,二者掌握总体单位资料的详尽程度不同。如果掌握了每一个总体单位的标志值,计算平均数时,用简单算术平均数;如果掌握了总体单位分组的标志值及各组的单位数,计算平均数时,用加权算术平均数;二是,二者的计算精确程度不同。用简单算术平均数计算的平均数是精确值,而用加权算术平均数计算的平均数是近似值。二者的联系是,当各组的权数相同时,加权算术平均数就变成了简单算术平均数。5.1.3调和平均数的计算(一)调和平均数的概念(二)简单调和平均数(三)加权调和平均数(四)加权调和平均数与加权算术平均数的关系(五)运用调和平均数应注意的问题(一)调和平均数的概念调和平均数也叫调和平均指标,是根据标志值的倒数计算的,它是标志值倒数的算术平均数的倒数,所以,亦称为倒数平均数,用xH来表示。在统计实践中,由于只有各组标志总量和各组变量值,而缺乏总体单位数资料,不能直接采用算术平均数计算,这时就需要将算术平均数的形式加以改变,按照算术平均数基本算式的需要,算出所需总体单位数,继而再计算平均数,这样就得到另一种平均数的计算方法,这就是调和平均数。调和平均数分为简单调和平均数和加权调和平均数两种。(二)简单调和平均数这种方法适用于未分组资料或资料虽分组,但各组标志总量均相等的情况。根据上述计算,可以得出简单算术平均数的计算公式:式中:xH为调和平均数;x为各标志值;n为变量值的个数。(三)加权调和平均数这种方法适用于资料已分组,且各组标志总量不相等的情况。其计算公式为:式中:m代表各组标志总量。(四)加权调和平均数与加权算术平均数的关系从形式上说,加权算术平均数与加权调和平均数的原式存在两点区别:一是加权算术平均数以x为变量,加权调和平均数则以1x为变量:二是加权算术平均数的权数是f,代表次数(单位数),而加权调和平均数的权数却是xf,代表标志总量。但两者实质上都是标志总量与总体单位数之比。调和平均数可以称为算术平均数的变形。在对算术平均数与调和平均数的介绍当中,可以发现这样的特点:在计算平均指标时,若缺少分子资料时,既缺少总体的标志总量,则适宜采用加权算术平均数;若缺少分母资料时,既缺少总体的单位总量,则适宜采用加权调和平均数的方法。(五)运用调和平均数应注意的问题(1)当变量数列有一变量x为零时,调和平均数公式的分母将等于无穷大,因而无法求出一确定的平均值。(2)调和平均数与算术平均数一样,易受极端变量值的影响,当数列存在极端大的数值时,调和平均数增大;当数列存在极端小的数值时,调和平均数减小。(3)要注意调和平均数和算术平均数的使用条件,因事制宜。5.1.4几何平均数几何平均数也叫几何平均指标,是计算平均比率和平均速度最适用的一种方法,用xG表示,它也有简单几何平均数和加权几何平均数之分。它适合于各变量值之间存在环比关系的事物,例如,各年发展速度之间、流水生产线各车间的产品合格率之间、各年银行存款利率之间等都存在这种关系。(一)简单几何平均数(二)加权几何平均数(一)简单几何平均数简单几何平均数是n个标志值连乘积的n次方根,其计算公式为:简单几何平均数适用于各组变量值出现的次数都为一次的情况。(二)加权几何平均数对于分组资料x1,x2,…,xn,若其相应的次数为f1,f2,…,fn,则必须以指数形式给各变量值加权,然后求其平均数。其计算公式为:综上分析,由于几何平均数是一种特殊的平均数,所以,在运用几何平均数时应注意以下问题:(1)在数列的标志中,若有一个变量数值为0,则几何平均数等于0;(2)用等比级数数列计算几何平均数不会受极端值的影响,而用环比数列计算几何平均数,则受最初水平和最末水平的影响;(3)在我国统计实务中,几何平均法主要用于计算平均发展速度,属于动态平均数。而计算静态数列时,使用较少。5.1.5众数(一)众数的概念(二)众数的确定(一)众数的概念众数是指总体中出现次数最多的标志值,用MO表示。它能够鲜明地反映数据分布的集中趋势。它既不受极端变量值大小的影响,也不受极端变量值位置的影响。在总体单位数多且有明显集中趋势时,确定众数既方便且意义明确。如总体单位数较少,或虽多但无明显集中趋势,就不存在众数。变量数列中有两个或几个变量值的次数都比较集中时,就可能有两个或几个众数,这时称为复众数,在实际工作中应用较为普遍,如服装、鞋帽的尺码。(二)众数的确定1.单项式数列确定众数2.组距式数列确定众数1.单项式数列确定众数对于单项式数列,可以根据定义直接求出。2.组距式数列确定众数对于组距式数列,应先根据定义确定众数所在的组,然后用众数的上限或下限公式求出众数的具体数值。下限公式:上限公式:式中:L为众数所在组的下限;U为众数所在组的上限;Δ1为众数所在组次数与下一组次数之差;Δ2为众数所在组次数与上一组次数之差;d为组距。5.1.6中位数(一)中位数的概念(二)中位数的确定方法(一)中位数的概念中位数(Me)是指位于总体分布中点位置上的标志值。所谓分布中点,意味着有一半单位的标志值小于该点的标志值,而另—半单位的标志值必定大于该点的标志值。由此可见,中位数的大小不受两端值的影响,也不受各变量变动大小的影响,仅受所处位置的影响。由于许多事物的分布均呈正态分布或近似正态分布,因此,中位数可以从另一侧面反映次数分布的集中趋势。(二)中位数的确定方法1.根据未分组资料确定中位数2.根据分组资料确定中位数1.根据未分组资料确定中位数对于未分组的资料x1,x2,…,xn进行排序后,按下列公式确定众位数的位置。中位数位置=(n+1)÷2式中,n代表数列的项数。如果项数是奇数,则居于中间位置的那个变量值就是中位数。2.根据分组资料确定中位数分组资料可以分为单项式变量数列和组距式变量数列。(1)对于单项式变量数列。首先,要确定中位点∑f/2所在的组,即累计次数的半值;其次,找出中位数所在的组,即含累计次数半值的组,该组的变量值就是中位数。(2)对于组距式变量数列。由组距数列确定中位数,同样要先按中位点的公式∑f2,确定中位数所在的组,然后按照下限公式或上限公式来计算中位数的近似值。中位数的下限公式:中位数的上限公式:式中:L为中位数所在组的下限;Sm-1为中位数所在组前一组的累计次数(其累计次数按向上累计计算);fm为中位数所在组的次数;d为中位数所在组的组距;U为中位数所在组的上限;Sm+1为中位数组后一组的累计次数(累计次数按向下累计计算)。5.2标志变异指标5.2.1标志变异指标概述

5.2.2标志变异指标的计算5.2.1标志变异指标概述(一)标志变异指标的概念(二)标志变异指标的作用(三)标志变异指标的种类(一)标志变异指标的概念标志变异指标是用来说明总体各单位的标志值之间差异程度的综合指标,也称为标志变动度。平均指标是将总体各单位某一数量标志值的差异抽象化,只反映总体的一般水平与共性,反映的是总体的集中趋势,同时,也掩盖了总体各单位的数量差异,不能全面描述总体分布的特征。标志变异度指标弥补了这个不足,反映了总体各单位的标志值之间的差异性,从另一方面说明总体分布的特征,反映的是总体分布的离中趋势。因此,两者紧密联系,分别从不同角度分析现象的特征。平均指标与标志变异指标的区别主要是:(1)前者是抽象变量值之间的差异而成的结果,后者则是反映变量之间差异而成的结果;(2)前者反映了总体分布的集中趋势,后者反映了总体分布的离中趋势。(二)标志变异指标的作用1.标志变异指标是衡量平均指标代表性大小的重要尺度2.标志变异指标是反映社会经济活动过程的均衡性与协调性的重要指标3.标志变异指标是抽样方案设计的依据之一(三)标志变异指标的种类根据比较的标准不同,可将标志变异指标分为三类:1.以标志值之间相互比较的方式来说明变异情况2.以平均数为比较标准来说明标志变异情况3.以正态分布为标准来说明分配数列的偏离情况5.2.2标志变异指标的计算(一)全距的概念和特点(二)平均差的概念、特点及计算(三)标准差的概念、特点及计算(四)变异系数的意义和计算(一)全距的概念和特点全距也叫极差,通常用R表示。它是测定标志变动度最简单的方法,计算总体各单位标志值中最大值与最小值之差。它表示总体各单位标志变动度的大小,也反映了总体分散与集中的程度。一般说来,全距大,总体各单位变异程度大;全距小,总体各单位变异程度小。全距=最大的标志值-最小标志值全距反映总体标志变动度比较直观,且计算简单,但其反映总体标志变动度不是太准确。(二)平均差的概念、特点及计算平均差是指各标志值与其算术平均数离差的绝对值的算术平均数。常用A.D表示。其计量单位与标志值的计量单位相同。由于各个标志值对算术平均数的离差有正有负,其和为零。因此需采用离差的绝对值来计算。平均差仅反映总体各单位的标志值对其平均数的平均离差量。平均差愈大,表明标志变异程度愈大;反之,则表明标志变异程度愈小。1.对未分组资料,采用简单算术平均式A.D=∑x-xn2.对分组资料,采用加权算术平均式A.D=∑x-xf∑f平均差综合了总体各单位的数量差异,因此,能全面地反映总体分布的变异程度。但是,它采用绝对值的方式来消除离差的正负号,不便于代数运算,在数学处理上也不够严密。(三)标准差的概念、特点及计算1.标准差(σ)的概念2.标准差的计算方法3.标准差的数学性质与简捷计算4.是非标志标准差1.标准差(σ)的概念所谓标准差就是总体各单位的标志值与其算术平均数离差平方的算术平均数的平方根,故又称为均方根差,简称均方差。标准差的平方称为方差。标准差的意义与平均差相同,它也是各个标志值对其算术平均数的平均离差。但在数学处理上与平均差有所不同,它是采用平方的方法来消除离差的正负号的,因此,它比平均差更能准确地反映变量数列之间的离中程度,是统计中最常用的标志变异度指标。2.标准差的计算方法根据标准差的定义,标准差的计算步骤为:首先,求总体各标志值的算术平均数;其次,求总体各标志值与其算术平均数的离差;第三,求离差的平方;第四,求各项离差平方的算术平均数;第五,对离差平方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论