第四章平均指标和标志变异指标_第1页
第四章平均指标和标志变异指标_第2页
第四章平均指标和标志变异指标_第3页
第四章平均指标和标志变异指标_第4页
第四章平均指标和标志变异指标_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章平均指标和标志变异指标第1页,共94页,2023年,2月20日,星期三本章要点1、平均指标几种计算方法2、平均增长速度计算3、标志变异指标第2页,共94页,2023年,2月20日,星期三第一节

平均指标的

概念与作用第3页,共94页,2023年,2月20日,星期三一、平均指标的概念平均指标又称统计平均数,是反映同质总体内各单位在某一数量标志值上一般水平的综合指标。它是统计分析中最常用的指标之一。第4页,共94页,2023年,2月20日,星期三平均指标的特点1.将数量差异抽象化。2.只能就同类现象计算。3.能反映总体变量值的集中趋势。第5页,共94页,2023年,2月20日,星期三二、平均指标的作用(一)平均指标可用于同类现象在不同空间、不同时间条件下的对比。(二)平均指标是评价事物或现象的数量依据。(三)平均指标也可用于分析现象之间的依存关系和进行数量上的估算。第6页,共94页,2023年,2月20日,星期三三、平均指标的种类平均指标有静态平均数和动态平均数之分。静态平均数是反映同质总体各单位在同一时间某一数量标志值上的一般水平。动态平均数反映的是现象某一数量标志在不同时间上的一般水平。这种平均数又叫序时平均数统计学中常用反映集中趋势的指标有算术平均数、调和平均数、几何平均数、众数mode和中位数median。第7页,共94页,2023年,2月20日,星期三第二节算术平均数

ArithmeticMean第8页,共94页,2023年,2月20日,星期三一、基本计算公式Basicformulaofarithmeticmean第9页,共94页,2023年,2月20日,星期三平均数与强度相对数的区别1、人均书籍20本2、人均耕地2亩人均课本20本人均馆藏图书20本某村人均耕地2亩某地区人均耕地2亩强度相对数平均数第10页,共94页,2023年,2月20日,星期三二、简单算术平均数

simplearithmeticmean将各单位的标志值xi直接相加得出标志总量,再除以总体单位数n,就得到简单算术平均数。用公式表示为式中:X—算术平均数;X1,X2,…,Xn—总体各单位标志值;n—总体单位数;∑—总和符号。第11页,共94页,2023年,2月20日,星期三ExampleAsampleoffiveexecutivesreceivedthefollowingbonuslastyear($000):

14.0,15.0,17.0,16.0,15.0第12页,共94页,2023年,2月20日,星期三Σ的性质1、2、3、??第13页,共94页,2023年,2月20日,星期三三、加权算术平均数

WeightedArithmeticMean当掌握的资料是经过加工整理的变量数列,并且各组的单位数不相等时,就需要以各组的单位数为权数,采用加权的办法计算平均指标。这样计算的平均指标称为加权算术平均数。第14页,共94页,2023年,2月20日,星期三总体标志值为y1、y2、…、yk,将相同的标志值分为一组,共分n组。第一组有f1个,标志值为X1,…,第n组有fn个,标志值为Xn。算术平均数公式加权算术平均数公式第15页,共94页,2023年,2月20日,星期三采用加权的办法计算平均指标是一种简便运算第16页,共94页,2023年,2月20日,星期三例:抽样调查某地200个3口之家的居民户,得其生活费用支出资料如下表:

月生活费支出(元)组中值Xi户数(户)fiXifi400以下267800400-6003517500600-8005941300800-120040400001200-180026390001800以上1429400合计—200175000要求:计算居民户月平均生活支出。300210050070010001500??第17页,共94页,2023年,2月20日,星期三解:取组中值作Xi,户数作权数fi,中间计算过程见上表。则居民户月平均生活支出为:第18页,共94页,2023年,2月20日,星期三公式的变形第19页,共94页,2023年,2月20日,星期三某车间生产三批产品的废品率分别是2%、1%、4%,三批产量占全部产量的比重分别是45%、30%、25%,试求该车间三批产品的平均废品率。解:平均废品率第20页,共94页,2023年,2月20日,星期三某小贩以2元/千克的价格购进100千克苹果,以3元/千克的价格卖出60千克,以2.6元/千克的价格卖出40千克,剩余的20千克以购进价卖出,平均名义卖价是多少?实际平均每千克赚了多少?第21页,共94页,2023年,2月20日,星期三解:1、平均名义价格2、实际价差第22页,共94页,2023年,2月20日,星期三加权算术平均数的特征加权算术平均数受两个因素的影响:①变量值的大小;②权数的结构。权数有绝对数权数和相对数权数两种。绝对数权数就是变量值个数以绝对数形式表示,即次数或频数;相对数权数则是变量值个数以相对数形式表示,即频率。第23页,共94页,2023年,2月20日,星期三第三节调和平均数

HarmonicAverage第24页,共94页,2023年,2月20日,星期三一、调和平均数的概念和计算调和平均数又称“倒数平均数”,它是各个变量值倒数的算术平均数的倒数。通常用H表示。根据同一资料计算出的算术平均数和调和平均数是不相同的。事实上,变量值的调和平均数本身无实际意义,但在社会经济统计中,有时由于资料的原因不能直接计算出算术平均数,而采用调和平均数的形式。因此,可以把调和平均数看作是算术平均数的变形。第25页,共94页,2023年,2月20日,星期三(一)简单调和平均数简单调和平均数的计算公式是:式中:(X—变量值;n—总体单位总量。)第26页,共94页,2023年,2月20日,星期三由算术平均数的公式令Xifi=Mi则有fi=Mi/Xi

于是上式变为(二)加权调和平均数第27页,共94页,2023年,2月20日,星期三班长购一批教材:在图书城用去420元,单价为14元;在一小书店用去425元,单价为15元;在新华书店用去80元,单价为14元。班上每位同学应出多少钱?第28页,共94页,2023年,2月20日,星期三解:平均价格第29页,共94页,2023年,2月20日,星期三二、调和平均数的应用调和平均数是作为算术平均数的变形来使用的,它们在实质上相同,都满足平均数的基本计算公式:标志总量/总体单位总量。计算平均数时,如果掌握了基本公式中分母项的资料,即总体单位总量,则直接采用算术平均数的形式;如果只掌握了基本公式中分子项的资料,即标志总量,而未掌握其分母项资料,则需采用调和平均数的形式。第30页,共94页,2023年,2月20日,星期三例2已知甲、乙、丙三个企业的有关资料如表4-5,要求计算这三个企业的平均计划完成程度。表4-5三个企业实际计划完成情况表

企业计划完成(%)实际完成数(万元)甲9595乙102153丙108410.4合计—658.4第31页,共94页,2023年,2月20日,星期三解:由计划完成相对数的计算公式和已知条件,有:平均计划完成程度从以上例可以看出,计算平均数时,要依据客观存在的经济关系式和已知条件作具体分析,而不能简单地套用公式,否则容易出现错误。第32页,共94页,2023年,2月20日,星期三我们可将平均数的计算归纳为以下几个步骤:第一步:确定变量X,求谁的平均数谁即为X;第二步:依资料及客观经济关系式写出平均数的基本计算公式;第三步:根据资料,若已知各组标志值的次数f,则采用算术平均数的公式计算平均数;若已知各组标志总量M,则采用调和平均数的计算公式求出平均数。要点:弄清各个量之间的关系。第33页,共94页,2023年,2月20日,星期三某银行营业部只有两笔大额贷款,一笔为200万元,年利率10%,另一笔为1000万元,年利率13%,求该营业部大额贷款的平均年利率。年利率=(10%+13%)÷2=11.5%错啦!

对啦!第34页,共94页,2023年,2月20日,星期三分析单位:万元第35页,共94页,2023年,2月20日,星期三某人购房欲贷款12万元,根据其资信水平,贷款10万元的年利率是8%,若增加2万元,则这12万元贷款的年利率变为10%,求增加的2万元贷款的年利率。解:第36页,共94页,2023年,2月20日,星期三第四节几何平均数

GeometricMean第37页,共94页,2023年,2月20日,星期三几何平均数是n个变量值连乘积的n次方根。通常用G表示。几何平均数适合于计算现象比率或速度的平均值,并且还要求现象在各阶段上的比率或速度之积等于总比率或总速度。不满足上述条件计算得到的几何平均值无实际意义。几何平均数根据资料情况,可分为简单几何平均数和加权几何平均数两种。前者适用于未分组资料,后者适用于分组后的变量数列。第38页,共94页,2023年,2月20日,星期三一、简单几何平均数简单几何平均数是n个变量值连乘积的n次方根。式中:(Xi—数列中第i个变量值(i=1,2,…,n)n—变量值个数∏—连乘符号)

第39页,共94页,2023年,2月20日,星期三例如,生产某产品需连续经过4道工序,根据经验,各道工序的合格率分别为98%、95%、92%、90%,求该产品4道工序的平均合格率第40页,共94页,2023年,2月20日,星期三二、加权几何平均数当各个变量值的次数(权数)不相同时,应采用加权几何平均数。式中,fi为变量值Xi出现的次数,又称权数。

第41页,共94页,2023年,2月20日,星期三投资银行某笔投资的年利率是按复利计算的,10年的年利率分配是:第1年至第2年为5%;第3年至第5年为8%;第6年至第8年为10%;第9年至第10年为12%,则平均年利率是多少?问题:如果不按复利计算,平均年利率是多少?平均年利率第42页,共94页,2023年,2月20日,星期三解:设本金为C,则平均年利率第43页,共94页,2023年,2月20日,星期三三、平均发展速度设各个时期的发展水平为

a0,a1,a2,a3,…,an平均发展速度的计算公式为或者第44页,共94页,2023年,2月20日,星期三四、平均增长速度1、已知发展速度υi2、已知增长速度θi(2)已知废品率、淘汰率θi(1)已知利率、经济增长率θi第45页,共94页,2023年,2月20日,星期三有32支球队参加比赛,经5轮决出冠军,求每一轮的平均淘汰率。平均淘汰率解:n=5a0=32an=1第46页,共94页,2023年,2月20日,星期三几何平均数较之算术平均数,应用范围较窄,它有如下特点:①如果数列中有一个标志值等于零或负值,就无法计算G②G受极端值影响较X和H小;③它适用于反映特定现象的平均水平,即现象的总标志值不是各单位标志值的总和,而是各单位标志值的连乘积的情形。对于这类社会经济现象,不能采用算术平均数反映其一般水平,而需采用几何平均数。第47页,共94页,2023年,2月20日,星期三算术平均数、调和平均数和几何平均数三者间存在如下数量关系:

H≤G≤X

并且只有当所有变量值都相等时,这三种平均数才相等第48页,共94页,2023年,2月20日,星期三众数和中位数第五节第49页,共94页,2023年,2月20日,星期三一、众数Mode众数是总体中出现次数最多的标志值。它可用来大致说明现象的一般水平。如果总体中出现次数最多的标志值不是一个,而是两个,那么就存在复众数。众数可以有一个或多个,这是与算术平均数所不同的。就是总体的单位数较多,各标志值的次数分配又有明显的集中趋势时计算众数才有意义;如果总体单位数很少,尽管次数分配较集中,那么计算出来的众数意义不大;如果总体单位数较多,但次数分配不集中,即各单位的标志值在总体中的分布比较均匀,那么也无所谓众数。第50页,共94页,2023年,2月20日,星期三众数的计算方法1.单项式变量数列由单项式变量数列确定众数,可直接观察次数,出现次数最多的标志值就是众数。2.组距数列由组距数列确定众数,首先要由最多次数来确定众数所在组,然后再用比例插值法计算众数。第51页,共94页,2023年,2月20日,星期三由组距数列确定众数下限公式:

上限公式:

式中:(M0—众数;L—众数组的下限;U—众数组的上限;△1—众数组次数与前一组次数之差;△2—众数组次数与后一组次数之差;d—众数组组距。)

第52页,共94页,2023年,2月20日,星期三从众数的计算可看到众数的特点:①众数不受极端值的影响,组距数列中出现开口组时,对众数也无影响;②众数的计算公式只适用于等距数列,如果是不等距数列,则应先将其换算为等距数列,然后再利用上、下限公式求众数。第53页,共94页,2023年,2月20日,星期三二、中位数Median(一)中位数的概念将现象总体中各单位的标志值按大小顺序排列,位于中间位置的那个标志值就是中位数。通常用Me表示。由中位数的定义可知:中位数把全部标志值分为两个部分,一半的标志值不高于中位数,另一半的标志值不低于中位数,中位数位置前后的总体单位个数相等。中位数和众数一样,有时可代替算术平均数来反映现象的一般水平。第54页,共94页,2023年,2月20日,星期三(二)中位数的计算1.由未分组资料确定中位数在数据量不大的情况下,确定中位数的步骤是:①先对变量值由小到大顺序排列;②根据项数n确定中位数的位置,中位数位置=(n+1/2),n代表总体单位数;③根据中位数位置找出中位数。当项数n为奇数,则居于中间位置的那个变量值就是中位数;当项数为偶数,即(n+1/2)为非整数时,位于中间位置的第(n/2)项和第(n/2)+1项的两个变量值的算术平均数就是中位数。第55页,共94页,2023年,2月20日,星期三2.由单项式变量数列确定中位数当数据量较大时,资料常以分组数列的形式出现,如果是单项式变量数列,则确定中位数的步骤是;计算累计次数,累计次数第一次超过(∑f/2)的那一组即为中位数所在组;与该组对应的标志值即为中位数。其中∑f为总次数。第56页,共94页,2023年,2月20日,星期三3.由组距式数列确定中位数由组距数列确定中位数,应先找出中位数所在组,累计次数第一次超过(∑f/2)的那一组即为中位数所在组,然后再用比例插值法计算中位数的值。第57页,共94页,2023年,2月20日,星期三用比例插值法计算中位数下限公式:

上限公式:

式中:(Me—中位数;L—中位数组的下限;U—中位数组的上限;fm—中位数组的次数;∑f—总次数即总体单位数;Sm-1—中位数组前各组的次数之和;Sm+1—中位数组后各组的次数之和;d—中位数组的组距。)

第58页,共94页,2023年,2月20日,星期三标志变异指标第六节

第59页,共94页,2023年,2月20日,星期三一、标志变异指标的概念和作

(一)标志变异指标的概念标志变异指标也称标志变动度,是反映总体各单位标志值之间差异程度的综合指标。平均指标表明数值的集中趋势(MEASURESOFCENTRALTENDENCY)标志变异指标反映数值的离中趋势(MEASURESOFDISPERSION)第60页,共94页,2023年,2月20日,星期三(二)标志变异指标的作用1.标志变异指标是评价平均数代表性的依据。2.标志变异指标可用来反映社会经济活动过程的均衡性和稳定性。标志变异指标值小,说明社会经济活动过程的均衡性和稳定性好,反之则差。3.标志变异指标度量风险。第61页,共94页,2023年,2月20日,星期三二、标志变异指标的种类和计算据计算方法不同可将标志变异指标分为不同类型。有一类是将总体标志值按顺序排列之后取特定位置的标志值,求其离差,以表明次数分布的变化范围,如全距指标,四分位差指标等。另一类是求各标志值对平均数的平均离差来反映标志值相对于平均数的离差程度,如平均差、标准差(又称均方差)或方差等。用上述标志变异指标还可以计算各种变异系数或离散系数,以表示标志值离差的相对水平。此外还有描述标志值分布状态的指标如偏度系数指标和峰度系数指标,它们说明实际统计分布偏离正态分布的程度。第62页,共94页,2023年,2月20日,星期三MeasuresofDispersionRange(全距)

Quartiles(四分位数)Meandeviation(平均差)

Standarddeviation(标准差)Variance(方差)Coefficientofvariation(离散系数)

Coefficientofskewness(偏态系数)Coefficientofkurtosis(峰度系数)

第63页,共94页,2023年,2月20日,星期三(一)全距(Range)全距又称极差,是总体各单位标志值中最大值与最小值之差,常记为R。它表示标志值的变化范围。全距(R)=最大标志值-最小标志值一般而言,全距的值愈小,则变量值愈集中,表明标志值的变异程度小,反之则愈大。但由于全距只决定于两个极端值而与其它中间值没有关系,因此不能准确反映全部标志值的变化状况,由此据全距得出的结论有时不够准确,尤其是两个极端值与其它值偏离较大时,用全距说明各标志值的变异程度则更不准确。第64页,共94页,2023年,2月20日,星期三*四分位差

InterquartileRange把一个变量数列分成四等份,形成三个分割点Q1、

Q2、

Q3,这三个分割点的数值就称为四分位数,Q2也是中位数,四分位差为Q.D.Q.D.=Q3-Q1第65页,共94页,2023年,2月20日,星期三LocationofapercentileQuartilesandPercentileQ3------>

L75

Q2------>

L50Q1------>

L25

Q2=

Me

第66页,共94页,2023年,2月20日,星期三EXAMPLE464748495153545455585960第67页,共94页,2023年,2月20日,星期三第68页,共94页,2023年,2月20日,星期三(二)平均差

AverageDeviation平均差是各单位标志值对平均数的离差绝对值的平均数,常用A.D表示。计算时之所以取绝对值,是为了避免各种离差之和出现正负相互抵消。平均差实际上说明每个标志值对其平均值的平均偏离程度,它考虑到了每一个标志值的情况,因此能比较全面、准确地反映标志值的变异程度。但由于计算中取绝对值,从而不便于代数运算,使用范围受到限制。第69页,共94页,2023年,2月20日,星期三平均差的计算公式未分组资料:

UngroupedData分组资料:GroupedData第70页,共94页,2023年,2月20日,星期三(三)标准差

StandardDeviation未分组资料:分组资料:第71页,共94页,2023年,2月20日,星期三标准差的简捷计算公式

ShortcutMethod未分组资料:分组资料:第72页,共94页,2023年,2月20日,星期三(四)离散系数

CoefficientofVariation离散系数V是标准差与平均数之比,用于反映总体各单位标志值的相对离散程度。通常所讲的离散系数就是指标准差系数。注意:离散系数常用于不同数列间变异程度(平均数代表性高低、均衡性、稳定性等)的比较。

第73页,共94页,2023年,2月20日,星期三例2为比较两个不同城市居民家庭收入的差异程度,现从甲市任抽100户,得其平均年收入是42000元,年收入的标准差是38060元;从乙市任抽150户,得其平均年收入是62000元,年收入的标准差是50980元。解:利用离散系数进行比较

甲市:乙市:由于V乙<V甲,据上述抽样资料可知,乙市家庭的收入差异程度低于甲市家庭的收入差异程度。注意,在这里不能用标准差作比较,否则会得出错误结论。

第74页,共94页,2023年,2月20日,星期三EXAMPLEAlargegroupofairforceinductees(应召入伍的士兵)wasgiventwoexperimentaltests-amechanicalaptitudetestandafingerdexteritytest.Thearithmeticmeanscoreonthemechanicalaptitudetestwas200,withastandarddeviationof10.Themeanandstandarddeviationforthefingerdexteritytestwere30(mean),s=6,comparetherelativedispersioninthetwogroup.第75页,共94页,2023年,2月20日,星期三EXAMPLEThevariationintheannualincomesofexecutivesistobecomparedwiththevariationinincomesofunskilledemployees.Forasampleofexecutives,thesamplemeanis$500,000,ands=50,000.Forasampleofunskilledemployeesthesamplemeanis$32,000,ands=$3,200.第76页,共94页,2023年,2月20日,星期三全距、平均差、方差和离散系数

作用比较第77页,共94页,2023年,2月20日,星期三标准分数(standardscore)1.也称标准化值2.对某一个值在一组数据中相对位置的度量3.可用于判断一组数据是否有离群点(outlier)4.用于对变量的标准化处理5.计算公式为第78页,共94页,2023年,2月20日,星期三标准分数的性质2.方差等于11.均值等于0第79页,共94页,2023年,2月20日,星期三Examplez分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的状态,而只是将该组数据变为均值为0,标准差为1

第80页,共94页,2023年,2月20日,星期三Chebishev定理

方差和标准差的大小说明各数值在均值周围分布的情况,当一组资料的标准差较小时,说明大多数的数值集中于均值附近。问题:究竟有多少个数值落在均值附近的某一个区间内呢?Chebishev定理:对任何的一组资料,观测值落于均值左右k个标准差的区间内的比例,至少为(1-1/k2

第81页,共94页,2023年,2月20日,星期三例如,有一组关于顾客购物付帐时等候时间的资料,已知等候时间的均值为4分钟,标准差为0.9分钟,则根据Chebishev定理,当k=2时,至少有1-(1/2)2=3/4或75%的观测值落在均值左右两个标准差的区间内,即[4±2×0.9]区间内。也就是说,等候时间介于2.2分钟至5.8分钟之间的顾客至少占75%。

第82页,共94页,2023年,2月20日,星期三K区间落在该区间内的比例1(-

)至少为02(-2

,+2

)至少为3/4(75%)3(-3

,+3

)至少为8/9(89%)4(-4

,+4)至少为15/16(94%)各种不同K值所对应的观测值落入的区间

第83页,共94页,2023年,2月20日,星期三经验法则EmpiricalRule经验法则表明:当一组数据为钟型对称分布时约有68%的数据在平均数加减1个标准差的范围之内约有95%的数据在平均数加减2个标准差的范围之内约有99%的数据在平均数加减3个标准差的范围之内第84页,共94页,2023年,2月20日,星期三钟型对称分布K区间落在该区间内的比例1(-

)68%2(-2

,+2

)95%3(-3

,+3

)99%6(-6

,+6

)1-1/1百万第85页,共94页,2023年,2月20日,星期三(七)交替标志的均值和方差

dichotomousqualitativevariable交替标志又叫是非变量或相对标志。设总体单位数为N,具有某种特征的单位数为N1,不具有该种特征的单位数为N0,若再假设具有某种特征的单位数占总单位数的比重为P(P=N1/N),则有:

N=N1+N0P=N1/N

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论