版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学第三章变量分布特征的描述第1页,课件共118页,创作于2023年2月学习要求①理解变量分布三大特征即集中趋势、离中趋势和分布形状的的含义;②理解平均指标、离散指标和形状指标的意义与作用;③熟练掌握各种平均数的计算方法并加以正确的应用,科学理解加权平均数中权数的意义,正确认识算术平均数与调和平均数之间的应用关系,以及算术平均数、中位数和众数三者之间的数量关系;④熟练掌握各种离散指标的计算方法并加以正确的应用,尤其是要深刻理解方差、标准差和离散系数的内涵;⑤熟练掌握偏度系数和峰度系数的计算方法并加以正确的应用,尤其是要了解动差的含义。第2页,课件共118页,创作于2023年2月变量分布特征集中趋势
(位置)离中趋势
(分散程度)偏态和峰度(形状)第3页,课件共118页,创作于2023年2月数据分布的测度峰度偏态数据的特征和测度分布的形状集中趋势离散程度众数中位数变异系数方差和标准差四分位差极差位置平均数数值平均数算术平均数调和平均数几何平均数第4页,课件共118页,创作于2023年2月第一节集中趋势的描述集中趋势
亦称为趋中性,是指变量分布以某一数值为中心的倾向,一般用平均指标来表示。一、集中趋势与平均指标平均指标主要用来表明同质总体中某一标志值,在一定时间、地点条件下所达到的一般水平。其数值表现平均数。概念第5页,课件共118页,创作于2023年2月平均指标的种类从总体各单位变量值中抽象出具有一般水平的量,这个量是根据各个单位的具体标志值计算出来的,有算术平均数、调和平均数、几何平均数等形式。数值平均数1、反映时间不同,分为静态和动态平均数。2、取得集中趋势代表值方法的不同,可分为数值平均数和位置平均数。先将总体各单位的变量值按一定顺序排列,然后取某一位置的变量值来反映总体各单位的一般水平。位置平均数有众数、中位数、四分位数等形式。位置平均数第6页,课件共118页,创作于2023年2月
算术平均数
计算平均数调和平均数静态平均数几何平均数位置平均数众数平均指标中位数分位数发展水平平均数动态平均数发展速度平均数第7页,课件共118页,创作于2023年2月平均指标的作用(1)通过反映变量分布的一般水平,帮助人们对研究现象的一般数量特征有一个客观的认识。(2)利用平均指标可以对不同空间的发展水平进行比较。(3)利用平均指标可以对某一现象总体在不同时间上的发展水平进行比较,以说明这种现象发展变化的趋势或规律性。(4)利用平均指标可以分析现象之间的依存关系或进行数量上的推算。(5)平均指标还可以作为研究和评价事物的一种数量标准或参考。第8页,课件共118页,创作于2023年2月二、数值(计算)平均数数值平均数调和平均数算术平均数几何平均数第9页,课件共118页,创作于2023年2月(一)算术平均数算术平均数一般就称为平均数(mean)。其定义是:观察值的总和除以观察值个数的商。在实际工作中,由于所掌握的统计资料的不同,利用上述公式进行计算时,可分为简单算术平均数和加权算术平均数两种。简单算术平均数
(SimpleArithmeticMean)
加权算术平均数
(WeightedArithmeticMean)
第10页,课件共118页,创作于2023年2月1.简单算术平均数
简单算术平均数的公式根据未经分组整理的原始数据计算的均值。设一组数据为x1,x2,x3,…xn.则简单算术平均数的计算公式如下:第11页,课件共118页,创作于2023年2月例1:据南方人才服务中心调查,从事IT行业的从业人员年薪在40000-55000元之间,表中的数据是IT从业人员年薪的一个样本:24名IT从业人员年薪资料表491004860049950488004720049900513505460049300512005100049400514005180049600534004870050300490004980048900486505130051900计算IT从业人员的平均年薪第12页,课件共118页,创作于2023年2月2.加权算术平均数
根据分组整理的数据计算的算术平均数。
加权算术平均数的公式
f代表各组变量值出现的频数。第13页,课件共118页,创作于2023年2月设某厂职工按日产量分组后所得组距数列如下,据此求平均日产量。按日产量分组(千克)工人数f(人)60以下1060–701970–805080–903690–10027100–11014110以上8合计164例2组中值X(千克)Xf555506512357537508530609525651051470115920-13550第14页,课件共118页,创作于2023年2月(1)算术平均数的大小,不仅取决于研究对象的变量值(x),而且受各变量值重复出现的频数(f)或频率(f/∑f)大小的影响,频数或频率较大,该组数据的大小对算术平均数的影响就大,反之则小。(2)权数的表现形式问题注意点第15页,课件共118页,创作于2023年2月按日产量分组(千克)组中值X(千克)工人数f(人)ff/∑f60以下55100.063.360–7065190.127.870–8075500.3022.580–9085360.2218.790–10095270.1615.2100–110105140.099.45110以上11580.055.75合计-1641.0082.7例3:第16页,课件共118页,创作于2023年2月3.算术平均数的数学性质
(1)各变量值与其算术平均数的离差之和等于零.(2)各变量值与其算术平均数的离差平方和最小.
(3)两个独立的同性质变量代数和的平均数等于各变量平均数的代数和.(4)两个独立的同性质变量乘积的平均数等于各变量平均数的乘积.第17页,课件共118页,创作于2023年2月4.算术平均数的优缺点优点(1)可用于推算总体标志总量。(2)代表性强,在抽样中具有良好的稳定性和可靠性.(3)可以进行代数运算。
缺点(1)当总体中个别单位标志值特别大或特别小时,会导致算术平均数偏大或偏小。(2)当组距数列有开口组时,组中值有较大假定性。第18页,课件共118页,创作于2023年2月(二)调和平均数小学四年级的算术题:一辆小车以每小时80公里的速度从山下开到山顶,又以每小时100公里的速度沿原路返回到山下,问:该车的平均速度。80km/h100km/h链接例子:F1比赛时,A车手第一圈时速300公里,第二圈时速340公里,B车手第一圈时速320公里,第二圈时速318。请问:只赛两圈谁获胜?第19页,课件共118页,创作于2023年2月问题的解答:速度=距离/时间,故平均速度=总距离/总时间。推广:如果该车山下——山顶来回开,n次的速度分别为x1,x2,x3,…,xn,则平均速度就成为:第20页,课件共118页,创作于2023年2月这一计算方式被定义为“调和平均数”(H)。变量值倒数的算术平均数的倒数,故又称为倒数平均数第21页,课件共118页,创作于2023年2月1、简单调和平均数(1)作为算术平均的变形例1:三种不同等级的青菜,每公斤单价分别为2元、4元、5元。每种等级各买1元,则均价是多少?例2:某人在30元/股、50元/股、100元/股的三个不同价位各买进“贵州茅台”股票6000元,则所持该股票的均价是多少?定义:调和平均数是变量值倒数的算术平均数的倒数。又称倒数平均数。调和平均通常是作为算术平均数的变形来使用的。但一些特殊的领域,如综合评价,调和平均却是一种独立的统计平均数,有着特定的应用价值。第22页,课件共118页,创作于2023年2月例1等价于:三种等级的青菜单价分别为2元/公斤、4元/公斤、5元/公斤,分别购买0.5公斤、0.25公斤、0.2公斤,要求计算平均价格。等价的计算方式是:例2等价于:A股票30元/股时买了200股,50元/股时买了120股,100元/股时买了60股。要求计算股票均价。等价的计算方式是:第23页,课件共118页,创作于2023年2月(2)作为独立公式运用例1:计算1与2的调和平均。例2:编制价格总指数时,代表品1的价格指数是110%,代表品2的价格指数是105%,则可用两者的调和平均值作为这一小类的价格指数。例3:甲员工的“德”、“才”、“能”测量分值分别是90分、86分、84分;乙员工的“德”、“才”、“能”测量分值分别为84分、98分、78分。要求采用简单调和平均方法计算并比较甲、乙两人的综合素质。第24页,课件共118页,创作于2023年2月第25页,课件共118页,创作于2023年2月2、加权调和平均数例1:法拉利队的车王迈克尔·舒马赫在2004年9月初的一次试车中(F2004),以每小时320公里的速度开了52圈,以每小时345公里的速度开了35圈,而队友巴里切罗以每小时322公里的速度开了45圈,以每小时337公里的速度开了42圈,求两人各自的平均车速。例2:三种不同等级的青菜分别买5元、6元、10元,每公斤单价分别为2元、4元、5元,则平均价格是多少?第26页,课件共118页,创作于2023年2月(1)加权调和平均数的基本公式
(2)加权调和平均公式的应用
——作为算术平均的变形当mi=xifi
时,有:第27页,课件共118页,创作于2023年2月(3)加权调和平均公式应该注意的几个问题A.与加权算术平均公式类似,加权调和平均公式的权数也有两种类型:绝对权重与比重权重,相应就有两种不同形式的加权方式.调和平均数的权数不是“次数”而是各组的标志值。绝对权重比重权重第28页,课件共118页,创作于2023年2月B.计算加权调和平均值时,同样需要注意选择合适的x,以及合适的权重m.
应该以组平均作为x,若无,则用组中值近似代表。权重m应该是具有实际意义的“各组标志总量”。C.调和平均与算术平均的正确选择问题
作为算术平均数变形,调和平均数主要用于“平均数的平均”与“相对数的平均”计算之中。如果掌握了变量值,以及该变量的分子资料时,需要通过基本数量关系推导出分母数值,此时即为“加权调和平均”。第29页,课件共118页,创作于2023年2月甲乙两农贸市场三种农产品的价格和成交量和成交额如下:产品价格甲市场成交额乙市场成交量(元/斤)(万元)(万斤)A1.21.22B1.42.81C1.51.51分别求两个市场农产品的平均价格。第30页,课件共118页,创作于2023年2月这是以分母为权重的加权算术平均数这是以分子为权重的加权调和平均数第31页,课件共118页,创作于2023年2月D.简单调和平均与加权调和平均的关系m1=m2=m3=…=mn=m第32页,课件共118页,创作于2023年2月调和平均数易受极端值的影响,且受极小值的影响比受极大值的影响更大。只要有一个变量值为零,就不能计算调和平均数。当组距数列有开口组时,其组中值即使按相邻组距计算了,假定性也很大,这时,调和平均数的代表性就很不可靠。调和平均数应用的范围较小。
E.调和平均的特点第33页,课件共118页,创作于2023年2月
某鱼摊有两种鲫鱼:大的每公斤18元,小的每公斤12元,并不能还价。一顾客欲各买一条,但提出两条一起称,每公斤15元,鱼摊主答应。问谁占便宜?思考题:第34页,课件共118页,创作于2023年2月3.由相对数或平均数计算平均数(1)由相对数计算平均数例1:设有某行业150个企业的有关产值和利润资料如表所示,计算该行业一、二季度的平均产值利润率。产值利润率(%)一季度二季度企业数(个)实际产值(万元)企业数(个)实际利润(万元)5-103057005071010-20702050080351420-305022500202250合计150487001506474第35页,课件共118页,创作于2023年2月计算第一季度的平均产值利润率,应该采用实际产值加权,进行算术平均,即有:计算第二季度的平均产值利润率,则应该采用实际利润加权,即有:第36页,课件共118页,创作于2023年2月产值计划完成程度%)组中值(%)X企业数(个)实际产值(万元)M计划产值(万元)M/X80~9085268080090~10095323752500100~110105101806017200110~120115350604400合计-182617524900例2:计算下表企业的平均计划完成程度第37页,课件共118页,创作于2023年2月(2)由平均数计算平均数例3:某车间各班组工人的平均劳动生产率和实际工时数据如表所示,要求计算车间平均劳动生产率班组平均劳动生产率(件/工时)实际工时(小时)123412162028200320300190合计1000我们掌握的资料是平均数的母项数值即实际工时数,因而应该以实际工时数为权数,采用加权算术平均数的形式来计算平均劳动生产率。第38页,课件共118页,创作于2023年2月平均劳动生产率(件/工时)实际工时实际产品总量(件)班组1234121620282003203001902400512060005320合计101018840车间平均劳动生产率(件/工时)==第39页,课件共118页,创作于2023年2月(三)几何平均数(GeometricMean)几何平均数也称几何均值,它是n个变量值乘积的n次方根。适用对象:现象的总比率是若干项变量的乘积,或现象的总发展速度是各时期发展速度的连乘积时,计算平均比率或平均发展速度。1.简单几何平均数
(SimpleGeometricMean)
直接将n项变量连乘,对其连乘积开n次方根所得的平均数即为简单几何平均数。计算公式为:第40页,课件共118页,创作于2023年2月例1:某企业的一条生产流水线有四道工序,每一道工序完成的产品都要作一次质量检查,只有合格的中间件才进入下一道工序。工序C工序A工序B工序D合格率98%合格率97%合格率94%合格率95%请问:平均合格率=?第41页,课件共118页,创作于2023年2月所谓平均“合格率”,是指每一道工序合格率是相同的。这也就是说,如果记“平均合格率为G,则只有”四道工序全部合格的产品才是合格的,因而,有以下等式:第42页,课件共118页,创作于2023年2月例2:据网上报到,成都温江的兰花节(2006年2月27日,温江第三届兰花节)上,一盆兰花卖价是1100万元,这背后是迅速壮大的10万户成都养兰、炒兰户。他们当中,不少人是在借高利贷炒兰,图谋暴利。专家称,成都兰市价格已涨到了疯狂的境地,投资兰花不能盲目跟风,“击鼓传花”式的投机最终会让人血本无归。红荷黄金海岸龙女彩蝶第43页,课件共118页,创作于2023年2月设某炒兰投资者从朋友处借得一笔高利贷,以季度为结算单位,每个季度生成的利息到期自动转为本金,一年连本带利付清。各季利率根据兰花价格变化适当调整。实际一年下来,第一季度的利率是3%,第二季度的利率是3.2%,第三季度的利率是3.6%,第四季度的利率是2.8%。问:平均利率是多少?解答:即若借款总额为L万元,则一年之后的付款额(本息和)为:如果平均利率为G,则应该有:第44页,课件共118页,创作于2023年2月2.加权几何平均数
(WeightedGeometricMean)
与算术平均数一样,当资料中的某些变量值重复出现时,相应地,简单几何平均数就变成了加权几何平均数。计算公式为:第45页,课件共118页,创作于2023年2月
例3:投资银行某笔投资的年利率是按复利计算的,25年的年利率分配是:有1年为3%,有4年为5%,有8年为8%,有10年为10%,有2年为15%,求平均年利率。本利率(%)X年数f本利率的对数lgXf·lgX10312.01282.012810542.02128.084810882.033416.2672110102.041420.414011522.06074.1214合计25-50.9002第46页,课件共118页,创作于2023年2月
25年的平均本利率为108.6%,年平均利率即为8.6%。例4:设某生产流水线由12道工序组成,据统计,有3道工序的不合格率为2%,有4道工序的不合格率为4%,有5道工序的不合格率为5%,求平均不合格率第47页,课件共118页,创作于2023年2月几何平均数特点(1)受极端值的影响较算术平均数小。(2)如果变量值有负值,计算出的几何平均数就会成为负数或虚数。(3)仅适用于具有等比或近似等比关系的数据。(4)其对数是各变量值对数的算术平均数。第48页,课件共118页,创作于2023年2月(四)几何平均数、算术平均数和调和平均数的关系幂平均函数第49页,课件共118页,创作于2023年2月某公司所属三个企业有关生产资料如下:(1)若三个企业生产同一种产品,试计算平均合格率(2)若三个企业生产不同一种产品,试计算平均合格率(3)若三个企业为流水作业生产同一种产品,试计算平均合格率企业合格率(%)产品产量(件)实际消耗工时(工时)甲96100500乙95200450丙98300400思考题:第50页,课件共118页,创作于2023年2月三、位置平均数
位置平均数,就是根据总体中处于特殊位置上的个别单位或部分单位的标志值来确定的代表值,它对于整个总体来说,具有非常直观的代表性,因此,常用来反映分布的集中趋势。常用的众数、中位数。第51页,课件共118页,创作于2023年2月(一)中位数与分位数1.中位数(Median)的含义中位数是将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据就是中位数。中位数用Me表示。Me50%50%在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。第52页,课件共118页,创作于2023年2月2.中位数的计算确定中位数,必须将总体各单位的标志值按大小顺序排列,最好是编制出变量数列。这里有两种情况:A.对于未分组的原始资料,首先必须将标志值按大小排序。设排序的结果为:第53页,课件共118页,创作于2023年2月491004860049950488004720049900513505460049300512005100049400514005180049600534004870050300490004980048900486505130051900例1:24名IT从业人员年薪资料表如下所示,计算该24名IT人员的中位数排序得:中位数的位置在(24+1)/2=12.5,中位数在第12个数值(49800)和第13个数值(49900)之间,即
Me=(49800+49900)/2=49850(元)。第54页,课件共118页,创作于2023年2月B.由分组资料确定中位数(1)由单项数列确定中位数,直接按的公式求出中位数所在组的位置,计算累计次数确定中位数所在的组,组值即是中位数。第55页,课件共118页,创作于2023年2月例2:某车间50名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112第56页,课件共118页,创作于2023年2月第57页,课件共118页,创作于2023年2月(2)由组距数列确定中位数,应先按的公式求出中位数所在组的位置,然后再按下限公式或上限公式确定中位数。Sm-1-中位数所在组以下的累计次数。Sm-1-中位数所在组以上的累计次数。第58页,课件共118页,创作于2023年2月LU第59页,课件共118页,创作于2023年2月
例3:某企业50名工人加工零件中位数计算表,计算50名工人日加工零件数的中位数按零件数分组(个)频数(人)向上累计(人)向下累计(人)105~1103350110~1155847115~12081642120~125143034125~1301040201301404504Sm-1Sm+1第60页,课件共118页,创作于2023年2月中位数特点(1)中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。(2)有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。(3)缺乏敏感性。
第61页,课件共118页,创作于2023年2月2.分位数分位数是将变量的数值按大小顺序排列并等分为若干部分后,处于等分点位置的数值。常用的分位数有四分位数、十分位数和百分位数根据中位数的原理,你能写出四分位数的公式吗?第62页,课件共118页,创作于2023年2月第63页,课件共118页,创作于2023年2月(二)众数(Mode)1.众数的含义众数是指总体中出现次数最多的那个标志值。用Mo表示。它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。众数也不受数列中极端变量值的影响,它可反映总体各单位某一标志值的集中趋势。第64页,课件共118页,创作于2023年2月2.众数的计算(众数的不唯一性)无众数
原始数据:
10591268一个众数
原始数据:
659855多于一个众数
原始数据:
252828
364242第65页,课件共118页,创作于2023年2月(1)数值型分组数据的众数A.众数的值与相邻两组频数的分布有关D.该公式假定众数组的频数在众数组内均匀分布B.相邻两组的频数相等时,众数组的组中值即为众数MoC.相邻两组的频数不相等时,众数采用下列近似公式计算MoMoMoMo第66页,课件共118页,创作于2023年2月UdLab第67页,课件共118页,创作于2023年2月某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—例:根据表中的数据,计算50名工人日加工零件数的众数第68页,课件共118页,创作于2023年2月(2)组距数列确定众数的方法下限公式上限公式第69页,课件共118页,创作于2023年2月众数特点1.众数不受分布数列的极大或极小值的影响.2.当分组数列没有任何一组的次数占多数,而是近似于均匀分布时,则该次数分配数列无众数。若将无众数的分布数列重新分组或各组频数依序合并,又会使分配数列再现出明显的集中趋势。第70页,课件共118页,创作于2023年2月3.如果与众数组相比邻的上下两组的次数相等,则众数组的组中值就是众数值;如果与众数组比邻的上一组的次数较多,而下一组的次数较少,则众数在众数组内会偏向该组下限;如果与众数组比邻的上一组的次数较少,而下一组的次数较多,则众数在众数组内会偏向该组上限。4.缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不象数值平均数那样利用了全部数据信息。第71页,课件共118页,创作于2023年2月(三)中位数、众数和算术平均数的关系在对称分布(即正态)时在右偏时在左偏时适度偏态时众数与算术平均数的距离约为中位数与算术平均数距离的3倍第72页,课件共118页,创作于2023年2月对称分布右偏分布左偏分布第73页,课件共118页,创作于2023年2月一组工人的月收入众数为700元,月收入的算术平均数为1000元,则月收入的中位数近似值是:例:第74页,课件共118页,创作于2023年2月第二节离中趋势的描述一、离中趋势和离散指标
离中趋势,就是变量分布中各变量值背离中心值的倾向。如果说集中趋势是总体或变量分布同质性的体现,那么离中趋势就是总体或变量分布变异性的体现。离散指标就是反映变量值变动范围和差异程度的指标,即反映变量分布中各变量值远离中心值或代表值程度的指标,亦称为变异指标或标志变动度指标。
第75页,课件共118页,创作于2023年2月离散指标是衡量平均指标代表性的尺度。一般来讲,数据分布越分散,变异指标越大,平均指标的代表性越小;数据分布越集中,变异指标越小,平均指标的代表性越大。常用的变异指标有:全距、平均差、方差和标准差、变异系数。
第76页,课件共118页,创作于2023年2月离散指标的作用
用离散指标衡量和比较平均指标的代表性。用离散指标反映经济活动过程的均衡性、稳定性和节奏性。离散指标为统计推断提供依据。第77页,课件共118页,创作于2023年2月接吻定律
第一次接吻以后,女人会把这个吻当作一笔放出去的投资,男人却会把它当做一笔收回来的贷款。乐观与悲观定律
乐观者发明了游艇,悲观者发明了救生圈;乐观者建造了高楼,悲观者生产了救火栓;乐观者都去做了玩命的赛车手,悲观者却穿起了白大褂当了医生;最后乐观者发射了宇宙飞船,悲观者则开办了保险公司。人力定律
一个人在一分钟内可以挖一个洞,六十个人在一秒钟内就办不到。做饭定律
因为怕做饭,男人下了班也不忙着回家;因为要做饭,女人没下班就忙着溜回家。第78页,课件共118页,创作于2023年2月二、离散指标的测度(一)全距(Range)全距(R)也称为极差,是指总体各单位的两个极端标志值之差,即:R=最大标志值-最小标志值
特点(优点与缺点)(1)简明;(2)只反映变异范围;(3)只受两个数值影响;最容易受极端值影响。没有反映中间数值的影响,没有反映分布情况。第79页,课件共118页,创作于2023年2月例1:有两个学习小组的统计学开始成绩分别为:第一组:60,70,80,90,100第二组:78,79,80,81,82很明显,两个小组的考试成绩平均分都是80分,但是哪一组的分数比较集中呢?如果用全距指标来衡量,则有R甲=100-60=40(分)R乙=82-78=4(分)这说明第一组资料的标志变动度或离中趋势远大于第二组资料的标志变动度。第80页,课件共118页,创作于2023年2月(二)四分位差四分位差是四分位数中第一个四分位数与第三个四分位数之差,也称为内距或四分间距,通常用表示,即:第81页,课件共118页,创作于2023年2月(三)异众比率异众比率是分布数列中非众数组的频数与总频数之比,通常用来表示,即:
第82页,课件共118页,创作于2023年2月在资料未分组的情况下,平均差的计算公式为:
在资料已分组的情况下,要用加权平均差公式:
第83页,课件共118页,创作于2023年2月例2:某厂按月收入水平分组的组距数列如表所示,计算平均差
例1:以甲组学生数学成绩为例,平均差如下:A.D=职工工资(元)职工人数(f)250-27015270-29025290-31035310-33065330-35040合计180组中值(x)xfx-2603900-507502807000-3075030010500-10350320208001065034013600301200-55800-3700第84页,课件共118页,创作于2023年2月解:根据公式列表计算,得到A.D=
由于平均差采用了离差的绝对值,不便于运算,这样使其应用受到了很大限制。第85页,课件共118页,创作于2023年2月(四)平均差(MeanDeviation)
平均差是总体各单位标志值对其算术平均数的离差绝对值的算术平均数。特点(1)反映了全部标志值的变动情况;(2)受平均数水平高低、计量单位(不同性质的现象)影响;(3)取绝对值的方法消除离差正负号,不便于代数处理。第86页,课件共118页,创作于2023年2月(五)方差(Variance)、
标准差(StandardDeviation)
方差和标准差是测度数据变异程度的最重要、最常用的指标。方差是各个数据与其算术平均数的离差平方的平均数,通常以σ2表示。标准差又称均方差,一般用σ表示。方差和标准差的计算也分为简单平均法和加权平均法,另外,对于总体数据和样本数据,公式略有不同。第87页,课件共118页,创作于2023年2月1.总体方差和标准差
设总体方差为,对于未经分组整理的原始数据,方差的计算公式为:对于分过组的数据,方差的计算公式为:第88页,课件共118页,创作于2023年2月方差的平方根即为标准差,其相应的计算公式为:未分组数据:分组数据:
第89页,课件共118页,创作于2023年2月2.样本方差和标准差样本方差与总体方差在计算上的区别是:总体方差是用数据个数或总频数去除离差平方和,而样本方差则是用样本数据个数或总频数减1去除离差平方和,其中样本数据个数减1即n-1称为自由度。第90页,课件共118页,创作于2023年2月设样本方差为,根据未分组数据和分组数据计算样本方差的公式分别为:未分组数据:分组数据:
第91页,课件共118页,创作于2023年2月根据未分组数据和分组数据计算样本标准差的公式分别为:未分组数据:分组数据:
第92页,课件共118页,创作于2023年2月例1:考察一台机器的生产能力,利用抽样程序来检验生产出来的产品质量,假设搜集的数据如下:根据该行业通用法则:如果一个样本中的14个数据项的方差大于0.005,则该机器必须关闭待修。问此时的机器是否必须关闭?第93页,课件共118页,创作于2023年2月解:根据已知数据,计算因此,该机器工作正常。第94页,课件共118页,创作于2023年2月例2:以下是江苏省和浙江省2005年年营业收入最大的前15个企业,试用标准差来比较两省企业收入的稳定程度.江苏前15名营业收入(万元)浙江前15名营业收入(万元)江苏沙钢集团有限公司3112365浙江物产集团3476937熊猫电子集团2804390浙江省兴合集团2261710南京钢铁集团2788062浙江冶金集团2159445江苏华西集团公司2603864广厦控股创业投资有限公司2137266苏宁电器集团2246465万向集团2092908太平洋建设集团2122634浙江省能源集团有限公司1838372南京斯威特集团有限公司1960673横店集团1429810春兰集团1706942雅戈尔集团1397123徐州工程机械集团有限公司1700551浙江省建设投资集团1383451华芳集团有限公司1691373正泰集团1196121江苏悦达集团1538658宁波电子信息集团1194889江苏国泰国际集团有限公司1206262杭州娃哈哈集团1144323江苏永钢集团有限公司1166189德力西集团1076741江苏交通控股有限公司1118380奥克斯集团1034198跃进汽车集团1113675华立集团1033388第95页,课件共118页,创作于2023年2月江苏省:
=1925365.533(万元)
=667382.6891(万元)浙江省=1657112.133(万元)
=675072.0375(万元)从标准差看江苏企业比浙江省企业的营业收入稳定第96页,课件共118页,创作于2023年2月营业收入(亿元)企业个数(江苏)(浙江)10-20487520-30262430-4040-5050-6060-7070-8080-9090-100100以上15166878988163111810合计144154例3:以下是江苏省和浙江省2005年年营业收入超过10亿元企业,试用标准差来比较两省营业收入超过10亿元企业收入的稳定程度.第97页,课件共118页,创作于2023年2月江苏:先计算平均数:=43.26(亿元)
标准差
=31.52(亿元)浙江:=32.98(亿元)=26.07(亿元)第98页,课件共118页,创作于2023年2月在实际计算方差时,可以采用另一种较为简便的方法:方差和标准差也是根据全部数据计算的,它反映了每个数据与其均值相比平均相差的数值,因此它能准确地反映出数据的离散程度。第99页,课件共118页,创作于2023年2月σ与R的关系σ与A.D.的关系经验表明,当分布数列接近于正态分布时,R和σ之间存在以下经验公式:R为4至6个σ:当标志值项数较少时,R≈4σ
当标志值项数较多时,R≈6σ对同一资料,所求的平均差一般比标准差要小,即A.D.≤σ3.标准差与全距、平均差的关系第100页,课件共118页,创作于2023年2月(六)离散系数(CoefficientofVariation)上面介绍的各离散程度测度值都是反映数据分散程度的绝对值,其数值的大小依赖于两方面:1.原变量值本身水平高低的影响。2.它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。第101页,课件共118页,创作于2023年2月对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。离散系数也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。第102页,课件共118页,创作于2023年2月其计算公式为:Vσ和Vs分别表示总体离散系数和样本离散系数。离散系数要是用于对不同组别数据的离散程度进行比较,离散系数大的说明该组数据的离散程度也就大,离散系数小的说明该组数据的离散程度也就小。第103页,课件共118页,创作于2023年2月例1:甲乙两个城市的居民年收入情况表中前三栏的数据来看,乙城市不仅人均年收入两倍于甲城市,而且收入的差距也似乎显著于甲城市.但通过计算标准差系数可以看出:乙城市的实际收入差距相对于它的平均收入来说,比甲城市要低的多.或者说,以居民对收入收入差距所承受的压力而言,甲城市要比乙城市高得多.人均年收入收入标准差标准差系数甲城市60001502.5乙城市120001801.5第104页,课件共118页,创作于2023年2月例2:江苏企业江苏企业的经营收入比浙江企业稳定浙江企业例3:火箭队每场比赛失误的均值是5.6分,全赛季失误的标准差是10分,马刺队每场比赛失误的均值是4.2分,全赛季失误的标准差是10分.你认为以下哪一种叙述是正确的()火箭队比马刺队打球水平差火箭队比马刺队在失误上比较稳定马刺队比火箭队在失误上比较稳定马刺队很少不失误第105页,课件共118页,创作于2023年2月(七)是非标志的平均数和标准差
是非标志,又称交替标志,它是用“是”
“否”或“有”“无”来表示的。由于是非标志
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗园区顶管施工服务合同
- 渔市场防火门施工合同
- 农村建筑维修规划设计合同
- 跨国公司外派员工聘用合同范例
- 高空作业供应租赁合同
- 艺术品交易市场合同
- 体育馆活动空调租赁协议
- 民航空运代理合同范例
- 音响销售合同范例
- 纺织原料销售合同三篇
- 治疗皮肤病药膏市场需求与消费特点分析
- 医院电梯维保服务方案及应急措施
- 设备安装应急应对预案
- 企业合规风险控制手册
- 2023-2024学年人教版选择性必修2 1-1 种群的数量特征 教案
- 7.2+做全球发展的贡献者+课件-高中政治统编版选择性必修一当代国际政治与经济
- 2024年大学试题(艺术学)-艺术导论考试近5年真题集锦(频考类试题)带答案
- 基于区块链的碳交易研究
- 铁路交通安全主题班会课件
- 做账实操-冷库企业的账务处理实例
- 2024年专技人员公需科目考试答
评论
0/150
提交评论