统计学第五章平均指标及标志变异指标ppt课件_第1页
统计学第五章平均指标及标志变异指标ppt课件_第2页
统计学第五章平均指标及标志变异指标ppt课件_第3页
统计学第五章平均指标及标志变异指标ppt课件_第4页
统计学第五章平均指标及标志变异指标ppt课件_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章平均指标和标志变异指标,第一节平均指标第二节标志变异指标,第一节平均指标,一、平均指标的概念和作用二、算术平均数三、调和平均数四、几何平均数五、众数六、中位数七、各种平均数之间的相互关系,(一)平均指标含义,一、平均指标的概念和作用,(二)平均指标的特点,概括地描述统计分布的一般水平或集中趋势的数值,用以反映总体在具体条件下的一般水平。,1、数量差异抽象化2、反映总体变量值的集中趋势一般水平,(三)平均指标的作用,1、反映总体各变量分布的集中趋势和一般水平。,2、便于比较同类现象在不同单位间的发展水平。,3、能够比较同类现象在不同时间的发展变化趋势或规律。,位置平均数根据标志值某一特点位置来确定的平均数。根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的。,(四)平均指标的分类,平均指标根据其具体的代表意义和计算方式不同,可分为:,数值平均数是以统计数列的所有各项数据来计算的平均数。其特点是统计数列中任何一项数据的变动,都会在一定程度上影响数值平均数的计算结果。,众数中位数,平均数,位置平均数,数值平均数,算术平均数调和平均数几何平均数,第三节平均指标,一、平均指标的概念和作用二、算术平均数三、调和平均数四、几何平均数五、众数六、中位数七、各种平均数之间的相互关系,二、算术平均数,(一)算术平均数的概念与用途(二)算术平均数的计算,算术平均数:全部变量值之和与变量值个数相除所得的商。通常也称为平均数(average)或均值(mean)。,算术平均数的概念与用途,STAT,83名女生的身高,变量一般水平、代表性数值,分布的集中趋势、中心数值,二、算术平均数,算术平均数的概念与用途算术平均数的计算,算术平均数的计算,算术平均数=,总体标志总量,总体单位总数,数据集,数据个数N,简单算术平均数,5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:,例,总体各单位的标志值没有经过任何分组,就用简单算数平均数求平均值,单项数列,组距数列,组距数列,但没有次数,只有频率,某年级83名女生身高资料,某年级83名女生身高资料,组距数列,次数f,频率f/f,变量x,加权算术平均数,权数与加权,权数与加权,权数与加权,权数与加权,算术平均数的计算取决于变量值和权数的共同作用:变量值决定平均数的范围;权数则决定平均数的位置,权数,(1)概念,对平均数的大小起着权衡轻重的作用。平均数总是趋向于出现次数最多的哪个标志值。,(2)权数的表现形式,绝对数形式相对数形式,权数在平均数中的权衡轻重的作用,是通过各组频率的大小体现出来的;频率越大,该标志值计入平均数的份额也越大,对平均数的影响就越大;反之,频率越小,该标志值计入平均数的份额就越小,对平均数的影响就越小.,(3)权数的作用,当各组的次数都相同时,各标志值对平均数的影响都相同时,那就无所谓权数的“权衡轻重”了,加权算术平均数就等于简单算术平均数。,(4)权数不起作用的场合,即当,时,,简单算术平均数实际上是加权算术平均数的特例。,根据单项数列计算加权算术平均数,计算公式:,应用条件:单项式分组,各组次数不同。,加权算术平均数的计算,例:,某车间20名工人加工某种零件资料:,根据组距数列计算加权算术平均数,应用条件:组距式分组,各组次数不同。,例:某车间200名工人日产量资料:,组距数列只有频率计算加权算术平均数,应用条件:组距数列中只有频率,没有次数,公式:,二、算术平均数,算术平均数的概念与用途算术平均数的计算算术平均数的数学性质,第三节平均指标,一、平均指标的概念和作用二、算术平均数三、调和平均数四、几何平均数五、众数六、中位数七、各种平均数之间的相互关系,调和平均数(),调和平均数又叫做倒数平均数,它是各个变量值倒数的算术平均数的倒数。,先计算各个变量值的倒数,,然后计算倒数的算术平均数的倒数,,即,,调和平均数是算术平均术的另外一种表现形式。在实际工作中,由于获取的数据不同,有时不能直接采用平均数的形式进行计算,这时就需要使用调和平均数的形式。,x、f为已知,若只知x和xf,而f未知,则不能使用加权算术平均方式,只能使用其变形即加权调和平均方式。,苹果单价购买量总金额品种(元)(公斤)(元)红富士236青香蕉1.859,例,调和平均数的应用,计算该企业该日全部工人的平均日产量。,即该企业该日全部工人的平均日产量为12.1375件。,某蔬菜批发市场三种蔬菜的日成交数据如下表,计算三种蔬菜该日的平均批发价格。,平均价格成交额成交量xff36900480000.769(元)如果已知的数据不是成交量而是成交额(如下表),根据上表计算平均批发价格时,无法直接采用加权算术平均法,而应用调和平均法,即:平均价格成交额成交量m(mx)36900480000.769(元),上例是根据绝对数计算的,与算术平均数一样,调和平均数也可以根据相对数或平均数来计算。(1)由相对数计算调和平均数例在下表中计算工作量计划完成程度:,平均完成计划()m(mx)(57+420+172)(60+400+150)106.4,(2)由平均数计算调和平均数例设某车间三个班组的工人劳动生产率如下表,计算该车间平均劳动生产率。,车间平均劳动生产率m(mx)(4000+2200+2400)(400+200+200)10.75(件工时),第三节平均指标,一、平均指标的概念和作用二、算术平均数三、调和平均数四、几何平均数五、众数六、中位数七、各种平均数之间的相互关系,几何平均数(geomean(geomatricmean)是N个变量值连乘积的N次方根G。,几何平均数也有简单几何平均数和加权几何平均数两种。,简单几何平均数,例:某企业生产某种产品需经过三个连续作业车间才能完成。,应用条件:资料未分组,计算公式:,加权几何平均数,计算公式:,例:将一笔钱存入银行,存期10年,以复利计息,10年的利率分配是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率,设为本金,应用条件:资料经过分组,平均年利率=8.77%,某系83名女生身高资料(按序排列),152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174,将变量值按顺序排列起来,当反映分布集中趋势的度量值仅仅由数列中某个位置的值来确定时,这个值就称为次序统计量,也可以称为位置平均数。位置平均数与数值平均数的基本区别在于其不需要依据每一个变量值来计算。,某系83名女生身高资料(按序排列),将变量值按顺序排列起来,当反映分布集中趋势的度量值仅仅由数列中某个位置的值来确定时,这个值就称为次序统计量,也可以称为位置平均数。位置平均数与数值平均数的基本区别在于其不需要依据每一个变量值来计算。,152154154155155156156156156157158158159159160160160160160160160160160160160160161161161161161161161162162162162162162162162163163163163164164164165165165165165165165165166166166166166167167167168168168168168168168169170170170170170171171172172172174,第三节平均指标,一、平均指标的概念和作用二、算术平均数三、调和平均数四、几何平均数五、众数六、中位数七、各种平均数之间的相互关系,众数,1、众数的含义:总体中出现次数最多、频率最高的标志值。,2、确定众数的方法:,(1)单项数列确定众数,(2)由组距数列确定众数,1、计算公式:,农户年人均收入众数计算表,众数的原理及应用,83名女生身高原始数据,83名女生身高组距数列,当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数。在数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)。,众数的原理及应用,1981,1980,1979,1978,1977,1976,1975,160,140,120,100,80,60,40,20,0,413名学生出生时间分布直方图,众数的原理及应用,没有突出地集中在某个年份,出现了两个明显的分布中心,413名学生身高分布条形图,413名学生身高分布100%叠加条形图,158cm以下没有男生,178cm以上没有女生,STAT,在研究身高时,男生与女生不能合成一个总体,而是应当作为两个总体分别进行统计。当数据分布呈现出双众数或多众数时,可以断定这些数据来源于不同的总体。,第三节平均指标,一、平均指标的概念和作用二、算术平均数三、调和平均数四、几何平均数五、众数六、中位数七、各种平均数之间的相互关系,中位数,1、中位数的含义将总体各单位按其标志值大小顺序排列起来居于中间位置的那个数就是中位数。,2、确定中位数的方法,(1)由未分组资料确定中位数,中位数的作用:,不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。,标志值的个数是奇数,【例】某售货小组5个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元,则,中位数的位次为:,即第3个单位的标志值就是中位数,标志值的个数是偶数,【例】若上述售货小组为6个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元、760元,则,中位数的位次为,中位数应为第3和第4个单位标志值的算术平均数,即,由单项数列确定中位数,中位数为第40名和41名日产量的平均值,【例】某企业某日工人的日产量资料如下:,中位数的位次:,计算该企业该日全部工人日产量的中位数。,由组距数列确定中位数,计算公式,中位数位次:(计算累计次数;确定中位数组(67),根据中位数计算公式计算中位数,【课练】某车间50名工人月产量的资料如下:,计算该车间工人月产量的中位数。,第三节平均指标,一、平均指标的概念和作用二、算术平均数三、调和平均数四、几何平均数五、众数六、中位数七、各种平均数之间的相互关系,常用的几种平均数,概念计算公式特点,优点:容易理解,便于计算灵敏度高稳定性好缺点:易受极值影响在偏斜分布和U形分布中,不具有代表性,1.算术平均数,一个变量的所有观察值相加,再除以观察值的个数,简单:,加权:,常用的几种平均数,优点:灵敏度高受极值影响小适宜于各比率之积为总比率的变量求平均缺点:有“0”或负值时不能计算偶数项数列只能用正根,2.几何平均数(),几个变量值连乘积的n次根,简单:,加权:,概念计算公式特点,3.中位数(Me),是一种位置平均数,数据按大小顺序排列,处于数据序列中间位置的数值就是中位数,上限公式:,下限公式:,优点:容易理解,不受极值影响适宜于开口组资料和些不能用数字测定的事物缺点:灵敏度和计算功能差间断数Me,常用的几种平均数,概念计算公式特点,常用的几种平均数,4.众数(Mo),是一种位置平均数,是一批数据中出现次数最多的那个数值.通常只用于定性数据或离散型的定量数据。,上限公式:,下限公式:,优点:容易理解,不受极值影响缺点:灵敏度和计算功能差稳定性差具有不唯一性,概念计算公式特点,1、算术平均数、几何平均数和调和平均数的关系,2、算术平均数、众数和中位数的关系,当总体分布呈对称状态时,三者合而为一。,对称分布,2、算术平均数、众数和中位数的关系,当总体分布呈右偏时,则,右偏分布,众数,中位数,均值,2、算术平均数、众数和中位数的关系,当总体分布呈左偏时,则,左偏分布,均值,中位数,众数,应用平均指标的原则,1必须是同质的量方可平均;,2总平均数与组平均数结合分析;,3集中趋势与离散趋势结合分析,第二节标志变动度,一、标志变动度的意义和作用二、全距三、四分位差四、平均差五、标准差六、离散系数,集中趋势弱、离散趋势强,集中趋势强、离散趋势弱,总体中各单位标志值差别大小的程度,又称离散程度或离中程度。,变异指标是用来刻画总体分布的离散程度或变异状况,变异指标越大,表明总体各单位标志值的变异程度越大,且衡量总体平均数的代表性越差;反之亦然.,变异指标的含义,标志变动度,2、反映社会经济活动的均衡性。,变异指标的作用,1、用于衡量平均指标的代表性。,3、研究总体标志值分布偏离正态的情况。,第四节标志变动度,一、标志变动度的意义和作用二、全距三、四分位差四、平均差五、标准差六、离散系数,全距也称极差,用R表示,全距(极差),全距,公式:R=最大值最小值,【例】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则,【例】某季度某工业公司18个工业企业产值计划完成情况如下:,优点:计算简便,易懂,缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差,往往应用于生产过程的质量控制中,第四节标志变动度,一、标志变动度的意义和作用二、全距三、四分位差四、平均差五、标准差六、离散系数,四分位差,用Q1代表第一个四分位数(下四分位数),Q3代表第三个四分位数(上四分位数),四分位数,通过三个点将全部数据分为四个部分,每部分包含25%的数据,处在分位点上的数值就是四分位数。很显然中间的四分位数就是中位数,因此通常所说的四分位数是指第一个四分位数(下四分位数)和第三个四分位数(上四分位数)。,也称内距或四分间距,它是上四分位数与下四分位数之差,用Q.D表示,四分位差,Q.D=Q3-Q1,根据未分组资料求Q.D.,根据分组资料求Q.D.,若单项数列,则Q1与Q3所在组的标志值就是Q1与Q3的数值;,若组距数列,确定了Q1与Q3所在组后,还要用以下公式求近似值:,四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中,数值越大,说明中间的数据越分散。四分位差不受极值的影响,主要用于测度顺序数据的离散程度。,第四节标志变动度,一、标志变动度的意义和作用二、全距三、四分位差四、平均差五、标准差六、离散系数,平均差(Avedev):平均离差,即各变量值与其算术平均数离差的算术平均数。,平均差考虑了每一个变量值的分布情况,较全距和四分位差为优,AD,x1x2x3x4x5x6x734445510,x1x2x3x4x5x6x73345677,1.43,41.43,【例】试计算工人日加工零件数的平均差,解:计算过程见表首先,算出平均数,解:计算过程见表然后再计算平均差,1.平均差以均值为中心,反映了每个数据与均值的平均离差程度,它能全面准确地反映一组数据的离散状况。,2.平均差越大,说明数据的离散程度越大;反之,则说明数据的离散程度越小。,3.为了避免离差之和等于0而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差,这给计算带来了不便。同时平均差在数学性质上也不是最优的,因而实际中应用较少。,第四节标志变动度,一、标志变动度的意义和作用二、全距三、四分位差四、平均差五、标准差六、离散系数,方差(variance):各变量值与其算术平均数离差平方的算术平均数。标准差(meansquaredeviationStandarddeviation):是方差的算术平方根。也称均方差、均方根差、离差均方根等。,Var2S2,MSDSTDEVS,方差及标准差的概念,方差及标准差的计算,简单式,加权式,总体方差及标准差,简单式,样本方差及标准差,方差及标准差的计算,一般的计算过程:列表,第一步计算均值,第二步计算离差,第三步离差平方,第四步乘以权数,简捷计算方法:不计算离差,某车间生产工人日产零件资料如下,试求该车间工人日产量标准差。,解(1),方差及标准差的作用,方差及标准差的作用,68.27%,95.45%,99.73%,对于接近正态分布的数据集,有如下的经验法则:约68%的数据与平均数的距离在1个标准差之内;约95%的数据与平均数的距离在2个标准差之内;几乎所有的数据与平均数的距离在3个标准差之内。,方差及标准差的作用,方差及标准差的作用,标准差可以用来度量相对位置和异常值的检测。,Z分数,标准化的数值,表明Xi距离其平均数的标准差个数。,某学生期末考试时,数学成绩为85分,据此计算的分数为0.5;英语成绩为70分,分数也是0.5。则说明该学生两科考试成绩的相对位置是相同的,即都高于平均成绩0.5个标准差。,一个数据集中某个或某几个数据反常地大或小,一般称其为极端值或异常值,应当进一步加以检查、鉴别。一般的建议是:凡分数小于-3或大于+3的数据均可以被认为是异常值。,国外一项研究表明,IQ值呈正态分布,其平均数为100

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论