第三章平均数标准差和变异系数课件_第1页
第三章平均数标准差和变异系数课件_第2页
第三章平均数标准差和变异系数课件_第3页
第三章平均数标准差和变异系数课件_第4页
第三章平均数标准差和变异系数课件_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有:1.算术平均数2.中位数(M)4.几何平均数(Mg)3.众数(Mo)5.调和平均数(H)3.1平均数:第三章平均数、标准差与变异系数在数理统计中,平均数是用来反映一组变数的集中趋势,即1

作为一个资料的代表,指资料中各变数集中较多的中心位置,用来与另一资料相比较。不同的平均数适合于不同的数据资料。例如:不同国家、地区、种族之间身高、体重等的比较;不同品种的家畜、家禽之间生产性能的比较集中趋势的度量平均数的意义作为一个资料的代表,指资料中各变数集中例如:不同国家23.1.1算术平均数一、定义

一组资料中,所有观测值的总和除以其个数所得到的商,称为算术平均数,简称平均数或均数。

是最常用的一种集中趋势度量指标。

样本的平均数记为

总体平均数记为

集中趋势的度量3.1.1算术平均数一、定义集中趋势的度量3:第i个观察值或变数n:观察值或变数的个数∑:求和符号(sigma)计算公式:集中趋势的度量3.5.1算术平均数:第i个观察值或变数计算公式:集中趋势的度量3.5.4Σ的性质Σ的性质5例2.1:5头猪的体重分别为70、72、80、83、88kg,问5头猪的算术平均数是多少?

从计算结果看5头猪都距78.6(kg)不远,所以平均数是数量资料的代表值。

上述计算方法称为直接法,适用于样本小,即资料内包含变数个数不多,一般在30个变数以下未经分组的资料。集中趋势的度量一、直接法例2.1:5头猪的体重分别为70、72、80、83、61.分类资料:每个类别在某个指标上取相同的值。2.计数资料和连续性资料:频率分布表

加权法,即计算时先将各个变数乘上它的权数,再经过总和,然后除以权数的总合,称为加权平均数。集中趋势的度量二、加权法1.分类资料:每个类别在某个指标上取相同的值。加7

xi=变数值

fi=变数值xi出现的频数计算公式:集中趋势的度量二、加权法xi=变数值计算公式:集中趋势的度量二、加权法8例:一个有1000个个体的群体,等位基因A的频率为0.6,另一个400个个体的群体,等位基因A的频率为0.3,这两个群体的混合在一起,整个混合群体的等位基因A的频率为:集中趋势的度量二、加权法例:一个有1000个个体的群体,等位基因A的集中趋9例:200头大白猪的仔猪的一月窝重的资料组别组中值频数(f)fx8-16-24-32-40-48-56-64-72-80-88-96-104-112-122028364452606876849210010811646910131726352821168434812025236057288415602380212817641472800432348总合20013120集中趋势的度量二、加权法例:200头大白猪的仔猪的一月窝重的资料组别组中值频数(f)10xi=组中值fi=组中值出现的频数集中趋势的度量二、加权法xi=组中值集中趋势的度量二、加权法11(一)离均差之和为零:一个样本观察值与平均数之差简称离均差。∑(xi-)=(x1-)+(x2-)+……+(xn-)=x1+x2+……+xn+n•=∑xi-n‧∑xi/n=0三、算术平均数的性质集中趋势的度量(一)离均差之和为零:∑(xi-)三、算术平均数的性12(二)离均差平方和最小:一个样本的各个观察值与平均数之差的平方和比各个观察值与任意其他数之差的平方和小。所以:平均数是与各个观察值最接近的数值。所以:平均数代表这个样本的集中趋势。集中趋势的度量三、算术平均数的性质(二)离均差平方和最小:所以:平均数是与各个观察值最接近的数13定义:将n个观察值从小到大依次排队,位于中间的那个观察值称为中位数。3.1.2中位数(Md)集中趋势的度量定义:将n个观察值从小到大依次排队,位于中间的那个观察值称为14例:2.5现有一窝仔猪的出生重资料为:1.4,1.0,1.3,1.2,1.6kg,试求其中位数。解:首先排序:1.0,1.2,1.3,1.4,1.6;

(n+1)/2=(5+1)/2=3;Md=X3=1.3如果增加一头仔猪,出生重为1.8kg,计算中位数:n/2=6/2=3(n/2)+1=3+1=4;Md=(X3+X4)/2=(1.3+1.4)/2=1.35集中趋势的度量3.1.2中位数(Md)例:2.5现有一窝仔猪的出生重资料为:1.4,1.0,1.15对于频数分布的资料,公式如下:Lmd:中位数所在组的组下限;fm:中位数所在组的频数;C:从第一组到中位数所在组前一组的累计频数n:样本含量;

i:组距;例:表2-5集中趋势的度量3.1.2中位数(Md)对于频数分布的资料,公式如下:L16集中趋势的度量3.1.2中位数(Md)集中趋势的度量3.1.2中位数(Md)17定义:n个非负数的乘积开n次方的根称为几何平均数,用G表示。3.1.3几何平均数集中趋势的度量定义:n个非负数的乘积开n次方的根称为几何平均3.1.3几18为了计算方便,各变数先取对数,再相加除以n,即为logG,再求其反对数,即为G值。集中趋势的度量3.1.3几何平均数几何平均数用于以百分率、比例表示的数据资料,如:增长率、利率、药物效价、抗体滴度等。能够消弱数据中个别过分偏大值的影响。为了计算方便,各变数先取对数,再相加除以n,即为lo19例:某奶牛场在1995年有100头奶牛,已知在1996、1997、1998年的奶牛头数分别为前一年的2,3和4.5倍,求其年平均增加率。◈1998年的奶牛头数为:100×2×3×4.5=2700头或者100×33=2700头集中趋势的度量3.1.3几何平均数例:某奶牛场在1995年有100头奶牛,已知在1996、1920定义:在资料中某一个变数出现次数最多,就称之为众数。1.离散性资料:出现频数最多的数。2.连续性资料:频数分布表中,频数出现最多的一组的组中值。!!有的资料可出现多个众数,即多个数具有相同的最高频数;有的资料没有众数,即所有数出现的频数都相同。集中趋势的度量3.1.4众数定义:在资料中某一个变数出现次数最多,就称!!有的资料可出现21定义:各观察值倒数的算术平均数的倒数3.1.5调和平均数简单调和平均数集中趋势的度量适用于极端右偏态定义:各观察值倒数的算术平均数的倒数3.1.5调和平均数简223.1.5调和平均数集中趋势的度量例:用某药物救治12只中毒的小鼠,它们的存活天数记录如下:8、8、8、10、10、7、13、10、9、14,另有两只一直未死亡,求平均存活天数。由于数据极端右偏态,用调和平均数较为合理。3.1.5调和平均数集中趋势的度量例:用某药物救治12只中23复习连续性资料分组方法集中趋势(平均数)有哪几种表示方式?算术平均数的性质复习连续性资料分组方法242.2.3百分位数(百分位点)指将一组n个数据由小到大排列,如果小于某数值的数据个数为全体数据个数的x%,则称该数为第x百分位数或x%分位数。

25%分位数或下四分位数:0.25n个数的后一个数。

50%分位数或中位数:0.5n个数的后一个数。

75%分位数或上四分位数:0.75n个数的后一个数。1252.2.3百分位数(百分位点)指将一组一、各个集中趋势度量指标之间的关系1.在完全对称分布情况下,算数平均数、中位数和众数三者相等。集中趋势的度量一、各个集中趋势度量指标之间的关系1.在完全对称分布情况下,26

适用于正态分布资料。家畜的大多数数量性状都是正态分布,因此算术平均数是最常用的,也是最重要的。集中趋势的度量2、算术平均数但是当分布不对称时,呈偏态时,用算术平均数则难以表示资料的集中趋势。适用于正态分布资料。集中趋势的度量2、算术平均数27适用于非参数检验,如卡方检验。4、几何平均数和调和平均数适用于右偏态分布。偏态:是指大部分数值落在平均数的哪一边,若分配较多的集中在低数值的方面视为正偏态,或称为右偏态集中趋势的度量3、中位数适用于非参数检验,如卡方检验。4、几何平均数和调和平28平均数的代表程度与样本的变异程度有关一个样本内有很多的变数,用平均数作为样本的代表,其代表程度决定于样本内各个变数的变异程度。3.2标准差离散趋势的度量平均数的代表程度与样本的变异程度有关3.2标准差离散趋势的度29即使两个样本的平均数相同,但是样本内变数的变异程度不一定相同。产仔数总和甲8,4,16,12,22,17,6,14,6,511011乙14,8,11,9,11,12,10,14,13,811011离散趋势的度量3.2标准差即使两个样本的平均数相同,但是样本内变数的变异30甲的变异程度大于乙甲的平均数的代表性小于乙的平均数所以,应该测定其变异程度离散趋势的度量◈甲、乙两品种的平均产仔数相同,都是11头。

从平均数来看,两个品种没有差异。从以上统计结果可知:◈进一步观察各个变数,二者变异程度并不相同。

甲:最小为4,最大为22;乙:最小为8,最大为14甲的变异程度大于乙离散趋势的度量◈甲、乙两品种的平均产仔数311.如果各个变数相同或者变异程度比较小,则平均数能够代表整个样本。2.如果各个变数的变异程度比较大,则平均数的代表性就小。离散趋势的度量

因此,单靠平均数不能全面、正确地了解样本。也不能了解平均数作为样本的变异程度。3.2标准差1.如果各个变数相同或者变异程度比较小,则平离散趋势的32定义:全部变数的最大值与最小值之差

R=Max(x)-Min(x)3.2范围(全距)范围或全距可以反映变异程度的一部分,但是不能代表样本内各变数之间的变异程度。

目前,被广泛使用的是以标准差来度量变异程度。离散趋势的度量定义:全部变数的最大值与最小值之差3.2范围(全距)33如果一个样本有n个观察值x1,x2……

xn,设其算术平均数为,则该样本的标准差为:标准差考虑了每个变数与平均数的离差。每个变数与平均数相差愈小,样本变异程度愈小,反之,愈大。因此,标准差是离散程度的度量3.2.1标准差的定义离散趋势的度量如果一个样本有n个观察值x1,x2……xn,设341.离均差=(x-)2.离均差之和=∑(x-)=03.离均差平方和SS=∑(x-)2为了合理地计算平均差异,用平方和的办法来消除离均差的正负号,离均差平方相加,得到平方和(SS),但是由于不同样本的观察值个数不同,所以离均差平方和也不是理想指标离散趋势的度量虽然离均差可以衡量变异程度,但是离均差之和为0,所以不是理想的指标3.2.2标准差公式的来源1.离均差=(x-)为了合理地计算平均差异,用平方和的353.2.3样本方差和样本标准差将离均差平方和求平均数,称为样本方差,目的是消除观察值个数的影响样本方差开方,目的是使变异还原,即标准差。离散趋势的度量3.2.3样本方差和样本标准差将离均差平方和求平均数,称为36总体是未知的,用样本标准差估计和推断总体标准差离散趋势的度量3.2.4总体方差和样本标准差总体是未知的,用样本标准差估计和推断总体标准差离散趋势的度量37如果一个样本含有n个变数,从理论上讲,n个变数都同样用以计算标准差,n个变数与平均数相减有n个离均差。表面上虽有n个比较,但实质上仅有n-1个可以自由变动,最后一个离均差受到离均差之和这个条件的限制,所以不能自由。3.2.5自由度:

df,n-1如果一个样本含有n个变数,从理论上讲,n个变数都同样38例如:有3个变数,平均数等于5。问着三个变数可能是多少?离散趋势的度量3.2.5自由度:(4、5、6)(2、4、9)(3、5、7)……他们的共同特点:前两个数可以自由选择,为了使平均数等于5,第三个数不用选就确定了。这时(3-1)=2就是所谓自由度。自由度:消除限制性因数后,所剩余的独立变数的个数,用df表示。例如:有3个变数,平均数等于5。离散趋势的度量3.2.5自39三、方差和标准差的计算公式离散趋势的度量1.直接法2.加权法三、方差和标准差的计算公式离散趋势的度量1.直接法2.加403.2.6标准差的性质标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。在计算标准差时,在各观测值加上或减去一个常数,其数值不变。当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。3.2.6标准差的性质标准差的大小,受资料中每个观测值的影413.2.6标准差的性质在资料服从正态分布的条件下:平均数左右一倍标准差(±S)范围:约有68.26%的观测值;平均数左右两倍标准差(±2S)范围:约有95.43%的观测值在平均数左右三倍标准差(±3S)范围:约有99.73%的观测值也就是说全距近似地等于6倍标准差,可用()来粗略估计标准差。3.2.6标准差的性质在资料服从正态分布的条件下:423.3变异系数(C.V)⁂用于比较度量单位不同以及不同时期的资料。离散趋势的度量标准差与平均数的比值称为变异系数3.3变异系数(C.V)⁂用于比较度量单位不同以及不同时43Thankyou!Thankyou!44在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有:1.算术平均数2.中位数(M)4.几何平均数(Mg)3.众数(Mo)5.调和平均数(H)3.1平均数:第三章平均数、标准差与变异系数在数理统计中,平均数是用来反映一组变数的集中趋势,即45

作为一个资料的代表,指资料中各变数集中较多的中心位置,用来与另一资料相比较。不同的平均数适合于不同的数据资料。例如:不同国家、地区、种族之间身高、体重等的比较;不同品种的家畜、家禽之间生产性能的比较集中趋势的度量平均数的意义作为一个资料的代表,指资料中各变数集中例如:不同国家463.1.1算术平均数一、定义

一组资料中,所有观测值的总和除以其个数所得到的商,称为算术平均数,简称平均数或均数。

是最常用的一种集中趋势度量指标。

样本的平均数记为

总体平均数记为

集中趋势的度量3.1.1算术平均数一、定义集中趋势的度量47:第i个观察值或变数n:观察值或变数的个数∑:求和符号(sigma)计算公式:集中趋势的度量3.5.1算术平均数:第i个观察值或变数计算公式:集中趋势的度量3.5.48Σ的性质Σ的性质49例2.1:5头猪的体重分别为70、72、80、83、88kg,问5头猪的算术平均数是多少?

从计算结果看5头猪都距78.6(kg)不远,所以平均数是数量资料的代表值。

上述计算方法称为直接法,适用于样本小,即资料内包含变数个数不多,一般在30个变数以下未经分组的资料。集中趋势的度量一、直接法例2.1:5头猪的体重分别为70、72、80、83、501.分类资料:每个类别在某个指标上取相同的值。2.计数资料和连续性资料:频率分布表

加权法,即计算时先将各个变数乘上它的权数,再经过总和,然后除以权数的总合,称为加权平均数。集中趋势的度量二、加权法1.分类资料:每个类别在某个指标上取相同的值。加51

xi=变数值

fi=变数值xi出现的频数计算公式:集中趋势的度量二、加权法xi=变数值计算公式:集中趋势的度量二、加权法52例:一个有1000个个体的群体,等位基因A的频率为0.6,另一个400个个体的群体,等位基因A的频率为0.3,这两个群体的混合在一起,整个混合群体的等位基因A的频率为:集中趋势的度量二、加权法例:一个有1000个个体的群体,等位基因A的集中趋53例:200头大白猪的仔猪的一月窝重的资料组别组中值频数(f)fx8-16-24-32-40-48-56-64-72-80-88-96-104-112-122028364452606876849210010811646910131726352821168434812025236057288415602380212817641472800432348总合20013120集中趋势的度量二、加权法例:200头大白猪的仔猪的一月窝重的资料组别组中值频数(f)54xi=组中值fi=组中值出现的频数集中趋势的度量二、加权法xi=组中值集中趋势的度量二、加权法55(一)离均差之和为零:一个样本观察值与平均数之差简称离均差。∑(xi-)=(x1-)+(x2-)+……+(xn-)=x1+x2+……+xn+n•=∑xi-n‧∑xi/n=0三、算术平均数的性质集中趋势的度量(一)离均差之和为零:∑(xi-)三、算术平均数的性56(二)离均差平方和最小:一个样本的各个观察值与平均数之差的平方和比各个观察值与任意其他数之差的平方和小。所以:平均数是与各个观察值最接近的数值。所以:平均数代表这个样本的集中趋势。集中趋势的度量三、算术平均数的性质(二)离均差平方和最小:所以:平均数是与各个观察值最接近的数57定义:将n个观察值从小到大依次排队,位于中间的那个观察值称为中位数。3.1.2中位数(Md)集中趋势的度量定义:将n个观察值从小到大依次排队,位于中间的那个观察值称为58例:2.5现有一窝仔猪的出生重资料为:1.4,1.0,1.3,1.2,1.6kg,试求其中位数。解:首先排序:1.0,1.2,1.3,1.4,1.6;

(n+1)/2=(5+1)/2=3;Md=X3=1.3如果增加一头仔猪,出生重为1.8kg,计算中位数:n/2=6/2=3(n/2)+1=3+1=4;Md=(X3+X4)/2=(1.3+1.4)/2=1.35集中趋势的度量3.1.2中位数(Md)例:2.5现有一窝仔猪的出生重资料为:1.4,1.0,1.59对于频数分布的资料,公式如下:Lmd:中位数所在组的组下限;fm:中位数所在组的频数;C:从第一组到中位数所在组前一组的累计频数n:样本含量;

i:组距;例:表2-5集中趋势的度量3.1.2中位数(Md)对于频数分布的资料,公式如下:L60集中趋势的度量3.1.2中位数(Md)集中趋势的度量3.1.2中位数(Md)61定义:n个非负数的乘积开n次方的根称为几何平均数,用G表示。3.1.3几何平均数集中趋势的度量定义:n个非负数的乘积开n次方的根称为几何平均3.1.3几62为了计算方便,各变数先取对数,再相加除以n,即为logG,再求其反对数,即为G值。集中趋势的度量3.1.3几何平均数几何平均数用于以百分率、比例表示的数据资料,如:增长率、利率、药物效价、抗体滴度等。能够消弱数据中个别过分偏大值的影响。为了计算方便,各变数先取对数,再相加除以n,即为lo63例:某奶牛场在1995年有100头奶牛,已知在1996、1997、1998年的奶牛头数分别为前一年的2,3和4.5倍,求其年平均增加率。◈1998年的奶牛头数为:100×2×3×4.5=2700头或者100×33=2700头集中趋势的度量3.1.3几何平均数例:某奶牛场在1995年有100头奶牛,已知在1996、1964定义:在资料中某一个变数出现次数最多,就称之为众数。1.离散性资料:出现频数最多的数。2.连续性资料:频数分布表中,频数出现最多的一组的组中值。!!有的资料可出现多个众数,即多个数具有相同的最高频数;有的资料没有众数,即所有数出现的频数都相同。集中趋势的度量3.1.4众数定义:在资料中某一个变数出现次数最多,就称!!有的资料可出现65定义:各观察值倒数的算术平均数的倒数3.1.5调和平均数简单调和平均数集中趋势的度量适用于极端右偏态定义:各观察值倒数的算术平均数的倒数3.1.5调和平均数简663.1.5调和平均数集中趋势的度量例:用某药物救治12只中毒的小鼠,它们的存活天数记录如下:8、8、8、10、10、7、13、10、9、14,另有两只一直未死亡,求平均存活天数。由于数据极端右偏态,用调和平均数较为合理。3.1.5调和平均数集中趋势的度量例:用某药物救治12只中67复习连续性资料分组方法集中趋势(平均数)有哪几种表示方式?算术平均数的性质复习连续性资料分组方法682.2.3百分位数(百分位点)指将一组n个数据由小到大排列,如果小于某数值的数据个数为全体数据个数的x%,则称该数为第x百分位数或x%分位数。

25%分位数或下四分位数:0.25n个数的后一个数。

50%分位数或中位数:0.5n个数的后一个数。

75%分位数或上四分位数:0.75n个数的后一个数。1692.2.3百分位数(百分位点)指将一组一、各个集中趋势度量指标之间的关系1.在完全对称分布情况下,算数平均数、中位数和众数三者相等。集中趋势的度量一、各个集中趋势度量指标之间的关系1.在完全对称分布情况下,70

适用于正态分布资料。家畜的大多数数量性状都是正态分布,因此算术平均数是最常用的,也是最重要的。集中趋势的度量2、算术平均数但是当分布不对称时,呈偏态时,用算术平均数则难以表示资料的集中趋势。适用于正态分布资料。集中趋势的度量2、算术平均数71适用于非参数检验,如卡方检验。4、几何平均数和调和平均数适用于右偏态分布。偏态:是指大部分数值落在平均数的哪一边,若分配较多的集中在低数值的方面视为正偏态,或称为右偏态集中趋势的度量3、中位数适用于非参数检验,如卡方检验。4、几何平均数和调和平72平均数的代表程度与样本的变异程度有关一个样本内有很多的变数,用平均数作为样本的代表,其代表程度决定于样本内各个变数的变异程度。3.2标准差离散趋势的度量平均数的代表程度与样本的变异程度有关3.2标准差离散趋势的度73即使两个样本的平均数相同,但是样本内变数的变异程度不一定相同。产仔数总和甲8,4,16,12,22,17,6,14,6,511011乙14,8,11,9,11,12,10,14,13,811011离散趋势的度量3.2标准差即使两个样本的平均数相同,但是样本内变数的变异74甲的变异程度大于乙甲的平均数的代表性小于乙的平均数所以,应该测定其变异程度离散趋势的度量◈甲、乙两品种的平均产仔数相同,都是11头。

从平均数来看,两个品种没有差异。从以上统计结果可知:◈进一步观察各个变数,二者变异程度并不相同。

甲:最小为4,最大为22;乙:最小为8,最大为14甲的变异程度大于乙离散趋势的度量◈甲、乙两品种的平均产仔数751.如果各个变数相同或者变异程度比较小,则平均数能够代表整个样本。2.如果各个变数的变异程度比较大,则平均数的代表性就小。离散趋势的度量

因此,单靠平均数不能全面、正确地了解样本。也不能了解平均数作为样本的变异程度。3.2标准差1.如果各个变数相同或者变异程度比较小,则平离散趋势的76定义:全部变数的最大值与最小值之差

R=Max(x)-Min(x)3.2范围(全距)范围或全距可以反映变异程度的一部分,但是不能代表样本内各变数之间的变异程度。

目前,被广泛使用的是以标准差来度量变异程度。离散趋势的度量定义:全部变数的最大值与最小值之差3.2范围(全距)77如果一个样本有n个观察值x1,x2……

xn,设其算术平均数为,则该样本的标准差为:标准差考虑了每个变数与平均数的离差。每个变数与平均数相差愈小,样本变异程度愈小,反之,愈大。因此,标准差是离散程度的度量3.2.1标准差的定义离散趋势的度量如果一个样本有n个观察值x1,x2……xn,设781.离均差=(x-)2.离均差之和=∑(x-)=03.离均差平方和SS=∑(x-)2为了合理地计算平均差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论