




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
作为一个资料的代表,指资料中各变数集中较多的中心位置,用来与另一资料相比较。不同的平均数适合于不同的数据资料。例如:不同国家、地区、种族之间身高、体重等的比较;不同品种的家畜、家禽之间生产性能的比较集中趋势的度量平均数的意义第一页,共四十三页,编辑于2023年,星期六3.1.1算术平均数一、定义
一组资料中,所有观测值的总和除以其个数所得到的商,称为算术平均数,简称平均数或均数。
是最常用的一种集中趋势度量指标。
样本的平均数记为
总体平均数记为
集中趋势的度量第二页,共四十三页,编辑于2023年,星期六:第i个观察值或变数n:观察值或变数的个数∑:求和符号(sigma)计算公式:集中趋势的度量3.5.1算术平均数第三页,共四十三页,编辑于2023年,星期六Σ的性质第四页,共四十三页,编辑于2023年,星期六例2.1:5头猪的体重分别为70、72、80、83、88kg,问5头猪的算术平均数是多少?
从计算结果看5头猪都距78.6(kg)不远,所以平均数是数量资料的代表值。
上述计算方法称为直接法,适用于样本小,即资料内包含变数个数不多,一般在30个变数以下未经分组的资料。集中趋势的度量一、直接法第五页,共四十三页,编辑于2023年,星期六1.分类资料:每个类别在某个指标上取相同的值。2.计数资料和连续性资料:频率分布表
加权法,即计算时先将各个变数乘上它的权数,再经过总和,然后除以权数的总合,称为加权平均数。集中趋势的度量二、加权法第六页,共四十三页,编辑于2023年,星期六
xi=变数值
fi=变数值xi出现的频数计算公式:集中趋势的度量二、加权法第七页,共四十三页,编辑于2023年,星期六例:一个有1000个个体的群体,等位基因A的频率为0.6,另一个400个个体的群体,等位基因A的频率为0.3,这两个群体的混合在一起,整个混合群体的等位基因A的频率为:集中趋势的度量二、加权法第八页,共四十三页,编辑于2023年,星期六例:200头大白猪的仔猪的一月窝重的资料组别组中值频数(f)fx8-16-24-32-40-48-56-64-72-80-88-96-104-112-122028364452606876849210010811646910131726352821168434812025236057288415602380212817641472800432348总合20013120集中趋势的度量二、加权法第九页,共四十三页,编辑于2023年,星期六xi=组中值fi=组中值出现的频数集中趋势的度量二、加权法第十页,共四十三页,编辑于2023年,星期六(一)离均差之和为零:一个样本观察值与平均数之差简称离均差。∑(xi-)=(x1-)+(x2-)+……+(xn-)=x1+x2+……+xn+n•=∑xi-n‧∑xi/n=0三、算术平均数的性质集中趋势的度量第十一页,共四十三页,编辑于2023年,星期六(二)离均差平方和最小:一个样本的各个观察值与平均数之差的平方和比各个观察值与任意其他数之差的平方和小。所以:平均数是与各个观察值最接近的数值。所以:平均数代表这个样本的集中趋势。集中趋势的度量三、算术平均数的性质第十二页,共四十三页,编辑于2023年,星期六定义:将n个观察值从小到大依次排队,位于中间的那个观察值称为中位数。3.1.2中位数(Md)集中趋势的度量第十三页,共四十三页,编辑于2023年,星期六例:2.5现有一窝仔猪的出生重资料为:1.4,1.0,1.3,1.2,1.6kg,试求其中位数。解:首先排序:1.0,1.2,1.3,1.4,1.6;
(n+1)/2=(5+1)/2=3;Md=X3=1.3如果增加一头仔猪,出生重为1.8kg,计算中位数:n/2=6/2=3(n/2)+1=3+1=4;Md=(X3+X4)/2=(1.3+1.4)/2=1.35集中趋势的度量3.1.2中位数(Md)第十四页,共四十三页,编辑于2023年,星期六对于频数分布的资料,公式如下:Lmd:中位数所在组的组下限;fm:中位数所在组的频数;C:从第一组到中位数所在组前一组的累计频数n:样本含量;
i:组距;例:表2-5集中趋势的度量3.1.2中位数(Md)第十五页,共四十三页,编辑于2023年,星期六集中趋势的度量3.1.2中位数(Md)第十六页,共四十三页,编辑于2023年,星期六定义:n个非负数的乘积开n次方的根称为几何平均数,用G表示。3.1.3几何平均数集中趋势的度量第十七页,共四十三页,编辑于2023年,星期六为了计算方便,各变数先取对数,再相加除以n,即为logG,再求其反对数,即为G值。集中趋势的度量3.1.3几何平均数几何平均数用于以百分率、比例表示的数据资料,如:增长率、利率、药物效价、抗体滴度等。能够消弱数据中个别过分偏大值的影响。第十八页,共四十三页,编辑于2023年,星期六例:某奶牛场在1995年有100头奶牛,已知在1996、1997、1998年的奶牛头数分别为前一年的2,3和4.5倍,求其年平均增加率。◈1998年的奶牛头数为:100×2×3×4.5=2700头或者100×33=2700头集中趋势的度量3.1.3几何平均数第十九页,共四十三页,编辑于2023年,星期六定义:在资料中某一个变数出现次数最多,就称之为众数。1.离散性资料:出现频数最多的数。2.连续性资料:频数分布表中,频数出现最多的一组的组中值。!!有的资料可出现多个众数,即多个数具有相同的最高频数;有的资料没有众数,即所有数出现的频数都相同。集中趋势的度量3.1.4众数第二十页,共四十三页,编辑于2023年,星期六定义:各观察值倒数的算术平均数的倒数3.1.5调和平均数简单调和平均数集中趋势的度量适用于极端右偏态第二十一页,共四十三页,编辑于2023年,星期六3.1.5调和平均数集中趋势的度量例:用某药物救治12只中毒的小鼠,它们的存活天数记录如下:8、8、8、10、10、7、13、10、9、14,另有两只一直未死亡,求平均存活天数。由于数据极端右偏态,用调和平均数较为合理。第二十二页,共四十三页,编辑于2023年,星期六复习连续性资料分组方法集中趋势(平均数)有哪几种表示方式?算术平均数的性质第二十三页,共四十三页,编辑于2023年,星期六2.2.3百分位数(百分位点)指将一组n个数据由小到大排列,如果小于某数值的数据个数为全体数据个数的x%,则称该数为第x百分位数或x%分位数。
25%分位数或下四分位数:0.25n个数的后一个数。
50%分位数或中位数:0.5n个数的后一个数。
75%分位数或上四分位数:0.75n个数的后一个数。24第二十四页,共四十三页,编辑于2023年,星期六一、各个集中趋势度量指标之间的关系1.在完全对称分布情况下,算数平均数、中位数和众数三者相等。集中趋势的度量第二十五页,共四十三页,编辑于2023年,星期六
适用于正态分布资料。家畜的大多数数量性状都是正态分布,因此算术平均数是最常用的,也是最重要的。集中趋势的度量2、算术平均数但是当分布不对称时,呈偏态时,用算术平均数则难以表示资料的集中趋势。第二十六页,共四十三页,编辑于2023年,星期六适用于非参数检验,如卡方检验。4、几何平均数和调和平均数适用于右偏态分布。偏态:是指大部分数值落在平均数的哪一边,若分配较多的集中在低数值的方面视为正偏态,或称为右偏态集中趋势的度量3、中位数第二十七页,共四十三页,编辑于2023年,星期六平均数的代表程度与样本的变异程度有关一个样本内有很多的变数,用平均数作为样本的代表,其代表程度决定于样本内各个变数的变异程度。3.2标准差离散趋势的度量第二十八页,共四十三页,编辑于2023年,星期六即使两个样本的平均数相同,但是样本内变数的变异程度不一定相同。产仔数总和甲8,4,16,12,22,17,6,14,6,511011乙14,8,11,9,11,12,10,14,13,811011离散趋势的度量3.2标准差第二十九页,共四十三页,编辑于2023年,星期六甲的变异程度大于乙甲的平均数的代表性小于乙的平均数所以,应该测定其变异程度离散趋势的度量◈甲、乙两品种的平均产仔数相同,都是11头。
从平均数来看,两个品种没有差异。从以上统计结果可知:◈进一步观察各个变数,二者变异程度并不相同。
甲:最小为4,最大为22;乙:最小为8,最大为14第三十页,共四十三页,编辑于2023年,星期六1.如果各个变数相同或者变异程度比较小,则平均数能够代表整个样本。2.如果各个变数的变异程度比较大,则平均数的代表性就小。离散趋势的度量
因此,单靠平均数不能全面、正确地了解样本。也不能了解平均数作为样本的变异程度。3.2标准差第三十一页,共四十三页,编辑于2023年,星期六定义:全部变数的最大值与最小值之差
R=Max(x)-Min(x)3.2范围(全距)范围或全距可以反映变异程度的一部分,但是不能代表样本内各变数之间的变异程度。
目前,被广泛使用的是以标准差来度量变异程度。离散趋势的度量第三十二页,共四十三页,编辑于2023年,星期六如果一个样本有n个观察值x1,x2……
xn,设其算术平均数为,则该样本的标准差为:标准差考虑了每个变数与平均数的离差。每个变数与平均数相差愈小,样本变异程度愈小,反之,愈大。因此,标准差是离散程度的度量3.2.1标准差的定义离散趋势的度量第三十三页,共四十三页,编辑于2023年,星期六1.离均差=(x-)2.离均差之和=∑(x-)=03.离均差平方和SS=∑(x-)2为了合理地计算平均差异,用平方和的办法来消除离均差的正负号,离均差平方相加,得到平方和(SS),但是由于不同样本的观察值个数不同,所以离均差平方和也不是理想指标离散趋势的度量虽然离均差可以衡量变异程度,但是离均差之和为0,所以不是理想的指标3.2.2标准差公式的来源第三十四页,共四十三页,编辑于2023年,星期六3.2.3样本方差和样本标准差将离均差平方和求平均数,称为样本方差,目的是消除观察值个数的影响样本方差开方,目的是使变异还原,即标准差。离散趋势的度量第三十五页,共四十三页,编辑于2023年,星期六总体是未知的,用样本标准差估计和推断总体标准差离散趋势的度量3.2.4总体方差和样本标准差第三十六页,共四十三页,编辑于2023年,星期六如果一个样本含有n个变数,从理论上讲,n个变数都同样用以计算标准差,n个变数与平均数相减有n个离均差。表面上虽有n个比较,但实质上仅有n-1个可以自由变动,最后一个离均差受到离均差之和这个条件的限制,所以不能自由。3.2.5自由度:
df,n-1第三十七页,共四十三页,编辑于2023年,星期六例如:有3个变数,平均数等于5。问着三个变数可能是多少?离散趋势的度量3.2.5自由度:(4、5、6)(2、4、9)(3、5、7)……他们的共同特点:前两个数可以自由选择,为了使平均数等于5,第三个数不用选就确定了。这时(3-1)=2就是所谓自由度。自由度:消除限制性因数后,所剩余的独立变数的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 不可撤销居间协议书范本
- 2025年度办公家具及配套设施保养与更换服务协议
- 机器设备抵押合同范本
- 酒类经销商合作协议书范本
- 高端别墅装修终止协议
- 2025年餐饮行业述廉报告范文
- 矿山工程施工进度及管理措施探究
- 2025学年一年级道德与法治跨学科融合计划
- 城市环境卫生清洁服务合作协议
- 影视特效制作与服务合同
- DL∕T 1094-2018 电力变压器用绝缘油选用导则
- 【我国农村数字普惠金融的发展问题及完善策略12000字(论文)】
- DL-T-5115-2016混凝土面板堆石坝接缝止水技术规范
- 全国川教版信息技术八年级下册第二单元第1节《设计文创作品》教学设计
- 危货押运员考试答案(题库版)
- QCT267-2023汽车切削加工零件未注公差尺寸的极限偏差
- 2022-2023学年浙江省绍兴市高一(下)期末数学试卷含答案
- 租房协议书 租房协议书范本
- GB/T 43646-2024陆生野生动物廊道设计要求
- 吊篮施工风险分级管控与隐患排查治理(汇编)
- 内蒙古呼和浩特市2023年中考历史试题(附真题答案)
评论
0/150
提交评论