平均数标准差和变异系数课件_第1页
平均数标准差和变异系数课件_第2页
平均数标准差和变异系数课件_第3页
平均数标准差和变异系数课件_第4页
平均数标准差和变异系数课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上章内容回顾试验资料的整理:检查和核对;制作次数分布表和分布图(柱形图、折线图、条形图,饼图)试验资料计数资料(非连续)质量性状资料(数量化处理)数量性状资料计量资料(连续变量)试验资料搜集常用的方法:调查和试验试验资料均具有集中性和离散性两种基本特征,平均数是反映集中性的特征数,变异数是反映离散型的特征数第三章平均数、标准差和变异系数平均数(mean)用于反映资料的集中性,即观测值以某一数值为中心而分布的性质。标准差(standarddeviation)与变异系数(variationcoefficient)反映资料的离散性,即观测值分散变异的性质。第一节平均数一、平均数的意义和种类二、算术平均数的计算方法三、算术平均数的重要特性四、算术平均数的作用五、总体平均数算术平均数:一个数量资料中各个观察值的总和除以观察值个数所得的商数,称为算术平均数(arithmeticmean),记作。因其应用广泛,常简称平均数或均数(mean)。均数的大小决定于样本的各观察值。012345678910平均数=5平均数=61234567141、算术平均数2、中位数中位数:将资料内所有观察值从大到小排序,居中间位置的观察值称为中数(median),计作Md。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。对于未分组资料,先将各观测值由小到大依次排列,找到中间的1个数(n为奇数)或2个数(n为偶数),之后求平均即可。0123456789101214012345678910中位数=5中位数=5众数:资料中最常见的一数,或次数最多一组的中点值,称为众数(mode),记为M0。如棉花纤维检验时所用的主体长度即为众数。3、众数众数可能不存在可能有多个众数多用于属性数据01234567891011121314众数=9没有众数几何平均数:如有n个观察值,其相乘积开n次方,即为几何平均数(geometricmean),用G代表。其计算公式如下:

4、几何平均数调和平均数:(harmonicmean)各观测值倒数的算术平均数的倒数,称为调和平均数,记为H。即

(4.6)5、调和平均数对于同一资料:算术平均数>几何平均数>调和平均数上述五种平均数,最常用的是算术平均数。设某一资料包含n个观测值:x1、x2、…、xn,则样本平均数可通过下式计算:(4.1)简写:【例1】某植保站测得10只某类害虫的体重分别为500、520、535、560、585、600、480、510、505、490(mg),求其平均数。由于Σx=500+520+535+560+585+600+480+510+505+490=5285,n=10得:即10只害虫的平均体重为528.5mg。(二)加权法(4.2)式中:xi-第i组的组中值;fi-第i组的次数;k-分组数第i组的次数fi是权衡第i组组中值xi

在资料中所占比重大小的数量,因此将fi称为是xi

的“权”,加权法也由此而得名。对于样本含量n≥30以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算公式为:【例3】140行水稻产量(P38),用两种方法求其平均数,并比较计算结果。(1)直接法:(2)加权法:1、算术平均数的计算与每一个数(值)都有关。

2、如果是n1个值的平均数,是n2个值的平均数,那么全部n1+n2个值的算术平均数是(加权平均数)

三、算术平均数的重要特性

4、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。(常数)或简写为:5、若A为任意常数,6、平均数是有单位的数值,与原资料单位相同。注意:必须性状同质时,才有代表性。算术平均数是描述观测资料的重要特征数,它的作用主要有以下两点:1.指出数据资料的中心位置,标志着资料所代表性状的数量水平和质量水平。2.可以作为样本或资料的代表数据与其他资料进行比较。四、算术平均数的作用

对于总体而言,通常用μ表示总体平均数,有限总体的平均数为:

(4.3)

式中,N表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数()作为总体平均数(μ)的估计量,并已证明样本平均数是总体平均数μ的无偏估计量。五、总体平均数二、方差为了正确反映资料的变异度,较合理的方法是根据样本全部观察值来度量资料的变异度。这时要选定一个数值作为共同比较的标准。平均数既作为样本的代表值,则以平均数作为比较的标准较为合理,但同时应该考虑各样本观察值偏离平均数的情况,为此这里给出一个各观察值偏离平均数的度量方法。为了准确地表示样本内各个观测值的变异程度,人们首先会考虑到以平均数为标准,求出各个观测值与平均数的离差,(),称为离均差。虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负,离均差之和为零,即Σ()=0,因而不能用离均差之和Σ()来表示资料中所有观测值的总偏离程度。为了解决离均差有正、有负,离均差之和为零的问题,可先求离均差的绝对值并将各离均差绝对值之和除以观测值个数n求得平均绝对离差,即Σ|x–x|/n。虽然平均绝对离差可以表示资料中各观测值的变异程度,但由于平均绝对离差包含绝对值符号,使用很不方便,在统计学中未被采用。

我们还可以采用将离均差平方的办法来解决离均差有正、有负,且离均差之和为零的问题。先将各个离均差平方,即()2,再求离均差平方和,即,简称平方和,记为SS;由于离差平方和常随样本大小而改变,为了消除样本大小的影响,用平方和除以样本大小,即,求出离均差平方和的平均数;为了使所得的统计量是相应总体参数的无偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n,而用自由度n-1,于是,我们采用统计量表示资料的变异程度。统计量称为均方(meansquare,缩写为MS),又称样本方差,记为S2,即

S2=(4.7)相应的总体参数叫总体方差,记为σ2。对于有限总体而言,σ2的计算公式为:(4.8)标准差为方差的正平方根值,用以表示资料的变异度,其单位与观察值的度量单位相同。从样本资料计算标准差的公式为:同样,样本标准差是总体标准差的估计值。总体标准差用表示:

由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差S2的平方根叫做样本标准差,记为S,即:三、标准差由于所以(4.9)式可改写为:(4.10)相应的总体参数叫总体标准差,记为σ。对于有限总体而言,σ的计算公式为:(4.11)在统计学中,常用样本标准差S估计总体标准差σ。四、变异系数标准差和观察值的单位相同,表示一个样本的变异度。若比较两个样本的变异度,则因单位不同或均数不同,不能用标准差进行直接比较。这时可计算样本的标准差对均数的百分数,称为变异系数(coefficientofvariation)。变异系数是无量纲的量,可以用于不同单位、不同尺度下各样本变异程度的比较。

【例7】已知某甲品种猪平均体重为190kg,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论