第3章 平均数、标准差与变异系数13431928_第1页
第3章 平均数、标准差与变异系数13431928_第2页
第3章 平均数、标准差与变异系数13431928_第3页
第3章 平均数、标准差与变异系数13431928_第4页
第3章 平均数、标准差与变异系数13431928_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

下一张

主页

退出

上一张

第三章资料的统计描述1.正确理解各种平均数、方差、标准差、变异系数等统计量的概念和性质;2.掌握上述各统计量的计算方法。教学目标:第一节平平均均数平均数是是统计学学中最常常用的统统计量,,用来表表明资料料中各观观测值相相对集中中较多的的中心位位置。平平均数主主要包括括有:算术平均均数(arithmeticmean)中位数(median)众数(mode)几何平均均数(geometricmean)调和平均均数(harmonicmean)1.资料的代代表数2.表示各种种技术措措施的效效果3.表示畜禽禽的生产产性能4.进行变量量间的相相互比较较其作用主主要体现现在:下一张主页页退出出上一张一、算术术平均数数算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,记为、等。算术平均均数可根根据样本本大小及及分组情情况而采采用直接接法或加加权法计计算。(一)直接法主要用于于样本含含量n≤30、未经分分组资料料平均数数的计算算。下一张主页页退出出上一张设某一资资料包含含n个观测值值:x1、x2、…、xn,则样本平平均数可可通过下下式计算算:(3-1)其中,Σ为总和符号;表示从第一个观测值x1累加到第n个观测值xn。当其在意义上已明确时,可简写为,(3-1)式可改写为:下一张主页页退出出上一张【例3.1】】某种公牛牛站测得得10头成年公公牛的体体重分别别为500、520、535、560、585、600、480、510、505、490(kg),求其其平均数数。由于Σx=500+520+535++560+58+600+480+510++505+49=5285,n=10得:即10头种公牛牛平均体体重为528..5kg。下一张主页页退出出上一张(二)加加权法对于样本本含量n≥30以上且已已分组的的资料,,可以在在次数分分布表的的基础上上采用加加权法计计算平均均数,计计算公式式为:(3-2)下一张主页页退出出上一张式中:—第i组的组中值;—第i组的次数;—分组数。第i组的次数数fi是权衡第第i组组中值值xi在资料中中所占比比重大小小的数量量,因此此将fi称为是xi的“权””,加权权法也由由此而得得名。【例3.2】】将100头长白母母猪的仔仔猪一月月窝重((单位::kg)资料整整理成次次数分布布表如下下,求其其加权数数平均数数。组别组中值(x)次数(f)fx10—1534520—25615030—352691040—4530135050—5524132060—65852070—753225合计1004520表3-1100头长白母母猪仔猪猪一月窝窝重次数数分布表表利用(3-2)式得::即这100头长白母母猪仔猪猪一月龄龄平均窝窝重为45.2kg。计算若干干个来自自同一总总体的样样本平均均数的平平均数时时,如果果样本含含量不等等,也应应采用加加权法计计算(以各样本本的含量量为权)。下一张主页页退出出上一张【例3.3】】某牛群有有黑白花花奶牛1500头,其平平均体重重为750kg,而另一一牛群有有黑白花花奶牛1200头,平均均体重为为725kg,如果将这这两个牛牛群混合合在一起起,其混混合后平平均体重重为多少少?此例两个个牛群所所包含的的牛的头头数不等等,要计计算两个个牛群混混合后的的平均体体重,应应以两个个牛群牛牛的头数数为权,,求两个个牛群平平均体重重的加权权平均数数,即下一张主页页退出出上一张即两个牛牛群混合合后平均均体重为为738..89kg。下一张主页页退出出上一张(三)平平均数的的基本性性质1、样本各各观测值值与平均均数之差差的和为为零,即即离均差之之和等于于零。可简写成成:或2、样本各各观测值值与平均均数之差差的平方方和为最最小,即即离均差平平方和为为最小。对于总体体而言,,通常用用μ表示总体体平均数数,有限限总体的的平均数数为:(3-3)式中,N表示总体体所包含含的个体体数。当一个统统计量的的数学期期望等于于所估计计的总体体参数时时,则称称此统计计量为该该总体参参数的无偏估计计量。统计学中中常用样样本平均均数())作为总总体平均均数(μ)的估计量量,并已已证明样样本平均均数是总总体平均均数μ的无偏估估计量。。下一张主页页退出出上一张

当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数()作为总体平均数(μ)的估计量,并已证明样本平均数是总体平均数μ的无偏估计量。下一张主页页退出出上一张二、中位位数将资料内内所有观观测值从从小到大大依次排排列,位位于中间间的那个个观测值值称为中位数(median),记为Md。当观测值值的个数数是偶数数时,则则以中间间两个观观测值的的平均数数作为中中位数。。当所获获得的数数据资料料呈偏态态分布时时,中位位数的代代表性优优于算术术平均数数。中位数的的计算方方法因资资料是否否分组而而有所不不同。1、当观测测值个数数n为奇数时时,(n+1)/2位置的观观测值,,即x(n+1)/2为中位数数:下一张主页页退出出上一张(一)未未分组资资料中位位数的计计算方法法对于未分分组资料料,先将将各观测测值由小小到大依依次排列列。2、当观测值值个数为为偶数数时时,n/2和(n/2++1)位置的的两个观观测值之之和的1/2为中位数数,即::(3-4)【例3.4】】观察得9只西农莎莎能奶山山羊的妊妊娠天数数为:144、145、147、149、150、151、153、156、157,求其中中位数。。此例n=9,为奇数数,则::即西农莎莎能奶山山羊妊娠娠天数的的中位数数为150天。(d)下一张主页页退出出上一张【例3.5】】某犬场发发生犬瘟瘟热,观观察得10只仔犬发发现症状状到死亡亡分别为为7、8、8、9、11、12、12、13、14、14天,求其其中位数数。此例n=10,为偶数数,则::(d)即10只仔犬从从发现症症状到死死亡天数数的中位位数为11.5天。下一张主页页退出出上一张(二)已已分组资资料中位位数的计计算方法法若资料已已分组,,编制成成次数分分布表,,则可利利用次数数分布表表来计算算中位数数,其计计算公式式为:(3-5)式中:L—中位数所所在组的的下限;;i—组距;f—中位数所所在组的的次数;;n—总次数;;c—小于中数数所在组组的累加加次数。。下一张主页页退出出上一张【例3.6】】某奶牛场场68头健康母母牛从分分娩到第第一次发发情间隔隔时间整整理成成次数分分布表如如表3—2所示,求求中位数数。表3-268头母牛从从分娩到到第一次次发情间间隔时间间次数分分布表间隔时间(d)头数(f)累加头数12—261127—412342—56131657—71203672—86165287—1011264102—116266≥117268下一张主页页退出出上一张由表3-2可见:i=15,n=68,因而中中位数只只能在累累加头数数为36所对应的的“57—71”这一组,,于是可可确定L=57,f=20,c=16,代入公公式(3-5)得:(d)即奶牛头头胎分娩娩到第一一次发情情间隔时时间的中中位数为为70.5天。又如,由由表3-1可算得其其中位数数为:下一张主页页退出出上一张三、几何何平均数数n个观测值值相乘之之积开n次方所得得的方根根,称为为几何平均均数(geometricmean),记为G。它主要应应用于畜畜牧业、、水产业业的生产产动态分分析,畜畜禽疾病病及药物物效价的的统计分分析。如如畜禽、、水产养养殖的增增长率率,抗体体的滴度度,药物物的效价价,畜禽禽疾病的的潜伏期期等,用用几何平平均数比比用算术术平均数数更能代代表其平平均水平平。其计计算公式式如下::(3-6)n为了计算算方便,,可将各各观测值值取对数数后相加加除以n,得lgG,再求lgG的反对数数,即得得G值,即(3-7)【例3.7】】某波尔山山羊群1997—2000年各年度度的存栏栏数见表表3-3,试求其其年平均均增长率率。年度存栏数(只)增长率(x)Lgx1997140——19982000.429-0.36819992800.400-0.39820003500.250-0.602Σlgx=-1.368表3—3某波尔山山羊群各各年度存存栏数与与增长率率利用(3-7)式求年年平均增增长率=lg-1[(-0.368--0.398––0.602))/3]]=lg-1[-1..368/3]]=lg-1(-0.456)=0.3501即年平均均增长率率为0.3501或35.01%。下一张主页页退出出上一张当一组数数据资料料中的各各观测值值呈倍数数关系((等比关关系,几几何级数数)变化化趋势时时,用几几何平均均数表示示其一般般水平是是较为合合适的。。下一张主页页退出出上一张四、众数数资料中出出现次数数最多的的那个观观测值或或次数最最多一组组的组中中值,称称为众数(mode),记为Mo。间断性资资料由于样本本中的各各观测值值容易集集中于某某一个数数值,所所以众数易于于确定。连续性资资料由于在两两个相邻邻的观测测值之间间,可有有各种数数值存在在,样本本中的观观测值不不易集中中于某一一个数值值,众数不易易确定。在连续性性资料的的次数分分布表中中,分布布次数最最多一组组的组中中值即为为该样本本的概约众数数。但在实实际统计计分析过过程中,,由于分分组不同同,概约约众数亦亦不同。。可用补补差法计计算众数数,其准准确性高高于众数数。公式式如下::(3-8)为次数最多组的下限,为组距,L为次数最多组上一组的累计次数,为次数最多组下一组的累计次数。如表2-3所列的的50枚受精种种蛋出雏雏天数次次数分布布中,以以22出现的次次数最多多,则该该资料的的众数为为22天。又如【例3.6】】所列出的的次数分分布表中中,57—71这一组次次数最多多,其组组中值为为64天,则该该资料的的众数为为64天。再如,由由表3-1可算得其其概约众数数为:五、调和和平均数数资料中各各观测值值倒数的的算术平平均数的的倒数,,称为调和平均均数(harmonicmean),记为H。即(3-9)调和平均均数主要要用于反反映畜群群不同阶阶段的平平均增长长率或畜畜群不同同规模的的平均规规模。下一张主页页退出出上一张【例3.8】】某保种牛牛群不同同世代牛牛群保种种的规模模分别为为:0世代200头,1世代220头,2世代210头;3世代190头,4世代210头,试求求其平均均规模。。利用(3-9)式求平平均规模模:(头)即保种群群平均规规模为208..33头。一般,对于同一一资料::算术平均均数≥几几何平均均数≥调调和平均均数。上述五种种平均数数,最常常用的是是算术平平均数。。555553456713579三组数据据平均数数均为5,但代表表性强弱弱不同。。第二节标标准准差下一张主页页退出出上一张一、标准准差的意意义用平均数数作为样样本的代代表,其其代表性性的强弱弱受样本本资料中中各观测测值变异异程度的的影响。。仅用平平均数对对一个资资料的特特征作统统计描述述是不全全面的,,还需引引入一个个表示资资料中观观测值变变异程度度大小的的统计量量。全距(极极差)是表示资资料中各各观测值值变异程程度大小小最简便便的统计计量。全距只利利用了资资料中的的最大值值和最小小值,并并不能准准确表达达资料中中各观测测值的变变异程度度,比较较粗略。。当资料料很多而而又要迅迅速对资资料的变变异程度度作出判判断时,,可以利利用全距距这个统统计量。。为了准确地表示样本内各个观测值的变异程度,人们首先会考虑到以平均数为标准,求出各个观测值与平均数的离差,(),称为离均差。虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负,离均差之和为零,因而不能用离均差之和来表示资料中所有观测值的总偏离程度。为了解决离均差有正、有负,离均差之和为零的问题,可先求离均差的绝对值并将各离均差绝对值之和除以观测值个数n求得平均绝对离差,即。虽然平均均绝对离离差可以以表示资资料中各各观测值值的变异异度,但但由于平平均绝对对离差包包含绝对对值符号号,使用用很不方方便,在在统计学学中未被被采用。。我们还可可以采用用将离均均差平方方的办法法来解决决离均差差有正、、有负,,离均差差之和为为零的问问题。先将各个离均差平方,即,再求离均差平方和,即,简称平方和,记为SS;由于离差平方和常随样本大小而改变,为了消除样本大小的影响,用平方和除以样本大小,即,求出离均差平方和的平均数。为了使所得的统计量是相应总体参数的无偏估计(unbiasedestimate)量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n,而用自由度n-1,于是,我们采用统计量表示资料的变异程度。统计量称为均方(meansquare,缩写为MS),又称样本方差(varianceofsample),记为,即(3-10)相应的总体参数叫总体方差,记为。对于有限总体而言,的计算公式为:(3-11)由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差的平方根叫做样本标准(standarddeviationofsample),记为,即:

(3-12)(3-13)由于所以(3-12)式可改改为:下一张主页页退出出上一张(3-14)相应的总总体参数数叫总体标准准差,记为σ。对于有有限总体体而言,,σ的计算公公式为::在统计学学中,常常用样本本标准差差S估计总体体标准差差σ,但这并并非无偏偏估计。。二、标准准差的计计算方法法(一)直直接法对于未分分组或小小样本资资料,可可直接利利用(3—13)或(3-14)式来计计算标准准差。【例3.9】】计算10只辽宁绒绒山羊产产绒量::450,450,500,500,500,550,550,550,600,600,650(g)的标准准差。此例n=10,经计算算得:Σx=5400,Σx2=2955000,代入((3-13)式得::下一张主页页退出出上一张(g)即10只辽宁绒绒山羊产产绒量的的标准准差为为65.828g。(二)加加权法对于已制制成次数数分布表表的大样样本资料料,可利利用次数数分布表表,采用用加权法法计算标标准差。。计算公公式为::(3-15)式中,f为各组次次数;x为各组的的组中值值;Σf=n为总次数数。【例3.10】利用某纯纯系蛋鸡鸡200枚蛋重资资料的次次数分布布表(见见表3-4)计算标标准差。。组别组中值(x)次数(f)fxfx244.15—45.03135.06075.045.85—46.76280.213085.3447.55—48.416774.437480.9649.25—50.1221102.255220.2250.95—51.8301554.080497.2052.65—53.5442354.0125939.0054.35—55.2281545.085317.1256.05—56.9301707.097128.3057.75—58.612703.241207.5259.45—60.35301.518180.4561.15—62.04248.015376.00合计

Σf=200Σfx=10705.1Σfx2=575507.11表3-4某纯系蛋蛋鸡200枚蛋重资资料次数数分布及及标准差差计算表表下一张主页页退出出上一张将表3-4中的Σf、Σfx、代入(3-15)式得::(g)即某纯系系蛋鸡200枚蛋重的的标准差差为3.5524g。下一张主页页退出出上一张三、标准准差的特特性(一)标准差的的大小,,受资料料中每个个观测值值的影响响,如观观测值间间变异大大,求得得的标准准差也大大,反之之则小。。(二)在计算标标准差时时,在各各观测值值加上或或减去一一个常数数,其数数值不变变。(三)当每个观观测值乘乘以或除除以一个个常数a,则所得得的标准准差是原原来标准准差的a倍或1/a倍。(四)在资料服服从正态态分布的的条件下下,资料料中约有有68.26%的观测值值在平均均数左右右一倍标标准差((±S)范围内;;约有9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论