第02章 试验资料的整理与特征数的计算_第1页
第02章 试验资料的整理与特征数的计算_第2页
第02章 试验资料的整理与特征数的计算_第3页
第02章 试验资料的整理与特征数的计算_第4页
第02章 试验资料的整理与特征数的计算_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学2试验资料的整理与特征数的计算本章教学内容试验资料的搜集与整理试验资料的类型试验资料的搜集试验资料的整理试验资料特征数的计算平均数变异数2试验资料类型试验资料数量性状资料质量性状资料/属性性状资料计数资料/非连续变量资料计量资料/连续变量资料3数量性状资料数量性状(quantitativecharacter)是指能够以计数和测量或度量的方式表示其特征的性状观察测定数量性状而获得的数据就是数量性状资料(dataofquantitativecharacteristics)数量性状资料的获得有计数和测量两种方式,因而数量性状资料又分为计数资料和计量资料两种4计数资料和计量资料计数资料和计量资料计数资料指用计数方式获得的数量性状资料观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现,因此各观察值是不连续的,称为非连续变量资料、间断变量资料或离散变量资料。5计数资料和计量资料计数资料和计量资料计数资料指用计数方式获得的数量性状资料观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现,因此各观察值是不连续的,称为非连续变量资料、间断变量资料或离散变量资料。6计数资料和计量资料计数资料和计量资料计量资料指用测量或度量法获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数据资料数据是用长度、重量、容积、温度、浓度等来表示,要带单位这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精确度而定,它们之间的变异是连续性的,称为连续变量资料7质量性状资料质量性状(qualitativecharacter)是指能观察到而不能直接测量的性状。观察质量性状而获得的数据就是质量性状资料(dataofqualitativecharacteristics),也称为属性性状资料。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理。8统计次数法和评分法统计次数法:在一定的总体或样本中,根据某一质量性状的类别分别统计其次数,以次数作为质量性状的数据;由质量性状数量化得来的资料又叫次数资料评分法:对某一质量性状分成不同级别,对不同级别进行评分来表示其性状差异的方法通过次数统计或评分,将质量性状进行数量化,以便统计分析株数频率红花26626.6%紫花49449.4%白花24024.0%总计1000100.0%9资料搜集的方法调查对已经存在的事件的资料按某种方案进行收集的方法试验对已有的或没有的事物加以处理的方法10调查普查:是对研究对象的全部个体逐一进行调查的方法抽样调查:是根据一定的原则从研究对象中抽取一部分具有代表性的个体进行调查的方法通过抽样将获得的样本资料进行统计处理,然后利用样本的特征数对总体进行推断生物学研究中绝多数情况下进行抽样调查随机抽样必须满足2个条件总体中每个个体被抽中的机会均等总体中所有个体相互独立,是否被抽中不受其他个体影响11试验试验设计的方法对比设计随机区组设计平衡不完全区组设计裂区设计拉丁方设计正交设计正交旋转设计试验设计的原则随机重复局部控制12试验资料的整理原始资料的检查与核对次数分布表计数资料计量资料次数(频数)分布图13试验资料的整理原始资料的检查与核对调查试验原始数据检查订正核对确保原始资料的完整性和正确性14试验资料的整理次数分布表结构简单,层次分明,安排合理,重点突出,数据准确总横标目(或空白)纵标目1纵标目2……横标目1横标目2数据资料……表号标题15试验资料的整理次数分布表标题简要、准确地说明表的内容,有时须注明时间地点标目标目分横标目和纵标目两项。横标目列在表的左侧,纵标目列在表的上端,标目需注明单位,如%、kg、cm等数字一律用阿拉伯数字,小数位数一致,右对齐;无数字的用“─”表示,数字是“0”的,则填写“0”线条多用三线表,上下两条边线粗一号字体、字号宋体、新罗马,标目加粗,比正文小半或一号16试验资料的整理计数资料的整理计数资料基本上采用单项式分组法进行整理用样本变量自然值进行分组,每组用一个或几个变量值来表示计量资料的整理计量资料一般采用组距式分组法全距组数组距组限归组制表17次数分布表-计数资料11~17来亨鸡每月产蛋数变动范围:分为7组统计各组次数计算频率和累积频率制表表2-1100只来亨鸡每月的产蛋数171214131412111413161414131715141416141415151414141113121413141315141315141314151616141314151315131515151414161415171316141615131414141416121312141215161516141315171413141217141518表2-2100只来亨鸡每月产蛋数次数分布表每月产蛋数次数频率累积频率PreductFrequencyPercentCumulative1120.020.021270.070.0913190.190.2814350.350.6315210.210.8416110.110.951750.051.0019表2-2100只来亨鸡每月产蛋数次数分布表每月产蛋数次数频率累积频率PreductFrequencyPercentCumulative1120.020.021270.070.0913190.190.2814350.350.6315210.210.8416110.110.951750.051.001自然值进行分组,最大值17,最小值112数据主要集中在14,向两侧分布逐渐减少20次数分布表-计数资料小麦品种300个麦穗穗粒数18-6262-17=45,分为45组?样本容量分组数30~605~860~1007~10100~2009~12200~50010~18>50015~3021次数分布表-计数资料每穗粒数次数频率累积频率FrequencyPercentCumulativePercent18-223.000.010.0123-2718.000.060.0728-3238.000.130.2033-3751.000.170.3738-4268.000.230.5943-4753.000.180.7748-5241.000.140.9153-5722.000.070.9858-626.000.021.00表2-3小麦品种300个麦穗穗粒数的次数分布表22次数分布表-计量资料56496278414765455855596569627352526051627866455858605752514856465870727677566658585553506563576585

5958546248634661625738585254556652485675725737467656637565485255546271486258465738545365428366485358464666567655605458495256826365547565864677706940565861545352435264585854785256615954596468515968635263表2-4

150尾鲢鱼体长(cm)23次数分布表-计量资料求全距(极差,range):R=xmax-xmin=85-37=48(cm)确定组数:组数多、组距小,统计数精确,计算不方便组数少、组距大,统计数不精确,计算方便样本容量分组数30~605~860~1007~10100~2009~12200~50010~18>50015~3024次数分布表-计量资料确定组数:组距=全距/组数=48/10=4.8≈5(cm)确定组限(classlimit)和组中值(classmidvalue)组限是指每个组变量值的起止界限(上限和下限)组中值是两个组限的中间值=(上限+下限)/2最小一组的下限必须小于资料中的最小值,最大一组的上限必须大于资料中的最大值组限可取到10分位或5分位上,临界值就高不就低组号12……11下限35.040.0……85.0上限40.045.0……90.0组中值37.542.5……87.525次数分布表-计量资料分组:根据各组上、下限后,将原始资料中各观测值归于相应的组制表:计算各组的观测数次数、频率、累积频率,制作次数分布表

组限组中值次数频率累积频率

FrequencyPercentCumulativePercent35~37.530.02000.020040~42.540.02670.046745~47.5170.11330.160050~52.5280.18670.3467

55~57.5400.26660.613360~62.5250.16670.780065~67.5170.11330.897370~72.560.04000.933375~77.570.04670.980080~82.520.01330.993385~87.510.00671.000026次数(频数)分布图把次数(频率)分布资料画成统计图形特点:直观、形象类型:条形图、直方图、多边形图、饼图和散点图基本要求:标题简明扼要,列于图的下方纵、横两轴应有刻度,注明单位横轴由左至右,纵轴由下而上,数值由小到大;图形宽高比例应为4:3至6:5图中需用不同颜色或线条代表不同事物时,应有图例说明27条形图(柱形图,barchart)用于计数资料,两柱之间有一定间隔图2.1月产蛋数次数分布柱形图图2.2月产蛋数频率分布柱形图28饼图(piechart)用于计数资料质量性状资料图1来亨鸡月产蛋次数分布图29直方图(矩形图,histogram)用于计量资料,各组之间没有距离354045505560657075808590图2.3鲢鱼体长次数分布图30多边形图(polygon,折线图broken-linechart)用于计量资料图2.3鲢鱼体长次数分布图31散点图(scatter)常用于表示变量间的关系正向直线关系负向直线关系曲线关系1234564321123456432112345643213233试验资料特征数的计算变量的分布具有两种明显的基本特征集中性变量在趋势上有着向某一中心聚集,或者说以某一数值为中心而分布的性质,用平均数来表示离散性是变量有着离中分散变异的性质,用变异数来表示34平均数概念平均数是统计学中最常用的统计量,是计量资料的代表值,表示资料中观测数的中心位置,并且可作为资料的代表与另一组相比较,以确定二者的差异情况种类算术平均数中位数众数几何平均数调和平均数35总体或样本资料中所有观测数的总和与观测次数的商,简称平均数、均数或均值总体:样本:算术平均数(arithmeticmean)36中位数(median,Md)资料中所有观测数依大小顺序排列,居于中间位置的观测数称为中位数或中数当观测值个数n为奇数时,排序后(n+1)/2位置的观测值为中位数:Md=x(n+1)/2当观测值个数为偶数时,排序后n/2和(n/2+1)位置的两个观测值的平均值为中位数:Md=xn/2+xn/2+137众数(mode,M0)资料中出现次数最多的那个观测值或次数最多一组观测值的组中值某些数据不存在众数某些数据存在两个或两个以上的众数主要用来描述频率分布38几何平均数(geometricmean,G)资料中有n个观测数,其乘积开n次方所得数值适用范围:几何均数适用于变量x为对数正态分布,经对数转换后呈正态分布的资料39调和平均数(harmonicmean,H)资料中各观测值倒数的算术平均数的倒数适用范围:主要用于反映生物不同阶段的平均增长率或不同规模的平均规模40算术平均数的计算方法直接计算减去常数加权平均=x1+x2+x3+…+xnnx=(x1-a)+(x2-a)+(x3-a)+…+(xn-a)nx+aåååå==++++++===ffxfxffffxfxfxfxkiikiiikkk11212211LL41直接计算法例:随机抽取20株小麦测量它们的株高(cm)分别为:

79858486848382838384818081828182828280求小麦的平均株高。

=Σxn=20(82+79+…+80)=82.3(cm)42减去常数法例:设a为80(cm)则有:

798584868483828383

2-154643233818081828182828280

4101212220=20(2-1+5+…+0)=82.3(cm)+8043加权平均法株高x次数ffx791798021608132438264928332498432528518586186=201=82.3(cm)×(79×1+80×2+…+86×1)44加权平均法例:将100头长白母猪的仔猪一月窝重(单位:kg)资料整理成次数分布表如下,求其一月窝平均重量。组别组中值(x)次数(f)fx10~1534520~25615030~352691040~4530135050~5524132060~65852070~753225合计1004520

表100头长白母猪仔猪一月窝重次数分布表45算术平均数的重要性质离均差之和等于零离均差平方和最小46指出一组数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平作为样本或资料的代表数与其他资料进行比较通过平均数提供计算样本变异数的基本数据用样本的平均数估计总体平均数47变异数常用的变异数极差方差标准差变异系数48极差(全距,range,R)数据分布的两端变异的最大范围,即样本变量最大值和最小值之差,用R表示:R=max{x1,x2,……,xn}

-

min{x1,x2,……,xn}是资料中各观测值变异程度大小的最简便的统计量除了最大、最小值,不能反映组内其他数据的变异样本较大时抽到较大值与较小值的可能性较大,样本极差也较大,故样本含量相差较大时,不宜用极差来比较分布的离散度当资料很多而又要迅速对资料的变异程度作出判断时,可以利用极差49离均差离均差:观测值与平均数的离差离均差反映一个观测值偏离平均数的性质和程度离均差之和为零50方差(Variance)样本总体51标准差(standarddeviation)样本总体52标准差的计算用原始数据(减去一个常数)计算对分组资料计算53x=411x2=18841x’=6x’2=76

表2-89名男子前臂长(cm)标准差计算前臂长x2x’=x-45x’245202500421764-39441936-11411681-4164722092450250052547220924

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论