生物统计学第四版知识点总结_第1页
生物统计学第四版知识点总结_第2页
生物统计学第四版知识点总结_第3页
生物统计学第四版知识点总结_第4页
生物统计学第四版知识点总结_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、 田间试验的特点1、 田间试验具有严格的地区性和季节性,试验周期长。2、 田间试验普遍存在试验误差3、 研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研究其生长发育规律、各项栽培技术或栽培条件的效果。二、田间试验的基本要求结果重演性、结果可靠性、条件先进代表性、目的明确性三、 单因素试验的处理数就是该因素的水平数。四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组合数是?3因素3水平的处理组合数是?多因素试验的处理数是各因素不同水平数的所有组合。五、 如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为喷施等量清水 。六、 简单效应的计算n 的简单效应

2、为40-30=10在 n1水平下,p2与p1的简单效应为38-30=8;在n2水平下,p2与p1的简单效应为54-40=14。七、平均效应的计算p的主效(8+14)/2=11;n的主效(10+16)/2=13;八、 互作的计算n与p的互作为(16-10)/2=3或(14-8)/2=3九、 田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误差,则精确度=准确度。)十、 小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。适当的时候可以考虑增加重复次数来降低

3、误差。小区面积一般在6-60m2,而示范小区面积不小于330m2 。十一、通常情况下,狭长小区误差比方形小区误差小。小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复;小区面积较大的试验可设2-4次重复。十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。)十五、算术平均数的主要特征 1、样本各观测值与平均数之差的和为零,即离均差之和为0。2、离均差的平方和

4、最小。十六、【例3·1】 在1、2、3、 、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)a=“抽得1个数字4”;(2)b=“抽得1个数字是2的倍数”。( 即n=20,而事件a所包含的基本事件有4个,既抽得编号为1,2,3,4中的任何1个,事件a便发生,即ma=4,所以b所包含的基本事件数mb=10,即抽得数字为 2,4,6,8,10,12,14,16,18,20中的任何1个,事件b便发生,故( 十七、推论1:完全事件系的概率为1;推论2:对立事件的概率为: 十八、二项分布是离散型变数的一种重要的理论分布,必须满足两个基本条件:(各事件是相互独立的;各随机事件必须发生

5、非此即彼的对立事件。)十九、正态分布曲线是一个曲线系统。有两个参数, 即平均数 和标准差。 决定了曲线在x轴上的位置,决定了它的变异度当恒定时,愈大,则曲线沿x轴愈向右移动;反之,愈小,曲线沿x轴愈向左移动。当恒定时,越大,表示 x 的取值越分散, 曲线越“胖”;越小,x 的取值越集中在 附近,曲线越“瘦”。分布密度曲线与横轴所夹的面积为 1。x落入曲线下某一区间的概率,等于该区间的面积占总面积的成数。记住 p(-1u1)=0.6826 p(-2u2)=0.9545 p(-3u3)=0.997320、中心极限定理:只要样本容量适当大,不论总体分布形状如何,分布都可看作为正态分布,n>30

6、,就应用它21、f 测验需具备以下两个条件(1)变数 x 遵循正态分布n(,2)(2)s12和s22彼此独立。当资料不符合这些条件时,需作转换。 名词解释准确性: 也叫准确度,指在试验中某一试验指标或性状的观测值与其真值接近的程度。 精确性:也叫精确度,指试验中同一试验指标或性状的重复观测值彼此接近的程度。试验因素:试验中由人为控制的被变动的条件的总称,简称“因素”。水平:试验因素的质的不同状态和量的不同等级。例,品比试验中,品种是因素,每一个品种就是一个水平。(质量水平)密度试验呢?(数量水平)处理:几个因素不同水平的组合,即试验中具体研究比较的对象。简单效应:同一因素内不同水平之间试验效应

7、的差异。平均效应:又叫主要效应,简称主效。一因素内各简单效应的平均数互作(交互作用):因素内简单效应的平均差异。试验误差:试验中观测值与理论真值之间的偏差边际效应:小区两边或两端的植株因占有较大的空间而表现出的差异。生长竞争:当相邻小区种植不同品种或施用不同肥料时,由于株高、分蘖能力或生长期的不同,通常将有一行或更多行受到影响的现象。小区(plot):田间试验中安排一个处理的小块地段。区组(block):将全部处理分配于相对同质的一块土地上,成为一个区组。重复(replication):同一处理所设置的试验单元数。即同一处理种植的小区数。局部控制:将整个试验环境分成若干相对一致的小环境(区组)

8、,再在小环境内设置成套处理。总体: 具有共同性质的个体所组成的集合。(总体内个体的数目用n表示。 分为有限总体和无限总体。)样本:从总体中抽出的若干个个体组成样本。随机样本:从总体中随机抽取的样本。样本容量:样本中所包含的个体数目,用n表示。(样本容量越大,越能代表总体。注意:生物统计中规定,n<30为小样本,n>=30为大样本。)全距:是资料中最大值与最小值之差,又称为极差(range),用r表示自由度:在计算离均差平方和时,能够自由变动的离均差的个数。二项总体:由非此即彼、二者必居其一的对立事件构成的总体。抽样分布:指从总体中按一定的样本容量随机抽取全部所有可能的样本,由这些样

9、本计算的统计数组成的分布。二项分布:二项总体的概率分布,称为二项分布。研究随机变数的取值以及取值对应的概率形成的分布。正态分布:统计推断:根据抽样分布律和概率理论由样本结果(统计数)来推断总体参数的过程。包括统计假设测验和参数估计两方面的内容。参数估计:用样本的统计数对总体参数作出点估计和区间估计。回归分析:对回归模型的资料进行的统计分析。其目的是建立由x预测y的回归方程,并确定给定的x某一值,y将什么范围内变化。回归模型:变数之间存在因果关系相关模型:变数间呈平行变化关系,即变量间相互影响。相关分析:对相关模型的资料进行的统计分析。其目的是测定变数在数量关系上的密切程度和性质。简答题一、 田

10、间试验误差的来源及控制途径来源一:试验材料固有的差异。其控制途径:选材一致、标准一致。来源二:操作管理不一致引起的差异。其控制途径:统一操作标准,一切操作管理、观察测量和数据收集都应以“区组”为单位进行,尽量减少可能发生的差异。来源三:外界环境造成的差异。外界因素中,土壤差异是最主要、最有影响、最难以控制的差异。其控制途径:1)选择肥力均一的试验地; 2)试验中采用适当的小区技术; 3)应用良好的试验设计和统计分析二、各种实验设计的优缺点及其利用1)完全随机设计应用了试验设计的重复和随机两个原则,其优点是设计容易,处理数与重复次数都不受限制,统计分析也比较简单。 主要缺点是没有应用局部控制的原

11、则,试验环境条件差异较大时试验误差较大,试验的精确度较低。常用于土壤肥力均匀一致的田间试验和在实验室、温室、网室中进行的试验。2) 随机区组设计简单;适应性广;能提供无偏误差估计,降低误差;对试验地形要求不严格;试验的处理数目一般不要超过203) 拉丁方设计(区组数目等于重复次数,等于处理数。)优点:双向控制土壤差异,具有较高的精确度;缺点:缺乏随机区组的灵活性,不能将一直行或一横行分开设置,要求有整块平坦的土地;重复数等于处理数,两者相互制约,通常只限4-8个处理。*裂区设计( 多因素试验的一种设计形式。) 1、先按一个因素的各处理设置主处理小区(主区),然后在主区内引进第二个因素的各个处理

12、(副处理),即将主区按副处理再划分小区(副区或裂区)。副处理间的比较比主处理间的比较更为精确。2、应将精确度要求更高的、主要研究的因素作为副区因素。 公式:组中值(组下限组上限)/2 组下限1/ 2组距 组上限1/2组距平均数是反映变数集中性的特征数算术平均数:是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。直接法加权法xi 各组组中值; fi 各组次数;k 分组数。(一)变异数的计算1、极差 r=xmax-xmin2、方差或均方(variance)方差是根据全部观察值来度量资料的变异度的,是能够正确反映资料的变异度的度量方法平方和:样本均方(s2):总体均方(2): 3.

13、标准差(standard deviation) 方差的正根值,可以很好的表示资料的变异度,其单位与观察值的度量单位相同。样本标准差(s)总体标准差()n-1是自由度(degree of freedom,缩写为df)其统计意义是指在计算离均差平方和时,能够自由变动的离均差的个数。 如:有5个观察值,其4个的离均差为3,2,3,6,则第5个离均差必定为8,才能保证离均差之和等于0。 所以,在估计其他统计数时,如果该统计数受k个条件限制,则其自由度应该为nk。4、变异系数变异系数是样本标准差与样本平均数的比值,以百分数形式表示,计算公式(二)标准差的计算1、直接法2、矫正系数法 样本(n30)和未经

14、分组的资料,直接利用下式计算标准差。 3、加权法对于大样本(n30)且已分组的资料,可在次数分布表的基础上采用加权法计算标准差,计算公式为: f为第i组的次数;x为第i组的组中值;n为样本观测值的总个数。理论分布1、二项分布正态分布的定义 若连续型随机变量x的概率密度函数为 为平均数,2为方差,则称随机变量x服从正态分布,记为xn(,2)。标准化变换: =0, 2=1 的正态分布为标准正态分布。 标准正态分布的概率密度函数及概率分布累积函数分别记作f(u)和f(u):随机变量u服从标准正态分布,记作un(0,1)。p(-1u1)=0.6826 p(-2u2)=0.9545 p(-3u3)=0.

15、9973作变换u=(x -),故有p (u1uu2 ) f (u2) f (u1)因此,计算一般正态分布的概率时, 只要将区间的上下限作适当标准化变换, 就可查标准正态分布的概率表求得概率。样本标准误:在实际工作中,总体标准差往往是未知的,因而无法求得 。此时,可用样本标准差s大题统计假设测验的基本步骤和方法1、对样本所属的总体提出统计假设,包括无效假设h0和备择假设ha 。2、确定显著水平值。3、在无效假设为正确的条件下,根据统计数的分布律计算实际差数由误差造成的概率。4、依据“小概率事件实际不可能发生”原理接受或否定无效假设。某地小麦品种的产量为每亩300kg, 。现有一新品种经过25个小

16、区试验后,得亩产量为 330kg,试问这个新品种与当地品种的产量有否显著差异?1、提出假设无效假设:h0:=0=300kg ,即实际差数是由试验误差造成的。说明这个新品种产量与当地一般品种比较差异不显著。备择假设:ha:备择假设 0,即实际差数是试验中处理的效应,不是误差造成的。说明这个新品种与当地品种差异显著。2、确定显著水平:一般定为0.05 3、计算概率:根据u 测验公式计算:4、推断结论:查表:u0.05=1.96,u >1.96落入否定区,否定h0,接受ha。说明这个新品种与当地品种差异显著一尾测验否定区在左尾:为了测验是否显著小于0 h0:0,ha:0否定区在右尾:为了测验是

17、否显著大于0 h0:0,ha:0。例2:某地区10年前普查时,13岁男孩子的平均身高为1.51 m。现抽查200个12.513.5岁男孩,身高平均值为1.53,标准差为0.073m。问10年来该地区男孩子身高是否有明显增高?分析:调查样本较原值是否有明显增长?没有降低的含义,所以是右尾测验。1、提出假设无效假设:h0: 1,该地区男孩子身高没有明显增高。备择假设:ha: > 1 ,该地区男孩子身高有明显增高2、确定显著水平:0.053、计算概率注意: 两尾测验当=0.05时,查附表得u=1.96。一尾测验时,需要将一尾概率乘以2,再查附表(两尾概率表)获得其临界u值。 一尾测验当=0.05时,查附表2 =0.1,则u=1.64 。所以,一尾测验容易否定无效假设。4、推断结论:因为 u >u0.1 =1.64 ,落入否定区,所以否定h0,接受ha,说明地区男孩子身高有明显增高。方差分析方差分析是将总变异分裂为各个因素的相应变异,作出其数量估计,从而发现各个因素在变异中所占的重要程度。除了可控制因素所引起的变异后,其剩余变异又可提供试验误差的准确而无偏的估计,作为统计假设测验的依据。方差分析的基本步骤1、自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论