版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章试验设计与描述性统计
Fieldexperimentdesignanddiscriptivestatistic
基本概念(BasicConcepts)第一节试验设计(experimentdesign)第二节描述性统计(discriptiveStatistic)几个基本概念:总体(population)是指在同一组条件下所有成员的某种性状变量的集合,或者说是某一变数的全部可能值的集合。有无限总体(infinitepopulation)和有限总体(finitepopulation)之分。参数(parameter)是指描述总体的特征数,如总体平均数、总体标准差、总体方差等等。样本(sample)是指从总体中抽出的一个部分。大样本-个体数>30,小样本-个体数≤30。统计数(statistic)是指描述样本的特征数,如样本平均数、样本标准差、样本方差等等。变数(variable)是指某种性状或特性的有变化的数据。观察值(observation)是指每一个体的某一性状、特性的测定数值。试验因素(experimentalfactor)水平(level)是指因素内设置的不同处理级别。处理(treatment)是指试验因素不同水平的组合。随机样本(RandomSample):从总体中随机抽取的样本。试验指标(Experimentalindicator):衡量试验效果的指示性状。试验效应(Experimentaleffect):试验因素对试验指标所起的增或减作用。准确度(Accuracy):同一处理的观察值与其真实值的接近程度。精确度(Precision):同一处理的重复观察值间彼此接近程度。试验单元(ExperimentalUnit):是指接受某种处理的最小的一个独立的试验材料单位。如一张叶片、一个果实、一个枝条、一个植株等。误差(Error):观察值与处理真实值间的偏离程度。系统误差(SystematicError):观察值与处理真实值间出现有一定方向的系统偏离,如供试材料的遗传背景、仪器等方面存在的可辨识的差别所造成的误差。随机误差(RandomError):观察值与处理真实值间出现的大小、方向不同的微小差异。如在试验单元、管理方法、操作方法等方面存在的不可辨识的差别所造成的误差。样本含量(SampleSize/Capacity):样本中所包含的个体数目。第一节试验设计experimentdesign试验是在人为控制条件下有目的地进行的一种实践活动。试验方案是根据试验目的和要求所进行比较的一组试验处理的总称。在进行科学试验时,必须在固定大多数因素的条件下才能研究一个或者几个因素的作用。一、试验类型(1)按照试验环境田间试验、温室试验、实验室试验、皿内试验、人工气候试验、室内试验等等。(2)按照供试因子的多少单因素试验、多因素试验、综合性试验(各因素的各个水平不构成平衡的处理组合,而是将若干个因素某些水平结合在一起形成少数几个处理组合,目的在于探索综合作用,不在于检测因素的单独效应和相互作用)。二、试验的基本要求目的明确结果可靠试验条件有代表性试验结果能够重复●●●●●即准确又精确●●●●●准确而不精确●●●●●即不准确又不精确●●●●●精确而不准确精确度和准确度的关系试验模型供试体输入处理输出试验指标随机干扰Fig.1Generalmodelofexperiment试验指标是指用于衡量试验效果的指示性状。输入(处理)供试体输出(观察响应)随机干扰(也是一种输入)UxFig.1Mathematicalmodelofexperiment
离散的测定几个点,采用统计学的方法经验的估计x=f(U)(如上图所示),显然观测点未必都在曲线上。如果估计出了x=f(U),我们就掌握了x随U而变化的规律,就可以进行预测和控制,这个曲线称为响应曲线(曲面)。离地面不同高度孢子捕捉器捕捉到的苹果黑星菌子囊孢子数量三、处理设计田间试验按试验小区大小、试验年份、试验地点等可分为若干类,但最基本的是根据试验因素可将田间试验分为:单因素试验(Single-factorexperiment)仅研究某一个问题,如施肥对产量的影响,可以包含肥料的不同等级。优点:试验简单,容易分析、但是不能了解各因素之间的关系。多因素试验(Multiple-factorexperiment)中包含了不同因素及不同水平的组合。优点:便于了解各因素之间的相互关系,试验复杂,设计不妥时不便于分析。综合试验(Comprehensiveexperiment)是在进行多因素研究之后,将重要因素重新组合,进行试验分析,各因素的水平不需要构成平衡处理。四、试验单元的排列方式试验设计的目的是避免系统误差,缩小随机误差,以保证试验的准确度和精确度。试验设计的三个基本原理:重复(Replication):重复的作用(1)若试验中没有系统误差存在,只有随机误差,则可用处理多次重复观察值间的参差不弃程度来估计随机误差。只有1次重复就无法估计随机误差(2)同一处理多次观察值的平均值是处理真值的最好估计。随机化(Randomization):通过试验单元的随机化排列来消除试验单元间的系统误差。局部控制(Localcontrol):将整个试验空间分成若干个各自相对均匀的局部(区组),所有的区组构成区组因素。作用(1)可将系统误差分离出来增加准确度;(2)区组内保证试验单元的一致性,增加精确度。随机化排列重复I重复IIbcdefgck2ckckheabcfgdaabcdefghck1、田间试验设计ckabcgedf利用查表或产生随机数的方法进行设计ck2五、局部控制1、田间试验设计abcdefck设置重复随机化排列局部控制消除系统误差,无偏试验误差估计估计和降低随机误差与随机化结合分离系统误差降低随机误差提高准确度和精确度保证统计推断的可靠性试验类型(二)
试验设计可以归纳为全面实施试验和部分实施试验两种类型。全面实施试验分为顺序排列的试验设计和随机排列的试验设计两大类。前者常用在处理数量大、精确度要求不高、不须作统计推断的预备试验,容易发生系统误差;后者强调有合理的试验误差估计,常用于对精确度要求较高的试验。全面实施试验(全因子试验)一、顺序排列的试验设计对比法设计(contrastdesign)常用于少数处理试验及示范性试验,其试验单元排列特点是处理单元直接排列在对照区旁边,使每一小区可与其邻旁的对照区直接比较。IIIIII1CK23CK45678CKCK7CK81CK23456CKCK5CK67CK81234CKCK常用的田间试验设计2.间比法设计(intervalcontrastdesign)常用处理试验单元较多的试验,要求不高,但用随机区组排列有困难的试验。其试验单元排列特点是第一个小区和末尾小区一定是对照,每二个对照之间排列相同数目的处理小区,通常是4或9个,重复2-4次。CKCKCKCK12345678910111212个小麦品种的间比法排列二、随机排列的试验设计完全随机设计(completelyrandomdesign)将各个处理随机分配到各个试验单元(或小区)中,每一个处理的重复数可以相等或不相等。这种设计灵活机动,单因素和多因素均可使用。2.随机区组设计(randomizedblockdesign)亦称完全随机区组设计(randomcompleteblockdesign)根据局部控制的原则将试验地划分为等于重复次数的区组,一个区组安排一个重复,区组内各处理都独立随机排列。主要特点(1)简单;(2)适应性广;(3)能提供无偏的误差估计,降低误差;(4)对试验地形要求不严格;(5)试验的处理数目一般不要超过20。74211317368548732164524887566532IIIIIIIV肥力梯度:8个品种4次重复的随机区组排列3.拉丁方设计(latinsquaredesign)将各个处理从纵横两个方向排列为区组(或重复),使每一个处理在每一列和每一行中出现的次数相等(通常一次)。所以它比随机区组多一个方向进行局部控制的随机排列设计。拉丁方设计具有双向控制土壤差异的作用,有较高的精确度,但缺乏伸缩性,适应于4-8个处理的试验设计。ABCDEBCDEACDEABDEABCEABCD4.裂区设计(split-plotdesign)是多因素试验的一种设计形式。先按一个因素设计主处理小区(mainplot),然后在这个主处理小区内引进第二个因素的各个处理的小区(副区或裂区,split-plot)。152541243634362651高低中653231163142465254低中高246532142135461653高中低IIIIII6个品种、3种施肥量再裂区设计(split-splitplotdesign)若在裂区试验中需要引进第三个因素时,可以进一步裂区,将第三个因素的各个处理随机排列在裂区内。条区设计(stripblocksdesign)条区设计是裂区设计的一种衍生设计,当要研究的两个因素都需要较大的小区面积,且为了便于观察和管理,将每个区组划分为纵向长条形小区,安排第一个因素的各个处理,再将各个区组划分为若干个横向长条形小区,安排第二个因素的各个处理。部分实施试验(部分因子试验)正交设计(orthogonaldesign):两个重要的特点:(1)每列中因素各水平数字出现的次数相等,即整齐可比性;(2)任两列放在一起,他们的行构成一个有序数对,这样的数对出现的次数也相等。或者说任两列之间的所有可能的水平组合都出现,且出现的次数均等。即均衡分散性。具有这样特点的数表称为正交表。正交表是正交拉丁方的推广。一般用LN(mk)表示正交表,N为试验次数;k为所能容纳的最多因素数;m为每个因素的水平数。如L8(27)。
假设我们要做一个三因素二水平的试验,若已知不需要考虑任何交互作用,可以用L4(23)表,但在这种情况下,误差项Sse分离不出来,无法作统计检验,只能直观比较哪个水平好。若存在交互作用,就会迭加在其它列上,从而得到错误的结果。因此,若不能排除存在交互作用的可能,则应利用L8(27)表。12345671111111121112222312211224122221152121212621221217221122182212112ColRow表头设计:首先将A、B放在第1,2列上,查交互作用表,他们的交互作用AB在第3列,因此,C因素不能放在第3列上,应放在第4列上,AC放在第5列上,BC放在第6列上,ABC放在第7列上,真正安排时只用1,2,4列。若ABC不存在,则第7列可作为误差e,这样就得到了表头设计如下:因素ABABCACBCe列号1234567第二节描述性统计DescriptiveStatistics一、试验资料的性质与分类1.数量性状资料(quantitativetrait)采用计数和量测两种方式所得到的数据。间断性变数Discontinuousordiscretevariable连续性变数continuousvariable小麦基本苗数、菌落数、穗数、分孽数等等病斑长度、作物产量、株高、土壤水分含量等等2.质量性状资料(qualitativetrait)观察而不能量测性状,如菌落的颜色、麦穗有无芒等等。统计次数法给分法统计具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数给予每类性状以相对数量的方法,如小麦籽粒有红白两种颜色,可用0表示白色,用1表示红色二、次数分布表将试验所得到的大量未加整理的数据,按观察值大小或数据类别进行分组,制成关于观察值不同组别或不同分类单位的次数分布表,就可以看出资料中不同表现的观察值与其频率间的规律性,从而
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论