绪论科学试验及其误差控制_第1页
绪论科学试验及其误差控制_第2页
绪论科学试验及其误差控制_第3页
绪论科学试验及其误差控制_第4页
绪论科学试验及其误差控制_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 绪论科学试验及其误差控制第一节 科学研究与科学试验一、农业和生物学领域的科学研究科学研究是人类认识自然、改造自然、服务社会的原动力。农业和生物学领域的科学研究推动了人们认识生物界的各种规律,促进人们发掘出新的农业技术和措施,从而不断提高农业生产水平,改进人类生存环境。自然科学中有二大类科学,一类是理论科学,一类是实验科学。理论科学研究主要运用推理,包括演绎和归纳的方法。实验科学研究主要通过周密设计的实验来探新。农业和生物学领域中与植物生产有关的专业包括农学、园艺、草业、植物保护、生物技术、农业资源与环境等,所涉及的学科大多数是实验科学。这些领域中科学实验的方法主要有二类,一类是抽样调查

2、,另一类是科学试验。生物界千差万别,变化万端,要准确地描述自然,通常必须通过抽样的方法,使所做的描述具有代表性。同理,要准确地获得试验结果,必须严格控制试验条件,使所比较的对象间尽可能少受干扰而能把差异突出地显示出来。二、科学研究的基本过程和方法 (一) 科学研究的基本过程 科学研究的目的在于探求新的知识、理论、方法、技术和产品。基础性或应用基础性研究在于揭示新的知识、理论和方法;应用性研究则在于获得某种新的技术或产品。在农业科学领域中不论是基础性研究还是应用性研究,基本过程均包括3个环节:(1)根据本人的观察(了解)或前人的观察(通过文献)对所研究的命题形成一种认识或假说;(2)根据假说所涉

3、及的内容安排相斥性的试验或抽样调查;(3)根据试验或调查所获的资料进行推理,肯定或否定或修改假说,从而形成结论,或开始新一轮的试验以验证修改完善后的假说,如此循环发展,使所获得的认识或理论逐步发展、深化。 (二) 科学研究的基本方法 1. 选题 科学研究的基本要求是探新、创新。研究课题的选择决定了该项研究创新的潜在可能性。优秀的科学研究人员主要在于选题时的明智,而不仅仅在于解决问题的能力。最有效的研究是去开拓前人还未涉及过的领域。不论理论性研究还是应用性研究,选题时必须明确其意义或重要性,理论性研究着重看所选课题在未来学科发展上的重要性,而应用性研究则着重看其对未来生产发展的作用和潜力。科学研

4、究不同于平常一般的工作,它需要进行独创性的思维。因此要求所选的课题使研究者具有强烈的兴趣,促进研究者心理状态保持十分敏感。反之若所选的课题并不激发研究者的兴趣,那么这项研究是难以获得新颖的见解和成果的。有些课题是资助者设定的,这时研究者必须认真体会它的确实意义并激发出对该项研究的热情和信心。2. 文献 科学的发展是累积性的,每一项研究都是在前人建筑的大厦顶层上添砖加瓦,这就首先要登上顶层,然后才能增建新的层次,文献便是把研究工作者推到顶层,掌握大厦总体结构的通道。选题要有文献的依据,设计研究内容和方法更需文献的启示。查阅文献可以少走弯路,所花费的时间将远远能为因避免重复、避免弯路所节省的时间所

5、补偿,绝对不要吝啬查阅文献的时间和功夫。科学文献随着时代的发展越来越丰富。百科全书是最普通的资料来源,它对于进入一个新领域的最初了解是极为有用的。文献索引是帮助科学研究人员进入某一特定领域作广泛了解的重要工具。专业书籍可为所进入的领域提供一个基础性的了解。评论性杂志可使科学研究人员了解有关领域里已取得的主要成绩。文摘可帮助研究人员查找特定领域研究的结论性内容,使之跟上现代科学前进的步伐。科学期刊和杂志登载最新研究的论文,它介绍一项研究的目的、材料、方法以及由试验资料推论到结果的全过程,优秀的科学论文,可给人们以研究思路和方法上的启迪。各个有实力的研究机构都十分重视图书、期刊、文献的搜集,图书馆

6、是研究人员工作的一个关键场所。现代通信和网络技术的发展,使一些期刊、杂志通过网络为研究人员提供服务,今后计算机及网络系统将可能是文献探索的主要工具。3. 假说 在提出一项课题时,对所研究的对象总有一些初步的了解,有些来自以往观察的累积,有些来自文献的分析。因而围绕研究对象和预期结果之间的关系,研究者常已有某种见解或想法,即已构成了某种假说,而须通过进一步的研究来证实或修改已有的假说。一项研究的目的和预期结果总是和假说相关联的,没有形成假说的研究,常常是含糊的、目的性不甚明确的。即便最简单的研究,例如进行若干个外地品种与当地品种的比较试验,实际上有其假说,即“某地引入种可能优于当地对照种”,只不

7、过说这类研究的假说比较简单而已。简单的假说只是某些现象的概括;复杂的假说则要进一步假定出各现象之间的联系,这种联系可能是平行的,也可能是因果的,复杂的假说中甚至还可能包含类推关系。假说只是一种尝试性的设想,即对于所研究对象的试探性概括,在它没有被证实之前,决不能与真理、定律混为一谈。科学的基本方法之一是归纳,从大量现象中归纳出真谛;演绎是科学的另一基本方法,当构思出一个符合客观事实的假说时,可据此推演出更广泛的结论。这中间形式逻辑是必要的演绎工具。自然科学研究人员应自觉地训练并用好归纳、演绎以及形式逻辑的方法。4. 假说的检验 假说有时也表示为假设。在许多研究中假设是简单的,它们的推论也很明确

8、。对假说进行检验,可以重新对研究对象进行观察,更多的情况是进行实验或试验,这是直接的检验。有时也可对假说的推理安排试验进行验证,这是一种间接的检验,验证了所有可能的推理的正确性,也就验证了所做的假说本身,当然这种间接的检验要十分小心,防止漏洞。5. 试验的规划与设计 围绕检验假说而开展的试验,需要全面、仔细地规划与设计。试验所涉及的范围要覆盖假说涉及的各个方面,以便对待检验的假说可以作出无遗漏的判断。比较是科学研究中常用的方法,有比较才有鉴别。农业和生物学领域的研究中常常采用比较试验的方法,从比较中确定出最确凿的理论、方法和技术。比较研究中十分重要的是选定恰当的比较标准。比较试验中比较的对象不

9、一定只有两个,可以是一组对象间的比较。这组比较的对象是按假说的内涵选定的,称为一组处理。这一组处理可能是某一因子(因素)量的不同级别或质的不同状态(水平),也可能是不同因子(因素)的不同级别(或状态)的组合,全部处理规定了整个研究的内容和范围,称为试验方案,这是狭义的理解。广义的试验方案是指包括实施步骤在内的整个试验计划。确定试验方案是试验规划与设计的核心部分。如上所述,试验方案中必须明确比较的标准或对照处理。农业和生物学的试验中十分重视试验结果的代表性和重演性,从而可以明确研究结果的适用范围和稳定程度。因而要求试验材料和试验的环境条件有代表性。这是因为作为试验材料的生物体是存在遗传分化的,作

10、为应用试验结果的地点是有地理、季节、土壤等环境差异的。设计一项试验时必须考虑到试验材料和试验环境的代表性和典型性。农业和生物学试验中供试的一组处理间的差异是在一定的试验条件下在供试材料身上体现出来的,因而要确切暴露出处理间或供试因子、级别间的差异,必须严格控制供试材料及试验条件的一致性;在多个因子的试验时还要将所比较的那个因子以外的因子控制在相同的水平上。这是比较试验的“唯一差异”原则。供试的生物体、试验条件除了因系统的原因有变异外,还有许多偶然因素所致的变异。试验研究应严格排除这种系统性的变异。剩下的偶然性波动确实是不能完全控制的。一个试验中试验结果(数据)包含了这种偶然性波动,要正确地从试

11、验数据提取结论必须与试验的偶然性波动相比较,只有证实试验表现出来的效应显然不是偶然性波动所致,才能合乎逻辑地作出正确的结论。因而在设计试验时必须考虑到可以确切估计出排除了系统误差的试验效应和试验的偶然性误差,从而在两者的比较中引出关于试验对象的结论。农业和生物学的试验中常将排除系统误差和控制偶然误差的试验设置称为试验设计,这是狭义的理解,广义的理解则是指整个研究工作的设计。第二节 试验方案一、试验因素与水平如上节所述,试验方案是根据试验目的和要求所拟进行比较的一组试验处理(treatment)的总称。农业与生物学研究中,不论农作物还是微生物,其生长、发育以及最终所表现的产量受多种因素的影响,其

12、中有些属自然的因素,如光、温、湿、气、土、病、虫等,有些是属于栽培条件的,如肥料、水分、生长素、农药、除草剂等。进行科学试验时,必须在固定大多数因素的条件下才能研究一个或几个因素的作用,从变动这一个或几个因子的不同处理中比较鉴别出最佳的一个或几个处理。这里被固定的因子在全试验中保持一致,组成了相对一致的试验条件;被变动并设有待比较的一组处理的因子称为试验因素,简称因素或因子(factor),试验因素的量的不同级别或质的不同状态称为水平(level)。试验因素水平可以是定性的,如供试的不同品种,具有质的区别,称为质量水平;也可以是定量的,如喷施生长素的不同浓度,具有量的差异,称为数量水平。数量水

13、平不同级别间的差异可以等间距,也可以不等间距。所以试验方案是由试验因素与其相应的水平组成的,其中包括有比较的标准水平。试验方案按其供试因子数的多少可以区分为以下3类:(1) 单因素试验(single-factor experiment) 单因素试验是指整个试验中只变更、比较一个试验因素的不同水平,其他作为试验条件的因素均严格控制一致的试验。这是一种最基本的、最简单的试验方案。例如在育种试验中,将新育成的若干品种与原有品种进行比较以测定其改良的程度,此时,品种是试验的唯一因素,各育成品种与原有品种即为各个处理水平,在试验过程中,除品种不同外,其它环境条件和栽培管理措施都应严格控制一致。又例如为了

14、明确某一品种的耐肥程度,施肥量就是试验因素,试验中的处理水平就是几种不同的施肥量,品种及其它栽培管理措施都相同。(2) 多因素试验(multiple-factor or factorial experiment) 多因素试验是指在同一试验方案中包含2个或2个以上的试验因素,各个因素都分为不同水平,其他试验条件均应严格控制一致的试验。各因素不同水平的组合称为处理组合(treatment combination)。处理组合数是各供试因素水平数的乘积。这种试验的目的一般在于明确各试验因素的相对重要性和相互作用,并从中评选出1个或几个最优处理组合。如进行甲、乙、丙3个品种与高、中、低3种施肥量的2因素

15、试验,共有甲高、甲中、甲低、乙高、乙中、乙低、丙高、丙中、丙低等33=9个处理组合。这样的试验,除了可以明确2个试验因素分别的作用外,还可以检测出3个品种对各种施肥量是否有不同反应并从中选出最优处理组合。生物体生长受到许多因素的综合作用,采用多因素试验,有利于探究并明确对生物体生长有关的几个因素的效应及其相互作用,能够较全面地说明问题。多因素试验的效率常高于单因素试验。(3) 综合性试验(comprehensive experiment) 这也是一种多因素试验,但与上述多因素试验不同。综合性试验中各因素的各水平不构成平衡的处理组合,而是将若干因素的某些水平结合在一起形成少数几个处理组合。这种试

16、验方案的目的在于探讨一系列供试因素某些处理组合的综合作用,而不在于检测因素的单独效应和相互作用。单因素试验和多因素试验常是分析性的试验;综合性试验则是在对于起主导作用的那些因素及其相互关系已基本清楚的基础上设置的试验。它的处理组合就是一系列经过实践初步证实的优良水平的配套。例如选择一种或几种适合当地条件的综合性丰产技术作为试验处理与当地常规技术作比较,从中选出较优的综合性处理。二、试验指标与效应 用于衡量试验效果的指示性状称试验指标(experimental indicator)。一个试验中可以选用单指标,也可以选用多指标,这由专业知识对试验的要求确定。例如农作物品种比较试验中,衡量品种的优劣

17、、适用或不适用,围绕育种目标需要考察生育期(早熟性)、丰产性、抗病性、抗虫性、耐逆性等多种指标。当然一般田间试验中最主要的常常是产量这个指标。各种专业领域的研究对象不同,试验指标各异。例如研究杀虫剂的作用时,试验指标不仅要看防治后植物受害程度的反应,还要看昆虫群体及其生育对杀虫剂的反应。在设计试验时要合理地选用试验指标,它决定了观测记载的工作量。过简则难以全面准确地评价试验结果,功亏一篑;过繁琐又增加许多不必要的浪费。试验指标较多时还要分清主次,以便抓住主要方面。试验因素对试验指标所起的增加或减少的作用称为试验效应(experimental effect)。例如,某水稻品种施肥量试验,每亩施氮

18、10kg,亩产量为350kg,每亩施氮15kg,亩产量为450kg;则在每亩施氮10kg的基础上增施5kg的效应即为450-350=100(kg/亩)。这一试验属单因素试验,在同一因素内两种水平间试验指标的相差属简单效应(simple effect)。在多因素试验中,不但可以了解各供试因素的简单效应,还可以了解各因素的平均效应和因素间的交互作用。表1.1为某豆科植物施用氮(N)、磷(P)的22=4种处理组合(N1P1,N1P2,N2P1,N2P2)试验结果的假定数据,用以说明各种效应。(1)一个因素的水平相同,另一因素不同水平间的产量差异仍属简单效应。如表中18-10=8就是同一N1水平时P2

19、与P1间的简单效应;28-16=12为在同一N2水平时P2与P1间的简单效应;16-10=6为同一P1水平时N2与N1间的简单效应;28-18=10为同一P2水平时N2与N1间的简单效应。(2)一个因素内各简单效应的平均数称平均效应,亦称主要效应(main effect),简称主效。如表中N的主效为(6+10)/2=8,这个值也是二个氮肥水平平均数的差数,即22-14=8;P的主效为(8+12)/2=10,也是二个磷肥水平平均数的差数,即23-13=10。(3)两个因素简单效应间的平均差异称为交互作用效应(interaction effect),简称互作。它反映一个因素的各水平在另一因素的不同

20、水平中反应不一致的现象。将表以图表示,可以明确看到,中的二直线平行,反应一致,表现没有互作。交互作用的具体计算为(8-8)/2=0,或(6-6)/2=0。图中P2-P1在N2时比在N1时增产幅度大,直线上升快,表现有互作,交互作用为(12-8)/2=2,或为(10-6)/2=2,这种互作称为正互作。图1.1和中,P2-P1在N2时比在N1时增产幅度表现减少或大大减产,直线上升缓慢,甚至下落成交叉状,这是有负互作。中的交互作用为(4-8)/2=-2,中为(-2-8)/2=-5。表 22试验数据(解释各种效应)试验因素NP水平N1N2平均N2-N1P1101613 6P2182421 6平均142

21、0 6P2-P1 8 880,0/2=0P水平N1N2平均N2-N1P1101613 6P218282310平均1422 8P2-P1 812104,4/2=2P水平N1N2平均N2-N1P1101613 6P2182019 2平均1418 4P2-P1 8 46-4,-4/2=-2P水平N1N2平均N2-N1P1101613 6P2181416-4平均1415 1P2-P1 8-23 -10,-10/2=-5因素间的交互作用只有在多因素试验中才能反映出来。互作显著与否关系到主效的实用性。若交互作用不显著,则各因素的效应可以累加,主效就代表了各个简单效应。在正互作时,从各因素的最佳水平推论最优

22、组合,估计值要偏低些,但仍有应用价值。若为负互作,则根据互作的大小程度而有不同情况。中由单增施氮(N2P1)及单增施磷(N1P2)来估计氮、磷肥皆增施(N2P2)的效果会估计过高,但N2P2还是最优组合,还有一定的应用价值。而中N2P2反而减产,如从各因素的最佳水平推论最优组合将得出错误的结论。图1.1 22试验的图示(解释交互作用)两个因素间的互作称为一级互作(first order interaction)。一级互作易于理解,实际意义明确。三个因素间的互作称二级互作(second order interaction),余类推。二级以上的高级互作较难理解,实际意义不大,一般不予考察。三、制订

23、试验方案的要点拟订一个正确有效的试验方案,以下几方面供参考: 1. 拟订试验方案前应通过回顾以往研究的进展、调查交流、文献探索等明确试验的目的,形成对所研究主题及其外延的设想,使待拟订的试验方案能针对主题确切而有效地解决问题。2. 根据试验目的确定供试因素及其水平。供试因素一般不宜过多,应该抓住12个或少数几个主要因素解决关键性问题。每因素的水平数目也不宜过多,且各水平间距要适当,使各水平能有明确区分,并把最佳水平范围包括在内。例如通过喷施矮壮素以控制某种植物生长,其浓度试验设置50、100、150、200、250ppm等5个水平,其间距为50ppm。若间距缩小至10ppm便须增加许多处理,若

24、处理数不多,参试浓度的范围窄,会遗漏最佳水平范围,而且由于水平间差距过小,其效应因受误差干扰而不易有规律性地显示出来。如果涉及试验因素多,一时难以取舍,或者对各因素最佳水平的可能范围难以作出估计,这时可以将试验分为两阶段进行,即先做单因素的预备试验,通过拉大幅度进行初步观察,然后根据预备试验结果再精细选取因素和水平进行正规试验。预备试验常采用较多的处理数,较少或不设重复;正规试验则精选因素和水平,设置较多的重复。为不使试验规模过大而失控,试验方案原则上应力求简单,单因素试验可解决的就不一定采用多因素试验。3. 试验方案中应包括有对照水平或处理,简称对照(check,符号CK)。品种比较试验中常

25、统一规定同一生态区域内使用的标准(对照)种,以便作为各试验单位共同的比较标准。4. 试验方案中应注意比较间的唯一差异原则,以便正确地解析出试验因素的效应。例如根外喷施磷肥的试验方案中如果设喷磷(A)与不喷磷(B)两个处理,则两者间的差异含有磷的作用,也有水的作用,这时磷和水的作用混杂在一起解析不出来,若加进喷水(C)的处理,则磷和水的作用可分别从A与C及B与C的比较中解析出来,因而可进一步明确磷和水的相对重要性。5. 拟订试验方案时必须正确处理试验因素及试验条件间的关系。一个试验中只有供试因素的水平在变动,其他因素都保持一致,固定在某一个水平上。根据交互作用的概念,在一种条件下某试验因子的最优

26、水平,换了一种条件,便可能不再是最优水平,反之亦然。这在品种试验中最明显。例如在生产上大面积推广的扬麦1号小麦品种、农垦58号水稻品种,在品比试验甚至区域试验阶段都没有显示出它们突出的优越性,而是在生产上应用后,倒过来使主管部门重新认识其潜力而得到广泛推广的。这说明在某种试验条件下限制了其潜力的表现,而在另一种试验条件下则激发了其潜力的表现。因而在拟订试验方案时必须做好试验条件的安排,绝对不要以为强调了试验条件的一致性就可以获得正确的试验结果。例如品种比较试验时要安排好密度、肥料水平等一系列试验条件,使之具有代表性和典型性。由于单因子试验时试验条件必然有局限性,可以考虑将某些与试验因素可能有互

27、作(特别负互作)的条件作为试验因素一起进行多因素试验,或者同一单因素试验在多种条件下分别进行试验。6. 多因素试验提供了比单因素试验更多的效应估计,具有单因素试验无可比拟的优越性。但当试验因素增多时,处理组合数迅速增加,要对全部处理组合进行全面试验(称全面实施)规模过大,往往难以实施,因而以往多因素试验的应用常受到限制。解决这一难题的方法就是利用本书后文将介绍的正交试验法,通过抽取部分处理组合(称部分实施)用以代表全部处理组合以缩小试验规模。这种方法牺牲了高级交互作用效应的估计,但仍能估计出因素的简单效应、主要效应和低级交互作用效应,因而促进了多因素试验的应用。第三节 试验误差及其控制一、试验

28、数据的误差和精确性通过试验的观察或测定,获得试验数据,这是推论试验结果的依据。然而研究工作者获得的试验数据往往是含有误差的。例如测定一个大豆品种南农88-48的蛋白质含量,取一个样品(specimen)测得结果为%,再取一个样品测得结果为%,两者是同一品种的豆粒,理论上应相等,但实际不等,如果再继续取样品测定,所获的数据均可能各不相等,这表明实验数据确有误差。通常将每次所取样品测定的结果称为一个观察值(observation),以y表示。理论上这批大豆种子的蛋白质含量有一个理论值或真值,以表示,则,即观察值=真值+误差,每一观察值都有一误差,可正,可负,。若上述大豆种子是在冷库中保存的,另有一

29、部分是在常温下保存的,也取样品测定其蛋白质含量,其结果为%,%,同样每一观察值均包含有误差。但比较冷库的种子和常温的种子,在常温条件下长期保存后,其蛋白质含量有所降低。照理两者都是同一品种、同一田块里收获来的种子,其蛋白质含量应相同。但实际不同,有误差,这种误差是能追溯其原因的。因而对同一块田里同一品种种子蛋白质含量的测定,观察值间存在变异,这种变异可归结为两种情况,一种是完全偶然性的,找不出确切原因的,称为偶然性误差(spontaneous error)或随机误差(random error);另一种是有一定原因的称为偏差(bias)或系统误差(systematic error)。若以上例中冷

30、库保存的大豆种子为比较的标准,其种子蛋白质含量的观察值可表示为: 在常温下保存的大豆种子蛋白质含量的观察值可表示为: 式中,代表南农88-48大豆品种蛋白质含量的真值(理论值),、分别为每一样品观察值的随机误差,则为室温保存下(可能由于呼吸作用)导致的偏差或系统误差。两种保存方法下蛋白质含量的差数 包含了系统偏差和随机误差两个部分。 a b c d图1.2 由打靶图示试验的准确性与精确性试验数据的优劣是相对于试验误差而言的。系统误差使数据偏离了其理论真值;偶然误差使数据相互分散。因而系统误差(值)影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度;而偶然误差(、值)影响了数据的精确性

31、,精确性是指观测值间的符合程度。图1.2以打靶的情况来比喻准确性和精确性。以中心为理论真值,a表示5枪集中在中心,准而集中,具有最佳的准确性和精确性;b表示5枪偏离中心有系统偏差但很集中,准确性差,而精确性甚佳;c表示5枪既打不到中心,又很分散,准确性和精确性均很差;d表示5枪很分散,但能围绕中心打,平均起来有一定准确性,但精确性很差。农业和生物学试验中,常常采用比较试验来衡量试验的效应。如果两个处理均受同一方向和大小的系统误差干扰,这往往对两个处理效应之间的比较影响不大。当然若两处理分受两种不同方向和大小系统误差的干扰,便严重影响两个处理效应间的真实比较了。但一般的试验,只要误差控制得好,后

32、面一种情况出现较少。因而研究工作者在正确设计并实施试验计划的基础上,十分重视精确性或偶然误差的控制,因为这直接影响到后文所要介绍的统计推论的正确性。二、试验误差的来源 研究工作者通过试验获得了观测值,其目的是要了解研究对象的真值。若观察中包含了大量的误差便无法由观察值对真值做出估计,因而必须尽量减少误差的干扰。如上所述,系统误差是一种有原因的偏差,因而在试验过程中要防止这种偏差的出现。在各种领域的研究工作中系统偏差出现的原因多种多样,难以一概而论,因而要求各种领域的研究人员熟知本领域研究中产生系统偏差的常发性因素。这有赖于经验的积累。请教同行专家是也十分重要的。导致系统偏差的原因可能不止一个,

33、方向也不一定相同,所以实际观察的系统偏差往往是多种偏差的复合。田间试验是农业和生物学研究中最常用的研究手段,它比之其他研究有很多特殊性,其中最主要的是将生物体的反应作为试验指标,而试验又是在开放的自然条件下进行的,生物体及自然界的气候、土壤本身都存在很多变异,因而田间试验的误差控制是尤其重要的。下一章将专门讨论田间试验的误差来源,尤其是系统误差的来源。一般讲,随机误差是偶然性的。整个试验过程中涉及的随机波动因素愈多,试验的环节愈多,时间愈长,随机误差发生的可能性及波动程度便愈大。随机误差不可能避免,但可以减少,这主要依赖于控制试验过程,尤其那些随机波动性大的因素。不同专业领域有其各自的主要随机

34、波动因素,这同样须有经验的积累,成熟的研究人员是熟知其关键的。理论上,系统误差是可以通过试验条件及试验过程的仔细操作而控制的。实际上一些主要的系统性偏差较易控制,而有些细微偏差则较难控制。一般研究工作在分析数据时把误差中的一些主要偏差排除以后,剩下都归结为随机误差,因而估计出来的随机误差有可能比想像的要大,甚至大得多。三、随机误差的规律性图1.3 随机误差的分布模式理论上,系统偏差源自某种系统性原因,只要仔细检查,它是有规律可循的。至于随机误差,只要确实是随机波动所致,也有其变化规律的。仍以大豆品种蛋白质含量的测定为例,若从一批种子中抽取100份样品,分别进行蛋白质含量的测定,若无系统偏差的干

35、扰,则所获100个数据,将其平均数当作理论真值(上加帽子表示这100个数据所属总体真值的估计值),根据可计算出100个误差值。这100个误差值有“+”有“-”,平均起来正负相抵消等于0。若将其画成坐标图,接近于一个对称的钟形图(图1.3),在靠近0的+、-范围内出现的误差次数多,越远离0出现的次数越少。这种随机误差的分布在第四章中将介绍是一种正态分布。许多以数量表示的观察值的误差常常属于这种模式。了解随机误差的这种模式对以后判断试验结果的表面效应是误差所致,还是一种真实的处理效应所致是至关重要的。以上单个样品蛋白质含量测定的误差可用作表示,若测定了多个样品则可用多个样品平均数作代表,表示该品种

36、的平均蛋白质含量。显然在平均过程中正负误差抵消了一部分,因而平均数与单个观察值相比,虽然存在随机误差,但平均后要小得多。这里要强调,多个观察值的平均数既然是由单个观察值平均得来的,必然也存在随机误差。当然观察值个数越多,其平均数由于正负相互抵消的作用越大而且也加以平均,因而误差便越小。既然平均数的误差是随机误差,因而它也像观察值的误差一样,具有相同的规律性,只是向0集中得更明显。四、随机误差的层次性仍以大豆品种蛋白质含量测定为例,以上在冷藏的种子中取样品作测定,通常要均匀取约30克种子,磨碎烘干后用克氏法做测定。若取了100个30克的样品进行测定,尽管取种子时很注意从各个部位都取到,但这100

37、个样品的结果,在严格控制分析技术时100个数据间仍然有变异,表明有随机误差存在。实际上进行克氏定氮时一般只从30克豆粉中取出2克进行分析,技术人员在每次测定时要多次称重、消化、移液,这过程中往往也有随机因素的影响使结果有波动,因而一般对同一份样品(30克)进行2次测定,若两者相对相差不大便不再做第3次测定,否则要进行第3次分析直至有2个数据相一致为止。从这里可以看到大豆蛋白质测定中抽取样品时,因为取样过程的随机性存在取样的随机误差,对于同一份样品理论上应相同,但实际分析结果两次测定间仍有随机误差,这一随机误差是由于测定过程中的随机因素所导致的,而前者是取样过程的随机性所导致的,两者虽都是随机误

38、差,但发生的时段或层次不一样,因此,随机误差具有层次性。这里前一阶段的是取样误差,后一阶段的是测定过程误差。此时,观测值可表示为:式中表示前一阶段误差,表示第二阶段误差。既然不同阶段存在不同的随机误差,而关于试验结果的推断是与随机误差作出比较后作出的,因此研究工作者要注意推断的性质与误差的性质保持一致。五、试验误差的控制根据以上关于试验误差来源的分析,研究工作者为保证试验结果的正确性,必须针对各种可能的系统偏差原因预防多种多样的系统误差;同时针对不同阶段、不同层次偶然性因素造成的随机误差分别尽量控制这种不同阶段、不同层次上发生的随机误差,使之尽量缩小。关于田间试验的两类误差的控制将在第二章介绍

39、,至于其他各种领域实验室或温室试验的误差控制,要按上述原则具体分析、对待。试验中的误差控制常依赖于经验的积累,而细心的研究工作者往往少走弯路。第四节 试验统计学的发展和本课程的主要内容一、试验统计学的发展对农业和生物学研究工作者来说,试验统计学作为一门系统的学科奠基于1925年R.A. Fisher出版的“Statistical Methods for Research Workers”,该书形成了试验统计学较为完整的体系。在这以前23个世纪内已经积累了有关概率、分布和统计方法的一些要素。在这以后由于农业和生物学研究的发展,生物统计、试验设计和抽样理论得到了快速发展。以后工业研究和数理科学研究

40、的发展推动了数理统计的发展,反过来又促进了试验统计学科的发展。统计(statistics)是一个古老的政治术语,原用之于国家管理需要的统计数字,后来则将统计学看作为实验数据搜集、分析及推论的理论、方法和科学。试验统计学是统计学的一个部分,它是统计学与试验设计相结合而发展起来的。试验统计学的发展也是与随机误差和误差控制的研究紧密相关联的。以下一些研究进展为试验统计学的建立与发展奠定了基础:17世纪Pascal 和Fermat的概率论;18世纪De Moivre、Laplace和Gauss的正态分布理论;19世纪达尔文应用统计方法研究生物界的连续性变异;孟德尔应用统计方法发现显性、分离、独立分配等遗传定律;Karl Pearson用统计方法研究进化问题,并创建了Biometrika杂志;Galton研究了亲子身高的回归问题;20世纪以来Gosset用实验方法发现了t分布;Fisher提出了方差分析,建立了试验设计的三大原

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论