生统 第五章 方差分析_第1页
生统 第五章 方差分析_第2页
生统 第五章 方差分析_第3页
生统 第五章 方差分析_第4页
生统 第五章 方差分析_第5页
已阅读5页,还剩172页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生统第五章方差分析2023/2/26第一页,共一百七十七页,2022年,8月28日一、为什么要学习方差分析?第四章学习的t测验方法,只适于比较只有两个试验处理的平均数间差异是否显著。对于多个处理平均数间的差异显著性比较(或差异显著性测验),如仍采用t测验方法,就会表现出下列一些问题:

第二页,共一百七十七页,2022年,8月28日若进行5个处理平均数间的差异显著性比较,则需进行C25=10次t测验,无效假设分别为:H0:μ1=μ2,μ1=μ3,μ1=μ4,μ1=μ5;μ2=μ3,μ2=μ4,μ2=μ5;μ3=μ4,μ3=μ5;μ4=μ5,因此,计算量非常大。1.计算工作量大第三页,共一百七十七页,2022年,8月28日两个样本平均数比较采用t测验,α=0.05时,犯第一类错误的概率为0.05,推断的可靠性为1-α=0.95。若对5个处理采用10次t测验,10次测验中都不犯一类错误的概率为0.9510=0.5987,即10次推断总的可靠性降到0.5987,总的犯一类错误的概率上升到(1-0.5987)=0.4013。2.推断的可靠性降低,犯第一类错误的概率增大第四页,共一百七十七页,2022年,8月28日3.无统一误差且误差估计值偏高使检验真实差异的灵敏度降低有5个处理,每处理重复4次,共有20个观察值,作t测验每次只利用8个观察值,误差自由度为2(4-1)=6,若利用全部观察值估计试验误差,误差自由度为5(4-1)=15。自由度越小,误差估计值越大,检验灵敏度越低;自由度越大,误差估计值越小,检验灵敏度越高。第五页,共一百七十七页,2022年,8月28日因此对多个处理平均数进行差异显著性测验,不宜采用t测验,而需采用一种新的统计方法——方差分析法(analysisofvariance)。第六页,共一百七十七页,2022年,8月28日1、方差:度量一组资料的变异程度。2、方差分析基本思路:将k个样本的观察值作为一个整体考虑,把观察值总变异分解成不同变异来源分量,进而获得不同变异来源所属总体方差的估计值―均方。通过计算均方之适当比值,测验假设H0:μ1=μ2=…=μk是否成立,进而确定多个处理平均数间是否存在显著差异。二、方差分析的基本思路第七页,共一百七十七页,2022年,8月28日三、方差分析的作用方差分析有助于发现影响生物某性状发生变异的各种因素在总变异中所占的比重大小。从而分清主要因素与次要因素,指导生产和试验。1、在单因素试验中,可以分辨出最优水平。2、在多因素试验中,可以分辨出最优水平组合。第八页,共一百七十七页,2022年,8月28日第一节方差分析基本原理与步骤一、数学模型与基本假定二、平方和与自由度的分解三、F检验四、多重比较第九页,共一百七十七页,2022年,8月28日一、数学模型与基本假定假设某单因素试验有k个处理,n次重复,完全随机设计,则共有nk个观察值,其数据结构和符号如表5.1所示。第十页,共一百七十七页,2022年,8月28日表5-1k个处理n次重复完全随机观察值符号表重复12…j…n处理总和处理平均处理xi.

1x11x12

…x1j

…x1nx1.2x21x22

…x2j

…x2nx2.

┇┇

┇ixi1xi2

…xij

…xinxi.

┇kxk1xk2

…xkj

…xknxk.x..te第十一页,共一百七十七页,2022年,8月28日方差分析的线性数学模型上表中每个观察值可用下式表示:第十二页,共一百七十七页,2022年,8月28日上式叫单因素完全随机设计试验资料的数学模型。由于εij相互独立且服从正态分布N(0,σ2),所以各处理Ai(i=1,2,…,k)观察值所属总体亦应呈正态分布,即Ai~N(μi,σ2)。尽管各处理所在总体的平均数µi不一定相等,但总体方差σ2则必须假定是相等的。第十三页,共一百七十七页,2022年,8月28日用样本符号表示观察值的数学模型每个观察值的变异包含处理间变异和处理内变异两部分。第十四页,共一百七十七页,2022年,8月28日单因素完全随机试验资料的数学模型包含有以下几个基本假定:效应的可加性(additivity)分布的正态性(normality)方差的同质性(homogeneity)方差分析这三个基本假定也是进行其它类型方差分析的前提。第十五页,共一百七十七页,2022年,8月28日二、平方和与自由度的分解第十六页,共一百七十七页,2022年,8月28日nk个观察值的变异构成了整个资料的总变异,总变异的平方和等于各个观察值与总平均数的离差平方和,它反映了全部样本观察值间总的变异程度。1、总变异平方和与自由度dfT=nk-1第十七页,共一百七十七页,2022年,8月28日2、处理间平方和与自由度处理间平方和指各处理的平均数与总平均数的离差平方和的和,它反映重复n次的各处理平均数的总变异程度。即dft=k-1第十八页,共一百七十七页,2022年,8月28日3、处理内平方和与自由度

处理内平方和SSi指各处理内的n个观察值与其相应平均数的离差平方和,它反映了同一处理内重复观察值间的变异程度。处理1(第一组):处理2(第二组):┇处理k(第k组):

第十九页,共一百七十七页,2022年,8月28日由于同一处理内各观察值的差异是由偶然因素造成的,因而,SS1、SS2、…、SSk实际上都属于随机误差平方和,将其合并得全试验资料处理内变异的平方和:第二十页,共一百七十七页,2022年,8月28日各处理内自由度:处理1(第1组):df1=n-1处理2(第2组):df2=n-1┇处理k(第k组):dfk=n-1整个资料处理内总自由度为:dfe=df1+df2+…+dfk=k(n-1)=(nk-1)-(k-1)dfe=dfT-dft第二十一页,共一百七十七页,2022年,8月28日第二十二页,共一百七十七页,2022年,8月28日于是,处理间均方:

处理内均方:总变异均方:注意第二十三页,共一百七十七页,2022年,8月28日【例5-1】有一水稻施肥的盆栽试验,设5个处理:①和②系分别施用两种不同的氨水,③施碳酸氢铵,④施尿素,⑤不施氮肥。每处理各4盆(每盆纯氮相同),共5×4=20盆,随机放置于同一盆栽场。其稻谷产量(克/盆)列于表5-2。请分析这五种施肥处理之间是否存在显著差异。第二十四页,共一百七十七页,2022年,8月28日处理观察值(Xij)xi.①氨水12430282610827.0②氨水2272421269824.5③碳铵3128253011428.5④尿素3233332812631.5⑤不施212216218020.0x..=∑xi.=526=26.3表5-2水稻施肥盆栽试验的产量结果(g/盆)第二十五页,共一百七十七页,2022年,8月28日如果以离均差形式表示20个观察值xij的各种变异,就得以下结果:总变异处理间变异误差项变异①②

⑤-2.33.71.7-0.30.7-2.3-5.3-0.34.71.7-1.33.75.76.76.71.7-5.3-4.3-10.3-5.30.70.70.70.7-1.8-1.8-1.8-1.82.22.22.22.25.25.25.25.2-6.3-6.3-6.3-6.3-331-12.5-0.5-3.51.52.5-0.5-3.51.50.51.51.5-3.512-41SST=402.2dft=19SSt=301.2dft=4SSe=101.0dfe=15第二十六页,共一百七十七页,2022年,8月28日总变异处理间变异和试验误差例5-1的处理数k=5,每一处理观察值个数n=4根据单因素完全随机试验资料的数学模型例5-1平方和与自由度的分解第二十七页,共一百七十七页,2022年,8月28日各变异来源平方和计算矫正数:总变异:处理间变异:处理内变异:第二十八页,共一百七十七页,2022年,8月28日各项变异来源自由度计算总变异自由度:处理间变异自由度:处理内变异自由度:第二十九页,共一百七十七页,2022年,8月28日总变异:处理间变异:处理内变异:各变异来源的均方本研究目的就是想明确5种施肥处理对水稻产量的效应是否存在显著差异。第三十页,共一百七十七页,2022年,8月28日三、F检验(一)EMSe=σ2方差分析的一个基本假定是要求各处理观察值所在总体的方差相等。即学习第三章时我们知道,样本方差是总体方差的无偏估计值。即第三十一页,共一百七十七页,2022年,8月28日统计学已证明,各的合并均方(以各处理内的自由度n-1为权的加权平均数)也是σ2的无偏估计量,且估计的精确度更高。很容易推证处理内均方MSe就是各样本方差的合并均方。第三十二页,共一百七十七页,2022年,8月28日(二)EMSt=试验中各处理所属总体的本质差异体现在处理效应的差异上。我们把称为处理效应方差,它反映了各处理观察值所属总体的平均数μi的变异程度大小。第三十三页,共一百七十七页,2022年,8月28日因为各未知,所以无法求得的确切值,只能通过试验结果中各处理均数的差异去估计。然而,并非的无偏估计。第三十四页,共一百七十七页,2022年,8月28日因为各处理均数间的差异来源于两方面:一是各处理所在总体μi本质不同,二是平均数的抽样误差。统计学已证明:所以处理间总均方MSt实际上是的无偏估计。它一般比误差均方MSe来得大。即EMSt=第三十五页,共一百七十七页,2022年,8月28日因为σ2,分别是误差均方MSe和处理间均方MSt的数学期望(mathematicalexpectation),所以又称它们为期望均方,简记为EMS(expectedmeansquares)。第三十六页,共一百七十七页,2022年,8月28日(三)F检验当处理效应的方差=0,亦即各处理观测值所在总体的平均数µi(i=1,2,…,k)相等时(即µ1=µ2=…=µk

),处理间均方MSt与处理内均方MSe的期望均方相同,都是误差方差σ2的估计值。第三十七页,共一百七十七页,2022年,8月28日

F检验就是通过对MSt

与MSe的比较来推断是否为零,即是否相等。统计学已证明,在=0的条件下,MSt/MSe服从自由度df1=k-1与df2=k(n-1)的F分布。

附表4列出了检验MSt所代表的总体方差是否显著比MSe代表的总体方差大的临界F值,供F检验时查用。F值越大,对应的右尾概率越小。第三十八页,共一百七十七页,2022年,8月28日这种利用F分布计算概率来推断一个总体方差是否显著大于另一个总体方差的假设测验称F检验。这种F检验是一尾检验。第三十九页,共一百七十七页,2022年,8月28日所以F检验的无效假设是备择假设是而且在进行F检验时,把被检验因素的均方作分子,误差均方作分母。分母项的选择以期望均方所决定。第四十页,共一百七十七页,2022年,8月28日这里误差均方6.73系五种处理内变异的合并均方,它是表5-2资料的试验误差的估计;处理间均方75.3则是试验误差与不同施肥处理效应对产量共同作用的结果。例5-1,我们计算了处理间均方:误差均方:第四十一页,共一百七十七页,2022年,8月28日表5-1资料的方差分析表变异来源DFSSMSF处理间k-1SStMStMSt/MSe处理内k(n-1)SSeMSe总变异kn-1SST第四十二页,共一百七十七页,2022年,8月28日表5-2资料方差分析表变异来源dfSSMSFF0.05F0.01处理间处理内415301.2101.075.36.7311.18**3.064.89总变异19402.2上述F测验表明,F>>F0.01,则P<<0.01,所以否定H0,接受HA,即5种施肥处理对水稻产量的效应存在极显著差异。第四十三页,共一百七十七页,2022年,8月28日四、

多重比较(multiplecomparisons)F检验只是对所有处理整体上是否存在显著差异的测验,并不能提供任何两个平均数是否存在显著性差异的具体信息。要明确各个处理平均数彼此间的差异显著性,还必须对各个平均数作相互比较,这种多个处理平均数两两间的相互比较称为多重比较。第四十四页,共一百七十七页,2022年,8月28日(一)、最小显著差数法(LSD)最小显著差数法的实质是在F测验显著前提下两个样本平均数相比较的t测验。1、计算平均数差数的标准误;2、计算出显著水平下的最小显著差数LSDα。第四十五页,共一百七十七页,2022年,8月28日3、将任意两个处理平均数差的绝对值与LSDα相比较。第四十六页,共一百七十七页,2022年,8月28日对【例5-1】用LSD法测验各处理平均数与对照的差异显著性。由前面的分析可知:MSe=6.73;n=4查t值表,当dfe=15时,t0.05,15=2.131t0.01,15=2.947故:LSD0.05=2.131×1.834=3.90(克/盆)LSD0.01=2.947×1.834=5.40(克/盆)第四十七页,共一百七十七页,2022年,8月28日处理平均产量(克/盆)差数(克/盆)④施尿素31.511.5**③施碳铵28.58.5**①施氨水127.07.0**②施氨水224.54.5*⑤不施氮肥20.0---五种施肥效果的多重比较表(LSD法)

推断:施氨水2显著高于不施氮肥;施碳铵、尿素、氨水1均极显著高于不施氮肥。LSD0.05=3.9LSD0.01=5.4第四十八页,共一百七十七页,2022年,8月28日LSD法的特点LSD是在F测验保护下的两两平均数间的t测验,避免了检验工作量大和无统一误差及误差估计值过高的问题;但LSD没有考虑相互比较的平均数大小排列上的秩次,所有平均数间比较,都采用同一个标准,使得秩次大的平均数间比较的标准偏小,容易否定无效假设,增大犯I型错误的概率。第四十九页,共一百七十七页,2022年,8月28日(二)、最小显著极差法最小显著极差(Leastsignificantrange)法:把平均数的差数看成极差,根据极差范围内包含的处理数k的不同而采用不同的检验尺度。即不同平均数间比较采用不同的检验尺度,称为最小显著极差LSRα,k

。常用的有新复极差法和q测验法。第五十页,共一百七十七页,2022年,8月28日新复极差法

新复极差法(newmultiplerangemethod),是D.B.Duncan(1955)提出的,故又称Duncan法,还称SSR(shortestsignificantranges)法。q测验法

q测验法(复极差法)是Student-Newman-Keul基于极差的抽样分布理论提出的,有时又称SNK测验或NK测验。第五十一页,共一百七十七页,2022年,8月28日1、新复极差测验法(SSR)第一:计算单个平均数的标准误第二:查SSR表,计算最小显著极差值LSRα,K第三:以各个k值下的LSR为显著尺度,测验各平均数两极差的显著性。第五十二页,共一百七十七页,2022年,8月28日试以SSR法测验例5-1五个处理两两平均数间的差异显著性。由前面的分析可知:MSe=6.73,n=4,故当dfe=15时,由SSR值表,查出k=2,3,4,5的SSR0.05和SSR0.01的值,并由LSRα,k=SSRα,k×计算出相应的最小显著极差LSR于下表。第五十三页,共一百七十七页,2022年,8月28日K2345SSR0.053.013.163.253.31SSR0.014.174.354.464.55

LSR0.053.904.104.224.29LSR0.015.415.645.785.90q0.053.013.674.084.37q0.014.174.835.255.56LSR0.053.904.765.295.67

LSR0.015.416.266.817.21五个施肥处理多重比较LSRα值表(SSR/q法)第五十四页,共一百七十七页,2022年,8月28日多重比较结果(SSR或q测验)的表示方法标记字母法①将全部平均数从大到小依次排列;②在最大的平均数上标上字母a;③将该平均数与以下平均数相比,凡相差不显著的,都标上字母a,直至某一个与之相差显著的平均数,则标以字母b;④以标有b的平均数为标准,与上方各个比它大的平均数相比,凡不显著的一律标以字母b;第五十五页,共一百七十七页,2022年,8月28日⑤再以标有字母b的最大平均数为标准,与以下各个未标记的平均数相比,凡不显著的继续标以字母b,直至某一个与之相差显著的平均数则标以字母c。⑥如此重复进行下去,直至最小一个平均数被标记比较完毕为止。

判断标准:各平均数间,凡有一个相同标记字母的即为差异不显著,凡具不同标记字母的即为差异显著。第五十六页,共一百七十七页,2022年,8月28日处理平均产量(克/盆)差异显著性0.050.01④施尿素31.5aaAA③施碳铵28.5ababABAB①施氨水127.0babABAB②施氨水224.5bbBCBC⑤不施氮肥20.0cc

CC五种施肥效果的差异显著性(SSR/q)推断:1)施尿素、碳铵、氨水1、氨水2的平均产量显著高于不施氮肥;2)施尿素的平均产量极显著高于施氨水2;3)施碳铵、氨水1、氨水2之间的差异不显著。第五十七页,共一百七十七页,2022年,8月28日2、q测验法q测验法与SSR法大致相同,所不同的是计算LSR值时用q值而不用SSR值,即其中,为在F测验中分母项相应自由度下显著水平为时的q值。与SSR法相比,q测验的显著尺度标准更高,因此,由q测验法推断的结果更严格。第五十八页,共一百七十七页,2022年,8月28日多重比较方法的选择三种多重比较方法的检验尺度有如下关系:一个试验资料,采用哪一种多重比较方法,主要根据是否定一个正确的Ho和接受一个不正确的Ho的相对重要性来决定。第五十九页,共一百七十七页,2022年,8月28日

否定一个正确的H0接受一个不正确的H0q测验LSD或SSR宁愿冒犯β错误的风险较大而不愿有较大的犯α错误的风险宁愿冒犯α错误的风险较大而不愿有较大的犯β错误的风险第六十页,共一百七十七页,2022年,8月28日在农业和生物学研究中,由于试验工作者通常都寄希望于否定H0,所以LSD和SSR得到较为广泛的应用。如果试验是几个处理都与一个对照相比,则可选用LSD法;如果试验是每两个处理都要进行相互比较,则宜选用SSR法。第六十一页,共一百七十七页,2022年,8月28日方差分析的基本步骤

将原始资料进行整理,计算各处理的和与平均数及全部资料的和与平均数;依据数学模型计算各变异项平方和与自由度;列出方差分析表,进行F检验如果F检验处理间存在显著差异,则应进行多重比较;提取结论.第六十二页,共一百七十七页,2022年,8月28日第二节单因素完全随机设计试验资料的方差分析各处理重复数相等的方差分析各处理重复数不等的方差分析第六十三页,共一百七十七页,2022年,8月28日(一)、各处理重复数相等的方差分析有一小麦新品系完全随机试验,小区产量见表5-13,试检验不同小麦品系平均产量的差异是否显著。第六十四页,共一百七十七页,2022年,8月28日表5-13四个不同小麦品系的小区产量

品系号观测值xij(㎏/20m2)xi

平均04-11210141612188213.666704-2810121412167212.000004-31416131610158414.000004-416182016141610016.6667合计

第六十五页,共一百七十七页,2022年,8月28日计算各变异来源的平方和第六十六页,共一百七十七页,2022年,8月28日计算各变异来源的自由度第六十七页,共一百七十七页,2022年,8月28日四个不同小麦品系产量方差分析表变异来源dfSSMSFF0.05F0.01品系间误差32067.17130.8322.396.533.43*3.104.94总变异23第六十八页,共一百七十七页,2022年,8月28日各处理平均数的多重比较(SSR)平均数标准误最小显著极差第六十九页,共一百七十七页,2022年,8月28日SSR值及LSR值dfe秩次距kSSR0.05SSR0.01LSR0.05LSR0.01

2022.954.023.07834.194933.104.223.23494.403643.184.333.31834.5184第七十页,共一百七十七页,2022年,8月28日

不同小麦品系的平均产量多重比较表(SSR法)品种平均数-12.0-13.7-14.004-416.74.7**3.02.704-314.02.00.3

04-113.71.7

04-212.0

第七十一页,共一百七十七页,2022年,8月28日结论小麦品系04-4的平均产量极显著高于04-2,但与04-3,04-1差异不显著;四个小麦品系中以04-4产量最高.第七十二页,共一百七十七页,2022年,8月28日二、各处理重复数不等的方差分析若k个处理中的观测值数目不等,分别为n1,n2,…,nk。自由度的分解第七十三页,共一百七十七页,2022年,8月28日平方和的分解第七十四页,共一百七十七页,2022年,8月28日例5-45个玉米品种的盆栽试验,调查穗长(cm)性状,得资料如表5-17所示。试比较不同品种间穗长有无显著差异。第七十五页,共一百七十七页,2022年,8月28日表5-175个玉米品种的穗长

品种穗长(cm)xijnixi.B121.519.520.022.018.020.06121.020.2B216.018.517.015.520.016.06103.017.2B319.017.520.018.017.0591.518.3B421.018.519.020.0

478.519.6B515.518.017.016.0

466.516.6合计25460.5第七十六页,共一百七十七页,2022年,8月28日自由度分解第七十七页,共一百七十七页,2022年,8月28日平方和分解第七十八页,共一百七十七页,2022年,8月28日5个玉米品种穗长方差分析表变异来源SSdfMSF值品种间46.50411.635.99**品种内(误差)38.84201.94

总变异85.3424

F0.05(4,20)=2.87,F0.01(4,20)=4.43第七十九页,共一百七十七页,2022年,8月28日多重比较第八十页,共一百七十七页,2022年,8月28日根据dfe=20,秩次距k=2,3,4,5,从附表6中查出α=0.05与α=0.01的临界SSR值,乘以=0.625,即得各最小显著极差,所得结果列于表5-20。将表5-19中的各个差数与表5-20中相应的最小显著极差比较,作出推断。检验结果已标记在表5-19中。第八十一页,共一百七十七页,2022年,8月28日表5-20SSR值及LSR值表dfe

秩次距(k)SSR0.05SSR0.01LSR0.05LSR0.012022.954.021.8442.51333.104.221.9382.63843.184.331.9882.70653.254.402.0312.750第八十二页,共一百七十七页,2022年,8月28日表5-195个玉米品种平均穗长多重比较表(SSR法)品种平均数α=0.05α=0.01B120.2aAB419.6aABB318.3abABCB217.2bBCB516.6bC第八十三页,共一百七十七页,2022年,8月28日结论品种B1、B4的穗长显著长于B2、B5;5个品种中,B2、B5穗长最短;B3的穗长居中。第八十四页,共一百七十七页,2022年,8月28日第三节两因素完全随机设计试验资料的方差分析两因素试验按水平组合的方式不同,分为交叉分组和系统分组两类,对应的方差分析方法也不同。第八十五页,共一百七十七页,2022年,8月28日两因素试验是多因素试验的最简单形式。多因素试验比单因素试验具有更多的优越性。(1)可研究因素之间的交互作用;(2)试验精确度更高;(3)所得结论论据更充分。

第八十六页,共一百七十七页,2022年,8月28日如某试验考察品种、密度、施肥量三个因素,每因素取两水平,则共有23=8种水平组合(即8个处理),若重复三次,全试验共有24个小区,因而每一因素的每一水平重复了12次,若将24个小区做三个单因素试验,则每因素各得8个小区,每因素的每一水平仅重复4次。重复12次的精度当然比重复4次的高。第八十七页,共一百七十七页,2022年,8月28日因素品种A密度B施肥量Ca1a2b1b2b1b2c1c2c1c2c1c2c1c2水平组合第八十八页,共一百七十七页,2022年,8月28日一、两因素交叉分组资料方差分析

验考察A、B两个因素,A因素分a个水平,B因素分b个水平。A因素每个水平与B因素每个水平交叉搭配形成ab个水平组合即ab个处理,A、B在试验中处于平等地位。完全随机设计时是将试验单位分成ab个组,每组随机接受一种处理,因而试验数据也按两因素两方向分组。包括无重复观测值和有重复观测值两种类型。第八十九页,共一百七十七页,2022年,8月28日(一)两因素单个观察值试验资料方差分析第九十页,共一百七十七页,2022年,8月28日A因素B因素总和xi.平均B1B2…

BbA1A2┇Aax11x12…

x1bx21x22…

x2b

┇xa1xa2…

xabx1.x2.

┇xa.总和x.j平均x.1x.2…x.bx..两因素单个观察值的数据结构第九十一页,共一百七十七页,2022年,8月28日线性模型:第九十二页,共一百七十七页,2022年,8月28日平方和分解第九十三页,共一百七十七页,2022年,8月28日自由度分解第九十四页,共一百七十七页,2022年,8月28日各变异分量的均方第九十五页,共一百七十七页,2022年,8月28日【例5.5】为了研究不同田间管理方法对草莓产量的影响,选择了6个不同的地块,每个地块分成3个小区,随机安排3种田间管理方法,所得结果见表5-22,试作方差分析。

第九十六页,共一百七十七页,2022年,8月28日表5-22各品系草莓不同管理措施的产量(kg/区)地块(A)田间管理方法(B)xi.

平均B1B2B3A171737722173.67A290909227290.67A359708020969.67A475808223779.00A565606719264.00A682868525384.33合计x.j4424594831384

平均73.6776.5080.50

76.89第九十七页,共一百七十七页,2022年,8月28日1.计算各项平方和与自由度第九十八页,共一百七十七页,2022年,8月28日第九十九页,共一百七十七页,2022年,8月28日变异来源SSdfMSF值A因素B因素1435.11141.4452287.0270.7217.80**4.39*误差161.221016.12

总变异1307517

F0.05(5,10)=3.33,F0.01(5,10)=5.64

F0.05(2,10)=4.10,F0.01(2,10)=7.56

2、列出方差分析表第一百页,共一百七十七页,2022年,8月28日3、多重比较(1)不同地块的草莓平均产量比较,采用q法。在两因素单独观察值试验情况下,因为A因素每一水平的重复数恰为B因素的水平数。

第一百零一页,共一百七十七页,2022年,8月28日q值及LSR值

dfe

秩次距kq0.05q0.01LSR0.05LSR0.011023.154.487.302310.385533.885.278.994612.216944.335.7710.037813.376054.656.1410.779614.233764.916.4311.382414.9060第一百零二页,共一百七十七页,2022年,8月28日各地块草莓平均产量多重比较(q法)

地块平均数-64.00-69.67-73.67-79.00-84.33A290.6726.67**21.00**17.00**11.67*6.34A684.3320.33**14.66**10.66*5.33A479.0015.00**9.33*5.33A173.679.33*4.00A369.675.67A564.00A2产量极显著高于A5、A3、A1,显著高于A4,但与A6差异不显著。第一百零三页,共一百七十七页,2022年,8月28日(2)不同田间管理方法的草莓平均产量比较

B因素各水平平均数比较见表5-26。在两因素单独观测值试验情况下,B因素(本例为田间管理方法)每一水平的重复数恰为A因素的水平数a。B因素各水平间比较方法同A。从略。第一百零四页,共一百七十七页,2022年,8月28日

两因素或多因素试验,除了研究每一因素对试验指标的影响外,往往更希望研究因素之间的交互作用。例如,通过对播种期、播种密度、施氮量、施钾量、施磷量对作物生长发育的影响有无交互作用的研究,对最终确定有利于作物生产的最佳栽培技术体系是有重要意义的。第一百零五页,共一百七十七页,2022年,8月28日前面介绍的两因素单个观测值试验只适用于两个因素间无交互作用的情况。若两因素间有交互作用,则每个水平组合只设一个观察单位是不正确的或不完善的。第一百零六页,共一百七十七页,2022年,8月28日

(1)只有单个观察值,误差项均方MSe实际是交互作用和试验误差交织在一起,如果因素有互作,则互作效应在其中占主要比例。

(2)因此加大了试验误差均方值,容易掩盖试验因素的真实差异,从而增大接受无效假设的可能性,即增大犯Ⅱ型错误的概率。

(3)因为每个水平组合只有一个观测值,所以无法估计真正的试验误差,因而不可能对因素的交互作用进行研究。第一百零七页,共一百七十七页,2022年,8月28日因此,进行两因素或多因素试验时,一般应设置重复,以便正确估计试验误差,深入研究因素间的交互作用。第一百零八页,共一百七十七页,2022年,8月28日(二)有重复观测值交叉分组资料的方差分析对两因素等多因素有重复观测值试验结果的分析,能研究因素的简单效应、主效应和因素间的交互作用(互作)效应。第一百零九页,共一百七十七页,2022年,8月28日

设A与B两因素试验,分别具有a个水平和b个水平,共有ab个水平组合,每个水平组合有n次重复,则全试验共有abn个观测值。这类试验结果方差分析的数据模式如表5-29所示。第一百一十页,共一百七十七页,2022年,8月28日两因素有重复观察值试验资料的数学模型为:依据数学模型,试验资料总变异分解如下:第一百一十一页,共一百七十七页,2022年,8月28日

【例5.6】为了研究不同的种植密度和商业化肥对大麦产量的影响,将种植密度(A)设置3个水平、施用的商业化肥(B)设置5个水平,交叉分组,重复4次,完全随机设计。产量结果(kg/小区)列于表5-30,试分析种植密度和施用的商业化肥对大麦产量的影响。

第一百一十二页,共一百七十七页,2022年,8月28日本例A因素(种植密度)分3个水平,即a=3;B因素(商业化肥)分5个水平,即b=5;共有ab=3×5=15个水平组合;重复数n=4;全试验共有abn=3×5×4=60个观测值,试验结果列于表5-30,请对该资料进行方差分析。第一百一十三页,共一百七十七页,2022年,8月28日1、计算各项平方和与自由度第一百一十四页,共一百七十七页,2022年,8月28日第一百一十五页,共一百七十七页,2022年,8月28日表5-31不同种植密度和商业化肥试验资料方差分析表

变异来源SSdfMSF值种植密度(A)315.83332157.9167129.20**商业化肥(B)207.1667451.791742.38**互作(A×B)50.333386.29175.15**误差55.0000451.2222总变异628.333359F0.01(2,45)=3.20,F0.01(4,45)=2.58,F0.01(8,45)=2.152、列出方差分析表,进行F检验第一百一十六页,共一百七十七页,2022年,8月28日3、多重比较

(1)种植密度(A)各水平平均数间的比较不同种植密度平均数多重比较表见表5-32。因为A因素各水平的重复数为bn,故A因素各水平的标准误的计算公式为:第一百一十七页,共一百七十七页,2022年,8月28日

(2)商业化肥(B)各水平平均数间的比较:不同商业化肥平均数多重比较表见表5-34。

因为A因素各水平的重复数为an,故B因素各水平的标准误的计算公式为:第一百一十八页,共一百七十七页,2022年,8月28日

以上所进行的两项多重比较,实际上是A、B两因素主效应的检验。结果表明,种植密度以A3的产量最高;商业化肥以B4的产量最高。若A、B因素交互作用不显著,则可选出A3B4为最优水平组合;若交互作用显著,则应进行水平组合平均数间的多重比较,以选出最优组合,同时可进行简单效应的检验。

第一百一十九页,共一百七十七页,2022年,8月28日(3)各水平组合平均数间的比较因为水平组合数通常较大(本例=3×5=15),采用LSR法进行各水平组合平均数的比较时,计算量大,且会出现同样两水平组合在各水平组合平均数间的比较和在简单效应检验中所用检验尺度不同,造成检验结果不同的问题,故一般推荐使用LSD法来进行各水平组合平均数的多重比较和简单效应检验。也就是说,用相同的检验尺度进行各水平组合平均数间的比较和简单效应检验。第一百二十页,共一百七十七页,2022年,8月28日因为水平组合的重复数为n,故水平组合平均数标准误计算式为:

第一百二十一页,共一百七十七页,2022年,8月28日由dfe=45,从附表3中查出=0.05、=0.01的临界t值,乘以,得各LSD值,即

以上述LSD值去检验各水平组合平均数间的差数,结果列于表5-36。由于互作存在,最优组合(即产量最高的组合)并不是A3B4,而是A3B3。第一百二十二页,共一百七十七页,2022年,8月28日二、二级系统分组资料的方差分析

系统分组资料:如果试验资料分为个组,每个组内又分为m个亚组,每个亚组又再分为若干个小亚组。如此分下去,直至最后一个小亚组具有n个观察值,这种分组资料称为系统分组资料。第一百二十三页,共一百七十七页,2022年,8月28日在农业试验上系统分组资料是常见的。例如土样分析,随机取若干地块,每地块取若干个样点,每一样点的土样又作了数次分析所获得的资料;又如调查某种果树病害,随机取若干株,每株取不同部位枝条,每枝条取若干叶片,调查各叶片病斑数所获得的资料都属于系统分组资料。

第一百二十四页,共一百七十七页,2022年,8月28日在系统分组中,划分组的因素叫一级因素,划分亚组的因素叫二级因素……。二级因素的各亚组套在一级因素的每个组下,亚组与组之间是从属关系而不是平等关系,分析侧重于一级因素。

第一百二十五页,共一百七十七页,2022年,8月28日最简单的系统分组资料是二级系统分组资料。设一系统分组资料共有a组,每组内又分b个亚组,每一亚组内有n个观察值,则该资料共有abn个观察值。其数据模式如表5-37所示。第一百二十六页,共一百七十七页,2022年,8月28日一级因素二级因素观察值二级因素一级因素ABxi.A1B11x111x112…x11nx1.B12x121x122…x12n………………B1bx1b1x1b2…x1bnA2B21x211x212…x21nx2.B22x221x222…x22n………………B2bx2b1x2b2…x2bn…………………………AaBa1xa11xa12…xa1nxa.Ba2xa21xa22…xa2n………………Babxab1xab2…xabn合计x…第一百二十七页,共一百七十七页,2022年,8月28日一、数据结构与变异来源分解对于表5-37,任一观察值的数据结构为:

μ:全部观察值总体平均数αi=(μi-μ)组效应βij=(μij-μi)亚组效应εijl=(xijl-μij)随机误差,相互独立且服从N(0,σ2)第一百二十八页,共一百七十七页,2022年,8月28日上式表明,任一观察值的总变异可分解为:①组间变异;②同一组内亚组间变异;③同一亚组内各观察值的变异(试验误差).用样本符号可表示为第一百二十九页,共一百七十七页,2022年,8月28日二、自由度与平方和的分解1.总变异:自由度平方和其中2.组间(A)变异:自由度平方和第一百三十页,共一百七十七页,2022年,8月28日3.同一组内亚组间(B)的变异自由度平方和4.同一亚组内的变异(误差):自由度平方和第一百三十一页,共一百七十七页,2022年,8月28日各项均方如下:A因素的均方A因素内B因素的均方误差均方第一百三十二页,共一百七十七页,2022年,8月28日三、F测验当测验组间平均数的差异时,用组内亚组间的均方作分母,即当测验组内亚组间平均数的差异时,以误差均方作分母,即第一百三十三页,共一百七十七页,2022年,8月28日【例5·7】

随机选取3株植物,在每一株内随机选取两片叶子,用取样器从每一片叶子上选取同样面积的两个样本,称取湿重(g),结果见表5-38。分析不同植株和同一植株上的不同叶片间湿重差异是否显著。

第一百三十四页,共一百七十七页,2022年,8月28日表5-38叶片湿重植株A

叶片B测定结果A1

B1112.112.124.212.1049.812.45B1212.812.825.612.80A2

B2114.414.428.814.4058.014.50B2214.714.529.214.60A3

B3123.123.446.523.25103.425.85B3228.128.856.928.45Σ

x…=211.2第一百三十五页,共一百七十七页,2022年,8月28日1.计算各项平方和与自由度

矫正数

总平方和及其自由度

第一百三十六页,共一百七十七页,2022年,8月28日植株间平方和及其自由度

第一百三十七页,共一百七十七页,2022年,8月28日植株内叶片间的平方和及其自由度

第一百三十八页,共一百七十七页,2022年,8月28日误差(叶片内分析样品间)平方和及其自由度

第一百三十九页,共一百七十七页,2022年,8月28日2.列出方差分析表,进行F检验表5-38资料的方差分析表,见表5-39。变异来源平方和自由度均方F值植株间A416.70002208.350022.67*植株内叶片间B(A)27.570039.1900177.76**误差C(B)0.310060.0517

总变异444.580011

F0.05(2,3)=9.55,F0.01(2,3)=30.82,F0.01(3,6)=9.78第一百四十页,共一百七十七页,2022年,8月28日3.三株植株平均湿重的多重比较(SSR法)

因为对一级因素(植株)进行F检验时是以植株内叶片间均方作为分母,植株的重复数为bn,所以植株的标准误为:

第一百四十一页,共一百七十七页,2022年,8月28日由dfB(A)=3,k=2,3,查附表6,得SSR0.05和SSR0.01值并与相乘,求出相应的LSR0.05和LSR0.01的值,得:LSR0.05,2

=6.82,

LSR0.01,2=12.52LSR0.05,3=6.82,

LSR0.01,3=12.88

三株植株叶片平均湿重的差异显著性(SSR测验)检验结果见表5-40。第一百四十二页,共一百七十七页,2022年,8月28日表5-40植株叶片平均湿重多重比较表(SSR法)植株平均-12.45-14.50A325.8513.40**11.35*A214.502.05*

A112.45

结果表明,植株A3叶片平均湿重极显著高于A1,显著高于A2,A2又显著高于A1。第一百四十三页,共一百七十七页,2022年,8月28日第四节方差分析的数学模型与期望均方

一、数学模型

二、期望均方三、方差分量的估计第一百四十四页,共一百七十七页,2022年,8月28日指试验资料的数据结构,即每一观察值的线性组成部分。方差分析的数学模型也叫线性可加模型,它是方差分析各变异来源分解的依据。所谓线性可加模型是指每一观察值可以划分成若干个线性组成部分,效应之间是“和”的关系,且是一次方,故通常称为“线性可加模型”,简称线性模型。一、数学模型第一百四十五页,共一百七十七页,2022年,8月28日设在一平均数为μ、方差为σ2的正态总体中随机抽取容量为n的一组样本。由于随机误差的存在,每一个xi都和总体平均数μ有差别,这个差量就是随机误差εi。因而每一个观察值的线性可加模型:第一百四十六页,共一百七十七页,2022年,8月28日如果将上述总体分成k个组,使每组成为该总体的一个亚总体,分别给予不同的处理,处理效应为αi,则各个亚总体的平均数为μi=(μ+αi)。从每个亚总体随机抽取容量为n的一个样本,共得k个样本,任一观察值xij(I=1,2,..,k;j=1,2,…,n)所具有的线性模型为:第一百四十七页,共一百七十七页,2022年,8月28日对于方差分析线性模型中的处理效应(或),由于试验目的不同而有不同的解释,从而产生了方差分析的两种数学模型:固定模型(fixedmodel)和随机模型(randommodel)。与之对应的是固定效应和随机效应。形式区别:

固定效应用κα表示随机效应用σα表示第一百四十八页,共一百七十七页,2022年,8月28日固定模型:指试验的各个处理都抽自特定的处理总体,因而处理效应是固定不变的,试验的目的就是研究各个处理效应,所作的推断也仅限于供试处理的范围之内。重复试验时,各处理是固定不变的。第一百四十九页,共一百七十七页,2022年,8月28日特点抽样方式是固定有标准的;试验的目的是估计各个处理的效应;H0:μ1=μ2=…=μk

HA:µ1≠µ2≠…≠µk;推断仅限于供试处理范围内;

F测验后,要进行均数的多重比较。

一般的肥料试验、农药试验、密度试验、品比试验等都属于固定模型。第一百五十页,共一百七十七页,2022年,8月28日随机模型:指试验中的各个处理皆抽自同一总体的一组随机样本,因而处理效应是随机的,试验目的不在于研究供试处理本身的效应,而在于研究处理效应的变异程度,所以推断也不是关于某些供试处理本身,而是关于抽出这些处理的整个总体。重复试验时,处理可以发生变化。第一百五十一页,共一百七十七页,2022年,8月28日特点各处理的抽样方式是随机的,没有标准;试验目的是估计各处理所在更大总体的变异程度;所作假设为;推断是关于k个处理所在更大总体的变异情况;F测验后,不进行均数的多重比较,而需估计方差σ2α。

随机模型在遗传、育种和生态试验方面,有较广泛的应用。第一百五十二页,共一百七十七页,2022年,8月28日按上述方差分析的线性模型分类看,在单因素试验时,有固定模型(fixedmodel)和随机模型(randommodel)之分;在多因素试验时,则有固定模型、随机模型和混合模型(mixedmodel)之分。第一百五十三页,共一百七十七页,2022年,8月28日例如,为研究中国早稻产量变异情况,从大量早稻品种中随机抽取部分品种为代表进行试验,从试验结果推断中国早稻产量变异情况,这就属于随机模型。进行多年、多点品种区域试验,品种效应、地点效应是固定的,而年份效应是随机的。这种试验资料的数学模型就是混合模型。第一百五十四页,共一百七十七页,2022年,8月28日二、期望均方由于模型不同,方差分析中各项期望均方的组成也有所不同,因而F检验时分母项均方的选择也有所不同。

F检验分母项均方的选择是分子的期望均方组成分量比分母多一个分量,而且其余分量相同。如:第一百五十五页,共一百七十七页,2022年,8月28日1.单因素完全随机设计试验资料方差分析的期望均方重复数相等时第一百五十六页,共一百七十七页,2022年,8月28日1.单因素完全随机设计试验资料方差分析的期望均方重复数不等时第一百五十七页,共一百七十七页,2022年,8月28日2、交叉分组试验资料方差分析的期望均方单个观测值时第一百五十八页,共一百七十七页,2022年,8月28日2、交叉分组试验资料方差分析的期望均方有重复观测值时第一百五十九页,共一百七十七页,2022年,8月28日

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论