方差分析的基本原理课件_第1页
方差分析的基本原理课件_第2页
方差分析的基本原理课件_第3页
方差分析的基本原理课件_第4页
方差分析的基本原理课件_第5页
已阅读5页,还剩239页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章方差分析1第六章方差分析1第一节方差分析的基本原理2第一节方差分析的基本原理2一、方差分析的意义

u检验或t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t检验法就不适宜了。这是因为:3一、方差分析的意义u检验或t检验法适用于样本1、u或t检验过程烦琐

例如,一试验包含5个处理,采用t检验法要进行=10次两两平均数的差异显著性检验;若有k个处理,则要作=k(k-1)/2

次类似的检验。41、u或t检验过程烦琐例如,一试验包含5个处理2、无统一的试验误差,误差估计的准确性和检验的灵敏性低(1)t检验要进行两两比较,每次仅用2个样本信息估计总体方差,误差估计的准确性低(2)

k个处理平均值的自由度为k(n-1),而t检验查tα值的自由度为2(n-1),从而降低了检验的灵敏性两两比较合并均方:k个样本合并均方:52、无统一的试验误差,误差估计的准确性和检验的灵敏性低(1)3、t检验增大犯α错误的概率t检验时对具有不同秩次的平均数采用同一个tα

,会增大犯α错误的概率,降低推断的可靠性。

2个平均数比较:α

=0.055个平均数比较:α’

=1-(1-0.05)10=0.401310个平均数比较:α”

=1-(1-0.05)45=0.900663、t检验增大犯α错误的概率t检验时对具有不同秩次因此,多个平均数的差异显著性检验不宜用t(或u)检验,须采用方差分析法。方差分析(analysisofvariance)由英国统计学家R.A.Fisher于1923年提出的。——将多个样本(处理)的观测值作为一个总体,用方差来表示变异,把引起事件总的变异分解为各种因素的变异,并对每个因素引起的变异作数量估计,从而说明各因素的变异幅度及其在总变异中的重要程度;并用剩余变异无偏估计随机误差,进而比较处理均值间的差异。7因此,多个平均数的差异显著性检验不宜用t(或u)检验,须采有关术语:1、试验指标(experimentalindex)为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有:日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生理生化和体型指标(如血糖含量、体高、体重)等。2、试验因素(experimentalfactor)试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。试验因素常用大写字母A、B、C、…等表示。8有关术语:1、试验指标(experimentalinde3、因素水平(leveloffactor)试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。研究某种饲料中4种不同能量水平对肥育牛瘦肉率的影响,这4种特定的能量水平就是饲料能量这一试验因素的4个水平。因素水平用代表该因素的字母加添足标1,2,…,来表示。如A1、A2、…,B1、B2、…,等。4、试验处理(treatment)事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时,实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3种饲料和3个品种对猪日增重影响的两因素试验,整个试验共有3×3=9个水平组合,在多因素试验时,试验因素的一个水平组合就是一个处理。93、因素水平(leveloffactor)试验因素所5、试验单位(experimentalunit)在试验中能接受不同试验处理的独立的试验载体叫试验单位。在畜禽、水产试验中,一只家禽、一头家畜、一只小白鼠、一尾鱼,即一个动物;或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往往也是观测数据的单位。6、重复(repetition)在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4次重复。105、试验单位(experimentalunit)在试验二、方差分析的基本原理1、线性模型与基本假定假设某单因素试验有k个处理,每个处理有n次重复,共有nk个观测值。这类试验资料的数据模式如表7.1所示。11二、方差分析的基本原理1、线性模型与基本假定假设某单因素试验表7.1k个处理每处理有n个观测值的数据模式处理观察值(xij,i=1~k;j=1~n)总和平均1x11x12…

x1j…

x1nT1.2x21x22…

x2j…

x2nT2.┇

┇…

┇┇┇ixi1xi2…

xij…

xinTi.┇

┇┇…

┇…

┇┇┇kxk1xk2…

xkj…

xknTk.

Tx1.x2.xi.xk.x注:xij指第i个处理第j个观察值(i=1~k;j=1~n)12表7.1k个处理每处理有n个观测值的数据模式处理观察值(xij可以分解为:其中:μ表示全试验观测值总体的平均数;

i是第i个处理的效应(treatmenteffects)表示处理i对试验结果产生的影响。显然有εij是试验误差,相互独立,且服从正态分布N(0,σ2)。(7-1)式叫做单因素试验的线性模型,亦称数学模型。在这个模型中xij表示为总平均数μ、处理效应

i、试验误差εij之和。(7-1)(7-2)13xij可以分解为:其中:μ表示全试验观测值总体的平均数;ε由εij

相互独立且服从正态分布N(0,σ2),可知各处理i(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布N(μi,σ2)。尽管各总体的均数μi

可以不等或相等,σ2则必须是相等的。所以,单因素试验的数学模型可归纳为:效应的可加性(additivity)、分布的正态性(normality)、方差的同质性(homogeneity)。这也是进行其它类型方差分析的前提或基本假定。14由εij相互独立且服从正态分布N(0,σ2若将表7.1中的观测值xij(i=1,2,…,k;j=1,2,…,n)的数据结构(模型)用样本符号来表示,则(7-3)15若将表7.1中的观测值xij(i=1,2,…,k;j=1

(7-1)、(7-3)两式告诉我们:每个观测值都包含处理效应(i或),与误差(εij或),故kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。16(7-1)、(7-3)两式告诉我们:16药剂A(x1)B(x2)C(x3)D(x4)19212022232418252127192713201522总和Ti.76927296平均19231824观察值【例7.1】-22-3317药剂A(x1)B(x2)C(x3)D(x4)1921202药剂A(x1)B(x2)C(x3)D(x4)19212022232418252127192713201522总和Ti.76927296平均19231824观察值18药剂A(x1)B(x2)C(x3)D(x4)192120222、自由度与平方和的剖分

在方差分析中是用样本方差即均方(MS)来度量资料的变异程度的。表7.1中全部观测值的总变异可以用总均方来度量。将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子──称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母──称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。192、自由度与平方和的剖分在方差分析中是用样本方差(1)平方和的剖分

在表7.1中,反映全部观测值总变异的总平方和是各观测值xij与总平均数的离均差平方和,记为SST。即(7-4)20(1)平方和的剖分在表7.1中,反映全部观测值总变异的总因为21因为21其中所以(7-5)(7-5)式中,为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,即:(7-6)22其中所以(7-5)(7-5)式中,(7-5)式中,为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即:(7-7)23(7-5)式中,为各于是有SST

=SSt+SSe

(7-8)这个关系式中三种平方和的简便计算公式如下:其中,C=T2

/(kn)称为矫正数。(7-9)CTnSSikit-=S=2.11CxSSijnjkiT-=SS==21124于是有这个关系式中三种平方和的简便计算公式如下:其中,C=(2)自由度的剖分

在计算总平方和时,资料中的各个观测值要受这一条件的约束,故总自由度等于资料中观测值的总个数减1,即kn-1。总自由度记为dfT,即:

dfT=kn–1(7-10)25(2)自由度的剖分在计算总平方和时,资料中的各在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间自由度为处理数减1,即k-1。处理间自由度记为dft,即:

dft=k-1(7-11)在计算处理内平方和时,要受k个条件的约束,即,(i=1~k)。故处理内自由度为资料中观测值的总个数减k,即kn-k。处理内自由度记为dfe,即:dfe=kn–k=k(n-1)(7-12)26在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间因为所以

综合以上各式得:(7-13)(7-14)27因为所以即:总均方一般不等于处理间均方加处理内均方。各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为MST(或)、MSt(或)和MSe(或)。(7-15)(3)均方的计算

28即:总均方一般不等于处理间均方加处理内均方。各部分平方和除以计算均方后,通过比较处理间均方相对误差均方的大小即可判断处理效应所引起的变异所占比重,从而可以判断试验是否存在明显处理效应。29计算均方后,通过比较处理间均方相对误差均方的大小即可判断处理三、方差分析中的F测验方差分析的F检验用于测验某项变异因素的效应是否真实存在将要测验的那一项变异因素的均方作分子,另一项变异因素(例如误差项)的均方作分母(具体情况与所用试验设计和模型有关)如果F<1,则不必查F表,即可确定P>0.05,应该接受H030三、方差分析中的F测验方差分析的F检验用于测验某项变异因F测验需具备的条件:(1)被抽样总体的变数x服从正态分布,即x~N(μ,σ2

)(2)和彼此相互独立。注:当试验资料不符合这些条件时,需要作适当转换。31F测验需具备的条件:(1)被抽样总体的变数x服从正态分布,即第二节方差分析的一般步骤一、平方和与自由度的分解二、列出方差分析表,作F测验三、若F检验显著,则进行多重比较四、结果的解释/说明32第二节方差分析的一般步骤一、平方和与自由度的分【例】以A(CK)、B、C、D共4种药剂处理水稻种子,测得苗高结果如下表:药剂苗高观测值总和平均A182120137218B202426229223C101517145614D2827293211629T..=3362133【例】以A(CK)、B、C、D共4种药剂处理水稻种子,测得苗一、平方和与自由度的分解1、平方和的计算方法一:方法二:,C=T2

/(kn)CTnSSikit-=S=2.11CxSSijnjkiT-=SS==21134一、平方和与自由度的分解1、平方和的计算方法一:方法二:,C方法二:C=T2/(k·n)=3362/(4×4)=7056CxSSijnjkiT-=SS==211CTnSSikit-=S=2.11=(182+212+…+322)-C=602=(722+922+562+1162)/4-C=504SSe=SST-SSt=602-504=9835方法二:C=T2/(k·n)=3362/(4×4)=70562、自由度的分解tTedfdfdf-=-=tkdf1Tkndf-=1=4×4-1=15=4-1=3=15-3=12362、自由度的分解tTedfdfdf-=-=tkdf1Tknd二、列出方差分析表,作F测验表7.5药剂处理后水稻苗高的方差分析表变异来源dfSS药剂处理间3504随机误差1298总15602MS168.008.17F20.56显著F值F0.05=3.49F0.01=5.95**37二、列出方差分析表,作F测验表7.5药剂处理后水三、若F检验显著,则进行多重比较1、最小显著差数法(LSD法)到底哪些处理间存在真实差异?如何判断?——多重比较38三、若F检验显著,则进行多重比较1、最小显著差数法(LSD将这一判断标准记作:39将这一判断标准记作:39LSD0.05=2.179×2.02=4.40(cm)LSD0.01=3.055×2.02=6.17(cm)处理平均数与对照的差数A(CK)18-LSD0.05=4.40D2911**LSD0.01=6.17B235*C14-440LSD0.05=2.179×2.02=4.40(cm2、最小显著极差法(LSR法)

——LeastSignificantRanges根据极差抽样分布原理,将一组k个平均数由大到小排列后,依所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差LSRα值的多重比较方法。用于比较任意两个处理间的平均数的差异显著性,两平均数的差数的绝对值大于或等于LSRα则差异显著与LSD法相比,不同处理间的差数进行比较时需要根据差数所包含的平均数个数(m)不同确定不同的比较标准412、最小显著极差法(LSR法)

——LeastSignifLSR法根据其比较标准此方法包括两种:复极差法(q法)新复极差法(SSR法,shortestsignificantranges)*这里的qα、SSRα由α、

df、m三因素确定。*SE指标准误,随检验的对象不同(平均数或总和数)而不同。42LSR法根据其比较标准此方法包括两种:复极差法(q法)新复极4343①计算SE(比较四种药剂处理的平均数)②据ve=12查附表6得SSRα,计算LSR

α,

并列表m234SSR0.053.083.233.33SSR0.014.324.554.68LSR0.054.404.624.76LSR0.016.186.516.6944①计算SE(比较四种药剂处理的平均数)②据ve=12查附③按从大到小的顺序排列各处理平均数,并

用应定方法标识其差异显著性处理平均数D29B23A18C14P=4P=3P=2P=2P=3P=245③按从大到小的顺序排列各处理平均数,并

用应定方法标字母标记法

原则:凡是两个平均数无共同字母则表示差异显著,只要有一个字母相同就说明其间差异不显著字母标记法标记步骤(0.05标记小写字母,0.01标记大写字母):a)首先将全部平均数从大到小依次排列在最大的平均数标上字母a将该平均数与以下的平均数依次比较,凡不显著的都标上相同字母a,直到显著,标上下一字母b3、多重比较结果的表示方法46字母标记法

原则:凡是两个平均数无共同字母则表示差异以标上字母b的平均数作为标准,从下向上与上方各自比其大的平均数比较,凡是不显著的都标以b,直到显著为止注意:向上比较显著时不标新字母,向下比较显著时要标以新字母再以标有b的最大平均数为标准,向下依次比较,直到显著,标以字母c,再以标c平均数向上比较直到显著为止重复上述步骤,直到所有平均数都比较完47以标上字母b的平均数作为标准,从下向上与上方各自比其大的平均用字母标记法标记四种药剂试验的平均数差异关系p234SSR0.053.083.233.33SSR0.014.324.554.68LSR0.054.404.624.76LSR0.016.186.516.69处理差异显著性α=0.05α=0.01D29B23A18C14abcAcABBCC48用字母标记法标记四种药剂试验的平均数差异关系p234SSR0四种药剂处理效应间存在显著差异在0.05显著性水平上有D与其它药剂之间差异显著,B药剂显著高于A和C药剂,而A和C药剂间差异不显著而在0.01显著性水平上,D与A、C药剂处理间差异极显著,B药剂则极显著高于C药剂的处理效果。四、结果的解释/说明49四种药剂处理效应间存在显著差异在0.05显著性水平上有D与其另一例p23456789SSR0.053.003.153.233.303.343.373.393.41LSR0.051.241.301.331.361.381.391.401.40处理差异显著性α=0.05α=0.01A3B39.3A2B18.7A1B18.0A3B27.7A2B27.3A2B37.0A1B26.7A3B16.7A1B35.7aabbbccccccdddd50另一例p23456789SSR0.053.003.153.2凡是与对照比较或与预定的比较对象的比较,一般可选用LSD法关于多重比较方法的选择选用时考虑到否定一个正确的H0和接受一个不正确的H0的相对重要性51凡是与对照比较或与预定的比较对象的比较,一般可选用LSD法关显著尺度:

LSD法最低,SSR法次之,q法最高犯第一类错误概率:

LSD法最大,SSR法次之,q法最小*所以,当试验结论事关重大或要求较严格时,宜采用q测验,一般试验可采用LSD法52显著尺度:LSD法最低,SSR法次之,q法最高犯第一类第三节数学模型一、方差分析的模型据其中ti的不同可将模型分为两类:(1)固定模型(2)随机模型53第三节数学模型一、方差分析的模型据其中ti的不同可1、固定模型指试验的各处理均抽自特定的处理总体,这些总体遵循N(mi,s)的分布,处理效应ti

=mi

–m是固定的,试验的目的在于研究ti的大小,如果重复做试验,所用处理不变,试验的假设为:mmt==iiH或:00e2*在F测验H0被否定后,进一步的工作是多重比较,用于比较每个处理的效应大小541、固定模型指试验的各处理均抽自特定的处理总体,这些*每次重复试验时所用材料和试验处理都是固定的,即ti

=mi

-m是固定的*固定模型所做出的推断仅限于试验所用处理范围之内,不可推而广之*用于效应比较一类的试验,包括多数栽培试验(如肥料、密度、农药...)以及很多室内效应比较试验等55*每次重复试验时所用材料和试验处理都是固定的,即ti=指试验的各处理是从同一个总体N(0,)抽得的一组随机样本,ti

=mi

–m是随机变量,随试验的不同而不同。试验的目的不在于研究ti的大小,而在于研究ti的变异度;如果重复做试验,所用处理会改变。试验的假设为:2、随机模型2ts00220>=ttss::AHH*在F测验H0被否定后,进一步的工作是是计算的大小,然后估计遗传力等遗传参数2ts2ts56指试验的各处理是从同一个总体N(0,*每次重复试验时都要再次随机抽取样本,因此ti

=mi

–m会发生变化*随机模型所做出的推断不仅限于试验所用处理,其目的在于推断抽出这些处理的整个总体,因而其推断可以在一定条件下推而广之*在育种和生态一类的试验中应用较为广泛,目的在于总体特征的研究57*每次重复试验时都要再次随机抽取样本,因此*随机模型所做比较项目固定模型随机模型①处理来源②试验目的③统计假设④H0被否的进一步工作⑤推断范围两类模型的比较58比较项目固定模型随机模型①处理来源②试验目的③统计假设判断两类模型的标准:(1)看处理因素的水平是否可以完全控制:随机模型的处理因素水平不可以控制固定模型的处理因素水平可以完全控制温度——菌落生长的影响化肥——植物产量的提高农家肥——植物产量的提高59判断两类模型的标准:(1)看处理因素的水平是否可以完全控制:判断两类模型的标准:*欲通过试验看一个地区辣椒产量的整体水平(2)看研究目的:固定模型:特定个体的比较随机模型:总体变异情况的研究*欲通过试验从一批辣椒品种中选出几个产量水平较高的品种在某地区推广如前面四种药剂试验的例子60判断两类模型的标准:*欲通过试验看一个地区辣椒产量的整体水第三节单因素方差分析——适用于单因素完全随机试验设计61第三节单因素方差分析——适用于单因素完一、每个处理观察值数目相等的单向分组资料62一、每个处理观察值数目相等的单向分组资料62处理盆1盆2盆3盆4总和平均A氨水12430282610827.0B氨水2272421269824.5C碳酸氢铵3128253011428.5D尿素3233332812631.5E对照212216218020.0T..=52626.3【例】表水稻盆栽施肥试验产量结果(g/盆)63处理盆1盆2盆3盆4总和平均A氨水1243028261082表不同肥料处理后水稻产量的方差分析表变异来源DFSSMSFF0.01处理间4301.275.3011.19**4.89误差15101.06.73总和19402.2LSR:LSD:64表不同肥料处理后水稻产量的方差分析表变异来源DFSS资料的LSR值(n

=15)多重比较结果p2345SSR0.053.013.163.253.31SSR0.014.174.374.504.58LSR0.053.904.104.224.29LSR0.015.415.675.845.94施N法均值5%水平1%水平尿素31.5碳酸氢铵28.5氨水127.0氨水224.0对照20.0aabbbAAABBBCCc65资料的LSR值(n=15)多重比较结果p2345SSR0.资料的LSR值(n

=15)多重比较结果p2345Q0.053.013.674.084.37Q0.014.174.845.255.56LSR0.053.904.765.295.67LSR0.015.416.286.817.21施N法均值5%水平1%水平尿素31.5碳酸氢铵28.5氨水127.0氨水224.0对照20.0aaabbbcAAABBBCC66资料的LSR值(n=15)多重比较结果p2345Q0.05LSD:多重比较结果施N法均值与CK差值

D尿素31.511.5**C碳酸氢铵28.58.5**A氨水127.07.0**B氨水224.04.0*E对照20.0-v=15时,t0.05=2.131;t0.01=2.947LSD0.05=3.91;LSD0.01=5.4067LSD:多重比较结果施N法均值与CK差值D尿素31.51二、每个处理观察值数目不相等的单向分组资料68二、每个处理观察值数目不相等的单向分组资料68每个处理观察值数目不相等时平方和与自由度的分解69每个处理观察值数目不相等时平方和与自由度的分解69每个处理观察值数目不相等时的多重比较70每个处理观察值数目不相等时的多重比较705个不同品种羊的育肥试验,后期30天增重(kg)如表7.12所示。试比较品种间增重有无差异。品种增重(kg)niTi.B121.519.520.022.018.020.06121.020.2B216.018.517.015.520.016.06103.017.2B319.017.520.018.017.0591.518.3B421.018.519.020.0478.519.6B515.518.017.016.0466.516.6合计25460.5【例】715个不同品种羊的育肥试验,后期30天增重(kg1、计算各项平方和与自由度721、计算各项平方和与自由度722、列方差分析表,进行F测验变异来源自由度平方和均方F值F0.05F0.01EMS品种间误差总变异方差分析显示F=5.99>F0.01(4,20),P<0.01,表明品种间差异极显著,此试验为固定模型,下一步需要进行品种间的多重比较732、列方差分析表,进行F测验变异来源自由度平方和均方F值F03、多重比较假设用SSR法(可用其它多重比较方法)因为各处理重复数不等,应先计算出平均重复次数n0来代替标准误SE中的n

秩次距(p)SSR0.05SSR0.01LSR0.05LSR0.0122.954.021.8442.51333.104.221.9382.63843.184.331.9882.70653.254.402.0312.750743、多重比较假设用SSR法(可用其它多重比较方法)因为各处理羊品种平均增重多重比较梯形表品种-16.6-17.2-18.3-19.6B120.23.63.01.90.6B419.63.02.41.3B318.31.71.1B217.20.6B516.675羊品种平均增重多重比较梯形表品种-16.6-17.2-18处理12…i…l总亚处理………12…j…m……观察值………xi11xi21…xij1…xim1……xi12xi22…xij2…xim2………………xi1kxi2k…xijk…ximk………………xi1nxi2n…xijn…ximn亚组总和………Ti1.Ti2.…Tij.…Tim.……亚组平均…………………组总和T1..T2..…Ti..…Tl..T…组平均……三、系统分组资料76处理12…i…l总亚处理………12…j…m……………xi17777系统分组资料平方和与自由度的分解78系统分组资料平方和与自由度的分解78二级分组资料的方差分析及其期望均方变异来源自由度SSMSFEMS混合模型随机模型组间l-1SStMStMSt/MSe1亚组间l(m-1)SSe1MSe1MSe1/MSe2亚组内(误差)lm(n-1)SSe2MSe2总变异lmn-1SST*若组间差异显著,则进行多重比较*若亚组间差异不显著,可将亚组间和亚组内的平方和进行合并,求其合并均方:*首先对亚组间进行F测验*若亚组间差异显著,然后对组间进行F测验79二级分组资料的方差分析及其期望均方变异来源自由度SSMSFE系统分组资料的多重比较F测验中的备比量被比较平均数所包含的观察值个数80系统分组资料的多重比较F测验中的备比量被比较平均数所包含的观【例】表4种培养液下株高增长量(mm)81【例】表4种培养液下株高增长量(mm)81【例】资料的方差分析表82【例】资料的方差分析表82第四节两向分组资料的方差分析两向分组(交叉分组)资料:试验包括两个因素两个因素的每个水平均衡相遇其水平组合总数即为处理数按组合观察值是否有重复其方差分析分两种情况组合内有重复观察值组合内无重复观察值83第四节两向分组资料的方差分析两向分组(交叉分组)资A因素B因素总和平均B1B2…Bj…BbA1

x11x12…x1j…x1bT1.A2x21x22…x2j…x2bT2.………………………Aixi1xi2…xij…xibTi.………………………Aaxa1xa2…xaj…xabTa.总和T.1T.2…T.j…T.bT..平均……A因素水平数为i=1,2,…,aB因素水平数为j=1,2,…,b共有处理组合数ab个,即观察值总数为ab个一、组合内无重复观测值的两向资料x.1xa.x.bx.jx.2x1.xi.x2.x..84A因素B因素总和平均B1B2…Bj…BbA1x11x12…1、模型851、模型852、平方和与自由度的分解862、平方和与自由度的分解863、方差分析及其期望均方变异来源自由度SSMSFEMS混合模型随机模型固定模型A因素a-1SSAMSAMSA/MSeB因素b-1SSBMSBMSB/MSe误差(a-1)(b-1)SSeMSe总变异ab-1SST873、方差分析及其期望均方变异来源自由度SSMSFEMS混合模4、多重比较884、多重比较88【例7.9】(P119)采用5种生长素处理豌豆,未处理为对照,待种子发芽后,分别每盆中移植4组,每组6盆,试验共有4组24盆,并按组排于温室中,使同组各盆条件一致。当各盆见第一朵花时记录总结间数,见下表:89【例7.9】(P119)采用5种生长素处理【例7.9】资料的方差分析表变异来源DFSSMSFF0.05F0.01光照组间35.451.82<1

激素间565.8713.174.56**2.904.56误差1543.302.89总和23114.6290【例7.9】资料的方差分析表变异来源DFSSMSFF0.05二、组合内有重复观测值的两向资料A因素B因素总和Ti..平均B1B2…Bj…BbA1………x1j1x1j2…x1jk…x1jn……T1..A2………x2j1x2j2…x2jk…x2jn……T2..……………………………………Ai………xij1xij2…xijk…xijn……Ti..……………………………………Aa………xaj1xaj2…xajk…xajn……Ta..总和Tj.T.1.T.2.…T.j.…T.b.T…平均……A因素水平数为i=1,2,…,aB因素水平数为j=1,2,…,b每个处理重复观察值数为k=1,2,…,n共有处理组合数ab个,则观察值总数为abn个91二、组合内有重复观测值的两向资料A因素B因素总和平均B1B21、模型921、模型922、平方和与自由度的分解932、平方和与自由度的分解933、方差分析及其期望均方变异来源自由度SSMSFEMS固定模型随机模型混合模型A因素a-1SSAMSAB因素b-1SSBMSBA×B互作(a-1)(b-1)SSA×BMSA×B误差ab(n-1)SSeMSe总变异abn-1SST因不同模型而异943、方差分析及其期望均方变异来源自由度SSMSFEMS固定模4、多重比较954、多重比较95【例】表7.153种肥料施于3种土壤的小麦产量96【例】表7.153种肥料施于3种土壤的小麦产量96表7.16表7.15资料的方差分析表肥类平均数的比较组合平均数的比较97表7.16表7.15资料的方差分析表肥类平表7.17表7.15资料的多重比较(肥类均值)98表7.17表7.15资料的多重比较(肥类均值)98表7.18表7.15资料的多重比较(组合均值)99表7.18表7.15资料的多重比较(组合均值)9如互作不存在,两个因素各最好水平的组合为最优处理如存在互作,两个因素各最好水平的组合不一定为最优处理100如互作不存在,两个因素各最好水平的组合为最优处理100第五节方差分析的基本假定和数据转换一、方差分析的三个基本假定101第五节方差分析的基本假定和数据转换一、方差分析的三1、处理效应和环境(误差)效应具有“可加性”1021、处理效应和环境(误差)效应具有“可加性”102SST

=SSt+SSe103SST=SSt+SSe103效应的可加性与倍加性处理可加性倍加性环境1环境2环境1环境2A10201020B30403060处理与环境彼此独立,其效应是线性可加的处理与环境不是彼此独立的,其效应非线性可加104效应的可加性与倍加性处理可加性倍加性环境1环境2环境1环境22、试验误差是独立的随机变量,且符合N(0,σ2)-“正态性”*误差的随机性是F测验的基本假定*εij相互之间是独立的——严格遵循试验设计的随机性——要杜绝系统误差,严格试验管理与环境控制*εij与ti之间也是独立的,如存在关联,则会表现为εij不符合正态分布1052、试验误差是独立的随机变量,且符合N(0,σ2)-“正态性3、所有试验处理必须具有共同的误差方差-“同质性”即假定各处理的εij~N(0,s2)如果计算所得处理内方差相差比较悬殊,可以通过F测验或2检验其是否同质,如不同质可以:*将试验分成比较同质的几个部分进行分析*将特殊处理从全试验中剔除求合并均方的前提是:1063、所有试验处理必须具有共同的误差方差-“同质性”即假定各处二、数据转换处理原始数据12A(%)1.21.5B(%)68方差转换前转换后0.0450.007220.07221、平方根转换平方根转换121.101.222.452.83样本平均数与其方差有比例关系如泊松分布()-稀有现象的数据每一次调查的偶然性比较大其方差会因平均数而异,不符合“同质性”做平方根处理后各处理内的方差同质性优于处理前107二、数据转换处理原始数据12A(%)1.21.5B(%)68处理倍加性环境1环境2A1020B3060对数转换环境1环境21.001.301.481.782、对数转换数据表现效应为倍加性或可乘性误差方差非同质性和非可加性通常也是用于稀有现象资料108处理倍加性环境1环境2A1020B3060对数转换环境1环境经对数转换后各处理内方差同质性增强对于改进非可加性的影响,比平方根转换更有效109经对数转换后各处理内方差同质性增强109生物学试验中一些连续性变数,有时容易形成左偏的一个分布,其均方会随处理平均数增加而增加,偏离正态分布可以采用对数法进行转换对数转换将数据的普通尺度变为对数尺度,将分布的右侧长尾缩短,使之趋向正态分布110生物学试验中一些连续性变数,有时容易形成左偏的一个分布,其均3、反正弦转换常用于平均数与方差有关联的资料以二项分布资料最为典型1113、反正弦转换常用于平均数与方差有关联的资料111通过反正弦转换,使具有小方差的小成数增大,大成数减小,改进了因不同p值造成的处理的误差均方的异质性;也相对改进了处理内均方的非独立性112通过反正弦转换,使具有小方差的小成数增大,大成数减小,改进了4、用几个观察值的平均数做方差分析1134、用几个观察值的平均数做方差分析113三、数据转换后资料的方差分析分析要点方差分析步骤同未经转换资料平方和与自由度的分解方法相同但是,平方和的计算采用转换后数据F测验显著时,多重比较也要用转换后的数据对分析的结果进行解释和描述时要用转换后的平均数反转换,再作结论114三、数据转换后资料的方差分析分析要点方差分析步骤同未经转换资解:资料分析(2)平方和与自由度分解试验资料为单向分组资料,设有一个对照试验设有k=4个处理,每处理有n=6个观察值资料数据为成数数据,且很多大于70,做方差分析前应做反正弦数据转换(1)反正弦数据转换与资料整理反正弦转换求总和数与平均数(下页表)【例】115解:资料分析(2)平方和与自由度分解试验资料为单向分组资料表不同处理有生活力花粉的百分数(p)转化后:有生活力花粉百分数的反正弦值()116表不同处理有生活力花粉的百分数(p)转化后:有生活力117117(3)列方差分析表变因DFSSMSFF0.05F0.01处理间误差总变异118(3)列方差分析表变因DFSSMSFF0.05F0.01处理(4)花粉生活力试验的多重比较判断标准LSDα=?119(4)花粉生活力试验的多重比较判断标准119处理平均数与对照的差数LSD0.05LSD0.01反转换为(%)对照68.0-9.0912.4086.0(2)61.26.876.8(1)58.99.173.3(3)52.016.062.1列出处理的差数比较表(5)结论与解释不同花粉储藏保鲜方法中,只有处理(2)与对照不存在显著差异(其活力仅降低9.2%),而其他两种储藏花粉的方法与对照存在显著差异(分别降低12.7%和23.9%)花粉盛于烧杯,置于干燥器中,藏于冰箱内是有效的花粉储藏方法120处理平均数与对照LSD0.05LSD0.01反转换为对照68作业:Page121习题6.1-6.7121作业:Page121121个人观点供参考,欢迎讨论!个人观点供参考,欢迎讨论!第六章方差分析123第六章方差分析1第一节方差分析的基本原理124第一节方差分析的基本原理2一、方差分析的意义

u检验或t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t检验法就不适宜了。这是因为:125一、方差分析的意义u检验或t检验法适用于样本1、u或t检验过程烦琐

例如,一试验包含5个处理,采用t检验法要进行=10次两两平均数的差异显著性检验;若有k个处理,则要作=k(k-1)/2

次类似的检验。1261、u或t检验过程烦琐例如,一试验包含5个处理2、无统一的试验误差,误差估计的准确性和检验的灵敏性低(1)t检验要进行两两比较,每次仅用2个样本信息估计总体方差,误差估计的准确性低(2)

k个处理平均值的自由度为k(n-1),而t检验查tα值的自由度为2(n-1),从而降低了检验的灵敏性两两比较合并均方:k个样本合并均方:1272、无统一的试验误差,误差估计的准确性和检验的灵敏性低(1)3、t检验增大犯α错误的概率t检验时对具有不同秩次的平均数采用同一个tα

,会增大犯α错误的概率,降低推断的可靠性。

2个平均数比较:α

=0.055个平均数比较:α’

=1-(1-0.05)10=0.401310个平均数比较:α”

=1-(1-0.05)45=0.90061283、t检验增大犯α错误的概率t检验时对具有不同秩次因此,多个平均数的差异显著性检验不宜用t(或u)检验,须采用方差分析法。方差分析(analysisofvariance)由英国统计学家R.A.Fisher于1923年提出的。——将多个样本(处理)的观测值作为一个总体,用方差来表示变异,把引起事件总的变异分解为各种因素的变异,并对每个因素引起的变异作数量估计,从而说明各因素的变异幅度及其在总变异中的重要程度;并用剩余变异无偏估计随机误差,进而比较处理均值间的差异。129因此,多个平均数的差异显著性检验不宜用t(或u)检验,须采有关术语:1、试验指标(experimentalindex)为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有:日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生理生化和体型指标(如血糖含量、体高、体重)等。2、试验因素(experimentalfactor)试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。试验因素常用大写字母A、B、C、…等表示。130有关术语:1、试验指标(experimentalinde3、因素水平(leveloffactor)试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。研究某种饲料中4种不同能量水平对肥育牛瘦肉率的影响,这4种特定的能量水平就是饲料能量这一试验因素的4个水平。因素水平用代表该因素的字母加添足标1,2,…,来表示。如A1、A2、…,B1、B2、…,等。4、试验处理(treatment)事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时,实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3种饲料和3个品种对猪日增重影响的两因素试验,整个试验共有3×3=9个水平组合,在多因素试验时,试验因素的一个水平组合就是一个处理。1313、因素水平(leveloffactor)试验因素所5、试验单位(experimentalunit)在试验中能接受不同试验处理的独立的试验载体叫试验单位。在畜禽、水产试验中,一只家禽、一头家畜、一只小白鼠、一尾鱼,即一个动物;或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往往也是观测数据的单位。6、重复(repetition)在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4次重复。1325、试验单位(experimentalunit)在试验二、方差分析的基本原理1、线性模型与基本假定假设某单因素试验有k个处理,每个处理有n次重复,共有nk个观测值。这类试验资料的数据模式如表7.1所示。133二、方差分析的基本原理1、线性模型与基本假定假设某单因素试验表7.1k个处理每处理有n个观测值的数据模式处理观察值(xij,i=1~k;j=1~n)总和平均1x11x12…

x1j…

x1nT1.2x21x22…

x2j…

x2nT2.┇

┇…

┇┇┇ixi1xi2…

xij…

xinTi.┇

┇┇…

┇…

┇┇┇kxk1xk2…

xkj…

xknTk.

Tx1.x2.xi.xk.x注:xij指第i个处理第j个观察值(i=1~k;j=1~n)134表7.1k个处理每处理有n个观测值的数据模式处理观察值(xij可以分解为:其中:μ表示全试验观测值总体的平均数;

i是第i个处理的效应(treatmenteffects)表示处理i对试验结果产生的影响。显然有εij是试验误差,相互独立,且服从正态分布N(0,σ2)。(7-1)式叫做单因素试验的线性模型,亦称数学模型。在这个模型中xij表示为总平均数μ、处理效应

i、试验误差εij之和。(7-1)(7-2)135xij可以分解为:其中:μ表示全试验观测值总体的平均数;ε由εij

相互独立且服从正态分布N(0,σ2),可知各处理i(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布N(μi,σ2)。尽管各总体的均数μi

可以不等或相等,σ2则必须是相等的。所以,单因素试验的数学模型可归纳为:效应的可加性(additivity)、分布的正态性(normality)、方差的同质性(homogeneity)。这也是进行其它类型方差分析的前提或基本假定。136由εij相互独立且服从正态分布N(0,σ2若将表7.1中的观测值xij(i=1,2,…,k;j=1,2,…,n)的数据结构(模型)用样本符号来表示,则(7-3)137若将表7.1中的观测值xij(i=1,2,…,k;j=1

(7-1)、(7-3)两式告诉我们:每个观测值都包含处理效应(i或),与误差(εij或),故kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。138(7-1)、(7-3)两式告诉我们:16药剂A(x1)B(x2)C(x3)D(x4)19212022232418252127192713201522总和Ti.76927296平均19231824观察值【例7.1】-22-33139药剂A(x1)B(x2)C(x3)D(x4)1921202药剂A(x1)B(x2)C(x3)D(x4)19212022232418252127192713201522总和Ti.76927296平均19231824观察值140药剂A(x1)B(x2)C(x3)D(x4)192120222、自由度与平方和的剖分

在方差分析中是用样本方差即均方(MS)来度量资料的变异程度的。表7.1中全部观测值的总变异可以用总均方来度量。将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子──称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母──称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。1412、自由度与平方和的剖分在方差分析中是用样本方差(1)平方和的剖分

在表7.1中,反映全部观测值总变异的总平方和是各观测值xij与总平均数的离均差平方和,记为SST。即(7-4)142(1)平方和的剖分在表7.1中,反映全部观测值总变异的总因为143因为21其中所以(7-5)(7-5)式中,为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,即:(7-6)144其中所以(7-5)(7-5)式中,(7-5)式中,为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即:(7-7)145(7-5)式中,为各于是有SST

=SSt+SSe

(7-8)这个关系式中三种平方和的简便计算公式如下:其中,C=T2

/(kn)称为矫正数。(7-9)CTnSSikit-=S=2.11CxSSijnjkiT-=SS==211146于是有这个关系式中三种平方和的简便计算公式如下:其中,C=(2)自由度的剖分

在计算总平方和时,资料中的各个观测值要受这一条件的约束,故总自由度等于资料中观测值的总个数减1,即kn-1。总自由度记为dfT,即:

dfT=kn–1(7-10)147(2)自由度的剖分在计算总平方和时,资料中的各在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间自由度为处理数减1,即k-1。处理间自由度记为dft,即:

dft=k-1(7-11)在计算处理内平方和时,要受k个条件的约束,即,(i=1~k)。故处理内自由度为资料中观测值的总个数减k,即kn-k。处理内自由度记为dfe,即:dfe=kn–k=k(n-1)(7-12)148在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间因为所以

综合以上各式得:(7-13)(7-14)149因为所以即:总均方一般不等于处理间均方加处理内均方。各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为MST(或)、MSt(或)和MSe(或)。(7-15)(3)均方的计算

150即:总均方一般不等于处理间均方加处理内均方。各部分平方和除以计算均方后,通过比较处理间均方相对误差均方的大小即可判断处理效应所引起的变异所占比重,从而可以判断试验是否存在明显处理效应。151计算均方后,通过比较处理间均方相对误差均方的大小即可判断处理三、方差分析中的F测验方差分析的F检验用于测验某项变异因素的效应是否真实存在将要测验的那一项变异因素的均方作分子,另一项变异因素(例如误差项)的均方作分母(具体情况与所用试验设计和模型有关)如果F<1,则不必查F表,即可确定P>0.05,应该接受H0152三、方差分析中的F测验方差分析的F检验用于测验某项变异因F测验需具备的条件:(1)被抽样总体的变数x服从正态分布,即x~N(μ,σ2

)(2)和彼此相互独立。注:当试验资料不符合这些条件时,需要作适当转换。153F测验需具备的条件:(1)被抽样总体的变数x服从正态分布,即第二节方差分析的一般步骤一、平方和与自由度的分解二、列出方差分析表,作F测验三、若F检验显著,则进行多重比较四、结果的解释/说明154第二节方差分析的一般步骤一、平方和与自由度的分【例】以A(CK)、B、C、D共4种药剂处理水稻种子,测得苗高结果如下表:药剂苗高观测值总和平均A182120137218B202426229223C101517145614D2827293211629T..=33621155【例】以A(CK)、B、C、D共4种药剂处理水稻种子,测得苗一、平方和与自由度的分解1、平方和的计算方法一:方法二:,C=T2

/(kn)CTnSSikit-=S=2.11CxSSijnjkiT-=SS==211156一、平方和与自由度的分解1、平方和的计算方法一:方法二:,C方法二:C=T2/(k·n)=3362/(4×4)=7056CxSSijnjkiT-=SS==211CTnSSikit-=S=2.11=(182+212+…+322)-C=602=(722+922+562+1162)/4-C=504SSe=SST-SSt=602-504=98157方法二:C=T2/(k·n)=3362/(4×4)=70562、自由度的分解tTedfdfdf-=-=tkdf1Tkndf-=1=4×4-1=15=4-1=3=15-3=121582、自由度的分解tTedfdfdf-=-=tkdf1Tknd二、列出方差分析表,作F测验表7.5药剂处理后水稻苗高的方差分析表变异来源dfSS药剂处理间3504随机误差1298总15602MS168.008.17F20.56显著F值F0.05=3.49F0.01=5.95**159二、列出方差分析表,作F测验表7.5药剂处理后水三、若F检验显著,则进行多重比较1、最小显著差数法(LSD法)到底哪些处理间存在真实差异?如何判断?——多重比较160三、若F检验显著,则进行多重比较1、最小显著差数法(LSD将这一判断标准记作:161将这一判断标准记作:39LSD0.05=2.179×2.02=4.40(cm)LSD0.01=3.055×2.02=6.17(cm)处理平均数与对照的差数A(CK)18-LSD0.05=4.40D2911**LSD0.01=6.17B235*C14-4162LSD0.05=2.179×2.02=4.40(cm2、最小显著极差法(LSR法)

——LeastSignificantRanges根据极差抽样分布原理,将一组k个平均数由大到小排列后,依所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差LSRα值的多重比较方法。用于比较任意两个处理间的平均数的差异显著性,两平均数的差数的绝对值大于或等于LSRα则差异显著与LSD法相比,不同处理间的差数进行比较时需要根据差数所包含的平均数个数(m)不同确定不同的比较标准1632、最小显著极差法(LSR法)

——LeastSignifLSR法根据其比较标准此方法包括两种:复极差法(q法)新复极差法(SSR法,shortestsignificantranges)*

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论