生物统计学方差分析_第1页
生物统计学方差分析_第2页
生物统计学方差分析_第3页
生物统计学方差分析_第4页
生物统计学方差分析_第5页
已阅读5页,还剩139页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学方差分析第1页/共144页某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,投喂不同的饲料,经1个月以后,各组鱼的增重(g)结果列于下表。重复饲料A1A2A3A413192482212702279257236308331826827329042842792492455359262258286311.8262.8247.4279.8表6-1不同饲料饲喂鱼增重的数据(g)20个样本4个平均数第2页/共144页(2)试验误差不统一,误差估计的精确性和检验的灵敏性低。t检验:C42

=6次6个标准误(1)检验过程烦琐。判断两组数据平均数间的差异显著性6次都接受Hoα错误(3)推断的可靠性低,检验时犯α错误概率大。t检验自由度较小P=(0.95)6=0.735P=1-0.735=0.265第3页/共144页将所有这些组数据放在一起,一次比较就对所有各组平均数间是否有差异作出判断。方差分析,又称为变量分析,是英国著名统计学家R.A.Fisher于1923年提出的。方差分析是对两个或多个样本平均数差异显著性检验的方法。方差分析(Analysisofvariance,ANOVA)第4页/共144页方差分析的基本原理1单因素方差分析2二因素方差分析3多因素方差分析4方差分析缺失数据的估计5方差分析的基本假定和数据转换6第六章方差分析第5页/共144页三、数学模型一、相关术语四、平方和与自由度的分解五、统计假设的显著性检验-----F检验六、多重比较二、方差分析的基本原理第一节方差分析的基本原理第6页/共144页一、相关术语试验中所研究的影响试验指标的原因或原因组合称为试验因素。试验因素也称为处理因素,简称为因素或因子。为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。例如日增重、酶活性、产量等。(一)试验因素第7页/共144页在试验中可以人为调控的因素在试验中不能人为调控的因素可控因素(固定因素)非控因素(随机因素)试验因素常用大写字母A、B、C、…等来表示。因素的水平不能严格控制,或水平能控制,其效应为随机变量;重复时可得到相同的结果。因素的水平可准确控制,且水平固定后,其效应也固定;重复时不易得到相同的结果。(一)试验因素第8页/共144页每个试验因素的不同状态(处理的某种特定状态或数量上的差别)称为因素水平,简称为水平。因素是一个抽象的概念,水平是一个较为具体的概念。温度酶活性15℃、20℃、25℃、30℃水平用代表该因素的字母加下标1、2、3、…等来表示。如A1、A2、A3、…,B1、B2、B3、…等。一、相关术语(二)因素水平第9页/共144页试验处理常称为处理,指对受试对象给予的某种外部干预(或措施),是试验中实施的因子水平的一个组合。单因素处理多因素处理一、相关术语(三)试验处理第10页/共144页一个4种不同配合饲料对鱼的饲喂试验,实施在试验单位上的具体项目就是饲喂某一种饲料。试验因素的一个水平考察在该因素不同水平值上性状量值的变化规律,找出最佳水平或估计其总体变异。两个或两个试验因素的一个水平组合考察反应量在各因素不同水平、水平组合上的变化规律,找出水平的最佳组合或估计总体变异。因素处理目的举例3种播种密度对4个小麦品种的产量的影响研究,试验共有3×4=12个水平组合。其它单因素处理多因素处理可以同时研究主效应、交互作用

第11页/共144页试验误差是指试验中由于无法控制的因素所引起的差异,简称为误差。随机误差系统误差一、相关术语(四)试验误差第12页/共144页在实验中能接受不同试验处理的独立的试验载体,即根据研究目的而确定的观测总体。在试验中,将一个处理实施在两个或两个以上的试验单位上。处理实施的试验单位数即处理的重复数。植物个体、动物个体以及不同的组织、器官等都可以作为试验单位。一、相关术语(五)试验单位(六)重复第13页/共144页重复饲料A1A2A3A413192482212702279257236308331826827329042842792492455359262258286311.8262.8247.4279.8表6-1不同饲料饲喂鱼增重的数据(g)试验指标单因素水平重复第14页/共144页观测值差异基本思想:将测量数据的总变异按照变异原因不同分解为处理效应和试验误差,并作出其数量估计。

处理效应误差效应二、方差分析基本思想第15页/共144页比较处理效应和误差效应在总变异中所占的比例。处理效应试验误差相差不大,说明试验处理对指标影响不大。相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。第16页/共144页表6-2每组具n个观测值的k组样本符号表三、数学模型处理A1A2…Ai…Ak重复x11x21…xi1…xk1x12x22…xi2…xk2………………x1jx2j…xij…xkj………………x1nx2n…xin…xkn总和Ti.T1.T2.…Ti.…Tk.T..=∑xij平均xi.x1.x2.xi.xk.x..第i个处理的第j个观测值第i个处理n个观测值的和全部观测值的和第i个处理的平均数全部观测值的总平均数第17页/共144页表6-2每组具n个观测值的k组样本符号表处理A1A2…Ai…Ak重复x11x21…xi1…xk1x12x22…xi2…xk2………………x1jx2j…xij…xkj………………x1nx2n…xin…xkn总和Ti.T1.T2.…Ti.…Tk.T..=∑xij平均xi.x1.x2.xi.xk.x..第i个处理观测值总体平均数试验误差三、数学模型第18页/共144页第i个处理的效应,即处理i对试验结果产生的影响固定模型随机模型混合模型三、数学模型第19页/共144页固定模型各处理的效应值τi

是固定值,它是由固定因素所引起的效应。实验因素的各水平是根据试验目的事先主观选定的而不是随机选定的。在固定模型中,除去随机误差之后的每个处理所产生的效应是固定的,试验重复时会得到相同的结果。方差分析所得到的结论只适合于选定的那几个水平,并不能将其结论扩展到未加考虑的其它水平上。第20页/共144页各处理的效应值τi

不是固定的数值,而是由随机因素所引起的效应。τi

是一个标准正态总体中的随机变量。选取4窝动物,每窝均有4只幼仔,分析不同窝出生的幼仔体重是否显著。从美国经进的黑核桃品种在不同纬度生态条件下试种,观察该品种对不同地理条件的适应情况。随机模型第21页/共144页在随机模型中,水平确定之后其处理所产生的效应并不是固定的,试验重复时也很难得到相同的结果。方差分析所得到的结论,可以推广到这个因素的所有水平上。随机模型第22页/共144页在设计思想和统计推断上有明显不同,因此进行方差分析时的公式推导也有所不同。其平方和与df的分解公式没有区别,但在进行统计推断时假设检验构成的统计数是不同的。模型分析的侧重点也不完全相同,方差期望值也不一样,固定模型主要侧重于效应值的估计和比较,而随机模型则侧重效应方差的估计和检验。对于单因素方差分析来说,两者并无多大区别。随机模型固定模型123第23页/共144页在多因素试验中,既有固定效应的试验因素,又有随机效应的试验因素,则属于混合模型.混合模型为推断全国6~7岁孩的身长发育状况,随机抽取3个省,每个省分为城市和农村两类地区,各抽取20例数据进行分析。这其中城市与农村两个水平组成的地区属于固定效应型,由于省份的三个水平是通过抽样确定的,属于随机效应型。在实际应用中,固定模型应用最多,随机模型和混合模型相对较少。第24页/共144页观测值变异处理间的变异处理内的变异方差第25页/共144页总平方和总自由度处理间处理内处理间处理内四、平方和与自由度的分解第26页/共144页四、平方和与自由度的分解(一)平方和分解第27页/共144页0第28页/共144页每一处理n个观测值离均差平方和累加k个处理的离均差平方和累加总平方和SST处理内平方和SSe处理间平方和SSt第29页/共144页C(矫正数)第30页/共144页第31页/共144页第32页/共144页四、平方和与自由度的分解(二)自由度分解第33页/共144页重复饲料A1A2A3A413192482212702279257236308331826827329042842792492455359262258286总和1559131412371399平均数311.8262.8247.4279.8表6-1不同饲料饲喂鱼增重的数据(g)k=4n=5nk=20第34页/共144页(1)平方和计算(2)自由度计算(3)方差计算第35页/共144页五、显著性检验---F检验1提出假设2确定显著性水平3计算统计量4统计推断否定Ho,接受HA,说明不同饲料饲喂鱼的增重差异是极显著的,用不同的饲料饲喂,增重是不同的。第36页/共144页在方差分析中,通常将变异来源、平方和、自由度、均方和F值整理成一张方差分析表。在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及F检验可在方差分析表上进行。变异来源dfSSs2FF0.05F0.01饲料间311435.353811.7837.1323.245.29饲料内168551.60534.475总变异1919986.95**表中的F值应与相应的被检验因素齐行。表6-3不同饲料饲喂鱼增重的方差分析表第37页/共144页F值显著或极显著,否定了无效假设H0

,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异。变异来源dfSSs2FF0.05F0.01饲料间311435.353811.7837.1323.245.29饲料内168551.60534.475总变异1919986.95表6-3不同饲料饲喂鱼增重的方差分析表**并不能说明每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。第38页/共144页统计上把多个平均数两两间的相互比较称为多重比较。六、多重比较有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。最小显著差数法(LSD法)最小显著极差法(LSR法)第39页/共144页由统计学家R.A.Fisher提出的,其实质是两个平均数相比较的t检验法。LSD(leastsignificantdifference)法在F检验显著的前提下,先计算出显著水平为α的最小显著差数LSDα,然后将任意两个处理平均数的差数的绝对值与其比较。在α水平上差异显著在α水平上差异不显著第40页/共144页LSD检验均数差值标准误误差方差两组数据误差均方的自由度tα自由度被比较的两个均数t检验第41页/共144页(1)计算最小显著差数

LSDα;(2)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;(3)将平均数多重比较表中两两平均数的差数与LSDα比较,作出统计推断。LSD法方法步骤第42页/共144页(xi)饲料平均数差异显著性(xi.-247.4)(xi.-262.8)(xi.-279.8)A1311.864.4**49.0**32.0*A4279.832.4*17.0A2262.815.4A3247.4表6-44种饲料饲喂鱼增重差异显著性表梯形表示法(三角形法)第43页/共144页饲料平均数差异显著性

0.050.01A1311.8A4279.8A2262.8A3247.4(1)全部平均数从大到小依次排列;abcbcABAB(2)在最大的平均数上标字母a,将该平均数与以下各平均数相比,凡相差不显著的标a,直至某个与之相差显著的则标以字母b;(3)以该标有b的平均数为标准,与各个比它大的平均数比较,凡差数差异不显著的在字母a的右边加标字母b;(4)以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差数不显著的继续标以字母b,直至差异显著的平均数标以字母c,再与上面的平均数比较;(5)重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。(6)差异极显著标记方法同上,用大写字母标记。B字母标记法第44页/共144页LSD法实际上是用t检验对所有平均数进行一对一的检验。自50年代以来,提出了多重范围检验的思想:即把平均数按大小排列后,对离得远的平均数采用较大的临界值。应用较多的有最小显著极差法(LSR法)。LSD法没有考虑平均数依数值大小排列上的秩次,多次重复使用t检验的方法,会大大增加犯α错误的概率。LSD法只需计算一个LSDα,应用方便。第45页/共144页LSR(leastsignificantranges)法LSR法采用不同平均数间用不同的显著差数标准进行比较,根据极差范围内所包含的处理数据(秩次距)k的不同而采用不同的检验尺度。这种在显著水平α上依秩次距k的不同而采用不同的检验尺度的显著性检验方法称为最小显著极差法。SSR检验q检验新复极差检验(newmultiplerangetest)(theshortestsignificantranges)邓肯(Duncan)法Duncan多范围检验法(Duncanmultiplerangetest)第46页/共144页(1)按相比较的样本容量计算平均数标准误(2)查SSR表,自由度dfe,所含平均数个数M(3)将各平均数按大小顺序排列,用各个M值的LSRα进行检验。附表8(P324)新复极差检验SSR值表dfM(检验极差的平均数个数)2345616(0.05)3.003.143.243.303.3416(0.01)4.134.314.424.514.57第47页/共144页表6-64种饲料饲喂鱼增重试验LSR值(SSR检验)M234LSR0.0531.0232.4733.50LSR0.0142.7044.5745.70饲料平均数差异显著性

0.050.01A1311.8A4279.8A2262.8A3247.4abbcABABcB表6-54种饲料饲喂鱼增重试验(LSD检验)饲料平均数差异显著性

0.050.01A1311.8A4279.8A2262.8A3247.4abbbABABB表6-74种饲料饲喂鱼增重试验(SSR检验)第48页/共144页q检验q检验法也称为Student-Newman-Keuls(SNK)检验,是以统计量q的概率分布为基础的。附表9(P324)q值表dfM(检验极差的平均数个数)2345616(0.05)3.003.654.054.344.5616(0.01)4.134.785.195.495.72第49页/共144页表6-84种饲料饲喂鱼增重试验LSR值(q检验)M234LSR0.0531.0237.7441.88LSR0.0142.7049.4353.66饲料平均数差异显著性

0.050.01A1311.8A4279.8A2262.8A3247.4abbbAAABB表6-94种饲料饲喂鱼增重试验(q检验)B第50页/共144页LSR值(q检验)M234LSR0.0531.0237.7441.88LSR0.0142.7049.4353.66LSR值(SSR检验)M234LSR0.0531.0232.4733.50LSR0.0142.7044.5745.70k=2,三种方法显著尺度是相同的。k>2,三种方法显著尺度不相同。第51页/共144页精度要求高的试验精度要求一般的试验各个处理平均数与对照相比的试验q检验SSR检验LSD检验犯α错误的概率LSD检验SSR检验q检验>>第52页/共144页方差分析步骤定义总平方和与自由度的分解;(2)列方差分析表,进行F检验;(3)若F检验显著,进行多重比较(注明方法)方差分析是对两个或多个样本平均数差异显著性检验的方法。它是将测量数据的总变异按照变异来源分解为处理效应和试验误差,并作出其数量估计。第53页/共144页第二节单因素方差分析单因素方差分析的目的:正确判断该试验因素各水平的相对效果。组内观测次数相等的方差分析组内观测次数不等的方差分析第54页/共144页一、组内观测次数相等的方差分析例6.2测定东北、内蒙古、河北、安徽、贵州5个地区黄鼬冬季针毛的长度,每个地区随机抽取4个样本,测定的结果如下表所示,比较其差异显著性。地区东北内蒙古河北安徽贵州132.029.225.523.322.3232.827.426.125.122.5331.226.325.825.122.9430.426.726.725.523.7表6-10不同地区黄鼬冬季针毛长度(mm)第55页/共144页(1)平方和计算(2)自由度计算(3)方差计算(4)F检验第56页/共144页变异来源dfSSs2FF0.05F0.01地区间4173.7143.42850.1483.064.89地区内1512.990.866总变异19186.70**表6-11不同地区黄鼬冬季针毛长度方差分析表第57页/共144页地区平均数差异显著性0.050.01东北31.60内蒙古27.40河北26.03安徽24.75贵州22.85表6-12不同地区黄鼬冬季针毛长度显著性比较(LSD检验)abbccdABBCCDD第58页/共144页二、组内观测次数不等的方差分析处理12……i……k重复n1n2……ni……nk变异来源dfSSs2F处理间处理内总变异表6-13组内观测次数不等的方差分析第59页/共144页第60页/共144页例6.3用某种小麦种子进行切胚乳试验,实验分为三种处理:整粒小麦(I),切去一半胚乳(II),切去全部胚乳(III),同期播种于条件较一致的花盆内,出苗后每盆选留两株,成熟后进行单株考种,每株粒重结果如表,试进行方差分析。处理株号合计平均数12345678910ⅠⅡIII21202429252224252822232525292130312627242626202120424414625.524.424.3表6-14小麦切胚乳试验单株粒重(g)n1

=8,n2

=10,n3

=6,N=24第61页/共144页(1)平方和的计算(2)自由度的计算(3)列方差分析表变异来源SSdfs2F处理间处理内6.8233.72213.410.70.318总变异230.523第62页/共144页第63页/共144页第三节二因素方差分析两个因素共同影响试验指标的试验处理。主效各试验因素的相对独立作用称为该因素的主效应,简称为主效。它是由于因素水平的改变而造成因素效应的改变。互作互作效应是由于两个或多个试验因素的相互作用而产生的效应。某一因素在另一因素的不同水平上所产生的效应不同,则二因素间存在交互作用,简称互作。第64页/共144页因素间的交互作用显著与否关系到主效应的利用价值。若交互作用显著,则各因素的效应就不能累加,最优处理组合的选定应根据各处理组合的直接表现选定。二因素间是否存在交互作用有专门的统计判断方法,有时也可根据专业知识判断。若交互作用不显著,则各因素的效应可以累加。各因素的最优水平组合,即为最优的处理组合。有时交互作用相当大,甚至可以忽略主效应。第65页/共144页第三节二因素方差分析无重复观测值的二因素方差分析有重复观测值的二因素方差分析第66页/共144页无重复观测值的二因素方差分析二因素无交互作用时,每个处理可只设一个观测值。因素A

因素BB1B2…Bb总和平均数A1x11x12…x1bT1.x1.A2x21x22…x2bT2.x2.…………………Aaxa1xa2…xabTa.xa.总和T.1T.2…T.bT平均数x.1x.2…x.bx..A因素a个水平,B因素b个水平,每个处理组合只有1个观测值。表6-15无重复观测值的二因素数据资料第67页/共144页第68页/共144页(1)平方和的分解(2)自由度的分解(3)计算方差(4)F值的计算:第69页/共144页例6.4

将一种生长激素配成M1、M2、M3、M4、M5五种浓度,并用H1、H2、H3三种时间浸渍某大豆品种的种子,出苗45天后的各处理每一植株的平均干物重(g)。浓度(A)时间(B)H1H2H3M11314144113.67M21212133712.33M333393.00M410910299.67M5254113.674043441278.08.68.88.47表6-15激素处理对大豆干物重的影响(g)激素浓度和时间均为固定因素,适应于固定模型。第70页/共144页(1)平均和计算(2)自由度的计算第71页/共144页变异来源dfSSs2FF0.05F0.01浓度间4289.0672.27116.56**3.847.01时间间误差281.734.940.870.621.404.468.65总变异14295.73F检验结果表明,不同激素浓度对大豆干物重有极显著差异。(4)进行多重比较(用SSR检验)表6-16激素处理对大豆干物重影响的方差分析浓度间的平均数标准误均为b=3是每一浓度的观测值数目。如果要比较时间间的效应,由于每一时间有a=5个观测值,其平均数的标准误应为(3)列方差分析表第72页/共144页M2345SSR0.053.263.403.483.52SSR0.014.754.945.065.14LSR0.051.481.551.581.60LSR0.012.162.252.302.34表6-17不同浓度大豆干物重多重比较SSR和LSR值查SSR值表,当dfe=8,M=2,3,4,5时SSR值、LSR值列于下表浓度平均数差异显著性α=0.05α=0.01M1M2M3M4M513.6712.339.673.673.00aabccAABCC表6-18不同浓度大豆干物重差异显著性检验(SSR检验)第73页/共144页对固定模型而言,结论只能适用于参加试验的几个水平,不能任意推广到其他水平上去。如果存在两个因素的互作,方差分析中就不能用互作来估计误差,必须在有重复观测值的情况下对试验误差进行估计。无重复观测值的二因素方差分析,所估计的误差实际上是这两个因素的相互作用,这是在两个因素不存在互作,或互作很小的情况下进行估计的。第74页/共144页因素A因素BTi.xi.B1B2…BbA1x111x121…x1b1T1.x1.x112x122…x1b2…………x11nx12n…x1bnA2x211x221…x2b1T2.x2.x212x222…x2b2…………x21nx22n…x2bn…………………Aaxa11xa21…xab1Ta.xa.xa12xa22…xab2…………xa1nxa2n…xabnT.jT.1T.2…T.bx.jx.1x.2…x.bTx..A因素a水平,B因素有b水平,每一重复都包括ab次实验,设试验重复n次。第75页/共144页有重复观测值的二因素方差分析A因素i水平,B因素j水平,第k次重复观测值总平均值A因素i水平的效应B因素j水平的效应A因素i水平和B因素j水平的交互作用随机误差第76页/共144页(1)平方和的分解为:A因素a水平,B因素有b水平,每一重复都包括ab次实验,设试验重复n次。abnSSt第77页/共144页(3)各项的方差分别为(2)自由度的分解为第78页/共144页(4)F检验αi、βj、(αβ)ij

和εijk是相互独立的随机变量。αi,βj及(αβ)ij

均为固定效应。固定模型随机模型(以A为固定因素,B为随机因素为例)A和B的效应为非可加性,αi

为固定效应,βj及(αβ)ij

为随机效应。混合模型第79页/共144页例6.5为了研究某种昆虫滞育期长短与环境的关系,在给定的温度和光照条件下在实验室培养,每一处理记录4只昆虫的滞育天数,结果列于表中,是对该材料进行方差分析。光照(A)温度(B)250C300C350C5h·d-1143138120107101100808389931017610h·d-1961037891796183598076616715h·d-1798396986071786467587183表6-19不同温度及光照条件下某种昆虫滞育天数第80页/共144页由于温度和光照条件都是人为控制的,为固定因素,可依固定因素分析。将表6-19中数字均减去80,整理得下表光照(A)标本号温度(B)250C300C350C5h·d-112346358402721200391321-4271188443910h·d-112341623-211-1-193-210-4-19-13-2648-38-3615h·d-11234-131618-20-9-2-16-13-22-93-5236-47-41272-41-38193第81页/共144页(1)平方和计算第82页/共144页(2)自由度分解第83页/共144页(4)列方差分析表变异来源dfSSs2FF0.05F0.01光照间25367.062683.5321.94**3.355.49温度间25391.062695.5322.03**3.355.49光照×温度误差427464.943303.25116.24122.340.952.734.11总变异35295.73F检验结果表明,浓度间和时间间的F值大于F0.01,即昆虫滞育期长短主要决定于光照和温度,而与两者之间的互作关系不大。表6-20昆虫滞育天数方差分析表(3)计算方差第84页/共144页了解各种光照时间及温度对滞育期的影响,需进行不同光照间及不同温度间的多重比较。(5)多重比较光照(A)间平均数标准误温度(B)间平均数标准误第85页/共144页例6.6在啤酒生产中,为了研究烘烤方式(A)与大麦水分(B)对糖化时间的影响,选了两种烘烤方式,4种水分共8种处理,每一处理重复三次,结果如下表。烘烤方式(A)水分(B)B1B2B3B4A112.09.516.018.013.010.015.519.014.512.514.017.0A25.013.017.515.06.514.018.516.05.515.016.017.5表6-21不同烘烤方式及水分的糖化时间A固定因素B随机因素混合模型第86页/共144页烘烤方式(A)标本号水分(B)B1B2B3B4A112.0-0.56.08.051.023.00.05.59.034.52.54.07.09.52.015.524.0A21-5.03.07.55.039.52-3.54.08.56.03-4.55.06.07.5-13.012.022.018.5-3.51437.542.590.5第87页/共144页(1)平方和的分解第88页/共144页(2)自由度分解第89页/共144页变异来源dfSSs2FF0.05F0.01烘烤方式A15.5105.5100.15410.1934.12水分B3228.86576.28855.482**3.245.29A×B误差316107.61522.00035.8721.37526.089**3.245.29总变异23363.99表6-22大麦糖化时间方差分析表(3)列方差分析表第90页/共144页F检验结果表明,水分和A×B的F值大于F0.01,大麦中的水分及水分与烘烤方式之间的互作对糖化时间的影响达到了极显著水平。变异来源dfSSs2FF0.05F0.01烘烤方式A15.5105.5100.15410.1934.12水分B3228.86576.28855.482**3.245.29A×B误差316107.61522.00035.8721.37526.089**3.245.29总变异23363.99表6-22大麦糖化时间方差分析表烘烤方式对糖化时间的作用不显著。在生产上应注意大麦的含水量及根据含水量来选择合适的烘烤方式。第91页/共144页固定模型随机模型混合模型由于SSAB一般要大于SSe,交互作用存在时更为明显。因此若不能区分因素是随机或固定,有可能错用统计量,导致错误的结论。因此在两个以上因素的方差分析中,区分因素类型显得更为重要。随机、混合模型中,没有重复时,仍无法把SSAB和SSe分开,此时随机模型仍可对主效应进行检验,混合模型中也可以对固定因素的主效应进行检验。但当交互作用存在时,仅检验主效应没有太大意义,因为有可能是交互作用起主要作用。在因素间存在交互作用时,不设重复的试验是无意义的。因此试验时应尽可能设置重复,除非有可靠的证据证明交互作用不存在。第92页/共144页第四节多因素方差分析A因素a水平B因素b水平n次重复C因素c水平第93页/共144页实际分析时,可将三因素试验数据列成三个两向表(A、B因素组合,B、C因素组合,A、C因素组合),把三因素方差分析化为二因素方差分析。BjAiC1xij11xij12…xij1nC2xij21xij22…xij2n……………Ccxijc1xijc2…xijcnSSASSBSSABCkAiB1xi1k1xi1k2…xi1knB2xi2k1xi2k2…xi2kn……………Bbxibk1xibk2…xibknCkBjA1x1jk1x1jk2…x1jknA2x2jk1x2jk2…x2jkn……………Aax1jk1xajk2…xajknSSASSCSSACSSBSSCSSBC第94页/共144页总平方和:全部试验观测值的平方和误差平方和:同一处理下数据的变异平方和总平方和的分解总自由度的分解dfT=dfA+dfB+dfC+dfAB+dfAC+dfBC+dfABC+dfe第95页/共144页例6.6为了研究在猪饲料中添加胱氨酸(因素A)、蛋氨酸(因素B)和蛋白质(因素C)对猪日增重(kg)的影响,设计了下面的试验,每一组共用两头猪作重复.试作方差分析。第96页/共144页胱氨酸(A)蛋氨酸(B)蛋白质(C)日增重(g)合计00121.110.972.08141.521.452.970.025121.090.992.08141.271.222.490.05120.851.212.06141.671.242.910.050121.301.002.30141.551.533.080.025121.031.212.24141.241.342.580.05121.120.962.08141.761.273.030.100121.221.132.35141.381.082.460.025121.341.412.75141.401.212.610.05121.341.192.53141.461.392.850.150121.191.032.22140.801.292.090.025121.361.162.52141.421.392.810.05121.461.032.49141.621.272.89合计31.5028.9760.47A因素4水平B因素3水平2次重复C因素2水平固定模型第97页/共144页蛋氨酸(B)胱氨酸(A)T.j.00.050.100.1505.055.384.814.3119.550.0254.574.825.365.3320.080.0504.975.115.385.3820.84Ti..14.5915.3115.5515.0260.47蛋白质(C)胱氨酸(A)T..k00.050.100.15126.226.627.637.2327.70148.378.697.927.7932.77Ti..14.5915.3115.5515.0260.47蛋氨酸(B)蛋白质(C)T.j.121408.9510.6019.550.0259.5910.4920.080.0509.1611.6820.84T..k27.7032.7760.47第98页/共144页(1)列两向表,整理数据(2)平方和计算第99页/共144页第100页/共144页第101页/共144页(3)自由度的分解为第102页/共144页变异来源dfSSs2FF0.05F0.01胱氨酸A30.04270.01420.4453.014.72蛋氨酸B20.05260.02630.8243.405.61蛋白质C10.53550.535516.787**4.267.82A×B60.25430.04241.3292.513.67A×C30.23990.08002.5083.014.72B×C20.08210.04101.2853.405.61A×B×C误差6240.06850.76530.01140.03190.3572.513.67总变异47363.99检验结果表明,蛋白质对猪日增重影响极其显著,胱氨酸及蛋氨酸的影响不显著,推测饲料中不缺乏这两种氨基酸。表6-23猪增重试验方差分析表第103页/共144页方差分析的数据一般都是根据实验设计事先设计好的,缺一不可。意外事件常使某一个或某几个数据丢失,比如收获的作物可能遭到毁坏,动物可能有死亡,或者在记录时可能漏记或记错等等。数据的缺失使平方和的线性可加模型无效,因此无法直接进行方差分析。缺失的数据可用统计方法从理论上估计出,用计算出的数据去弥补缺失的数据,这样就可以用前面介绍过的方法进行分析。第104页/共144页第五节方差分析缺失数据的估计缺失一个数据的估计方法缺失两个数据的估计方法使补上缺失的数据后,误差平方和最小。弥补缺失数据的原则有一点必须明确,缺失数据估计并不能恢复原来的数据,只能是补足后不致于干扰其余数据,估计的数据并不能提出任何新的信息,因此,试验中应尽量避免这类情况发生。注意第105页/共144页B1B2B3B4B5B6B7B8总和A13039414242393838309A23746x4351443549305+xA32737362437413343278A43042354046473846324总和124164112+x1491761711441761216+x上表中x23是缺失的,需要补上。表6-24缺失一个数据试验结果表缺失一个数据的估计方法第106页/共144页B1B2B3B4B5B6B7B8总和A13039414242393838309A23746x4351443549305+xA32737362437413343278A43042354046473846324总和124164112+x1491761711441761216+x误差的平方和第107页/共144页为了SSe

达到最小,第108页/共144页B1B2B3B4B5B6B7B8总和A13039414242393838309A23746434351443549348A32737362437413343278A43042354046473846324总和1241641551491761711441761259由于缺失数据是估计值,当缺失一个数据时,总自由度应当减1。表6-24缺失一个数据试验结果表缺失一个数据的估计方法因素A和因素B的自由度仍是(a-1)和(b-1),误差自由度也相应减1。第109页/共144页B1B2B3B4B5B6B7B8总和A13039414242393838309A23746x4351443549305+xA3273736243741y43245+yA43042354046473846324总和124164112+x149176171111+y1761183+x+y缺失二个数据的估计方法表6-25缺失二个数据试验结果表第110页/共144页使SSe

极小,应满足经整理,解得:x=42.97,y=30.57即:第111页/共144页缺失的数据补上后进行方差分析时,总自由度dfT和误差自由度dfe均减2。缺失数据的估计值是使误差平方和为最小的值。因此,处理项平方和是向上偏欹的。但是,若缺失数据不是很多,对处理平均数之间的检验不会有太大的影响。第112页/共144页由于误差自由度减小,F检验的灵敏度相应降低,对分析问题是不利的,补救的数据只是不干扰方差分析,并不能提供丢失的信息,所以进行试验时,要谨慎小心,尽量避免数据的丢失。在缺失数据估计出来之后,将估计值填到缺失的位置上,然后,按一般方差分析方法进行分析,只要把总自由度和误差自由度项减去缺失数据即可。第113页/共144页对试验数据进行方差分析是有条件的,即方差分析的有效性建立在一些基本假定上。如果分析的数据不符合这些基本假定,得出的结论就不会正确。一般地说,在试验设计时,就应考虑方差分析的条件。第114页/共144页第六节方差分析的基本假定和数据转换基本假定正态性可加性方差同质性第115页/共144页试验误差是服从正态分布的独立的随机变量。非正态分布的资料进行适当数据转后,也能进行方差分析。正态性方差分析只能估计随机误差,顺序排列或顺序取样资料不能作方差分析。应用方差分析的资料应服从正态分布,即每一观测值Xij应围绕相应的平均数呈正态分布。第116页/共144页可加性方差分析的每一次观察值都包含了总体平均数、各因素主效应、各因素间的交互效应、随机误差等部分,这些组成部分必须以叠加的方式综合起来,即每一个观察值都可视为这些组成部分的累加和。方差分析的数学模型明确提出了处理效应与误差效应应该是“可加的”,正是由于这一“可加性”,才有了样本平方和的“可加性”,亦即有了试验观测值总平方和的“可剖分”性。第117页/共144页可加性可加性是否显著有专门的统计方法。方差分析的数学模型均为线性可加模型,其理论分析是建立在线性统计模型的基础上的,这正说明可加性性是方差分析的重要先决条件。如果试验资料不具备这一性质,那么变量的总变异依据变异原因的剖分将失去根据,方差分析不能正确进行。第118页/共144页方差同质性误差异质将使检验中某些处理效应得到错误的结果。如有方差异质的现象,可将变异特别明显的数据剔除;或者将试验分成几个部分分析,使每部分具有同质的方差。各个处理观测值总体方差σ2应是相等的,即不同处理不能影响随机误差的方差。只有这样,才有理由以各个处理均方的合并均方作为检验各处理差异显著性的共同的误差均方。第119页/共144页正态性可加性方差同质性理论分析:数据具有正态性统计分析:方差齐性检验两个总体方差是否相等的检验:F检验。在方差分析中若要对方差齐性进行检验,必然涉及多个总体方差进行比较。如两两进行多次比较,会增加第一类错误的可能性。常用的多总体方差齐性检验:对数方差分析、巴勒特检验、Fmax检验。第120页/共144页正态性可加性方差同质性进行方差分析的基本前提或基本假定。如果在分差分析前发现有某些异常的观测值、处理或单位组,只要不属于研究对象本身的原因,在不影响分析正确性的条件下应加以删除。第121页/共144页样本的非正态性、不可加性和方差的异质性通常连带出现,主要的是考虑处理效应与误差效应的可加性,其次才考虑方差同质性。数据转换有些资料就其性质来说就不符合方差分析的基本假定。其中最常见的一种情况是处理平均数和均方有一定关系(如泊松分布和二项式分布)。对这类资料不能直接进行方差分析,而应考虑采用非参数方法分析或进行适当数据转换后再作方差分析。第122页/共144页平方根转换对数转换反正弦转化数据转换第123页/共144页平方根转换特点:对方差的降缩作用较强。样本平均数与其方差有比例关系,采用平方根转换可获得同质的方差。适用于各组均方与其平均数之间有某种比例关系的资料,尤其适用于总体呈泊松分布的资料。第124页/共144页表6-26燕麦田中某种杂草的株数35.2537.7585.25413.00395.75xi20165231538047787151377319326316142244221817775384381A5A4A3A2A1处理表6-27燕麦田中某种杂草的株数的平方根5.75.89.020.219.8xi4.54.07.217.719.548.89.312.319.417.935.15.67.820.521.024.24.18.823.220.91A5A4A3A2A1处理方差异质第125页/共144页变异来源dfSSs2FF0.05F0.01处理间4866.663216.66646.425**3.064.89处理内1569.9954.667总变异19936.658表6-28燕麦田中某种杂草的株数平方根转换后方差分析第126页/共144页资料中的效应成比例而不是可加的,或者标准差(或极差)与平均数大体成比例时。对数转换通常,对数转换对于削弱大变数的作用要比平方根转换强。对数变换用于稳定方差,如果原变量的标准差直接随均数变化而改变,即其变异系数为一常数,当效应是成比例的而不是可加的时候,应用对数变换可以同时改善效应的可加性与方差齐性。第127页/共144页时期捕蛾灯对数值ⅠⅡⅢⅠⅡⅢ119.150.1123.01.281.702.09223.4166.0407.41.372.222.61339.5223.9398.11.602.352.60423.458.922

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论