第七章 方差分析_第1页
第七章 方差分析_第2页
第七章 方差分析_第3页
第七章 方差分析_第4页
第七章 方差分析_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

样本平均数的假设检验u检验t检验某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,投喂不同的饲料,经1个月以后,各组鱼的增重(g)结果列于下表。重复饲料A1A2A3A413192482212702279257236308331826827329042842792492455359262258286311.8262.8247.4279.8表6-1不同饲料饲喂鱼增重的数据(g)20个样本4个平均数(2)试验误差不统一,误差估计的精确性和检验的灵敏性低。t检验:C42

=6次6个标准误(1)检验过程烦琐。判断两组数据平均数间的差异显著性6次都接受Hoα错误(3)推断的可靠性低,检验时犯α错误概率大。t检验自由度较小P=(0.95)6=0.735P=1-0.735=0.265将所有这些组数据放在一起,一次比较就对所有各组平均数间是否有差异作出判断。方差分析,又称为变量分析,是英国著名统计学家R.A.Fisher于1923年提出的。方差分析是对两个或多个样本平均数差异显著性检验的方法。方差分析(Analysisofvariance,ANOVA)方差分析的基本原理1单因素方差分析2二因素方差分析3方差分析的基本假定和数据转换4第六章方差分析三、数学模型一、相关术语四、平方和与自由度的分解五、统计假设的显著性检验-----F检验六、多重比较二、方差分析的基本原理第一节方差分析的基本原理一、相关术语(一)试验因素试验中所研究的影响试验指标的原因或原因组合称为试验因素。试验因素也称为处理因素,简称为因素或因子。为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。例如日增重、酶活性、产量等。(一)试验因素在试验中可以人为调控的因素在试验中不能人为调控的因素可控因素(固定因素)非控因素(随机因素)试验因素常用大写字母A、B、C、…等来表示。因素的水平不能严格控制,或水平能控制,其效应为随机变量;重复时可得到相同的结果。因素的水平可准确控制,且水平固定后,其效应也固定;重复时不易得到相同的结果。每个试验因素的不同状态(处理的某种特定状态或数量上的差别)称为因素水平,简称为水平。(二)因素水平因素是一个抽象的概念,水平是一个较为具体的概念。温度酶活性15℃、20℃、25℃、30℃水平用代表该因素的字母加下标1、2、3、…等来表示。如A1、A2、A3、…,B1、B2、B3、…等。一、相关术语(三)试验处理试验处理常称为处理,指对受试对象给予的某种外部干预(或措施),是试验中实施的因子水平的一个组合。单因素处理多因素处理一、相关术语一个4种不同配合饲料对鱼的饲喂试验,实施在试验单位上的具体项目就是饲喂某一种饲料。试验因素的一个水平考察在该因素不同水平值上性状量值的变化规律,找出最佳水平或估计其总体变异。两个或两个试验因素的一个水平组合考察反应量在各因素不同水平、水平组合上的变化规律,找出水平的最佳组合或估计总体变异。因素处理目的举例3种播种密度对4个小麦品种的产量的影响研究,试验共有3×4=12个水平组合。其它单因素处理多因素处理可以同时研究主效应、交互作用

(四)试验误差试验误差是指试验中由于无法控制的因素所引起的差异,简称为误差。一、相关术语(五)试验单位(六)重复在实验中能接受不同试验处理的独立的试验载体,即根据研究目的而确定的观测总体。在试验中,将一个处理实施在两个或两个以上的试验单位上。处理实施的试验单位数即处理的重复数。重复饲料A1A2A3A413192482212702279257236308331826827329042842792492455359262258286311.8262.8247.4279.8表-1不同饲料饲喂鱼增重的数据(g)试验指标单因素水平重复观测值差异基本思想:将测量数据的总变异按照变异原因不同分解为处理效应和试验误差,并作出其数量估计。

处理效应误差效应二、方差分析基本思想比较处理效应和误差效应在总变异中所占的比例。处理效应试验误差相差不大,说明试验处理对指标影响不大。相差较大,即处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。表-2每组具n个观测值的k组样本符号表三、数学模型处理A1A2…Ai…Ak重复x11x21…xi1…xk1x12x22…xi2…xk2………………x1jx2j…xij…xkj………………x1nx2n…xin…xkn总和Ti.T1.T2.…Ti.…Tk.T..=∑xij平均xi.x1.x2.xi.xk.x..第i个处理的第j个观测值第i个处理n个观测值的和全部观测值的和第i个处理的平均数全部观测值的总平均数表-2每组具n个观测值的k组样本符号表三、数学模型处理A1A2…Ai…Ak重复x11x21…xi1…xk1x12x22…xi2…xk2………………x1jx2j…xij…xkj………………x1nx2n…xin…xkn总和Ti.T1.T2.…Ti.…Tk.T..=∑xij平均xi.x1.x2.xi.xk.x..第i个处理观测值总体平均数试验误差三、数学模型第i个处理的效应,即处理i对试验结果产生的影响固定模型随机模型混合模型固定模型各处理的效应值τi

是固定值,它是由固定因素所引起的效应。实验因素的各水平是根据试验目的事先主观选定的而不是随机选定的。在固定模型中,除去随机误差之后的每个处理所产生的效应是固定的,试验重复时会得到相同的结果。方差分析所得到的结论只适合于选定的那几个水平,并不能将其结论扩展到未加考虑的其它水平上。各处理的效应值τi不是固定的数值,而是由随机因素所引起的效应。τi

是一个标准正态总体中的随机变量。选取4窝动物,每窝均有4只幼仔,分析不同窝出生的幼仔体重是否显著。从美国经进的黑核桃品种在不同纬度生态条件下试种,观察该品种对不同地理条件的适应情况。随机模型在随机模型中,水平确定之后其处理所产生的效应并不是固定的,试验重复时也很难得到相同的结果。方差分析所得到的结论,可以推广到这个因素的所有水平上。随机模型在多因素试验中,既有固定效应的试验因素,又有随机效应的试验因素,则属于混合模型.混合模型为推断全国6~7岁孩的身长发育状况,随机抽取3个省,每个省分为城市和农村两类地区,各抽取20例数据进行分析。这其中城市与农村两个水平组成的地区属于固定效应型,由于省份的三个水平是通过抽样确定的,属于随机效应型。在实际应用中,固定模型应用最多,随机模型和混合模型相对较少。观测值变异处理间的变异处理内的变异方差总平方和总自由度处理间处理内处理间处理内四、平方和与自由度的分解四、平方和与自由度的分解(一)平方和分解0每一处理n个观测值离均差平方和累加k个处理的离均差平方和累加总平方和SST处理内平方和SSe处理间平方和SStC(矫正数)四、平方和与自由度的分解(二)自由度分解重复饲料A1A2A3A413192482212702279257236308331826827329042842792492455359262258286总和1559131412371399平均数311.8262.8247.4279.8表-1不同饲料饲喂鱼增重的数据(g)k=4n=5nk=20(1)平方和计算(2)自由度计算(3)方差计算五、显著性检验---F检验1提出假设2确定显著性水平3计算统计量4统计推断否定Ho,接受HA,说明不同饲料饲喂鱼的增重差异是极显著的,用不同的饲料饲喂,增重是不同的。在方差分析中,通常将变异来源、平方和、自由度、均方和F值整理成一张方差分析表。在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及F检验可在方差分析表上进行。变异来源dfSSs2FF0.05F0.01饲料间311435.353811.7837.1323.245.29饲料内168551.60534.475总变异1919986.95**表中的F值应与相应的被检验因素齐行。表-3不同饲料饲喂鱼增重的方差分析表统计上把多个平均数两两间的相互比较称为多重比较。六、多重比较最小显著差数法(LSD法)最小显著极差法(LSR法)LSD法(leastsignificantdifference)在F检验显著的前提下,先计算出显著水平为α的最小显著差数LSDα,然后将任意两个处理平均数的差数的绝对值与其比较。在α水平上差异显著在α水平上差异不显著LSD检验均数差值标准误误差方差两组数据误差均方的自由度tα自由度被比较的两个均数t检验LSD法(1)计算最小显著差数

LSDα;(2)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;(3)将平均数多重比较表中两两平均数的差数与LSDα

比较,作出统计推断。方法步骤(xi)饲料平均数差异显著性(xi.-247.4)(xi.-262.8)(xi.-279.8)A1311.864.4**49.0**32.0*A4279.832.4*17.0A2262.815.4A3247.4表-44种饲料饲喂鱼增重差异显著性表梯形表示法(三角形法)饲料平均数差异显著性

0.050.01A1311.8A4279.8A2262.8A3247.4字母标记法(1)全部平均数从大到小依次排列;abbcABAB(2)在最大的平均数上标字母a,将该平均数与以下各平均数相比,凡相差不显著的标a,直至某个与之相差显著的则标以字母b;(3)以该标有b的平均数为标准,与各个比它大的平均数比较,凡差数差异不显著的在字母a的右边加标字母b;(4)以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差数不显著的继续标以字母b,直至差异显著的平均数标以字母c,再与上面的平均数比较;(5)重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。(6)差异极显著标记方法同上,用大写字母标记。cB(xi)饲料平均数差异显著性(xi.-247.4)(xi.-262.8)(xi.-279.8)A1311.864.4**49.0**32.0*A4279.832.4*17.0A2262.815.4A3247.4饲料平均数差异显著性

0.050.01A1311.8aAA4279.8bABA2262.8bcBA3247.4cB平均数间有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。小写拉丁字母表示显著水平α=0.05,大写拉丁字母表示显著水平α=0.01。LSR法(leastsignificantranges)LSR法采用不同平均数间用不同的显著差数标准进行比较,根据极差范围内所包含的处理数据(秩次距)k的不同而采用不同的检验尺度。这种在显著水平α上依秩次距k的不同而采用不同的检验尺度的显著性检验方法称为最小显著极差法。SSR检验q检验新复极差检验(newmultiplerangetest)SSR检验(theshortestsignificantranges)邓肯(Duncan)法Duncan多范围检验法(Duncanmultiplerangetest)(1)按相比较的样本容量计算平均数标准误(2)查SSR表,自由度dfe,所含平均数个数M(3)将各平均数按大小顺序排列,用各个M值的LSRα进行检验。附表6(P268)新复极差检验SSR值表dfM(检验极差的平均数个数)2345616(0.05)3.003.143.243.303.3416(0.01)4.134.314.424.514.57表-64种饲料饲喂鱼增重试验LSR值(SSR检验)M234LSR0.0531.0232.4733.50LSR0.0142.7044.5745.70表-64种饲料饲喂鱼增重试验LSR值(SSR检验)M234LSR0.0531.0232.4733.50LSR0.0142.7044.5745.70饲料平均数差异显著性

0.050.01A1311.8A4279.8A2262.8A3247.4abbcABABcB表-54种饲料饲喂鱼增重试验(LSD检验)饲料平均数差异显著性

0.050.01A1311.8A4279.8A2262.8A3247.4abbbABABB表-74种饲料饲喂鱼增重试验(SSR检验)q检验q检验法也称为Student-Newman-Keuls(SNK)检验,是以统计量q的概率分布为基础的。附表7(P269)q值表dfM(检验极差的平均数个数)2345616(0.05)3.003.654.054.344.5616(0.01)4.134.785.195.495.72表-84种饲料饲喂鱼增重试验LSR值(q检验)M234LSR0.0531.0237.7441.88LSR0.0142.7049.4353.66饲料平均数差异显著性

0.050.01A1311.8A4279.8A2262.8A3247.4abbbAAABB表-94种饲料饲喂鱼增重试验(q检验)BLSR值(q检验)M234LSR0.0531.0237.7441.88LSR0.0142.7049.4353.66LSR值(SSR检验)M234LSR0.0531.0232.4733.50LSR0.0142.7044.5745.70k=2,三种方法显著尺度是相同的。k>2,三种方法显著尺度不相同。精度要求高的试验精度要求一般的试验各个处理平均数与对照相比的试验q检验SSR检验LSD检验犯α错误的概率LSD检验SSR检验q检验>>方差分析步骤定义总平方和与自由度的分解;(2)列方差分析表,进行F检验;(3)若F检验显著,进行多重比较(注明方法)方差分析是对两个或多个样本平均数差异显著性检验的方法。它是将测量数据的总变异按照变异来源分解为处理效应和试验误差,并作出其数量估计。例7.2

测定东北、内蒙古、河北、安徽、贵州5个地区黄鼬冬季针毛的长度,每个地区随机抽取4个样本,测定的结果如下表所示,比较其差异显著性。地区东北内蒙古河北安徽贵州132.029.225.523.322.3232.827.426.125.122.5331.226.325.825.122.9430.426.726.725.523.7表-10不同地区黄鼬冬季针毛长度(mm)第二节单因素方差分析(1)平方和计算(2)自由度计算(3)方差计算(4)F检验变异来源dfSSs2FF0.05F0.01地区间4173.7143.42850.1483.064.89地区内1512.990.866总变异19186.70**表-11不同地区黄鼬冬季针毛长度方差分析表地区平均数差异显著性

0.050.01东北31.60内蒙古27.40河北26.03安徽24.75贵州22.85表-12不同地区黄鼬冬季针毛长度显著性比较(LSD检验)abbccdABBCCDD第三节二因素方差分析两个因素共同影响试验指标的试验处理。主效各试验因素的相对独立作用称为该因素的主效应,简称为主效。它是由于因素水平的改变而造成因素效应的改变。互作互作效应是由于两个或多个试验因素的相互作用而产生的效应。某一因素在另一因素的不同水平上所产生的效应不同,则二因素间存在交互作用,简称互作。有重复观测值的二因素方差分析A因素i水平,B因素j水平,第k次重复观测值总平均值A因素i水平的效应B因素j水平的效应A因素i水平和B因素j水平的交互作用随机误差(1)平方和的分解为:A因素a水平,B因素有b水平,每一重复都包括ab次实验,设试验重复n次。abnSSt(3)各项的方差分别为(2)自由度的分解为(4)F检验αi、βj、(αβ)ij

和εijk是相互独立的随机变量。αi,βj及(αβ)ij

均为固定效应。固定模型随机模型(以A为固定因素,B为随机因素为例)A和B的效应为非可加性,αi

为固定效应,βj及(αβ)ij

为随机效应。混合模型例7.5

为了研究某种昆虫滞育期长短与环境的关系,在给定的温度和光照条件下在实验室培养,每一处理记录4只昆虫的滞育天数,结果列于表中,是对该材料进行方差分析。光照(A)温度(B)250C300C350C5h·d-1143138120107101100808389931017610h·d-1961037891796183598076616715h·d-1798396986071786467587183表-19不同温度及光照条件下某种昆虫滞育天数由于温度和光照条件都是人为控制的,为固定因素,可依固定因素分析。将表-19中数字均减去80,整理得下表光照(A)标本号温度(B)250C300C350C5h·d-112346358402721200391321-4271188443910h·d-112341623-211-1-193-210-4-19-13-2648-38-3615h·d-11234-131618-20-9-2-16-13-22-93-5236-47-41272

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论