版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四讲方差分析
两总体平均数间的差异显著性可用t检验,但实际中常遇到比较多个总体(处理)平均数的问题,这时若仍用t检验就不适宜了。这是因为:4.1绪言(1)检验过程烦琐例如,一试验包含5个处理,采用t检验法要进行C52=10次两两平均数的差异显著性检验;若有k个处理,则要作q=Ck2=k(k-1)/2次类似的检验。(2)无统一的试验误差对同一试验的多个处理进行比较时,应该有一个统一的试验误差。若用t检验作两两比较,由于每次比较需计算一个,故使得各次比较误差不统一,同时没有充分利用资料信息而使误差估计的精确性降低,从而降低检验的灵敏性。(3)推断的可靠性低,犯I型错误的概率增大
若用t检验进行多个处理平均数间的差异检验,会增大犯I型错误的概率(1-(1-)q),降低推断的可靠性。
由于上述原因,多个平均数的检验不宜用t检验,须采用方差分析法。
这种方法是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,获得不同变异来源总体方差的估计值;通过计算总体方差的估计值的适当比值,检验各样本所属总体平均数是否相等。
“方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术”,方差分析实质上是关于观测值变异原因的数量分析。
几个常用术语:1、试验指标(experimentalresponseorindex)
为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有:日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生理生化和体型指标(如血糖含量、体高、体重)等。下一张
主页
退出
上一张
2、试验因素(experimentalfactor)
试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。试验因素常用大写字母A、B、C、…等表示。下一张
主页
退出
上一张
3、因素水平(leveloffactor)
试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如比较3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素的3个水平;研究某种饲料中4种不同能量水平对肥育猪瘦肉率的影响,这4种特定的能量水平就是饲料能量这一试验因素的4个水平。下一张
主页
退出
上一张
因素水平用代表该因素的字母加添足标1,2,…,来表示。如A1、A2、…,B1、B2、…,等。
4、试验处理(treatment)
事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时,实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单因素试验时,试验因素的一个水平就是一个处理。下一张
主页
退出
上一张
在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3种饲料和3个品种对猪日增重影响的两因素试验,整个试验共有3×3=9个水平组合,实施在试验单位(试验猪)上的具体项目就是某品种与某种饲料的结合。所以,在多因素试验时,试验因素的一个水平组合就是一个处理。下一张
主页
退出
上一张
5、试验单位(experimentalunitorplot)
在试验中能接受不同试验处理的独立的试验载体叫试验单位。在畜禽、水产试验中,一只家禽、一头家畜、一只小白鼠、一尾鱼,即一个动物;或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往往也是观测数据的单位。
下一张
主页
退出
上一张
6、重复(repetitionorreplication)
在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4次重复。试验设计三原则:randomization,replication,portionofcontrol下一张
主页
退出
上一张
4.2方差分析的基本原理4.2.1基本原理为便于理解方差分析的基本原理,先看一个例子。例7.1
小麦品种对比试验,6个品种,4次重复,单因素完全随机设计,得产量(kg/小区)结果如下表:处理和yi.处理平均处理品种观察值(重复)1234A15854504921152.75A24238413615739.25A33236293513233.00A44645434618045.00A53531343413433.50A64442363816040.0024个小区的产量有高有低存在差异,称为变异;处理和yi.处理平均处理品种观察值(重复)1234A15854504921152.75A24238413615739.25A33236293513233.00A44645434618045.00A53531343413433.50A64442363816040.00
各处理平均产量之间也存在差异,看作不同品种间生产能力的差异;
同一品种不同重复之间的产量也不相同,是由随机误差造成的;试验结果的总变异是由两类原因引起:(1)由施加试验条件的影响引起试验指标的变异,称处理间(组间)变异;(2)由随机因素引起的变异,称处理内(组内)变异。
即:总变异=处理间变异+处理内变异
用方差作为衡量各种变异量的尺度。
总方差ST2表示总变异,处理间方差St2表示处理间变异,处理内方差Se2表示处理内变异(作为误差)。
把处理方差和误差方差在一定意义下比较,当处理间方差显著地大于误差方差时,表明处理因素对试验指标有显著影响,这就是方差分析解决问题的基本思路。4.2.2方差分析的一般步骤
(1)平方和与自由度的分解
重复处理12…j…nyi.A1A2…Ai…Ak
y11
y12…y1j
…y1ny21
y22…y1j…y2n……………….
yi1
yi2…yij…yin………………yk1
yk2…ykj…ykny1.y2.…yi.…yk.……
假设单因素A有k个处理(水平)A1,A2,…,Ak,完全随机化设计,每个处理有n次重复,共有nk个观测值。这类试验资料的数据模式如下表所示。
重复处理12…j…nyi.A1A2…Ai…Ak
y11
y12…y1j
…y1ny21
y22…y1j…y2n……………….
yi1
yi2…yij…yin………………yk1
yk2…ykj…ykny1.y2.…yi.…yk.……其中:表示第i个处理n个观察值的和;表示第i个处理的平均数;表示全部观察值的总和;表示全部观察值的总平均数。
平方和分解总平方和是各观测值yij与总平均数的离差平方和,记为SST。即其中所以称为处理间平方和;称为处理内平方和或误差平方和。易证平方和的计算公式如下:其中,C=y2··/(kn)称为矫正数。处理间自由度,DFt=k–1;处理内(误差)自由度,DFe=nk
-k=k(n
-
1)。自由度分解总自由度,DFT=nk
–1;显然,DFT=
DFt
+DFe计算均方
各部分平方和除以相应的自由度便得到总均方、处理间均方和处理内均方,分别记为MST
(或ST2)、MSt(或St2)和MSe(或Se2)。即(2)F检验
在单因素试验结果的方差分析中,记i为第i处理(总体)的期望值(平均值),则假设为
H0:1=2=…=k,HA:各i不全相等在H0成立的条件下,
当F≥F(DFt,DFe)时,否定H0,即认为k个处理平均值之间差异显著。然后进行多重比较;
当F<F(DFt,DFe)时,接受H0,即认为k个处理平均值之间差异不显著,计算结束。列方差分析表:方差来源自由度平方和均方F值F临界值处理误差k-1k(n-1)SStSSeMStMSeF=MSt/MSeFα(DFt,DFe)总和nk-1SST
当F≥F(DFt,DFe)时,否定H0,即认为k个处理平均值之间差异显著。然后进行多重比较;
当F<Fα(DFt,DFe)时,接受H0,即认为k个处理平均值之间差异不显著,计算结束。对例7.1k=6,n=4处理和yi.处理平均处理品种观察值(重复)1234A15854504921152.75A24238413615739.25A33236293513233.00A44645434618045.00A53531343413433.50A64442363816040.00处理和yi.处理平均处理品种观察值(重复)1234A15854504921152.75A24238413615739.25A33236293513233.00A44645434618045.00A53531343413433.50A64442363816040.00DFT=nk–1=4×6–1=23;DFt=k–1=6-1=5;DFe=DFT
-DFt
=23–5=18MSt=SSt/DFt=1109.33/5=221.87MSe=SSe/DFe=158.50/18=8.81F=MSt/MSe=221.87/8.81=25.18;查F表F0.01(5,18)=4.25
因为F=25.18>F0.01(5,18)=4.25,所以则否定H0,接受HA,这表明不同处理平均值间差异显著。即6个不同品种的平均产量间差异显著。方差分析表方差来源自由度平方和均方F值F临界值品种误差5181109.33158.50221.878.8125.18**F0.01(5,18)=4.25总和231267.83
表中的F值应与相应的被检验因素齐行。经F检验差异极显著,故在F值25.18右上方标记“**”(若
=0.05水平显著,标记“*”)。
因为F=25.18>F0.01(5,18)=4.25,所以则否定H0,接受HA,这表明不同处理平均值间差异显著。即6个不同品种的平均产量间差异显著。
设有k个处理,第i个处理有ni次重复,试验结果yij表示第i个处理的第j个观察值(i=1,2,…,k;j=1,2,…,ni)。
N=n1+n2+…+nk为全部试验数据个数,C=y..2/N
为矫正数,则平方和与自由度的计算公式为
重复数不等的情况DFT=N–1;DFt=k–1;DFe=DFT
–DFt均方与F值的计算公式不变。
例4.2
在食品卫生检验中,对4种不同品牌腊肉的酸价进行了随机抽样检测,得结果如下表,试分析4种不同品牌腊肉的酸价指标有无显著差异?品牌酸价(yij)yi
.
niA1A2A3A41.61.52.01.91.31.01.21.41.71.92.02.52.71.80.91.01.31.11.91.61.51.82.01.72.11.52.52.211.612.69.313.81.4982.1061.3371.977k=4,y..=11.6+12.6+9.3+13.8=47.6,N=28C=47.62/28=80.9200,SST=(1.62+…+2.22)-C=5.8800SSt=(11.62/8+12.62/6+9.32/7+13.82/7)-C=2.8027SSe=SST-SSt=5.8800-2.8027=3.0773DFT=N-1=28-1=27,DFt=k-1=4-1=3,DFe=DFT-DFt=27-3=24F=7.287>4.72,即4种不同品牌腊肉之酸价差异极显著。方差分析表方差来源DFSSMSFF临界值品牌间误差3242.80273.07730.93420.12827.287**F0.01(3,24)=4.72总变异275.8800SST=5.8800,SSt=2.8027,SSe=3.0773MSt=SSt
/DFt=2.8027/3=0.9342,MSe=3.0073
/24=0.1282
4.3线性模型、期望均方与效应模型4.3.1线性可加模型、期望均方单因素完全随机设计试验的方差分析模型:
yij=+i+ij,i=1,2,…,k;j=1,2,…,n其中:—总均值;i—第i处理效应值,且1+…+k=0;
ij—随机误差且独立同分布N(0,2)。或yij=i+ij,i=1,2,…,k;j=1,2,…,n其中:i—第i处理均值;
ij—随机误差且独立同分布N(0,2)
方差分析是在效应线性可加,误差独立正态等方差条件下进行的,这些条件称为方差分析的基本假定。对模型中的参数进行估计。
分别是i和的无偏估计;其差值ti为i的无偏估计量。
检验H0:1=…=k
等价于H0:1=…=k=0对单因素完全随机设计的方差分析有SST
=SSt+SSe,其中可以证明:DFt=k–1,因为DFe=k(n
-
1),所以误差均方及处理均方的数学期望:DFt=k–1,因为DFe=k(n
-
1),所以误差均方及处理均方的数学期望:其中称为效应方差。所以MSe是2的无偏估计,MSt是n2+2的无偏估计量.
当处理效应方差2=0,即各i(i=1,…,k)相等(H0成立)时,MSt与MSe一样,方差分析是通过MSt
与MSe的比较进行推断的。在H0成立下,由Cochran定理及第4章得
当处理效应方差2=0,即各i(i=1,…,k)相等(H0成立)时,MSt与MSe一样,方差分析是通过MSt
与MSe的比较进行推断的。在H0成立下,由Cochran定理及第4章得
当给定显著水平,当F
F(k-1,nk-k)时,否定H0,即不同处理平均值间差异显著;否则,则接受H0,即不同处理平均值间差异不显著。4.3.2效应模型固定模型
i为常数的线性模型。一般栽培试验模型为固定模型。随机模型
i为随机变量的线性模型。一般育种试验模型为随机模型。混合模型
对多因素而言,有的因素效应是随机的,有的因素效应是固定的,这样的线性模型是混合模型。
在数量遗传学中把2记作g2
,称遗传型方差;而2记作e2,称为环境方差,两者之和p2=g2+e2称为表现型方差。把g2与p2
的比值
在数量遗传学中把2记作g2
,称遗传型方差;而2记作e2,称为环境方差,两者之和p2=g2+e2称为表现型方差。把g2与p2
的比值称为遗传力。称为遗传变异系数。gcv%愈大,选得优良遗传型的潜力愈大。这个指标可作为育种工作的参考。4.4处理平均数间的多重比较
因而须进行两两处理平均数间的比较,以判断平均数间的差异显著性。把多个平均数两两间的相互比较称为多重比较。
多重比较方法甚多,常用的有:Fisher’s最小显著差数(LSD)法、Tukey’s固定极差法和Dunnett’s最小显著差数法。F检验否定H0,表明总变异主要来源于处理间变异,各处理平均数间存在显著差异;但并不意味着每两两平均数间都差异显著,也不能具体说明哪些有显著差异,哪些无差异显著。4.4.1Fisher's最小显著差数法
若>LSD时,则处理Ai与Aj的平均值之间在水平上差异显著;反之,则差异不显著。最小显著差数计算公式为:
基本做法是:在F检验显著的前提下,先计算出显著水平为的最小显著差数LSD,然后将任意两个处理平均数的差数的绝对值与其比较。
按平均数从大到小自上而下排列出多重比较表,将平均数多重比较表中两两平均数的差数与LSD比较,作出统计推断。对例7.1,MSe=8.81,DFe=18,n=4.多重比较表(LSD法)平均数处理-33.0-33.5-39.25-40.0-45.0A152.7519.75*19.25*13.5*12.75*7.75*A445.0012.00*11.50*5.75*5.00*A640.007.00*6.50*0.75A239.256.25*5.75*A533.500.50A333.00小于4.41者不显著;大于4.41者显著,在差数的右上方标记“*”。4.4.2Tukey法在F检验显著下,计算出显著水平为的最小显著差数TFR
,然后将任意两个处理平均数的差数的绝对值与其比较。
若>TFR
时,则Ai与Aj的平均值之间在水平上差异显著;反之不显著。TFR
计算公式为:其中:k—处理数;q
(k,DFe)—查q表。上例,k=6;DFe=18;MSe=8.81;n=4;q0.05(6,18)=4.49.多重比较表(Tukey法)平均数处理-33.0-33.5-39.25-40.0-45.0A152.7519.75*19.25*13.5*12.75*7.75*A445.0012.00*11.50*5.755.00A640.007.00*6.500.75A239.256.255.75A533.500.50A333.00
品种A1的平均产量与其它5个品种有显著差异;A4与A5和A3有显著差异;A6与A3有显著差异;其它无差异。上例,k=6;DFe=18;MSe=8.81;n=4;q0.05(6,18)=4.49.4.4.3Dunnett's最小显著差数法其中:Dt(k-1,DFe)—查附表;
在F检验显著下,计算显著水平为的最小显著差数DLSD,然后将两个处理平均数的差数的绝对值与其比较。该方法主要应用于各处理平均值与对照处理平均值之间的比较。如例7.1中A1~A5是国内自己培育的,要与国外引进的品种A6进行比较。对例7.1,MSe=8.81,DFe=18,n=4,k=6.对例7.1,MSe=8.81,DFe=18,n=4,k=6.品种A1~A5与对照品种A6的平均产量多重比较表(Dunnett法)比较A1-A612.7512.75*A4-A65.005.00A2-A6-0.750.75A5-A6-6.506.50*A3-A6-7.007.00*A1的平均产量显著地高于对照品种A6;A5、A3显著地低于对照品种A6;品种A4和A2的平均产量与品种A6无显著差异。4.4.4多重比较方法的选择
上述三种方法,当k=2时比较结果一致。当k>2时,LSD法、DLSD法和Tukey法的值从小到大,即LSD法最“松”(易显著),Tukey法最“严”。具体选择哪种方法视具体情况而定。注意:当处理重复数不等时n的估计为式中k为处理数,ni(i=1,…,k)为第i个处理的重复数。对例4.2
用LSD法,DFe=24,MSe=0.1282,k=4,N=28处理平均值差值=0.05=0.01A2A4A1A32.101.971.471.330.130.63**0.50*0.77**0.64**0.14
aAaABbBCbC多重比较表(LSD法)
4.4.5多重比较结果的表示方法
(1)三角形表示法上述方法即为三角形表示法。优点:简便直观。缺点:占篇幅较大。
(2)标记字母法将各处理平均数由大到小自上而下排列;在最大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度压路机零部件采购合同3篇
- 玻璃纤维对建筑用轻骨料混凝土板材的性能影响
- 2025年度大数据公司股权转让与数据分析合同3篇
- 商业航天旅游的市场前景与挑战分析
- 2025年度二零二五年度桉树抚育与林业生态修复承包合同3篇
- 2024轻质隔墙板品牌推广及市场拓展合作协议3篇
- 小学生数学思维在科技项目中的应用
- 2025年度数字营销平台开发与推广合同3篇
- 2025年度股权转让合同(含业绩承诺和违约责任)2篇
- 二零二五年度智能医疗设备研发与应用合同协议书3篇
- 【苏教版】三年级上册数学《多彩的“分数条”》教案
- 企业员工培训之风险管理与防范对策
- SVG无功补偿培训
- 新生儿听力筛查技术规范卫生部2010年版
- 大猫英语分级阅读 六级1 Arthur's Fantastic Party课件
- SCA自动涂胶系统培训讲义
- LEC法取值标准对照表
- 铸造工厂设备管理(共21页)
- 华中数控车床编程及操作
- 农产品收购台账(登记经营单位及个体经营者投售的农产品
- 分红保险精算规定
评论
0/150
提交评论