




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1 第三章第三章 协方差分析协方差分析 Analysis of covariance Analysis of covariance 协方差分析是将相关回归分析与方差分协方差分析是将相关回归分析与方差分析结合起来的一种重要的统计分析方法。本析结合起来的一种重要的统计分析方法。本章将主要介绍协方差分析的意义以及单向和章将主要介绍协方差分析的意义以及单向和两向资料的协方差分析的方法。两向资料的协方差分析的方法。2 第一节第一节 协方差分析的意义协方差分析的意义一、协方差的概念一、协方差的概念 有有N N对对x x、y y的有限总体,其离均差乘积和除以的有限总体,其离均差乘积和除以N N,叫做协方差。
2、叫做协方差。 而对于样本则为:而对于样本则为:NyxCOVyx)(1)(nyyxxVCO3 对于一个样本,可以用均方(对于一个样本,可以用均方(MSMS)反映该变数的)反映该变数的变异度,对于一个双变数样本,可以用均积(变异度,对于一个双变数样本,可以用均积(MPMP,也,也叫协方)反映其变异度,此变异度可描述为相关变异叫协方)反映其变异度,此变异度可描述为相关变异度或协同变异度,它反映了两个相关变数相互影响的度或协同变异度,它反映了两个相关变数相互影响的大小,协方差绝对值愈大,两个变数相互影响愈大。大小,协方差绝对值愈大,两个变数相互影响愈大。 二、主要作用二、主要作用 在以前的学习中,我们
3、知道当有在以前的学习中,我们知道当有k k个单变数样本个单变数样本时,总方差的平方和与自由度可以分解为不同变异来时,总方差的平方和与自由度可以分解为不同变异来源的平方和与自由度,从而获得相应的均方(源的平方和与自由度,从而获得相应的均方(MSMS),),这叫这叫方差分析方差分析。协方差也同样均有类同的性质:当有。协方差也同样均有类同的性质:当有4k k个双变数样本时,总协方的乘积和与自由度也可以个双变数样本时,总协方的乘积和与自由度也可以分解为不同变异来源的乘积和与自由度,从而获得相分解为不同变异来源的乘积和与自由度,从而获得相应的协方(应的协方(MPMP)。由于协方是相关回归分析中的一个)。
4、由于协方是相关回归分析中的一个重要统计数,所以,当得到不同变异来源的自由度、重要统计数,所以,当得到不同变异来源的自由度、平方和、乘积和后,就能把方差分析和相关回归分析平方和、乘积和后,就能把方差分析和相关回归分析结合起来应用,这就是结合起来应用,这就是协方差分析协方差分析。其主要作用有:。其主要作用有: 1. 1. 对试验进行统计控制对试验进行统计控制 在试验设计中强调的要采用各种措施使非试验条在试验设计中强调的要采用各种措施使非试验条件尽可能对各处理的影响相对一致,这叫做件尽可能对各处理的影响相对一致,这叫做试验控制。试验控制。然而在实际工作中,即使尽最大努力,也难以使然而在实际工作中,即
5、使尽最大努力,也难以使5试验控制达到理想效果(尤其是当我们的试验材料为试验控制达到理想效果(尤其是当我们的试验材料为动物、特别是大型动物时),也即是说很难保证试验动物、特别是大型动物时),也即是说很难保证试验用动物的初始条件相同。此时,可以利用协方差分析用动物的初始条件相同。此时,可以利用协方差分析的方法将试验前的测定值(比如参试动物的初始重等)的方法将试验前的测定值(比如参试动物的初始重等)都矫正为同一水平(根据回归分析结果),然后再对都矫正为同一水平(根据回归分析结果),然后再对矫正后的矫正后的y值(即试验结果)进行方差分析,这样就值(即试验结果)进行方差分析,这样就可以消除试验处理前动物
6、个体间的差异对试验结果的可以消除试验处理前动物个体间的差异对试验结果的影响,而矫正后的影响,而矫正后的y值是应用统计方法将动物的初始值是应用统计方法将动物的初始条件控制一致后得到的,故叫条件控制一致后得到的,故叫统计控制。统计控制。这种将回归这种将回归分析与方差分析结合起来的方法叫回归模型的协方差分析与方差分析结合起来的方法叫回归模型的协方差分析。分析。62. 2. 做出不同变异来源的相关关系分析做出不同变异来源的相关关系分析在随机模型的方差分析中已经讲过,根据各变异在随机模型的方差分析中已经讲过,根据各变异来源的来源的MSMS与与EMSEMS的关系,可以得到不同变异来源总体的关系,可以得到不
7、同变异来源总体方差的估计值。在协方差分析中,根据方差的估计值。在协方差分析中,根据SPSP与期望协方与期望协方EMPEMP的关系,同样也可以得到不同变异来源的总体协的关系,同样也可以得到不同变异来源的总体协方差估值,有了这些估值,就能做出相应的相关关系方差估值,有了这些估值,就能做出相应的相关关系分析,即两个变数间各个变异来源的总体相关系数,分析,即两个变数间各个变异来源的总体相关系数,这些分析将在遗传育种、生态、环保等研究领域中有这些分析将在遗传育种、生态、环保等研究领域中有重要作用。这种协方差分析称为相关模型的协方差分重要作用。这种协方差分析称为相关模型的协方差分析。析。73. 3. 测验
8、多个线性方程中的回归系数测验多个线性方程中的回归系数bibi的差异显著性的差异显著性 若各个若各个bibi无显著差异,表明各回归直线具有相同无显著差异,表明各回归直线具有相同的斜率,因而可以求得一个合并的的斜率,因而可以求得一个合并的b b值,以增加估计值,以增加估计的精确性。若各的精确性。若各bibi有显著差异,则表明各回归线的斜有显著差异,则表明各回归线的斜率不同,不存字共同的率不同,不存字共同的b b值。值。 第二节第二节 单向分组资料的协方差分析单向分组资料的协方差分析 设有设有K K组双变数资料(即组双变数资料(即K K各处理各处理) ),每组内皆有,每组内皆有n n对观察值(对观察
9、值(x x、y y),则该资料为具有),则该资料为具有knkn对观察值的单对观察值的单向分组资料,其中向分组资料,其中y y为试验指标,为试验指标,x x为对试验指标有影为对试验指标有影响而又难以控制一致的试验条件(见表响而又难以控制一致的试验条件(见表1 1)。)。89 对表对表1 1中的中的x x变数和变数和y y变数进行平方和与自由度的变数进行平方和与自由度的分解方法前面已有介绍。而乘积和的分解为:分解方法前面已有介绍。而乘积和的分解为:总:总:处理:处理:误差:误差:knTTyxSPyxnijijT11 kndfTknTTnTTSPyxkiyixt11 kdfttTeSPSPSPtTe
10、dfdfdf10 上述公式为各处理的n相等时的分解,如果各处理的n不相等,则按下面公式进行分解:总:处理:误差:iyxnijijTnTTyxSPi11 kdft1iTndfiyxkkykxyxyxtnTTnTTnTTnTTSP)(222111tTeSPSPSPtTiedfdfkndf11 例:为了探讨饲料中添加不同量壳聚糖对仔猪生例:为了探讨饲料中添加不同量壳聚糖对仔猪生长性能和免疫力的影响,选择长性能和免疫力的影响,选择4040头健康的条件相近头健康的条件相近的杜长大仔猪进行试验。将其随机分成的杜长大仔猪进行试验。将其随机分成4 4组,对照组组,对照组(A A)饲喂基础饲粮,试验处理()饲喂
11、基础饲粮,试验处理(B B、C C、D D)为在基)为在基础饲粮中添加不同量的壳聚糖。预试期为础饲粮中添加不同量的壳聚糖。预试期为7 7天,正式天,正式期为期为2121天,测定生长及血清生化等指标。表天,测定生长及血清生化等指标。表2 2为其中为其中测得的增重量结果,试分析饲料中添加壳聚糖对仔测得的增重量结果,试分析饲料中添加壳聚糖对仔猪增重有无显著影响?猪增重有无显著影响? 本试验中,尽管选择试验用的仔猪时尽量保持本试验中,尽管选择试验用的仔猪时尽量保持条件的相对一致性,也难保证仔猪的初始重一致,条件的相对一致性,也难保证仔猪的初始重一致,故资料用协方差分析方法。故资料用协方差分析方法。12
12、13 协方差分析步骤和方法如下协方差分析步骤和方法如下: : 一、计算一、计算x x、y y变数的平方和、乘积和与自由度变数的平方和、乘积和与自由度( (见表见表3 3) 表表3 x3 x、y y变数的平方和、乘积和及其自由度变数的平方和、乘积和及其自由度 变异来源变异来源 SSxSSx SSy SSy SPxy SPxy df df 处理间处理间 2.6968 0.178 0.529 32.6968 0.178 0.529 3 处理内处理内 7.4410 8.902 7.526 367.4410 8.902 7.526 36 (误差)(误差) 总变异总变异 10.1378 9.080 8.0
13、55 3910.1378 9.080 8.055 3914二、对二、对x x、y y变数各做方差分析(结果见表变数各做方差分析(结果见表4 4) 变异变异 来源来源 X X变数变数 y y变数变数 F F值值 SS dfSS df S S2 2 F SS df F SS df S S2 2 F F处理间处理间 误差误差 2.697 3 0.899 4.349 0.178 3 0.059 1 2.697 3 0.899 4.349 0.178 3 0.059 1 7.441 36 0.207 8.902 36 0.247 7.441 36 0.207 8.902 36 0.247总变异总变异10
14、.138 3910.138 3938. 401. 0F86. 205. 0F表表4 4 仔猪初始重仔猪初始重(x)(x)及增重量及增重量(y)(y)的方差分析表的方差分析表 15三、处理内(误差)三、处理内(误差)x x和和y y变数的直线回归分析变数的直线回归分析1.1.计算误差项(表计算误差项(表3 3)的回归平方和、离回归平方和及)的回归平方和、离回归平方和及相应的自由度相应的自由度回归平方和:回归平方和:离回归平方和:离回归平方和:612. 7441. 7526. 72)(2)(exeeuSSSPSS1)(eudf35136)()()(eueTeQdfdfdf290. 1612. 79
15、02. 8)()()(eueyeQSSSSSS162. 2. 计算计算F F值,检验误差项直线回归关系的显著性值,检验误差项直线回归关系的显著性 本步骤地分析目的是:明确该资料的本步骤地分析目的是:明确该资料的x x、y y变数之变数之间是否存在直线回归关系。间是否存在直线回归关系。如果显著,如果显著,说明仔猪初始说明仔猪初始重与增重量之间关系密切,可以利用直线回归方程对重与增重量之间关系密切,可以利用直线回归方程对y y变数进行矫正后继续分析;变数进行矫正后继续分析;如果不显著,如果不显著,说明仔猪说明仔猪初始重与不同饲料饲喂后的增重量大小无关,协方差初始重与不同饲料饲喂后的增重量大小无关,
16、协方差分析到此结束,只能用分析到此结束,只能用y y变数进行方差分析(即变数进行方差分析(即x x不能不能提供新的信息)。本资料的提供新的信息)。本资料的F F测验结果见表测验结果见表5 5 。17表表5 5 本资料误差项直线回归关系方差分析表本资料误差项直线回归关系方差分析表 (离回归分析)(离回归分析) 变异来源变异来源 SS dfSS df S S2 2 F F F F0.010.01误差回归误差回归 7.612 1 7.612 206.297.612 1 7.612 206.29* * * 7.42 7.42误差离回归误差离回归 1.290 35 0.03691.290 35 0.03
17、69误差总和误差总和 8.902 368.902 36 F F测验结果显示,处理内的测验结果显示,处理内的x x和和y y变数之间存在着极变数之间存在着极显著的线性回归关系,因此可以利用直线回归关系来矫显著的线性回归关系,因此可以利用直线回归关系来矫正正y y值,并对矫正后的值,并对矫正后的y y值进行方差分析。值进行方差分析。18进行进行y y值矫正时,首先计算误差项回归系数值矫正时,首先计算误差项回归系数(第(第1313页表):页表):0114. 1441. 7526. 7)(exeeSSSPb四、处理平均数的回归矫正及矫正平均数的假设测验四、处理平均数的回归矫正及矫正平均数的假设测验1.
18、 1. 处理平均数的回归矫正处理平均数的回归矫正 为了将各为了将各x x值(本例为仔猪初始重)都矫正到值(本例为仔猪初始重)都矫正到 的水平,显然,凡是的水平,显然,凡是 , 其其y y值需适当降低;凡值需适当降低;凡是是 ,其,其y y值需适当提高。这一矫正的公式为:值需适当提高。这一矫正的公式为:xx xxijxxij19)()(xxbyyijeijxxij 如果我们将全部矫正的如果我们将全部矫正的y y值一一算出,在进行值一一算出,在进行方差分析将会发现:方差分析将会发现: (1 1) (2 2)误差项平方和(矫正后)误差项平方和(矫正后y y)正是误差项离)正是误差项离回归平方和(本例
19、表回归平方和(本例表5 5中的中的1.2901.290)。)。ijknxxijyy1)(20 上述第二点很重要,因为本资料原上述第二点很重要,因为本资料原y y变数的误差方差变数的误差方差为为0.24730.2473(表(表4 4),现在却为),现在却为0.03690.0369(表(表5 5),这说明原),这说明原y y变数的误差方差大,其原因主要是因仔猪初始重不同造变数的误差方差大,其原因主要是因仔猪初始重不同造成的,仔猪初始重(成的,仔猪初始重(x x变数)的干扰一经除去,误差方差变数)的干扰一经除去,误差方差就极显著减小(就极显著减小(0.2373/0.0369=6.7020.2373/
20、0.0369=6.702* * *),所以,本资),所以,本资料经过协方差分析后,极大地提高了试验效率。料经过协方差分析后,极大地提高了试验效率。 实际应用时,若逐一对实际应用时,若逐一对y y值进行矫正,不但繁琐,而值进行矫正,不但繁琐,而且也不必要。因为在比较处理效应时,我们依据的是处且也不必要。因为在比较处理效应时,我们依据的是处理的平均数,而处理平均数理的平均数,而处理平均数 的矫正值一定是等于各处的矫正值一定是等于各处理理y yijij矫正值的平均数,即:矫正值的平均数,即:iynyyxxijxxi)()(21 所以,我们可以由所以,我们可以由 直接得到直接得到 ,而不必要,而不必要
21、通过通过 的平均数得到,用下面公式计算的平均数得到,用下面公式计算 :iyiy)(xxiy)(xxiy)(xxijy)()(xxbyyieixxi 比较矫正后的比较矫正后的 和矫正前的和矫正前的 可以发现,不仅数值可以发现,不仅数值会发生变化,而且排序也会发生改变。此时再对处理平会发生变化,而且排序也会发生改变。此时再对处理平均数的比较才是处理效应真实的比较均数的比较才是处理效应真实的比较iy22)(xxiy2.2.矫正平均数矫正平均数 的方差分析的方差分析 统计学证明,统计学证明,y y 矫正后的总平方和、误差平方和及矫正后的总平方和、误差平方和及其自由度等于其相应变异项的(矫正前)离回归平
22、方和其自由度等于其相应变异项的(矫正前)离回归平方和及其自由度。及其自由度。)(2)()()()(xTxyTyTTQyTSSSPSSSSSS)()(eQyeSSSS)()(eQyedfdf2 kndfT)()(2/eQeQxydfSSS23 将上述计算的总平方和与自由度分别减去误差平将上述计算的总平方和与自由度分别减去误差平方和及自由度,其差值显然是由于矫正后处理平均数方和及自由度,其差值显然是由于矫正后处理平均数间的差异造成的,即:间的差异造成的,即:由此可进行由此可进行F测验,结果见表测验,结果见表6。)()()(yeYTytSSSSSS)()()(yeyTytdfdfdf24表表6 6
23、各处理矫正平均数的显著性测验各处理矫正平均数的显著性测验 变异来源变异来源 SS dfSS df s s2 2 F F F F0.010.01处理间处理间 1.3899 3 0.4633 12.5561.3899 3 0.4633 12.556* * * 4.40 4.40误误 差差 1.2900 35 0.03691.2900 35 0.0369总变异总变异 2.6799 38 2.6799 38 F F测验结果显示,各饲料之间的仔猪增重量有极显著差测验结果显示,各饲料之间的仔猪增重量有极显著差异,这一结论与矫正前的异,这一结论与矫正前的F F测验结果(测验结果(F F11)完全不同,说明)
24、完全不同,说明了仔猪初始重对仔猪增重的影响,也说明了利用了仔猪初始重对仔猪增重的影响,也说明了利用x x变数对变数对y y变变数进行了统计控制,这是协方差分析的重要功能。数进行了统计控制,这是协方差分析的重要功能。25五五 、各处理矫正平均数的多重比较、各处理矫正平均数的多重比较1.t1.t测验(逐对比较):测验(逐对比较):)()(0:xxyjxxyiH)()(:xxyjxxyiAHDjiyyxxjxxiSyySyytxxjxxi)()()()(ji 1) 1(nkdf)(2212/)(11xejixyDSSxxnnSS26 2. PLSD法 利用上述t 测验法,每次比较都需计算各自的矫正平
25、均数差数标准误SD,一般在误差自由度小于20,且x变数的变异较大(X变数的F测验达到显著)时使用此法;当误差自由度大于20,且x变数的变异较小(X变数的F测验达到显著)时,各个矫正平均数的比较可以共用一个差数标准误,从而采用PLSD法进行多重比较。) 1(1 )()(2/2/xextxyxySSkSSSS)11(212/nnSSxyD) 1(1 2)()(2/xextxyDSSkSSnSS27本例中,若用PLSD法做多重比较,结果见表7: 表表7 7 本资料多重比较结果本资料多重比较结果 饲料饲料 - A - B - C - A - B - C 显著性显著性 D 6.4153 0.5278 D
26、 6.4153 0.5278* * * 0.1316 0.0015 a A 0.1316 0.0015 a A C 6.4138 0.5263 C 6.4138 0.5263* * * 0.1304 a A 0.1304 a A B 6.2834 0.3959 B 6.2834 0.3959* * * a A a A A 5.8875 b B A 5.8875 b Biy 多重比较结果显示,在4种饲料中,添加壳聚糖的饲料饲喂仔猪后,可以提高仔猪的增重量,差异达到极显著,说明壳聚糖有利于仔猪的生长发育。但在参试的添加3种用量壳聚糖的饲料之间,仔猪的增重量无显著差异。如果本着经济用量的角度考虑应选
27、择低量的饲料。另外从本试验中刊出一个趋势,随着壳聚糖添加量的增加,仔猪增重量增加,壳聚糖是否还有进行一步提高增重量的作用,可进行进一步试验。283.3.LSRLSR法法 ) 1(1 )()(2/xextxyDSSkSSnSS LSRLSR方法进行平均数的多重比较方法见以前方法进行平均数的多重比较方法见以前介绍,此处不再赘述。只是注意平均数标准误介绍,此处不再赘述。只是注意平均数标准误和平均数差数标准误的区别。和平均数差数标准误的区别。29 在上述分析中,省去了各个样本在上述分析中,省去了各个样本b bi i的显著性测验,的显著性测验,而在对总变异离回归分析时而在对总变异离回归分析时F F值达显
28、著后就计算值达显著后就计算b be e值,值,这样就节省了许多计算工作量。这是因为这样就节省了许多计算工作量。这是因为我们的目的仅我们的目的仅在于明确在于明确x x和和y y是否有线性关系以及在存在这一关系时以是否有线性关系以及在存在这一关系时以之矫正之矫正y y的效果,所以省略各个样本的效果,所以省略各个样本b bi i的显著性测验是的显著性测验是无关紧要的,无关紧要的,而且处理内(误差)的回归显著亦包含了而且处理内(误差)的回归显著亦包含了b bi i间的差异不显著的部分信息。但是,如果各个间的差异不显著的部分信息。但是,如果各个b bi i是否是否同质,也是我们的研究目的,则还是需要进行
29、各个处理同质,也是我们的研究目的,则还是需要进行各个处理b bi i间的显著性测验(本章此方法略)。间的显著性测验(本章此方法略)。30上述协方差分析的过程可总结如下:上述协方差分析的过程可总结如下:1. 1. 列出各变异来源的列出各变异来源的dfdf 、SSxSSx、SSySSy、SPxySPxy,进行,进行x x、y y变数的方差分析。变数的方差分析。2. 2. 进行处理内回归关系分析,明确进行处理内回归关系分析,明确x x、y y变数间的线性回变数间的线性回归关系是否显著。如果显著,继续分析;如果不显著,归关系是否显著。如果显著,继续分析;如果不显著,协方差分析结束,只能用协方差分析结束
30、,只能用y y变数进行方差分析。变数进行方差分析。3. 3. 计算合并回归系数计算合并回归系数bebe,并对,并对y y值进行矫正。值进行矫正。4. 4. 对矫正后的处理平均数对矫正后的处理平均数 进行方差分析,如果进行方差分析,如果F F测验测验结果显著,进行下一步的多重比较(见表结果显著,进行下一步的多重比较(见表8 8)。)。5. 5. 多重比较(多重比较(1 1)t t测验法,测验法, (2 2)PLSDPLSD法。法。iy31 表表8 8 本资料的协方差分析本资料的协方差分析iy变因变因 dfdf SS SSx x SS SSy y SS SSxyxy be be 矫正后矫正后 的方差分析的方差分析 df df Q S Q S2 2 F F处理处理 3 2.697 0.178 0.5293 2.697 0.178 0.529误差误差 36 7.441 8.902
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校节能减排知识讲座
- 护理学研究方法
- 家长与学生沟通
- 学期工作总结小班
- 建筑行业员工述职
- 2024-2025学年度山东省菏泽市鄄城县第一中学高一第二学期3月月考历史试题(含答案)
- 幼儿安全教育活动
- 2025年重症监护临床信息系统项目合作计划书
- 中考数学高频考点专项练习:专题14 四边形综合训练及答案
- 中国快递行业分析
- 超市产品质量与风险防控培训
- 2024春苏教版《亮点给力大试卷》数学六年级下册(全册有答案)
- 中考英语语法填空总复习-教学课件(共22张PPT)
- 机场安检防爆培训课件模板
- 一到六年级语文词语表人教版
- 2024年浙江杭州地铁运营分公司招聘笔试参考题库含答案解析
- 2024年九省联考新高考 数学试卷(含答案解析)
- 学生营养膳食
- 《质量检验培训》课件
- 2023年高考真题-文综政治(新课标卷)含解析
- 2023版设备管理体系标准
评论
0/150
提交评论