




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第8章重复测量分析生长测量和其它时间依赖测量Carl N. Von Ende8.1. 重复测量问题有很多场合生态学家会对同一个体、同一试验单元或在同一取样地点进行重复测量。最常见的是某个特征或者因子在不同时间被测量。比如,对不同的种群、地点或试验处理,我们可能感兴趣于动物体型大小、植物体大小、生存力(survivorship)、窝卵数、种群大小、营养水平或者污染物水平如何随时间变化。另一类型的重复测量研究包括将有机体个体置于某种试验处理的不同水平,测量在不同水平上的个体反应。比如在植物生态生理学研究中,经常将同一种植物暴露在一系列的不同CO2水平,测量光合速率(Potvin et al. 19
2、90b)。上面两类研究都反映出了研究者们明晰的兴趣对一种试验处理下,反应随时间、处理水平变化的格局或者形式。即使没有对个体重复测量,也可以回答相同的问题。假设我们研究饮食对松鼠生长的影响,具体地说,就是检测一下三个月内,吃橡子的松鼠生长模式(growth pattern)和吃山胡桃的松鼠生长模式是否不同。假定松鼠喂养是独立的,试验开始日秤体重,之后每两周秤一次,共六次测量。六个测量日和两种饲养策略,于是就有12种饮食×日期的组合。试验可以用两种不同的方法进行。比如我们可以在每个饮食×日期组合中测量三只松鼠。所有松鼠开始时间一样,而且饲养规律化,但是每种饮食的每个测量日期都有
3、不同的松鼠被称重。所以每只松鼠只有一次称重的机会,试验将需要36只松鼠。另一种方法是,每种饮食中安排六只松鼠,所有的松鼠在每个测量日期都称体重,所以每只松鼠要测量六次。第二种设计是一种重复测量设计,仅需要12只松鼠。第一种试验设计可以用双因素ANOVA(饮食,日期)进行分析,因为每一个饮食处理的任何一个日期的松鼠都与其他日期的松鼠独立,但显然这样要比重复测量试验设计需要更多的动物。然而用双因子ANOVA分析第二种试验设计结果并不合适,因为同一只动物在试验中被重复测量多次,每只松鼠不同日期的体重并不是互相独立的(重复间互相独立是ANOVA中的一个基本假定)。第二种试验设计必须用重复测量分析(re
4、peated-measures analysis)方法,这种方法考虑动物的重复测量和日期的相关性。过去,尽管很多生态学家从重复测量设计试验中收集到了数据,但是他们经常运用“普通”的ANOVA对他们进行不正确的分析,或者将数据硬“塞”到某个统计软件包的重复测量分析中,不考虑某些重复测量分析中的基本假定,或者扔掉中间过程数据,用ANOVA只分析最终测量结果。随着生态学家统计学知识水平的增长,人们已经不能接受前两种数据处理方式,也不满意最后一种方式。重复测量设计在心理学和农业中已经被运用已久(Snedecor and Cochran 1989; Winer et al. 1991),但是受到生态学家
5、特别关注也只是最近十来年的事(Gurevitch and Chester 1986; Potvin et al. 1990b)。在这一章,我将讨论分析重复测量数据的各种参数方法。8.2. 统计学问题重复测量设计可以用单变量或者多变量的参数方法分析。单变量分析是包括区组的ANOVA设计(随机区组和裂区)(第4章)。MANOVA(第6章)则用于多变量分析。与MANOVA比,单变量分析计算简单,而且普遍认为其统计效力强于MANVOVA,但是单变量分析也有更苛刻的假定。Mead(1998)讨论了将时间处理为一种 “分裂单元”(split-unit)因子而重复的测量发生在相同,而不是不同的实验单元上的哲
6、学问题。随着最近十年来复杂统计学软件的发展,MANOVA的应用不再受到计算复杂性的限制,两种方法都可以处理析因设计。我将简要的回顾单变量和多变量方法,突出重要的方面,然后将详细的讨论一些的例子。8.2.1. 单变量重复测量分析用于重复测量的基本单变量设计就是随机完全区组和裂区设计了。在最简单的重复测量设计中,我们感兴趣的是不同的处理水平施加于同一个体是否有显著影响(如之前提到的植物光合作用的例子)。这可以用随机区组ANOVA进行分析(第4章)。每一个体作为进行试验处理的一个不同区组。这就类似于一个农业实验中,不同的肥料施到每一个区组中互相毗邻的区域。用重复测量的行话来说,处理即是重复因子。心理
7、学家称其为组内因子(within-subject factor)。区组的目的是从误差项中去除区组间或者试验对象间的方差,使分析更加敏感。区组内的一般假定比区组间更同质化,所以进行试验处理要施加在区组内,或同一个试验对象上。当时间是主体内因子,每个试验对象都有不同时间的观测值。裂区设计(第4章)是随机区组设计的自然扩展。农业中的一个典型例子是灌溉如何影响施肥处理的效果。设想我们有很多田地或者是很多实验区,一半灌溉,一半没有。每个完整的实验区又分成很多小块,每个小块内施用一种水平的肥料。灌溉(或者不灌溉)在重复测量的行话中称为组间因子(即实验区间)。而肥料为组内(裂区)因子。前面松鼠喂养不同食物的
8、重复观察试验也可以作为一个裂区设计的例子,食物是组间因子,每只松鼠是每种食物下的 “实验区”或者试验对象,日期是组内因子。重述一下它的生态学问题:不同的饮食条件下,松鼠体重随时间变化的格局是否一样。虽然随机区组和裂区设计有别于普通的ANOVA仅在于这两种设计假定区组内处理水平间有某种相关性,但是许多生态学家并未很好的认识这些设计还内含一些关于主体内因子水平的方差和协方差,以及它们之间关系的假定。具体而言,这些方法假定组内内因子水平间具有称之为循环性(Circularity)的特征。在这些设计里,我们可以给组内因子构造一个方差协方差的平方矩阵(Square VarianceCovariance
9、Matrix)。组内因子的每个水平的方差都会落在矩阵的对角线上,而不同水平间的协方差则占据了矩阵的其他位置。一个循环方差协方差矩阵具有如下特性:组内因子任意两个水平间差异的方差等于一个常数(Winer et al. 1991)。也就是说,如果取两个组内因子水平,将一个水平值减去另一个,以此得到的差值一定具有等同于任意两个水平对的方差(Maxwell and Delaney 1990)。这种循环性的假定不如复合对称性(Compound Symmetry)假定苛刻,后者假定所有方差都相等,所有协方差也互相一致。多年来,复合对称性被认为是F统计运用到重复测量ANOVA中正确与否的一个条件;然而,Hu
10、ynh和Feldt (1970)证明了循环性条件即已足够。所有具有复合对称性的矩阵都是循环矩阵,但是不是所有的循环矩阵都具有复合对称性。矩阵的另一个特征球形性(Sphericity)可用来评估方差协方差矩阵的循环性。正交变换得到互相独立的(正交的)变换后变量,。这些变换后变量如果再换算(scaled)一下,使得每个变量系数的平方和等于1,这样就得到一组正交变量(Stevens 1996)。一个变换为标准化正交形式的循环方差协方差矩阵即为球形的(Spherical)(Winer et al. 1991)。变换步骤如下:首先构建一个矩阵,以正交对比(Orthogonal Contrasts)系数为
11、行;然后标准化这些系数(例子请见Winer et al. 1991,第244页)。于是,该矩阵就能用于将方差协方差矩阵转换为一个正交标准化的方差协方差矩阵。通过检验正交标准化形式的球形性可以判断一个方差协方差矩阵的循环性。如果变换的方差协方差矩阵是球形的,那么初始的方差协方差矩阵一定是循环的。在一个球形方差协方差矩阵中,变换后变量的方差都相等,它们间的协方差等于0。有一些关于球形性的检测方法,最流行的一种方法是Mauchly检验法(Crowder和Hand1990)。该方法中的检测统计量W在01间变动(公式见Winer et al. 1991)。其中方差和协方差用的是正交标准化形式。W值离0越
12、近,则离球形性越远(Winer et al. 1991)。Huynh和Mandeville(1979)的研究表明W对不符合正态性的情况很敏感,并且随着样本量增大这种敏感型趋势会放大。OBrien和Kaiser(1985),Stevens(1986),Winer et al. (1991)都建议不要用W。在植物实验的那个例子中,如果对每个植物的CO2水平的顺序是随机的,并且从一个CO2浓度到下一个浓度,不存在光合作用的残留效应(carry-over effects),这样的话,可能满足循环性的假定。但是,如果时间是组内因子,一般邻近日期所测得数据间的相关性要高于其他不邻近日期的数据,则循环性条件
13、不满足。生态学家在很多情况下会进行了重复测量ANOVA分析,将时间作为组内因子,但是却不提循环性(或球形性)假定。不能满足假定条件的后果就是组内因子(及其相互作用)的F-统计量会膨胀,因而很可能将一个不显著的效应检测为具统计显著性。当此假定条件无法满足时,有两个选择,(1)调整F统计的自由度使其更加保守;或者(2)用多元方法分析数据。下面我们将讨论这些。裂区设计中,由于存在组间因子,所以还有一个假定需要考虑。组内因子水平间差异的方差-协方差矩阵,在所有组间因子水平上必须是同质的。这就是说,如果我们有三个组间因子水平,在每个水平上计算得到一个组内因子水平间差异的方差-协方差矩阵,这三个矩阵必须是
14、相同的,因为对组内因子(以及它们与组间因子相互作用)的显著性检验是基于合并方差-协方差矩阵。矩阵之间必须相等才能被合并在一起。合并的组内因子水平间差异的方差-协方差矩阵还必须满足循环性条件。组内因子及其与组间因子的相互作用的显著性检验对循环性假定十分敏感,在前面讨论简单组内设计时涉及过此问题。显著性检验对第二个关于方差-协方差矩阵同质型假定稳健,只要样本大小是一致的。如果样本大小不一致,则检验也难以稳健了(Maxwell and Delaney 1990)。如果组内或者组间影响显著,就应该进行后继的一些检验。OBrien和Kaiser(1985),Maxwell和Delaney(1990),S
15、tevens(1996)都讨论涉及到重复测量设计中的追溯比较检验。需要着重指出计划(先期)中的每个对比都包含特定的误差项,而不是一个整体误差项,这些对比不受循环性假定限制。其例可参考OBrien和Kaiser(1985)。尽管我只描述了有单一组内和组间因子的简单实验设计,重复测量设计可以扩展成有多个组内和组间因子的试验。请参考Maxwell和Delaney(1990),Winer等(1991),Stevens(1996)以及本章8.4节的例子。8.2.2. 多变量重复测量分析重复测量数据也可以用MANOVA(见第6章)来分析。这种方法中,组内因子每个水平的反应变量(Response Varia
16、ble)被处理成不同的因变量。在之前我们举的植物例子中,每个CO2浓度下的光合速率都可以看成不同的反应变量。所以,如果有5个CO2水平,每个植物个体的反应就可用5个光合反应速率来表示,每个速率对应一个CO2浓度。MANOVA是设计用来同时分析多个相关变量反应的一种方法。MANOVA也常被用于分析重复测量数据,但与重复测量ANOVA不同,它不要求因变量间相关性一致。它假定方差协方差矩阵“没有结构”,即对方差协方差矩阵没有特殊要求。用MANOVA分析前面松鼠的例子。因变量是6个测量日中每一次测量的体重,组间处理为饮食,目标是检验两种饮食的平均反应向量(Mean Response Vector)是否
17、不同(见第6章)。尽管MANOVA避免了重复测量ANOVA中要求的循环性问题,MANOVA也有它自己的局限性。松鼠例子中,我提到每种饮食可以用6只松鼠(n)来做。MANOVA中可以分析的因变量(k)的数量取决于总样本量(对象N,subjects)和组间处理的数目(组,M,groups)(Potvin et al. 1990b)。前提条件为(N-M>k)。松鼠例子中,数据是在6个测量日期,6只松鼠和2个处理水平下测得,所以这个条件是满足的(12-2=10>k=6)。尽管N12是满足条件的,但检验效力比较低。最好是加大样本量或者减少测量日。检验效力随着n:k比值增加而增加(Potvin
18、 et al. 1990b)。组内因子水平数目的限制以及相应的低检验力问题,在MANOVA使用中是始终存在的(见第6章)。Stevens(1996)对MANOVA的检验力有一个很详尽的讨论,同时提到,如果怀疑检验力低时,有必要用较大的值。Maxwell和Delaney(1990)在重复测量设计中也讨论了MANOVA的效力,并且给出了单组内因子设计在不同检验力下所对应的取样量估测表。同时,他们建议只有当(N-M>k9)的时候才用MANOVA(Maxwell and Delaney 1990, p676)。这个限制条件要求研究人员在实验设计的开始就考虑重复量和组内因子水平数量,而不是等实验已
19、经完成后,。Potvin等(1990b)建议用要求的最少数量且能充分描述一个反应的组内因子水平,增加重复量,以期分析的检验力更高。在比较处理间不同水平的平均反应曲线差别时,MANOVA分析组合了两个来源的组内数据差别:不仅考虑了反应曲线形状(shape)的差别,而且还考虑反应曲线水平(level)的差别(Harris 1985)。还是松鼠那个例子,不过仅考虑三个测量日(图8-1)。如果生长曲线相互平行(图8-1A),则表明两种饮食下松鼠的生长模式相似(形状),不然则表明生长曲线趋异(图8-1B),两者生长模式不同。如果生长曲线平行,且其中一条曲线显著高于另一条(图8-1A),那么随时间推移,其
20、中一组松鼠将一直保持更高的体重(水平)。如果曲线是互相平行的,且几乎互相重叠,这意味着饮食对体重没有影响。最后一点,如果曲线是互相平行的,斜率显著(即斜率>0),表明体重随时间发生了变化,而如果曲线是水平的,则表明体重不随时间变化。轮廓分析(Profile Analysis)能检验上述多变量反应中这三方面的显著性,它经常和MANOVA一起,被用于重复测量数据的分析(Harris 1985; OBrien and Kaiser 1985)。轮廓分析同时用到单边量(ANOVA)和多变量(MANOVA)检验。通过检验特定假设来检查上述三个方面。反应曲线间形状比较是平行性假设检验(Paralle
21、lism Hypothesis);曲线水平间比较是水平性假设检验(Level Hypothesis);判断反应曲线的平均斜率是否不等于零是平坦性假设检验(Flatness Hypothesis)。上述顺序隐含着一层意思,平行性假设应该首先检验。因为如果曲线不水平,则水平性假设检验就会争论不休。这类似于析因设计分析中,相互作用检验要先于主要影响因子的分析(Keppel 1991)。图8-1与析因子设计分析中的交互性图相似(Keppel 1991)。OBrien和Kaiser (1985)给出了重复测量分析中用轮廓分析所需要的大量先决条件。他们的方法在后面的例子中会继续提到。轮廓分析还可以被用到多
22、变量分析中,而不仅重复测量(Morrison 1990)。一个生态学家常感兴趣的不只是测量一个对象、或者一个实验单元随时间变化的某个反应变量。比如植物高度和叶面积之间具有某种相关,这种相关在植物竞争研究中备受关注。在群落生态学研究中,一个实验单元(栏圈、猎物、原位生物群(mecocosm)经常是有一批生物物种同时接受某种处理。共存于栏圈内的物种的反应具潜在相关性,所以采用MANOVA分析这种问题比较合适。只有一个组内因子,但对每个对象(实验单元),测量不止一个反应变量,这种设计被称为双重多变量设计(Doubly Multivariate)。像普通的MANOVA一样,双重多变量设计中可以具有任意
23、数量的组间因子。在SAS说明书中给了一个双重变量分析的例子(SAS Institute Inc. 1989b,第2章,例9),SPSS高级统计说明书的命令参考章节中也有相关的例子(Norusis 1990)。图8-1轮廓分析:假设的6周松鼠体重变化,胡桃喂养的松鼠(虚线),橡子喂养的松鼠(实线)。(A)用于反映平行性和水平效应的曲线;(B)用于反映没有平行性,即饮食×时间交互作用的曲线8.3. 举例:只有一个组间和组内因子第一个例子是裂区设计 (表8-1)。假设一种植物种在温室花盆中,用两种营养水平(低,高)处理,连续五周监测每株植物的叶子总数。这个例子我们先用重复测量ANOVA分析
24、,然后再用MANOVA和轮廓分析发进行分析(8.3.2)8.3.1. 重复测量ANOVA我们前面讲过,裂区设计应用到重复测量数据中,对象是“区”(plots),组内因子是“小区”(subplots),每个对象分配给一个水平的组间处理。表8-1中,组内因子是时间,组间因子是营养水平。表中数据的模型表述如下:Xijkik(i)jijjk(i)m(ijk)式中i表示营养处理对植物生长的影响;k(i)是嵌入相应营养水平内研究对象(植物k-译者)的影响,j 是时间影响;ij是营养和时间的相互作用;jk(i)是对象和时间的相互作用;m(ijk)是误差项。另外m是一个虚拟的标记,表征实验误差嵌入个体观测过程
25、中。模型中包含对象和时间的相互作用的目的是强调这种可能存在的相互作用,但是,对象×时间没有重复,所以无法估计两者的相互作用,从而成为组内因子检验和组间因子相互作用检验的误差来源之一(Winer et al. 1991)。此模型的期望均方假定营养和时间是确定因子(fixed factors),对象(植物)是随机的,如表8-2所示。表8-1 一种植物假定连续5周的生长情况(每株植物叶子数目)。两个营养水平:低(L),高(H)植株营养水平第1周第2周第3周第4周第5周1L4568102L346693L67910124L57810125L5678106H4699117H35710128H68
26、1110149H579101210H5891111如果用SAS来分析这种重复测量设计(不是双重多变量),则重复测量ANOVA和轮廓分析可以在一个分析中同时做(见附录)。步骤是:选择SAS程序:平衡设计则选择ANOVA,非平衡设计则选择GLM,用CLASS语句(statement)列出组间因子,用MANOVA形式写出MODEL语句,方程左边是描述组内因子水平的因变量,方程右边是组间处理,在REPEATED语句中列出组内因子的标记和水平数目。表8-1数据的分析结果列于表8-3。表8-2 重复测量ANOVA中期望的平方值(一个组间和一个组内因子)a方差来源dfE(MS)组间np-1营养p-1C2+q
27、S2+nqN2组内组间p(n-1)C2+ qS2组内np(q-1)时间q-1C2TS2npT2营养×时间(p-1)(q-1)C2TS2nNT2组内对象×时间p(n-1)(q-1)C2TS2aN2:营养导致的方差;S2:对象导致的方差;T2:时间导致的方差;C2:误差方差注意,方差来源可分为组间影响(营养)和组内影响两部分。后者包括组内主要影响(时间)组内和组间相互作用影响(营养×时间)。通常我们采用重复测量设计是因为对对像间处理的效应随时间变化的情况感兴趣,即营养×时间相互作用,因此,这一项应是最先检测的处理。表8-3第6列列出的相应F统计值概率(P&g
28、t;F)是在假定数据满足循环性条件下计算出来的。基于这些概率,可以发现营养×时间的相互作用具统计显著性(P<0.0321),这意味着施肥植物增加新叶的速度要快于未施肥者。统计显著的时间效应(P<0.0001)表明叶平均数量随时间增长,营养的单独影响的F统计结果不具统计显著性,由于相互作用具统计显著性,这并不奇怪。表8-3 一个分割试验设计的重复测量ANOVA分析aA.组间方差源dfMSFP>F营养116.822.60.1456误差86.46修正的P>FB.组内dfMSFP>FG-GH-F时间466.85158.220.00010.00010.0001营养
29、×时间41.273.010.03260.06660.0353误差(时间)320.42GreenhouseGeisser的0.5882HuynhFeldt的0.9531 a P>F是未修正的概率,G-G和H-F分别是Greenhouse-Geisser和Huynh-Fedlt修正概率,他们各自有自己的修正的值(详见正文)。如果数据的球形性不能满足,组内因子(及其相互作用)的F统计结果膨胀。根据对球形性假定的违背情况,目前发展了很多估计子()可根据对球形性假定的违法严重程度选择用来降低F统计的自由度,即在临界F统计量的自由度乘上。Box(1954)基于“总体”的方差协方差矩阵,最先
30、为组内设计(无组间因子)提出了计算公式。Geisser和Greenhouse(1958)将这种方法引用到裂区设计中。然而,由于未知(因为“总体”的方差协方差矩阵未知),必须从样本的方差协方差矩阵中估计得到。这一点也额外增加了问题的复杂性:我们不知道样本数据的不准确性如何影响的估计的,因而也无从知道其对修正的F统计自由度如何影响。出于这个原因,Greenhouse和Geisser(1959)建议了一种非常保守的方法,用能取到的最小值1/(k-1)来代替,其中k是组内因子水平的数目。Collier等(1967)以及其他研究者检验了用样本方差协方差矩阵估计而引入的偏差(Crowder和Hand 19
31、90)。从样本得到的估计值表示为“”。当大于0.75,n(样本量)小于2k时,很可能对自由度矫枉过正,从而使检验非常保守(Crowder和Hand 1990, Winer 等. 1991)。仍从样本数据出发,Huynh和Feldt(1976)提出了一个偏离较小的估计值()(其描述见Winer 等1991),尽管有些情况下,它的估计可能过于宽松(即I类错误)。SAS提供了Box的()和HuynhFeldt的修正()两种调整方法,同时还给出组内因子修正后F统计量的各自概率,并将这些作为重复测量ANOVA输出结果的一部分(表8-3)。其中Box的在SAS中表示为GreenhouseGeisser的(
32、作者本人支持这种称法)。但Maxwell和Delaney(1990)称其为Geisser-Greenhouse的。这个值可以在0和1之间波动,而则可能大于1。后者当值大于1时,取值为1。或越小,数据的球形性越差。因为, ,一般来说,是一个更保守的修正。随样本增加,两个估计值趋于一致(Maxwell和Delaney 1990)。表8-1数据分析的值在表8-3的底端。大家可以看到,的修正比大。调整的F统计概率位于组内处理组合的右侧两列。F统计修正后,营养×时间的交互作用在Greenhouse-Geisser修正后,统计上不再显著,而HuynhFeldt修正后依然是显著的。修正后,时间效应
33、的F统计概率都没有变化。运用修正程序的时候,统计结果间不可能有完全的一致性,尤其是在用备择的轮廓分析时,对比更明显(见8.8.2节中备择推荐方法间的比较)。8.3.2. 轮廓分析 MANOVA方法分析重复测量数据可以从同时考虑所有水平的组内因子的数据中估计多变量检验统计量。相比之下,轮廓分析的信息量更充分,因为它分析组内因子反应的格局。轮廓分析法回答关于平行性(parallelism)、水平性(levels)和平坦性(flatness)三种假设,通过将组内重复测量数据转换成一组对比(contrasts)或差值数据,然后对这组数据进行单变量(t检验,ANOVA)或者多变量(Hotelling的T
34、2,MANOVA)分析。Potvin et al. (1990b)秤此方法为MANOVAR。下面我将详细的介绍营养实验(表8-1)的轮廓分析,先用前两个星期的数据分析,然后用全部的数据。为进行对照,我先对前两周数据的总体多元统计量进行估计,然后再对其进行轮廓分析。前两周(两个因变量)低和高营养水平的叶子数量用Hotelling的T2 多元比较得到:F5.69, df2, 7, P=0.034。这表明在同时考虑第一周和第二周的数据时,两个营养水平的叶子数量是不同的。图8-2假定植物分别在高营养(虚线)和低营养(实线)条件下连续生长5周。用轮廓分析来分析这两周的数据,首先要检验两组数据的反应曲线形
35、状或者斜率是否相同(图8-2)来检验平行性假设。这相当于重复测量ANOVA中检验是否有显著营养×时间的相互作用。比较反应曲线的形状,也就等于在问“两个营养水平上两周内叶子数目的平均改变量是否相同”;换句话说,两组各自的均差(d)比较结果如何(表8-4)?待检验的假设是H0:(N1-N2)(W1-W2),其中第一个下标(i)表示低的或者高的营养水平,第二个下标(j)是指第一周和第二周。对前两周来说,低营养处理的d为1.2,高营养处理为2.0(应为2.2,原文计算有误译者)。t检验结果显示这两组差别显著(t3.54, df8, P=0.008)。这说明营养×时间相互作用影响显著
36、,以及叶子数目在高营养处理水平中增长更快。表8-4每株植物叶子数目的差别(表8.1所举的例子) 相邻两周的差别植株营养水平2-13-24-35-41L11222L12033L12124L21225L1112平均值1.21.41.22.26H13027H22328H23-149H221210H3120平均值2.0 2.2 1.0 2.0 既然营养×时间相互作用显著,水平性假设和平坦性假设的检验就没什么意义了,但为了演示,下面将继续解释这两种检验。水平性假设检验对营养主效应的检验。将每个对象第一周和第二周的值平均(第一周第二周)/2),然后用t检验比较两组均值。要问的问题是“反应曲线水平
37、是否有差别”,或者说,用两周均值比,高营养的植物是否比低营养植物叶子多。本例中,前两周的营养处理影响不一致(t0.66, df8, p0.53)(此处有误译者),这与显著营养×时间相互作用结果一致。最后要检验平坦性假设,或者说时间效应。我们再次用到对比变量(第一周和第二周之差),但这次是在营养水平上取平均。检验的问题是“对立变量的总平均是否不等于0”,这基本上就是一个配对t检验(Zar 1996, 第9章),并且不考虑营养处理组。用原来的反应变量就是要检验第一周和第二周间叶子数量是否增加(斜率>0),检验时,每一周中所有植物个体一起取平均。本例中,时间影响在第一、二周统计显著(
38、t7.97, df9, P<0.0001),所以有一个总的不等于0的斜率。总结一下,对于只有一个组间因子(营养)和一个组内因子两个水平(第一周,第二周)简单的设计,我们可以采用的多元分析法有:(1)Hotelling的T2检验组间大体的差别,或者(2)轮廓分析(三个独立的单变量检验),分别检验平行性、水平性和平坦性三种假设。由于轮廓分析是一个提供更多信息的方法,且可以在SAS(GLM程序和ANOVA程序)中进行,下面我将用这种方法分析表8.1中所有五天的数据。轮廓分析中的时间效应(平坦性)和营养×时间交互作用(平行性)是以邻周间差(对比)为基础进行分析的。5周的数据,则周间差数
39、据为4组。这4组周间差数据可以作为4组因变量,用MANOVA进行分析。在SAS中,这些差别(或称对比,contrasts)是原始组内数据的一种变换。这种变换与大多数生态学家在统计分析中熟知的变换不太一样,后者常见的比如对数变换、平方根变换、反正弦变换等。我们这种差别变换,是将组内因子的两个水平转换成一个。平行性假设检验中,用到的周间差有(第二周第一周),(第三周第二周),(第四周第三周),(第五周第四周)(表8.3)。转换的结果可以被REPEATED语句识别为组内因子(见附录)。这个分析中用到的PROFILE语句可以利用组内因子相邻水平间的差别来产生对比变量。SAS中其它可用的变换在下面的章节
40、中将陆续谈到。表8.5A是MANOVA对差别的分析结果。表的第二列显示四种不同的多变量检验方法的统计量,第三列是与其同价的F统计量,最后一列是F统计量的概率。表中低概率(P=0.025)表明营养×时间相互作用影响统计显著。因子轮廓分析的结果说明高营养水平和低营养水平的生长曲线斜率不同,这与重复测量ANOVA的分析结果一致(表8.3)。(不同的多变量检验统计方法在第章已经讨论)。平坦性(时间影响)假设检验从两个营养水平平均来看,是否叶子数目随时间有显著增加。这次是检验四个时间差别组的总平均(全部营养水平的平均)是否等于0。同样,MANOVA中得到的统计显著的F值,表明叶子数目随时间是增
41、加的(P<0.0001)(表8.5B)。轮廓分析中组间影响(即营养水平)检验与重复测量ANOVA是一样的,两者都是比较各个组间因子水平的组内反应(时间)的均值差别(SAS Institute Inc. 1989b; Potvin et al. 1990b)。表8-5营养×时间交互作用、以及时间效应的MANOVA分析(表8.1的数据)a统计方法值FNum.dfDen.dfP>FA.营养×时间Wilks' lambda0.144772127.3843450.025Pillai's trace0.855227887.3843450.025Hotelli
42、ng-Lawley trace5.907407417.3843450.025Roy's greatest root5.907407417.3843450.025B.TimeWilks' lambda0.00848656146.0417450.025Pillai's trace0.99151344146.0417450.025Hotelling-Lawley trace116.8333333146.0417450.025Roy's greatest root116.8333333146.0417450.025a “Num.df”,”Den.df”分别表示分子和分母
43、的自由度如果我们对特定时间间隔中处理效应是否有差别感兴趣,单个的ANOVA(F检验)可以针对每组对比进行检验。比如,我们可以对表8.4中每一组对比进行营养×时间相互作用或时间影响的显著性进行检验。表8.6为这种分析结果。在每个对比变量各自的ANOVA分析中,“平均”(表中Mean)表示平坦性假设检验,即是否具有显著的时间影响;“营养”(表中Nutrient)为平行性假设检验,检验是否具有显著的营养×时间相互作用影响。请注意,在4组对比同时分析时,营养×时间的相互作用和时间影响都是显著的,但是在个体ANOVA中,营养×时间相互作用影响只有第二周第一周是显著
44、的。这说明由于营养处理导致的叶子数目显著变化只出现在第一周和第二周间。这一个可以从对比的均值看出来(表8.3)。其他日期营养水平的周间差的均值,还没有足够大到显著的水平,但是当所有一起分析时,他们对总差别仍有一定贡献。表8-6 ANOVA分析组内因子(时间)的每个对比变量(表8.1的数据)方差源dfMSFP>F对比变量:第二周第一周平均值128.9144.50.0001营养12.512.50.0077残差80.2对比变量:第三周第二周平均值132.464.80.0001营养11.63.20.1114残差80.5对比变量:第四周第三周平均值112.17.560.0251营养10.10.03
45、0.8089残差81.6对比变量:第五周第四周平均值144.140.090.0002营养10.10.090.7707残差81.1因为对比分析单个一一进行时,ANOVA被反复使用,所以必须根据检验次数修正全实验的误差率。为了保证总体的为0.05,表8.6中每组对比可用Bonnferroni修正0.05/4=0.0125。如果只对一组对比感兴趣,那么不需要修正。像SAS这种统计软件包会自动地对所有对比组进行MANOVA和ANOVA分析,但我们可以用ANOVA只检验我们所感兴趣的对比组。需要强调,组内因子可使用不同的变换(对比),但这并不影响MANOVA的输出结果,因为多变量统计检验具有不变性(in
46、variance)的特性(Morrison 1990)。使用什么样的变换,取决于想从组内因子中找出什么样的格局。SAS提供了5种不同的转换选择:轮廓(Profile)转换,对比(Contrast)转换,黑尔默特(Helmert)转换,均值(Means)转换和多项式(Polynomial)转换。前面我们叙及从时间因子相邻两个水平差别产生的轮廓转换。对比转换时默认变换条件,其中一个水平的组内因子作为对照,其它水平与其相比对。Potvin等(1990b)用了黑尔默特转换:它将一个组内因子水平和其后面组内因子水平的均值进行比较。Mean变换是将每个组内因子水平和剩下的其它水平的均值作比较。多项式转换在
47、我们对组内数据的趋势感兴趣,想看它们是否符合某种特定形式时尤其有用。比如,每株植物叶子数目随时间的变化是否符合线、平方或者立方变化趋势呢?这种方法的基础是一组阶次递增的多项式,就像一组独立(正交的)的对比,这种分析经常被称为趋势分析(Winer et al. 1991)。正交多项式使我们可以问这样的问题:数据是否有显著的线性(一阶)、平方(二阶)或立方(三阶)趋势(Gurevitch和Chester 1986; Hand和Taylor1987)?假定k是组内因子水平的数目,那么可以得到(k1)个多项式,尽管很多时候我们只感兴趣低阶趋势(线性或者二次)的存在。分析组内因子时,MANOVA同时考虑
48、从数据中获得的所有阶次多项式。与轮廓转换一样,我们可以用单个ANOVA检测特定的多项式。检验正交多项式时,我们一般从高阶到低阶检验显著性,当我们找到具有显著性的某阶多项式时,检验终止。因为高阶多项式对大多数生态学数据来说都不合适,且检验数量增加会增加我们犯类错误的概率,所以多数情况下,选择从立方或者平方开始分析数据的显著性是比较合适的。表8-7 一阶和二阶正交多项式的个体ANOVA分析(表8.1的数据)方差dfMSFP>F对比变量:一阶平均值1265.690 432.02 0.0001 营养12.890 4.70 0.0620 残差80.615 对比变量:二阶平均值10.007 0.03
49、 0.8651 营养12.064 8.86 0.0175 残差80.232 用正交多项式分析表8.1植物生长数据(表8.7)。多变量分析的F值与表8.5相同,表8.7只显示了个体F检验的结果。本例中我们只检验了平方和线性趋势,SAS中还提供了立方趋势分析。因为有两个独立的分析,设为0.025(0.05/2),可以看到营养×时间相互作用存在一个显著的平方趋势(P=0.0175)。记住,SAS输出的表中,“营养”表示营养×时间相互作用。所以低营养和高营养处理在叶子数目随时间变化的平方上差别显著。时间(Mean)不具显著的平方趋势,但线性趋势显著(P<0.0001),表明实
50、验中叶子数目增加大体是一种线性趋势。8.4. 多个组内因子生态实验或数据收集过程中,经常会遇到这样的情况,同一个个体的重复观测又被析因分类(classified factorially),或同一个体在多组不同条件下进行观测。在植物生长试验中(表8.1),我们可能会将试验继续进行到下一年,看看第二年里,高营养条件是否继续比低营养条件产生更多的叶子(表8.8)。这就是一个两个组内因子(周和年)的试验设计。组内因子处理如下:(1)在年间平均,检验是否有显著的周效应;(2)周间平均,检验是否有显著的年效应;(3)用一个合适对比,检验是否有显著的周×年相互作用,换句话说,在营养水平间平均,植物
51、生长是否有年间差异?组间因子(营养)与其中每一个容斥(cross-classified),所以需要检测营养处理与每个组内因子(周、年),以及组内因子相互作用(周×年)的相互作用。实际上,这是一个须最先检测的三因子相互作用(营养×年×周)。需要强调的是这种多于一个组内因子的设计既可以用重复测量ANOVA(Winer等 1991),又可以用轮廓分析(MANOVA)(OBrien和Kaiser 1985)来分析。乍一看,这种分析很复杂,事实上,只要我们顺着组间因子和组内因子走就并不复杂(表8.9)。在SAS程序MODEL语句中,如将两年数据合并,将每一周数据看成一个因变
52、量,总共10个(附录B)。和前面一样,每个组内因子水平数目列在REPEATED语句中。表8.9中,我仅列出了轮廓分析(MANOVA)结果,并将SAS的输出结果压缩。在组内因子影响中,三向相互作用(营养×年×周)统计显著,这意味着第一年里高营养植物比低营养植物产叶多,但第二年里不存在这种差别,所以营养处理不同年份有不同影响。与第一年数据分析结果一样,营养主效应不显著。ANOVA和正交多项式分析结果一样。在OBrien和Kaiser(1985)书中有具体的两组间因子和两组内因子的例子。表8-8 表.1中的植物继续生长一年a植株营养水平第一年第二年12345123451L4568
53、10445792L346693468103L6791012346794L57810123468105L5678105567106H4699114457107H35710125568118H681110144467109H57910123457910H5891111557911a在低营养和高营养两种条件下,在第一年和第二年分别连续测量了五周植物的叶子数目。每年春天,植物叶子数目增加需要5到周的时间,包括第一周的叶子萌动。到了冬天,叶子凋零。8.5. 重复测量的其他生态学例子前面我们一直关注的是时间为组内因子的重复测量分析。生态学研究中其他重复测量的情况还有像生物个体或者试验单元处在几个不同条件下
54、,测定其某种反应。Potvin等(1990b)用的一个例子是,同一株植物暴露在不同的CO2浓度条件(组内因子)下,比较各自的光合速率。该例包含两个组间因子:植物来自两个不同种群;另外在光合速率测量前,部分植物经过冷处理。调查植物和食草昆虫相互关系的研究人员会对来自不同种群的同一种昆虫在不同植物种(或种群)上的适合度情况这样的问题感兴趣。研究的一个典型做法是:在不同植物种或不同植物种群(组内因子)的叶子上饲养来自不同昆虫种群(组间因子)的同一批卵中孵化出来的姊妹个体。Horton等(1991)对这种数据作了很详细的分析,表明用重复测量设计来分析的话,会增强统计效力。一批卵在这里被看作为一个区组或
55、对象,每个昆虫种群都有多个重复试验的卵。在有些蛙类中,雌雄体色不同,而且很多会在不同颜色背景下变色。King和King(1991)研究了雌雄林蛙(Rana Sylvatica)(组间因子)颜色的差别,并且同一个体被暴露在不同的颜色背景下(组内因子)。因为是在三个反应变量下分析颜色,所以这是一个双重多变量设计。表8-9轮廓分析(MANOVA)结果(表8.8中的数据)aA.组间方差源MSdfFP>F营养13.6913.830.0861残差3.588B.组内方差源FNum.dfDen.dfP>F年(Y)14.47180.0052 周(W)135.14450.0001 年×周14.34450.0060 营养×年0.97180.3530 营养×周0.52450.7301 N×Y×W5.66450.0425 a所有的处理组合的四种MANOVA检验条件,得到的统计结果是一样的。“Num.df”,”Den.df”分别表示分子和分母的自由度8.6. 重复测量ANOVA和轮廓分析的替代方法随因变量数量增加和样本减小,MANOVA的效力会下降。MANOVA效力低的一个原因是对方差-协方差矩阵结构缺乏限制(Crowder和Hand 1990)。在一些情况下
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年健身气功课考试题及答案
- 2025年预审学考试题型及答案
- 2025年三级教育抹灰试题及答案
- 2025年高考语文备考之小说阅读:考点剖析+教材衔接
- 2025年有趣知识的测试题及答案
- 2025年温州银行笔试试题及答案
- 2025年考试题型改革及答案
- 2025年宿舍管理面试试题及答案
- 2025年广西南职面试题及答案
- 2025年医学保研面试题及答案
- 全过程工程咨询服务服务质量保障方案
- 安全生产培训记录表
- (高清版)DZT 0319-2018 冶金行业绿色矿山建设规范
- 2024年湖南株洲市天元区面向社会社区专职工作者招聘笔试参考题库附带答案详解
- 高中生物学科核心素养解读课件
- 2024届江苏省苏州市八年级语文第二学期期末统考试题含解析
- 个人所得税宣贯培训课件
- 高素质农民培训认识
- 地域文化与城乡景观 全国优质课一等奖
- 工业机器人及零部件结构设计
- OA办公系统的详细介绍
评论
0/150
提交评论