第4章方差分析(共42页)_第1页
第4章方差分析(共42页)_第2页
第4章方差分析(共42页)_第3页
第4章方差分析(共42页)_第4页
第4章方差分析(共42页)_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、PAGE PAGE 85第四章 方差分析方差分析(Analysis of Variance,ANOVA)是将待分析资料的总变异(biny)剖分为不同的变异来源,以获得不同变异来源的总体方差的估计值。通过F检验,完成多个样本(yngbn)平均数之间的差异显著性检验(即多重比较),若处理效应为随机模型时,则进行方差组分的估计。4.1 方差分析的SAS过程(guchng)用于方差分析的主要过程有方差分析(ANOVA)和广义线性模型(GLM)。对于无缺省(缺值、缺组等)资料,或称平衡资料,一般采用(ANOVA)过程,对缺省资料(非平衡资料)应采用(GLM)过程。事实上根据效应模型的不同,还有VARCO

2、ME(方差组分)过程,MIXED(混合模型)过程等。4.1.1 ANOVA过程1. 名词解释自变量与依变量 在方差分析中,自变量可称为独立变量、定性变量(Qualitative Variale)、分类变量(Classiflcation Variable)或类别变量(Categorcal Variable),相当于因素处理、水平变量。依变量又称反应变量(Response Variable),相当于观察值变量。实验效应 方差分析的目的是找出对依变量产生的实验效应,这种效应可分为3种:主效应,常以自变量的英文字母表示,如A、B等。互作效应,常以星号联接自变量表示,如A*B。嵌套效应,以小括号表示,如

3、A(B)表示A效应嵌套在B效应之内。2 过程格式:PROCANOVACLASSMODELMEANSFREQTESTMANOVABY选项串;变量名称串;依变量名称串=效应串/选项串;效应名称串/选项串;变量名称;H=效应名称 E=效应名称H=效应名称 E=效应名称 M=变量的转换式;PREFIX=新变量的名称代号;MNAMES=新变量的名称串/选项串;变量名称串语句(yj)说明:CLASS指令(zhlng)必须出现在MODEL指令(zhlng)之前,如选用TEST、MANOVA指令,则它们必须出现在MODEL指令之后。MEANS、TEST及MANOVA等指令可重复使用,其他指令则只能出现一次。P

4、ROC ANOVA选项串中:DATA=输入数据集名称,指明对它执行ANOVA分析。MANOVA 要求将含一个或一个以上依变量遗漏数据的观察值剔除。OUTPUT=(含分析结果的)输出文件名称,包括平方和(SS),F检验值,以及各效应的显著程度。CLASS变量名称串 指明自变量,自变量可以是数值的或文字的。MODEL指令 定义分析所用的线性数学模型(见表61),删除号(/)后的选项:NOUNI:不印出单变量方差分析的结果,适用于多变量的方差分析。INT:要求SAS把线性模型内的截距(即资料的总平均数)当成一个参数,同时对这个截距作是否为零的假设检验。MEANS指令 前半部要求算出某些自变量(或互作

5、)中各组的平均数,后半部(删除号后)共有24个选项,前17个选项分别对MEANS指令中所列的主效应平均数进行多种方法的多重比较。这些选项有:BON:修正最小显著差异t检验。DUNCAN:邓肯多重范围检验,即邓肯氏新复极差法。DUNNETT(控制组组名):邓尼特控制差异检验。它是依据t分布由各组平均数与控制组(指定组如对照组)进行比较,采用双尾检验。DUNNETTL(控制组组名):邓尼特小于控制均数检验。与控制组平均数的比较,采用单尾检验,临界值订在t分布的下端。DUNNETTU(控制组组名):邓尼特大于控制均数检验。与控制组平均数的比较,采用单尾检验,临界值订在t分布的上端。GABRIEL:贵

6、博氏多重比较。REGWF:REGW多重F检验。REGWQ:REGW多种t检验。SCHEFFE:执行沙菲氏(Scheffe)的多重比较检验。SIDAK:Sidak调整T检验。SUM(或GTI):Sidak独立样本t检验。当两组样本含量不等时为哈氏(Hochberg)的GTI检验。SNK:纽曼库尔多重范围检验,即q检验。T(或LSD):配对t检验或费歇尔最小显著差异检验。TUKEY:图基固定极差检验。WALLER:娃尔邓肯 K比率t检验。以上17种检验法最常用的为、。其它主要选项还有ALPHA=P:界定检验的显著水准。内设值为P=0.05。当上面选项与选项并用时,P值必须是0.10、0.05、0.

7、01三者之一。与上面其他检验选项时,P可以是0.0001与0.9999间任何的值。LINES:将显著性检验的平均数,由大到小排列。若某一对平均数之间无显著差异,则将它们印在同一行上,并以虚线将它们与其他有显著差异的平均数分开。当选用、或等检验时,此选项会自动被包括在内,否则,必须附加此选项。CLM:效应的各组平均数以置信区间方式表示。此项必须与、等联用。(21)CLDIFF:与(20)相仿,选用、时,附加此选项,将以置信区间方式显示各组平均数。(22)E=效应名称:它界定各显著检验的分母,缺省时以误差项的均方自动成为分母。FREQ指令(zhlng) 指明(zhmng)该变量值为各观察值重复出现

8、的次数。TEST指令(zhlng) 用来指定F检验的分子与分母,H=分子,E=分母;一般而言,系统自动采用误差项的均方作为F检验的分母。但对于随机模型等,可选此项。MANOVA指令 主要用于执行多变量(多元)方差分析。BY指令 用于把数据文件分成几个小文件,然后逐一进行ANOVA分析,但文件内的数据必须先按照BY变量串的值做由小到大的重新排列。此步骤可籍PROC SORT达成。以上指令中MODEL指令至关重要,同一资料,分析结果依模型不同而异。常用的模型定义语句有:MODEL Y=A;单因素方差分析,MODEL Y=A B两因素主效应模型,MODEL Y=A B A*B两因素带互作模型,MOD

9、EL Y=A B(A)嵌套(NESTED)模型用于系统分组资料。MODEL Y1、Y2=A两元单因素方差分析。在模型定义中,可用“|”和“n”简化表达。“|”等价于按Searle规则将效应从左到右展开,“n”表示互作效应和嵌套效应所包含的最多变量数。各种模型简化表示法及其等价形式列于下表。表41模型简化表示法及其等价形式简化表示法等价形式 A|BA|B|CA|B|C2A|C(B)A(B)|C(B)A|B(A)|CA|B(A)|C2A B A*BA B A*B C A*C B*C A*B*CA B A*B C A*C B*CA C(B) A*C(B)A(B) C(B) A*C(B)A B(A)

10、C A*C B*C(A)A B(A) C A*C结果输出包括分类变量信息表,方差分析表及多重比较表等。4.1.2 GLM过程1. 概述GLM是广义(gungy)线性模型(General Linear Model)的简称(jinchng),其推算参数(cnsh)的理论依据是最小误差平方法(The Least Squares Method)。最适宜于非平衡设计的资料,该过程可应用于多种不同的统计分析。本章仅介绍在方差分析方面的用途。2. 过程格式:PROCGLMCLASSMODELMEANSCONTRASTESTIMATELSMEANSMANOVAOUTPUTRANDOMTESTFREQBY选项串

11、;变量名称串;依变量名称串=效应串/选项串;效应名称串/选项串;比较式的名称各组效应系数据/选项串; 估计值的名称各组效应系数据/选项串;效应名称串/选项串;H=效应名称 E=效应名称 M=变量的转换式;PREFIX=新变量的名称代号;MNAMES=新变量的名称串/选项串;OUT=输出文件名称 关键字=变量串;效应名称串/选项串;H=效应名称 E=效应名称/选项串;变量名称; 变量名称 语句说明: 格式中第1、3条指令是不可省略的,CLASS指令必须出现在MODEL、MEANS指令之前,其余均应出现在MODEL指令之后(但BY可出现在RUN前任何一处)。PROC GLM选项串中: DATA、

12、MANOVA、 OUTPUT的含义与ANOVA选项串中的相同。 NOPRINT:要求分析结果不在报表上打印出来,一般不用此选项。MULTIPASS:要求重读输入资料文件内的数据,也不常用。 ORDER=FREQ |DATA| INTERNAL|FORMATTED:界定自变量内各水平(组别)的次序,该选项与CONTRAST及ESTIMATE指令相关。当ORDER=FREQ时,观察值个数最多的那一组为第一组,余类推。当ORDER=DATA时,组别按输入资料文件中各组第一次出现的次序而定。当ORDER=INTERNAL时,组别按其代号由小到大排列,或按各组名称的英文字母顺序排列。当ORDER=FOR

13、MATTED时,则组别的顺序以外部的格式而定,此项为内设值。CLASS指令 指明自变量。MODEL指令(zhlng)的前半部可参见表41,删除号后的选项串大致可分四类(s li)。第一类与截距(常数项)有关。NOINT:把截距排除(pich)模型之外。INT:印出截距统计检验。第二类与报表有关。NOUNI:不打印单因素方差分析结果(常用于多变量分析)。SOLUTION:打印一般线模型中参数的估计值,当省略CLASS指令时,程序会自动印出此解。TOLERANCE:印出容忍量。其定义为1R2,R2为自变量与依变量的相关指数。第三类与无效假设的检验有关。E:要求印出所有可估计函数(Estimable

14、 Functions)的值。E1;或E2:或E3:或E4:只要求印出每一效应第一、或第二、或第三、或第四型可估计函数值。SSI:或SS2:或SS3:或SS4:只印出每一效应第一、或第二、或第三、或第四型的平方和。第四类与控制计算过程的打印有关。XPX:要求印出(XX)的向量积距阵INVERST(或I):要求印出(XX)的逆距阵,或(XX)通用逆距阵。MEANS指令的后半部分(删除号后)的选项,前22项可参见ANOVA过程。另有DEPONLY:要求印出依变量的平均数,若省略此项,程序会印出文件中所有连续性变量的平均数。ETYPE=1(或2、或3、或4):界定F检验中分母距阵的均方类型,内设为分析

15、过程检验中最高的一型。HTYPE=1(或2、或3、或4):与WALLER选项并用,界定F检验中分子距阵的均方类型,内设为分析过程检验中最高的一型。CONTRAST指令 用于对比检验,即以线性方程序重新组合参数据执行检验。其中“比较式的名字”必须放在单引号内,名字长度以20个字母为限;各组效应系数前必须先注明所要比较的效应,这些效应必须是MODEL中出现过的。横行系数总和必须是0,不接受分数。若有多个比较式,则以逗号将各横行隔开。删除号后有E:印出线性函数的向量L。E=效应名称:界定F检验的分母内设为误差项均方。ETYPE=1(或2:或3:或4):界定平方和的类型等。ESTIMATE指令 用于检

16、验参数线性组合。LSMEANS指令 用于计算依据最小误差平方法所得的平均数。主要选项有:E:最小误差平方平均数(Lsm)计算过程中所用到的可估计函数值。STDERR:印出t检验(Ho:Lsm0) 的分母与其显著程度。TDIFF:印出各平均数比较的t值及显著程度。PDIFF:印出各平均数比较后的显著程度。E=效应名称:必须与、选项并用,指定某一效应均方作为t检验的分母。缺省时,GLM自动采用误差项的均方作为t检验的分母。ETYPE=1(或2:或3:或4):指定中效应均方的类型。MANOVA指令 请参阅 4.3。OUTPUT指令(zhlng)中,OUT=输出资料文件名称,这个(zh ge)文件含原

17、输入资料文件的所有变量,以及指令中所提到的关键字。关键字=变量(binling)名称串:关键字主要有P=预测值。R=预测误差。L95M(或U95M)=依变量平均数95%置信区间的下限(或上限)。L95(或U95)=依变量预测值95%置信区间的下(或上)限。STDP=预测值平均数的标准差。KSTDP=误差的标准差。STDI=个别预测值的标准差。STUDENT=经过标准化的误差。H=影响力,定义为Xi(XX)Xi。RANDOM指令 指定模型中的随机效应。选项串中Q:给出所有固定效应的二次形。TEST:对各式随机效应执行适当的F检验,并且F检验的分母完全根据效应的期望均方而定。FREQ、BY、指令与

18、ANOAV过程中相似。4.1.3 VARCOMP过程1. 概述VARCOMP过程是用于估计广义线性模型中方差组分的值,尤其是对随机模型的资料,或系统设计的资料,可用该过程完成方差组分的估计。本过程估计方差组分的方法有四种:TYPE1(一型平方和)法:因为该型平方和与模型效应的前后顺序相关(如系统设计)。所以需要对其后效应的大小作调整,据此计算出各效应均方后进行F检验,其所对应的选项为:METHOD=TYPE1。MIVQUE0(最小方差二次无偏估计)法:该法估计的方差不受线性模型中固定效应的影响,随机效应的方差只对固定效应作调整,所以该法计算过程非常节省时间,并作为VARCOMP的内设值。其选项

19、为:METHOD=MIVQUE0。ML(极大似然) 法,该法的估计过程是循环式的,直到目标函数值稳定下来为止。其选项为METHOD=ML。REML(约束极大似然)法,该法与相异之处是先将线性模型中的随机效应与固定效应分开,然后进行循环式的估计,直到随机效应所对应的目标函数值稳定下来为止。而则不加以区分。该法的选项为:METHOD=REML。2. 过程格式:PROCVARCOMPCLASSMODELBY选项串;自变量名称串;依变量名称串=效应串/选项串;变量名称串;语句说明:VARCOMP选项中METHOD =TYPE1|MIVQUEO|ML|REML见概述。MAXITER = 正整数:界定ML

20、 REML中循环的最高次数,内设值等于50。EPSILON=小的正实数:界定ML或REML中目标函数稳定性的标准,内设10-8。若两次循环所产生的函数值 之差小于此数,则目标函数已达稳定。CLASS、BY指令(zhlng)与ANOVA或GLM过程(guchng)相同。MODEL指令的前半部,亦与上述两个过程相同,删除号后的选项只有(zhyu)一个,FIXD=n(大于0的正整数,如:2):它指明指令等号右边的前n(2)个效应是固定效应,其后的效应都是随机效应。4.2程序应用4.2.1单因素方差分析例41选用条件基本一致的小白鼠30只,随机分成3组,分别接种11C、9D、DSL三种菌型的伤寒杆菌,

21、观察接种后小白鼠的存活天数如下列程序数据行中。试比较3组小白鼠的存活天数有无显著差异。这是一个单因素设计的资料,a因素分3个水平,每个水平含10个观察值,拟用ANOVA过程分析。1. 编程法分析(1)程序options nodate nonumber;data xu4a;do a=1 to 3;do i=1 to 10; input x ; output;end; end;cards;5 5 6 7 8 8 5 5 7 102 4 3 2 4 7 7 2 5 45 6 7 7 12 13 11 7 8 9;proc format;value trtf 1=11C 2=9D 3=DSL;proc

22、 anova; format a trtf.;class a; model x=a;means a/ duncan; means a/ duncan alpha=0.01;means a;run;(2)输出结果 The ANOVA ProcedureClass Level InformationClassLevelsValuesa311C 9D DSLNumber of observations 30 Dependent Variable: xSourceDFSum of SquaresMean SquareF ValuePr FModel2102.066666751.033333311.21

23、0.0003Error27122.90000004.5518519Corrected Total29224.9666667R-SquareCoeff VarRoot MSEx Mean0.45369733.510582.1335076.366667SourceDFAnova SSMean SquareF ValuePr Fa2102.066666751.033333311.210.0003 Duncans Multiple Range Test for xAlpha0.050.01Error Degrees of Freedom2727Error Mean Square4.5518524.55

24、1852Number of Means2323Critical Range1.9582.0572.6442.757Means with the same letter are not significantly different.0.050.01Duncan GroupingMeanNaDuncan roupingMeanNaA8.500010DSL A8.500010DSLA6.60001011CBA6.60001011CB4.0000109D B4.0000109D Level of xaNMeanStd Dev11C106.600000001.712697689D104.0000000

25、01.88561808DSL108.500000002.67706307【程序(chngx)说明】数据(shj)步中有两个循环体,外循环a取值1、2、3,循环(xnhun)3次(为a的水平数),内循环i取值110,循环10次(为各水平内观察值个数),所以,整个大循环共读入观察值变量x(依变量)的30个数据。过程步中FORMAT语句 用于设定变量格式。VALUE语句 定义格式名trtf,当某变量使用trtf格式时,该变量若取值1、2、3,将分别用格式中定义的11C、9D、DSL表示。其语句为:FORMAT 变量名 格式名,本例为:FORMAT a trtf;即指定a的输出格式,输出时将a的取值1

26、、2、3,分别用11C、9D、DSL代替。设定格式和输出格式的存在与否不影响分析结果,仅仅是为了解释结果的方便而已。CLASS语句 指明自变量a。MODEL语句 定义单项分组资料的线性数学模型。MEANS语句 前两个指定计算处理平均数,并用邓肯新复极差法(SSR法)进行0.05及0.01显著水平下的多重比较。后一个MEANS语句指定印出各处理的平均数、标准差。【结果分析】输出结果为:显示资料的分组(自变量)信息。a有3个水平,取值为11C、9D、DSL,观察值个数为30。为方差分析表。项目有:变异来源(Source)、自由度(DF)、平方和(Sun of Squares)、均方(Mean Sq

27、uare)、F值(F Value)及概率P(PrsF)。变异来源中有模型变异(Model),即整个处理效应的总变异,误差项(Error)的变异以及总变异(Corrected Total)。因为只有一个A因素,因此,其下表中a间变异即为总效应的变异。F检验结果(F=11.21,P=.0003)表明,处理间差异达到极显著水平。在该表下为a(自变量)与x(依变量)间的相关指数(RSquare)为:R2=模型平方和/总平方和=102.067/224.967=0.453697。Root MSE为误差项均方根(相当于方程估测误差) Sx=4.5518521/2=2.133507。依变量(x)的平均数=6.

28、366667,Coeff Var为剔除处理效应后依变量的变异系数CV=100%Sx/=100%2.1335/6.3667=33.5106。为多重比较表,表中列有检验所用的显著水平、自由度、标准误及LSR值(Critical Range),并注明均数前字母相同者为差异不显著,不同者为差异显著或极显著。经检验结果表明,9D与11C、DSL两个菌型的毒性分别达到显著(p0.05)和极显著(p0.05)。列出各水平的样本含量、平均数及标准差。2. 非编程法分析先创建(chungjin)数据集work.xu4a,采用(ciyng)SAS/ASSIST进行(jnxng)分析,其步骤为:SolutionsA

29、SSISTData AnalysisANOVAAnalysis of VarianceTableworkxu4aokDependentxokClassificationaokAdditional OptionsOutput statisticsMeanaOptions for meansComparison TestsDuncansrange testokokGobackGobackRunSubmit【说明】结果显示于OUTPUT窗口,其内容与编程法分析中多重比较为0.05显著水平的相当。例42在产卵场捕得12尾鲫鱼,它们的成熟系数(%)按年龄分成2年(g2)、3年(g3)及4(g4)年3个组

30、别列于程序数据行中。试检验不同年龄组鲫鱼成熟系数有无显著差异。这是一个单因素3个水平内观察次数不等的资料,拟用GLM过程进行分析。1. 编程法分析(1)程序 options nodate nonumber;data xu4b;input g$ n;do i=1 to n;input x ;output;end;cards;g2 411.5 14.0 14.3 12.0g3 513.2 12.6 18.5 19.0 15.7g4 318.1 18.6 20.0;proc glm;class g; model x=g/ss3;means g / hovtest snk;means g;run;pr

31、oc npar1way wilcoxon;class g;var x;exact;run;(2)输出(shch)结果 Dependent Variable: xSourceDFSum of SquaresMean SquareF ValuePr FModel260.952500030.47625006.470.0182Error942.41000004.7122222Corrected Total11103.3625000R-SquareCoeff VarRoot MSEx Mean0.58969613.892902.17076515.62500SourceDFType III SSMean

32、SquareF ValuePr Fg260.9525000030.476250006.470.0182 Levenes Test for Homogeneity of x VarianceANOVA of Squared Deviations from Group MeansSourceDFSum of SquaresMean SquareF ValuePr Fg298.764149.38206.210.0202Error971.56277.9514 Student-Newman-Keuls Test for xSNK GroupingMeanNgA18.9003g4 BA15.8005g3

33、B12.9504g2 Level of xgNMeanStd Devg2412.95000001.40593978g3515.80000002.93853705g4318.90000000.98488578The NPAR1WAY Procedure Wilcoxon Scores (Rank Sums) for Variable xClassified by Variable g gNSum of ScoresExpected Under H0Std Dev Under H0Mean Scoreg2414.026.005.8878413.50g3534.032.506.1576516.80g

34、4330.019.505.40832710.00 Kruskal-Wallis TestChi-Square5.6308DF2Asymptotic Pr Chi-Square0.0599Exact Pr = Chi-Square0.0504【程序(chngx)说明】Input语句(yj) 指明(zhmng)输入一个字符变量(自变量)g,取值g2、g3、g4(3个水平名称)、一个数字型变量n取值4、5、3(各水平内观察次数)。Do循环语句 指定按各水平中的观察值读给变量g。MODEL语句中删除号后的选项ss3:指明印出效应的第三型平方和。MEANS语句中删除号后的选项SKN:指明用q法进行平均数

35、的多重比较。选项HOVTEST:指明进行方差同质性检验。同质性检验有多种方法,若不对HOVTEST加选择(直接写上)为缺省的算法,即LEVENE检验法。若加选择,如HOVTEST=BARTLETT,则表明用巴特利特检验法等等。PROC NPAR1WAY语句 指明调用非参数检验过程。当资料的总体方差不同质或为非正态资料时,可调用该过程进行非参分析,NPAR1WAY后的选项主要有四种常用分析方法,它们的不同称呼列于表42。表42四种非参数的平均数比较值选项名传统的非参数分析两个样本时名称多个样本时名称WILCOXONWilcoxon秩和检验或MannWhitney U检验多样本KruskalWal

36、lis检验MEDIANBrown检验中位数检验VWVan der Waerden检验多样本Van der Waerden检验SAVAGESavage检验多样本Savage检验EXACT语句 指明进行非参数的精确检验,不选此项,NPAR1WAY在执行大样本分析时用卡方检验。【结果分析】方差分析结果(F=6.47,P=0.018)表明,不同年龄组别的成熟系数间存在显著的差异。多重比较表中,q检验的结果表明,只有4年龄的鲫鱼成熟系数与2年龄的存在显著的差异,其他各组间的差异均未达到5%的显著水平。严格地说,只有满足正态性和方差同质性的资料才能进行方差分析。中采用LEVENE检验法对资料的方差同质性进

37、行检验。结果(F=6.21,P=0.0202)表明,该资料相应的总体方差是不同质的(P0.05)。在这种情况下,要么寻找合适的变量变换方法,使变换的资料满足正态性和方差同质性后,进行参数检验;要么采用非参数检验。非参数检验结果表明,3组之间的差异其精确概率P=0.054,用2分布作为其近似分布推算出来的概率P=0.0599,两者都接近于0.05,表明四组资料的分布位置之间存在一定的差异。但两两之间的差异,SAS中未给出。列出各水平的样本含量、平均数及标准差。2 非编程法分析创建(chungjin)数据集work.xu4b,用SAS/AA模块进行方差分析和非参数检验以及(yj)方差同质性检验。(

38、1)方差分析及非参数检验 SolutionsAnalysisStatistical AnalysisFileOpen by SAS Nameworkxu4bokStatisaicsANOVAOneWay ANOVAxDependentgIndependentTestsNonparametricsKruskalWallisokokRunSubmit(2)方差(fn ch)同质性检验SolutionsAnalysisStatistical AnalysisFileOpen by SAS Nameworkxu4bokStatisaicsANOVAOneWay ANOVAxDependentgInde

39、pendentTestsLevenes TestokokSubmit 【说明】在Tests for Equal Variance复选框中可任选Levenes Test、Brown and Forsythes Test或Bartletts Test中的一种或全部非参检验法。输出结果与编程法分析的结果相同。例43对不同周龄组的罗曼鸡,注射某疫苗后,测定其抗体滴度(1x)列于下表。试对各组的抗体平均滴度作差异显著性检验。表43 不同周龄鸡抗体滴度的倒数(x)5周龄24488163210周龄881632326412815周龄163232646412825620周龄326464128256256512该

40、资料是一个单因素4水平,各水平观察值次数相等的资料,表中数据为抗体滴度的倒数,明显呈等比数列。此类资料多不符合方差分析的基本假定,因此有必要做正态性检验,若资料不符合正态分布则需要作变量变换。本例拟作对数的变换。1编程法分析(1)程序 options nodate nonumber;data xu4c; input g x; y=log(x);cards;122831643214283324641421633246418232364412818232364425611626431284256132212832564512;proc sort;by g;run;proc univariate n

41、ormal;var x;by g;run;proc anova;class g;model y=g; means g/duncan;means g; run;(2) 输出(shch)结果 Tests for Normality (x)g=1TestStatisticp ValueShapiro-WilkW0.792083Pr W0.0342g=2TestStatisticp ValueShapiro-WilkW0.798708Pr W0.0398g=3TestStatisticp ValueShapiro-WilkW0.792083Pr W0.0342g=4TestStatisticp Val

42、ueShapiro-WilkW0.854425Pr FModel331.4868314510.4956104811.12 Fg331.4868314510.4956104811.12.0001 Duncan GroupingMeanNgA4.852074BA4.059973B3.267772C1.980471 Level of ygNMeanStd Dev171.980420520.93241148273.267693851.03696654374.059862060.93241148474.852030260.98025814【程序(chngx)说明】Input语句(yj) 指明(zhmng

43、)输入2个变量g、x,其中g取值1、2、3、4,x为表43中的观察值变量。Y=log(x) 是对原始数据作以e为底的对数变换。若原始数据出现0时,通常作y=log(x+1)变换。若为百分数资料应作反正弦变换,即 Y=arsin(sqrt(x)/3.14159*2*90,其中x为百分数,如50%,x=0.5。第1、2过程步 指明对原始数据x做正态性检验。第3过程 调用ANOVA过程。MODEL语句 指明以y为依变量的单因数线性数学模型(y=g),即对变换后的数据进行方差分析。这种分析亦称几何平均数的单因素方差分析。【结果分析】从正态性检验摘录的结果中可以看出,4组数据中的前3组均不满足正态性的要

44、求(p0.05),因此作变量变换是适宜的。方差分析结果(F=11.12,p0.01)表明处理间的差异极为显著,说明不同周龄鸡的抗体平均滴度(几何平均数)之间有明显的差别。由SSR法检验结果表明20周龄鸡的抗体平均滴度显著高于5周和10周龄的(p0.05);15周的 也明显高于5周的(p0.05)。若要具体说明其平均滴度时,应将上述各组平均数换算回原始的几何平均滴度,即取它们的反对数值,但显著性不变。取反对数后5、10、15、20周龄的几何平均滴度分别为17.25、126.25、158、1128。2 非编程分析(fnx)先创建(chungjin)数据集后,仿例41的SAS/ASSIST模块(m

45、kui)分析操作步骤,把其中的X改为Y,把A改为G即可。输出结果与编程法相同。4.2.2 交叉分组的两因素方差分析所谓交叉分组的两因素设计资料,是指同时考察两因素A、B对观察值的影响时,两因素中的水平(a、b)都相互搭配齐全。其处理数(水平组合数)为两因素水平数之积(ab)。当水平组合内只有一个观察值时,称无重复观察值的交叉分组资料;当水平组合内有两个或两个以上观察值时,称有重复观察值的交叉分组资料。例44为研究蒸馏水的PH值和硫酸铜浓度对化验血清白蛋白的影响,采用交叉分组,用同一种血清。每一水平组合各做一次化验,测得白蛋白与球蛋白之比例于下表,试作方差分析。表44 PH值及硫酸铜浓度对血清蛋

46、白的影响蒸馏水值硫酸铜浓度 (B)0.040.080.105.43.52.32.05.62.62.01.95.72.01.51.25.81.40.80.31 编程法分析(1)程序 options nodate nonumber;data xu4d;do a=1 to 4;do b=1 to 3;input x ;output;end; end;cards;3.5 2.3 2.0 2.6 2.0 1.9 2.0 1.5 1.2 1.4 0.8 0.3 ;proc glm;class a b;model x=a b / ss3;means a b;means a b /snk;run;(2)输出(

47、shch)结果 Dependent Variable: xSourceDFSum of SquaresMean SquareF ValuePr FModel57.510833331.5021666734.890.0002Error60.258333330.04305556Corrected Total117.76916667 R-Square Coeff Var Root MSE x Mean 0.966749 11.58130 0.207498 1.791667SourceDFType III SSMean SquareF ValuePr Fa35.289166671.7630555640.

48、950.0002b22.221666671.1108333325.800.0011 Level of AaNMeanStd DevSNK Groupinga132.600000000.79372539A1232.166666670.37859389B2331.566666670.40414519C3430.833333330.55075705D4 Level of BbNMeanStd DevSNK Groupingb142.375000000.89582364A1241.650000000.65574385B2341.350000000.78528127B3【程序(chngx)说明】循环(x

49、nhun)语句 指明(zhmng)外循环A取值14(A因素的水平(shupng)名称)B取值13(因素的水平名称),水平组合43=12,为观察值的个数。PROC语句 指明调用GLM过程,进行方差分析,若改GLM为ANOVA过程,其分析结果相同。CLASS语句 指明2个分组变量或2个自变量(即A、B两因素)。MODEL语句 定义两因素主因素模型,其效应的平方和以SS3型印出。两个MEANS语句 前者指明计算A、B两因素各水平的平均数及标准差(可有可无);后者要求计算的各水平平均数用q法进行多重比较。【结果分析】方差分析结果表明,总处理(Model)均方与误差项均方之比达到极显著水平(F=34.4

50、9,P=0.0002)。说明或A、或B、或A、B两因素的主效应都非常明显。各效应的分析表明,A、B两因素各水平间都存在明显的差异(P FModel80.128555560.016069445.440.0004Error270.079700000.00295185Corrected Total350.20825556 R-Square Coeff Var Root MSE x Mean 0.617297 12.52186 0.054331 0.433889SourceDFType III SSMean SquareF ValuePr Fa20.072072220.0360361112.210.0

51、002b20.012772220.006386112.160.1344a*b40.043711110.010927783.700.0158 Duncan GroupingMeanNaDuncan GroupingMeanNbA0.47000122A0.45833123A0.46083121A0.43083121B0.37083123A0.41250122 Least Squares Meansabx LSMEANStandard ErrorPr |t|LSMEAN Number110.415000000.02716547.00011120.490000000.02716547.00012130

52、.477500000.02716547.00013210.477500000.02716547.00014220.397500000.02716547.00015230.535000000.02716547.00016310.400000000.02716547.00017320.350000000.02716547.00018330.362500000.02716547 |t|Dependent Variable: xi/j1234567891-1.95222-1.62685-1.626850.455518-3.123550.3904441.6919251.3665550.06140.115

53、40.11540.65240.00420.69930.10220.183021.9522210.325370.325372.407739-1.171332.3426653.6441463.3187760.06140.74740.74740.02320.25170.02680.00110.002631.626851-0.325371.44E-152.082369-1.49672.0172953.3187762.9934060.11540.74741.00000.04690.14610.05370.00260.005841.626851-0.32537-144E-172.082369-1.4967

54、2.0172953.3187762.9934060.11540.74741.00000.04690.14610.05370.00260.00585-0.45552-2.40774-2.08237-2.08237-3.57907-0.065071.2364070.9110360.65240.02320.04690.04690.00130.94860.22700.370363.1235541.1713331.4967031.4967033.5790723.5139984.8154784.4901080.00420.25170.14610.14610.00130.0016.00010.00017-0

55、.39044-2.34267-2.0173-2.01730.065074-3.5141.3014810.9761110.69930.02680.05370.05370.94860.00160.20410.33778-1.69192-3.64415-3.31878-3.31878-1.23641-4.81548-1.30148-0.325370.10220.00110.00260.00260.2270.00010.20410.74749-1.36655-3.31878-2.99341-2.99341-0.91104-4.49011-0.976110.325370.18300.00260.0058

56、0.00580.37030.00010.33770.7474【程序(chngx)说明】3个循环体中,内循环把每个水平(shupng)组合内4个观察(gunch)值读给r,中循环(xnhun)和外循环各3次,把36个观察值分别读给A和B两个分组变量(自变量)。MODEL语句 定义A、B两个主效应、A*B互作效应的线性数学模型。选项指明各效应的平方和以SS3型印出。MEANS语句 要求计算A、B两因素的各水平平均数用SSR法进行多重比较。LSMEANS语句 要求依据最小误差平方法计算各水平组合的平均数 (平衡资料LSM=MEAN)。选项要求印出t检验(Ho:Lsm0) 的分母与其显著程度、各平均数

57、比较的t值及显著程度。当比较的平均数较多时,可采用本语句。否则系统不印出多重比较的结果,只印出平均数和标准差。【结果分析】方差分析结果(F=5.44,P FTermError MeanSquareVarianceComponentPercentof TotalTotal111482.250000134.750000151.104167100.0000a2662.0000001.280.3974b331.00000017.85416711.8158b3778.75000037.530.0003Error259.583333126.33333383.6068Error641.5000006.916

58、6676.9166674.5774 x Mean 18.25000000 Standard Error of x Mean 5.25198375 Dependent Variable: xSourceDFSquaresSum of Mean SquareF ValuePr FModel51440.750000288.15000041.660.0001Error641.5000006.916667Corrected Total111482.250000 R-Square Coeff Var Root MSE x Mean0.972002 14.41072 2.629956 18.25000Sou

59、rceDFType I SSMean SquareF ValuePr Fa2662.0000000331.000000047.860.0002b(a)3778.7500000259.583333337.530.0003Tests of Hypotheses Using the Type I MS for b(a) as an Error TermSourceDFType I SSMean SquareF ValuePr Fa2662.0000000331.00000001.280.3974 Duncan GroupingMeanNaA23.7541A23.2542A7.7543 Least S

60、quares Means for Effect b(a)bax LSMEANi/j1234561117.000001-5.133171.901173-6.65415.3232841.7110550.00220.10600.00060.00180.13792130.5000025.1331667.034339-1.5209410.456456.8442220.00220.00040.1791.00010.00051212.000003-1.90117-7.03434-8.555283.422111-0.190120.10600.00040.00010.01410.85552234.5000046

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论