方差分析Anova,Glm过程课件_第1页
方差分析Anova,Glm过程课件_第2页
方差分析Anova,Glm过程课件_第3页
方差分析Anova,Glm过程课件_第4页
方差分析Anova,Glm过程课件_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验六

目的与要求:(一)掌握内容1.anova和glm过程的格式2.利用anova过程或glm过程进行完全随机设计的方差分析3.anova过程或glm过程进行随机区组设计的方差分析4.SAS程序的输出结果作出合理解释(二)熟悉内容snk、Dunnett、Bonfferoni等多重比较方法在SAS中的实现本次课程幻灯片下载下载邮箱:

密码:987654321授课教师:张敏办公地点:公卫楼431(周二-周五)联系方式:

邮箱:

过程简介方差分析在SAS系统中由SAS/STAT模块来完成,其中我们常用的有ANOVA过程和GLM过程。前者运算速度较快,但功能较为有限;后者运算速度较慢,但功能强大。本章将首先介绍方差分析所用数据集的建立技巧,然后重点介绍这两个程序步。完全随机设计的方差分析表变异来源SSdfMSF组间(处理组间)

SS组间k-1SS组间/v组间MS组间/

MS组内组内(误差)

SS组内N-kSS组内/v组内总SS总N-1随机区组设计的方差分析表变异来源SSdfMSF处理组

SS处理k-1SS处理/k-1MS处理/

MS误差区组

SS区组b-1SS区组/b-1MS区组/

MS误差误差

SS误差N-k-b+1SS误差/v误差总SS总N-1二、

应用条件独立性:各样本是相互独立的随机样本;正态性:各样本来自正态总体;方差齐性:各总体方差相等。三、常用两两比较方法:SNK法Bonfferoni法Dunnett法四、方差齐性检验

F检验:适用于正态分布资料两个总体方差的齐性检验Bartlett2检验:适用于正态分布资料Levene检验:适用于任何分布资料五、方差分析所用的过程ANOVA过程(AnalysisOfVariance)GLM过程(GeneralLinearModel)procanova数据步dataaa1;inputxg@@;cards;2.79 1 3.83 2 5.41 32.69 1 3.15 2 3.47 33.11 1 4.70 2 4.92 33.47 1 3.97 2 4.07 31.77 1 2.03 2 2.18 32.44 1 2.87 2 3.13 32.83 1 3.65 2 3.77 32.52 1 5.09 2 4.26 3;proc

anova;classg;modelx=g;run;过程步2--方差分析proc

anova;classg;modelx=g;meansg;/*关于均数和标准差的统计表*/run;过程步3--方差分析同时输出统计表proc

anova;classg;modelx=g;meansg/hovtest

snkbon

;/*homogeneityofvariance*/run;过程步4--方差分析同时进行方差齐性检验

和两两比较proc

glm;/*方差分析*/classg;modelx=g;meansg/hovtestsnk;run;过程步--glm过程结果解释:1、三组数据正态性检验作出判断2、方差齐性检验:F=1.45,P=0.2567>0.05,方差齐;3、方差分析:F=4.28,P=0.0275,拒绝H0,差别有统计学意义,三组小鼠FDP酶活力不全相等。4

、两两比较:可以认为对照与水层RNA组间,对照组与酚层RNA组间均有差别,而还不能认为水层RNA组与酚层RNA组间有差别。

统计分析所用的数据格式和我们在分析整理资料时所用的格式是不同的。一般来说,数据集中应至少有一个结果变量,用于记录不同处理因素水平下观察值的大小;至少有一个处理因素变量,用于记录处理因素的类型及其水平数。以单因素方差分析为例,就应有一个结果变量和一个处理因素变量;而两因素的方差分析应有一个结果变量和两个处理因素变量。单因素方差分析(one-wayanova)分析:数据集中应该有两个变量,不妨命名为bsvalue、group。Bsvalue记录血糖的下降值,group取值1、2、3,分别代表高剂量组、低剂量组、对照组。分析数据集中变量个数(2)例9-2为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为10个区组。每个区组3只大白兔随机采用A、B、C三种处理方案,即在松止血带前分别给予丹参2ml/kg、丹参1ml/kg、生理盐水2ml/kg,在松止血带前及松后1小时分别测定血中白蛋白含量(g/L),算出白蛋白减少量如下表9-6所示,问A、B两方案分别与C方案的处理效果是否不同?两因素方差分析(two-wayanova)分析:数据集中应该有3个变量,不妨命名为albumin、group、block。albumin记录白蛋白的减少量;group取值1、2、3,分别代表A,B,C三种方案;block取值为1-10,代表10个区组。方差分析数据集的建立技巧我们可以一个一个的输入变量的值。但是方差分析的数据集其变量取值有一定的规律,因此可以利用循环语句和判断语句来简化输入。例9-1数据的整理一个一个的输入变量的值,不仅麻烦,还容易出错。下面数据的输入是我们书上附带光盘的程序,录入有个小错误,你能找出么?DATAex9_1;INPUTxgrp@@;CARDS;5.619.516.018.719.215.013.515.818.0115.5111.8116.3111.8114.614.918.113.816.1113.2116.519.21-0.625.7212.824.12-1.82-0.126.3212.729.8212.622.025.627.027.924.326.427.025.423.1212.430.937.033.931.636.433.033.932.231.132.737.836.931.539.433.837.538.4312.236.03;例9-1数据的整理看不出吧!很多同学录入错误了,自己发现不了!举手问老师,哪里错了,你帮我找找?晕……………!

加个print过程,很容易看出了!DATAex9_1;INPUTxgrp@@;CARDS;5.619.516.018.719.215.013.515.818.0115.5111.8116.3111.8114.614.918.113.816.1113.2116.519.21-0.625.7212.824.12-1.82-0.126.3212.729.8212.622.025.627.027.924.326.427.025.423.1212.430.937.033.931.636.433.033.932.231.132.737.836.931.539.433.837.538.4312.236.03;procprint;Run;例9_1:问治疗4周后,餐后2小时血糖下降值的三组总体平均水平是否不同?

解:由于是三组做比较,因此要用方差分析法。在建立数据集后可用ANOVA过程或GLM过程进行分析,同时给出选项进行各组均数的两两比较(此处用SNK法),两过程的输出格式基本一致。对于单因素的方差分析,在比较之前一般要考虑方差齐性的问题。这里可以用GLM(anova)过程中的HOVTEST选项实现,实际上这也是在SAS中做方差齐性检验的唯一途径。

proc

anova;classgroup;modelbsvalue=group;meansgroup/hovtestsnk;run;proc

glm;classgroup;modelbsvalue=group/ss1;meansgroup/hovtestsnk;run;步骤如下1编程(ANOVA)。2主要结果如下。

TheANOVAProcedureDependentVariable:bsvalueSourceDFSumofSquaresMeanSquareFValuePr>FModel2176.76497688.3824885.540.0063Error57909.87152415.962658CorrectedTotal591086.636500

TheANOVAProcedure

Levene'sTestforHomogeneityofbsvalueVarianceANOVAofSquaredDeviationsfromGroupMeansSourceDFSumofSquaresMeanSquareFValuePr>Fgroup2351.5175.80.590.5572Error5716956.3297.5

TheANOVAProcedureStudent-Newman-KeulsTestforbsvalueMeanswiththesameletterarenotsignificantlydifferent.SNKGroupingMeanNgroupA

9.195211B

5.800192BB

5.430203.3结果分析(1)建立假设,确定检验水准

H0:1=2=3,即三总体均数相等;

H1:1,2,3

不等或不全相等。 =0.05。(2)用sas8.1进行统计分析,使用anova过程进行方差分析,并进行方差齐性检验。方差齐性检验(Levene‘sTest)

F=0.59,(v1=2,v2=57),P=0.5572。可以认为三组资料方差相等。方差分析表如下

方差分析表变异来源SSvMSFp组间176.76288.385.540.0063组内909.875715.96总1086.63593结果分析

(3)结论:

F=5.54,(v1=2,v2=57),P=0.0063<0.05。

拒绝H0,接受H1。可认为三个总体平均水平不全相同,即三个总体均数中至少有两个不同。

使用snk方法进行两两比较知:第一组与第二组、第一组与第三组差别有统计学意义,第二组与第三组差别无统计学意义。ANOVA适合处理均衡数据ANOVA过程是SAS系统中用于方差分析的几个程序步之一,它适用于均衡的数据。这意味着如果按所分析的变量将观测值分类,则每个格子内的观测值数目应相同。如果数据不满足这一要求,则ANOVA过程的分析结果并不可靠,分析者应改用GLM过程来处理数据。SNK法两两比较注:为了便于理解,SAS将两两比较的结果直接用英文字母的形式标示出来。两两比较结果的最右侧是处理因素变量的取值,最左侧标以字母A、B、C等等,用以表示该处理组和其它组有无差异。如果两组有相同的字母(如2、3两组),则两者之间无差异;而如果两组间只有不同的字母,则表示两组间的差异有统计学意义。GLM过程即广义线形模型(GeneralLinerModel)过程,它使用最小二乘法对数据拟合广义线形模型。GLM过程中可以进行回归分析、方差分析、协方差分析、剂量反应模型分析、多元方差分析和偏相关分析等等,其功能之强大可见一斑。在我们所用到的范围里,GLM过程的语法结构和ANOVA过程完全相同,这可大大的方便了我们的学习。结果解释中:GLM过程的结果和ANOVA过程是雷同的――注意是雷同而不是相同。GLM过程会给出两种结果(Ⅰ类和Ⅲ类结果)。在我们用到的范围里,两种结果是完全相同的,所以用哪一种都可以。例2为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为10个区组。每个区组3只大白兔随机采用A、B、C三种处理方案,即在松止血带前分别给予丹参2ml/kg、丹参1ml/kg、生理盐水2ml/kg,在松止血带前及松后1小时分别测定血中白蛋白含量(g/L),算出白蛋白减少量如下表9-6所示,问A、B两方案分别与C方案的处理效果是否不同?两因素方差分析(two-wayanova)dataaa2;dotreat=1

to

3;doblock=1

to

10;inputx@@;output;

end;end;cards;2.212.323.151.862.561.982.372.883.053.422.912.643.673.29

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论