第五章方差分析_第1页
第五章方差分析_第2页
第五章方差分析_第3页
第五章方差分析_第4页
第五章方差分析_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 五 章 方差分析上海交大医学院生物统计学教研室概论n方差分析(analysis of variance,简记为:anova) 的原理即方差可以分解n方差计算即标准差平方。n固定时方差取决于离均差平方和(ss)) 1/()(2nxx方差分析检验思想n备择假设:总体组间均值无差别组内方差组间方差,如二者比值远大于1(与f界值相比),有统计学意义,可得出组间均值有差值的结论。n目的是检验均值有无差别有无统计学意义,通过将方差分解为误差项和效应(均值差别所致)项,计算f值,如有统计学意义则认为均值差别有统计学意义ss分解示例为何不作t检验n减少i型误差如两组比较作一次t检验取=0.05; 三组之间

2、的两两t检验作三次t检验,至少有一次拒绝h0的概率为0.14。 五组之间的两两t检验作十次t检验,至少有一次拒绝h0的概率为0.40。 两组以上均数的比较不能用两两t检验,而必须用方差分析。n多个影响因素时,检验每个因素时控制其它因素的影响,提高检验效能。两个分组因素时n考虑性别时,误差项ss8n不考虑时,ss20第一节第一节 常用术语常用术语n反应变量(dependent variable)和自变量(independent variable)反应变量也被称为因变量、结果变量,它是欲分析的主要观测指标。自变量是自由取值的变量。自变量影响因变量的取值。n因素和水平(factor and leve

3、r)因素就是指对反应变量有影响的分类变量。分类变量的不同取值就是水平。n处理单位(treatment unit)各因素的各种水平的组合为处理,每个组合就形成一个单元格,每个单元格就是一个处理单位。n元素(element)元素是用于观测反应变量最小的观测单位常用术语常用术语n均衡(balance)在一个实验设计中如果每个单元格中的出现的试验次数相等,则称这个设计是均衡的,反之,则是不均衡的。n协变量(covariate)对反应变量有影响的数值型变量就是协变量n交互作用(interaction)当一个因素的作用随另外一个因素水平的改变而改变,则这两个因素之间存在交互作用.n固定因素和随机因素(fi

4、xed factor and random factor)在一个研究设计中,如果所选择的因素水平是此因素的所有水平,则这个因素就是固定因素,如果所涉及到因素的水平只是在此因素所有水平中随机抽取的一部分,如果重复此研究,则这个因素所抽取的水平和前一次研究是不同的。则这个因素就是随机因素。方差分析的条件n(1)可加性:可加性要求总变异度可被分解成若干部分变异,每一部分根据变异的来源都有特定的含义。n(2)方差齐性:各处理组总体方差相等。n(3)正态性:各样本来自正态总体。n(4)独立性:各样本是相互独立的随机样本。此外,分析的观测指标,即反应变量必须是数值型变量,如不符合基本要求时,可进行变量变换

5、,变换成正态分布后再进行检验或用非参数检验的方法。第二节 单因素方差分析n(one-way anova, completely random design anova)方差分析步骤n1、建立假设检验,确定检验水准h0:各组总体均数相同h1:各组总体均数不相同或不全相同n2、计算检验统计量 总变异=组间变异+组内变异 组间变异反映了处理因素和随机误差对个体观测值的影响,组内变异反映了个体观测值的随机误差。因而亦可表达成如下等式:总变异=处理因素变异+随机变异 因而处理因素是否有作用,就是和随机变异进行比较,大于随机变异,就说明处理因素有作用,不大于随机变异,处理因素就无作用。n3、下结论方差分析

6、计算步骤离均差平方和用ss表示,自由度用df表示,均方(mean square)用ms表示 ms=ss/df 即方差。 ss总=ss组间+ss组内 df总=df组间+df组内 f=ms组间/ms组内 = (ss组间/ df组间)/( ss组内/ df组内) 根据f和df组间,df组内查方差分析用f界值表,得p值。如p0.05,拒绝h0 。方差分析步骤 方差分析表 变异来源 平方和 自由度 均方 f值 p值 source ss df ms f p 总变异 组间 误差 方差分析结果解释例5.1。第三节 方差齐性检验h0: 各个正态总体方差相等,即12= 22 = k2h1: 至少存在一对i,j,有

7、i2 j 2levene检验 (1)对于k组的样本资料, 求得各组的均数后计算观察值距各自组均数的绝对离差。(2) 以绝对离差作为主要变量,使用前述的方差分析法。当拒绝h0时,认为各组方差不齐;当不拒绝h0时,认为方差齐性。第四节 均数间多重比较n1、snk(student-newman-keuls)检验:又称为q检验,是运用最广泛的一种两两比较方法。它采用student range 分布进行所有各组均值间的比较。在sas的输出结果中给出在设定的 的水平上两组之间是否有差异,而不给出检验统计量和p值。n2、lsd(least significant difference)检验:即最小显著差异法

8、,它没有控制总的 水平,因而随着比较次数的增多,犯一类错误的概率就逐渐增大,因而是最敏感的两两比较的方法。n3、bonferroni检验:也是运用比较广泛的一种两两比较方法,它通过设定每次比较的 水平来控制总的犯一类错误的水平(预先设定),=/k,k为两两比较的总次数。因而bonferroni是最保守的检验方法。n4、dunnett检验:它是多个试验组和一个对照组的比较,此检验法同样控制总的犯一类错误的水平 (预先设定)。在sas程序中需要指定对照组的水平。n5、 检验:它的检验结果是和f检验一致的,即经f检验多个样本均数间有差别,则 检验一定可以找出差异,而如果f检验多个样本均数间无差别,

9、检验也会检验出有差别,但是对于别的两两检验的方法,就不会这样保持一致了。n6、多项式比较:这种比较可根据试验目的,基于正交的原理上,通过设定检验水平的系数对各组均数之间进行不同方式的线性比较,而不拘泥于上述的两两比较方法。scheffe s 第五节 变 量 变 换1.服从对数正态分布的资料可用对数变换 y=log(x)2.服从泊松分布的资料可用平方根变换 y= x3.表达成百分数的资料可用平方根反正弦变换 y=arcsinx第六节第六节 随机区组设计方差分析随机区组设计方差分析randomized block design anova 又称随机单位组设计, 随机配伍组设计,它是两样本配对试验的

10、扩大。 单位组 处理1 处理2 . 处理k 1 x11 x12 x1k 2 x21 x22 x2k 。 b xb1 xb2 xbk 随机区组设计n 试验设计时,先将受试对象按其它控制因素性质相同或相近者组成单位组,n每个单位组有k个受试对象,分别随机分配至因素的k个水平上。n这时每个水平的受试对象不仅数量相同, 而且性质亦相同或相近,就能缩小误差,提高实验效率。这样的设计可将单位组亦看作一个因素,就成为二个因素的设计n总变异分解为因素i、单位组和误差三项n条件是残差满足正态分布 第七节 拉丁方设计方差分析latin square design anovan欲比较一个因素中k个水平的各均数,同时

11、要控制另二个因素作用时,可用拉丁方设计。n用k个拉丁字母排列成k行k列的方阵,使每行,每列中每个字母仅出现1次, 这样的方阵称为拉丁方。拉丁方设计方差分析拉丁方设计实际上是一种特殊类型的三因素试验设计,三个因素的水平数必须相同。 (1)首先根据水平数选定拉丁方。 (2)再随机交换拉丁方的行或列。 (3)然后将三个因素分别放置于拉丁方的行, 列 及字母上面,主要考察因素放置于字母上。 (4)根据设计进行试验,把试验结果记入相应位置。 (5)进行方差分析,得出结论。 处理因素为药物复方1复方2可待因处理因素为药物不同浓度控制因素为动物种系单因素方差分析随机区组设计方差分析拉丁方设计方差分析拉丁方设

12、计方差分析防护服a、b、c、d、e受试者甲、乙、丙、丁、戊试验日期1、2、3、4、5第八节 析因设计的方差分析factorial design anova 析因设计是一种多因素的交叉分组试验设计。由于进行了交叉设计,同时每组又有重复,因此可检验各因素间的交互作用(interaction)。重复数可以相等也可以不相等,一般地说,重复数相等时,效率最高第七节 析因设计的方差分析最简单的析因设计是22析因设计。有二个因素,每个因素分二个水平。因素a:分a1和a2二个水平; 因素b:分b1和b2二个水平;分四个处理组:a1b1,a1b2,a2b1和a2b2。每个处理组做若干次试验。交互作用 当二个因素

13、的作用相互独立时,称这二个因素无交互影响;当二个因素的作用不独立,而相互有影响时,称这二个因素有交互影响。当存在交互影响时表示一个因素各水平间的差异随着另一个因素的水平改变而不同;当不存在交互影响时,则各个因素独立, 即一个因素水平改变时不影响另一个因素的各水平之效应。因素a和因素b的交互作用记为ab。n 交互作用:几个因素联合作用不等于这几个因素单独作用的累加(有的情况是相乘),称这几个因素间存在交互作用,否则称为不存在交互作用或称为这几个因素相互独立。 因素1引起的变异(甲药) 因素2引起的变异(乙药) 总变异 因素1和因素2的交互作用引起的变异 误差 可作三个假设检验。第七节 析因设计的

14、变异分解协方差分析(analysis of covariance)n协方差分析是把直线回归和方差分析结合起来的一种统计分析方法。n当不同处理结果的y值还受自变量x的影响时,先找出y与x的直线关系,求出把x值化为相等后y的修正均数,然后进行比较,n这样就能消除x对y的影响,更恰当地评价各种处理的作用。例7.1051015202530350100200300400进食量体重增加量051015202530350100200300400进食量体重增加量协方差分析步骤:(1)各处理组分别拟合直线回归方程(2)比较各处理组的斜率,求公共回归系数。公共回归系数通过公式jjjxbya111938. 061.2

15、6xy221938. 094.28xy总变异可由可由x解释的变异解释的变异误差引起的变异误差引起的变异协方差分析三个重要的假设:1.各组样本来自正态总体,且方差齐性2.总体回归系数不等于03.各组的总体回归系数差异不显著。总变异协变量处理误差例题n随机将学生分到两个组,一组选用一本教材,教学后比较两组成绩n此时iq对成绩是有影响,为使该试验检验效能更高,可以以iq为协变量协方差分析提示n如iq和成绩确实相关,控制iq影响后可降低误差项ss,f值变大,提高检验效能n如f值变小,可能协变量与因变量不相关,且与研究因素相关,此时协变量不仅不能从误差项分走ss,而且会从组间项分走ss。niq是学期末测

16、定的,且两种教材差别较大,使两组学生成绩和iq提高也不同。此时控制iq影响后,也去除了教材对成绩的真正影响n协变量与研究因素间交互作用n一种教材适合iq高的同学,另一种适合iq低的同学,第一组中iq和成绩是正相关,第二组中iq和成绩是零相关或负相关。n可有多个协变量方差分析的sas程序 可用于各种方差分析的sas过程较多,常用的有二个过程:nanova过程:只用于单因素方差分析及各种平衡设计资料(即各组例数相等)的方差分析。nglm(general linear model)过程:用于各种试验设计的方差分析和协方差分析。n glm过程可完全替代anova过程的作用,并且语句相同。nmixed过程单因素方差分析程序拉丁方方差分析程序析因设计方差分析程序随机区组方差分析程序data a; do group=1 to 2; input n; do i=1 to n; input x y; output; end; end;cards;8209.3 11.2 252.4 26.1 241.5 13.2 259.1 24.4201.1 18.8 287.5 31.0 286.6 27.9 255.7 20.87286.9 27.2 302.1 30.6 246.8 15.4 273.2 24

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论