




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章多个样本均数比较的
Analysisofvariance(ANOVA)4/8/20231医学统计学--供研究生用方差分析方差分析的基本思想完全随机设计的单因素随机区组设计的两因素方差分析交叉设计的方差分析多个样本均数间的多重比较2第一节方差分析的基本思想用途:检验3组及以上总体均数是否相等。通过分析处理组均数之间的差别,推论它们所代表的k个总体均数间是否存在差别,或k个处理组间的差别是否具有统计学意义。3全部实验结果存在三种不同的变异总变异:全部实验数据大小不等。变异的大小用观察值与总均数的离均差平方和表示,记为SS总组间变异:各处理组的样本均数也大小不等,变异的大小用各组均数与总体均数的离均差平方和表示,记为SS组间。组内变异:各处理组内部观察值也大小不等,可用各处理组内部每个观察值与组均数的离均差平方和表示。记为SS组内。5总变异=组间变异+组内变异总变异:组间变异:组内变异:总=N-1组间=k-1组内=N-k6F=MS组间/MS组内如果:各样本均数来自同一总体(H0:m1=m2==mk),即各组均数之间无差别。则:组间变异与组内变异均只能反映随机误差,此时:F值应接近1。反之,若各样本均数不是来自同一总体,组间变异应较大,F值将明显大于1,则不能认为组间的变异仅反映随机误差,也就是认为处理因素有作用。7方差分析的基本思想根据资料的设计类型,将全部观察值总的离均差平方和及自由度分解为两个或多个部分,除随机误差(如SS组内)外,其余每个部分的变异(如SS组间)可由某个因素的作用(或某几个因素的交互作用,如A因素×B因素)加以解释。通过比较不同变异来源的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。9方差分析对数据的基本假设
(方差分析的应用条件)任何两个观察值之间均不相关每一水平下的观察值均来自正态总体各总体方差相等,即方差齐性(homogeneityofvariance)10第二节完全随机设计资料的
单因素方差分析在实验研究中,将受试对象随机分配到一个研究因素的多个水平中去,然后观察实验效应。在观察研究中,按某个因素的不同水平分组,比较该因素的效应。如比较糖尿病患者,IGT异常和正常人的载脂蛋白有无差别(人群这个研究因素分为3个水平)。如将30名乙型脑炎患者随机分为三组,分别用单克隆抗体、胸腺肽和利巴韦林三种药物治疗(药物这个研究因素分为3个水平),观察治疗后的退热时间。11二、变异分解:例:某社区随机抽取了30名糖尿病患者(11例),IGT异常(9例)和正常人(10例)进行载脂蛋白(mg/dL)测定,问三种人的载脂蛋白有无差别?131.完全随机设计方差分析中变异的分解
总变异=组间变异+组内变异表糖尿病患者、IGT异常及正常人的载脂蛋白测定结果糖尿病IGT正常人85.7096.00144.00105.20124.50117.00………111.0099.00159.00106.50120.00115.00均数105.45(11)102.39(9)122.80(10)X=110.3142.分析计算步骤建立检验假设和确定检验水准H0:三种人载脂蛋白的总体均数相等,即m1=m2=m3H1:三种人载脂蛋白的总体均数不全相等=0.05计算检验统计量F值15表糖尿病患者、IGT异常及正常人的载脂蛋白测定结果糖尿病IGT正常人∑Xij
116011105.45123509.5912.59102.3996045.412283309.51030122.80110.3153420372974.9niX∑Xij2
C=3309.52/30=365093
(校正数)SS总=372974.87-365093=7881.87SS组间=11602/11+921.52/9+12282/10-365093=2384.03SS组内=SS总-SS组间=7881.87-2384.03=5497.8417
确定P值和作出推断结论查附表3F界值表(P522),1=2,2=27F0.05(2,27)=3.35,F0.01(2,27)=5.49本例F=5.85>F0.01(2,27),故P<0.01。可认为三种人的载脂蛋白不同。方差分析计算表变异来源SSMSFP组间2384.0321192.015.85<0.01组内5497.8427203.62总7811.872918以上结论表明总的来说三种人的载脂蛋白有差别,但并不表明任何两种人的载脂蛋白均有差别。要了解哪些组均数间有差别,需进一步作两两比较。当k=2时,对同一资料,F=t2。19一、随机区组设计如何分组:先将全部受试对象按某种或某些特征分为若干个区组(block),使每个区组内的观察对象随机地接受研究因素某一水平的处理。由于区组内的个体特征比较一致,减少了个体差异对结果的影响。21
表A、B、C三种营养素喂养小白鼠所增体重区组号A营养B营养C营养均数150.1058.2064.5057.60Xij247.8048.5062.4052.90…761.9053.0051.2055.37842.2039.8046.2042.73均数53.9053.9559.1455.6622二、变异分解随机区组设计方差分析中变异的分解:
SS总=SS处理+SS区组+SS误差232.分析计算步骤建立检验假设和确定检验水准H0:三种营养素喂养的小白鼠体重增量相等,即m1=m2=m3H1:三种营养素喂养的小白鼠体重增量不全相等=0.05计算检验统计量F值25表随机区组设计方差分析的计算公式26一般而言,随机区组设计较成组设计更容易检验出处理组间的差别,提高了研究效率。但不是在任何情况下都能提高研究效率。区组效应是否具有统计学意义是重要的,它表明区组的划分是否成功,即达到:区组内各实验单位很均匀,而不同区组内的实验单位具有很大差异。如果区组效应无统计学意义,则并不能提高研究效率,甚至会降低研究效率。(如果MS区组<MS误差)若没有足够理由显示不同区组间的差别确有统计学意义,则宁可不分区组。29第四节
交叉设计资料的方差分析在医学研究中,将A、B两种处理先后施加于同一批受试对象,先随机的将一半的受试对象接受A后接受B,而另外一半则相反,先接受B再接受A,将两种处理因素在全部试验过程中交叉进行,故称之为交叉设计(cross-overdesign)。30交叉设计是一种特殊的自身对照设计克服了试验前后自身对照由于观察期间各种非试验因素对试验结果的影响所造成的偏移。31交叉设计的优点:1.节约样本含量2.控制了时间因素以及个体差异对处理方式的影响3.每一个试验对象同时接受试验因素和对照,从医德的观点出发,均等考虑了每一个患者的利益32交叉设计的缺点:不允许有病人失访,否则会造成该个体已有的数据完全浪费不适用于病程较短的急性病治疗效果的研究33交叉设计的限制条件前一个试验阶段的处理效应不能持续作用到下一个试验阶段洗脱时间(washouttime):目的是消除残留效应(carry-overeffect)34例题为了研究12名高血压病人用A、B两种治疗方案疗效的差别,随机的让其中6名病人先以A法治疗,后以B法治疗,而另外一半的6名病人则先用B法,后用A法,记录治疗后血压的下降值(KPa),请分析A、B两方案疗效有无差别。35二阶段交叉设计变异的来源:1.处理(药物)效应2.阶段效应3.顺序效应和个体差异其中处理效应是希望研究的因素,而顺序效应则在目前常用的统计分析中被忽略,因为这是交叉设计能够实施的前提条件。
保证顺序效应忽略的办法,就是消除残留效应。4.误差36例:12例高血压病人交叉设计资料阶段123456789101112IBBABAAAABBBA3.071.334.441.873.203.734.131.071.072.273.472.40IIAABABBBBAAAB2.801.473.733.602.671.602.671.731.471.873.471.7337第五节拉丁方设计
(latinsquaredesign)拉丁方设计是将三个因素(一个处理因素+两个控制因素)按水平数r排列成一个r×r的随机方阵。如3×3、4×4拉丁方。38常用拉丁方表ABCCABBCAABCDBADCCDBADCAB将两个控制因素分别安排在拉丁方设计的行和列上,需对基本拉丁方表作行列变换。39拉丁方设计的优点:与随机区组相比较,可以多安排一个控制因素,增加了均衡性,减少了误差,提高了效率。40例4-5
比较A、B、C、D、E、F6种药物给家兔注射后产生的皮肤疱疹大小(mm2),研究者选用6只家兔、并在每只家兔的6个不同部位进行注射。试验结果见下表,试做拉丁方设计和方差分析。41家兔编号(行区组)注射部位编号(列区组)1234561A(73)B(75)C(67)E(61)D(69)F(79)2B(83)A(81)E(99)F(82)C(85)D(87)3E(73)D(60)F(73)C(77)B(68)A(74)4F(58)C(64)B(64)D(71)A(77)E(74)5C(64)F(62)D(64)A(81)E(85)B(71)6D(77)E(75)A(73)B(59)F(85)C(82)拉丁方设计与试验结果(皮肤疱疹大小,mm2)
拉丁方设计与随机区组区别42拉丁方设计变异的来源:1.处理组变异2.行区组变异3.列区组变异4.误差其中处理效应是希望研究的因素。43第四节多个样本均数间的多重比较multiplecomparison概念无效假设的两种情况常用方法44一、概念指出哪几组均数之间的差别具有或不具有统计学意义。当对比组数大于2时,为什么不能用t检验?因为会增加第一类错误的概率,使本来无无差别的两总体均数判为有差别。如有5个样本均数,可作10次t检验。每次不犯第一类错误的概率为1-0.05=0.95。每次比较均不犯第一类错误的概率仅为0.9510=0.5987,每次犯第一类错误的概率为1-0.5987=0.4013,明显增加了犯第一类错误的概率。45二、无效假设的两种情况检验某几个特定总体均数是否相等,其无效假设称为部分无效假设。检验全部k个总体均数是否相等,其无效假设称为完全无效假设。461.检验某几个特定总体均数是否相等H0:i=j(ij)在试验设计阶段就根据研究目的或专业知识决定了某些均数间的两两比较,常用于事先有明确研究假设的证实性研究。如
多个处理组与对照组比较;处理后不同时间与处理前比较;几个特定的处理组间比较472.检验全部k个总体均数是否相等H0:1=2=...=k。在研究设计阶段对实验结果知道不多的探索性研究,或经数据结果的提示后,才决定作多个均数间的两两比较。一般涉及到每两个均数的两两比较。48三、常用方法BonferroniTukeyDunnett-t检验Tamhane’sT2LSD-t检验(leastsignificantdifference)SNK-q检验(Student-Newman-Keuls)49SPSS统计软件中的两两比较方法501.LSD-t检验Leastsignificantdifferencettest,最小有意义差异,比较k组中一对或几对在专业上有特殊意义的均数差值的总体均数是否为“0”;51LSD-t检验公式以误差自由度误差(或组内)和检验水准查t界值表缺点:没有调整多重比较的检验水准,比较的次数愈多,犯I类错误的可能性愈大。522.Dunnett-tk-1个实验组与一个对照组均数差别的多重比较。根据算得的t值,误差自由度误差,试验组数k-1,以及检验水准查Dunnett-t界值表,作出推断结论。533.SNK-q检验Student-Newman-Keuls,q检验一般在方差分析结果拒绝H0时,再用q检验进行多重比较缺点:没有调整多重比较的检验水准,比较的次数愈多,犯I类错误的可能性愈大。54组次123
均数102.39105.45122.80
组别IGT异常糖尿病患者正常人表三个样本均数两两比较的q检验对比组两均数之差标准误q值组数q界值0.050.01P值1与3-20.414.63614.402433.494.45<0.051与2-3.064.53500.674822.893.89>0.052与3-17.354.40873.935422.893.89<0.01例将3个样本均数从小到大排序:554.Bonferroni样本组数不宜过多,样本数一般≤4,这时的检验效率高于Tukey法。调整了多重比较时的检验水准:
=/比较的总次数,当计算所得的t≥t(,)时,则以P<称所比较的两组均数的差别有统计学意义。是SPSS统计软件推荐的方法565.Tukey当比较的样本数大于5时,检验效率高于Bonferroni。当样本数为5时,要作10次两两比较;当样本数为6时,要作15次两两比较调整了多重比较时的检验水准,是SPSS统计软件推荐的方法57BonferroniandTukeyTheBonferroniandTukeyshonestlysignificantdifferencetestsarecommonlyusedmultiplecomparisontests.58BonferroniTheBonferronitest,basedonStudentststatistic,adjuststheobservedsignificancelevelforthefactthatmultiplecomparisonsaremade.Forasmallnumberofpairs,Bonferroniismorepowerful.59TukeyTukeyshonestlysignificantdifferencetestusestheStudentizedrangestatistictomakeallpairwisecomparisonsbetweengroupsandsetstheexperimentwiseerrorratetotheerrorrateforthecollectionforallpairwisecomparisons.Whentestingalargenumberofpairsofmeans,TukeyshonestlysignificantdifferencetestismorepowerfulthantheBonferronitest.60容易得出有统计学意义结论的,依次为:LDS(最容易)SNKTukeybonferroni(最不容易)616.方差不齐时的两两比较Tamhane’sT2法:Conservativepairwisecomparisonstest(保守的两两比较检验,I类错误小)basedonattest.Thistestisappropriatewhenthevariancesareunequal.Dunnett’sT3Games–HowUDunnett’sC62多个方差的齐性检验
LeveneTestAhomogeneity-of-variancetestthatislessdependentontheassumptionofnormalitythanmosttests.Foreachcase,itcomputestheabsolutedifferencebetweenthevalueofthatcaseanditscellmeanandperformsaone-wayanalysisofvarianceonthosedifferences.63SPSS操作与结果解释方差分析64建立SPSS数据工作表
g:分组(1:糖尿病;2:IGT;
3:正常人)
X:载脂蛋白表糖尿病患者、IGT异常及正常人的载脂蛋白测定结果糖尿病IGT正常人85.7096.00144.00105.20124.50117.00………111.0099.00159.00106.50120.00115.00均数105.45(11)102.39(9)122.80(10)一、完全随机设计方差分析的SPSS652.选用SPSS过程66One-wayANVOA对话框
将x选入DependentList栏,
g选入Factor栏67单击PostHoc…按钮68选择Bonferroni,单击Continue返回√69选择Descriptive,Homogeneity…
单击Continue返回70单击OK按钮运行ANOVA过程713.结果解释
三组均数(mg/dL)依次为:
正常人(122.80)、糖尿病患者(105.46)
和IGT患者(102.39)。72经方差齐性检验,P=0.548,
按=0.05水准,还不能认为3个总体方差不等。73经完全随机设计的单因素方差分析,F=5.85,P=0.008,可认为三种人的载脂蛋白不同。74经Bonferroni检验,正常人与糖尿病患者(P=0.029)、正常人与IGT患者(P=0.013)载脂蛋白的差别有统计学意义75二、随机区组设计的两因素方差分析在不同的室温下测定家兔的血糖浓度。室温分七组,家兔分四个种属,每一种属七只。问不同温度的血糖浓度有无差别及不同水平血糖浓度均数的变化趋势?家兔种属室温5101520253035Ⅰ1301108282110120140Ⅱ12013011083100140160Ⅲ150140100110120120160Ⅳ1201007482100110130761.建立SPSS数据工作表家兔种属室温5101520253035Ⅰ1301108282110120140Ⅱ12013011083100140160Ⅲ150140100110120120160Ⅳ120100748210011013077求不同温度的血糖浓度均值
AnalyzeComparemeansMeans781.选用SPSS过程:Analyze
GeneralLinearModelUnivariate79在Univariate对话框,将血糖浓度选入DependentVariable栏;将室温选入Fixfactors栏;将家兔种属选入Randomfactors栏80单击Model按钮81选择Custom82将室温和家兔种属选入Model栏,从下拉菜单选择Maineffents(因不能分析交互作用)。单击Continue返回。83单击PostHoc按钮84将变量:室温选入PostHocTestsfor栏,以便进行两两比较。由于组数多,选择Tukey进行两两比较。单击Continue按钮返回85单击OK按钮863.SPSS结果解释:Means过程显示不同室温的均值:可见从5分钟(130.0mg%)到20分钟(89.3mg%),血糖均值由高逐渐降低;从20分钟(89.3mg%)到35分钟(147.5mg%),血糖均值由低逐渐升高。873.SPSS结果解释88经随机区组设计的两因素方差分析:不同室温血糖浓度的差别有统计学意义(F=19.12,P=0.000)不同家兔种属血糖浓度的差别也有统计学意义(F=10.02,P=0.000)89期望均方表(可不看该结果)90Tukey检验结果(1)91Tukey检验结果(2)92Tukey法的均衡子集表93三、交叉设计方差分析的SPSS例4-6分析A、B两种闪烁液测定血浆中3H-cGMP的交叉试验结果。第I阶段1、3、4、7、9号用A测定,2、5、6、8、10号用B测定;第II阶段1、3、4、7、9号用B测定,2、5、6、8、10号用A测定。试对交叉试验结果进行方差分析。941.建立数据库95交叉设计方差分析的Spss过程AnalyzeGeneralLinealModelUnivariateDependentlist:X
FixedFactor框:treatphaseRandomFactor框personModel⊙Custo
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村种植租地合同范本
- 农药委托加工合同范本
- 餐饮转让店面合同范本
- 消防包工简易合同范本
- 公司产权房合同范本
- 蔬菜种苗合同范本
- 建筑劳务合作合同书
- 撮合融资服务合同范本
- 有限空间安全知识培训
- 财务知识培训课件
- DB37∕T 5130-2018 建设工程造价咨询服务规范
- DB37T 3953-2020 医疗卫生机构安全风险分级管控体系实施指南
- 腕管综合征护理查房
- 苏教版六年级下册数学 第一、二单元 跟踪检测卷 扇形统计图 圆柱和圆锥
- 小学教育学详细讲义(黄济)
- 信息发布系统深化设计方案
- 《实践论》(原文)毛泽东
- 水轮发电机常识
- 箱变安装施工方案77341
- 家谱宗谱WORD模板
- 日本仿效唐制的变革PPT课件
评论
0/150
提交评论