多组均数间比较的方差分析_第1页
多组均数间比较的方差分析_第2页
多组均数间比较的方差分析_第3页
多组均数间比较的方差分析_第4页
多组均数间比较的方差分析_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于多组均数间比较的方差分析第一页,共七十六页,2022年,8月28日第一节方差分析(一):

单向方差分析第二页,共七十六页,2022年,8月28日一、方差分析(analysisofvariance,ANOVA)的基本思想把全部数据关于总均数的离均差平方和分解成几个部分,每一部分表示某一影响因素或诸影响因素之间的交互作用所产生的效应,将各部分均方与误差均方相比较,依据F分布作出统计推断,从而确认或否认某些因素或交互作用的重要性。第三页,共七十六页,2022年,8月28日二、完全随机设计的单因素方差分析完全随机化设计(completelyrandomdesign):在实验研究中,将全部观察对象随机分入k个组,每个组给予不同的处理,然后观察实验效应。在调查研究中,按某个因素的不同水平分组,比较该因素的效应。第四页,共七十六页,2022年,8月28日

第1组第2组···第k组X11X12···X21X22Xk1Xk2······X1n1X2n2Xknk

n1n2nkXNXij为第i个处理组的第j个观察值,i=1,2,···,g,j=1,2,···,nk;为第i个处理组的均数

为总均数,第五页,共七十六页,2022年,8月28日1.总变异,总=N-12.组间变异,组间=k-1

均方MS组间=SS组间/

组间3.组内变异,组内=N-k

MS组内=SS组内/

组内4.三种变异的关系:

=0第六页,共七十六页,2022年,8月28日总=N-1=(k-1)+(N-k)=组间+组内

H0:1=2=···=

k

F=MS组间/

MS组内

F服从自由度组间=k-1,组内=N-k的F分布,表示为F~F(组间,组内)若F

F(组间,组内),P>,不拒绝H0;若F

F(组间,组内),P,拒绝H0,接受H1。

第七页,共七十六页,2022年,8月28日注1:

H0:1=2=···=

kH1:1,2,

···,

k不全相等,不能用12

···

k表示。注2:优点(1)不受比较的组数限制;(2)可以同时比较多个因素的作用,以及因素间的交互作用。注3:条件(1)各组样本是互相独立的;(2)各样本来自于正态总体;(3)方差齐性。第八页,共七十六页,2022年,8月28日例8.1有3种解毒药:A,B,C,同时设一个空白对照D.受试大白鼠共24只,用完全随机化方法将它们等分成4组,每组接受一种药物.试比较不同解毒药的解毒效果.

应用不同解毒药的大白鼠血中胆碱酯酶含量组号胆碱酯酶含量(Xij)ni

1231218162814611118.52233.02283123242834616828.04790.03142417191622611218.72162.048122119141568914.81431.0合计2448020.010616.0第九页,共七十六页,2022年,8月28日(1)建立检验假设,确定检验水准。H0:各组大白鼠血中胆碱酯酶含量的总体均数相等H1:各组大白鼠血中胆碱酯酶含量的总体均数不全相等=0.05(2)选定检验方法,计算检验统计量。第十页,共七十六页,2022年,8月28日

===SS组间(SS处理)SS组内(SS误差)====10616-4802/24=1016.0=SS总

-

SS组间==447.67=1112/6+1682/6+1122/6+892/6-4802/24=568.33第十一页,共七十六页,2022年,8月28日总=N-1=24-1=23组间=k-1=4-1=3组内=N-k=24-4=20MS组间=SS组间/

组间=568.33/3=189.44MS组内=SS组内/

组内=447.67/20=22.38F=MS组间/

MS组内=189.44/22.38=8.46

方差分析结果变异来源SSMSFP组间组内总568.33447.671016.0032023189.4422.388.46<0.05(3)确定P值和作出推断结论:

F0.05(3,20)=3.10,F=8.46>F0.05(3,20),P<0.05。在=0.05水准上拒绝H0,接受H1,可以认为各组大白鼠血中胆碱酯酶含量的总体均数不全相等.第十二页,共七十六页,2022年,8月28日三、多个样本均数间的

多重比较第十三页,共七十六页,2022年,8月28日(一)LSD-t检验最小显著差异t检验(leastsignificantdifferencettest)第十四页,共七十六页,2022年,8月28日适合于某几个特定的总体均数间的比较。按算得的t值,以及误差和检验水准查t界值表,作出推断结论。如tt/2,则在水准上拒绝H0。与一般t检验的不同:1)MS误差代替Sc2;2)自由度为N-k,比成组比较中的n1+n2-2大得多,易于检出均数之差的显著性。当各处理组例数相等时,,最小显著差数

当|XA-XB|LSD时,则P,则可认为被比较的两组总体均数之间有显著性差别。第十五页,共七十六页,2022年,8月28日(二)Dunnett-t检验

适用于k-1个试验组与一个对照组均数差别的多重比较。

查Dunnett-t界值表。

当各组例数相等时,第十六页,共七十六页,2022年,8月28日(三)SNK-q检验用于多个样本均数间每两个均数的比较。第十七页,共七十六页,2022年,8月28日

当各组例数相等时,在比较时,将均数从大到小或从小到大依次排列,根据计算所得q值,组间跨度a,误差自由度误差和检验水准查q界值表,如qq(a,)

,则在水准上拒绝无效假设。第十八页,共七十六页,2022年,8月28日四、方差分析的假定条件1.观察值Xij独立来自正态分布的总体;2.方差齐性。第十九页,共七十六页,2022年,8月28日方差齐性检验1.提出检验假设;2.计算每一组的中位观察值mdi;3.计算各组内个体观察值与中位观察值之差的绝对值dij;

dij=|Xij-mdi|4.用dij作单向方差分析。第二十页,共七十六页,2022年,8月28日五、SPSS演示第二十一页,共七十六页,2022年,8月28日完全随机设计资料的方差分析,例8.1

ViewVariable:ViewData:第二十二页,共七十六页,2022年,8月28日AnalyzeCompareMeansOne-WayANOVA…Dependentlist:xFactor:gPostHoc…EqualVariancesAssumed:S-N-KContinueOptions…Statistics:HomogeneityofvariancestestContinueOK第二十三页,共七十六页,2022年,8月28日第二十四页,共七十六页,2022年,8月28日第二节方差分析(二):

双向方差分析第二十五页,共七十六页,2022年,8月28日一、随机区组设计的两因素方差分析随机化区组设计(randomizedblockdesign):将全部受试对象按某一个重要的属性(即区组因素)分组,把条件最接近的a个受试对象分在同一个区组内,然后用完全随机的方法,将每个区组中的全部受试对象分配到a个组中去。第二十六页,共七十六页,2022年,8月28日例9.1采用随机区组设计方案,以窝作为区组标志,给断奶后的小鼠喂以三种不同的营养素A、B和C。四周后检查各种营养素组的小鼠所增体重(g)。资料见下表,试比较不同营养素对小鼠体重增加的差别。

第二十七页,共七十六页,2022年,8月28日

三种营养素喂养四周后各小鼠所增体重(g)

营养素分组(i)按区组求和

1(A)2(B)3(C)nj

157.064.876.03197.8255.066.674.53196.1362.169.576.53208.1474.561.186.63222.2586.791.894.73273.2642.051.843.23137.0771.969.261.13202.2851.548.654.43154.5ni88824500.7523.4567.01591.162.665.370.966.332783.435459.142205.0110447.5

区组(j)第二十八页,共七十六页,2022年,8月28日1.变异的分解===SS处理SS区组SS误差其中:,N=na

,i=1,2,

···,a,j=1,2,

···,n总=N-1=(a-1)+(n-1)+(a-1)(n-1)===处理区组误差第二十九页,共七十六页,2022年,8月28日2.分析计算步骤(1)建立检验假设和确定检验水准H0:三种营养素喂养的小鼠体重增量相等H1:三种营养素喂养的小鼠体重增量不全相等=0.05(2)计算F值

=(197.82+196.1+···+154.52)/3-1591.12/24=3990.31SS误差=SS总-SS处理-SS区组=4964.21-283.83-3990.31=690.07第三十页,共七十六页,2022年,8月28日总=N-1=24-1=23处理=a-1=3-1=2区组=n-1=8-1=7误差=(a-1)(n-1)=27=14MS处理=SS处理/

处理=283.83/2=141.92MS误差=SS误差/

误差=690.07/14=49.29F=MS处理/

MS误差=141.92/49.29=2.88(3)确定P值和作出推断结论:

F0.05(2,14)=3.74,F=2.88<F0.05(2,14),P>0.05。在=0.05水准上不拒绝H0,尚不能认为三种营养素喂养的小鼠体重增量有差别。第三十一页,共七十六页,2022年,8月28日区组间差别的检验:H0:8个区组的小白鼠体重增量相等H1:8个区组的小白鼠体重增量不全相等=0.05MS区组=SS区组/

区组=3990.31/7=570.04F=MS区组/

MS误差=570.04/49.29=11.56F0.05(7,14)=2.77,F0.01(7,14)=4.28,F=11.56>F0.01(7,14),P<0.01。在=0.05水准上拒绝H0,接受H1,可以认为8个区组的小白鼠体重增量不全相等。第三十二页,共七十六页,2022年,8月28日SPSS演示第三十三页,共七十六页,2022年,8月28日随机区组设计资料的方差分析:例9.1

ViewVariable:ViewData:第三十四页,共七十六页,2022年,8月28日AnalyzeGeneralLinearModelUnivariate…DependentVariable:xFixedFactors:abModel…SpecifyModel:CustomBuildTerms:MaineffectsModel:abContinuePostHoc…PostHocTestsfor:a

EqualVariancesAssumed:S-N-KContinueOK第三十五页,共七十六页,2022年,8月28日UnivariateAnalysisofVariance第三十六页,共七十六页,2022年,8月28日第三十七页,共七十六页,2022年,8月28日二、数据变换第三十八页,共七十六页,2022年,8月28日(一)对数变换(logarithmtransformation)Y=lgX常用于:1)使服从对数正态分布的数据正态化。如生长率、变化速度、抗体滴度等。2)使数据达到方差齐性,特别是各样本的标准差与均数成比例时。第三十九页,共七十六页,2022年,8月28日例:为了诊断某种疾病需要测量一项指标,现用4种不同的方式来测量这一指标,以增加诊断的可靠性。表1是对4名健康人测得的数据。试检验4种测量方式有无差异?第四十页,共七十六页,2022年,8月28日

表1用4种方式对4人测得的某指标值测量方式A1A2A3A4对象123440000001500000100000001000002200013000300008500600034001600052007807201900550均数标准差39000004374928.6183759568.876505671.9987.5616.1

表2表1资料的方差分析变异来源SSMSF临界值测量方式间测量对象间误差总4.5410131.4510134.29101310.281013339151.5110134.8310124.7710123.171.01F0.05=3.50第四十一页,共七十六页,2022年,8月28日

表3经对数变换后的数据测量方式A1A2A3A4对象12346.606.187.005.006.200.864.344.114.483.934.220.243.783.534.203.723.810.282.892.863.282.742.940.23均数标准差

表4表2资料的方差分析变异来源SSMSF临界值测量方式间测量对象间误差总25.5622.731.701.13339157.580.570.1358.314.38F0.01=6.99F0.05=3.86第四十二页,共七十六页,2022年,8月28日(二)平方根变换(squareroottransformation)Y=常用于:1)使服从Poisson分布的计数资料正态化,如水中细菌数的分布、放射性物质在单位时间内放射的次数等。2)当各样本的方差与均数呈正相关时,可使数据达到方差齐性。第四十三页,共七十六页,2022年,8月28日例:下面的表1资料是3组小白鼠在注射某种同位素24h后脾脏蛋白质中放射性强度的测定,试问芥子气和电离辐射对同位素进入脾蛋白质是否起抑制作用?第四十四页,共七十六页,2022年,8月28日表1小白鼠注射某种同位素后脾脏蛋白质中放射性的测定窝别XY=对照组芥子气中毒组电离辐射组对照组芥子气中毒组电离辐射组12345678910Xs23817671181076.88.816053476634.15.413031254522.62.91.732.831.002.652.452.653.322.833.162.652.530.4701.002.450.002.241.732.002.652.452.451.731.870.6741.001.730.001.731.001.412.242.002.241.411.480.468第四十五页,共七十六页,2022年,8月28日

表2方差分析结果

变异来源自由度SSMSFF0.01P处理间窝别间误差总的2918295.63814.0200.48720.1462.8191.5580.027104.4157.706.013.60<0.01<0.01用LSD法进行多重比较:第四十六页,共七十六页,2022年,8月28日

表3处理组均数与对照组均数比较

处理均数与对照组的差异P反变换为平方对照组芥子气中毒组电离辐射组2.531.871.480.661.05<0.01<0.016.403.502.19第四十七页,共七十六页,2022年,8月28日(三)倒数变换Y=X常用于数据两端波动较大的资料。1第四十八页,共七十六页,2022年,8月28日(四)平方根反正弦变换(arcsinesquareroottransformation)常用于服从二项分布的率或百分比的资料,如发病率、治愈率、病死率、有效率等。第四十九页,共七十六页,2022年,8月28日

表1不同温度对玫瑰花瓣形成率(%)的影响病员编号

低温(4-6ºC)室温(20-25ºC)高温(30-37ºC)PPP12345总和均数40.034.034.034.534.539.2335.6735.6735.9735.97182.5136.5048.058.049.065.555.543.8549.6044.4354.0348.16240.0748.0149.036.040.016.015.044.4336.8739.2323.5822.79166.9033.38例:某医学院病理生理教研组研究不同温度对淋巴细胞玫瑰花瓣形成率的影响,结果见表1,试作方差分析和多重比较。第五十页,共七十六页,2022年,8月28日

表2方差分析结果

变异来源自由度SSMSFF0.05P温度间病人间误差总的24814594.04583.866371.1331049.044297.0220.9746.396.400.454.463.84<0.05>0.05用q检验法对各温度的形成率进行两两比较:第五十一页,共七十六页,2022年,8月28日将3个样本均数从大到小依次排列,组次123均数48.0136.5033.38组别室温低温高温表3两两比较计算表对比组两均数之差标准误q值组数q界值PA与B=0.05=0.011与31与22与314.6311.513.123.0463.0463.0464.8033.7791.0243224.043.263.265.644.754.75<0.05<0.05>0.05第五十二页,共七十六页,2022年,8月28日三、析因设计的方差分析如果试验所涉及的处理因素的个数2,当各因素在试验中所处的地位基本平等,而且因素之间存在交互作用时,需选用析因设计(factorialdesign)。第五十三页,共七十六页,2022年,8月28日(一)2×2析因设计第五十四页,共七十六页,2022年,8月28日例用A、B两药治疗12名贫血病人,性别、年龄一致,随机分成4组,治疗后1个月测得血中红细胞增加数(1012/L),结果如表,问A、B两药的治疗效果如何?两药是否存在交互效应?A、B两药治疗后病人红细胞增加数(1012/L)A药B药用不用用不用2.12.22.00.91.11.01.31.21.10.80.90.7第五十五页,共七十六页,2022年,8月28日(1)建立检验假设和确定检验水准对于有重复的两因素设计资料方差分析,可以作3个原假设。

H0:A药无效;或H0:B药无效;或H0:A、B两药无交互作用。=0.05(2)计算F值

1)列表计算各种X、X2。

A药B药用(i=1)不用(i=2)合计

用(j=1)不用(j=2)合计X=6.3X2=13.25X=3.6X2=4.34X=9.9X2=17.59X=3.0X2=3.02X=2.4X2=1.94X=5.4X2=4.96X=9.3X2=16.27X=6.0X2=6.28X=15.3X2=22.55第五十六页,共七十六页,2022年,8月28日2)校正数C=(X)2/n=15.32/12=19.513)总的离均差平方和SS总=X2-C

=22.55-19.51=3.044)总的处理离均差平方和

SS总处

==6.32/3+3.02/3+3.62/3+2.42/3-19.51=2.965)A药的离均差平方和

SSA

=(X)ij2nij-C(X)i2niiji-C=9.92/6+5.42/6-19.51=1.696)B药的离均差平方和

SSB

=(X)j2njj-C=9.32/6+6.02/6-19.51=0.917)A药和B药的交互作用

SSAB

=SS总处

-SSA

-SSB

=2.96-1.69-0.91=0.36第五十七页,共七十六页,2022年,8月28日8)误差离均差平方和

SS误差

=SS总

-SS总处

=3.04-2.96=0.089)计算与上述各种离均差平方和相对应的自由度总=n-1=12-1=11总处=(A的水平数×B的水平数)-1=2×2-1=3A=A的水平数-1=2-1=1B=B的水平数-1=2-1=1AB=总处-A-B=3-1-1=1误差=总-总处=11-3=8

第五十八页,共七十六页,2022年,8月28日10)列方差分析表变异来源SSMSF临界值总处理ABAB误差总2.961.690.910.360.083.0431118111.690.910.360.013611.3(3)确定P值并作出推断结论本例分析交互作用时,P<0.01,认为交互作用有统计学意义。表明A因素处于不同水平时,B因素的作用是不同的,反之亦然。因此,不能笼统地分析A因素和B因素的作用。第五十九页,共七十六页,2022年,8月28日

四种处理的样本均数

A药B药用不用用不用2.11.21.00.8由此算出,在不用B药时,A1-A2=1.2-0.8=0.4;用B药时,A1-A2=2.1-1.0=1.1。即B药能加强A药的作用。同理,A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论