医学统计学第讲方差分析_第1页
医学统计学第讲方差分析_第2页
医学统计学第讲方差分析_第3页
医学统计学第讲方差分析_第4页
医学统计学第讲方差分析_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

章方差分析——多组均数的比较节方差分析的基本思想和应用条件一、方差分析的基本思想2020/12/181

例8-1某大学营养与食品卫生研究所将800只条件一致的雌性果蝇随机分配到4种不同浓度的某受试物培养基组,各组200只。经2至3月的培养试验,得各组寿命最高的10只果蝇的生存天数如下,试比较各最高寿命组的平均生存天数。

2020/12/182浓度生存天数合计0%:616364646565666668686500.022%:626364646566676970706600.067%:636464656768686970706680.600%:65666667686870727476692

表8-1某受试物不同浓度组最高寿命果蝇的生存天数:i组第j个数据

:i组的样本均数g:处理组数

:全部数据的样本均数

:i个处理组的例数

2020/12/183各组样本均数各不相等,可能由两种原因引起:①随机误差(抽样误差、测量误差等);②处理因素,即不同的处理引起不同的作用或效果。2020/12/184三种变异:

⑴总变异:全部数据大小不同所引起的总变异程度。⑵(处理)组间变异:各处理组样本均数间的变异,由随机误差及各处理组总体均数(可能)不同所引起。2020/12/185⑶组内变异:各组内部数据的变异,由随机误差引起。2020/12/186

方差分析的原假设H0为各组的总体均数相等。若H0成立,则组间变异和组内变异均只反映随机误差,此时理论上,F=1。反之,若各样本不是来自同一总体(处理因素有效应),则组间变异不仅反映随机误差,还包括处理因素的效应,此时组间均方应明显大于组内均方,即,F>1。根据F分布的分布规律,通过查F界值表,由P值作出统计推断。拒绝H0,接受H1,可认为各总体均数不等或不全相等;反之,则差别无统计学意义,尚不能认为各总体均数不等或不全相等。2020/12/1872020/12/188

完全随机设计方差分析的基本思想:将全部测量值总的离均差(总变异)平方和分解为处理组间(组间变异)平方和与组内(误差)平方和两部分,将总变异的自由度分解为组间变异自由度与组内变异自由度两部分。用各平方和除以各自的自由度,分别得到组间均方、误差均方。用组间均方除以误差均方得F值。根据F分布的规律推论处理因素的作用。2020/12/189二、方差分析的应用条件

理论上要求数据满足以下两个条件:(1)各样本相互独立,均服从正态分布;(2)各样本的总体方差相等,即具有方差齐性(homogeneityofvariance)。2020/12/1810

第二节

完全随机设计多组均数比较的方差分析

2020/12/1811

分析步骤1.建立检验假设、确定检验水准H0:μ1=μ2=μ3=μ4

H1:各μi不全等或全不等

α=0.052.计算各自由度ν、均方MS及F值2020/12/18122020/12/1813平方和的计算:2020/12/1814=399.50-96.30=303.20ν总=N-1=39,ν组间

=g-1=3,ν总=N-g=362020/12/18152020/12/18163.查表确定P值、下结论查附表(方差分析用)F界值表(P322单侧):<3.81,P<0.05,可认为4处理组总体平均生存天数不全等或全不等。2020/12/1817方差分析表2020/12/1818datali8_1;doc=1to4;doi=1to10;inputx@@;output;end;end;cards;61636464656566666868626364646566676970706364646567686869707065666667686870727476;proc

univariatenormal;CLASSC;varx;proc

anova;classc;modelx=c;meansc/hovtestdunnett;run;2020/12/1819Levene'sTestforHomogeneityofxVarianceANOVAofSquaredDeviationsfromGroupMeansSumofMeanSourceDFSquaresSquareFValuePr>Fc3362.9121.01.680.1896Error362599.472.20532020/12/1820SumofSourceDFSquaresMeanSquareFValuePr>FModel396.300000032.10000003.810.0180Error36303.20000008.4222222Corrected39399.5000000Total2020/12/1821Comparisonssignificantatthe0.05levelareindicatedby***.DifferenceSimultaneouscBetween95%ConfidenceComparisonMeansLimits4-14.2001.0177.383***3-11.800-1.3834.9832-11.000-2.1834.1832020/12/1822第三节随机区组设计多个样本均数比较的方差分析

随机区组设计

(randomizedblockdesign)

将条件一致的试验对象编入同一区组,再随机分配到各个处理组。2020/12/1823一、实例及符号例8-2.为研究氯化镉CdCl2对细胞的毒性作用,分别以V79(中国仓鼠肺成纤维细胞)、WI38(人肺细胞株)、L929(小鼠成纤维细胞)、CHO(中国仓鼠卵巢成纤维细胞)、SHE(叙利亚地鼠胚胎细胞株)5种不同细胞作为5个区组,以3种不同的染毒时间作为3个处理组,观察细胞的克隆率,资料如表8-3。试比较不同染毒时间组的细胞克隆率。2020/12/18242020/12/1825n:区组个数g:处理组个数

:j区组内第i处理组的数据

:j区组全部数据的和

:第j区组的样本均数

SS总=SS处理+SS区组+SS误差

总=处理+区组+误差2020/12/1826二、分析步骤2020/12/1827

各区组样本均数间的变异,由随机误差及各区组总体均数可能不同所引起。区组间变异的大小用区组间平方和表示。

2020/12/1828=0.0897/4=0.0224=0.0068/8=0.0009

F=0.0094/0.0009=10.442020/12/18293.查表查表确定P值、下结论2020/12/1830datali8_2;doa=1to3;dob=1to5;inputx@@;output;end;end;cards;0.8800.8230.7630.7110.6690.8230.7900.7480.7010.6430.7740.7650.7070.6700.505;proc

anova;classab;modelx=ab;meansab/snk;run;2020/12/1831Meanswiththesameletterarenotsignificantlydifferent.SNKGroupingMeanNbA0.8256731ABA0.7926732BBC0.7393333CC0.6940034D0.60567352020/12/1832第四节多个样本均数的两两比较

2020/12/1833多重比较(1)在研究设计阶段未预先考虑到是否进行均数的两两比较,但经假设检验得出多个总体均数不全相等的提示后,才决定进行多个均数的两两事后比较,这类研究多属于探索性研究。可采用SNK-q检验、Bonfferonit检验等。(2)在设计阶段就根据研究目的或专业知识而计划好的某些均数间的两两比较,常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较;某一对或某几对在专业上有特殊意义的均数间的比较等,可采用Dunnett-t检验、LSD-t检验、Bonfferonit检验等。2020/12/1834一、SNK-q检验2020/12/1835②计算差值的标准误:③列表计算q统计量:2020/12/1836⑶确定P

值,做出统计推断

2020/12/1837二、LSD-t检验LSD-t检验即最小显著性差异(leastsignificantdifference)t检验,适用于某一对或某几对在专业上有特殊意义的均数间的比较,如多个处理组与对照组的比较,或某几个处理组间的比较,一般在设计阶段确定哪些均数需进行多重比较。2020/12/18381.建立检验假设,确定检验水准2020/12/18392020/12/1840

第五节析因设计的方差分析

一、析因分析的基本概念2020/12/18412020/12/18421.单独效应:单独效应是指其它因素水平固定,同一因素不同水平间指标平均值的差别。如表8-8中,B因素固定在1水平时A因素1水平的指标平均值为24,B因素固定在1水平时A因素2水平的指标平均值为28,则得B因素固定在1水平时A因素的单独效应为28-24=4。2020/12/18432.主效应:主效应是指某因素各单独效应的

平均值。A因素的主效应=(4+8)/2=6(%)

B因素的主效应=(20+24)/2=22(%)3.交互效应:某因素的各单独效应随另一因素变化而变化时,称两因素间存在交互作用。因素A的各单独效应随因素B的水平变化而变化的大小称交互效应,记作AB或BA。

AB=BA=[(a2b2-a1b2)-(a2b1-a1b1)]/2=(24-20)/2=2(%)2020/12/1844二、变异分解2020/12/18452020/12/1846三、析因设计方差分析的基本步骤

2020/12/18472020/12/1848datali8_4;doa=1to2;dob=1to2;dof=1to5;inputx@@;y=x/100;output;end;end;end;cards;1010405010303070603010203050305050706030;proc

anova;classab;modely=ab;run;2020/12/1849TheANOVAProcedureDependentVariable:ySumofSourceDFSquaresMeanSquareFValuePr>FModel20.260000000.130000004.590.0256Error170.482000000.02835294CorrectedTotal190.74200000R-SquareCoeffVarRootMSEyMean0.35040445.509000.1683830.370000SourceDFAnovaSSMeanSquareFValuePr>Fa10.018000000.018000000.630.4366b10.242000000.242000008.540.00952020/12/1850

三因素析因设计举例用5×2×2析因设计研究5种类型的军装在两种环境、两种活动状态下的散热效果,观察指标是从“冷”到“热”按等级评分,每种处理重复实验5次。试作方差分析。2020/12/1851datab3ys;doa=1to5;dob=1to2;doc=1to2;doi=1to5;inputx@@;output;end;end;end;end;cards;2020/12/18520.25-0.251.25-0.750.404.753.454.004.854.55/*a1b1c1、c2×5*/0.502.102.751.002.353.754.004.004.254.60/*a1b2c1、c2×5*/0.300.100.50-0.350.054.604.804.005.204.30/*a2b1c1、c2×5*/1.501.501.251.372.554.004.054.154.104.25/*a2b2c1、c2×5*/0.75-0.500.600.40-0.204.553.504.254.104.40/*a3b1c1、c2×5*/0.752.653.000.051.174.105.004.204.154.175/*a3b2c1、c2×5*/0.20-1.000.85-0.500.904.253.104.005.004.20/*a4b1c1、c2×5*/-0.750.900.950.6251.053.2754.254.004.254.25/*a4b2c1、c2×5*/-0.100.002.500.10-0.104.7254.304.104.803.60/*a5b1c1、c2×5*/1.752.401.753.052.754.804.024.154.754.80/*a5b2c1、c2×5*/;proc

anova;classabc;modelx=abca*ba*cb*ca*b*c;run;2020/12/1853

TheANOVAProcedureDependentVariable:xSumofSourceDFSquaresMeanSquareFValuePr>FModel19316.205804016.642410738.72<.0001Error8034.38446000.4298057CorrectedTotal99350.5902640R-SquareCoeffVarRootMSExMean0.90192425.503610.6555962.570600SourceDFAnovaSSMeanSquareFValuePr>Fa45.20898651.30224663.030.0222b19.92880109.928801023.10<.0001c1283.3498890283.3498890659.25<.0001a*b41.94127150.48531791.130.3488a*c41.47950850.36987710.860.4914b*c112.687844012.687844029.52<.0001a*b*c41.60950350.40237590.940.44742020/12/1854补充:正交设计与方差分析析因设计是全面试验,各因素各水平的全面组合得到g个处理。正交设计是非全面试验。2020/12/18552020/12/18562020/12/18572020/12/18582020/12/18592020/12/1860ABABCD2020/12/1861databzhj;inputabcdx@@;cards;111186112295121291122194211291212196221183222288;proc

anova;classabcd;modelx=abcda*b;run;2020/12/1862

TheANOVAProcedureDependentVariable:xSumofSourceDFSquaresMeanSquareFValuePr>FModel5141.000000028.200000011.280.0834Error25.00000002.5000000CorrectedTotal7146.0000000R-SquareCoeffVarRootMSExMean0.9657531.7471151.58113990.50000SourceDFAnovaSSMeanSquareFValuePr>Fa18.000000008.000000003.200.2155b118.0000000018.000000007.200.1153c160.5000000060.5000000024.200.0389d14.500000004.500000001.800.3118a*b150.0000000050.0000000020.000.04652020/12/1863第六节重复测量资料的方差分析

一、重复测量资料的数据特征重复测量资料(repeatedmeasurementdata)是指同一观查对象被给予某种处理后,在不同时间点上对某指标进行多次测量所得的资料;有时是指从同一观查对象不同部位(或组织)上重复测得某指标的资料。(一)重复测量资料的类型1.单因素重复测量设计资料2020/12/1864例8-5.从6名健康人抽血后制成血滤液。每个受试者的血滤液分成4份,把4份血滤液随机分别放置0、45、90、135分钟,测定其血糖浓度如表8-10。2020/12/18652.两因素重复测量设计资料例8-6.为比较两种同类药物A、B在体内的代谢速度,将10名受试对象随机分为两组,一组给予A药,另一组给予B药。分别在服药后1、2、4、6小时测定血中的药物浓度,结果见表8-11。2020/12/18662020/12/1867(二)重复测量设计与随机区组设计的区别1.重复测量设计中,各观察对象各时间点是固定的,同一观察对象依次接受各时间点的测量。两因素重复测量设计中,处理(如例8-6中的药物因素)是在观察对象间随机分配,不能在各时间点随机分配。在随机区组设计中,各区组内有多个条件一致的观察对象,每个观察对象随机分配给一种处理。2.随机区组设计中,各区组内各处理水平相互独立,各区组内各观察对象所得数据相互独立。重复测量设计中各区组内的数据重复测自同一观察对象,他们之间往往有较高的相关性。3.为了有效地处理重复测量资料间的相关性,须使用特定模型的多元方法。如对单因素重复测量设计资料,必须满足“球对称”(sphericity)的假设条件,方可采用完全随机设计方差分析,否则会增大Ⅰ型错误的概率。2020/12/1868二、重复测量资料的变异平方和及自由度分解

(-)单因素重复测量设计资料2020/12/1869(二)两因素重复测量设计资料2020/12/1870

三、重复测量设计资料的方差分析

(-)单因素重复测量设计资料对例8-5的资料,进行SAS编程:datali8_5;inputgrptime1-time4@@;cards;15.275.274.944.61 15.315.264.934.70 15.885.835.385.01 15.495.435.325.04 15.665.445.384.88 16.225.725.615.22;proc

glm;/*调用一般线性模型*/2020/12/1871classgrp;modeltime1-time4=grp/*将time1-time4按一整体作反应变量*//nouni;/*不把time1-time4作4个独立变量*/repeatedtime4/*重复测量因素的变量名为

time,水平为4*//printe;/*作球性检验*/run;2020/12/1872TheGLMProcedureRepeatedMeasuresAnalysisofVarianceSphericityTestsMauchly'sVariablesDFCriterionChi-SquarePr>ChiSqTransformedVariates50.30674174.39873320.4935OrthogonalComponents50.43474523.10059280.68452020/12/1873TheGLMProcedureRepeatedMeasuresAnalysisofVarianceUnivariateTestsofHypothesesforWithinSubjectEffectsAdjPr>FSourceDFTypeIIISSMeanSquareFValuePr>FG-GH-Ftime31.814433330.6048111147.00<.0001<.0001<.0001time*grp00.00000000.....Error(time)150.193016670.012867782020/12/1874(二)两因素重复测量设计资料

对例8-6的资料,进行SAS编程:datali8_6;inputgt1-t4@@;cards;19.1253.1654.8945.8815.1048.7877.3961.2913.3720.6571.2275.0816.5130.0774.2675.6911.995.8480.2669.82213.5527.1046.8853.2121.0225.1254.0344.1522.1514.2368.7464.6526.1825.8345.7054.2521.6840.2932.3471.00;2020/12/1875proc

glm;classg;modelt1-t4=g/nouni;repeatedt4/printe;run;2020/12/1876TheGLMProcedureRepeatedMeasuresAnalysisofVarianceSphericityTestsMauchly'sVariablesDFCriterionChi-SquarePr>ChiSqTransformedVariates50.141838713.1289340.0222OrthogonalComponents50.24516149.45035990.09242020/12/1877TheGLMProcedureRepeatedMeasuresAnalysisofVarianceTestsofHypothesesforBetweenSubjectsEffectsSourceDFTypeIIISSMeanSquareFValuePr>Fg1794.5048225794.504822519.320.0023Error8328.999680041.12496002020/12/1878TheGLMProcedureRepeatedMeasuresAnalysisofVarianceUnivariateTestsofHypothesesforWithinSubjectEffectsAdjPr>FSourceDFTypeIIISSMeanSquareFValuePr>FG-GH-Ft322209.527317403.1757746.04<.0001<.0001<.0001t*g3654.25557218.085191.360.27990.28590.2838Error(t)243859.28040160.803352020/12/1879思考题1.t检验与方差分析的异同点?相同点:⑴计量资料⑵单因素研究⑶实验设计:①完全随机②配对与区组⑷条件:①正态②方差齐性不同点:⑴水平数⑵检验方法⑶多组比较不能两两t检验2020/12/18802.完全随机设计方差分析与随机区组设计方差

分析的异同点?相同点:⑴计量资料⑵单因素研究⑶多水平⑷方差分析⑸修正数,总平方和、组间平方和及其自由度计算不同点:⑴实验设计⑵平方和、自由度的分解⑶区组因素⑷组内平方和,区组、误差平方和⑸检验效能2020/12/1881单选题:1.完全随机设计资料的方差分析中,必然有()A.SS组间>SS组内

B.MS组间<MS组内

C.MS总=MS组间+MS组内D.SS总=SS组间+SS组内E.组间>组内2.在完全随机设计资料的方差分析中,有()A.MS组内>MS误差

B.MS组间<MS误差

C.MS组内=MS误差

D.MS组间=MS误差E.MS组内<MS组间2020/12/18823.方差分析结果,F处理>,则统计推断是()。A.各总体均数不全相等或全不相等B.各总体均数都不相等C.各样本均数都不相等D.各样本均数间差别都有显著性E.各总体方差不全相等4.完全随机设计方差分析的实例中有()。A.组间SS不会小于组内SSB.组间MS不会小于组内MSC.F值不会小于1D.F值不会是负数E.F值不会是正数2020/12/18835.完全随机设计方差分析中的组间均方是()的统计量A.表示抽样误差大小B.表示N个数据的离散程度C.表示某处理因素的效应作用大小D.表示某处理因素的效应和随机误差两者综合影响的结果E.表示随机因素的效应大小6.配对设计资料,若满足正态性,要对两样本均数的差别做比较,可选择()A.随机区组设计的方差分析B.u检验C.成组t检验D.卡方检验E.秩和检验2020/12/1884练习题1、湖水中不同季节氯化物含量测量值(mg/L)如下,试分析不同季节氯化物平均含量是否不同。春季:22.6

22.8

21.0

16.9

20.0

21.9

21.5;夏季:21.2

19.1

22.8

24.5

18.0

15.2

18.4

20.1

21.2;秋季:18.9

13.6

17.2

15.1

16.6

14.2

16.719.6

19.0;冬季:16.9

17.6

14.8

13.1

16.9

16.2

14.8

完全随机设计方差分析2020/12/1885(1)该题应采用方法()。(2分)A完全随机设计的方差分析B配伍组随机设计的方差分析C两两比较的q(snk)检验D重复测量数据的方差分析(2)总平方和的计算公式为()。(2分)A.B.C.D.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论