卫生统计学1015方差分析_第1页
卫生统计学1015方差分析_第2页
卫生统计学1015方差分析_第3页
卫生统计学1015方差分析_第4页
卫生统计学1015方差分析_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、广州医科大学 统计学系阮红莲1. ANOVA1. ANOVA的基本思想的基本思想2. 2. 完全随机设计完全随机设计ANOVAANOVA的基本步骤的基本步骤3. 3. 随机区组设计随机区组设计ANOVAANOVA的基本步骤的基本步骤4. 4. 多重比较多重比较5. ANOVA5. ANOVA应用的前提条件应用的前提条件6. 6. 析因设计析因设计ANOVAANOVA的基本步骤的基本步骤7. 7. 重复测量设计重复测量设计ANOVAANOVA的基本步骤的基本步骤 例例1 为研究钙离子对体重的影响作用,某研究者将为研究钙离子对体重的影响作用,某研究者将36只肥胖模型大白鼠随机分为只肥胖模型大白鼠随

2、机分为三组三组,每组,每组12只,分别给只,分别给予常规剂量钙予常规剂量钙(0.5%)、中剂量钙、中剂量钙(1.0%)和高剂量钙和高剂量钙(1.5%)三种不同的高脂饲料,喂养三种不同的高脂饲料,喂养9周,测其周,测其喂养前后喂养前后体重的差值(表体重的差值(表1)。问三组不同喂养方式下大白鼠体。问三组不同喂养方式下大白鼠体重改变是否不同?重改变是否不同?1. ANOVA1. ANOVA的基本思想的基本思想表1 3种不同喂养方式下大白鼠体重喂养前后差值(g)中中233 232 1C31 0.95 0.95 0.95 1 0.950.14P 实际犯错误的风险大于检验水准!pt 检验仅适用于两总体均

3、值的比较; p 然而,在医疗实践中,我们往往需要比较多个组总体均值的差别;p 此时,方差分析(ANOVA) 是一种特别有效的方法。1 12222nnXXnXXsiii例例1 1 大白鼠体重差值变异分解示意图大白鼠体重差值变异分解示意图组内变异组间变异中中 变异的大小用变异的大小用方差方差来衡量,方差的分子为离均差来衡量,方差的分子为离均差平方和,分母为相应自由度。平方和,分母为相应自由度。 我们将方差分解的时候,将方差的分子(离均差我们将方差分解的时候,将方差的分子(离均差平方和)以及分母(自由度)分开考虑,依据相平方和)以及分母(自由度)分开考虑,依据相应变异的来源分别做分解。应变异的来源分

4、别做分解。TotalWithinBetween组内平方和(Within group SS)反映的是各组内个体间的差异,体现为反映的是各组内个体间的差异,体现为每组的原始数据与该组均数的差异,因此可以认为是随机误差,又称每组的原始数据与该组均数的差异,因此可以认为是随机误差,又称误误差变异差变异。组间平方和(Among-groups SS)反映各组间均数的差异,即各组间均数反映各组间均数的差异,即各组间均数与总的均数的差异,该变异除随机误差外,有可能存在处理因素的作用。与总的均数的差异,该变异除随机误差外,有可能存在处理因素的作用。12BEMSFMSF F 值值What does F indic

5、ate if it is near to 1 ?What does F indicate if it is far away from 1 ?012kH:1H:至少有两个总体均数不相等至少有两个总体均数不相等 0123H:1Not allare equaljH:2()47758.32TSSxx2()31291.67BiiSSn xx2()16466.65WiTBSSxxSSSS136 135Tn 由于样本含量为36,故总自由度有3个处理组,13 12Bk 组内自由度,35233WTB2()16466.65498.99363iWWWXXSSMSvnk组内均方MSw average variati

6、on within all groups What is the causation of MSW ?2()31291.6715645.8313 1iiBBBn XXSSMSvk组间均方MSB average variation between groups What is the causation of MSB ?15645.8331.36498.99BWMSFMSF 值值 ratio of MSB over MSW 在本例中,若三组饲料的处理效应相同,则组间在本例中,若三组饲料的处理效应相同,则组间变异应与组内变异一样,只反映随机误差的作用大小。变异应与组内变异一样,只反映随机误差的作用

7、大小。 如果三个总体均数相等,如果三个总体均数相等,F 的数值不会太大。的数值不会太大。相反,如果的数值过大,相反,如果的数值过大,“三个总体均数相等三个总体均数相等”这这个前提就值得怀疑了。个前提就值得怀疑了。 完全随机设计完全随机设计 (completely randomized design):是将同质的受试对象随机地分配到各处理组,再是将同质的受试对象随机地分配到各处理组,再观察其实验效应。观察其实验效应。 完全随机设计完全随机设计是最常见的研究单因素两水平或多是最常见的研究单因素两水平或多水平的实验设计方法,属水平的实验设计方法,属单向方差分析单向方差分析(one-way ANOVA

8、)。 建立检验假设,确定检验水准建立检验假设,确定检验水准 H H0 0: : 1 1= = 2 2= k k H H1 1: : 1 1, , 2 2 , , , , k k 不全相等不全相等 =0.05=0.05计算检验统计量计算检验统计量 构建构建ANOVAANOVA表表确定确定P值并作出推断结论值并作出推断结论 (1)建立检验假设,确定检验水准建立检验假设,确定检验水准 0H :三组不同喂养方式下大白鼠体重改变的总体平均水平相同1H :三组不同喂养方式下大白鼠体重改变的总体平均水平不全相同0.05表3 例1资料的方差分析表(3) 确定确定P值并作出推断结论值并作出推断结论 查表,得查表

9、,得 。由。由F = 31.36 知知P 0.01。按。按 = 0.05水准,差别有统计学水准,差别有统计学意义,可以认为三组不同喂养方式下大白鼠体重意义,可以认为三组不同喂养方式下大白鼠体重改变的改变的均值均值不全相同。不全相同。 0.05(2,32)0.01(2,32)3.29, 5.34FFFt 由于样本差异有统计学意义,可推断至少有两组总体均值不等。 若是想进一步知道哪两组均值不等,需做多重比较。考虑以下数据集:试采用方差分析的方法对两总体均值进行比较.随机区组设计随机区组设计(randomized block design)又称配伍又称配伍组设计组设计,通常是将受试对象按性质,通常是

10、将受试对象按性质(如动物的窝别、如动物的窝别、体重等非实验因素体重等非实验因素)相同或相近者组成相同或相近者组成b个区组个区组(配配伍组伍组),每个区组中的受试对象分别随机分配到,每个区组中的受试对象分别随机分配到k个处理组中去。个处理组中去。 29例例2 为探索丹参对肢体缺血再灌注损伤的影响,为探索丹参对肢体缺血再灌注损伤的影响,将将30只纯种新西兰实验用大白兔,按窝别相同分为只纯种新西兰实验用大白兔,按窝别相同分为10个区组个区组。每个区组的。每个区组的3只大白兔随机接受只大白兔随机接受三种不三种不同的处理同的处理,即在松止血带前分别给予丹参,即在松止血带前分别给予丹参2ml/kg、丹参丹

11、参1ml/kg、生理盐水、生理盐水2ml/kg,并分别测定松止血,并分别测定松止血带前及松后带前及松后1小时后小时后血中白蛋白含量血中白蛋白含量(g/L),算出白,算出白蛋白的减少量如表蛋白的减少量如表4所示。问三种处理效果是否不所示。问三种处理效果是否不同?同?表4 三种方案处理后大白兔血中白蛋白减少量(g/L)SSSST TvT TSSSSE E vE ESSSSB1B1vB1B1SSSSB2B2 vB2B2随机区组设计方差分析的总变异可以分为随机区组设计方差分析的总变异可以分为处理的处理的变异变异、区组的变异区组的变异和和误差误差三部分。三部分。 与与单因素方差分析单因素方差分析相比,由

12、于从误差变异中分解相比,由于从误差变异中分解出了反映个体差异的区组变异,使得误差更能出了反映个体差异的区组变异,使得误差更能反反映随机误差的大小,较映随机误差的大小,较单因素方差分析单因素方差分析更容易检更容易检验出处理组间的差别,从而提高了检验效率。验出处理组间的差别,从而提高了检验效率。33EBBTSSSSSSSS21EBBT2111Bk1Tkb(1)(1)Ekb21Bb111/BBBvSSMS222/BBBvSSMSEEESSMS/EBBMSMSF11EBBMSMSF22SSSSB1B1SSSSB B表5 随机区组设计方差分析表随机区组设计资料方差分析的基本步骤:随机区组设计资料方差分析

13、的基本步骤:(1) 建立检验假设,确定检验水准建立检验假设,确定检验水准 对于处理组:对于处理组:对于区组:对于区组:0H :三个处理组总体均数相等1H:三个处理组总体均数不全相等0H :十个区组总体均数相等1H:十个区组总体均数不全相等0.050.05(2) 计算检验统计量计算检验统计量随机区组设计的方差分析表随机区组设计的方差分析表(3) 确定确定P值并作出推断结论值并作出推断结论 计算出处理和区组的计算出处理和区组的F值,并根据相应的自由值,并根据相应的自由度查度查F界值表得出界值表得出P值。对于处理组,值。对于处理组,P 0.05,不能拒绝,不能拒绝 ,即尚不能,即尚不能认为十个区组的

14、总体均数不同。认为十个区组的总体均数不同。 0H0H试用随机区组设计的方差分析对以上数据进行检验.考虑以下数据: (1) 在研究设计阶段未预先考虑或预料到,经假设在研究设计阶段未预先考虑或预料到,经假设检验得出多个总体均数不全等的提示后,才决定检验得出多个总体均数不全等的提示后,才决定进行多个均数的两两事后比较。这类情况常用于进行多个均数的两两事后比较。这类情况常用于探索性研究探索性研究,往往涉及到每两个均数的比较,可,往往涉及到每两个均数的比较,可采用采用SNK(Students-Newman-Keuls) 法。法。 (2) 在设计阶段就根据研究目的或专业知识而计划在设计阶段就根据研究目的或

15、专业知识而计划好的某些均数间的两两比较。好的某些均数间的两两比较。 它常用于事先有明确假设的它常用于事先有明确假设的证实性研究证实性研究,如多,如多个处理组与对照组的比较,某一对或某几对在专业个处理组与对照组的比较,某一对或某几对在专业上有特殊意义的均数间的比较等,可采用上有特殊意义的均数间的比较等,可采用Dunnett 检验、检验、LSD-t检验检验 (Fishers least significant test)、Bonferroni 法、法、idk 法等。法等。SNK法法: 属于多重极差检验,用于每两个均数间的属于多重极差检验,用于每两个均数间的比较。比较。Bonferroni法法 :若

16、每次检验水准为:若每次检验水准为 ,共进行,共进行m次比次比较,当较,当 为真时,犯第一类错误的累积概率不超为真时,犯第一类错误的累积概率不超过过 。此方法较为保守,检验功效低于。此方法较为保守,检验功效低于SNK法。法。 0HmDunnett法法:又称:又称Dunnett t 检验,适用于检验,适用于k1个实验个实验组与对照组均数的比较。组与对照组均数的比较。 SNK法法(又称又称q检验检验)例例3 请对例请对例1资料喂养资料喂养9周后体重差值的三组总周后体重差值的三组总体均数进行两两比较。体均数进行两两比较。(1)建立检验假设,确定检验水准建立检验假设,确定检验水准 H0 : A B ,即

17、两对比组的总体均数相等。即两对比组的总体均数相等。 H1 : A B ,即两对比组的总体均数不等。即两对比组的总体均数不等。 =0.05(2)计算检验统计量)计算检验统计量:首先将三个样本均数由:首先将三个样本均数由大到小排列,并编组次:大到小排列,并编组次:组别组别正常钙组正常钙组中剂量钙中剂量钙高剂量钙高剂量钙293.37239.49224.78组次组次123iX误差误差,vvnnMSXXqBABA112例例1资料的资料的 SNK 检验计算表检验计算表对比组对比组A 与与 B(1)两均数之差两均数之差(2)两均数之两均数之差标准误差差标准误差 (3)q对比组内对比组内包含组数包含组数aq

18、的临界值的临界值P0.050.011 与与 368.599.127.5233.494.450.011 与与 253.879.125.9122.893.890.012 与与 314.719.121.6122.893.890.05BAXXBAXXS 324 (3) 确定确定P 值并作出推断结论:值并作出推断结论: 以计算以计算MS组内组内即即MS误差误差 的的自由度自由度 v组内组内 =33(本例取(本例取30)和对比组内包含组数和对比组内包含组数 a 查附表查附表 q 界值表得界值表得q(0.05,30)和和q(0.01,30)的界值的界值如上表所示。如上表所示。 按按 = 0.05水准,组次水

19、准,组次 2 与与 3(即中剂量钙(即中剂量钙 1.0%与高剂量钙与高剂量钙 1.5%)不拒绝)不拒绝 H0,差别无统计,差别无统计学意义,还不能认为两种剂量钙喂养学意义,还不能认为两种剂量钙喂养9周前后体重周前后体重差值不同。差值不同。其他两两组间其他两两组间均拒绝均拒绝 H0,差别有统计,差别有统计学意义,学意义,中、高中、高剂量钙剂量钙与正常钙与正常钙喂养喂养9周前后体重周前后体重差值不同。差值不同。Bonferroni 法法例例4 对例对例1资料资料进行两两比较。进行两两比较。(1)建立检验假设,确定检验水准建立检验假设,确定检验水准 H0 : A B,即两对比组的总体均数相等。即两对

20、比组的总体均数相等。 H1 : A B,即两对比组的总体均数不等。即两对比组的总体均数不等。0167. 0) 13(305. 02) 1(2kkm(2)计算检验统计量)计算检验统计量误差误差,vvnnMSXXSXXtBABAXXBABA11例例1资料的两两资料的两两t 检验计算表检验计算表对比组对比组A与与B(1)两均数之差两均数之差(2)标准误差标准误差 (3)t(4)P1与与253.873 9.1195 5.9070.00011与与368.587 9.11957.5210.00012与与314.713 9.11951.6130.1163BAXXBAXXS(3) 根据根据P值做出推断值做出推

21、断: 按按 =0.0167水准,处理水准,处理1与与2、1与与3的差异具有的差异具有统计学意义,喂养统计学意义,喂养9周前后体重差值不同。而处理周前后体重差值不同。而处理2与与3的差异尚无统计学意义,还不能认为高剂量钙与的差异尚无统计学意义,还不能认为高剂量钙与中剂量钙喂养中剂量钙喂养9周前后体重差值不同。周前后体重差值不同。 从理论上讲,进行方差分析的数据应满足如下两从理论上讲,进行方差分析的数据应满足如下两个基本假设:个基本假设: (1) 各样本是相互独立的随机样本,均服从正态分各样本是相互独立的随机样本,均服从正态分布;布; (2) 各样本的总体方差相等,即方差齐性。各样本的总体方差相等

22、,即方差齐性。 Bartlett 检验:资料检验:资料服从正态分布服从正态分布的多个的多个总体方差齐性检验的方法总体方差齐性检验的方法 2 Levene检验检验:资料是:资料是任意分布时任意分布时的方差齐的方差齐性检验法,既可用于检验性检验法,既可用于检验两总体两总体方差齐性,方差齐性,也可用于检验也可用于检验多个总体多个总体的方差齐性。的方差齐性。 (1) 建立检验假设,确定检验水准建立检验假设,确定检验水准 0.102220123H:,即三个总体方差全相等1H:三个总体方差不全相等(2) 计算检验统计量计算检验统计量 Bartlett 检验检验 值值 Levene检验检验 F 值值22(3

23、) 确定确定P值并作出推断结论值并作出推断结论残差的计算公式:残差的计算公式:ijijieXXijijijeXXXX完全随机设计资料:完全随机设计资料: 随机区组设计资料随机区组设计资料 : 对于一些明显偏离正态性和方差齐性条件的对于一些明显偏离正态性和方差齐性条件的资料,可以通过某种形式的数据变换使之满足方资料,可以通过某种形式的数据变换使之满足方差分析、差分析、t 检验或其它统计方法对资料的要求。检验或其它统计方法对资料的要求。 所谓所谓数据变换数据变换(data transformations),即对,即对原始数据作某种函数变换,它虽然改变了资料分原始数据作某种函数变换,它虽然改变了资料

24、分布的形式,但未改变各组资料间的关系,其缺点布的形式,但未改变各组资料间的关系,其缺点是分析结果的解释欠直观。是分析结果的解释欠直观。 常用的数据变换方法有:常用的数据变换方法有:1) 对数变换对数变换(logarithmic transformation) :将:将原始数据取自然对数或常用对数。其变换公式原始数据取自然对数或常用对数。其变换公式为为 为零或正数。为零或正数。该变换该变换适用适用于:于:(1)对数正态分布资料对数正态分布资料,如抗体滴度资料,疾病,如抗体滴度资料,疾病潜伏期,食品、蔬菜、水果中农药的残留量等。潜伏期,食品、蔬菜、水果中农药的残留量等。(2)标准差与均数成比例标准

25、差与均数成比例,或,或变异系数接近甚至变异系数接近甚至等于某一常数等于某一常数的资料。的资料。)ln(aXX a 2) 平方根变换平方根变换(square root transformation) : 将原始数据开算术平方根。将原始数据开算术平方根。 其变换公式为:其变换公式为: 或或 该变换适用于该变换适用于方差与均数成比例方差与均数成比例的资料,如的资料,如服从服从Poisson分布的资料分布的资料。XX0.5XX 3) 平方根反正弦变换平方根反正弦变换(arcsine square root transformation) 又称角度变换:就是将原始数据开平又称角度变换:就是将原始数据开平

26、方根再取反正弦。方根再取反正弦。 其变换公式为:其变换公式为: 该变换适用于该变换适用于百分比百分比的数据资料。的数据资料。 例如,例如, , 则变换为:则变换为:XXarcsin 46. 0 X71.4246. 0arcsin X析因设计析因设计(factorial design)(factorial design)是将多个因素的各是将多个因素的各个水平进行排列组合,在每一种可能的水平组合个水平进行排列组合,在每一种可能的水平组合下进行试验,以探讨各因素的效应以及各因素之下进行试验,以探讨各因素的效应以及各因素之间的交互效应,而且通过比较各种组合效应,找间的交互效应,而且通过比较各种组合效应

27、,找出最佳组合。出最佳组合。 2 2 析 因 设 计 的 数 据 结 构 B因 素因 素 A因 素因 素 1B 2B 1A 111X, ,112X, , ,rX11 121X, ,122X, , ,rX12 2A 211X, ,212X, , ,rX21 221X, ,222X, , ,rX22 考察考察A A、B B两因素的两因素的“主效应主效应”考察考察A A、B B两因素间的两因素间的“交互效应交互效应”例5 为研究某降血糖药物对糖尿病及正常大鼠心肌磺脲类药物受体SUR1的mRNA的影响,某研究者进行了如下实验:将24只大鼠随机等分成4组:两组正常大鼠,另两组制成糖尿病模型,糖尿病模型的

28、两组分别进行给药物和不给药物处理,剩余两组正常大鼠也分别进行给药物和不给药物处理,测得各组mRNA吸光度的值(%). 单独效应、主效应和交互效应单独效应、主效应和交互效应单独效应单独效应:是指其它因素水平固定时,是指其它因素水平固定时,同一因素不同水平的效应之差同一因素不同水平的效应之差A因素固定在1水平时,B因素的单独效应为 :A因素固定在2水平时,B因素的单独效应为 :B因素固定在1水平时,A因素的单独效应为 :B因素固定在2水平时,A因素的单独效应为:主效应主效应:是指某一因素单独效应的平均值是指某一因素单独效应的平均值 A因素的主效应-6.58; B因素的主效应为 -8.58交互效应交

29、互效应:是指两个或多个因素间的效应是指两个或多个因素间的效应互不独立的情形。互不独立的情形。ABAB()SSSSSSSSSSSSSS处理总误差误差ABAB()处理总误差误差析因设计方差分析表析因设计方差分析表析因设计资料的方差分析步骤:析因设计资料的方差分析步骤:1. 建立检验假设,确定检验水准建立检验假设,确定检验水准因素A因素BAB交互作用 2. 计算检验统计量计算检验统计量 3. 确定确定P值,作出统计推断值,作出统计推断 首先判断A因素和B因素交互效应AB的P 值, P 0.05,按 =0.05水准,拒绝H 0,表明两个因素间存在交互效应。这时,如要分析A因素或B因素的单独效应,应固定

30、在A因素的基线水平来分析B因素的作用,或者固定在B因素的基线水平来分析A因素的作用。重复测量资料(repeated measurement data)是同一受试对象的同一观察指标在不同时间点上进行多次测量所获得的资料,常用来分析该观察指标在不同时间点上的变化特点。例6 临床上为指导脑梗患者的治疗和预后,某研究人员对不同类型脑梗患者酸性磷脂(AP)在不同时间点的变化,进行了如下观察:随机选取三种不同类型的脑梗(TIA、脑血栓形成、腔隙性脑梗塞)患者各8例,分别于脑梗发生的第24小时、48小时、72小时、7天分别采血,测量血中AP的值.离均差平方和与自由度的分解()()()()SSSSSSSSSSSSSSSS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论