医学统计学(1)_第1页
医学统计学(1)_第2页
医学统计学(1)_第3页
医学统计学(1)_第4页
医学统计学(1)_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章第四章 多个样本多个样本 均数比较的均数比较的analysis of variance, analysis of variance, ANOVAANOVA 讲述内容讲述内容第一节第一节 方差分析的基本思想及其应用条件方差分析的基本思想及其应用条件第二节第二节 完全随机设计资料的方差分析完全随机设计资料的方差分析第三节第三节 随机区组设计资料的方差分析随机区组设计资料的方差分析 第四节第四节 拉丁方设计资料的方差分析拉丁方设计资料的方差分析 第五节第五节 两阶段交叉设计资料的方差分析两阶段交叉设计资料的方差分析第六节第六节 多个样本均数间的多重比较多个样本均数间的多重比较第七节第七节 多样

2、本方差比较的多样本方差比较的BartlettBartlett检验检验 和和LeveneLevene检验检验第一节第一节 方差分析的基方差分析的基本思想及其应用条件本思想及其应用条件目的:目的:推断多个总体均数是否有差别。推断多个总体均数是否有差别。 也可用于两个也可用于两个 方法:方法:方差分析,即多个样本均数比较方差分析,即多个样本均数比较 的的F检验。检验。 基本思想:基本思想:根据试验设计的类型,将全根据试验设计的类型,将全部测量值总的离均差平方和及其自由度部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因

3、素的用外,每个部分的变异可由某个因素的作用作用(或某几个因素的交互作用或某几个因素的交互作用)加以解加以解释释 。应用条件:应用条件: 总体总体正态且方差相等正态且方差相等 样本样本独立、随机独立、随机设计类型:设计类型:完全随机设计资料的方差分析完全随机设计资料的方差分析随机区组设计资料的方差分析随机区组设计资料的方差分析拉丁方设计资料的方差分析拉丁方设计资料的方差分析两阶段交叉设计资料的方差分析两阶段交叉设计资料的方差分析2221122(,),(,),(,)ggNNN表 4-1 g 个处理组的试验结果 处理分组 测量值 统计量 1 水平 X11 X12 X1j 1nX1 n1 1X S1

4、2 水平 X21 X22 X2j 2nX2 n2 2X S2 g 水平 Xg1 Xg2 Xgj ggnX ng gX Sg 完全随机设计资料的方差分析的基本思想完全随机设计资料的方差分析的基本思想 合计合计 N S 第第i个处理组第个处理组第j个观察结果个观察结果XijX变异(变异(离均差平方和离均差平方和)分解)分解:离均差平方和离均差平方和(sum of squares of deviations from mean,SS) :2211,2 (1)ingNijiji jSSXXXXNS1.1.总变异总变异: : 所有测量值之间总的变所有测量值之间总的变异程度,异程度,计算公式为计算公式为2

5、212111,iinnggijijijNiji jijXCSSXXXC 总2211,()()ingNijijiji jXXCNN校正系数校正系数:1N总 2组间变异:组间变异:各组均数与总均数的离均差平各组均数与总均数的离均差平方和,表示处理因素的作用和随机误差的影响,方和,表示处理因素的作用和随机误差的影响,计算公式为:计算公式为: 如果如果有有g个总体均数个总体均数有有差别差别 如果如果无无g个总体均数个总体均数无无差别差别21211()()inijjggiiiiiXSSn XXCn组间1g组间211()ingijiijSSXX组内Ng组内SSSSSS总组间组内总组间组内三种变异的关系三种

6、变异的关系:SSMSSSMS组间组间组间组内组内组内 均方差,均方均方差,均方( (mean square,MS) )。 检验统计量:检验统计量:如果如果 ,则,则 都为都为随机误差随机误差 的估计,的估计,F F值应接近于值应接近于1 1。如果如果 不全相等,不全相等,F F值将明显大于值将明显大于1 1。用用F F界值(单侧界值)确定界值(单侧界值)确定P P值。值。12, , MSFMS组间组间组内组内12g,MSMS组间组内212,g 第二节第二节完全随机设计资料的方差分析完全随机设计资料的方差分析 将全部试验对象分配到将全部试验对象分配到g个处理个处理组(水平组),各组分别接受不同组

7、(水平组),各组分别接受不同的处理,试验结束后比较各组均数的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论之间的差别有无统计学意义,推论处理因素的效应。处理因素的效应。一、完全随机设计一、完全随机设计 例例4-14-1 某医生为了研究一种降血某医生为了研究一种降血脂新药的临床疗效,按统一纳入标脂新药的临床疗效,按统一纳入标准选择准选择120名患者,采用完全随机设名患者,采用完全随机设计方法将患者等分为计方法将患者等分为4组进行双盲试组进行双盲试验。问如何进行分组?验。问如何进行分组?(1 1)完全随机分组方法:)完全随机分组方法: 1. 编号:编号:120名高血脂患者从名高血脂患者

8、从1开始到开始到120,见表见表4-2第第1行;行;2. 取随机数字:取随机数字:从附表从附表15中的任一行任中的任一行任一列开始,如一列开始,如第第5行第行第7列列开始,依次开始,依次读取三位数作为一个随机数录于编号读取三位数作为一个随机数录于编号下,见表下,见表4-2第第2行;行;表4-2 完全随机设计分组结果 编 号 1 2 3 4 5 6 7 8 9 10 119 120 随机数 260 873 373 204 056 930 160 905 886 958 220 634 序 号 24 106 39 15 3 114 13 109 108 117 16 75 分组结果 甲 丁 乙 甲

9、 甲 丁 甲 丁 丁 丁 甲 丙 3. 3. 编序号编序号:按数字从小到大:按数字从小到大 ( (数据相同则按先后顺序)数据相同则按先后顺序)编序号,见表编序号,见表4-24-2第第3 3行。行。4. 4. 事先规定:事先规定:序号序号1-301-30为甲组,序号为甲组,序号31-6031-60为乙组,序为乙组,序号号61-9061-90为丙组,序号为丙组,序号91-12091-120为丁组,见表为丁组,见表4-24-2第四行。第四行。(2 2)统计分析方法选择:)统计分析方法选择:1. 对于正态分布且方差齐同的资料,常采用对于正态分布且方差齐同的资料,常采用单因素方差分析单因素方差分析的的单

10、向分类的方差分析单向分类的方差分析或成或成组资料的组资料的 t 检验(检验(g=2););2. 对于非正态分布或方差不齐的资料,可进对于非正态分布或方差不齐的资料,可进行行数据变换数据变换或采用或采用Wilcoxon秩和检验秩和检验。二、变异分解二、变异分解 表4-4 完 全 随 机 设 计 资 料 的 方 差 分 析 表 变 异 来 源 自 由 度 SS MS F 总 变 异 N1 211ingijijXC 组 间 g1 211()inijgjiiXCn SS组间组间 MSMS组 间组 内 组 内 Ng SSSS总组 间 SS组内组内 例例4-2 某医生为了研究一种降血脂新药某医生为了研究一

11、种降血脂新药的临床疗效,按统一纳入标准选择的临床疗效,按统一纳入标准选择120名高名高血脂患者,采用完全随机设计方法将患者血脂患者,采用完全随机设计方法将患者等分为等分为4组(具体分组方法见例组(具体分组方法见例4-1),进行),进行双盲试验。双盲试验。6周后测得周后测得低密度脂蛋白低密度脂蛋白作为试作为试验结果,见表验结果,见表4-3。问。问4个处理组患者的低密个处理组患者的低密度脂蛋白含量总体均数有无差别度脂蛋白含量总体均数有无差别?表表4-3 44-3 4个处理组低密度脂蛋白测量值个处理组低密度脂蛋白测量值(mmol/L)(mmol/L)三、分析步骤三、分析步骤 H0:1234,即4个试

12、验组的总体均数相等 H1:4个试验组的总体均数不全相等 0. 05 按表4- 4中的公式计算各离均差平方和SS、自由度、均方MS和F值。 H0: 即即4个试验组总体均数相等个试验组总体均数相等 H1:4个试验组总体均数不全相等个试验组总体均数不全相等 12340.052 . 计算检验统计量计算检验统计量 :1. 建立检验假设,确定检验水准建立检验假设,确定检验水准: 102.9181.4680.9458.99324.30ijX 2367.85233.00225.54132.13958.52ijX 2(324.30) /120876.42C 958.52876.42=82.10SS总,总=120

13、1=119 2222(102.91)(81.46)(80.94)(58.99)876.4232.1630303030SS组间 413 组间 82.1032.1649.94SS组内, 1204116组内 32.1610.723MS组间,49.940.43116MS组内,10.7224.930.43F 变异来源 自由度 SS MS F P 总变异 119 82.10 组 间 3 32.16 10.72 24.93 0.01 组 内 116 49.94 0.43 表表4-5 完全随机设计方差分析表完全随机设计方差分析表列方差分析表列方差分析表0.053. 确定确定P值,作出推断结论:值,作出推断结论

14、: 按按 水准,拒绝水准,拒绝H0,接受,接受H1,认为,认为4个试验组个试验组ldl-c总体均数不相等,即不同剂量药总体均数不相等,即不同剂量药物对血脂中物对血脂中ldl-c降低影响有差别。降低影响有差别。注意:注意: 方差分析的结果拒绝方差分析的结果拒绝H0,接受,接受H1,不能,不能说明各组总体均数间两两都有差别。如果说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均要分析哪些两组间有差别,可进行多个均数间的多重比较(见本章第六节)。当数间的多重比较(见本章第六节)。当g=2时,完全随机设计方差分析与成组设计资时,完全随机设计方差分析与成组设计资料的料的t 检验等价

15、,有检验等价,有 。tF第三节第三节随机区组设计资料的方差分析随机区组设计资料的方差分析一、随机区组设计一、随机区组设计配伍组设计(randomized block design) 先按影响试验结果的非处理因素(如先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)性别、体重、年龄、职业、病情、病程等)将受试对象配成区组,再分别将各区组内将受试对象配成区组,再分别将各区组内的受试对象随机分配到各处理或对照组。的受试对象随机分配到各处理或对照组。(1 1)随机分组方法)随机分组方法:(2 2)随机区组设计的特点)随机区组设计的特点 随机分配的次数要重复多次,每次随机分随机分配的

16、次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,处理组受试对象数量相同,区组内均衡区组内均衡。 在进行统计分析时,将区组变异离均差平在进行统计分析时,将区组变异离均差平方和从完全随机设计的组内离均差平和中分离方和从完全随机设计的组内离均差平和中分离出来,从而出来,从而减小组内离均差平方和减小组内离均差平方和(误差平方(误差平方和),提高了统计检验效率。和),提高了统计检验效率。 例例4-3 如何按随机区组设计,分配如何按随机区组设计,分配5 5个区组的个区组的1515只小白鼠接受甲、乙、丙三种抗癌药物?只小白鼠接

17、受甲、乙、丙三种抗癌药物? 分组方法分组方法:先将小白鼠按体重编号,体重相先将小白鼠按体重编号,体重相近的近的3只小白鼠配成一个区组,见表只小白鼠配成一个区组,见表4-6。在随机数。在随机数字表中任选一行一列开始的字表中任选一行一列开始的2位数作为位数作为1个随机数,个随机数,如从如从第第8行第行第3列列开始纪录,见表开始纪录,见表4-6;在每个区组内;在每个区组内将随机数按大小排序;各区组中内序号为将随机数按大小排序;各区组中内序号为1的接受的接受甲甲药药、序号为、序号为2的接受的接受乙药乙药、序号为、序号为3的接受的接受丙药丙药,分,分配结果见表配结果见表4-6。表4-6 5个区组小白鼠按

18、随机区组设计分配结果 区组号 1 2 3 4 5 小白鼠 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 随机数 68 35 26 00 99 53 93 61 28 52 70 05 48 34 56 序 号 3 2 1 1 3 2 3 2 1 2 3 1 2 1 3 分配结果 丙 乙 甲 甲 丙 乙 丙 乙 甲 乙 丙 甲 乙 甲 丙 (3 3)统计方法选择)统计方法选择:1. 正态分布且方差齐同的资料,应采用正态分布且方差齐同的资料,应采用单因单因素方差分析的双向分类方差分析素方差分析的双向分类方差分析或配对或配对t检检验(验(g=2););2. 当不满足方差分析

19、和当不满足方差分析和t检验条件时,可对检验条件时,可对数数据 变 换据 变 换 或 采 用 随 机 区 组 设 计 资 料 的或 采 用 随 机 区 组 设 计 资 料 的Friedman M检验检验。 处理因素(g 个水平) 区组 编号 1 2 3 g 1 X11 X21 X31 Xg1 2 X12 X22 X32 Xg2 j X1j X2j X3j Xgj n 1nX 2nX 3nX gnX 表4-7 随机区组设计的试验结果 二、变异分解二、变异分解(1)总变异:总变异:反映所有观察值之间的变异反映所有观察值之间的变异,记为记为SS总总。(2) 处理间变异:处理间变异:由处理因素的不同水平

20、作用和随机由处理因素的不同水平作用和随机误差产生的变异,记为误差产生的变异,记为SS处理处理。(3) 区组间变异:区组间变异:由不同区组作用和随机误差产生的由不同区组作用和随机误差产生的变异,记为变异,记为SS区组区组.(4) 误差变异:误差变异:完全由随机误差产生的变异,记为完全由随机误差产生的变异,记为SS误误差差。对总离均差平方和及其自由度的分解,有对总离均差平方和及其自由度的分解,有: SSSSSSSS处理区组总误差处理区组总误差变异来源 自由度 SS MS F 总变异 N1 211gnijijXC 处理间 g1 2111()gnijijnXC SS处理处理 MSMS处理误差 区组间

21、n1 2111()gnijjigXC SS区组区组 MSMS区组误差 误 差 (n1) (g1) SS总 SS处理-SS区组 SS误差误差 表4-8 随机区组设计资料的方差分析表 三、分析步骤三、分析步骤 例例4-4 某研究者采用随机区组设计进行实某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将果,先将15只染有肉瘤小白鼠按体重大小配只染有肉瘤小白鼠按体重大小配成成5个区组,每个区组内个区组,每个区组内3只小白鼠随机接受只小白鼠随机接受三种抗癌药物(具体分配方法见例三种抗癌药物(具体分配方法见例4-3),),以肉瘤的重量为指标,

22、试验结果见表以肉瘤的重量为指标,试验结果见表4-9。问三种不同的药物的抑瘤效果有无差别?问三种不同的药物的抑瘤效果有无差别?区组 A 药 B 药 C 药 1gijiX 1 0.82 0.65 0.51 1.98 2 0.73 0.54 0.23 1.50 3 0.43 0.34 0.28 1.05 4 0.41 0.21 0.31 0.93 5 0.68 0.43 0.24 1.35 1nijjX 3.07 2.17 1.57 6.81 ()ijX iX 0.614 0.434 0.314 0.454 ()X 21nijjX 2.0207 1.0587 0.5451 3.6245 2()ijX

23、 表表4-9 不同药物作用后小白鼠肉瘤重量不同药物作用后小白鼠肉瘤重量(g g) H0: ,即三种不同药物作用后,即三种不同药物作用后 小白鼠肉瘤重量的小白鼠肉瘤重量的总体均数相等总体均数相等 H1:三种不同药物作用后小白鼠肉瘤重:三种不同药物作用后小白鼠肉瘤重 量的量的总体均数不全相等总体均数不全相等1230.052113.62453.0917=0.5328gnijijSSXC总22221111()(3.072.171.57 ) 3.0917 0.22805gnijijSSXCn 处理2211() /(6.81) /153.0917gnijijCXN 211222221()1 (1.981.

24、501.050.931.35 ) 3.09170.22823gnijjiSSXCg 区组表 4-10 例 4-4的方差分析表 变异来源 自由度 SS MS F P 总变异 14 0.5328 处理间 2 0.2280 0.1140 11.88 0.01 区组间 4 0.2284 0.0571 5.95 0.05 误 差 8 0.0764 0.0096 据据 1=2、 2=8查附表查附表3的的F界值表,得界值表,得 在在=0.05的水准上,拒绝的水准上,拒绝H0,接受,接受H1,认为三,认为三种不同药物作用后小白鼠肉瘤重量的总体均数种不同药物作用后小白鼠肉瘤重量的总体均数不全相等,即不同药物的抑

25、瘤效果有差别。同不全相等,即不同药物的抑瘤效果有差别。同理可对区组间的差别进行检验。理可对区组间的差别进行检验。0.01(2,80.05(2,8)0.01(2,8)4.46, 8.65,11.88, 0.01FFFFP。注意:注意: 方差分析的结果拒绝方差分析的结果拒绝H0,接受,接受H1,不能,不能说明各组总体均数间两两都有差别。如果说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均要分析哪些两组间有差别,可进行多个均数间的多重比较(见本章第六节)。当数间的多重比较(见本章第六节)。当g=2时,随机区组设计方差分析与配对设计资时,随机区组设计方差分析与配对设计资料的料的

26、t 检验等价,有检验等价,有 。tF 随机区组设计确定区组应是对试验结果随机区组设计确定区组应是对试验结果有影响的非处理因素。区组内各试验对象有影响的非处理因素。区组内各试验对象应均衡,区组之间试验对象具有较大的差应均衡,区组之间试验对象具有较大的差异为好,这样利用区组控制非处理因素的异为好,这样利用区组控制非处理因素的影响,并在方差分析时将区组间的变异从影响,并在方差分析时将区组间的变异从组内变异中分解出来。组内变异中分解出来。 因此,当区组间差别有统计学意义时,因此,当区组间差别有统计学意义时,这种设计的误差比完全随机设计小,试验这种设计的误差比完全随机设计小,试验效率得以提高。效率得以提

27、高。第四节拉丁方设计资料的方差分析拉丁方设计资料的方差分析 (不讲(不讲)第五节两阶段交叉设计资料的方差分析两阶段交叉设计资料的方差分析 (不讲)(不讲) 第六节 多个样本均数间的多重比较多个样本均数间的多重比较 (multiple comparisonmultiple comparison)多重比较不能用两样本均数比较多重比较不能用两样本均数比较的的 t t 检验检验! 若用两样本均数比较的若用两样本均数比较的t 检验进行检验进行多重比较,将会加大犯多重比较,将会加大犯类错误(把类错误(把本无差别的两个总体均数判为有差别)本无差别的两个总体均数判为有差别)的概率。的概率。 例如,有例如,有4

28、个样本均数,两两组合数个样本均数,两两组合数为为 ,若用,若用 t 检验做检验做6次比较,且每次比次比较,且每次比较的检验水准定为较的检验水准定为=0.05,则每次比较不犯,则每次比较不犯类错误的概率为(类错误的概率为(10.05),),6次均不犯次均不犯类错误的概率为类错误的概率为 ,这时,总的检验,这时,总的检验水准变为水准变为 ,远比,远比0.05大。因大。因此,样本均数间的多重比较不能用两样本均此,样本均数间的多重比较不能用两样本均数比较的数比较的 t 检验。检验。4( )626(1-0.05)61-(1-0.05)0.26适用条件: 当方差分析的结果为拒绝当方差分析的结果为拒绝H0,

29、接,接受受H1时,只说明时,只说明g个总体均数不全个总体均数不全相等。若想进一步了解哪些两个总相等。若想进一步了解哪些两个总体均数不等,需进行多个样本均数体均数不等,需进行多个样本均数间的两两比较或称多重比较。间的两两比较或称多重比较。一、一、LSD-t检验检验 (least significant difference)适用范围:一对或几对在专业上有特殊适用范围:一对或几对在专业上有特殊 意义的样本均数间的比较。意义的样本均数间的比较。检验统计量检验统计量t的计算公式为的计算公式为LSD, ijijXXXXtS 误差11ijXXijSMSnn误差式中 MSMS误差组内L S D -t 检检

30、验验 公公 式式 与与 两两 样样 本本 均均数数 比比 较较 的的t 检检 验验 公公 式式 区区 别别 在在 于于 两两样样 本本 均均 数数 差差 值值 的的 标标 准准 误误ijXXS和和自自 由由 度度 的的 计计 算算 上上 。 注意:注意: 在两样本均数比较的 t 检验公式里是用合并方差2cS来计算ijXXS,=n1+n22;LSD-t 检验是用方差分析表中的误差均方误差MS来计算ijXXS,=误差。 ,即降血脂新药,即降血脂新药2.4g组与安慰剂组与安慰剂 组的低密度脂蛋白含量总体均数相等组的低密度脂蛋白含量总体均数相等 , 即降血脂新药即降血脂新药2.4g组与安慰剂组与安慰剂

31、 组的低密度脂蛋白含量总体均数不等组的低密度脂蛋白含量总体均数不等=0.05降血脂新药降血脂新药2.4g2.4g组与安慰剂组的比较:组与安慰剂组的比较:02.4g0:H12.4g0:H根根 据据 例例4-2 ,2.4gX=2.72 ,0X=3.43 ,2.4gn=0n=30 ,误差MS=0.43 ,误误 差差=116 。 按按 公公 式式(4-13)和和公公式式(4-14) ijXXS =110.433030=0.17 LSD-t =2.723.430.17=4.18 以以 =116,t=4.18 查查附附表表 2 的的 t 界界值值表表,得得P0.05 1,3 1.30 3 6.85 4.04 5.64 0.01 2,3 0.18 2 4.11 3.26 4.75 0.05 表4-15 多个均数两两比较值 例4-4 已求得误差MS=0.0096,8误差。各组例数均为5,有 0.0096 110.0438255ijXXS。 编辑课件结论:结论:可认为可认为A A药和药和B B药、药、C C药的抑瘤药的抑瘤 效果有差别,还不能认为效果有差别,还不能认为B B药和药和C C药的药的抑瘤效果有差别。抑瘤效果有差别。第七节 多样本方差比较的Bartlett检验和Levene检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论