版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章第四章 多个样本多个样本 均数比较的均数比较的 方差分析方差分析analysis of variance, analysis of variance, ANOVA ANOVA 讲述内容讲述内容第一节第一节 方差分析的根本思想及其运用条件方差分析的根本思想及其运用条件第二节第二节 完全随机设计资料的方差分析完全随机设计资料的方差分析第三节第三节 随机区组设计资料的方差分析随机区组设计资料的方差分析 第四节第四节 拉丁方设计资料的方差分析拉丁方设计资料的方差分析 第五节第五节 两阶段交叉设计资料的方差分析两阶段交叉设计资料的方差分析第六节第六节 多个样本均数间的多重比较多个样本均数间的多重比
2、较第七节第七节 多样本方差比较的多样本方差比较的BartlettBartlett检验检验 和和LeveneLevene检验检验第一节第一节 方差分析的根方差分析的根本思想及其运用条件本思想及其运用条件目的:推断多个总体均数能否有差别。目的:推断多个总体均数能否有差别。 也可用于两个也可用于两个 方法:方差分析,即多个样本均数比较方法:方差分析,即多个样本均数比较 的的F检验。检验。 根本思想:根据实验设计的类型,将全根本思想:根据实验设计的类型,将全部丈量值总的离均差平方和及其自在度部丈量值总的离均差平方和及其自在度分解为两个或多个部分,除随机误差作分解为两个或多个部分,除随机误差作用外,每个
3、部分的变异可由某个要素的用外,每个部分的变异可由某个要素的作用作用(或某几个要素的交互作用或某几个要素的交互作用)加以解加以解释释 。运用条件:运用条件: 总体总体正态且方差相等正态且方差相等 样本样本独立、随机独立、随机设计类型:设计类型:完全随机设计资料的方差分析完全随机设计资料的方差分析随机区组设计资料的方差分析随机区组设计资料的方差分析拉丁方设计资料的方差分析拉丁方设计资料的方差分析两阶段交叉设计资料的方差分析两阶段交叉设计资料的方差分析2221122(,),(,),(,)ggNNN表 4-1 g 个处理组的试验结果 处理分组 测量值 统计量 1 水平 X11 X12 X1j 1nX1
4、 n1 1X S1 2 水平 X21 X22 X2j 2nX2 n2 2X S2 g 水平 Xg1 Xg2 Xgj ggnX ng gX Sg 完全随机设计资料的方差分析的根本思想完全随机设计资料的方差分析的根本思想 合计合计 N S 第第i个处置组第个处置组第j个察看结果个察看结果XijX变异离均差平方和分解:变异离均差平方和分解:离均差平方和离均差平方和(sum of squares of deviations from mean,SS) :2211,2 (1)ingNijiji jSSXXXXNS1.1.总变异总变异: : 一切丈量值之间总一切丈量值之间总的变异程度,计算公式为的变异程度
5、,计算公式为2212111,iinnggijijijNiji jijXCSSXXXC 总2211,()()ingNijijiji jXXCNN校正系数:校正系数:1N总 2组间变异:各组均数与总均数的离均差平方和,表组间变异:各组均数与总均数的离均差平方和,表示处置要素的作用和随机误差的影响,计算公式为:示处置要素的作用和随机误差的影响,计算公式为: 假设有假设有g个总体均数有差别个总体均数有差别 假设无假设无g个总体均数无差别个总体均数无差别21211()()inijjggiiiiiXSSn XXCn组间1g组间211()ingijiijSSXX组内Ng组内SSSSSS总组间组内总组间组内三
6、种变异的关系:三种变异的关系:SSMSSSMS组间组间组间组内组内组内 均方差,均方均方差,均方(mean square(mean square,MS)MS)。 检验统计量:检验统计量:假设假设 ,那么,那么 都都为随机误差为随机误差 的估计,的估计,F F值应接近于值应接近于1 1。假设假设 不全相等,不全相等,F F值将明显大于值将明显大于1 1。用用F F界值单侧界值确定界值单侧界值确定P P值。值。12, , MSFMS组间组间组内组内12g,MSMS组间组内212,g 第二节第二节完全随机设计资料的方差分析完全随机设计资料的方差分析 将全部实验对象分配到g个处置组程度组,各组分别接受
7、不同的处置,实验终了后比较各组均数之间的差别有无统计学意义,推论处置要素的效应。一、完全随机设计一、完全随机设计 例4-1 某医生为了研讨一种降血脂新药的临床疗效,按一致纳入规范选择120名患者,采用完全随机设计方法将患者等分为4组进展双盲实验。问如何进展分组?1 1完全随机分组方法:完全随机分组方法: 1. 编号:编号:120名高血脂患者从名高血脂患者从1开场到开场到120,见表见表4-2第第1行;行;2. 取随机数字:从附表取随机数字:从附表15中的任一行任中的任一行任一列开场,如第一列开场,如第5行第行第7列开场,依次列开场,依次读取三位数作为一个随机数录于编号读取三位数作为一个随机数录
8、于编号下,见表下,见表4-2第第2行;行;表4-2 完全随机设计分组结果 编 号 1 2 3 4 5 6 7 8 9 10 119 120 随机数 260 873 373 204 056 930 160 905 886 958 220 634 序 号 24 106 39 15 3 114 13 109 108 117 16 75 分组结果 甲 丁 乙 甲 甲 丁 甲 丁 丁 丁 甲 丙 3. 3. 编序号:按数字从小到大编序号:按数字从小到大 ( (数据一样那么按先后顺数据一样那么按先后顺序编序号,见表序编序号,见表4-24-2第第3 3行。行。4. 4. 事先规定:序号事先规定:序号1-30
9、1-30为甲组,序号为甲组,序号31-6031-60为乙组,序为乙组,序号号61-9061-90为丙组,序号为丙组,序号91-12091-120为丁组,见表为丁组,见表4-24-2第四行。第四行。2 2统计分析方法选择:统计分析方法选择:1. 对于正态分布且方差齐同的资料,常采用对于正态分布且方差齐同的资料,常采用单要素方差分析的单向分类的方差分析或成单要素方差分析的单向分类的方差分析或成组资料的组资料的 t 检验检验g=2;2. 对于非正态分布或方差不齐的资料,可进对于非正态分布或方差不齐的资料,可进展数据变换或采用展数据变换或采用Wilcoxon秩和检验。秩和检验。二、变异分解二、变异分解
10、 表4-4 完 全 随 机 设 计 资 料 的 方 差 分 析 表 变 异 来 源 自 由 度 SS MS F 总 变 异 N1 211ingijijXC 组 间 g1 211()inijgjiiXCn SS组间组间 MSMS组 间组 内 组 内 Ng SSSS总组 间 SS组内组内 例4-2 某医生为了研讨一种降血脂新药的临床疗效,按一致纳入规范选择120名高血脂患者,采用完全随机设计方法将患者等分为4组详细分组方法见例4-1,进展双盲实验。6周后测得低密度脂蛋白作为实验结果,见表4-3。问4个处置组患者的低密度脂蛋白含量总体均数有无差别?表表4-3 44-3 4个处置组低密度脂蛋白丈量值个
11、处置组低密度脂蛋白丈量值(mmol/L)(mmol/L)三、分析步骤三、分析步骤 H0:1234,即4个试验组的总体均数相等 H1:4个试验组的总体均数不全相等 0. 05 按表4- 4中的公式计算各离均差平方和SS、自由度、均方MS和F值。 H0: 即即4个实验组总体均数相个实验组总体均数相等等 H1:4个实验组总体均数不全相等个实验组总体均数不全相等 12340.052 . 计算检验统计量计算检验统计量 :1. 建立检验假设,确定检验水准建立检验假设,确定检验水准: 102.9181.4680.9458.99324.30ijX 2367.85233.00225.54132.13958.52
12、ijX 2(324.30) /120876.42C 958.52876.42=82.10SS总,总=1201=119 2222(102.91)(81.46)(80.94)(58.99)876.4232.1630303030SS组间 413 组间 82.1032.1649.94SS组内, 1204116组内 32.1610.723MS组间,49.940.43116MS组内,10.7224.930.43F 变异来源 自由度 SS MS F P 总变异 119 82.10 组 间 3 32.16 10.72 24.93 0.01 组 内 116 49.94 0.43 表表4-5 完全随机设计方差分析
13、表完全随机设计方差分析表列方差分析表列方差分析表0.053. 确定确定P值,作出推断结论:值,作出推断结论: 按按 水准,回绝水准,回绝H0,接受,接受H1,以为以为4个实验组个实验组ldl-c总体均数不相等,即总体均数不相等,即不同剂量药物对血脂中不同剂量药物对血脂中ldl-c降低影响有差降低影响有差别。别。留意:留意: 方差分析的结果回绝H0,接受H1,不能阐明各组总体均数间两两都有差别。假设要分析哪些两组间有差别,可进展多个均数间的多重比较见本章第六节。当g=2时,完全随机设计方差分析与成组设计资料的t 检验等价,有 。tF第三节第三节随机区组设计资料的方随机区组设计资料的方差分析差分析
14、一、随机区组设计一、随机区组设计配伍组设计配伍组设计(randomized block design) 先按影响实验结果的非处置要素如性别、体重、年龄、职业、病情、病程等将受试对象配成区组,再分别将各区组内的受试对象随机分配到各处置或对照组。1 1随机分组方法:随机分组方法:2 2随机区组设计的特点随机区组设计的特点 随机分配的次数要反复多次,每次随机分配都对同一个区组内的受试对象进展,且各个处置组受试对象数量一样,区组内平衡。 在进展统计分析时,将区组变异离均差平方和从完全随机设计的组内离均差平和中分别出来,从而减小组内离均差平方和误差平方和,提高了统计检验效率。 例4-3 如何按随机区组设
15、计,分配5个区组的15只小白鼠接受甲、乙、丙三种抗癌药物? 分组方法:先将小白鼠按体重编号,体重相近的3只小白鼠配成一个区组,见表4-6。在随机数字表中任选一行一列开场的2位数作为1个随机数,如从第8行第3列开场纪录,见表4-6;在每个区组内将随机数按大小排序;各区组中内序号为1的接受甲药、序号为2的接受乙药、序号为3的接受丙药,分配结果见表4-6。表4-6 5个区组小白鼠按随机区组设计分配结果 区组号 1 2 3 4 5 小白鼠 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 随机数 68 35 26 00 99 53 93 61 28 52 70 05 48 34
16、56 序 号 3 2 1 1 3 2 3 2 1 2 3 1 2 1 3 分配结果 丙 乙 甲 甲 丙 乙 丙 乙 甲 乙 丙 甲 乙 甲 丙 3 3统计方法选择:统计方法选择:1. 正态分布且方差齐同的资料,应采用单要正态分布且方差齐同的资料,应采用单要素方差分析的双向分类方差分析或配对素方差分析的双向分类方差分析或配对t检检验验g=2;2. 当不满足方差分析和当不满足方差分析和t检验条件时,可对数检验条件时,可对数据 变 换 或 采 用 随 机 区 组 设 计 资 料 的据 变 换 或 采 用 随 机 区 组 设 计 资 料 的Friedman M检验。检验。 处理因素(g 个水平) 区组
17、 编号 1 2 3 g 1 X11 X21 X31 Xg1 2 X12 X22 X32 Xg2 j X1j X2j X3j Xgj n 1nX 2nX 3nX gnX 表4-7 随机区组设计的实验结果 二、变异分解二、变异分解(1)总变异:反映一切察看值之间的变异总变异:反映一切察看值之间的变异,记为记为SS总。总。(2) 处置间变异:由处置要素的不同程度作用和随机处置间变异:由处置要素的不同程度作用和随机误差产生的变异,记为误差产生的变异,记为SS处置。处置。(3) 区组间变异:由不同区组作用和随机误差产生的区组间变异:由不同区组作用和随机误差产生的变异,记为变异,记为SS区组区组.(4)
18、误差变异:完全由随机误差产生的变异,记为误差变异:完全由随机误差产生的变异,记为SS误差。误差。对总离均差平方和及其自在度的分解,有对总离均差平方和及其自在度的分解,有: SSSSSSSS处理区组总误差处理区组总误差变异来源 自由度 SS MS F 总变异 N1 211gnijijXC 处理间 g1 2111()gnijijnXC SS处理处理 MSMS处理误差 区组间 n1 2111()gnijjigXC SS区组区组 MSMS区组误差 误 差 (n1) (g1) SS总 SS处理-SS区组 SS误差误差 表4-8 随机区组设计资料的方差分析表 三、分析步骤三、分析步骤 例4-4 某研讨者采
19、用随机区组设计进展实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体艰苦小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物详细分配方法见例4-3,以肉瘤的分量为目的,实验结果见表4-9。问三种不同的药物的抑瘤效果有无差别?区组 A 药 B 药 C 药 1gijiX 1 0.82 0.65 0.51 1.98 2 0.73 0.54 0.23 1.50 3 0.43 0.34 0.28 1.05 4 0.41 0.21 0.31 0.93 5 0.68 0.43 0.24 1.35 1nijjX 3.07 2.17 1.57 6.81 ()ijX iX 0.614 0
20、.434 0.314 0.454 ()X 21nijjX 2.0207 1.0587 0.5451 3.6245 2()ijX 表表4-9 4-9 不同药物作用后小白鼠肉瘤分量不同药物作用后小白鼠肉瘤分量g g H0: ,即三种不同药物作用后,即三种不同药物作用后 小白鼠肉瘤分量的总体均数相等小白鼠肉瘤分量的总体均数相等 H1:三种不同药物作用后小白鼠肉瘤重:三种不同药物作用后小白鼠肉瘤重 量的总体均数不全相等量的总体均数不全相等1230.052113.62453.0917=0.5328gnijijSSXC总22221111()(3.072.171.57 ) 3.0917 0.22805gni
21、jijSSXCn 处理2211() /(6.81) /153.0917gnijijCXN 211222221()1 (1.981.501.050.931.35 ) 3.09170.22823gnijjiSSXCg 区组表 4-10 例 4-4的方差分析表 变异来源 自由度 SS MS F P 总变异 14 0.5328 处理间 2 0.2280 0.1140 11.88 0.01 区组间 4 0.2284 0.0571 5.95 0.05 误 差 8 0.0764 0.0096 据据 1=2、 2=8查附表查附表3的的F界值表,得界值表,得 在在=0.05的水准上,回绝的水准上,回绝H0,接受
22、,接受H1,以为三种不同,以为三种不同药物作用后小白鼠肉瘤分量的总体均数不全相等,即药物作用后小白鼠肉瘤分量的总体均数不全相等,即不同药物的抑瘤效果有差别。同理可对区组间的差别不同药物的抑瘤效果有差别。同理可对区组间的差别进展检验。进展检验。0.01(2,80.05(2,8)0.01(2,8)4.46, 8.65,11.88, 0.01FFFFP。留意:留意: 方差分析的结果回绝H0,接受H1,不能阐明各组总体均数间两两都有差别。假设要分析哪些两组间有差别,可进展多个均数间的多重比较见本章第六节。当g=2时,随机区组设计方差分析与配对设计资料的t 检验等价,有 。tF 随机区组设计确定区组应是
23、对实验结果随机区组设计确定区组应是对实验结果有影响的非处置要素。区组内各实验对象有影响的非处置要素。区组内各实验对象应平衡,区组之间实验对象具有较大的差应平衡,区组之间实验对象具有较大的差别为好,这样利用区组控制非处置要素的别为好,这样利用区组控制非处置要素的影响,并在方差分析时将区组间的变异从影响,并在方差分析时将区组间的变异从组内变异中分解出来。组内变异中分解出来。 因此,当区组间差别有统计学意义时,因此,当区组间差别有统计学意义时,这种设计的误差比完全随机设计小,实验这种设计的误差比完全随机设计小,实验效率得以提高。效率得以提高。第四节拉丁方设计资料的方差分析拉丁方设计资料的方差分析 不
24、讲不讲第五节两阶段交叉设计资料的方差分析两阶段交叉设计资料的方差分析 不讲不讲 第六节 多个样本均数间的多重比较多个样本均数间的多重比较 multiple comparisonmultiple comparison多重比较不能用两样本均数比较多重比较不能用两样本均数比较的的 t t 检验!检验! 假设用两样本均数比较的t 检验进展多重比较,将会加大犯类错误把本无差别的两个总体均数判为有差别的概率。 例如,有4个样本均数,两两组合数为 ,假设用 t 检验做6次比较,且每次比较的检验水准定为=0.05,那么每次比较不犯类错误的概率为10.05,6次均不犯类错误的概率为 ,这时,总的检验水准变为 ,
25、远比0.05大。因此,样本均数间的多重比较不能用两样本均数比较的 t 检验。4( )626(1-0.05)61-(1-0.05)0.26适用条件: 当方差分析的结果为回绝H0,接受H1时,只阐明g个总体均数不全相等。假想象进一步了解哪些两个总体均数不等,需进展多个样本均数间的两两比较或称多重比较。一、一、LSD-t检验检验 least significant difference适用范围:一对或几对在专业上有特殊适用范围:一对或几对在专业上有特殊 意义的样本均数间的比较。意义的样本均数间的比较。检验统计量检验统计量t的计算公式为的计算公式为LSD, ijijXXXXtS 误差11ijXXijS
26、MSnn误差式中 MSMS误差组内L S D -t 检检 验验 公公 式式 与与 两两 样样 本本 均均数数 比比 较较 的的t 检检 验验 公公 式式 区区 别别 在在 于于 两两样样 本本 均均 数数 差差 值值 的的 标标 准准 误误ijXXS和和自自 由由 度度 的的 计计 算算 上上 。 留意:留意: 在两样本均数比较的 t 检验公式里是用合并方差2cS来计算ijXXS,=n1+n22;LSD-t 检验是用方差分析表中的误差均方误差MS来计算ijXXS,=误差。 ,即降血脂新药,即降血脂新药2.4g组与抚慰剂组与抚慰剂 组的低密度脂蛋白含量总体均数相等组的低密度脂蛋白含量总体均数相等
27、 , 即降血脂新药即降血脂新药2.4g组与抚慰剂组与抚慰剂 组的低密度脂蛋白含量总体均数不等组的低密度脂蛋白含量总体均数不等=0.05降血脂新药降血脂新药2.4g2.4g组与抚慰剂组的比较:组与抚慰剂组的比较:02.4g0:H12.4g0:H根根 据据 例例4-2 ,2.4gX=2.72 ,0X=3.43 ,2.4gn=0n=30 ,误差MS=0.43 ,误误 差差=116 。 按按 公公 式式(4-13)和和公公式式(4-14) ijXXS =110.433030=0.17 LSD-t =2.723.430.17=4.18 以以 =116,t=4.18 查查附附表表 2 的的 t 界界值值表表,得得P0.05 1,3 1.30 3 6.85 4.04 5.64 0.01 2,3 0.18 2 4.11 3.26 4.75 0.05 表4-15 多个均数两两比较值 例4-4 已求得误差MS=0.0096,8误差。各组例数均为5,有 0.0096 110.0438255ijXXS。 结论:可以为结论:可以为A A药和药和B B药、药、C C药的抑瘤药的抑瘤 效果有差别,还不能以为效果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024护理安全培训
- 物理因子疗法及康复护理水疗法
- 医护理系彭芳
- 实验室主任安全培训
- 大班语言活动生字表
- 对新员工的财务培训
- 7月珠宝活动策划方案
- 数学学案:课堂导学函数的表示方法第课时分段函数
- 2岁护理方法和技巧
- 健康扶贫培训教材
- 第五单元学雷锋在行动(教案)全国通用五年级下册综合实践活动
- 服装店人员不稳定分析报告
- GB 37219-2023充气式游乐设施安全规范
- NB-T 47013.7-2012(JB-T 4730.7) 4730.7 承压设备无损检测 第7部分:目视检测
- 《梯形的认识》(课件)-四年级上册数学人教版
- 肝吸虫护理查房课件
- 北京开放大学《现代管理专题》终结性考试复习题库(附答案)
- 小腿抽筋的原因以及缓解和自救方法定稿
- 2023年度高级会计实务真题及答案解析
- 南开大学答辩通用模板
- 国网福建省电力有限公司高校毕业生招聘笔试真题2021
评论
0/150
提交评论