多个样本均数比较的方差分析 医学统计学 教学课件_第1页
多个样本均数比较的方差分析 医学统计学 教学课件_第2页
多个样本均数比较的方差分析 医学统计学 教学课件_第3页
多个样本均数比较的方差分析 医学统计学 教学课件_第4页
多个样本均数比较的方差分析 医学统计学 教学课件_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 多个样本均数比较 的方差分析Analysis of Variance, ANOVA Content1. Basal ideal and application conditions2. ANOVA of completely random designed data 3. ANOVA of randomized block designed data4. ANOVA of latin square designed data 5. ANOVA of cross-over designed data 6. Multiple comparison of sample means7. Bar

2、tlett test and Levene test 第一节 方差分析的根本思想及其应用条件目的:推断多个总体均数是否有差异。 也可用于两个 方法:方差分析,即多个样本均数比较 的F检验。 根本思想:根据资料设计的类型及研究目的,可将总变异分解为两个或多个局部,每个局部的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误差,即可了解该因素对测定结果有无影响。应用条件: 总体正态且方差相等 样本独立、随机设计类型:完全随机设计资料的方差分析随机区组设计资料的方差分析拉丁方设计资料的方差分析两阶段交叉设计资料的方差分析完全随机设计资料的方差分析的根本思想 合计 N S :第i个处理

3、组第j个观察结果记总均数为 ,各处理组均数为 ,总例数为Nnl+n2+ng,g为处理组数。 1.总变异:全部测量值大小不同,这种变异称为总变异。总变异的大小可以用离均差平方和(sum of squares of deviations from mean,SS)表示,即各测量值Xij与总均数差值的平方和,记为SS总。总变异SS总反映了所有测量值之间总的变异程度。 计算公式为其中:2组间变异: 各处理组由于接受处理的水平不同,各组的样本均数 (i1,2,g)也大小不等,这种变异称为组间变异。其大小可用各组均数与总均数的离均差平方和表示,记为SS组间 。计算公式为3组内变异: 在同一处理组中,虽然每

4、个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异误差。组内变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示,记为SS组内, 表示随机误差的影响。 三种变异的关系: 均方差,均方(mean square,MS)。 检验统计量:如果 ,那么 都为随机误差 的估计,F值应接近于1。如果 不全相等,F值将明显大于1。用F界值单侧界值确定P值。第二节完全随机设计资料的方差分析 (completely random design)是采用完全随机化的分组方法,将全部试验对象分配到g个处理组水平组,各组分别接受不同的处理,试验结束后比较各组均数之间的差异有无统计学意义,推论处理因

5、素的效应。一、完全随机设计 例4-1 某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名患者,采用完全随机设计方法将患者等分为4组进行双盲试验。问如何进行分组?1完全随机分组方法: 1. 编号:120名高血脂患者从1开始到120,见表4-2第1行P72;2. 取随机数字:从附表15中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下,见表4-2第2行;3. 编序号:将全部随机数字从小到大 (数据相同那么按先后顺序编序号,见表4-2第3行。4. 事先规定:序号1-30为甲组,序号31-60为乙组,序号61-90为丙组,序号91-120为丁组,见表4-2

6、第四行。2统计分析方法选择:1. 对于正态分布且方差齐同的资料,常采用完全随机设计的单因素方差分析(one-way ANOVA)或成组资料的 t 检验g=2;2. 对于非正态分布或方差不齐的资料,可进行数据变换或采用Wilcoxon秩和检验。二、变异分解 例4-2 某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组具体分组方法见例4-1,进行双盲试验。6周后测得低密度脂蛋白作为试验结果,见表4-3。问4个处理组患者的低密度脂蛋白含量总体均数有无差异?表4-3 4个处理组低密度脂蛋白测量值(mmol/L)三、分析步骤 H0: 即4个

7、试验组总体均数相等 H1:4个试验组总体均数不全相等 2 . 计算检验统计量 :1. 建立检验假设,确定检验水准:表4-5 完全随机设计方差分析表列方差分析表3. 确定P值,作出推断结论: 按 水准,拒绝H0,接受H1,认为4个试验组ldl-c总体均数不相等,即不同剂量药物对血脂中ldl-c降低影响有差异。注意: 方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差异。如果要分析哪些两组间有差异,可进行多个均数间的多重比较见本章第六节。当g=2时,完全随机设计方差分析与成组设计资料的t 检验等价,有 。第三节随机区组设计资料的方差分析一、随机区组设计配伍组设计(randomize

8、d block design) 随机区组设计(randomized block design)又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素如性别、体重、年龄、职业、病情、病程等将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。 1随机分组方法:2随机区组设计的特点 随机分配的次数要重复屡次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同。区组内均衡。 在进行统计分析时,将区组变异离均差平方和从完全随机设计的组内离均差平和中别离出来,从而减小组内离均差平方和误差平方和,提高了统计检验效率。 例4-3 如

9、何按随机区组设计,分配5个区组的15只小白鼠接受甲、乙、丙三种抗癌药物? 分组方法:先将小白鼠按体重编号,体重相近的3只小白鼠配成一个区组,见表4-6。在随机数字表中任选一行一列开始的2位数作为1个随机数,如从第8行第3列开始纪录,见表4-6;在每个区组内将随机数按大小排序;各区组中内序号为1的接受甲药、序号为2的接受乙药、序号为3的接受丙药,分配结果见表4-6。3统计方法选择:1. 正态分布且方差齐同的资料,应采用两因素处理、配伍方差分析(two-way ANOVA)或配对t检验g=2;2. 当不满足方差分析和t检验条件时,可对数据进行变换或采用随机区组设计资料的Friedman M检验。

10、表4-7 随机区组设计的试验结果 二、变异分解(1)总变异:反映所有观察值之间的变异,记为SS总。(2) 处理间变异:由处理因素的不同水平作用和随机误差产生的变异,记为SS处理。(3) 区组间变异:由不同区组作用和随机误差产生的变异,记为SS区组.(4) 误差变异:完全由随机误差产生的变异,记为SS误差。对总离均差平方和及其自由度的分解,有: 表4-8 随机区组设计资料的方差分析表 三、分析步骤 例4-4 某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物具体分配方法见例4-3,以肉瘤

11、的重量为指标,试验结果见表4-9。问三种不同的药物的抑瘤效果有无差异? 表4-9 不同药物作用后小白鼠肉瘤重量g H0: ,即三种不同药物作用后 小白鼠肉瘤重量的总体均数相等 H1:三种不同药物作用后小白鼠肉瘤重 量的总体均数不全相等 据1=2、2=8查附表3的F界值表,得 在的水准上,拒绝H0,接受H1,认为三种不同药物作用后小白鼠肉瘤重量的总体均数不全相等,即不同药物的抑瘤效果有差异。同理可对区组间的差异进行检验。注意: 方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差异。如果要分析哪些两组间有差异,可进行多个均数间的多重比较见本章第六节。当g=2时,随机区组设计方差分析

12、与配对设计资料的t 检验等价,有 。 随机区组设计确定区组因素应是对试验结果有影响的非处理因素。区组内各试验对象应均衡,区组之间试验对象具有较大的差异为好,这样利用区组控制非处理因素的影响,并在方差分析时将区组间的变异从组内变异中分解出来。 因此,当区组间差异有统计学意义时,这种设计的误差比完全随机设计小,试验效率得以提高。第四节拉丁方设计资料的方差分析 不讲第五节两阶段交叉设计资料的方差分析 不讲 第六节多个样本均数间的多重比较 multiple comparison多重比较不能用两样本均数比较的 t 检验! 假设用两样本均数比较的t 检验进行多重比较,将会加大犯类错误把本无差异的两个总体均

13、数判为有差异的概率。 例如,有4个样本均数,两两组合数为 ,假设用 t 检验做6次比较,且每次比较的检验水准定为=0.05,那么每次比较不犯类错误的概率为1,6次均不犯类错误的概率为 ,这时,总的检验水准变为 ,远比大。因此,样本均数间的多重比较不能用两样本均数比较的 t 检验。适用条件: 当方差分析的结果为拒绝H0,接受H1时,只说明g个总体均数不全相等。假设想进一步了解哪些两个总体均数不等,需进行多个样本均数间的两两比较或称多重比较。一、LSD-t检验 least significant difference适用范围:一对或几对在专业上有特殊 意义的样本均数间的比较。检验统计量t的计算公式

14、为式中 注意: 例4-7 对例4-2资料,问高血脂患者的降血脂新药g组、g组、g组与抚慰剂组的低密度脂蛋白含量总体均数有无差异? ,即降血脂新药组与抚慰剂 组的低密度脂蛋白含量总体均数相等 , 即降血脂新药组与抚慰剂 组的低密度脂蛋白含量总体均数不等降血脂新药组与抚慰剂组的比较: 新药组VS抚慰剂组: LSD-t为组VS抚慰剂组: LSD-t 为。 同理:按 水准,降血脂新药组、组与抚慰剂组间差异有统计学意义。二、Dunnett- t 检验 适用条件:g-1个实验组与一个对照组均数差异的多重比较,检验统计量为t ,亦称t检验。 式中 计算公式为:Dunnett- 例4-8 对例4-2资料,问高

15、血脂患者的三个不同剂量降血脂新药组与抚慰剂组的低密度脂蛋白含量总体均数是否有差异?H0:i=0,即各实验组与抚慰剂组的低密度 脂蛋白含 量总体均数相等H1:i 0,即各实验组与抚慰剂组的低密度 脂蛋白含量总体均数不等Dunnett-Dunnett-Dunnett-三、SNK-q检验Student-Newman-Keuls 适用于多个样本均数两两之间的全面比较。检验统计量q的计算公式为例4-9 对例4-4资料,问三种不同药物的抑瘤效果两两之间是否有差异?H0:A=B,即任两比照较组的总体均数相等H1:AB,即任两比照较组的总体均数不相等将三个样本均数由小到大排列,并编组次: 列出比照组,并计算两比照组的均数之差,写出两比照组包含的组数a。 =8和a,查附表4的q界值,得出相应的q界值。 以实际的q值和相应的q界值作比较,确定对应的P值 。表4-15 多个均数两两比较值 结论:可认为A药和B药、C药的抑瘤 效果有差异,还不能认为B药和C药的抑瘤效果有差异。第七节 多样本方差比较的Bartlett检验和Levene检验 在进行方差分析时要求所比照的各

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论