《医学方差分析》课件_第1页
《医学方差分析》课件_第2页
《医学方差分析》课件_第3页
《医学方差分析》课件_第4页
《医学方差分析》课件_第5页
已阅读5页,还剩127页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析

AnalysisofVariance(ANOVA)

因素也称为处理因素(factor)(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。一个因素(水平间独立)——单向方差分析

一个个体多个测量值——重复测量资料的方差分析

目的:用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。1方差分析

AnalysisofVariance(ANO方差分析的条件

一、方差分析的假定条件1.各处理组样本来自随机、独立的正态总体(D法、W法、卡方检验);2.各处理组样本的总体方差相等(不等会增加I型错误的概率,影响方差分析结果的判断)

二、方差齐性检验1.Bartlett检验法2.Levene等3.最大方差与最小方差之比<3,初步认为方差齐同。2方差分析的条件一、方差分析的假定条件2某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组,进行双盲试验。6周后测得低密度脂蛋白作为试验结果。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?3某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择1一个因素(factor):降脂药四个水平(level)(a=4个处理组):A安慰剂、B、C、D,i=1,2,3,4分别代表A、B、C、D每水平有ni=30只大白鼠,分别表示为j=1,2,…,30因变量用Xij表示,即第i组第j号大鼠的血中低密度脂蛋白的含量按完全随机化设计方法将N=120只动物随机等分成4个组4一个因素(factor):降脂药4ANOVA由英国统计学家R.A.Fisher首创,为纪念Fisher,以F命名,故方差分析又称F检验(Ftest)。用于推断多个总体均数有无差异5ANOVA由英国统计学家R.A.Fisher首创,单向方差分析One-wayanalysisofvariance方差分析的基本思想将所有测量值间的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。6单向方差分析方差分析的基本思想将所有测量值间的总一、离均差平方和的分解组间变异总变异组内变异7一、离均差平方和的分解组间变异总变异组内变异7对于例8-1(完全随机设计)

资料,共有三种不同的变异

总变异(Totalvariation):全部测量值Yij与总均数间的差异

组间变异(betweengroupvariation):各组的均数与总均数间的差异组内变异(withingroupvariation):每组的每个测量值Yij与该组均数的差异下面用离均差平方和(sumofsquaresofdeviationsfrommean,SS)反映变异的大小

8对于例8-1(完全随机设计)

资料,共有三种不同的变异总变

1.总变异:

所有测量值之间总的变异程度,计算公式校正系数:91.总变异:所有测量值之间总的变异程度,计表4-34个处理组低密度脂蛋白测量值(mmol/L)didj总变异SS总10表4-34个处理组低密度脂蛋白测量值(mmol/L)

2.组间变异:各组均数与总均数的离均差平方和,计算公式为SS组间反映了各组均数

的变异程度组间变异=①随机误差+②处理因素效应

112.组间变异:各组均数与总均数的离均差平方表4-34个处理组低密度脂蛋白测量值(mmol/L)dj组间变异SS组间存在组间变异的原因有:①随机误差(包括个体变异和测量误差);②处理的不同水平可能对试验结果的影响。12表4-34个处理组低密度脂蛋白测量值(mmol/L)3.组内变异:在同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异,也称SS误差。用各组内各测量值Yij与其所在组的均数差值的平方和来表示,反映随机误差的影响。计算公式为133.组内变异:在同一处理组内,虽然每个受试对象接受的表4-34个处理组低密度脂蛋白测量值(mmol/L)组内变异SS组内djdj存在组内变异的原因有:①随机误差(包括个体变异和测量误差);14表4-34个处理组低密度脂蛋白测量值(mmol/L)三种“变异”之间的关系离均差平方和分解:15三种“变异”之间的关系15二、变异分解

处理效应+随机误差随机误差016二、变异分解处理效应+随机误差随机误差016

均方差,均方(meansquare,MS)17均方差,均方(meansquare,MS)17

二、F值与F分布,18二、F值与F分布,18F分布曲线19F分布曲线19F界值表附表5F界值表(方差分析用,单侧界值)上行:P=0.05下行:P=0.01分母自由度υ2分子的自由度,υ1123456

1161200216225230234

405249995403562557645859

218.5119.0019.1619.2519.3019.33

98.4999.0099.1799.2599.3099.33

254.243.392.992.762.602.49

7.775.574.684.183.853.63

520F界值表附表5F界值表(方差分析用,单侧界值)分母自F分布曲线下面积与概率21F分布曲线下面积与概率212222某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组,进行双盲试验。6周后测得低密度脂蛋白作为试验结果。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?23某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择1三、分析步骤

H0:即4个试验组总体均数相等H1:4个试验组总体均数不全相等

2.计算检验统计量:1.建立检验假设,确定检验水准:24三、分析步骤H0:2525表4-5完全随机设计方差分析表列方差分析表26表4-5完全随机设计方差分析表列方差分析表263.确定P值,作出推断结论:

按水准,拒绝H0,接受H1,认为4个试验组ldl-c总体均数不相等,即不同剂量药物对血脂中ldl-c降低影响有差别。273.确定P值,作出推断结论:27四、下结论注意:当组数为2时,完全随机设计的方差分析结果与两样本均数比较的t检验结果等价,对同一资料,有:28四、下结论注意:当组数为2时,完全随机设计的方多样本方差比较的Bartlett检验和Levene检验29多样本方差比较的Bartlett检验和Levene检验29

在进行方差分析时要求所对比的各组即各样本的总体方差必须是相等的,这一般需要在作方差分析之前,先对资料的的方差齐性进行检验,特别是在样本方差相差悬殊时,应注意这个问题。对两样本方差进行齐性检验的方法前已介绍。本节介绍多样本(也适用于两样本)方差齐性检验的Bartlett检验法和Levene检验法。30在进行方差分析时要求所对比的各组即各样本的总一、Bartlett检验31一、Bartlett检验31323233333434例4-2的方差齐性检验表

35例4-2的方差齐性检验表35

3636二、Levene检验资料要求:可不具有正态性。检验统计量:F计算公式:F37二、Levene检验资料要求:可不具有正态性。F37式中38式中38检验步骤:39检验步骤:39平均值之间的多重比较不拒绝H0,表示拒绝总体均数相等的证据不足————>分析终止。拒绝H0,接受H1,表示总体均数不全相等哪两两均数之间相等?哪两两均数之间不等?————>需要进一步作多重比较。40平均值之间的多重比较不拒绝H0,表示拒绝总体均数相等的证据不控制累积Ⅰ类错误概率增大的方法采用Bonferroni法、SNK法和Tukey法等方法41控制累积Ⅰ类错误概率增大的方法采用Bonferroni法、S累积Ⅰ类错误的概率为α’当有k个均数需作两两比较时,比较的次数共有c==k!/(2!(k-2)!)=k(k-1)/2设每次检验所用Ⅰ类错误的概率水准为α,累积Ⅰ类错误的概率为α’,则在对同一实验资料进行c次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积Ⅰ类错误概率α’与c有下列关系:α’=1-(1-α)c(8.6)例如,设α=0.05,c=3(即k=3),其累积Ⅰ类错误的概率为α’=1-(1-0.05)3=1-(0.95)3=0.14342累积Ⅰ类错误的概率为α’当有k个均数需作两两比较时,比较的次一、LSD-t检验

(leastsignificantdifference)适用范围:一对或几对在专业上有特殊意义的样本均数间的比较。43一、LSD-t检验

(leastsignificant检验统计量t的计算公式为式中

44检验统计量t的计算公式为式中44注意:

45注意:454646

例4-7对例4-2资料,问高血脂患者的降血脂新药2.4g组、4.8g组、7.2g组与安慰剂组的低密度脂蛋白含量总体均数有无差别?47例4-7对例4-2资料,问高血脂患者的,即降血脂新药2.4g组与安慰剂组的低密度脂蛋白含量总体均数相等,

即降血脂新药2.4g组与安慰剂组的低密度脂蛋白含量总体均数不等α=0.05降血脂新药2.4g组与安慰剂组的比较:48,即4949

新药4.8g组VS安慰剂组:LSD-t为-4.297.2g组VS安慰剂组:LSD-t为-8.59。

同理:按水准,降血脂新药4.8g组、7.2g组与安慰剂组间差别有统计学意义。50新药4.8g组VS安慰剂组:LS二、Dunnett-t检验

适用条件:g-1个实验组与一个对照组均数差别的多重比较,检验统计量为t,亦称t检验。51二、Dunnett-t检验适用条件:g-1个实验组式中

计算公式为:Dunnett-52计算公式为:Dunnett-52对例1资料,问高血脂患者的三个不同剂量降血脂新药组与安慰剂组的低密度脂蛋白含量总体均数是否有差别?

H0:μi=μ0,即各实验组与安慰剂组的低密度脂蛋白含量总体均数相等H1:μiμ0,即各实验组与安慰剂组的低密度脂蛋白含量总体均数不等α=0.0553对例1资料,问高血脂患者的三个不同剂量降血脂新药组与安慰剂组Dunnett-Dunnett-Dunnett-54Dunnett-Dunnett-Dunnett-545555四、Bonferroni法方法:采用α=α’/c作为下结论时所采用的检验水准。c为两两比较次数,α’为累积I类错误的概率。56四、Bonferroni法方法:采用α=α’/c作为下结论时例2四个均值的Bonferroni法比较设α=α’/c=0.05/6=0.0083,由此t的临界值为t(0.0083/2,20)=2.927157例2四个均值的Bonferroni法比较Bonferroni法的适用性当比较次数不多时,Bonferroni法的效果较好。但当比较次数较多(例如在10次以上)时,则由于其检验水准选择得过低,结论偏于保守。58Bonferroni法的适用性当比较次数不多

三、数据变换改善数据的正态性或方差齐性。使之满足方差分析的假定条件。平方根反正弦变换——适用于二项分布率(比例)数据。平方根变换——适用于泊松分布的计数资料对数变换——适用于对数正态分布资料59三、数据变换59SiS1S2S3S4合计值5.994.153.784.716.6560SiS1S2S3S4合计值5.994.153.784.6161H0:即4个试验组总体均数相等H1:4个试验组总体均数不全相等

检验水准

一、建立检验假设62H0:即4个试验组总体均SiS1S2S3S4合计值5.994.153.784.716.6563SiS1S2S3S4合计值5.994.153.784.二、计算离均差平方、自由度、均方64二、计算离均差平方、自由度、均方64三、计算F值65三、计算F值65宇传华制作

66宇传华制作

http://statdtedm.6to2方差分析

AnalysisofVariance(ANOVA)

因素也称为处理因素(factor)(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。一个因素(水平间独立)——单向方差分析

一个个体多个测量值——重复测量资料的方差分析

目的:用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。67方差分析

AnalysisofVariance(ANO方差分析的条件

一、方差分析的假定条件1.各处理组样本来自随机、独立的正态总体(D法、W法、卡方检验);2.各处理组样本的总体方差相等(不等会增加I型错误的概率,影响方差分析结果的判断)

二、方差齐性检验1.Bartlett检验法2.Levene等3.最大方差与最小方差之比<3,初步认为方差齐同。68方差分析的条件一、方差分析的假定条件2某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组,进行双盲试验。6周后测得低密度脂蛋白作为试验结果。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?69某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择1一个因素(factor):降脂药四个水平(level)(a=4个处理组):A安慰剂、B、C、D,i=1,2,3,4分别代表A、B、C、D每水平有ni=30只大白鼠,分别表示为j=1,2,…,30因变量用Xij表示,即第i组第j号大鼠的血中低密度脂蛋白的含量按完全随机化设计方法将N=120只动物随机等分成4个组70一个因素(factor):降脂药4ANOVA由英国统计学家R.A.Fisher首创,为纪念Fisher,以F命名,故方差分析又称F检验(Ftest)。用于推断多个总体均数有无差异71ANOVA由英国统计学家R.A.Fisher首创,单向方差分析One-wayanalysisofvariance方差分析的基本思想将所有测量值间的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。72单向方差分析方差分析的基本思想将所有测量值间的总一、离均差平方和的分解组间变异总变异组内变异73一、离均差平方和的分解组间变异总变异组内变异7对于例8-1(完全随机设计)

资料,共有三种不同的变异

总变异(Totalvariation):全部测量值Yij与总均数间的差异

组间变异(betweengroupvariation):各组的均数与总均数间的差异组内变异(withingroupvariation):每组的每个测量值Yij与该组均数的差异下面用离均差平方和(sumofsquaresofdeviationsfrommean,SS)反映变异的大小

74对于例8-1(完全随机设计)

资料,共有三种不同的变异总变

1.总变异:

所有测量值之间总的变异程度,计算公式校正系数:751.总变异:所有测量值之间总的变异程度,计表4-34个处理组低密度脂蛋白测量值(mmol/L)didj总变异SS总76表4-34个处理组低密度脂蛋白测量值(mmol/L)

2.组间变异:各组均数与总均数的离均差平方和,计算公式为SS组间反映了各组均数

的变异程度组间变异=①随机误差+②处理因素效应

772.组间变异:各组均数与总均数的离均差平方表4-34个处理组低密度脂蛋白测量值(mmol/L)dj组间变异SS组间存在组间变异的原因有:①随机误差(包括个体变异和测量误差);②处理的不同水平可能对试验结果的影响。78表4-34个处理组低密度脂蛋白测量值(mmol/L)3.组内变异:在同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异,也称SS误差。用各组内各测量值Yij与其所在组的均数差值的平方和来表示,反映随机误差的影响。计算公式为793.组内变异:在同一处理组内,虽然每个受试对象接受的表4-34个处理组低密度脂蛋白测量值(mmol/L)组内变异SS组内djdj存在组内变异的原因有:①随机误差(包括个体变异和测量误差);80表4-34个处理组低密度脂蛋白测量值(mmol/L)三种“变异”之间的关系离均差平方和分解:81三种“变异”之间的关系15二、变异分解

处理效应+随机误差随机误差082二、变异分解处理效应+随机误差随机误差016

均方差,均方(meansquare,MS)83均方差,均方(meansquare,MS)17

二、F值与F分布,84二、F值与F分布,18F分布曲线85F分布曲线19F界值表附表5F界值表(方差分析用,单侧界值)上行:P=0.05下行:P=0.01分母自由度υ2分子的自由度,υ1123456

1161200216225230234

405249995403562557645859

218.5119.0019.1619.2519.3019.33

98.4999.0099.1799.2599.3099.33

254.243.392.992.762.602.49

7.775.574.684.183.853.63

586F界值表附表5F界值表(方差分析用,单侧界值)分母自F分布曲线下面积与概率87F分布曲线下面积与概率218822某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组,进行双盲试验。6周后测得低密度脂蛋白作为试验结果。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?89某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择1三、分析步骤

H0:即4个试验组总体均数相等H1:4个试验组总体均数不全相等

2.计算检验统计量:1.建立检验假设,确定检验水准:90三、分析步骤H0:9125表4-5完全随机设计方差分析表列方差分析表92表4-5完全随机设计方差分析表列方差分析表263.确定P值,作出推断结论:

按水准,拒绝H0,接受H1,认为4个试验组ldl-c总体均数不相等,即不同剂量药物对血脂中ldl-c降低影响有差别。933.确定P值,作出推断结论:27四、下结论注意:当组数为2时,完全随机设计的方差分析结果与两样本均数比较的t检验结果等价,对同一资料,有:94四、下结论注意:当组数为2时,完全随机设计的方多样本方差比较的Bartlett检验和Levene检验95多样本方差比较的Bartlett检验和Levene检验29

在进行方差分析时要求所对比的各组即各样本的总体方差必须是相等的,这一般需要在作方差分析之前,先对资料的的方差齐性进行检验,特别是在样本方差相差悬殊时,应注意这个问题。对两样本方差进行齐性检验的方法前已介绍。本节介绍多样本(也适用于两样本)方差齐性检验的Bartlett检验法和Levene检验法。96在进行方差分析时要求所对比的各组即各样本的总一、Bartlett检验97一、Bartlett检验319832993310034例4-2的方差齐性检验表

101例4-2的方差齐性检验表35

10236二、Levene检验资料要求:可不具有正态性。检验统计量:F计算公式:F103二、Levene检验资料要求:可不具有正态性。F37式中104式中38检验步骤:105检验步骤:39平均值之间的多重比较不拒绝H0,表示拒绝总体均数相等的证据不足————>分析终止。拒绝H0,接受H1,表示总体均数不全相等哪两两均数之间相等?哪两两均数之间不等?————>需要进一步作多重比较。106平均值之间的多重比较不拒绝H0,表示拒绝总体均数相等的证据不控制累积Ⅰ类错误概率增大的方法采用Bonferroni法、SNK法和Tukey法等方法107控制累积Ⅰ类错误概率增大的方法采用Bonferroni法、S累积Ⅰ类错误的概率为α’当有k个均数需作两两比较时,比较的次数共有c==k!/(2!(k-2)!)=k(k-1)/2设每次检验所用Ⅰ类错误的概率水准为α,累积Ⅰ类错误的概率为α’,则在对同一实验资料进行c次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积Ⅰ类错误概率α’与c有下列关系:α’=1-(1-α)c(8.6)例如,设α=0.05,c=3(即k=3),其累积Ⅰ类错误的概率为α’=1-(1-0.05)3=1-(0.95)3=0.143108累积Ⅰ类错误的概率为α’当有k个均数需作两两比较时,比较的次一、LSD-t检验

(leastsignificantdifference)适用范围:一对或几对在专业上有特殊意义的样本均数间的比较。109一、LSD-t检验

(leastsignificant检验统计量t的计算公式为式中

110检验统计量t的计算公式为式中44注意:

111注意:4511246

例4-7对例4-2资料,问高血脂患者的降血脂新药2.4g组、4.8g组、7.2g组与安慰剂组的低密度脂蛋白含量总体均数有无差别?113例4-7对例4-2资料,问高血脂患者的,即降血脂新药2.4g组与安慰剂组的低密度脂蛋白含量总体均数相等,

即降血脂新药2.4g组与安慰剂组的低密度脂蛋白含量总体均数不等α=0.05降血脂新药2.4g组与安慰剂组的比较:114,即11549

新药4.8g组VS安慰剂组:LSD-t为-4.297.2g组VS安慰剂组:LSD-t为-8.59。

同理:按水准,降血脂新药4.8g组、7.2g组与安慰剂组间差别有统计学意义。116新药4.8g组VS安慰剂组:LS二、Dunnett-t检验

适用条件:g-1个实验组与一个对照组均数差别的多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论