版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方差分析AnalysisofVariance3/12/20241医学统计学
用途
比较某实验(处理)因素不同水平样本均数间差别有无统计学意义,从而说明该实验因素某水平是否有作用的方法。种类根据实验因素的数量分为:
单因素方差分析
多因素(两因素及以上)方差分析方差分析由R.A.Fisher(英)首创,又称F检验
缩写:ANOVA3/12/20242医学统计学
RonaldAylmerFisher爵士(1890~1962)是现代统计学的奠基人之一。
他年轻时在剑桥大学主修数学,研究误差理论、统计力学和量子理论。他对统计理论与方法的主要贡献:相关系数的抽样分布、方差分析、实验设计原则。3/12/20243医学统计学第一节方差分析的基本思想和应用条件3/12/20244医学统计学一、名词解释处理因素和水平研究者对研究对象人为地施加某种干预措施,称为处理因素(factor)或实验因素;处理因素所处的不同状态称为水平(level)。处理因素的水平数≥2,即实验的组数。3/12/20245医学统计学
三组战士行军后体温增加数(℃)
不饮水定量饮水不限量饮水
1.91.40.91.81.20.71.61.10.91.71.41.11.51.10.91.61.30.91.31.10.81.41.01.01.61.20.9处理因素:饮水方式水平数=33/12/20246医学统计学单因素实验实验中的处理因素只有一个,这个处理因素包括g(g≥2)个水平,分析不同水平实验结果的差别是否有统计学意义。多因素实验实验中的处理因素≥2,各处理因素的水平≥2,分析各处理因素各水平的实验结果有无差别、有无交互作用。3/12/20247医学统计学安慰剂组3.534.594.342.66…2.59303.43102.91367.85降血脂新药2.4g组2.423.364.322.34…2.31302.7281.46233.00降血脂新药4.8g组2.862.282.392.28…1.68302.7080.94225.54降血脂新药7.2g组0.891.061.081.27…3.71301.9758.99132.13低密度脂蛋白测量值(mmol/L)分组
n
4个处理组低密度脂蛋白测量值
合计
1202.70324.30958.52单因素实验:研究一种降血脂新药的临床疗效3/12/20248医学统计学研究对象:高血脂病人(120例)
处理因素:降血脂药物水平:服降血脂新药2.4g组服降血脂新药4.8g组服降血脂新药7.2g组安慰剂组试验效应:低密度脂蛋白测量值(mmol/L)3/12/20249医学统计学研究饲料中脂肪含量高低、蛋白含量高低对小鼠体重的影响研究对象:小白鼠处理因素:饲料中脂肪含量、蛋白含量水平:脂肪含量高低蛋白含量高低试验效应:小鼠体重增加量多因素实验3/12/202410医学统计学
二、方差分析的目的
在无效假设成立的前提下,通过分析各处理组均数之间的差别,以推断其各相应总体均数间有无差别,从而说明处理因素的效果是否不同(或处理因素是否起作用)。3/12/202411医学统计学三、方差分析的基本思想
根据实验设计的类型及研究目的,将全部观察值之间所表现出来的总变异,分解为两个或多个部分。除随机误差作用外,其余每个部分的变异均可由某个因素的作用加以解释。通过比较不同变异来源的均方(MS),借助F分布做出统计推断,从而推断研究因素对试验结果有无影响。3/12/202412医学统计学
四、方差分析的应用条件
1、各样本是相互独立的随机样本,且来自正态分布的总体;2、相互比较的各样本的总体方差相等,即具有方差齐性。
独立性、随机性、正态性、方差齐性3/12/202413医学统计学五、方差分析的用途
1、用于进行两个或多个样本均数的比较;2、分析两因素或多因素间的交互作用;3、用于回归方程的线性假设检验。3/12/202414医学统计学六、方差分析的优点
1、不受比较组数的限制,可比较多组均数;2、可同时分析多个因素的作用;3、可分析因素间的交互作用.3/12/202415医学统计学第二节
完全随机设计资料的方差分析3/12/202416医学统计学是将全部试验对象按随机化的方法,分配到各个处理组中,各组对象分别接受不同水平的处理;试验或观察结束后,比较各组均数之间的差别有无统计学意义,推断处理因素的效应。各组样本含量可以相等也可以不等,相等时检验效率较高。由于完全随机设计的方差分析只有一个研究因素,所以又称为单因素方差分析。一、完全随机设计
completelyrandomdesign3/12/202417医学统计学各组例数可以相等或不等甲处理(n1)乙处理(n2)丙处理(n3)
试验对象(N)随机化分组3/12/202418医学统计学例
为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名患者,采用完全随机设计方法将患者等分为4组进行双盲试验。
完全随机设计分组结果随机数260873373204056930160905886958…220634序号241063915311413109108117…1675编号12345678910…119120结果甲丁乙甲甲丁甲丁丁丁…甲丙
1~30甲31~60乙61~90丙91~120丁3/12/202419医学统计学安慰剂组3.534.594.342.66…2.59303.43102.91367.85降血脂新药2.4g组2.423.364.322.34…2.31302.7281.46233.00降血脂新药4.8g组2.862.282.392.28…1.68302.7080.94225.54降血脂新药7.2g组0.891.061.081.27…3.71301.9758.99132.13低密度脂蛋白测量值(mmol/L)分组
n
4个处理组低密度脂蛋白测量值
合计
1202.70324.30958.523/12/202420医学统计学组间变异总变异组内变异二、变异分解3/12/202421医学统计学总变异处理因素组间变异组内变异随机误差测量误差个体变异随机误差测量误差个体变异3/12/202422医学统计学第1组第2组…第k组X11X21…Xk1X12X22…Xk2┇┇…┇X1jX2j…Xkj┇┇…┇X1nX2n…Xkn…n1n2…nkNS1S2…SkS2222
完全随机设计方差分析的数据结构3/12/202423医学统计学完全随机设计资料方差分析公式变异来源SS
MSF值
校正数:N-1总变异组间g-1组内N-g3/12/202424医学统计学
1、总变异:
总变异的大小可用离均差平方和表示,即各观测值Xij与总均数差值的平方和,记为SS总。SS总反映了所有观测值之间总的变异程度。3/12/202425医学统计学
计算公式:3/12/202426医学统计学
简化计算公式:3/12/202427医学统计学
2、组间变异:
各处理组的样本均数大小不等,这种变异称为组间变异,其大小可用各组均数与总均数的离均差平方和表示。记作SS组间。
组间变异存在的原因:
⑴.随机误差(包括个体变异和测量误差);⑵.处理因素的不同水平可能对实验结果有影响。3/12/202428医学统计学
计算公式:3/12/202429医学统计学
3、组内变异:
在同一处理组内,虽然各受试对象接受的处理相同,但测量值之间仍不同,这种变异称为组内变异(误差),其大小可用组内各测量值Xij与其组均数差值的平方和表示,
记为SS组内,反映了随机误差的影响。3/12/202430医学统计学计算公式:3/12/202431医学统计学4、三种变异的关系:离均差平方和与自由度具有可加性3/12/202432医学统计学5、方差分析的检验统计量F值:3/12/202433医学统计学
检验统计量F值的意义:
多个样本均数比较的方差分析,其无效假设H0是各样本均数来自相同的总体,即处理因素对研究结果无影响,组间变异与组内变异均只反映随机误差作用的大小,则F值在理论上应等于1,由于抽样的偶然性,得到的F值不会恰好等于1,而是接近1。若处理因素对研究结果有影响,将出现MS组间明显大于MS组内,F值也明显大于1。F值越大,拒绝H0的理由越充分。3/12/202434医学统计学若组间变异明显大于组内变异,则不能认为组间变异仅反映随机误差的大小,处理因素也在起作用。根据计算出的检验统计量F值,查界值表得到相应的P值,按所取检验水准α作出统计推断结论。检验统计量F值服从F分布。
F<Fα,(ν组间,ν组内),则P
>α,不拒绝H0,还不能认为各样本所来自的总体均数不同;
当F≥Fα,(ν组间,ν组内),则P≤α,拒绝H0,接受H1,可认为总体均数不等或不全相等。3/12/202435医学统计学三、分析步骤H0:
1=2=3=4
H1:i不等或不全相等
=0.05
3/12/202436医学统计学3/12/202437医学统计学方差分析表变异来源SS
MSFP
总82.10119
组间32.16310.7224.93<0.01
组内49.941160.43
附表3结论:按
=0.05水平,拒绝H0,接受H1,认为四组均数的差异有统计学意义,不同剂量药物对血脂中低密度脂蛋白降低有影响。3/12/202438医学统计学注意:当拒绝H0,接受H1,不能说明各组总体均数两两间都有差别,要进行多个均数间多重比较。
3/12/202439医学统计学第三节
随机区组设计资料的方差分析3/12/202440医学统计学又称配伍组设计是配对设计的扩大先按影响实验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组,再分别将区组内的受试对象随机分配到各处理组或对照组。一、随机区组设计
randomizedblockdesign3/12/202441医学统计学
随机区组设计方法要求区组内k个实验单位有较好的同质性。优点:通过配伍减小了非研究因素对结果的影响,故其比完全随机设计更容易发现处理组之间的差别(区组内个体误差较小)提高了统计检验效率。缺点:要求区组内观察单位数与处理数相等,若结果中出现缺失值,统计分析时较难处理。3/12/202442医学统计学例:比较三种抗癌药物对小白鼠肉瘤抑瘤效果处理因素:抗癌药物(A、B、C)实验对象及例数:染肉瘤小白鼠15只实验效应:肉瘤重量控制因素:小白鼠体重实验设计:随机区组设计方法:将体重相近的3只小白鼠配为一个区组,共5个区组;在区组内随机分配处理因素。3/12/202443医学统计学
不同药物作用后小白鼠肉瘤重量(g)区组A药B药C药10.820.650.511.9820.730.540.231.5030.430.340.281.0540.410.210.310.9350.680.430.241.353.072.171.576.810.6140.4340.3140.4542.02071.05870.54513.62453/12/202444医学统计学例如何按随机区组设计,分配5个区组的15只小白鼠接受甲、乙、丙三种抗癌药物?5个区组小白鼠按随机区组设计分配结果区组号12345小白鼠随机数683526009953936128527005483456序号321132321231213123456789101112131415
结果丙乙甲甲丙乙丙乙甲乙丙甲乙甲丙3/12/202445医学统计学二、变异分解总变异处理因素处理间变异随机误差测量误差个体变异组内变异随机误差测量误差个体变异区组因素区组间变异随机误差测量误差个体变异3/12/202446医学统计学随机区组设计资料方差分析公式变异来源SS
MSF值
N-1总变异处理间g-1误差(n-1)(g-1)区组间n-13/12/202447医学统计学三、分析步骤H0:
1=2=3
H1:i不等或不全相等
=0.05
3/12/202448医学统计学
3/12/202449医学统计学3/12/202450医学统计学方差分析表变异来源SS
MSFP
总0.532814
处理间0.228020.114011.88
<0.01
区组间0.228440.05715.95
<0.05
误差0.076480.0096结论:按
=0.05水平,拒绝H0,接受H1,认为三组均数的差异有统计学意义,三种抗癌药物对小白鼠肉瘤抑瘤效果有差别。3/12/202451医学统计学
变异来源SS
MSFP
总0.532814
处理间0.228020.114011.88<0.01
区组间0.228440.05715.95<0.05
误差0.076480.0096区组间差别有统计学意义解释由于控制了区组因素(体重),误差由0.0254减少到0.0096,提高了检验效率。
处理间0.228020.11404.49<0.05
区组+误差0.3048120.0254
3/12/202452医学统计学第四节
拉丁方设计资料的方差分析3/12/202453医学统计学完全随机设计只涉及到一个处理因素。随机区组设计涉及一个处理因素、一个区组因素(或称为配伍因素)。倘若实验研究涉及一个处理因素和两个控制因素,每个因素的类别数或水平数相等,此时可采用拉丁方设计(latinsquaredesign)来安排试验,将两个控制因素分别安排在拉丁方设计的行和列上。拉丁方设计是在随机区组设计的基础上发展的,它可多安排一个已知的对试验结果有影响的非处理因素,增加了均衡性,减少了误差,提高了效率。3/12/202454医学统计学
设计方法研究目的非处理因素控制完全随机设计
处理因素随机化分组平衡随机区组设计处理因素区组(行方向)可控制一个主要非处理因素拉丁方设计处理因素行与列方向可控制二个主要非处理因素一、拉丁方设计
latin-squaredesign3/12/202455医学统计学
拉丁方是用拉丁字母排列为K×K的方阵
K=处理因素水平数
例:K=4
列
12341ABCD
行2BCDA3CDAB
4DABC3/12/202456医学统计学
行和列安排两个需控制的非处理因素拉丁字母个数代表处理因素水平数行数=列数=处理水平数处理的每个水平在行或列中只出现一次使用时应对基本拉丁方随机化
列
12341ABCD
行
2BCDA3CDAB
4DABC
3/12/202457医学统计学研究目的:比较6种不同药物对家兔注射后产生的皮肤疱疹大小处理因素:6种药物处理因素水平:甲、乙、丙、丁、戊、己实验对象:家兔6只实验效应:皮肤疱疹大小控制因素1:不同受试对象(6只家兔)控制因素2:每只家兔不同注射部位(6个)3/12/202458医学统计学ABCDEFBAFEDCCDABFEDFEACBECBFADFEDCBA6×6基本拉丁方3/12/202459医学统计学
行变换:随机数220634725282
秩次213546
对调列变换:随机数272999726853
秩次126543
对调分配处理:药物甲乙丙丁戊己随机数355627092486
秩次453126
字母DECABF6×6基本拉丁方随机化
3/12/202460医学统计学6×6基本拉丁方行与列随机对调家兔编号
注射部位编号(列区组)(行区组)1234561ABCEDF2BAEFCD3EDFCBA4FCBDAE5CFDAEB6DEABFC处理因素(药物):ABCDEF3/12/202461医学统计学家兔编号
注射部位编号(列区组)(行区组)1234561A73B75C67E61D69F79
2B83A81E99F82C85D873E73D60F73C77B68A744F58C64B64D71A77E745C64F62D64A81E85B716D77E75A73B59F85C82处理因素(药物):ABCDEF6种药物注射家兔后产生皮肤疱疹大小(mm2)3/12/202462医学统计学家兔注射部位编号编号
1234561A73B75C67E61D69F7942470.72B83A81E99F82C85D8751786.23E73D60F73C77B68A7442570.84F58C64B64D71A77E7440868.05C64F62D64A81E85B7142771.26D77E75A73B59F85C8245175.26种药物注射家兔后产生皮肤疱疹大小(mm2)合计Ci
42841744043146946771.369.573.371.878.277.8药物DECABF合计Tk
428467439459420439
71.377.873.276.570.073.2合计Rj3/12/202463医学统计学二、变异分解总变异处理间变异不同药物随机误差随机误差行区组间变异不同家兔随机误差列区组间变异不同注射部位随机误差3/12/202464医学统计学拉丁方设计资料方差分析公式变异来源SS
MSF值
N-1
总变异处理间g-1行区组g-1列区组g-1误差
(g-1)(g-2)3/12/202465医学统计学三、分析步骤3/12/202466医学统计学变异来源SSMSFP总变异3036.0035
药物间268.67553.730.98>0.05家兔间383.33576.671.39>0.05部位间1283.335256.674.66<0.01误差1100.672055.03方差分析表3/12/202467医学统计学结论:处理因素:按α=0.05水准,可以认为6种药物注射家兔后产生皮肤疱疹大小均数的差别无统计学意义。非处理因素:按α=0.05水准,认为6只家兔皮肤疱疹大小均数的差别无统计学意义。
6个注射部位皮肤疱疹大小均数的差别有统计学意义。3/12/202468医学统计学拉丁方设计的缺点实验设计要求行数=列数=处理水平数,该条件实际工作中一般不易满足。在处理的水平数较少时,试验的重复数较少(如3×3拉丁方设计,重复例数为3),此时检验效率较低。3/12/202469医学统计学第五节
两阶段交叉设计资料的方差分析3/12/202470医学统计学一、两阶段交叉设计
Cross-overDesign3/12/202471医学统计学两阶段交叉设计模式
随机
试验阶段
分组
ⅠⅡ
甲组(n1)甲药乙药
N
乙组(n2)
乙药甲药3/12/202472医学统计学两阶段交叉设计优点1.每个试验对象先后接受两种处理,可成倍使用试验对象,例数少于完全随机分组设计。2.试验设计采用自身对照,可减少个体变异对试验效应的影响,试验结果较准确,统计检验效率高于完全随机分组设计。3/12/202473医学统计学1.两阶段间常安排洗脱(washout)阶段,比完全随机分组设计试验时间长。2.两阶段间不能有延滞(carry-over)效应。即前一时期处理的效应不能延续到后一时期的处理效应上。3.多用于治疗慢性病药物(如安眠、降血压等)的疗效比较。两阶段交叉设计缺点3/12/202474医学统计学二、两阶段交叉设计举例1.完全随机设计安排受试对象例
用A、B两种闪烁液测定10名受试者血浆中3H-cGMP的交叉试验2.随机区组设计安排受试对象3/12/202475医学统计学随机数22191678039323155857秩号54391106287规定秩号奇数处理先A后B,偶数先B后A
12345678910受试对象编号受试对象编号阶段1阶段21AB2BA3AB4AB
3/12/202476医学统计学受试者
阶段受试者合计编号ⅠⅡBi1A760B77015302B860A85517153A568B6021170
10B800A8031603阶段合计S1=7271S2=7370处理合计TA=7289TB=7352
X=14641两种闪烁液测定血浆中3H-cGMP的交叉试验3/12/202477医学统计学三、两阶段交叉设计数据的方差分析总变异A、B处理间变异受试者间变异Ⅰ、Ⅱ阶段间变异随机误差3/12/202478医学统计学3/12/202479医学统计学3/12/202480医学统计学
方差分析表
变异来源DFSSMSFP
总变异19552194.95
AB处理间1198.45198.454.02>0.05ⅠⅡ阶段间1490.05490.059.92<0.05
受试者间9551111.4561234.611240.07<0.01
误差8395.0049.383/12/202481医学统计学结论:1.还不能认为A与B两种闪烁液的测定结果有差别试验目的2.可认为不同的测定阶段对测定结果有影响控制因素3.可认为各受试者的3H-cGMP值不同控制因素3/12/202482医学统计学单因素处理资料方差分析小结设计方法
总变异分解
完全随机处理间+随机误差随机区组处理间+区组间+随机误差拉丁方处理间+行间+列间+随机误差两阶段交叉处理间+受试者间+阶段间+随机误差不同设计的目的主要是减少随机误差,显示处理因素的作用。3/12/202483医学统计学第六节
多个样本均数间的多重比较3/12/202484医学统计学当方差分析结果的处理因素间有统计学意义,只说明各总体均数不全相等;若了解各总体均数两两之间差别情况,需作多个样本均数间多重比较。
目的方法
1.一对或几对在专业上有LSD-t检验特殊意义样本均数比较
2.各实验组与一个对照组Dunnett-t检验
样本均数多重比较
3.多个样本均数两两间的SNK-q检验
全面比较3/12/202485医学统计学多个样本均数间比较不能采用t检验,否则将增大犯1类错误概率。对某一资料中3组数据用t检验作两两比较比较组别检验水准不犯1型错误概率A组与B组=0.05(1
0.05)A组与C组
=0.05(10.05)B组与C组
=0.05
(10.05)3次均不犯1型错误概率为(10.05)3总的检验水准为α=1(10.05)3=0.143/12/202486医学统计学一.LSD-t检验最小显著差异
(leastsignificantdifference)t检验适用于一对或几对在专业上有特殊意义的样本均数间的比较。3/12/202487医学统计学
LSD-t检验与t检验异同
LSD-t检验t检验t界值表(附表2)t界值表(附表2)3/12/202488医学统计学例降血脂新药2.4g组与安慰剂组比较降血脂新药2.4g组安慰剂组3/12/202489医学统计学二、Dunnett-t检验
由C.W.Dunnett
于1955年提出,适用于g-1个实验组与一个对照组均数差别的多重比较。3/12/202490医学统计学
Dunnett-t检验与t检验区别
Dunnett-t检验t检验Dunnett-t检验临界值表(附表5)t界值表(附表2)3/12/202491医学统计学例三个不同剂量降血脂新药组与安慰剂组比较
降血脂新药2.4g组安慰剂组3/12/202492医学统计学各实验组与安慰剂组比较组别Du
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一例糖尿病酮中毒个案护理
- 《后勤管理制度》课件
- 专科护理发展的意义
- 农产品培训教案
- 《通项公式的求法》课件
- 向管理要效益
- 基层医疗机构
- 学校反邪教教学活动
- 器官移植患者的护理
- 2024年山东省第三届中小学生海洋知识竞赛题库及答案(初中组第301-500题)
- 高标准农田建设施工总平面布置方案
- 材料自动分拣控制系统的设计
- 医疗器械召回管理办法培训
- 战争与和平-美术作品反映战争 课件-2023-2024学年高中美术湘美版(2019)美术鉴赏
- 市场营销策划(本)-形考任务三(第八~十章)-国开(CQ)-参考资料
- 解码国家安全智慧树知到期末考试答案2024年
- 阻生牙拔除的护理
- 两癌知识科普课件
- 厦门市2023-2024学年度第一学期高一年级质量检测数学试题(定稿)
- 全科医生师资培训课件
- 《遗传学》课程标准
评论
0/150
提交评论