方差分析-课件_第1页
方差分析-课件_第2页
方差分析-课件_第3页
方差分析-课件_第4页
方差分析-课件_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学方差分析AnalysisofVariance(ANOVA)

王友洁

email

7-方差分析

方差分析(analysisofvariance,ANOVA)由英国著名统计学家R.A.Fisher提出,为纪念Fisher,以F命名,故方差分析又称F检验(Ftest)。用于推断多个总体均数有无差异,因此也称F检验。英国统计学家、遗传学家,现代数理统计学的主要奠基人之一(1890—1962)7-方差分析

在医学科学研究中,经常遇到要研究不同条件对实验结果的影响,这时,往往不只两个均数需要比较,而是两个以上或多个同时比较,这就需要在t检验的基础上加以扩充,称为方差分析(Analysisofvariance)。什么是方差分析7-方差分析例子Arethesedifferencessignificant?什么是方差分析7-方差分析A,B两种治疗方法是否影响皮疹治愈时间现有的差异有两种可能

(1)个体变异,有抽样误差引起

(2)药物的作用引起(处理因素)3.设

1为A治疗方法的平均治愈时间,

2为B治疗方法的平均治愈时间,

3为安慰剂治疗方法的平均治愈时间。也就是检验下面的假设:H0:

1

2

3H1:

1,

2,

3不全相等4.检验上述假设所采用的方法就是方差分析什么是方差分析例子的进一步分析7-方差分析

方差分析的基本思想和原理

将所有测量值间的总变异按照其变异的来源分解为多个部份,然后将各部分的变异与随机误差进行比较,评价由某种因素所引起的变异是否具有统计学意义。7-方差分析μx1x2x3x4x5μ1μ2μ4μ3μ5x1x2x3x4x5差异由抽样误差所致差异由抽样误差和处理因素所致

方差分析的基本思想和原理7-方差分析

方差分析的基本思想和原理两类方差组内方差因素的同一水平(同一个总体)下样本数据的方差比如,治疗组A不同病人治愈天数的方差组内方差只包含随机误差组间方差因素的不同水平(不同总体)下各样本之间的方差比如,治疗方案A、B和安慰剂治愈天数之间的方差组间方差既包括随机误差(个体差异),也包括处理因素不同引起差异7-方差分析1. 比较两类误差,以检验均值是否相等2. 比较的基础是方差比3. 如果处理误差显著地不同于随机误差,则两组均方值就是不相等的;反之,均方就是相等的

方差分析的基本思想和原理

组间均方

F=

组内均方7-方差分析如果不同治疗方法的治疗效果没有区别,那么在组间方差中只包含有随机误差,而没有处理或因素引起误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近1如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有由于处理不同而差生误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异

方差分析的基本思想和原理

7-方差分析

方差分析的基本思想和原理方差——即标准差的平方(S2),又称均方;

F—就是两个变异数的比值;

组内组间MSMSssF==22217-方差分析

组间变异组间均方MS(间)组内变异组内均方MS(内)F=组间变异个体差异的离散情况不同处理方法的离散情况组内变异个体差异的离散情况7-方差分析S2:个体差异离散程度Tr:不同处理方法造成的离散程度

Tr+S12

S22

F=如果处理因素不起作用或者它们是同一总体内抽出的几个样本那么Tr=0,F=(0+S12)/S22=1理论上F值=1实际中F值非常接近17-方差分析如果处理方法有明显不同那么Tr>0,F=(0+S2)/S2>1用F值的大小,来检验处理有无作用。F=Tr+S2S27-方差分析经过F检验,求出F值,查F值表,得出相应的概率(P值),以此大小判断差异的显著性。F值有一定的波动范围,其分布与组间和组内的自由度有关。用F0.05(V1,V2)、F0.01(V1,V2)作为显著界限来判断。7-方差分析当F<F.0.05(V1,V2),P>0.05不能否定检验假设,而认为各组间处理方法的差异无显著性;当F≥F.0.05(V1,V2),P≤0.05认为各组处理间的差异有显著性;当F≥F0.01(V1,V2),

P≤0.01认为各组处理间差异有极显著性;7-方差分析F分布的特点F分布随v1,v2而变动理论分布F值从0-∞,平均数为1F分布不对称F分布17-方差分析

完全随机设计资料的方差分析

(单向方差分析one-wayANOVA)

定义:按照完全随机设计的原则将处理因素分为若干个不同的水平,每个水平代表一个样本,只能分析一个因素对试验结果的影响及作用。特点:

其设计简单,计算方便,应用广泛,是一种常用的分析方法,但其效率相对较低。该设计中的总变异可以分出两个部分

SS总=SS组间+SS组内。7-方差分析各样本是相互独立的随机样本各样本来自正态分布各样本方差相等,即方差齐。单因素方差分析应用条件7-方差分析单因素方差分析的数据结构

观察值xij因素(A)i

水平A1水平A2

水平Ak

x11x12…

x1kx21x22…

x2k::::::::xn1

xn2…

xnk7-方差分析

例:测定正常人与各期矽肺病人血清粘蛋白含量的比较有无差别

正常人与各期矽肺病人血清粘蛋白含量(毫克/100毫升)─────────────────────────────────

正常人0-Ⅰ期矽肺Ⅰ期矽肺Ⅱ期矽肺Ⅲ期矽肺总计─────────────────────────────────血

64.2694.8269.63100.6797.58清42.8470.4069.7393.4783.53粘52.4885.6865.4574.97103.81蛋48.1985.6896.3988.06107.10白80.2291.1595.20113.52178.42含69.6167.3380.44101.1482.58量48.1978.9180.4495.1089.01Xij58.9092.0174.97118.9877.11─────────────────────────────────58.0983.2579.0398.24102.3984.20

─────────────────────────────────7-方差分析第二步计算统计量F值a.计算总离均差平方和公式:第一步提出假设H0:μ1=μ2=μ3=μ4=μ5,即各期矽肺病人血清粘蛋白含量相同H1:各期矽肺病人血清粘蛋白含量相同总体均数不全相等

检验水准7-方差分析b.计算组间离均差方和7-方差分析c计算组间离均差方和7-方差分析d计算自由度总的自由度V总=N-1组间自由度V组间=k-1(k为组数)组内自由度V组内=N-k7-方差分析e计算均方组间和组内离均差平方和除以相应的自由度,就得到“组间均方”和“组内均方”7-方差分析f计算F值F值即组间均方与组内均方的比值

组间变异组间均方MS(间)组内变异组内均方MS(内)F=7-方差分析变异来源离均差平方和自由度均方FP组间9900.8442475.217.51<0.01组内11535.8335329.60总变异21436.67397-方差分析统计决策

将统计量的值F与给定的显著性水平

的临界值F

进行比较,作出接受或拒绝原假设H0的决策根据给定的显著性水平

,在F分布表中查找与第一自由度df1=k-1、第二自由度df2=n-k相应的临界值F

若F>F

,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素(A)对观察值有显著影响若F

F

,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响

7-方差分析方差分析中的多重比较不拒绝H0,表示拒绝总体均数相等的证据不足————>分析终止。

拒绝H0,接受H1,表示总体均数不全相等哪两两均数之间相等?哪两两均数之间不等?

需要进一步作多重比较。7-方差分析均数两两比较的特点和意义1。当分析结果为P≤α,拒绝H0时,得出的结论只是指各总体均数不全相等。如果想要确切了解哪两个样本均数之间的差异有统计学意义(总体均数不等),哪两个样本均数之间的差异无统计学意义(总体均数相等),可以进行多个样本均数的两两比较。2。当有三个及三个以上样本均数比较时,如果仍使用一般的t检验对样本均数两两组合后进行比较,会使检验水平α值增大,即增大第一类错误的概率,这样,就可能把本来无差别的两个总体均数判为有差别。例如,有4个样本均数进行两两比较,如用一般的t检验,则可以比较

7-方差分析例如,有4个样本均数进行两两比较,如用一般的t检验,则可以比较

6次,即可有6个对比组。若每次比较的检验水准α=0.05,则每次比较不犯第一类错误的概率为(1-0.05)=0.95。那么根据概率的乘法法则,比较6次均不犯第一类错误的概率为(1-0.05)6=0.7351。此时,总的显著性水平变为:α=1-0.7351=0.2649。此值已远远大于规定的检验性水平α=0.05。

7-方差分析常用多重均数比较方法SNK(Student-Newman-keuls)检验法,q检验法Tukey的W法Duncan多范围检验法Dunnett‘st检验,即q'值检验法7-方差分析特点及意义SNK-q检验法,全称为Student-Newman-Keulsq检验法,也简称为SNK法。这是国内外常用而较为经典的检验方法。可以对所有对照组及处理组的样本均数进行两两比较。式中:q为检验统计量,为任意比较的两样本均数,为两样本均数差值的标准误。SNK-q检验法7-方差分析当两样本n相等时自由度=V误差

当两样本n不相等时上式中MS误差在单因素方差分析中即为MS组内7-方差分析将各组均数按大小顺序排列。计算各组均数间的差数。求两均数差数的标准误。决定a值。代入公式,求q值。确定P值。判断结果。SNK-q检验法检验步骤7-方差分析计算实例

科研人员研究细胞增殖核抗原(PCNA)在胃癌组织(A组),胃癌旁组织(B组)及正常胃粘膜组织(C组)中的表达状况。检测结果用表达指数来表示。试分析PCNA在三种胃组织中的表达有无差异。7-方差分析PCNA在三种不同胃组织中的表达结果7-方差分析方差分析表7-方差分析经单因素方差分析,P<0.01,拒绝H0,接受H1。可以认为三种胃组织的PCNA表达指数不全相等。进一步作样本均数的两两比较。(1)建立检验假设H0:任意两样本的总体均数相等,μA=μBH1:任意两样本的总体均数不相等,μA≠μBα=0.05(2)计算统计量q值1)将三个样本均数由大到小顺序排列,三个样本均数顺序排列结果7-方差分析7-方差分析

随机区组设计(randomizedblockdesign),又称配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素将受试对象配成区组(block),再将各区组内的受试对象随机分配到不同的处理组,各处理组分别接受不同的处理,试验结束后比较各组均数之间差别有无统计学意义,以推断处理因素的效应。随机区组设计资料的方差分析7-方差分析该设计的特点:(1)该设计包含两个因素,一个是区组因素,一个是处理因素;(2)各区组及处理组的受试对象数相等,各处理组的受试对象生物学特性较均衡,可减少试验误差,提高假设检验的效率。此类资料的方差分析,其应用条件同前:即资料满足正态性及方差齐性的要求。7-方差分析

因为随机区组设计可以将区组间变异从完全随机设计的组内变异中分离出来以反映不同区组对结果的影响,所以随机区组设计全部测量值总的变异相应地就分成三部分。

各种变异之间的关系是:

其中:

二、

变异分解7-方差分析(1)总变异:反映全部试验数据间大小不等的状况,(2)处理组间变异:甲、乙、丙三个组间测量值的均数大小不等,(3)区组间变异:12个区组间测量值的均数大小不等,(4)误差变异:反映随机误差产生的变异,7-方差分析随机区组设计方差分析的数据结构

因素A(i)因素(B)j平均值

B1B2…

BrA1A2::Ak

x11x12…

x1kx21x22…

x2k::::::::xr1

xr2…

xrk

::平均值

…7-方差分析

随机区组设计的方差分析表

变异来源自由度SSMSF

总变异处理间区组间

误差7-方差分析二、分析步骤

研究甲、乙、丙三种营养素对小白鼠体重增加的影响,已知窝别为影响因素。拟用6窝小白鼠,每窝3只,随机地安排喂养甲、乙、丙三种营养素之一种,8周后观察小白鼠体重增加情况,数据见表9-6。问:(1)不同营养素之间小白鼠的体重增加是否不同?(2)不同窝别之间小白鼠的体重增加是否不同?7-方差分析三种营养素喂养小白鼠所增体重(g)

窝别号

甲营养素

乙营养素

丙营养素1646573253545937168794414638550586564240467-方差分析(1)建立假设、确定检验水准。处理:H0:

甲=

乙=

丙(三种营养素对小白鼠体重增加作用相同)H1:

甲,

乙,

丙不全相等(三种营养素对小白鼠体重增加作用不全相同)区组:H0:

1=

2=…=

6(窝别对小白鼠体重增加无影响)H1:

1,

2,…,

6不全相等(窝别对小白鼠体重增加有影响)

(2)计算检验统计量F

值。计算各处理组的小计,各区组的小计。7-方差分析三种营养素喂养小白鼠所增体重(g)

窝别号

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论