医学统计学-方差分析_第1页
医学统计学-方差分析_第2页
医学统计学-方差分析_第3页
医学统计学-方差分析_第4页
医学统计学-方差分析_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学方差分析AnalysisofVariance主要内容问题的提出方差分析的原理完全随机设计的方差分析

completelyrandomdesign配伍组设计的方差分析

randomblockdesign两两比较方差分析的正确应用问题的提出问题的提出t检验实例南京医科大学的学工部门想知道2012年南京市进入南医大就读的学生中,市区的学生和郊区的学生成绩是否有差异。因素:学生所来自的区域水平:市区,郊区单因素两水平问题的提出t检验实例阿卡波糖的降血糖效果。分别给对照组和试验组服用拜唐平胶囊和阿卡波糖胶囊,观察8周后血糖下降值的差异。因素:不同的药物水平:阿卡波糖,拜唐平单因素两水平问题的提出问题的提出江苏、安徽、浙江三省的平均入学成绩?单因素三水平江苏=592.79安徽=571.23浙江=569.83问题的提出一种新的降血脂药,120人分为安慰剂组,用药组1(2.4g),用药组2(4.8g),用药组3(7.2g)。实验结束后观察血脂水平。?单因素四水平用药组1=2.72mmol/l用药组2=2.70mmol/l安慰剂组

=3.43mmol/l用药组3=1.97mmol/l12312Vs23Vs13Vs?多组间的两两比较为什么不能用

t检验?Theproblemwiththisapproachtothedataanalysisisthatyoumighthavetoperformmany,manyt-teststotestallpossiblecombinationsofthelevels.问题的提出Asthenumberoflevels(orconditions)increases,thenumberofcomparisonsneededincreasesmorerapidly.Numberofcomparisons=(n2-n)/2,n=numberoflevels.问题的提出问题的提出假如每次t检验犯第一类错误的概率是0.05,那么要完全地进行比较,犯第一类错误的概率是1-(1-

)k。多组间的两两比较为什么不能用

t检验?进行一次假设检验,犯第一类错误的概率:

进行多次(k)假设检验,犯第一类错误的概率:1-(1-

)k

组数为3,k=3,

1-(1-0.05)k=0.1426

组数为4,k=6,

1-(1-0.05)k=0.2649

组数为5,k=10,1-(1-0.05)k=0.4013

组数为6,k=15,1-(1-0.05)k=0.5400问题的提出Asthenumberofcomparisonsincreases,theprobabilityofmakingatleast1Type-Ierrorincreasesrapidly.αfw=1-(1-α)K问题的提出SirRonaldAylmerFisherBorn:February171890

Died:July291962问题的提出SirRonaldAylmerFisher1890~1962RothamstedExperimentalStationFisher于Rothamsted研究作物产量时,完善了方差分析的思想1890:BorninEastFinchley,London.1909:StudentatGonvilleandCaiusCollege,Cambridge.1917:MarriedRuthE.Guiness.1919:StartedworkasastatisticianatRothamstedExperimentalStation.1933:ChairofEugenicsatUniversityCollege,London.1943:BalfourProfessorofGenetics,CambridgeUniversity.1957:PresidentofGonvilleandCaiusCollege.1962:DiedAdelaide,SouthAustralia.SirRonaldAylmerFisherHisworkfallsnaturallyinto3mainstreams:Contributionstothemathematicaltheoryofstatistics;ApplicationofstatisticaltheorytoagricultureandthedesignofexperimentsContributionstogenetics.

问题的提出方差分析方差分析,又称变异数分析。AnalysisofVariance,简写为ANOVA。由英国统计学家R.A.Fisher提出。方差分析的起源。F检验。方差分析的原理单因素方差分析:研究的是一个处理因素的不同水平间效应的差别;处理因素水平1水平2方差分析的原理单因素方差分析:研究的是一个处理因素的不同水平间效应的差别;TreatmentLevel2LevelkLevel1方差分析的原理例1某地用A、B和C三种方案治疗血红蛋白含量不满10g的婴幼儿贫血患者, A方案为每公斤体重每天口服2.5%硫酸亚铁1ml, B方案为每公斤体重每天口服2.5%硫酸亚铁0.5ml, C方案为每公斤体重每天口服3g鸡肝粉,治疗一月后,记录下每名受试者血红蛋白的上升克数,资料见表1,问三种治疗方案对婴幼儿贫血的疗效是否相同?因素:治疗方案水平:A,B,C例1三组血红蛋白增加量(g)A(i=1)B(i=2)C(i=3)1.81.45.02.02.1-0.7Xij0.51.20.20.01.91.32.32.30.51.61.71.13.70.70.33.00.20.22.40.51.91.62.00.72.01.41.00.01.50.91.51.72.43.00.90.82.73.0-0.40.71.1-0.31.13.22.01.2-0.20.70.92.51.60.71.31.4方差分析的原理所有个体的血红蛋白上升值几乎都不同

总变异不同组间的血红蛋白上升值不同,原因:处理因素的效应(如果存在的话);随机误差

组间变异同组内的血红蛋白上升值不一致,原因是不同个体的个体差异、随机误差

组内变异总变异=组间变异+组内变异X总变异示意图所有个体的血红蛋白上升值几乎都不同X组间变异示意图不同组间的血红蛋白上升值不同X组内变异示意图同组内的血红蛋白上升值不一致28Between-groupsvarianceBetween-groupsvarianceisameasureofhowdifferentthegroupsarefromeachother.Whichdistributionhasagreaterbetween-groupsvariance?方差分析的基本思想29Within-groupsvarianceWithin-groupsvarianceistheweightedmeanvariabilitywithineachgrouporconditionWhichofthetwodistributionstotherighthasalargerwithin-groupsvariance?Why?方差分析的基本思想例1三组血红蛋白增加量(g)A(i=1)B(i=2)C(i=3)1.81.45.02.02.1-0.7Xij0.51.20.20.01.91.32.32.30.51.61.71.13.70.70.33.00.20.22.40.51.91.62.00.72.01.41.00.01.50.91.51.72.43.00.90.82.73.0-0.40.71.1-0.31.13.22.01.2-0.20.70.92.51.60.71.31.4ni20202060Meansd1.8400.9131.4151.2970.9300.7801.3951.071总变异SS总SumofsquaresaboutthemeanofallNvalues.GrandMeanMean1Mean2Mean3TotalSumofSquares(SSTotal).GrandMeanTotalSumofSquares(SSTotal).组内变异SS组内SumofsquareswithingroupsGrandMeanDf=4Df=4Df=4SumofSquareswithingroups组间变异SS组间Sumofsquaresbetweengroupsn1n2n3

GrandMeanSumofsquaresbetweengroups(SS

between)总变异的分解SS总=SS组间+SS组内67.6685=8.2930+59.3755总变异的分解总变异的分解总变异的分解总变异的分解总变异的分解总变异的分解总变异的分解总变异的分解总变异的分解方差分析的基本思想组内变异(SS组内):抽样误差组间变异(SS组间):组间本质差别+抽样误差如果组间无本质差别,则组间变异=组内变异或:方差分析的基本思想总变异总的离均差平方和包括处理因素不同水平的效应所导致的变异,也包括随机误差无法用处理因素所解释的部分变异(随机误差)方差分析的原理尺度总变异总的离均差平方和包括处理因素不同水平的效应所导致的变异,也包括随机误差无法用处理因素所解释的部分变异(随机误差)方差分析的原理尺度方差分析表变异来源SSvMSF组间SS组间k-1SS组间/v组间MS组间MS组内组内SS组内N-kSS组内/v组内总SS总N-1方差分析表变异来源SSvMSF

总67.668559

组间8.293024.14653.98

组内(误差)59.3755571.0417方差分析的原理方差比的分布!

方差分析的最终统计推断和假设检验均依靠F分布,所以适当了解一下F分布的特点十分有益。F分布

F分布是英国统计学家Fisher和Snedecor(斯内德克

)提出的。为了表示对Fisher的尊重,Snedecor将其命名为F分布。方差分析也主要是由Fisher推导出来的,也叫F检验。F分布0123450.00.20.40.60.81.0

1=1,2=10

1=5,2=10F分布0123450.00.20.40.60.81.0

1=10,2=

1=10,2=1构造检验的统计量(F分布)如果均值相等,F=MSt/MSe1a

F分布F

(k-1,n-k)0拒绝H0不能拒绝H0F

=

1=

2=

3Ifwesampledfromthesepopulations,wewouldnotexpecttorejectH0Variabilitywithingroup方差分析的原理

Between-groupvariationislargecomparedtotheWithin-groupvariation

2

3

1

Ifwesampledfromthesepopulations,wewouldexpecttorejectH0VariabilitywithingroupVariabilitybetweengroup方差分析的原理方差分析表变异来源SSvMSF组间SS组间k-1SS组间/v组间MS组间MS组内组内SS组内N-kSS组内/v组内总SS总N-1方差分析表变异来源SSvMSF

总67.668559

组间8.293024.14653.98

组内(误差)59.3755571.0417F(2,57)的F分布及界值0123450.2.4.6.813.15880.05完全随机设计资料的方差分析H0:

1=

2=

3,即三总体均数相等;

H1:

1,

2,3不等或不全相等。 =0.05。计算检验统计量:F=3.98>3.1588(界值)对应的概率:P=0.0241(p<0.05)结论:在=0.05水准,拒绝H0,接受H1,差别有统计学意义。认为三种治疗方案治疗婴儿贫血的效果不等或不全相等。ThentheP-value=0.0241Let’ssayourobservedvalueforFwasF=3.98012340.00.20.40.60.8F-distributionForexample,considertheF-distributionwith2and57df

完全随机设计资料的方差分析完全随机设计资料的方差分析

例题2已知动物烧伤后内脏ATP含量迅速下降,严重影响生物体各器官能量的正常代谢,为了解烫伤后不同时期切痂对肝脏ATP含量影响,将30只雄性大鼠随机分3组,每组10只:A组为烫伤对照组,B组为烫伤后24小时(休克期)切痂组,C组为烫伤后96小时(非休克期)切痂组,

并在烫伤后168小时活杀,测量其肝脏的ATP含量,探讨烫伤后不同时间ATP含量是否有变化?因素:烫伤后不同时期水平:A,B,C完全随机设计资料的方差分析烫伤对照组24小时切痂组96小时切痂组7.7611.1410.857.7111.608.588.4311.427.198.4713.859.3610.3013.539.596.6714.168.8111.736.948.225.7813.019.956.6114.1811.266.9717.728.68完全随机设计资料的方差分析变异来源离均差平方和νMSF组间119.8314组内112.9712总变异完全随机设计资料的方差分析建立假设H0:三组大鼠肝脏的ATP含量值无差别,µ1=µ2=µ3H1

:三组大鼠肝脏的ATP含量值有差别;选择检验水准α=0.05;完全随机设计资料的方差分析列方差分析表,计算F值;查自由度为2,27的F界值表,得P<0.05;按α=0.05的水准拒绝H0,接受H1,差别有统计学意义。认为烫伤后168h时,三组大鼠肝脏的ATP含量有差别。

变异来源离均差平方和νMSF组间119.8314259.91614.32组内112.9712274.184总变异232.802629主要内容问题的提出方差分析的原理完全随机设计的方差分析配伍组设计的方差分析两两比较方差分析的正确应用配伍组设计的方差分析为什么要配伍?配对的目的:排除干扰因素的影响;配伍的目的:使同一区组内除了研究因素外的其他特征尽可能相似,排除干扰因素的影响;按窝配伍;田间试验按区块配伍;当研究因素只有两水平时,配伍设计方差分析=配对t检验Fisher用方差分析的思想耕种的一块田配伍组设计的方差分析

Randomized(Complete)BlockRothamsteAgriculturalStation配伍组设计的方差分析种子A种子B种子C配伍组设计的方差分析肥中瘦ABC肥中瘦BLOCK1配伍组设计的方差分析处理因素配伍因素BLOCK2BLOCK3配伍组设计的方差分析实质:两因素方差分析变异分解,N为总样本含量,k为水平数,n为区组数;总变异总的离均差平方和处理因素不同水平的效应所致的变异,及随机误差无法用处理、配伍所解释的部分变异(随机误差)配伍组方差分析的原理尺度配伍因素不同水平的效应所致变异,及随机误差尺度配伍组设计的SS的分解SS总=SS区组间+SS处理间+SS误差v总=v区组间+v处理间+v误差

kb-1=(b-1)+(k-1)+(k-1)(b-1)实质:两因素方差分析变异分解,N为总样本含量,k为水平数,b为区组数;配伍组设计的方差分析例3

在抗癌药筛选试验中,拟用20只小白鼠按不同窝别分为5组,分别观察三种药物对小白鼠肉瘤(S180)的抑瘤效果,资料见表6.7,问三种药物有无抑瘤作用?配伍组设计的方差分析配伍组设计的方差分析配伍组设计的方差分析建立假设实验因素:H0:三种药物的抑瘤效果与对照组相同;

H1:三种药物的效果与对照组不同或者不全相同;干扰因素:H0:5个窝别小白鼠对肉瘤生长的反应相同

H1:5个窝别小白鼠对肉瘤生长的反应不全相同或全不相同

;确立检验水准;α=0.05;列方差分析表;配伍组设计的方差分析按α=0.05的水准拒绝H0,接受H1,差别有统计学意义,认为三种药物对小白鼠肉瘤(S180)的抑瘤效果与对照组不同

;按α=0.05的水准不拒绝H0,差别无统计学意义,尚不能认为各窝小白鼠对肉瘤生长的反映不同;变异来源离均差平方和νMSFP处理0.4108430.136957.53P<0.01配伍0.1123340.028081.54P>0.05误差0.21811120.01818总变异0.7412819主要内容问题的提出方差分析的原理完全随机设计的方差分析配伍组设计的方差分析两两比较方差分析的正确应用两两比较又叫多重比较,MultipleComparison;分类事先计划好的多个试验组与一个对照组之间的比较,多个组与一个特定组间的比较或者特定组间的比较;(PlannedMultipleComparison)方差分析得到有差别的结论后多个组之间的相互比较的探索性研究(PostHoc);多个组之间的相互比较Student-Newman-Keuls法(SNK法)SNK法步骤H0:相比较的两总体均数相等;

H1:相比较的两总体均数不等。 =0.05。计算检验统计量:q

组次

1

2

3

均数 1.840 1.415 0.930

组别 A B C

a=2

a=2

a=3SNK法步骤

均数 1.840 1.415 0.930

组别 A B C对比组均数之差标准误qaq界值P1与30.9100.22823.987733.40<0.051与20.4250.22821.862422.83>0.052与30.4850.22822.125322.83>0.05结论:

A方案与C方案的治疗效果间差异有统计学意义,而其余两组间尚看不出差异。Duncan-t检验又称q’法。用于k-1试验组与1个对照组比较, 或k-1对照组与1个试验组比较。q’

与误差自由度有关,还与比较的两组之a值有关!Duncan-t法步骤H0:相比较的两总体均数相等;

H1:相比较的两总体均数不等。 =0.05。计算检验统计量:Duncanq’

Duncan-t法步骤结论:

A疗法优于C疗法,而A与B差异无统计学意义。对比组均数之差标准误q’aq’界值P1与20.4250.28221.862222.83>0.051与30.9100.28223.987432.98<0.05两两比较的注意事项对于方差分析后的两两比较均应以方差分析拒绝相应的H0为前提,且结论均不应与方差分析的结论相悖;出现模糊结论,下结论应该谨慎;方差分析拒绝H0,但两两比较得不出有差异的结论,因为方差分析效率高。PostHoc分析发现的各组间差别只是一种提示,一种进一步增加含量改进试验的提示。不能用t检验代替方差分析,也不能用t检验代替两两比较。无论是SNK法还是Dunnett-t法,用于两组比较时,结果与t检验等价。两两比较的注意事项方差分析的要求独立随机抽样(Independence);正态性(Normality);方差齐性(Homoscedascity);方差齐性检验两个方差的齐性检验Levene法多个方差的齐性检验Bartlett法变量变换(VariableTransformation)方差齐性是一个很strong的假设,如果不齐,就不能直接进行方差分析;变量变换目的:方差齐性化,正态化,线性化常用方法:对数变换对数正态分布,等比,正偏平方根变换poisson分布,轻度偏态等百分数平方根反正弦变换原始数据为率方差分析小结均数、方差的比较样本均数与总体均数的比较(t检验)配对设计样本均数的比较(配对t检验)两样本均数的比较

(t检验,u检验,F检验,SNK,Duncan)多样本均数的比较(F检验,ANOVA)各组间的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论