方差分析概论_第1页
方差分析概论_第2页
方差分析概论_第3页
方差分析概论_第4页
方差分析概论_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于方差分析概论方差分析(analysisofvariance)对多个样本进行比较并评估其显著性时,可以克服t检验存在的问题。它能够帮助我们回答一个问题:是否可用一个总的指标说明实验处理导致各个不同组间的平均数有差异?12.2平方和的概念从公式可以看出,若离差大,则方差也大,离差小,数据紧聚在平均数周围,则方差也小。第2页,共29页,2024年2月25日,星期天回忆一下两样本t检验计算公式:问:分子和分母分别表示意思?答:分子表示平均数之间的差异,而分母表示各组内变异相加的估计值,称为平均数差异的标准误。平均数之间差异越大,则t值越大,否者t值越小第3页,共29页,2024年2月25日,星期天图12-1要想得到统计学显著性,平均数差异大小与变异大小之间的关系如果变异较小,则统计显著性所需的平均数差异也较小如果变异较大,则统计显著性所需的平均数差异也较大第4页,共29页,2024年2月25日,星期天方差分析包括对两个方差的独立估计:组间方差(between-groupvariance)组内方差(with-groupvariance)方差分析一个基本概念就是平方和SS总=SS组内+SS组间第5页,共29页,2024年2月25日,星期天12.3举例说明:两个组的情形12.3.1总平方和分解为组内平方和与组间平方和实验组X136313620413432343233和329X212969611296400168111561024115610241089和11083控制组X229342733102826313035和283X2841115672910891007846769619001225和8461实验组平均数=32.9,控制组平均数=28.3SS总=(11083+8461)-(612)2/20=19544-18727.2=816.8SS1=11083-(329)2/10=11083-10824.1=258.9SS2=8461-(283)2/10=8461-8088.9=452.1SS组内=258.9+452.1=711第6页,共29页,2024年2月25日,星期天=10824.1+8008.9-18727.2=18833-18727.2=105.8K=2,df=2-1=1方差的估计值S2=SS组间/1=105.8组内自由度df=N-K=20-2=18SS组内=711/18=39.5查F表,F0.05(1,18)=4.41注意:当组间自由度=1时,F=t2,2.678=1.6362df2

单侧Pdf11180.018.290.054.412.678<4.41,不拒绝H0。结论与前面的t检验一致。第7页,共29页,2024年2月25日,星期天12.4方差分析的基本思想1.总方差分为组间方差+组内方差a.组间方差:由于受到实验处理,包括自变量以及混杂因素影响而产生的系统差异,这些变量引起因变量的变化。b.组内方差:由个体差异和非控制因素引起的因变量的变化。精良的设计需要使这个方差最小化。2.H0:μ1=μ2…=μk什么意思?所有样本来自一个总体。3.H1:μ1,μ2,…,μk

不全相等什么意思?所有样本不是来自一个总体。第8页,共29页,2024年2月25日,星期天4.F统计量=组间方差÷组内方差通过查F临界值以确定是否拒绝或接受H0。12.5以三个实验组为例-----单因素方差分析例题:某项研究为了评价三种不同教学效果,从学生总体中随机抽取21名被试,并随机分为三组,让他们接受三种不同的教学,完成教学后就进行测验,测验成绩越高,说明解决逻辑问题的能力越高。是否有证据表明哪种方法更有效?方法13272524方法23379475方法3945910811第9页,共29页,2024年2月25日,星期天(a)从μ1=μ2=μ3的总体中抽3个组,凭机遇很可能获得(F比率小)(b)有时偶然可能获得,F比值大,但是概率小于0.01.(c)凭机遇几乎无法获得,(F比率很大),发生概率小于万分之一第10页,共29页,2024年2月25日,星期天第1步:计算总平方和方法13272524∑X1=25X29449425416∑X12=111方法23379475∑X2=38X2994981164925∑X22=238方法3945910811∑X3=56X28116258110064121∑X32=488第11页,共29页,2024年2月25日,星期天方法13272524∑X1=25X29449425416∑X12=111方法23379475∑X2=38X2994981164925∑X22=238方法3945910811∑X3=56X28116258110064121∑X32=488第2步.三组的组间平方和为;第12页,共29页,2024年2月25日,星期天第3步:已知组间SS,总的SS,计算组内SS。SS组内=162.67-69.24=93.43第4步;计算组间方差估计值df组间=K-1=3-1=2第5步:计算组内方差估计值df组内=N-K=21-3=18第6步:计算F值在本例。总自由度=N-1=20第7步;列出分析分析表第13页,共29页,2024年2月25日,星期天表12-3方差分析表变异源平方和自由度方差估计值F比率组间69.24234.626.67组内93.43185.19总计162.672012.6F值的解释查F临界值表,F0.05(2,18)=3.55请问:这个问题是否到此就结束了?df2

单侧Pdf12180.018.290.054.416.67>3.55,所以按照0.05拒绝H0,三个总体平均数不同,不是来自一个总体。第14页,共29页,2024年2月25日,星期天1.事前比较或者计划比较:如果想在研究前进行比较,可使用事前检验而不用做方差分析。2.事后比较:事前心中无数或者计划不好,可先进行方差分析再事后做比较(也称为两两比较)。1953年,普林斯顿大学Tukey提出HSD检验(honestlysignificantdifference,即真正的显著性差异),使用条件:F检验要有显著性,并且各组样本量相等。其中:qα=根据给定的α水平以及组内自由度和k(平均值的个数),从附表查得。第15页,共29页,2024年2月25日,星期天表12-4样本平均数以及各组之间平均数差异的矩阵=3.57=5.43=8.00=3.57-1.864.43=5.43--2.57=8.00---查附表6q界值表当df=18,r=3,α=0.05时,查得q=3.61.因为只有第1和3组平均数之间的差异4.43>3.10,结论:第3种教学方法能够显著提高学生解决逻辑问题的能力。df

1-αr等级差数3180.953.610.994.70第16页,共29页,2024年2月25日,星期天12.7单变量实验设计---相关样本

行为或医学研究中诸多因素都能导致分数的变异。诸如个体差异,在独立样本中无法识别和量化,其结果会增大误差。剔除这些误差的方法,可考虑相关样本设计。这好比选择天线一样,长天线噪音最低,电台信号就清晰了。12.8三个配对组设计挑选21名业余篮球队员,按照投篮水平分为七个区组,每组3人投篮水平比较一致。每组站在罚球线位置,随机使用三种不同的投篮方法,每个人投20次。试问这21人在不同的区组和不同的投篮方法上是否存在差异?第17页,共29页,2024年2月25日,星期天表12-5接受不同训练后3个配对组的投篮分数(每投20次投中的次数)训练方法分组X1X2X3合计1151311392139103231210931411131236595721686418775214合计756155191第18页,共29页,2024年2月25日,星期天12.9计算平方和与方差估计值SS总=SS处理+SS区组+SS误差12-81.计算总平方和12-9矫正项CT表12-6实验处理情况区组X1X12X2X22X3X32区组和1152251316911121392131699811010032312144101009813141112113169121443659815257492168646364161877495252414和T1=75853T2=61605T3=55515191第19页,共29页,2024年2月25日,星期天∑X2=225…+4=853+605+515=1973矫正项CT=(∑X)2/nik=1912/21=1737.19SS总=∑X2-CT=1973-1737.19=235.81df总=nk-1=7×3-1=2012-10SS处理=(752+612+552)/7-1739.19=30.1012-11df处理=k-1=3-1=212-12区组X1X12X2X22X3X32区组和115225131691112139……………………77495252414和T1=75853T2=61605T3=555151912.计算SS处理及估计方差S2第20页,共29页,2024年2月25日,星期天SS处理=(752+612+552)/7-1739.19=30.1012-11df处理=k-1=3-1=212-12所以S2处理=30.10÷2=15.0512-13区组blbl2139152123210243319614361296521441618324714196和19157633.计算SS区组及估计方差S2=(1521+….+196)/3-1737.19=183.81df区组理=bl-1=7-6所以S2区组=183.81÷6=30.6412-16第21页,共29页,2024年2月25日,星期天SS总=235.81SS处理=30.10SS区组=183.81SS误差=235.81-30.10-183.81=21.90df误差=df总-df处理-df区组=20-2-6=123.计算SS误差及估计方差S2所以S2误差=21.90÷12=1.8212-17

表12-7随机区组设计单因素方差分析表变异源平方和自由度方差估计值F比率实验处理30.10215.058.27区组183.81630.6416.84误差21.90121.82总计235.8120第22页,共29页,2024年2月25日,星期天变异源平方和自由度方差估计值F比率实验处理30.10215.058.28区组183.81630.6416.84查F临界值表,F0.01(2,12)=6.93,8.28>6.93,所以拒绝H0,认为这些训练项目在三种情境中有差异查F临界值表,F0.01(6,12)=4.82.12.10平均数之间Tukey’sHSD显著性检验进行三种实验情境平均数差异的两两比较df2

单侧Pdf12120.053.890.016.9316.84>4.82,所以拒绝H0,配对变量有效解释了变异的总方差的大部分,可以解释总平方和中的183.81/235.81=0.7795,或者78%。df2单侧Pdf16120.014.82第23页,共29页,2024年2月25日,星期天区组X1X2X31151311…………7752和T1=75T2=61T3=55平均数10.718.717.86表12-8平均数之间的差异的矩阵=10.71=8.71=7.86=10.71-2.00*2.85*=8.71--0.85=7.86---查q表(N-K检验用)当df=12,k=3,α=0.05时,查得q=3.77.=3.77×0.5099=1.92df2

单侧Pr3120.053.770.015.05第24页,共29页,2024年2月25日,星期天12.11小结咋一看

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论