方差分析概论_第1页
方差分析概论_第2页
方差分析概论_第3页
方差分析概论_第4页
方差分析概论_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于方差分析概论第一张,PPT共二十九页,创作于2022年6月方差分析(analysis of variance) 对多个样本进行比较并评估其显著性时,可以克服 t 检验存在的问题。它能够帮助我们回答一个问题:是否可用一个总的指标说明实验处理导致各个不同组间的平均数有差异?12.2 平方和的概念从公式可以看出,若离差大,则方差也大,离差小,数据紧聚在平均数周围,则方差也小。第二张,PPT共二十九页,创作于2022年6月回忆一下 两样本 t 检验计算公式:问:分子和分母分别表示意思?答:分子表示平均数之间的差异,而分母表示各组内变异相加的估计值,称为平均数差异的标准误。平均数之间差异越大,则 t

2、 值越大,否者 t 值越小第三张,PPT共二十九页,创作于2022年6月图12-1 要想得到统计学显著性,平均数差异大小与变异大小之间的关系如果变异较小,则统计显著性所需的平均数差异也较小如果变异较大,则统计显著性所需的平均数差异也较大第四张,PPT共二十九页,创作于2022年6月方差分析包括对两个方差的独立估计:组间方差 (between-group variance)组内方差 (with-group variance)方差分析一个基本概念就是平方和SS总= SS组内 + SS组间第五张,PPT共二十九页,创作于2022年6月12.3 举例说明:两个组的情形12.3.1 总平方和分解为组内平

3、方和与组间平方和实验组X136313620413432343233和329X212969611296400168111561024115610241089和11083控制组X229342733102826313035和283X2841115672910891007846769619001225和8461实验组平均数 =32.9,控制组平均数 =28.3 SS总=(11083+8461)(612)2/20=1954418727.2=816.8SS1=11083(329)2/10=1108310824.1=258.9SS2=8461(283)2/10=84618088.9=452.1SS组内=25

4、8.9+452.1=711第六张,PPT共二十九页,创作于2022年6月=10824.1+8008.918727.2=1883318727.2=105.8K=2,df=21=1方差的估计值S2=SS组间/1=105.8组内自由度df=NK=202=18SS组内=711/18=39.5查F表,F 0.05(1,18)=4.41注意:当组间自由度=1时,F=t2 ,2.678=1.6362 df2 单侧Pdf11180.018.290.054.412.678 4.41,不拒绝H0。结论与前面的 t 检验一致。第七张,PPT共二十九页,创作于2022年6月12.4 方差分析的基本思想1. 总方差分为

5、 组间方差 + 组内方差a. 组间方差:由于受到实验处理,包括自变量以及混杂因素影响而产生的系统差异,这些变量引起因变量的变化。 b. 组内方差:由个体差异和非控制因素引起的因变量的变化。精良的设计需要使这个方差最小化。2. H0: 1=2=k 什么意思?所有样本来自一个总体。3. H1: 1,2,k 不全相等什么意思?所有样本不是来自一个总体。第八张,PPT共二十九页,创作于2022年6月4. F 统计量 =组间方差组内方差通过查F 临界值以确定是否拒绝或接受H0。12.5 以三个实验组为例-单因素方差分析例题:某项研究为了评价三种不同教学效果,从学生总体中随机抽取21名被试,并随机分为三组

6、,让他们接受三种不同的教学,完成教学后就进行测验,测验成绩越高,说明解决逻辑问题的能力越高。是否有证据表明哪种方法更有效?方法13272524方法23379475方法3945910811第九张,PPT共二十九页,创作于2022年6月(a) 从 1=2=3 的总体中抽3个组,凭机遇很可能获得(F比率小) (b) 有时偶然可能获得,F比值大,但是概率小于0.01.(c) 凭机遇几乎无法获得,(F比率很大),发生概率小于万分之一第十张,PPT共二十九页,创作于2022年6月第1步:计算总平方和方法13272524X1=25X29449425416X12=111方法23379475X2=38X2994

7、981164925X22=238方法3945910811X3=56X28116258110064121X32=488第十一张,PPT共二十九页,创作于2022年6月方法13272524X1=25X29449425416X12=111方法23379475X2=38X2994981164925X22=238方法3945910811X3=56X28116258110064121X32=488第2步. 三组的组间平方和为;第十二张,PPT共二十九页,创作于2022年6月第3步: 已知组间SS,总的SS,计算组内SS。SS组内=162.6769.24=93.43第4步;计算组间方差估计值 df组间=K

8、1=3 1=2第5步:计算组内方差估计值 df组内= N K =213=18第6步:计算F 值在本例。总自由度=N1=20第7步;列出分析分析表第十三张,PPT共二十九页,创作于2022年6月表 12-3 方差分析表变异源平方和自由度方差估计值F比率组间69.24234.626.67组内93.43185.19总计162.672012.6 F 值的解释查F 临界值表,F0.05(2,18)=3.55请问:这个问题是否到此就结束了? df2 单侧Pdf12180.018.290.054.416.673.55, 所以按照0.05拒绝H0,三个总体平均数不同,不是来自一个总体。第十四张,PPT共二十九

9、页,创作于2022年6月1. 事前比较或者计划比较:如果想在研究前进行比较,可使用事前检验而不用做方差分析。2. 事后比较:事前心中无数或者计划不好,可先进行方差分析再事后做比较(也称为两两比较)。1953年,普林斯顿大学Tukey提出HSD检验(honestly significant difference,即真正的显著性差异),使用条件:F检验要有显著性,并且各组样本量相等。其中:q=根据给定的水平以及组内自由度和k(平均值的个数),从附表查得。第十五张,PPT共二十九页,创作于2022年6月表12-4 样本平均数以及各组之间平均数差异的矩阵 =3.57 =5.43 =8.00 =3.57

10、1.864.43 =5.432.57 =8.00查附表6 q界值表当df=18 , r=3 ,=0.05时,查得q=3.61.因为只有第1和3组平均数之间的差异4.433.10,结论:第3种教学方法能够显著提高学生解决逻辑问题的能力。 df 1- r 等级差数3180.953.610.994.70第十六张,PPT共二十九页,创作于2022年6月12.7 单变量实验设计-相关样本 行为或医学研究中诸多因素都能导致分数的变异。诸如个体差异,在独立样本中无法识别和量化,其结果会增大误差。剔除这些误差的方法,可考虑相关样本设计。这好比选择天线一样,长天线噪音最低,电台信号就清晰了。12.8 三个配对组

11、设计挑选21名业余篮球队员,按照投篮水平分为七个区组,每组3人投篮水平比较一致。每组站在罚球线位置,随机使用三种不同的投篮方法,每个人投20次。试问这21人在不同的区组和不同的投篮方法上是否存在差异?第十七张,PPT共二十九页,创作于2022年6月表12-5 接受不同训练后3个配对组的投篮分数(每投20次投中的次数)训练方法分组X1X2X3合计1151311392139103231210931411131236595721686418775214合计756155191第十八张,PPT共二十九页,创作于2022年6月12.9 计算平方和与方差估计值SS总=SS处理+SS区组+SS误差 12-81

12、.计算总平方和 12-9矫正项CT表12-6 实验处理情况区组X1X12X2X22X3X32区组和1152251316911121392131699811010032312144101009813141112113169121443659815257492168646364161877495252414和T1=75853T2=61605T3=55515191第十九张,PPT共二十九页,创作于2022年6月X2=225+4=853+605+515=1973矫正项CT=(X)2/nik=1912/21=1737.19SS总= X2CT=1973 1737.19=235.81 df总=nk 1=73

13、 1=20 12-10SS处理=(752+612+552)/7 1739.19=30.10 12-11 df处理=k 1=3 1=2 12-12区组X1X12X2X22X3X32区组和11522513169111213977495252414和T1=75853T2=61605T3=555151912.计算SS处理及估计方差S2第二十张,PPT共二十九页,创作于2022年6月SS处理=(752+612+552)/7 1739.19=30.10 12-11 df处理=k 1=3 1=2 12-12所以 S2处理=30.102=15.05 12-13区组blbl2139152123210243319

14、614361296521441618324714196和19157633. 计算SS区组及估计方差S2=(1521+.+196)/31737.19=183.81 df区组理=bl 1=7 6所以 S2区组=183.816=30.64 12-16第二十一张,PPT共二十九页,创作于2022年6月SS总= 235.81SS处理=30.10SS区组=183.81SS误差=235.8130.10183.81=21.90 df误差= df总df处理df区组=20 2 6=123. 计算SS误差及估计方差S2所以 S2误差=21.9012=1.82 12-17 表 12-7 随机区组设计单因素方差分析表变

15、异源平方和自由度方差估计值F比率实验处理30.10215.058.27区组183.81630.6416.84误差21.90121.82总计235.8120第二十二张,PPT共二十九页,创作于2022年6月变异源平方和自由度方差估计值F比率实验处理30.10215.058.28区组183.81630.6416.84查F临界值表,F0.01(2,12)=6.93 , 8.286.93,所以拒绝H0,认为这些训练项目在三种情境中有差异查F临界值表,F0.01(6,12)=4.82 .12.10 平均数之间Tukeys HSD显著性检验进行三种实验情境平均数差异的两两比较 df2 单侧Pdf12120

16、.053.890.016.9316.844.82,所以拒绝H0,配对变量有效解释了变异的总方差的大部分,可以解释总平方和中的183.81/235.81=0.7795,或者78%。 df2单侧Pdf16120.014.82第二十三张,PPT共二十九页,创作于2022年6月区组X1X2X311513117752和T1=75T2=61T3=55平均数10.718.717.86表12-8 平均数之间的差异的矩阵 =10.71 =8.71 =7.86 =10.712.00*2.85* =8.710.85 =7.86查q表(N-K检验用)当df=12 , k=3 ,=0.05时,查得q=3.77.=3.7

17、70.5099=1.92 df2 单侧Pr3120.053.770.015.05第二十四张,PPT共二十九页,创作于2022年6月12.11 小结咋一看,方差分析计算复杂,不易理解,其实这些计算都是遵循一定程序,并且可预测。复杂计算也是由简单模型演变而来。例如:独立样本设计的方差分析先计算:SS总,SS组间,SS组内及各自的自由度,再计算各自的方差。相关样本的单因素方差分析先计算:SS总,SS处理,SS区组,SS误差。再计算自由度以及各自的方差。而SS区组的计算与SS处理计算类似的。12.11.1 单因素独立样本方差分析第1步 计算总平方和第二十五张,PPT共二十九页,创作于2022年6月 df 总=N-1 df组间=k-1 df误差=N-K第2步 计算组间或实验处理的平方和第3步 计算组内平方和第4步 计算自由度第5步 计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论