版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、关于方差分析与协方差分析第一张,PPT共五十六页,创作于2022年6月在针对连续变量的统计推断方法中,最常用的有t 检验和方差分析两种四种不同的颜色包装对饮料销售量的影响(四个水平,分类变量)两两t 检验?第二张,PPT共五十六页,创作于2022年6月不能做t 检验如果有K(K3)个平均数,若用两两比较的方法来检验,则需作K(K-1)/2次检验,不但程序繁琐,而且相当于从t 分布中随机抽取多个t 值,其落在大于临界值的范围内的概率大大增加,犯类错误的概率大大增加:如6次检验H0的概率是0.95时的误差为:1-0.956 =0.265。第三张,PPT共五十六页,创作于2022年6月 方差分析概念
2、第一类因素:可以控制的控制因素第二类因素:不能控制的随机因素受前两类因素影响的事物为观察变量方差分析目的:分析控制变量的不同水平是否对观察变量产生了显著影响,检验各个水平下观察变量的均值是否相等第四张,PPT共五十六页,创作于2022年6月 方差分析分类之一单变量方差分析:一个观察变量单因方差分析中的控制变量只有一个多因素方差分析中的控制变量有多个多变量方差分析:多个观察变量第五张,PPT共五十六页,创作于2022年6月 方差分析分类之二一般方差分析:因变量是定量变量,自变量是定类数据协方差分析:将很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地
3、对控制变量进行评价。协变量一定要是连续数值型。非定量方差分析:因变量为定序变量第六张,PPT共五十六页,创作于2022年6月 统计技术分类图定量因变量一个自变量多个自变量二分变量多分变量T检验单因子方差分析定类定类和定距定距N因子方差分析协方差分析回归分析一个因变量多个因变量多变量方差分析因变量非定量因变量非定量方差分析第七张,PPT共五十六页,创作于2022年6月 方差分析原理目的:通过方差的比较来检验各个水平下的观察值的均值是否相等观察值差异:观察值存在差异,差异的产生来自两个方面。 系统性差异:由控制变量的不同水平造成的,例如饮料的不同颜色带来不同的销售量 随机性差异:由于抽选样本的随机
4、性而产生的差异,例如,相同颜色的饮料在不同的商场销售量也不相同。第八张,PPT共五十六页,创作于2022年6月方差分析的基本思想(单因素)组间变异总变异组内变异组内只包含随机误差组间既包括随机误差,也包括系统误差第九张,PPT共五十六页,创作于2022年6月9 组间变异组内变异AB第十张,PPT共五十六页,创作于2022年6月 组间变异组内变异 AB第十一张,PPT共五十六页,创作于2022年6月单因素方差分析逻辑与步骤(One-Way ANOVA)前提假设模型与假设平方和的分解与F 检验多重比较(事后检验)关联强度与效应值第十二张,PPT共五十六页,创作于2022年6月方差分析的前提条件(1
5、)每个水平下的因变量应当服从正态分布。方差分析对分布假设有稳健性(robust),即正态性不满足时,统计结果变化不大,因此一般并不要求检验总体的正态性。(2)变异可加性。各因素对离差平方和的影响可以分割成几个可以加在一起的部分。(多因素)(3)独立性。观察对象是来自所研究因素的各个水平之下的独立随机抽样第十三张,PPT共五十六页,创作于2022年6月(4)方差齐性(homogeneity of variance),也称变异的同质性,各个水平下的总体具有相同的方差。这是方差分析一个很重要的前提,因此在进行方差分析之前,应当进行方差齐性检验。Bartlett检验法Levene F 检验最大方差与最
6、小方差之比3,初步认为方差齐同。第十四张,PPT共五十六页,创作于2022年6月方差不齐若方差齐性的假定不满足,可考虑如下策略: a.检查某些表现“特殊”的观测值,看能否将其剔除,用剩下的数据进行方差分析。 b.使用无方差齐性假设的多重比较方法。 c.数据变换,用变换(平方根变换、对数变换等)后的数据进行方差分析。正态性转换。 d. 非参数检验第十五张,PPT共五十六页,创作于2022年6月模型与假设模型表达式(单因素)Y=+a+e建立假设,确定检验水准 k组总体均数不全相等。 第十六张,PPT共五十六页,创作于2022年6月方差分析表 组间变异体现了因素A的效应,组内变异则被视作误差。来源平
7、方和自由度均方F 值P 值组间组内总和确定P 值,做出统计推断第十七张,PPT共五十六页,创作于2022年6月如果均值相等,F=MSA/MSE1a F 分布F(k-1,n-k)0拒绝H0不能拒绝H0F第十八张,PPT共五十六页,创作于2022年6月事后比较(posteriori/post hoc comparison)F 检验显著说明各组均值并不相同(至少两组不同),但不能回答到底哪几组不同。通过对各组均值之间的配对比较来进一步检验到底哪些均值之间存在差异。方法众多,不下20种。第十九张,PPT共五十六页,创作于2022年6月LSD法:最灵敏,会犯假阳性错误;Sidak法:比LSD法保守;Bo
8、nferroni法:比Sidak法更为保守一些;常用Scheffe法:多用于进行比较的两组间样本含量不等时;Dunnet法:常用于多个试验组与一个对照组的比较;S-N-K法:寻找同质亚组的方法;Turkey法:最迟钝,要求各组样本含量相同;Duncan法:与Sidak法类似。均数两两比较方法第二十张,PPT共五十六页,创作于2022年6月关联强度 (strength of association)与效应值 (effect size)的度量实验处理引致的效应的大小或者数据的变异有多少部分是由实验处理造成的。Eta平方净(偏)Eta平方Omega平方Cohens f(具体内容见附录)第二十一张,P
9、PT共五十六页,创作于2022年6月双因素(无交互作用)试验的方差分析表方差来源因素A总和平方和自由度均方和F 值F 值临介值因素B误差注意 各因素离差平方和的自由度为水平数减一,总平方和的自由度为试验总次数减一。第二十二张,PPT共五十六页,创作于2022年6月双因素(有重复)试验方差分析表方差来源因素A总和平方和自由度均方和F 值F 值临介值因素B误差这里第二十三张,PPT共五十六页,创作于2022年6月方差分析的应用范围: (一)单因素多个样本均数的比较:1. 完全随机设计:只安排一种处理因素,不安排任何配伍因素。2. 随机化区组设计:只安排一种处理因素,安排一种配伍因素。 3. 拉丁方
10、设计:只安排一种处理因素,安排两种配伍因素。 第二十四张,PPT共五十六页,创作于2022年6月(二)多因素样本均数间的比较:1.析因设计:安排两种或两种以上处理因素, 分析处理因素间的交互作用2.裂区设计:安排两种或两种以上处理因素, 分析处理因素间的交互作用3.交叉设计:安排两种或两种以上处理因素, 分析处理因素间的交互作用(三)多个样本均数向量间的比较 多元方差分析:结果变量有两个以上,需要综合评价。(四)回归方程的假设检验 第二十五张,PPT共五十六页,创作于2022年6月协方差分析第二十六张,PPT共五十六页,创作于2022年6月概念:将方差分析和回归分析结合起来的一种统计分析方法
11、当试验指标(Y)的变异既受一个或几个分类变量,也受一个或几个连续变量的影响,可采用协方差分析方差分析:一个或几个因子(分类变量)对变量Y(连续变量)的影响回归分析:一个或几个变量(连续变量)对变量Y (连续变量)的影响 第二十七张,PPT共五十六页,创作于2022年6月27目的消除连续变量对Y的影响,使方差分析的检验功效更高,结果更可靠连续变量可能会增大 Y 的组间差异,导致错误结论连续变量可能会增大 Y 的组内变异,降低检验功效消除分类变量的影响,使回归分析的结果更可靠第二十八张,PPT共五十六页,创作于2022年6月28 20名男性篮球运动员和20名大学生的肺活量(cm3)比较篮球运动员肺
12、活量Y大学生肺活量Y4700345052004100 48004000协方差分析基本思想第二十九张,PPT共五十六页,创作于2022年6月协方差分析基本思想篮球运动员大学生身高X肺活量Y身高X肺活量Y1854700168345017552001704100 17448001694000 20名男性篮球运动员和20名大学生的肺活量(cm3)比较协变量第三十张,PPT共五十六页,创作于2022年6月协方差分析基本思想比较肺活量时,要消除身高的影响。方法1:抽样时,选身高相近的。方法2:从统计分析技巧上平衡数据。 校正了身高的影响后(回归分析),再比较两组肺活量的均数有无差异(方差分析)。第三十一张
13、,PPT共五十六页,创作于2022年6月协方差分析基本思想在方差分析中,用来校正因变量的数值型变量称为协变量(covariable)。含有协变量的方差分析称为协方差分析。协方差分析可提高方差分析的准确度。观察指标(Y)的总变异:SS总SS协变量SS处理SS误差第三十二张,PPT共五十六页,创作于2022年6月协方差分析的基本思想 其实质就是从Y的总离均差平方和中扣除协变量X对Y的回归平方和,对剩余(残差)平方和作进一步分解后再进行方差分析,以更好的评价处理的效应。 SS总SS回 SS残 SS总SS协变量SS处理SS误差 SS修正SS组内残差第三十三张,PPT共五十六页,创作于2022年6月33
14、大学生篮球运动员图1 协方差分析示意图调整均数第三十四张,PPT共五十六页,创作于2022年6月协方差分析步骤完全随机设计的协方差分析应用条件检验回归分析求调整均数对调整均数作方差分析第三十五张,PPT共五十六页,创作于2022年6月协方差分析的假设协方差分析的基本假设与方差分析相同,包括变量的正态性、观测值独立、方差齐性等,此外还有三个重要的假设:因变量与协方差之间线性关系;所测量的协变量不应有误差,如果选用的是多项的量表,应有高的内部一致性信度或重测信度,系数最好大于0.80。这一假设若被违反会造成犯一类错误的概率上升,降低统计检验力。“组内回归系数同质性”(homogeneity of
15、with in rgression),各实验处理组中一举协变量(X)预测因变量(Y)的回归线的回归系数要相等,即斜率相等,各条回归线平行。如果斜率不等则不宜直接进行协方差分析。第三十六张,PPT共五十六页,创作于2022年6月协方差分析的模型和假定回归分析:协方差分析:模型协变量Co-variable方差分析:第三十七张,PPT共五十六页,创作于2022年6月37第三十八张,PPT共五十六页,创作于2022年6月第三十九张,PPT共五十六页,创作于2022年6月Thanks!第四十张,PPT共五十六页,创作于2022年6月问题:为什么一个比较均数差异的方法竟称为方差分析? 这种命名是因为在检验
16、均数间差异是否具有统计学意义的过程中,我们实际上是通过比较方差而得到的。与t 检验直接比较两组的平均数的做法不同,方差分析把“平均数之间差异是否显著”的问题转化为“平均数组间变异是否显著”的问题,通过“组间变异”与“组内变异”的对比,进行F 检验,从整体上同时比较多组的平均数之间是否存在显著差异。第四十一张,PPT共五十六页,创作于2022年6月LSD (费舍最小显著差异法, Fishers least significant difference) 该方法是对检验两总体均值是否相等的t检验方法的总体方差估计加以修正(用MSE代替)而得到的。特点检验敏感性高,即水平间的均值只要存在一定程度的微
17、小差异就可能被检验出来。但该方法没有控制范第一类错误的概率。第四十二张,PPT共五十六页,创作于2022年6月S-N-K(Student-Newman-Keuls, q检验) 首先把各组均值排序,用每一比较的两个均值在排序序列种相差的等级数来确定不同的q 临界值。两均值的rank之差是一种有效划分相似性子集的方法,该方法适用于各水平下观测值个数相等的情况。第四十三张,PPT共五十六页,创作于2022年6月Tukey法(honesty significant different, HSD) 与SNK法类似,不同之处在于不论各组均值的大小次序,均使用同一临界值。组数它采用q统计量,适用于各水平下观
18、测值个数相等的情况。与LSD方法比较,较好的控制了范第一类错误的概率。第四十四张,PPT共五十六页,创作于2022年6月Bonferroni校正(以t 分布作为检验分布,对检验水准进行调整)与LSD方法基本相同。不同的是它控制了范第一类错误的概率。在每次两两组的检验中,它将显著水平除以两两检验的总次数。 在比较的次数较多时,该方法就不太适合。 第四十五张,PPT共五十六页,创作于2022年6月 Dunnett方法 是一种唯一用于多个处理组和一个对照组比较的方法。第四十六张,PPT共五十六页,创作于2022年6月SPSS提供的常用多重比较检验方法1、Tambanes T2: 基于t检验的保守的多
19、重比较方法。不满足方差齐性多重检验方法2、Dunnetts T3: 基于学生化极大模的多重比较方法。3、Games-Howell: 非参数多重比较方法。4、 Dunnetts C:基于学生化极差的多重比较方法,是一种可信区间的方法。第四十七张,PPT共五十六页,创作于2022年6月Eta平方(Eta-Squared,2),又称关联强度(correlation ratio),因变量的变异被自变量解释的百分比。净Eta平方(partial Eta-Squared,p2),多因素ANOVA中,扣除了其他自变量后某自变量的效应。 判断标准:0.01,小;0.06,中;0.14,大第四十八张,PPT共五
20、十六页,创作于2022年6月Omega平方(Omega squared,2) 当F显著时,2将会是正值,若为负,则要解释为0。当样本很大而使MSw变得很小,F很容易达到显著,此时若2很小,即使在统计上有意义,实际应用上仍然没意义。 判断标准:0.01,小;0.06,中;0.14,大第四十九张,PPT共五十六页,创作于2022年6月Cohens f f f 0.25,中;f 0.40,高 第五十张,PPT共五十六页,创作于2022年6月修正均数 的计算:修正均数间的多重比较:S2y.x为组内剩余方差第五十一张,PPT共五十六页,创作于2022年6月SS总 SS回 SS总残第五十二张,PPT共五十六页,创作于2022年6月52常用试验设计1.完全随机设计(Completely random design) 单因素设计. 优点:简单易行,缺点:只能分析一个因素 2.配伍设计(Randomized block des
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 卫计委办公室工作计划范文
- 高二、五班班主任工作计划及行事历下学期
- 高中暑期学习计划
- 2024年工程管理工作计划报告
- 小学德育工作计划表
- 2021年下半年营销部工作计划
- 中学名师培养计划方案
- 2024大班教育教学计划
- 年度内部审核计划
- 新学期学习计划和目标范文
- 沈阳故宫旅游营销策划
- 2024年青海省交通控股集团有限公司招聘笔试参考题库含答案解析
- 2024轨道式集装箱门式起重机自动化技术规范
- 冬至节气(课件) 小学主题班会 23张幻灯片
- 2024年中国电建招聘笔试参考题库含答案解析
- 苏轼成语课件
- 用函数模型解决实际问题高一上学期数学北师大版(2019)必修第一册
- 意大利(百得)TBG 系列燃烧机说明书
- 道路交通安全培训内容
- 初中语文七年级上册《蚊子和狮子》教学课件
- 桥梁加固维修施工组织设计
评论
0/150
提交评论