版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十一章 方差分析与试验设计p方差分析导论p方差分析p多重比较方法p试验设计(完全随机化试验设计、随机化区组设计、双因素方差分析)方差分析导论p之前已经讨论过对于双总体均值差异的假设检验,那么如果是三个或三个以上的总体均值差异比较的检验呢?p先看一个现实例子:p某公司有下属甲、乙、丙三家工厂生产主要产品。为了确定这些工厂中有多少员工了解全面质量管理,从每个工厂中抽取一个由6名员工组成的样本,对这些样本进行质量管理有关知识的考核。得到了下表所示的考试分数:员工代号工厂甲工厂乙工厂丙185715927575643827362476746957169756858267p公司想知道:下属的三个工厂工人
2、在质量管理知识掌握上是否有差异?p因此相应的检验假设为:p ; Ha: u1,u2,u3不全相等p该例题中,响应变量(response variables)为工人考分;因素(factor)为工厂;各工厂的名称所属为处理(Treatment)p我们本章引入的方差分析方法就是用来检验:三个或三个以上总体均值的方法。p如果拒绝了H0,则说明:三个或三个以上的总体均值不全相等;至少有两个总体均值不同。3210:Hp进行方差分析之前有几个假设:p1. 对于每个总体,响应变量服从正态分布;p2. 对于所有总体,响应变量的方差相同;p3. 观测值是独立的。p方差分析的原理:p如果H0:u1=u2=u3为真,
3、且满足以上假定时,对于三个样本均值 都来自同一个抽样分布,那么此时该总体的均值估计(或称为 )可以用三个样本均值的算术平均数来估计。321,xxxxx1x2x3xnx22p此时的总体方差 的估计可以由:p此时 可以由样本的组间方差估计得到; 也可以通过样本的组内方差的平均值估计。在H0为真的情况下,二者的比值应接近于1。p组间方差:p组内估计:22xn22x13)()()(2322212xxxxxxsx35/)(5/)(5/)(612336122261211iiiiiixxxxxx2p如果H0:u1=u2=u3为假,说明总体均值不全相等,他们来自不同的抽样分布。此时的样本均值不接近。p相应的,
4、组间方差增大。此时的组间方差不适合估计p且组间方差和组内方差的比值远大于1.x2311x2x1x2xp由上例计算:p可见,总体方差的组间估计远大于组内估计,比率为9.p如前所述,当总体方差的组间估计与组内估计的比值较大时,可能导致拒绝原假设,那么多大的程度可以拒绝H0的原假设呢?25843613)()()(62322212xxxxxx组间6728332203435/)(5/)(5/)(612336122261211.组内iiiiiixxxxxxp方差分析的思想方差分析的思想:p比较总体方差的组间估计和组内估计:p组间估计是以样本均值间的变动来估计总体方差p组内估计是合并每个样本内的变动来估计总
5、体方差22比较总体方差的组内估计和组间估计在各总体均值无差异时,这两个估计应很接近若两个估计很接近,则不能否定各总体均值无差异若两个估计不是很接近,则按照一定的原则否定各总体均值无差异的假定方差分析p根据之前对方差分析原理的阐述,我们可以用判断样本方差比值的方法对k个总体均值进行检验。p假设从k个总体或处理中选择一个样本容量为n的简单随机样本。我们有以下定义,其中,nTn1+n2+nkp若每个样本的样本容量相等,则总样本平均值为:p即总体均值恰好等于k个样本均值的算术平均数.p定义总体方差的组间估计和组内估计总体方差的组间估计和组内估计p 的组间估计:pMSTR称为处理均方(mean squa
6、re due to treatments)p其中,MSTR的分子称为处理平方和SSTR(sum of squares due to treatments)2p 的组内估计:pMSE称为组内均方(mean square due to error)p其中,MSE的分子称为组内平方和,(sum of square due to error)p若H0为真,组间估计是总体方差的无偏估计;若H0为假,组间估计得到的 则偏大.不论H0真或假,组内估计都是总体方差的无偏估计.组内估计反映每个处理内部的变动.22p定义方差分析的统计量定义方差分析的统计量pF统计量的构造:两个chi方分布被各自自由度除以后的比值
7、.p在响应变量服从独立正态分布的假定下,且H0为真时,p我们可以推知,SSTR/ , SSE/ 分别服从自由度为(K-1)和(nT-k)的chi方分布.根据F分布的构造,可知,统计量F=MSTR/MSEF(k-1,nT-k)服从自由度为k-1和nT-k的F分布.由上例的数据计算可得,样本F统计量为F=258/28.67=922p方差分析的拒绝规则方差分析的拒绝规则:pH0: u1=u2=uk; Ha: u1,u2,uk 不全相等p在显著水平下的拒绝规则为:p若FF(;k-1,nT-k),则拒绝H0的原假设,认为总体1,总体2,.总体k的均值不全相等.p上例中的拒绝域是,pFF(0,05,2,1
8、5)=3.68p即当由样本信息计算得到的F统计量大于3.68时,拒绝初始假设H0.因为93.68,我们拒绝三个总体均值无差异的假设.F=MSTR/MSEF(;k-1,nT-k)p方差分析表方差分析表(ANOVA)方差来源平方和自由度均方(mean square)F统计量组间(处理)SSTRK-1MSTRMSTR/MSE组内(误差)SSEnT-kMSE合计SSTnT-1p方差分析就是将总得平方和及自由度分解为相应的来源:处理和误差.p当各样本的容量相等时,212121)(1)(xkjjkjjjnskxxnkxxnMSTRksknksnknsnMSEkjjkjjTkjjj121212) 1() 1
9、(多重比较方法p之前讨论的方差分析检验原假设时,只能得到所有总体均值是否相等的结论,但具体到若干个配对总体均值是否相等,就不能得出准确结论.p多重比较方法:Fisher LSD方法(Least Significant Difference)p该法是对总体方差估计稍微做出修改得出,别切给予两个总体情形的t检验统计量.LSD方法的多重比较步骤p1. H0: ui=uj; Ha: uiujp2. 检验统计量p3.拒绝规则为:p如果tt(a/2)或t-t(a/2),则拒绝H0p其中的t分布自由度为(nT-k)11(jijinnMSExxtp上例,我们对甲乙丙三家工厂的员工测试表明,三家工厂员工对质量管
10、理的知识认同没有达到一致.但具体是哪两家工厂间,或所有工厂间出现了认识差异呢?p用LSD多重比较方法分别对甲乙、甲丙、乙丙来进行判断,p相应的变量为:n1=n2=n3=6, k=3, nT=18;pMSTR=258;MSE=28.67pH0:u1=u2;Ha:u1u2p在假定H0为真的情形下,有统计量t服从自由度为15的t分布p此时,tt(0.025;15)=2.131p拒绝H0,可以得出甲丙两厂工人对质量认知有差异的结论。214)6161(67.286679)11(.jijinnMSExxtpH0:u2=u3;Ha:u2u3p在假定H0为真的情形下,有统计量t服从自由度为15的t分布p此时,
11、tF(0.05;2,12)=3.89p由于F=9.183.89,说明拒绝H0原假设,即三种装配方法的平均产量有差异。p相应的ANOVA表方差来源平方和自由度均方(mean square)F统计量组间(处理)52022609.18组内(误差)3401228.33合计86014试验设计:随机化区组设计p什么叫随机化区组设计p当试验单元同质时,完全随机设计有效;若试验单元异质,则需要采用随机化区间设计。p这个设计的目的就是通过剔除MSE项中的外部来源方差,来得到实际误差方差的最佳估计。p随机化区组设计由b个区组所组成,每个区组包含k个试验单位。K个处理被随机的指派给每个区组中的单位,且每个处理在每个
12、区组中只出现一次。p例:一项对3种不同包装设计的顾客偏好研究采用随机化区组试验设计,在4个超级市场进行。该试验进行了3周。超级市场包装1包装2包装31173423215262131238462216p表中给出的是每个超级市场在给定三周内每周每种包装设计售出的单位数。p问这些数据是否可以提供足够的证据表明各种包装设计的平均销售量有差异?p在纯随机设计中,包装设计被随机的指派到每个超级市场,然而由题可知,超级市场由于受到地域、人流量等的因素影响,存在异质性。因此总体方差的组内估计MSE除了误差的影响以外,还受到市场间的异质而导致的误差。因此,如果仍采用纯随机设计的方差分析方法,则可能产生错误的结果
13、。pSST=SSTR+SSBL+SSEp总方差可以分解为:分解为处理平方和(SSTR),区组平方和(SSBL)以及误差平方和(SSE)p其中,k为处理个数,b为区组数,nT为总的样本大小,方差来源 平方和自由度均方(mean square)F统计量处理SSTRk-1MSTRMSTR/MSE区组SSBLb-1MSBL误差SSE(k-1)(b-1) MSE合计SSTnT-1p由例题计算得到各统计量:pSSE=SST-SSTR-SSBL=45.5667.940)(41312jiijxxSST167.547)(4312.jjxxSSTR00.348)(3412.iixxSSBLp由例题计算得到各统计量
14、:方差来源平方和自由度均方(mean square)F统计量处理547.1672273.48336.08区组3483116误差45.567.58合计940.66711p同样的,我们也可以根据统计量F=MSTR/MSE的抽样分布来判定处理均值之间的差异。p在假定H0为真,总体满足正态分布,且观测值独立的情形下,统计量F服从自由度为(k-1,(k-1)*(b-1)的F分布。p拒绝规则为:若FF(a;k-1,(k-1)*(b-1),则拒绝H0的原假设。p本例的F统计量为36.0810.92,因此我们拒绝原假设,认为各种包装设计的平均销售量有差异。p例:空中交管员的压力测试p一项研究通过衡量空中交通管
15、制员的工作压力,建议改造并重新设置管制员工作站。设计三个工作方案,先想知道这三个工作方案对减轻管制员压力的效果有多大差异。p由于不同的管制员对压力的承受力是不同的,即考察对象不是同质的,组内方差有两个来源,一个是随机误差,一个是管制员的个人差异导致的误差。因此我们通过随机化区组设计将个人差异从MSE中分离出来。p为了体现随机化的特点,我们以管制员为区组,将三个方案以随机的顺序指派给每个管制员。p每个管制员要操作每个系统。p收集到以下数据:p可以计算得到以下汇总数据:p计算SST,SSTR,SSBL及SSEpSSE=SST-SSTR-SSBL=1970)(31612jiijxxSST21)(63
16、12.jjxxSSTR30)(3612.iixxSSBLp将各平方和被各自的自由度除以后,可得到相应的均方:pMSTR=SSTR/(K-1)=10.5pMSE=SSE/(k-1)*(b-1)=1.9pMSBL=SSBL/(b-1)=6pF=MSTR/MSE=10.5/1.9=5.53p计算的结果通过ANOVA表表示出来,如下:p通过比较F与F(a;2,10)可以得出是否拒绝H0的结论:pF5.53F(a;2,10)=4.1,拒绝原假设H0:u1=u2=u3p说明,统计上可以认为三种方案在对空中交通管制员平均压力效果上有差异。试验设计:双因素试验p之前的试验设计仅针对一个因子(factor)考虑
17、相应的统计结论,现在我们需要考虑关于两个或更多因子相关的结论。p我们介绍双因素试验以及双因素的方差分析方法。p例:某大学考虑以下三种GMAT辅导课程(factor1),对应的有三个因子值(处理):p1. 3小时复习,内容覆盖GMAT常考题型;p2. 1天课程,覆盖有关考试资料,及模拟考试;p3. 10周课程,发现学生弱点并建立个人改进课程。p另外,报考GMAT考试的学生主要来自三类学院(factor2),对应的三个因子值(处理),分别为1.商学院;2.工学院;3.艺术与科学学院。p因此,发现影响考试成绩的两个因素分别为:p课程类型及考生所在的院系。p现想考察辅导课程是否GMAT成绩的影响不同?
18、考生所在的院系是否对GMAT成绩的影响不同?p以及是否某些院校的考生参加某种辅导课程表现不错,但参加另一种辅导课程则表现不佳?p显著水平为:5%p现分别从各学院抽取6名考生,将其随机安排,其中各学院中的两名学生参加课程1,两名参加课程2,两名参加课程3。由GMAT考试收集到的考分数据如下:p因此,总的观测个数为18.因子1的处理个数为3,因子2的处理个数为3.且样本进行了2次复制。(在每个组合中有2个观测值)p由于双因素之间也可能产生影响,因此有交互作用(interaction),如果这个影响对GMAT考分有明显作用,我们就能得出辅导课程效果依赖于毕业院校的结论。p方差分析方法:pSST=SS
19、A+SSB+SSAB+SSEp设,a因子1的水平数(处理数);b-因子2的水平数(处理数);r-复制的个数;nT为总的观测个数。p相关记号:p A的第i个处理与B的第j个处理的第k个复制的观测值p A的第i个处理的样本均值p B的第j个处理的样本均值p A的第i个处理与B的第j个处理的组合的样本均值p 所有nT个观测值的样本均值ijkx. ixjx.ijxxbjrkijkixbrx11.1airkijkjxarx11.1rkijkijxrx11rkaibjijkxabrx1111p根据GMAT分数数据,我们计算以上统计量:方差来源平方和自由度均方(mean square)F统计量因素16100230501.38因素24530022265010.27交互作用11200428001.27误差1985092206合计8245017p1.检验辅导课程是否对GMAT成绩影响差异?pH0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年工交企业流动资借款合同
- 2024年营口旅客运输从业资格证考试题库
- 2024年合作养殖协议范本
- 2024年南京大客车从业资格证考试
- 2024年客运从业资格证试题下载电子版
- 2024年长沙汽车客运从业资格考试
- 2024年房屋买卖定金合同范
- 2024年经济适用房出售协议
- 2024年杭州市新建房屋白蚁预房工程合同
- 2024年中药饮片采购项目政府采购合同
- 杭州本级公共租赁住房资格续审申请表Ⅴ
- GB/T 18281.7-2024医疗保健产品灭菌生物指示物第7部分:选择、使用和结果判断指南
- 北京四中初一年级期中语文试题
- 2024年消防宣传月知识竞赛考试题库300题(含答案)
- 二十届三中全会精神学习试题及答案(100题)
- 2024二十届三中全会知识竞赛题库及答案
- 2024年江苏省昆山市自然资源和规划局招聘编外13人历年(高频重点复习提升训练)共500题附带答案详解
- 小学一年级拼音天天练
- 支气管哮喘急性发作个案护理记录
- 一年级数学专项练习(大括号问题、求总数、求部分数、一图四式)
- 档案整理及数字化服务方案
评论
0/150
提交评论