第九章一方差分析_第1页
第九章一方差分析_第2页
第九章一方差分析_第3页
第九章一方差分析_第4页
第九章一方差分析_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章一方差分析第一页,共五十九页,2022年,8月28日第一节方差分析的基本问题

一、方差分析的内容

对多个总体均值是否相等进行检验(一)方差分析在科学实验和生产实践中,影响一事物的因素很多,每一个因素的改变都有可能影响产品的数量和质量,有些影响较大,有些影响较小,怎么找出对产品有显著影响的因素?我们需要进行试验测量。将所有测量值间的总差异按照其差异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的差异是否具有统计学意义。第二页,共五十九页,2022年,8月28日例9.1某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一期该种饮料的销售量情况。见表9-1。问饮料的颜色是否对销售量产生影响。超市无色粉色橘黄色绿色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8表9-1该饮料在五家超市的销售情况单位:箱第三页,共五十九页,2022年,8月28日几个基本概念

1.对销售量是否有影响的那些(可以控制的)条件称为因素;2.为了考察一个因素的影响,一般把它严格控制在几个不同的状态等级上,把因素的每一个状态或等级称为一个水平;3.只考察一个因素的方差分析,称为单因素方差分析;4.同时考察两个或两个以上因素的方差分析,称为多因素方差分析;5.假定各水平的数据是来自正态分布总体的随机样本,各水平的样本互相独立,且方差相等。第四页,共五十九页,2022年,8月28日例9.1的分析1.检验饮料的颜色对销售量是否有影响,即检验四种颜色饮料的平均销售量是否相等。则饮料颜色就是考察的因素,而四种颜色就是四个水平2.用和分别表示无色、粉色、橘黄色和绿色饮料的平均销售量,那么就是要检验如下的假设是否成立。而备选假设则为3.上述假设的检验方法就是方差分析和不全相等第五页,共五十九页,2022年,8月28日二、方差分析原理

1.两类误差及两类方差⑴.每个水平为一个总体;⑵.每个水平的一组观察值为总体的一个随机样本,同一水平下样本观察值之间的差异称为随机误差,用组内方差来表示;⑶.不同水平下样本观察值之间的差异可能是由于不同水平引起的,这种误差称为系统误差,但也包含随机误差。不同水平样本观察值之间差异用组间方差来表示,即组间方差包括随机误差,也包括系统误差。第六页,共五十九页,2022年,8月28日2.方差的比较⑴.如果不同水平对试验结果没有不同影响,那么组间方差中只包括随机误差,这时,组间方差与组内方差应该相近,组间方差与组内方差之比接近1;⑵.如果不同水平对试验结果有不同影响,那么组间方差除了随机误差之外还包括系统误差,这时,组间方差就会大于组内方差,组间方差与组内方差之比就会大于1;⑶.方差分析就是通过这种方差的比较,作出接受原假设或拒绝原假设的判断。第七页,共五十九页,2022年,8月28日三、F分布F服从F分布。F分布为正偏态,随着自由度的增加趋于对称。当自由度很大时,F分布可用正态分布来近似。第八页,共五十九页,2022年,8月28日第二节单因素方差分析

一、单因素方差分析的步骤

㈠、提出假设对于r个水平的单因素方差分析,原假设和备择假设为不全相等对于例9.1,则不全相等第九页,共五十九页,2022年,8月28日㈡、计算水平均值设第j水平有个观察值,则第j个水平的样本均值:第j水平下的第i个观察值。而样本总均值其中其中(9.2)(9.3)第十页,共五十九页,2022年,8月28日观察值i水平1234无色粉色橘黄色绿色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8合计136.6147.8132.2157.3573.9水平均值四种颜色饮料销售量及均值单位:箱表9-2第十一页,共五十九页,2022年,8月28日㈢、计算离差平方和

1.总离差平方和

(总变异):用SST表示总离差平均和,反映全部数据的离散情况,即(9.4)例9.1的总离差平方和为第十二页,共五十九页,2022年,8月28日2.误差项离差平方和

(组内变异):用SSE表示误差项离差平方和,反映各水平数据的离散情况,即例9.1的1水平数据的平方和(9.5)第十三页,共五十九页,2022年,8月28日类似可得从而第十四页,共五十九页,2022年,8月28日3.水平项离差平方和

(组间变异)

:用SSA表示水平项离差平方和,反映各水平样本数据之间的异差程度,即对于例9.1有(9.6)第十五页,共五十九页,2022年,8月28日三个平方和的关系总离差平方和SST、误差项离差平方和SSE及水平项离差平方和SSA之间的关系

SST=SSA+SSE证:(9.7)第十六页,共五十九页,2022年,8月28日续(三个平方和的关系)由于从而在实际计算时,一般先计算SST和SSA,而

SSE=SST-SSA对于例9.1有115.9295=76.8455+39.084第十七页,共五十九页,2022年,8月28日组间变异总变异组内变异第十八页,共五十九页,2022年,8月28日㈣、计算平均平方1.各个离差平方和的大小与数据的多少有关,各个离差平方和的平均称为平均平方,也称均方或方差,用MS表示;2.平均平方是离差平方和除以相应的自由度;3.三个平方和的自由度分别为:⑴SST的自由度为n-1⑵SSA的自由度为r-1⑶SSE的自由度为第十九页,共五十九页,2022年,8月28日续(计算平均平方)4.SSA的平均平方记为MSA,即5.SSE的平均平方记为MSE,即(9.8)关于自由度,存在如下的关系式(9.9)对于例9.1第二十页,共五十九页,2022年,8月28日三个平方和的作用1.SST反映了全部样本数据的总离散程度,SSE反映了由于随机性引起的变动部分,即随机误差;而SSA则反映了不同水平之间引起的变动部分,即可以同时反映随机误差和系统误差的大小;2.如果成立,即为真,则表明没有系统误差,那么MSA和MSE都反映随机误差的大小,从而3.如果不成立,即不全相等,则SSA不仅反映了随机误差,同时还反映了系统误差的大小,从而F有偏大的趋势。应接近1;第二十一页,共五十九页,2022年,8月28日㈤、方差分析表当为真,即时,则对于例9.1,计算得前面这些计算结果可以列成表格的形式,称为方差分析表。第二十二页,共五十九页,2022年,8月28日方差来源离差平方和自由度平均平方F值SS

dfMS组间SSAr-1MSAMSA/MSE组内SSEn-rMSE-总差异SSTn-1

--方差分析表表9-3第二十三页,共五十九页,2022年,8月28日㈥、统计决策对于规定的显著性水平,由于根据小概率原理,若则拒绝。认为各水平均值不全相等。称所考察因素的各水平间差异显著,或各水平均值间有显著差异,而当则不能拒绝。这时称各水平之间无显著差异,即认为成立,各水平的均值都相等。第二十四页,共五十九页,2022年,8月28日续(统计决策)对于例9.1,若取,则由于从而拒绝。认为饮料的四种不同颜色的平均销售量有显著差异,即饮料的颜色对销售量有显著影响。第二十五页,共五十九页,2022年,8月28日表9-4差异源SSdfmsFP-valueF-crit组间76.8455325.6151710.48620.0004663.23887组内39.0840162.44275---总计115.929519----Excel输出的方差分析表第二十六页,共五十九页,2022年,8月28日二、方差分析中的多重比较1.方差分析拒绝,从而接受时,认为各水平均值不全相等。多重比较是通过对各均值之间的配对比较来进一步检验到底哪些均值之间有显著差异;2.多重比较的方法有多种,这里介绍最小显著差异法(LeastSignificantDifference-LSD)和q检验两种方法.第二十七页,共五十九页,2022年,8月28日㈠、最小显著差异法(LSD)

LSD方法具有检验敏感性高的特点,即水平间的均值只要存在一定程度的微小差异就可能被检验出来。是一种检验两个总体均值是否相等的t检验方法:(9.10)其中是由两个样本的数据求得。当对多个总体进行比较时,由于SSE的平均平方MSE是由r个水平的全部样本数据求得,从而用MSE代替。于是统计量t为(9.11)第二十八页,共五十九页,2022年,8月28日多重比较的步骤1.提出原假设和备择假设3.若则拒绝,称和有显著差异,否则不能拒绝。即接受,称和没有显著差异。2.检验统计量第二十九页,共五十九页,2022年,8月28日LSD

方法

LSD方法通常并不按t值作检验,而是基于作检验。1.提出和3.若则拒绝,否则接受2.计算LSD第三十页,共五十九页,2022年,8月28日例9.1的LSD方法已知取,则从而多重比较的结果可以列成表格形式,称为多重比较表第三十一页,共五十九页,2022年,8月28日例9.1的多重比较表(LSD法)=31.465.02*4.14*1.9=29.563.12*2.24*=27.320.88=26.44表中的差值右上角标者表示相应的第三十二页,共五十九页,2022年,8月28日㈡、q检验

q检验要求各水平的观察值个数相等,即。首先计算(9.13)然后查q表,q表值由和确定。由此计算临界值(9.14)则认为,否则认为。若第三十三页,共五十九页,2022年,8月28日q检验步骤1.提出原假设和备择假设3.若2.计算D则拒绝,称和有显著差异。否则不能拒绝,即接受,称和没有显著差异。第三十四页,共五十九页,2022年,8月28日例9.1的q检验已知,则再按查q表得于是多重比较的结果列于多重比较表第三十五页,共五十九页,2022年,8月28日例9.1的多重比较表(q检验)=31.465.02*4.14*1.9=29.563.12*2.24=27.320.88=26.44表中的差值右上角标者表示相应的第三十六页,共五十九页,2022年,8月28日LSD法与q检验的说明1.LSD=2.096,D=2.83,从而两种方法的结论有差别。由于按LSD法,则认为,但从而按q检验,又认为。一般认为q检验的结果更为可靠。第三十七页,共五十九页,2022年,8月28日续(LSD法与q检验的说明)2.q检验要求,即,否则应按调和平均数计算m,即然后再按(9.13)式计算,对于LSD法各水平的观察值个数可以相等,也可以不相等。(9.15)第三十八页,共五十九页,2022年,8月28日第三节双因素方差分析

一、双因素方差分析的类型1.同时分析两个因素(因素A和因素B)对试验结果的影响;2.分别对两个因素进行检验,考察各自的作用;3.如果因素A和因素B对试验结果的影响是相互独立的,则可以分别考察各自的影响,这种双因素方差分析称为无交互作用的双因素方差分析;4.如果因素A和因素B除了各自对试验结果的影响外,还产生额外的新影响,这种额外的影响称为交互作用,这时的双因素方差分析则称为有交互作用的双因素方差分析;(自学)5.无交互作用的双因素方差分析,相当于对每个因素分别进行单因素方差分析.第三十九页,共五十九页,2022年,8月28日二、数据结构

㈠、双因素方差分析的基本假定1.对于各因素的每个水平的观察值,是来自正态总体的简单随机样本;2.各正态总体的方差都相等;3.各随机样本相互独立。第四十页,共五十九页,2022年,8月28日表9-8因素(A)A1A2…ArB1X11X12…X1rB2X21X22…X2r...............BBkXk1Xk2…Xkr…双因素方差分析数据结构因素第四十一页,共五十九页,2022年,8月28日㈡、各水平样本均值与样本总均值1.A因素第j水平的样本均值2.B因素第i水平的样本均值3.样本总平均第四十二页,共五十九页,2022年,8月28日三、双因素方差分析的步骤

㈠、提出假设1.对因素A提出的假设为不全相等2.对因素B提出的假设为不全相等第四十三页,共五十九页,2022年,8月28日㈡、计算离差平方和

1.总离差平方和反映全部数据的离散情况(9.16)第四十四页,共五十九页,2022年,8月28日(9.17)2.因素A的离差平方和反映因素A各水平之间的差异第四十五页,共五十九页,2022年,8月28日(9.18)3.因素B的离差平方和反映因素B各水平之间的差异第四十六页,共五十九页,2022年,8月28日(9.19)4.误差项离差平方和反映了随机误差的离散情况第四十七页,共五十九页,2022年,8月28日(9.19)离差平方和的分离公式即

SST=SSA+SSB+SSE第四十八页,共五十九页,2022年,8月28日㈢、计算平均平方1.各个离差平方和的大小与数据的多少有关,各个离差平方和的平均称为平均平方2.平均平方是离差平方和除以相应的自由度3.各个平方和的自由度分别为⑴SST的自由度为n-1⑵SSA的自由度为r-1⑶SSB的自由度为k-1⑷SSE的自由度为且第四十九页,共五十九页,2022年,8月28日续(计算平均平方)4.SSA的平均平方记为MSA,即5.SSB的平均平方记为MSB,即6.SSE的平均平方记为MSE,即(9.20)(9.21)(9.22)第五十页,共五十九页,2022年,8月28日㈣、方差分析表1.检验因素A的各水平对试验结果有无显著影响,采用统计量2.检验因素B的各水平对试验结果有无显著影响,采用统计量第五十一页,共五十九页,2022年,8月28日表9-9误差来源离差平方和自由度均方差F值A因素SSAr-1MSA=SSA/(r-1)FA=MSA/MSEB因素SSBk-1MSB=SSB/(k-1)FB=MSB/MSE误差SSE(r-1)(k-1)MSE=

SSE/(r-1)(k-1)-合计SSTn-1--双因素方差分析表第五十二页,共五十九页,2022年,8月28日㈤、统计决策1.对规定的显著性水平

,由于则拒绝,认为因素A的各水平间有显著差异2.对规定的

,由于根据小概率原理,若从而,若则拒绝,认为因素B的各水平间有显著差异第五十三页,共五十九页,2022年,8月28日四、应用实例

例9.3某商品有五种不同包装方式(因素A),在五个不同地区销售(因素B),现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售资

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论