数学建模之方差分析_第1页
数学建模之方差分析_第2页
数学建模之方差分析_第3页
数学建模之方差分析_第4页
数学建模之方差分析_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一讲第一讲 方差分析方差分析 1.1 方差分析的概念方差分析的概念 1.2 单因素方差分析单因素方差分析 1.3 有交互作用的双因素方差分析有交互作用的双因素方差分析 1.4 无交互作用的双因素方差分析无交互作用的双因素方差分析 一、问题的引入一、问题的引入 在实际应用中,我们常常会遇到需要对两个在实际应用中,我们常常会遇到需要对两个以及两个以上总体均值是否相等进行检验,从而以及两个以上总体均值是否相等进行检验,从而判断某一种因素对我们所研究的对象是否产生了判断某一种因素对我们所研究的对象是否产生了显著的影响。显著的影响。 1.1 1.1 方差分析的概念方差分析的概念 例例1:某饮料生产企业

2、研制出一种新型饮料。饮料:某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,料的销售情况,饮料的颜色是否对销饮料的颜色是否对销售量产生影响。售量产生影响。 该饮料在五家超市的销售情况该饮料在五家超市的销售情况超市超市无色无色粉

3、色粉色 橘黄色橘黄色绿色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8 例例2 某公司为了研究三种不同内容的广告宣传对某种某公司为了研究三种不同内容的广告宣传对某种无季节性的无季节性的大型机械的销售量是否有显著影响,经调查统大型机械的销售量是否有显著影响,经调查统计,一年四个季度的销售量计,一年四个季度的销售量(单位单位:台台)如下如下: A1是强调运输方便性的广告,是强调运输方便性的广告,A2是强调节省燃料的经是强调节省燃料的经济性的广告,济性的广告,A3是强调噪音

4、低的优良性的广告是强调噪音低的优良性的广告.试判断试判断:新新闻广告的类型对该种机械的销售量是否有显著影响闻广告的类型对该种机械的销售量是否有显著影响?若影若影响显著,哪一种广告内容为好响显著,哪一种广告内容为好?广告类型广告类型第一季度第一季度第二季度第二季度第三季度第三季度第四季度第四季度A1A1163176170185A2A2184198179190A3A3206191218224 方差分析:在若干个能够相互比较的资料组中,方差分析:在若干个能够相互比较的资料组中,判别各组资料是否存在差异以及分析差异原因的判别各组资料是否存在差异以及分析差异原因的方法和技术。方法和技术。 方差分析由英国

5、统计学家方差分析由英国统计学家R.A.Fisher首创,为纪首创,为纪念念Fisher,方差分析又称,方差分析又称 F 检验检验 (F test)。用)。用于推断于推断多个总体均值多个总体均值有无差异有无差异二、基本概念二、基本概念 1.因素又称因子,指需要考察的引起数据变动的主因素又称因子,指需要考察的引起数据变动的主要原因,通常用要原因,通常用A、B、C表示。表示。 如:要分析饮料的颜色对销售量是否有影响,颜色如:要分析饮料的颜色对销售量是否有影响,颜色是要检验的因素或因子是要检验的因素或因子. 又如:要分析新闻广告的内容对某种机械的销售量又如:要分析新闻广告的内容对某种机械的销售量是否有

6、显著影响,新闻广告类型是所要检验的因素。是否有显著影响,新闻广告类型是所要检验的因素。可以控制可以控制的试验条的试验条件件单因素方差分析:在实验中考察的因素只有一个。单因素方差分析:在实验中考察的因素只有一个。多因素方差分析:多因素方差分析:在实验中考察的因素有两个以上。在实验中考察的因素有两个以上。双因素方差分析:双因素方差分析:在实验中考察的因素有两个。在实验中考察的因素有两个。2.2.水平:水平:因子在实验中的不同状态。因子在实验中的不同状态。 如:例如:例1中中橘黄色、粉色、绿色和无色透明橘黄色、粉色、绿色和无色透明四四种颜色就是因素的四个水平。种颜色就是因素的四个水平。3.3.交互影

7、响:交互影响:如果因子间存在相互作用,称之为如果因子间存在相互作用,称之为“交互影响交互影响”;如果因子间是相互独立的,则称;如果因子间是相互独立的,则称为无交互影响。为无交互影响。4.4.观察值:在每个因素不同水平下得到的样本值。观察值:在每个因素不同水平下得到的样本值。 如例如例1 1中每种颜色饮料的销售量就是观察值。中每种颜色饮料的销售量就是观察值。三、方差分析的基本思想三、方差分析的基本思想n比较两类误差比较两类误差 以检验均值是否相等以检验均值是否相等n随机误差和系统误差随机误差和系统误差 随机误差:随机误差:在因素的同一水平在因素的同一水平(同一个总体同一个总体)下,下,样本的各观

8、察值之间的差异。样本的各观察值之间的差异。 比如,同一种颜色的饮料在不同超市上的销售量比如,同一种颜色的饮料在不同超市上的销售量是不同的。不同超市销售量的差异可以看成是随机因是不同的。不同超市销售量的差异可以看成是随机因素的影响,或者说是由于抽样的随机性所造成的,称素的影响,或者说是由于抽样的随机性所造成的,称为随机误差为随机误差 。 系统误差:系统误差:在因素的不同水平在因素的不同水平(不同总体不同总体)下,各观下,各观察值之间的差异。察值之间的差异。 比如,同一家超市,不同颜色饮料的销售量也是不比如,同一家超市,不同颜色饮料的销售量也是不同的。这种差异可能是由于抽样的随机性所造成的,也同的

9、。这种差异可能是由于抽样的随机性所造成的,也可能是由于颜色本身所造成的,后者所形成的误差是由可能是由于颜色本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差。系统性因素造成的,称为系统误差。n比较的基础是方差比比较的基础是方差比n组内方差、组间方差组内方差、组间方差 组内方差:组内方差:因素的同一水平因素的同一水平(同一个总体同一个总体)下样本下样本数据的方差。数据的方差。 比如,无色饮料在比如,无色饮料在5家超市销售数量的方差。组内方家超市销售数量的方差。组内方差只包含随机误差差只包含随机误差 组间方差:组间方差:因素的不同水平因素的不同水平(不同总体不同总体)下各样下各样本之

10、间的方差本之间的方差 比如,例比如,例1中橘黄色、粉色、绿色和无色中橘黄色、粉色、绿色和无色透明四种颜色饮料销售量之间的方差。组间透明四种颜色饮料销售量之间的方差。组间方差既包括随机误差,也包括系统误差。方差既包括随机误差,也包括系统误差。 方差的比较方差的比较 如果不同颜色如果不同颜色(水平水平)对销售量对销售量(结果结果)没有影响,没有影响,那么在组间方差中只包含有随机误差,而没有那么在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近很接近,两个方差的比值就会接近1。 如果不同的水平对结果有影响

11、,在组间方差如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于组内方差的比值就会大于1。 当这个比值大到某种程度时,就可以说不同当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异。水平之间存在着显著差异。四、基本假定四、基本假定1.每个总体都应服从每个总体都应服从正态分布正态分布对于因素的每一个水平,其观察值是来自服从正态对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本分布总体的简单随机样本比如

12、,每种颜色饮料的销售量必须服从正态分布比如,每种颜色饮料的销售量必须服从正态分布2.各个总体的各个总体的方差必须相同方差必须相同对于各组观察数据,是从具有相同方差的总体中抽对于各组观察数据,是从具有相同方差的总体中抽取的。取的。比如,四种颜色饮料的销售量的方差都相同。比如,四种颜色饮料的销售量的方差都相同。 3.不同水平下的不同水平下的样本相互独立样本相互独立一、数学模型一、数学模型 jAAAAsAjs(,21在水平在水平个水平个水平有有设因素设因素得到如下表得到如下表次独立试验次独立试验进行进行下下,)2(,), 2 , 1 jjnns.的结果的结果表表1观察结果观察结果水平水平样本总和样本

13、总和样本均值样本均值总体均值总体均值1A2AsA11X21X11nX12X22X22nXsX1sX2snsX1 T2 TsT 1 X2 XsX 1 2 s 1.2 单因素方差分析单因素方差分析假设假设;),(), 2, 1(,), 2 , 1(. 1 22221均未知均未知与与的正态总体的正态总体均值分别为均值分别为来自具有相同方差来自具有相同方差下的样本下的样本各个水平各个水平 jjjjnjjjNsjXXXsjAj . 2下的样本之间相互独立下的样本之间相互独立不同水平不同水平jA),(2 jijNX 因为因为)., 0(2 NXjij所以所以 可写成可写成那么那么表示随机误差表示随机误差记

14、记ijijjijXX, 均未知均未知与与独立独立各各., 2, 1, 2, 1 , ), 0( ,22 jjijijijjijsjniNX单因素试验方差分析的数学模型单因素试验方差分析的数学模型需要解决的问题需要解决的问题.,:,:211210不全相等不全相等ssHH 1.检验假设检验假设.,. 2221 s估估计计未未知知参参数数数学模型的等价形式数学模型的等价形式.1,11 sjjjsjjnnnn 记记总平均总平均., 2 , 1,sjjj . 02211 ssnnn .,平均的差异平均的差异平均值与总平均值与总下的总体下的总体表示水平表示水平应应的效的效水平水平jjAA 独立独立各各 .

15、 0, 2, 1, 2, 1 , ), 0( ,12sjjjjijijijjijnsjniNX 均未知均未知与与独立独立各各., 2, 1, 2, 1 , ), 0( ,22 jjijijijjijsjniNX原数学模型原数学模型改写为改写为.,:,:211210不不全全相相等等ssHH 检验假设检验假设等价于等价于检验假设检验假设.,:, 0:211210不不全全为为零零ssHH sjniijjXnX111数据的总平均数据的总平均 sjniijTjXXS112)(总离差平方和总离差平方和(总变差总变差) jniijjjXnX11下下的的样样本本平平均均值值水水平平jA二、平方和的分解二、平方

16、和的分解 sjniijTjXXS112)( sjnijjijjXXXX112)()( sjnijsjnijijjjXXXX112112)()( sjnijjijjXXXX11)(20 sjnijsjnijijTjjXXXXS112112)()(AESS sjnijijEjXXS112)(误差(残差)平方和误差(残差)平方和 sjjjsjnijAXXnXXSj12112)()(212XnXnsjjj 组间离差平方和组间离差平方和(效应平方和效应平方和)组内平方和组内平方和 ST是全部观察值与总平均值的离差平方和,反映是全部观察值与总平均值的离差平方和,反映全部观察值的离散状况,从而反映了全部数据

17、总全部观察值的离散状况,从而反映了全部数据总的误差程度。的误差程度。 SA既包括随机误差,也包括系统误差,反映的是既包括随机误差,也包括系统误差,反映的是随机误差和系统误差的大小。随机误差和系统误差的大小。 sjniijTjXXS112)( sjjjsjnijAXXnXXSj12112)()(总误差平方和总误差平方和=组间误差平方和组间误差平方和+组内误差平方和组内误差平方和 如果组间方差明显高于组内方差,说明样本数据如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要波动的主要来源是组间方差,因子是引起波动的主要原因,可认为因子对实验的结果存在显著的影响;

18、原因,可认为因子对实验的结果存在显著的影响; 反之,如果波动的主要部分来自组内方差,则因反之,如果波动的主要部分来自组内方差,则因子的影响就不明显,没有充足理由认为因子对实验或子的影响就不明显,没有充足理由认为因子对实验或抽样的结果有显著作用。抽样的结果有显著作用。 判断因子的不同水平是否对其观察值有影响,实判断因子的不同水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小。际上就是比较组间方差与组内方差之间差异的大小。 检验这种差异,需要构造一个用于检验的统计量检验这种差异,需要构造一个用于检验的统计量。TAESSS),(),1(/,22220snSsSHEA 为真时为真

19、时因为因为,0为真时为真时所以所以 H)., 1()()1(22snsFsnSsSEA )()1(snSsSEA 检验假设检验假设.,:, 0:211210不全为零不全为零ssHH )., 1()()1(snsFsnSsSFEA 拒绝域为拒绝域为组间均组间均方差方差组内均组内均方差方差ASES三、假设检验三、假设检验单因素试验方差分析表单因素试验方差分析表方差来源方差来源因素因素A误差误差总和总和平方和平方和自由度自由度 均方均方F比比ASESTS1 ssn 1 n1 sSSAAsnSSEE EASSF , 1,111 sjniijniijjjjXTsjXT记记,2112nTXSsjniijT

20、j .ATESSS ,212nTnTSsjjjA 四、单因素方差分析的四、单因素方差分析的Matlab实现实现p=anova1(X,group)输入:输入:X是一个向量,从第一个总体的样本到第是一个向量,从第一个总体的样本到第r个总个总体的样本依次排列,体的样本依次排列,group是与是与X有相同长度的向量,有相同长度的向量,表示表示X中的元素是如何分组的中的元素是如何分组的. group中某元素等于中某元素等于i,表示表示X中这个位置的数据来自第中这个位置的数据来自第i个总体个总体.因此因此group中中分量必须取正整数,从分量必须取正整数,从1直到直到r.p=anova1(X) %比较比较

21、X中各列数据的均值是否相等中各列数据的均值是否相等此时输出的此时输出的p是零假设成立时,数据的概率,当是零假设成立时,数据的概率,当p0.05称差异是显著的,当称差异是显著的,当p0.01称差异是高度显著的称差异是高度显著的.输入输入X各列的元素相同,即各总体的样本大小相等,各列的元素相同,即各总体的样本大小相等,称为均衡数据的方差分析,不均衡时用下面的命令称为均衡数据的方差分析,不均衡时用下面的命令例例1 某水产研究所为了比较四种不同配合饲料对某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼鱼的饲喂效果,选取了条件基本相同的鱼20尾,尾,随机分成四组,投喂不同饲料,

22、经一个月试验以随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。后,各组鱼的增重结果列于下表。表表1 饲喂不同饲料的鱼的增(单位:饲喂不同饲料的鱼的增(单位:10g)饲料饲料鱼的增重(鱼的增重(xij)A131.927.931.828.435.9A224.825.726.827.926.2A322.123.627.324.925.8A427.030.829.024.528.5四种不同饲料对鱼的增重效果是否显著四种不同饲料对鱼的增重效果是否显著 ?解:这是单因素均衡数据的方差分析,解:这是单因素均衡数据的方差分析,Matlab程序程序如下:如下:A=31.9 27.9 31.8 28.4 35.9 24.8 25.7 26.8 27.9 26.2 22

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论