![第七章方差分析_第1页](http://file4.renrendoc.com/view/fd3838bcbda0855619c7f8997c573970/fd3838bcbda0855619c7f8997c5739701.gif)
![第七章方差分析_第2页](http://file4.renrendoc.com/view/fd3838bcbda0855619c7f8997c573970/fd3838bcbda0855619c7f8997c5739702.gif)
![第七章方差分析_第3页](http://file4.renrendoc.com/view/fd3838bcbda0855619c7f8997c573970/fd3838bcbda0855619c7f8997c5739703.gif)
![第七章方差分析_第4页](http://file4.renrendoc.com/view/fd3838bcbda0855619c7f8997c573970/fd3838bcbda0855619c7f8997c5739704.gif)
![第七章方差分析_第5页](http://file4.renrendoc.com/view/fd3838bcbda0855619c7f8997c573970/fd3838bcbda0855619c7f8997c5739705.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章方差分析方差分析的基本原理单因素实验数据的方差分析两因素实验数据的方差分析2023/2/41现有5种治疗荨麻疹的新药,为了比较其疗效,将30个病人随机分成5组,每组6人。让同一组使用同一种新药,各病人治愈天数如7-1表所示:
表7.1
5种治疗荨麻疹新药治愈病人天数问:5种药物的疗效是否存在显著差异?若存在显著差异,差异体现在那些药物之间?2023/2/42案例
五种新药的疗效一样吗药物治愈天数A16877108A2466356A3644523A4746635A5945776一、方差分析的主要概念二、案例的直观分析三、统计模型与基本假定四、离差平方和与自由度的分解2023/2/4版权所有BY统计学课程组3第一节方差分析的基本原理
方差分析:
是一种检验多个总体均值是否相等的统计方法。方差分析主要用来研究一个定量因变量与一个或多个定性自变量的关系。试验因素:
试验的设计者希望考察的试验条件,或者说就是方差分析研究的对象,简称因素,也可称为自变量,如案例中的药物。因素水平:
试验因素的某种特定状态或数量等级称为因素水平,简称水平,实际上就是因素的不同表现。如案例中的5种药物。若方差分析只针对一个因素进行,则称为单因素方差分析。若方差分析同时针对两个因素进行,则称为双因素方差分析。2023/2/44一、方差分析的主要概念试验指标:
衡量试验结果好坏程度的指标,也可称为因变量,其不同
的取值常称为观察值或试验数据。在本章案例中,治愈天
数就是试验指标。处理:
按照因素的给定水平对实验对象所做的操作。这种操作就
是对因素划类或确定数量等级,形成因素的不同水平。因
素的一个水平就是一个处理。每个处理可看作一个试验条
件或一个总体。试验单元
接受处理的实验对象称为试验单元,简称单元。如案例中
接受治疗的患者,一个患者就是一个试验单元。
2023/2/45一、方差分析的主要概念2023/2/4版权所有BY统计学课程组6一、方差分析的主要概念2023/2/4版权所有BY统计学课程组7一、方差分析的主要概念2023/2/4版权所有BY统计学课程组8二、案例的直观分析·····治愈天数A1A2A3A4A51.从散点图上可以看出
不同药物的治愈天数是有明显差异的同一个药物不同患者的治愈天数也明显不同2.药物与治愈天数之间有一定的关系如果药物与治愈天数之间没有关系,那么患者被治
愈的天数应该差不多相同,在散点图上所呈现的模
式也就应该很接近,不同药物的平均治愈天数就几
乎应该在一条水平线上。2023/2/4版权所有BY统计学课程组9二、案例的直观分析3.仅从散点图上观察还不能提供充分的证据证明不同药物的治愈天数之间有显著差异。4.需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析。所以叫方差分析,因为虽然我们感兴趣的是均值,但在判断均值之间是否有差异时则需要借助于方差。5.不同药物的治愈天数之间的差异可能是由于抽样的随机性所造成的,也有可能是系统性影响因素造成的。6.通过对数据误差来源的分析,判断不同总体的均值是否相等。2023/2/410二、案例的直观分析数据误差的来源分为随机误差和系统误差。1.随机误差因素的同一水平(总体)下,样本各观察值之间的差异。比
如,同一药物下不同患者的治愈天数是不同的。这种差异
可以看成是随机因素影响的结果,称为随机误差。2.系统误差
因素的不同水平(不同总体)下,各观察值之间存在差异。比如,不同药物的治愈时间之间的差异。这种差异可能是由于抽样的随机性所造成的,也可能是由于药物本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差。2023/2/411三、数据误差的来源2023/2/4版权所有BY统计学课程组12四、统计模型与方差分析的基本假定处理观测值合计平均A1……A2……………………………Ai……………………………Ak…合计——————方差分析的数据结构(以单因素方差分析为例):因素A的第i个处理的第j次观测值:第i个处理的n个观测值之和:全部观测值的总和:第i个处理平均数:全部观测值的总平均数2023/2/4版权所有BY统计学课程组131.符号定义方差分析中的统计模型,用来描述因素A的第i个处理的第j次观测值的形成机理。结合本章案例,假设在第i个处理下的第j次观测是患者张三,则张三的治愈天数应该为:
张三治愈天数=张三所在处理组的平均天数+
随机因素对张三治愈天数的影响(可正可负)
=总平均天数+张三所在组平均天数与总平均天数之差+随机因素对治愈天数的影响2023/2/4版权所有BY统计学课程组142.统计模型这个差值说明了什么?设张三所在组的平均治愈天数为,总平均治愈天数为,随机因素的影响为,张三所在组的平均治愈天数与总平均治愈天数之差为,则张三的治愈天数可表达为:2023/2/4152.统计模型(1)每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。(2)各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的(3)观察值是独立的各观测值彼此之间相互不影响在上述假定条件下,判断药物对治愈天数是否有显著影响,实际上也就是检验具有同方差的五个正态总体的均值是否相等。2023/2/4版权所有BY统计学课程组163.方差分析的基本假定结合本章案例,方差分析要回答的问题就是5种不同的药物对治愈天数是否有显著影响,实际上就是检验五种药物的平均治愈天数是否相等。所建立的假设为:
2023/2/4版权所有BY统计学课程组174.方差分析中假设的建立方差分析检验多个总体的均值是否相等,或是否存在显著差异,是从对数据差异来源的分析入手的。从本章案例中可以看出,试验数据的差异存在于如下三个方面:全部观测值存在差异各水平(处理)内部观测值存在差异各水平(处理)之间观测值存在差异上述各种差异产生的原因只有两个方面,即系统性因素与随机性因素。数据差异源分析,就是通过构造反映数据差异的统计量即离差平方和,并对其进行分解,确定数据差异的原因。2023/2/418五、数据差异源分析——离差平方和及其分解总离差平方和反映全部观测值总变异的程度。总变异可能是随机因素与系统因素(试验因素)共同影响形成的。2023/2/4191.总离差平方和SST处理内(组内)离差平方和反映各处理内观测值的变异程度。组内离差平方和是某一特定处理下试验数据的差异程度,与试验因素(系统因素)的变化无关,所以该离差平方和反映了随机因素所导致的数据差异,也称误差平方和。2023/2/4202.处理内(组内)离差平方和SSE处理间(组间)离差平方和反映重复n次的处理间观测值的变异程度。组间离差平方和既与试验因素(系统因素)的变化有关,也与随机因素有关,所以该离差平方和反映了试验因素(系统因素)与随机因素共同所导致的数据差异。2023/2/4213.处理间(组间)离差平方和SSA2023/2/4224.三项离差平方和之间的关系SST=SSA+SSE
总离差平方和因素A及随机因素导致的变差随机因素导致的变差组间离差平方和组内离差平方和前述的各离差平方和的绝对值的大小受到处理的重复数的影响,为了消除重复数对离差平方和的影响,并实现各离差平方和之间的可比,需要将离差平方和改造为误差均方(也可称方差)。误差均方是将各离差平方和与其对应的自由度相除所得的结果。各离差平方和的自由度如下:2023/2/4235.误差均方离差平方和自由度SSTSSESSA(1)组内均方(组内方差)(2)组间均方(组间方差)如果原假设成立,则表明没有系统误差,组间均方与组内均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差,判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小。2023/2/4245.误差均方2023/2/4255.误差均方组间离差平方和组内离差平方和组间方差组内方差受因素A和随机
因素的影响只受随机
因素的影响通过比较组间均方与组内均方之间的大小,来检验多个总体均值是否相等,是方差分析的基本思想。如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅受随机因素,还有系统因素的影响,试验因素对试验指标有显著的影响;反之,若两者很接近,说明各水平(总体)之间的差异仅有随机因素的影响,试验因素对试验指标无显著的影响。根据这一思想,可以构造检验的统计量。2023/2/426六、检验统计量如果因素A的不同水平对试验结果没有影响,那么在组间方差中只包含有随机误差,两个方差的比值会接近1。如果不同水平对试验结果有影响,组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1。当这个比值大到某种程度时,就可以说不同水平之间存在显著差异,或者说因素A对试验结果有显著影响。2023/2/427六、检验统计量如果,则拒绝原假设,认为各水平均值之间存在显著差异,反之,不能拒绝原假设,认为各水平均值之间没有显著差异。2023/2/428六、检验统计量a
F(k-1,nk-k)
0拒绝H0不能拒绝H0F变差来源离差平方和SS自由度df均方MSF值组间SSAk-1MSAMSA/MSE组内SSEnk-kMSE总和SSTnk-1——2023/2/429七、方差分析表方差分析表(单因素)一般形式1.为什么要进行多重比较在方差分析中,不拒绝原假设,表示拒绝总体均数相等的证据不足,分析终止;当原假设被拒绝时,我们可以确定至少有两个总体的均值有显著差异。但要进一步检验哪些均值之间有显著差异还需要采用多重比较的方法进行分析。2.什么是多重比较多重比较是同时对各个总体均值进行的两两比较。方法很多,如Fisher最小显著差异(LeastSignificantDifference,LSD)方法、Tukey的诚实显著差异(HSD)方法或Bonferroni的方法等。这里我们只介绍最小显著差异方法。2023/2/430八、多重比较2023/2/431八、多重比较(最小显著差异检验法的步骤)(1)提出假设
(2)计算检验的统计量(3)决策如果或则拒绝H0。2023/2/432八、多重比较(最小显著差异检验法的步骤)实际应用中,也可以按下列规则决策:首先计算检验统计量:其次计算检验临界值:最后进行统计决策:若,则拒绝原假设;反之不拒绝。1.提出假设2.计算各离差平方和及其自由度3.计算均方和F统计量4.列方差分析表,进行F检验5.对原假设进行决策。若拒绝原假设,则进行多重比较2023/2/433九、方差分析的步骤根据安排的试验因素的多少,方差分析分为单因素方差分析、两因素方差分析和多因素方差分析。单因素方差分析根据各处理内重复数是否相等,分为重复数相等与重复数不等的方差分析两种情况。上节讨论的是重复数相等的情况,而重复数不等的方差分析的基本原理与重复数相等时的过程是一致的,只是各离差平方和、自由度的计算,以及多重比较中标准误差的计算略有不同。2023/2/434第二节单因素方差分析2023/2/435一、各处理重复数相等的方差分析(例)根据本章案例介绍过程。1.建立假设:2.计算各均值、各离差平方和、各均方、F统计量,列方差分析表。这类计算比较麻烦,可借助相关软件完成。2023/2/436一、各处理重复数相等的方差分析(例)差异源SSdfMSFP-valueFcrit组间47.47411.875.55
0.002452.76组内53.5252.14总计100.9829--
----
--
方差分析表2023/2/437一、各处理重复数相等的方差分析(例)3.统计决策:从临界值来看,由于,所以拒绝原假设;从P值来看,由于,所以拒绝原假设;4.进行多重比较在显著性水平时,由于所以,水平1和水平2的均值之间存在显著差异。余此类推【例】为了对几个行业的服务质量进行评价,某市消费者协会对该地的旅游业、居民服务业、公路客运业和保险业分别抽取了不同数量的企业。每个行业中的这些企业在服务内容、服务对象、企业规模等方面基本相同。经统计,最近一年消费者对这23家企业投诉的次数资料如表7-7所示,消费者协会想知道:这几个行业之间的服务质量是否有显著差异?如果有,究竟是在哪些行业之间?如果能找出哪些行业的服务质量最差,就可以建议对消费者权益保护法中该行业的某些条款作出修正。2023/2/438二、各处理重复数不相等的方差分析2023/2/439例题数据
某地消费者对四个行业的投诉次数观测序列旅游业A1居民服务业A2公路客运业A3保险业A4157625170255495968346604863445545569554564760653557473.多重比较中检验统计量:4.其余操作与单因素方差分析过程一致。2023/2/4版权所有BY统计学课程组40分析过程2023/2/441计算与决策解:(1)建立假设H0:μ1=μ2=…=μm;H1:μ1,
μ2,…,
μm不
全相等
(2)计算有关均值及平方和
ST=1175.913,SE=422,SA=753.913
方差来源离差平方和S自由度均方离差F值组间SA=753.9133251.3043F=11.315组内SE=4221922.21053总差异ST=1175.91322方差分析表(3)统计决策对于显著性水平=0.05,F0.05(3.19)=3.1274由于检验统计量F=11.315>F0.05(3.19)
,所以拒绝原假设H0
,即有95%的把握认为不同的行业之间投诉的差异显著。2023/2/4版权所有BY统计学课程组42计算与决策(1)点击“工具”栏中的数据分析项;(2)在分析工具框中连击“单因素方差分析”;(3)在对话框的“数据区域”框中键入A3:C6; 在α框中保持0.05不变(也可根据需要变为0.01); 在“输出选项”中键入D3; 选择“确定”,输出结果如表7-9所示:2023/2/4版权所有BY统计学课程组43Excel中方差分析的计算步骤2023/2/444对四个行业的均值进行多重比较(=0.05)由题意及计算可知,k1=7,k2=6,k3=k4=5;第一步:提出假设假设1:H0:μ1=μ2;假设2:H0:μ1=μ3;假设3:H0:μ1=μ4假设4:H0:μ2=μ3;假设5:H0:μ2=μ4;假设6:H0:μ3=μ42023/2/4版权所有BY统计学课程组45第二步:计算检验统计量的值第三步:计算LSD。2023/2/4版权所有BY统计学课程组45对四个行业的均值进行多重比较(=0.05)2023/2/4版权所有BY统计学课程组46第四步:进行决策2023/2/4版权所有BY统计学课程组46由以上计算可知,检验统计量,,的值分别小于LSD1、LSD2、LSD4的值,显示旅游业与居民服务业的投诉次数之间、旅游业与公路客运业投诉次数之间、居民服务业与公路客运业投诉次数之间没有显著差异;,,的值分别大于LSD3、LSD5、LSD6的值,显示旅游业与保险业的投诉次数之间、公路客运业与保险业投诉次数之间有显著差异。对四个行业的均值进行多重比较(=0.05)一、无交互作用的双因素方差分析若记一因素为因素A,另一因素为因素B,对A与B同时进行分析,就属于双因素方差分析,即判断是否有某一个或两个因素对试验指标有显著影响,两个因素结合后是否有新效应。在统计学中将各个因素的不同水平的搭配所产生的新的影响称为交互作用。我们先讨论无交互作用的双因素方差分析问题,对于有交互作用的双因素方差分析问题稍后再讨论。2023/2/4版权所有BY统计学课程组47第三节双因素方差分析假定因素A有r个水平:A1,A2,…,Ar
;因素B有s个水平:B1,B2,…,Bs
。在A的r个水平与B的s个水平的每种组合下作一次试验,可得无交互作用的双因素方差分析的数据结构下表所示:2023/2/4版权所有BY统计学课程组48数据结构因素B因素AB1B2…BS平均值A1x11x12…x1sA2x21x22…x2s………………Arxr1xr2…xrs平均值…
判断因素A的影响是否显著等价于检验假设:
H01:μ1.=μ2.
=…=μi.
判断因素B的影响是否显著等价于检验假设:H02:μ.1=μ.2
=…=μ.j
其中,μr
表示A的第i个水平所构成的总体均值,
μs表示的B第j个水平所构成的总体均值。2023/2/4版权所有BY统计学课程组49假设建立分解总离差平方和与单因素情况类似,能够证明下列公式成立:
2023/2/4版权所有BY统计学课程组50自由度
由数理统计可以证明:当时与单因素情况类似,可以证明ST、SA
、SB和SE的自由度分
别为2023/2/4版权所有BY统计学课程组51平方和分解定理平方和分解定理:设Q服从自由度为n的分布,又Q1+Q2+…+Qk=Q,其中,Q(i=1,2,3,…,k)是秩为fi的非负二次型,则Q相互独立,并且服从自由度为fi的分布的充要条件是f1+f2+…+fk=n(这里不做证明,证明参见有关数理教材)。显然,ST、SA
、SB和SE满足平方和分解定理条件。2023/2/4版权所有BY统计学课程组52检验统计量由于SA反映因素A的各水平之间的差异,SB反映因素B的各水平之间的差异,SE反映在交互作用不显著时试验本身随机误差的大小。因此,可用以下统计量作为检验统计量:2023/2/4版权所有BY统计学课程组53双因素(无交互作用)方差分析表方差来源方差S自由度f均方MSF值A的影响fA=r-1MSA=SA/fAFA=MSA/MSEB的影响fB=s-1MSB=SB/fBFB=MSB/MSE误差fE=(r-1)(s-1)MSE=SE/fE总和fT=rs-12023/2/4版权所有BY统计学课程组54【例】为提高某种产品的合格率,考察原料用量和来源地对其是否有影响。原料来源地有三个:甲、乙、丙;原料用量有三种:现有量、增加5%、增加8%。每个水平组合各作一次试验,得到的数据如表下所示。试分析原料用量和来源地对产品合格率的影响是否显著?2023/2/4版权所有BY统计学课程组55例题例题数据原料用量原料来源地现有量B1增加5%B1增加8%B1甲地A1597066乙地A2637470丙地A36166712023/2/4版权所有BY统计学课程组56例题分析解:(1)建立假设H01:μ1.=μ2.=μ3.H02:μ.1=μ.2=μ.3
(2)计算相应的均值和平方和:2023/2/4版权所有BY统计学课程组57(3)列方差分析表
方差分析表方差来源方差S自由度f均方MSF值因素ASA=26fA=2MSA=26/2=13FA=13/7=1.86因素BSB=146fB=2MSB=146/2=73FB=73/7=10.43误差SE=28fE=4MSE=28/4=7总和ST=200fE=82023/2/4版权所有BY统计学课程组58例题分析(4)统计决策
对于显著性水平=0.05,查表得临界值F0.05(2,4)=6.94,
因为FA=1.86<F0.05(2,4),故不能拒绝H01;FB=1.86<F0.05(2,4),故拒绝H02.
即根据现有数据,有95%的把握可以推断原料来源地对产品合格率的影响不大,而原料用量对合格率有显著影响。由于,说明B2
为最优水平。既然原料来源地对产品合格率的影响不显著,在保证质量的前提下,可以选择运费最省的地方作为原料来源地选择时的首选。如果丙地的运费最省,则最优方案为B2A3。
2023/2/4版权所有BY统计学课程组59例题分析以例7.2为例,设数据输入到Excel工作表的区域为A2:C4,再按以下步骤进行:(1)点击“工具”栏中的数据分析项。(2)分析工具框中连击“方差分析:无重复的双因素方差分
析”。(3)在对话框的“数据区域”框中键入B3:D5;在框中保持0.05不变(也可根据需要变为0.01);在“输出选项”中
键入E2;选择“确定”,输出结果如表7-14所示:2023/2/4版权所有BY统计学课程组60Excel应用无重复双因素分析方差分析结果
方差分析:无重复双因素分析SUMMARY观测数求和平均方差行131956531行232076931行331986625列13183614列232107016列33207697方差分析差异源SSdfMSFP-valueFcrit行262131.85710.26896.9443列14627310.42860.02596.9443误差2847总计2008
2023/2/4版权所有BY统计学课程组61交互作用,简单来说就是不同因素对试验指标的复合作用,因素A和B的综合效应不是二因素效应的简单相加。为了能分辨出两个因素的交互作用,一般每组试验至少作两次。数据结构:设因素A有r个水平:A1,A2,…,Ar;因素B有s个水平:B1,B2,…,Bs;则共有rs个水平组合,每个水平组合(试验条件)重复t次试验,每次试验结果用xijk(i=1,2,…,r;j=1,2,…,s;k=1,2,…,t)表示,其数据结构如表7-15所示:2023/2/4版权所有BY统计学课程组62二、有交互作用的双因素方差分析表7-15有交互作用的双因素方差分析数据结构B1B2…BsA1x111,x112,…,x11tx121,x122,…,x12t…x1s1,x1s2,…,x1stA2x211,x212,…,x21tx221,x222,…,x22t…x2s1,x2s2,…,x2st……………Arxr11,xr12,…,xr1txr21,xr22,…,xr2t…xrs1,xrs2,…,xrst2023/2/4版权所有BY统计学课程组632.建立假设设xijk~N(μijk,σ2),各xijk相互独立,μijk和σ2均为未知参数,于是有xijk=μijk+εijkεijk~N(0,σ2
),各εijk相互独立,并记:2023/2/4版权所有BY统计学课程组64我们称i为水平Ai的效应,j为水平Bj的效应,rij为水平Ai和Bj的交互效应,μ为平均数。显然有:独立。2023/2/4版权所有BY统计学课程组65以上为双因素方差分析的数学模型。对这一模型可设如下三个假设:
H01:σ1=σ2=…=σr=0 H02:1=2=…=s=0 H03:γ11=γ12=…=γrs=02023/2/4版权所有BY统计学课程组663.方差分析
与单因素方差分析的平方和分解类似,有2023/2/4版权所有BY统计学课程组672023/2/4版权所有BY统计学课程组68数理统计可以证明:因此可用如下的检验统计量对H01,H02,H03进行检验:2023/2/4版权所有BY统计学课程组69表7.16双因素(有交互作用)方差分析表方差来源方差S自由度f均方MSF值因素ASAfA=r-1MSA=SA/fAFA=MSA/MSE因素BSBfB=s-1MSB=SB/fBFB=MSB/MSE因素A*BSA*BfA*B=(r-1)(s-1)MSA*B=SA/fA*BFA*B=MSA*B/MSE误差SEfE=rs(t-1)MSE=SE/fE总和STfE=rst-12023/2/4版权所有BY统计学课程组70
例7.3某公司想将橡胶、塑料和软木的板材冲压成密封垫片出售。市场上有两种不同型号的冲压机可供选择。为了能对冲压机每小时所生产的垫片数进行比较,并确定哪种机器使用何种材料生产垫片的能力更强,该公司使用每台机器对每一种材料分别运行三段时间,得到的试验数据(每小时生产的垫片数)如表7-16所示,试运用方差分析确定最优方案。2023/2/4版权所有BY统计学课程组71表7.17垫片材料和冲压机的数据资料单位:千个
垫片材料冲压机橡胶B1塑料B2软木B3A13.364.014.313.423.944.273.483.894.4A23.913.483.943.83.533.813.853.423.992023/2/4版权所有BY统计学课程组72解:建立假设:
H01:σ1=σ2=…=σr=0 H02:1=2=…=s=0 H03:γ11=γ12=…=γrs=0
(2)计算相应的均值和平方和:2023/2/4版权所有BY统计学课程组73
表7.18结构均值表2023/2/4版权所有BY统计学课程组74j=1j=2j=3i=13.8978i=2
=3.47673.63673.71174.12
=3.42
=3.9467
=4.3267
=3.8533
=3.9133(3)列方差分析表(7-19)表7.19方差分析表方差来源方差S自由度f均方MSF值因素ASA=0.10125fA=1MSA=0.10125FA=MSA/MSE=23.01因素BSB=0.8118fB=2MSB=0.4059FB=MSB/MSE=92.25因素A*BSA*B=0.768fA*B=2MSA*B=0.389FA*B=MSA*B/MSE=88.41误差SE=0.05273fE=12MSE=0.0044总和ST=1.734fE=172023/2/4版权所有BY统计学课程组75(4)统计决策 由于FA=23.01>F0.05(2,12)=3.89,FB=92.25>F0.05(2,12)=3.89,FA*B=88.41>F0.05(2,12)=3.89
说明不仅冲压机的型号和垫片材料对垫片数量有显著影响,而且其交互作用也是显著的。 由结构均值表可知,在冲压机中,第一种的均值较大;垫片材料中,木的均值较大,故最优方案是A1B3。2023/2/4版权所有BY统计学课程组76
以例7.3为例,将数据输入到Excel工作表的区域为B2:D7,冲压机的二个水平A1、A2在第一列,垫片材料的水平B1、B2、B3在第一行。再按以下步骤进行:(1)点击“工具”栏中的数据分析项。(2)分析工具框中连击“方差分析:可重复双因素方差分析”。(3)在对话框的“数据区域”框中键入A1:D7;在“每一样本的行数”框中键入3。 在框中保持=0.05不变(也可根据需要变为0.01); 在“输出选项”中键入空白地方,如F2; 选择“确定”,输出结果如表7-20所示:2023/2/4版权所有BY统计学课程组77有交互作用的双因素方差分析中的Excel应用7-20有重复双因素方差分析结果SUMMARY橡胶B1塑料B2软木B3总计A1
观测数3339求和10.2611.8412.9835.08平均3.423.9466674.3266673.897778方差0.00360.0036330.0044330.158394A2
观测数3339求和11.5610.4311.7433.73平均3.8533333.4766673.9133333.747778方差0.0030330.0030330.0086330.045694总计
观测数666求和21.8222.2724.72平均3.6366673.7116674.12方差0.0589870.0689370.05648方差分析差异源SSdfMSFP-valueFcrit样本0.1012510.1012523.040460.0004344.747225列0.81194420.40597292.383065.15E-083.885294交互0.76803320.38401787.386857.03E-083.885294内部0.052733120.004394总计1.73396117
由表7-20于检验行因素冲压机A(Excel表中为“样本”)、用于检验列因素垫片材料B、用于检验冲压机A和垫片材料B交互作用A*B的p值均小于0.05,故不仅因素A和B对试验指标有显著影响,而且其交互作用也是显著的。由于A1的试验指标均值大于A2的试验指标均值,B3的试验指标均值大于B1和B2的试验指标均值,故最优方案应为A1B3,买第一种型号的冲压机、采用软木材料,这种组合的单位时间内生产的垫片最多。2023/2/4版权所有BY统计学课程组79一、试验设计的概念和设计原则试验设计有三个基本原则:重复性、随机化和区组化。(1)重复性原则:重复性是指对一项试验要在相同的条件下重复进行若干次。只有进行多次的试验,才能掌握其规律性。(2)随机化原则:随机化是指试验材料和试验地点都要随机地确定。这样进行试验得出的结论才具有客观性和普遍性,且每次进行的试验都可认为是相互独立的。(3)区组化原则:一组试验,试验者总希望在相同或近似相同的条件下进行,以便在相互比较中得出正确的结论。2023/2/4版权所有BY统计学课程组80第四节正交试验设计初步第一、尽量减少试验误差。在试验时,要尽可能使对试验产生影响的其他因素达到理论中要求的精确程度,这样我们在对目的指标进行测算时才能达到较为客观的结果。在一项试验中误差是必然存在的,我们的目的就是要尽量减少该误差。第二、尽量减少试验次数。试验的次数越多,进行试验所耗费的人力、物力也就会相应地增多,最佳的试验就是用尽可能少的费用来获得最有效的试验结果。第三、所设计的试验要便于对指标值进行统计分析。影响一个事件的指标是多样的,在进行设计时要选择比较容易测算且对事件影响较大的指标进行计算。2023/2/4版权所有BY统计学课程组81在安排试验时需要注意三点:
在现实问题中,影响试验指标的因素通常有很多个,要考察它们就涉及多因子的试验设计问题。多因子试验中一个很困难的问题就是因子数较多,而又需要进行多次的试验。例如,有10个因子对某一指标有显著影响,而每个因子取两个水平进行比较,那么就有210=1024个不同的水平组合,即每个水平组合作一次试验,就需要进行1024次试验,耗费的人力、财力可想而知,这在实际中是不可行的。因此,需要按照一定的方法从中选择一部分进行试验。常用的试验设计方法有正交试验设计法、参数设计法、回归设计法、均匀设计法、混料设计法等。限于篇幅,这里仅介绍正交试验设计的基础知识,其他方法请读者自行阅读试验设计的有关书籍。2023/2/4版权所有BY统计学课程组82
在多因子试验中,各因子又有不同的水平数,我们的目的是要从这些因子不同的水平组合中,找出一组或几组组合使所要求的指标达到最优。下面以一个二因子的例子来具体认识一下多因子试验问题。例7.4为提高合金钢的强度,同时考虑碳(C)含量(因子)及钛(Ti)与铝(AL)的含量(因子)对强度Y的影响,希望找出最佳的含量组合,使强度Y达到最大(表7-21)。2023/2/4版权所有BY统计学课程组83二、多因子试验问题2023/2/4版权所有BY统计学课程组84表7-21合金钢的试验数据2023/2/4版权所有BY统计学课程组85
一个因子的水平好坏或好坏的程度受另一个因子水平制约的情况,称为因子A和B的交互作用,记作或AB。因子A和B的交互作用可以用图形较为直观地表示。
2023/2/4版权所有BY统计学课程组86三、交互作用2023/2/4版权所有BY统计学课程组87
因子间的交互作用会随着因子个数的增加而增加。如四个因子A,B,C,D间的交互作用有以下几类:(1)二级交互作用有6个:AB,
AC,
AD,
BC,
BD,
CD;(2)三级交互作用有4个:ABC,
ABD,
ACD,
BCD;(3)四级交互作用有1个:ABCD。交互作用共有11个,比因子个数还多。实践经验表明,多数交互作用是不存在或者很小以至可以忽略不计的,一般我们主要考虑部分二级交互作用,但具体考察哪些二级交互作用还要根据下面的方法来决定。2023/2/4版权所有BY统计学课程组88
正交试验设计法是利用正交表科学地挑选试验条件,合理安排试验的方法,是研究与处理多因素试验的一种科学方法。正交设计有两个重要的特点:(1)任意一对因子(也称因素)的任一水平组合必在试验中出现,且出现的次数相同;(2)总试验次数比全面试验(所有因子的任一水平组合都进行搭配)要少许多次。例如,对7个二水平因子进行全面试验要进行27=128次,而用正交表安排试验只需要作8次。用正交表合理地安排试验,可以做到省时、省力、省钱,还能得到令人满意的检验效果,因此这种方法在改进产品质量、研究采用新工艺、试制新产品、了解设备工艺性能以及改进技术管理等方面都有广泛的应用。2023/2/4版权所有BY统计学课程组89四、正交表及其类型
正交表是正交设计的工具,是运用组合数学理论在正交拉丁方的基础上构造的一种规格化表格,符号为:其中,L为正交表符号;
n为正交表的行数(试验次数,试验方案数);
j为正交表中每一列因子的水平个数;
i为正交表的列数(试验因子的个数)。
2023/2/4版权所有BY统计学课程组901.正交表及其特性
例如,表示一张8行7列,每列有两个水平的正交表(表7-22),它表示在这个试验中,要作8次不同条件的试验,共有7个影响因素,每个因素都有两个水平,我们称这张表为两水平的正交表。2023/2/4版权所有BY统计学课程组912023/2/4版权所有BY统计学课程组92
正交表具有正交性,这是指它有如下两个特征:(1)每列中不同的数字重复的次数相同。在表7.22中,每列有两个不同的数字:1,2,每一个各出现4次。(2)将任意两列的同行数字看成一个数对,那么任意可能数对重复的次数相等。在
中,任意两列有4种可能数对:(1,1),(1,2),(2,1),(2,2),每一对各出现2次。2023/2/4版权所有BY统计学课程组932023/2/4版权所有BY统计学课程组942.正交表的分类正交表安排试验的步骤如下:(1)明确试验目的,确定要考察的试验指标。(2)确定要考察的因子和因子的水平。(3)选用合格的正交表,进行表头设计。(4)根据试验号的安排进行试验,并记录试验指标的具体数据。(5)数据分析。对一个正交表形式的试验设计通常有三种分析方法:一是用极差分析各因子对指标影响程度的大小,这是一种较为简单的直观分析方法;二是用方差分析进行数据分析;三是贡献率分析法。2023/2/4版权所有BY统计学课程组95五、无交互作用情况下的设计例7.5某化工厂生产的一种产品的收率较低,为此希望通过试验提高收率。在试验中考察如下三个因子三个水平(表7-23):表7-23因子水平表
2023/2/4版权所有BY统计学课程组96解由于所考察的因子是三水平的,因此选用三水平正交表,又现在只考察三个因子,故选择安排试验。选定了正交表后把因子放在正交表的列上去,称为表头设计。在例7.5中将三个因子置于前三列,将它写成如下的表头设计形式:
2023/2/4版权所有BY统计学课程组97九次试验的结果——收率(%)分别是:516158726959878584(一)用极差分析各因子对指标影响程度的大小1.用直观分析表对该试验进行分析为方便起见,把试验结果写在正交表的右边一列上,并分别用表示,所有计算可以在表上进行。2023/2/4版权所有BY统计学课程组98
首先来看第一列,该列中的1,2,3分别表示因子的三个水平,按水平号将数据分为三组:“1”对应,“2”对应,“3”对应。在第二列,该列中的1,2,3分别表示因子B的三个水平,按水平号将数据分为三组:“1”对应,“2”对应,“3”对应。同理我们可以从图中得到第三列的情况。2023/2/4版权所有BY统计学课程组99
分别对每一列每个水平的数据进行相加,得到这个水平下该因子对应指标值的和,例如,2023/2/4版权所有BY统计学课程组100
同理我们可以得到对应C水平的T1,T2,T3的值,用每个水平得出的Ti的值去除以3就得到其均值。由以上计算可知,每个因子下间的差异反映了这个因子三个水平间的差异;分别对三个因子的各个水平进行数值大小比较:因子A的三个水平均值差异较大,其第三个水平的均值最大,故因子A的三水平最好。对第二、三列进行类似地分析,可知因子B的第二个水平好,因子C的第二个水平好。
2023/2/4版权所有BY统计学课程组101对第四列也可以进行上述分析,按其中的1,2,3分别将数据分为三组,但三组的水平组合相同,因此该列仅反映误差。综上可知,使指标达到最佳的水平组合是,即反应温度为90度、加碱量为48公斤、选取乙类催化剂可以使转化率达到最大。2023/2/4版权所有BY统计学课程组102
一个因子的极差是该因子各水平均值的最大值与最小值之差,如果该值大,则说明改变这一因子的水平会对指标造成较大的变化,所以该因子对指标的影响大,反之,则影响小。极差最大的列所对应的因子是最主要因子。当要求指标愈高愈好时,可选R行中最大者,所对应的水平为优水平;当要求指标愈低愈好时,可选R行中最小者其所对应的水平为优水平。2023/2/4版权所有BY统计学课程组1032.用极差分析各因子对指标影响程度的大小在例7.5中各个因子的极差分别是:它们被置于表7-24的最下方一行。从三个因子的极差可知因子A的影响最大,其次是C,而因子B的影响则最小,通常记为
2023/2/4版权所有BY统计学课程组1042023/2/4版权所有BY统计学课程组105表7-24例7.5的直观分析计算表
用方差分析方法来说明影响指标的因子的分析步骤如下:1.建
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第一单元《四则运算》【知识精研】【大单元教学】四年级数学下册同步备课(人教版)
- 第2节 光的反射(备课讲义)-2021-2022学年八年级物理上册同步备课讲义和课后训练(人教版)
- 《金银选冶概论》课件
- (高清版)DB37∕T 4201-2020 水泥中氯离子含量快速筛查检测法
- 化工原理课件非均相物系分离全
- 大学生创新创业教程(慕课版 双色版 第3版) 课件 第2章 创新思维与创新方法
- 《机械制图焊接图》课件
- 2025至2031年中国工艺石刻制品行业投资前景及策略咨询研究报告
- 2025至2031年中国T4DNA连接酶行业投资前景及策略咨询研究报告
- 《镇静镇痛评分》课件
- 《电子商务法律法规》电子商务专业全套教学课件
- 全套教学课件《工程伦理学》
- 江苏省建筑与装饰工程计价定额(2014)电子表格版
- JJG 976-2024透射式烟度计
- 清华大学考生自述
- 小学生读书卡模板
- 沉积学与古地理
- 生理学教学大纲
- 环保铁1215物质安全资料表MSDS
- “君子教育”特色课程的探索
- 冲击地压讲座
评论
0/150
提交评论