方差的分析与正交的设计c6_第1页
方差的分析与正交的设计c6_第2页
方差的分析与正交的设计c6_第3页
方差的分析与正交的设计c6_第4页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章方差分析与正交设计.单因素方差分析在实际问题中,人们常常需要在不同的条件或不同的状态下,对所研究的对象进行对比试验,从而得到若干组数据(样本)。方差分析就是一种分析、处理多组试验数据均值间差异显著性的统计分析方法。其主要任务是通过对数据的分析处理,搞清各试验条件以及它们所处的状态对试验结果(又称试验指标)的影响,以便有效地指导实践,提高经济效益或科研水平。基本概念例1某灯泡厂用四种不同材料的灯丝生产了四批灯泡,除灯丝材料不同外,其他生产条件完全相同。今由每批灯泡中随机地抽取若干个灯泡,测得使用寿命(单位:h)数据如表(1)所示,现在要求推断出灯泡使用寿命是否因灯丝材料不同而有显著差异。表⑴灯泡寿命灯丝12345678A)1600161016501680170017001780AI1500164014001700175016401550160016201640160017401800A4151015201530157016401680如果在一项试验中,只有一个因素变化,其他因素保持不变,我们称这种试验为单因素试验。因素所处的状态称为水平。本例考虑的是一个因素即灯丝,这个因素具有四个水平,即四个不同材料的灯丝,a1,a2,a3,A4°从表中的数据看到,即使对于同一种材料的灯丝,虽然生产条件都一样,但灯泡的使用寿命还是可以不相等的,这说明灯泡的使用寿命是一随机变量。现在用2,曷表示四种材料的灯丝所生产的灯泡的使用寿命,这样就有四个总体。若从这四个总体中分别随机地抽取容量为%的样本或看,2,…,舄-,•=123,4,我们应用这四个样本来推断四个总体之间有无显著差异。要判断不同灯丝材料的灯泡对使用寿命的影响问题,就是要辨别使用寿命之间的差异是主要由抽样误差造成的还是由灯丝材料不同造成的。这一问题可以归结为判断四个总体是否具有相同的分布。另外,在方差分析中,总是假定各总体相互独立,且都服从正态分布。由于除因素外,试验的其他条件都认为相同,这样就可以假设每个总体的方差相同。因此推断四个总体是否具有相同分布的问题,就归结为检验四个具有相同方差的正态总体,其均值是否相等的问题。实际上,方差分析就是检验若干个具有相同方差相互独立的正态总体,它们的均值是否相等的一种统计分析方法。前几章中我们曾介绍了检验两个正态总体均值间差异显著性的t检验法。现在对多个正态总体,我们能否仍用r检验法两两进行检验呢?结论是否定的。设想有十组数据,客观上它们来自同一正态总体,因而有相同的均值。在这种情况下,任取两组数据采用r检验法检验其均值是否相等。设a=0.05,则接受假设认为两组均值相等的概率为1一。=0.95。但从十组数据中任取两组,共有。1=45种不同的取法,所以接受“0的概率为(0.95)45比0.099。客观上十组数据均值相等,而采用,检验法两两检验时,犯第一类错误(认为至少有两组均值不等)的概率为0.901.由此可见,当组数增多时,采用f检验法两两检验时,犯第一类错误的概率将大大增加,使我们判断的结果很不可靠。波兰数学家R.A.Fisher(1923)提出的方差分析法,可同时判断多组数据均值间差异的显著性。下面给出单因数方差分析的一般概念。设有p个相互独立的正态总体i=1,2,—,p,设当,。2,…,殳,,是从第i个总体。中抽取的容量为〃,的简单随机样本。由于的~N(m,ct2)(i=1,2,…,ptj=1,2,—,%),易与〃i的差务.一M.可以看成是一个随机误差。因此%满足务=〃,+%, ⑴而%~N(0q2),且互相独立,其中i=1,2,…,p;)=1,2,…,〃,”要求检验假设•〃1=〃2=…=〃p°统计分析下面构造检验假设”0:〃|=〃2=…=〃p用的统计量。记TOC\o"1-5"\h\z〃=£%,己=,之务。 ⑵尸I这是第i个总体。.的样本均值,也叫做组平均值。称- 1pMl_1P—总率3嵩唁 ⑶“i=] j=\ "/=|为总平均值。〃是从p个总体抽得的样本的总容量。由(2),(3)两式可得一(务g,)©T)=°。〃1=1j=\由此得到pn\—P — — —S7=EE&T)2=££[④TJ+4一口2i=lj=l ;=1)=1务苫)+X〃,4T)2=s,+Sa。 (4)<=1j=\ i=l其中TOC\o"1-5"\h\zC _ p__1=££(务TN,54工〃,自一厅。«=1J=1 i=ls7是所有观察资料曷与总平均值占的差的平方和,称为总偏差平方和。它是描述所得全部数据离散程度的一个指标。由上式知,总偏差平方和可以分解为1、Sa两项之和。我们再来看2、Sa的意义。记〃=一三〃,〃, (5)n,=i是各均值的平均,叫做均值的总平均。令。产出一〃,j=1,2,…,po它是各总体的均值与理论总均值〃的差异。名称为因素的第i个水平的效应。易知p个效应满足关系式pZ〃,,=0。1=1当假设"0:〃|=〃2=…=〃p成立时,由(5)式可得〃]=〃2=…=〃p=",从而%=0(i=12…,p)o故假设"°也可写为//0:%=%=…=6Zp=0o式(1)用水平的效应表示,可以写成易=〃:+%=〃+%+/(i=l,2,—,p;J=l,2,-,%)此时曷=一工务=一工(〃+%+%)=〃+%+£,。nij=lnij=l其中£,=上E务是第i个总体样本误差的平均,又nij=l一1W—]白 - ip- -八一£〃4=一工〃,(〃/=1 〃 〃2其中工='£凡&='£之£表示所有样本误差的平均,从而有〃/=| n/=|j=i= 务乞)2=£之(〃+%+%—〃一区一田)2=£方(%—田)2。i=lj—\ i=lj—\ /=!j=lP— —P _ _P 一一Sa=Z%MT)2=Z%(〃+《+©一〃一£)2=Z%(a,+£i—£)2。1=1 i=l i=l由这两式可以看出,工仅依赖于随机误差%,Sa除与随机误差有关外,还与各水平间的效应%=4一M有关。这就是引起易波动的两个原因:一个纯粹是由随机误差与引起的,另一个在一定程度上是由各总体均值从之间的差异引起的。如何构造检验统计量呢?这可以从Se,5.的数学期望得到启发,因为(务W)2〜/(〃「力bj=l所以3=e["(务名尸]=曲忖&七)2TOC\o"1-5"\h\z[i=l7=1 J>=lL>=1 _ni=Z(n—1)o-2=(n-p)cr2.ES『e]£;〃,(Fi-万]=£>了(百一名)2=5-1方2+4仙一〃)2。J=1 Ji=l »=1记C2_Se2_SAlj।一 »o2— °n-p -p-l则有ES;=标.ES:Z+」—£%(〃,_〃)2。P-1m由此可见,不论对从的假设如何,S:是1的一个无偏估计,而5;仅当假设:〃1=〃2=…="p成立时,它才是b?的一个无偏估计,否则它的期望值要大于tT:。这说明比值S;(n-p)SA—S;~5-1电’在假设“0不成立时,有偏大倾向。

下面讨论尸的分布。当“0成立时,〃[=〃2=…=〃p=〃,此时,&广NQl,/)。于是由(4)式有p% p _££3)+《-〃)『i=lJ=1 i=lJ=1=11啕T)2+t9(占-〃)『+2£之©-)j=lj=l <=!j=] i=]j=lp"i _ _工X(务-工+〃(J")?i=lj=l=S«+Sa+〃痣-〃)2。对于%它有P个线性关系£(务-刁=0,i=l,2,…,P,所以它的秩为〃-P。对;=1于Sa,它含有一个线性关系£%(m-孑)=0,所以它的秩为p-l。对于〃痣-〃尸,其秩为1«sS由于(〃一p)+(p—l)+l=〃,故由Cochran定理知,当假设成立时,一^•和g相互独cra立,且—T-Z2(«P)>心~72(PT),(y~ b山此知S;(〃S;(〃-P)Sa("1电~F(p-\,n-p)给定显著性水平a,由尸分布的分位数知P{尸>K-a(pT,"P)}=a。当尸的观察值F>K_a(P-L〃-pW'h拒绝假设”°,否则认为试验结果与假设“°无显著差异。为应用方便起见,将上面讨论中所需的结果列成方差分析表,如表(2)„例2检验例1的四种灯丝材料对灯泡使用寿命是否有显著影响(a=0.05)。解4n=Z%=7+5+8+6=26,i=i计算得SA=44360.7,S,=151350.85;P-1n-p14786.91879.5844360.735;P-1n-p14786.91879.5844360.73=14786.9,151350.826-4=6879.58,把计算结果整理列成下面的方差分析表(表(3)表(2)方差来源平方和自由度均方和产值因素的影响Sa=£〃,出一斤1=1P-lo2 Sa邑=…si误差鼠=£之啖-己)21=1y=ln—ps;-n-p总和5产t七④W)2i=lj=ln-1s2=-^-〃-1表(3)方差来源平方和自由度均方和产值因素的影响SA=44360.7〃-1二35;=14786.92.15误差Se=151350.8n-p=22S,2=6879.58总和Sr=195711.5〃-1=25S2=7828.46这里产的自由度为(3,22),若给定显著性水平a=0.05,查得临界值尸「a(3,22)=3.05。因为F=2.15<3.05=F,_o(3,22),故应接受,即认为四种灯丝生产的灯泡其平均使用寿命之间没有显著的差异。§2.双因素方差分析在实际问题中,影响试验结果(试验指标)的因素往往都不止一个,而是两个或更多。此时,要分析因素的作用,就要用到多因素试验的方差分析。这里只讨论两个因素的方差分析。至于更多因素的问题,用正交试验法比较方便。在两个因素的试验中,不但每一个因素单独对试验起作用,往往两个因素会联合起来起作用。这种作用叫做这两个因素的交互作用。例如,有些合金,当单独加入元素A或元素B时,性能变化不大,但当两者同时加入时,合金性能的变化就特别显著。交互作用在多因素的方差分析中把它当成一个新因素来处理。不考虑交互作用的方差分析设因素A有p个不同的水平A1,&,…,AP'因素B有<7个不同水平81,人,…,约。对每种情况(A,吗)进行一次独立试验,共得pq个试验结果务(i=1,2,-,p;j=1,2,-,q),如表(1)所示。表(1)因素^B\当…Bq平均值m丸hJpl丸务以2•••丸丸比A务平均值…短占其中_ 1&4,=一方却,i=l,2,…,P,W.j=L£^ij,j=1,2,…,q,设务是相互独立的服从正态分布N(/q2)的随机变量,即务是从服从正态分布N(/,(t2)的总体中抽得的样本。由于认为A,8两个因素间不存在交互作用,故假定其均值i=1,2,—,p;j=1,2,—,q,名为因素A的第i个水平的效应,它表示因素A的各个水平的影响的大小。用为因素8的第j个水平的效应,它表示因素8的各个水平的影响的大小。记]qMZ"。'i=l,2,…,p>qj=\]G〃广一Z/,J=12,・・,q,Pi=l%=从.一〃,i=1,2,—,p,4=/—〃,j=1A-,q,则显然有£%=0,£4=0,TOC\o"1-5"\h\zi=i j-\这样,无交互作用的方差分析模型为务=〃+%+〃,+%,i=1,2,—,p;j=1,2,—,q, (1)p qZ%=°,工0j=°,i=i j=i%iid,%~N(0,cr2)。符号“iid”表示独立同分布,因此要判断因素A的影响是否显著,就等价于要检验假设”oi:。|=%=…=%=0。要判断因素8的影响是否显著,就等价于要检验假设h02•P\-Pi-…=4=。。下面来寻找检验统计量。和前面类似,将总偏差平方和»进行分解:S产££(务一斤=££((务-久-口+&)+©/-4)+©T))2/=1;=1 /=!)=1P__ f/__P4 ___=可七-厅+P9氏T)2+t之④-以-务+分1=1 ;=1 1=1j=l=SA+SB^SeO其中-1,Sp=p汽鬲一占)2,Se=£玄-j+“。i=1 j—\ i=lj—\由式(1)务=〃+/+丹+%知以=-2扁=-2?4+区+尸产%)=〃+火+—25

qj=\qj=i q可=〃+%+£”,i=l,2,…,po(2)一1工其中£,.=L».同理&j="Pj+£.j,j=1,2,—,q,(3)其中£./=,£号。

p1=1又务=」Z(〃+%+“,)=〃+£'pq/=ij=\pi=i(4)_ip1Pq其中-zz与为所有样本误差的平均。pi=\pq/=i;=1将(2),(3),(4),三式代入上面S%,S人邑的表示式中得SiS后.-占尸=虎(%+£,—£)2*=1 /=!Sb=pZ(E/-去)2=p£(fij+e.j—e了,J=1 尸1Se=Z£©—.j+E)2=Zt(%—Hj+3),i=l;=! i=lj=X山此可知,S,反映了误差引起的波动,S,除与误差有关外,还反映了因素A各水平效应间的差异,S8除与误差有关外,还反映了因素8各水平效应间的差异。还可以求得E(Sa)=(p-l)(r2+q^a.,f=le(sq=G7-1)。2+〃£氏,,=iE(Se)=(p-l)(q-l)cr\n2_Sb《2°2- ~'°3q-iE(S:)=E(S:)=6T2+E(S;)=E(S;)=E(S;)=CT与单因素方差分析类似,可采用下面统计量:V2p-1P-1邑当假设“01不成立时,扁大,故可用来检验假设“01;当假设“02不成立时,七偏大,故可用来检验假设“02。再讨论统计量匕,%的分布。当假设”01和“02成立时,有为=4,此时一切与〜N(〃q2),于是11[④—己+(占—〃)『=S7+pq记一〃)21=1j=\ i=lj=\=SA+SB+Se+pq(^-/i)2,其中X,Sb,Se,pq(己一〃尸都是非负二次型。SA=q£&.-Z)2,包含一个线性关系S(£-E)=。,故〃的秩为p-l。1=1 1=158=。2(七一分,包含一个线性关系9=°,故,的秩为4一1。j=l j=lS” .j+分,包含p+q个线性关系£(务—£Y.j+豆=0,i=l;=1 i=lj=l,2,…,q和演—+Z)=3i=l,2,…,p,由于f£(如一并一窘+占)j=l i=lj=l=0,故上面p+g个线性关系中,只有p+g-l个是独立的,因而S,的秩为pg-(p+q-l)=(p-l)(q-l)。又四咨-〃产的秩是1。而以上各项的秩相加得(p-l)+(q-l)+(p-1)(q-l)+l=pq。ssS由Cochran定理知,当及"o2同时成立时,心,七,一?相互独立,且a"<y'a"TOC\o"1-5"\h\zS, s, S,T~/(p-i),(g-1),—^~/((pT)(g-i))。a~ a a~从而当“01,”02为真时S:(p-D(g-l)s"=77= : ((p-1),(p-l)(g-l)),S3 p-i sePS; (p-l)(q-I)Sb (n.n,八、尸8=77= ; — ((g-1),(p-D(q-l))。S3 p-l将上面的结果列成方差分析表(表(2))所示。表(2)方差来源平方和自由度均方和E值A的影响Sa='®.一分1=1p-1s;告p-lS2B的影响工——S8=pX©jT)2j=lqts;告q-i心等误差Se=H()2Z=1j=l(p-i)(4-i)s;=^——(p-D(q-l)

总和s产£力务一斤/=1;=1pq-i例1为了研究蒸储水的pH值和硫酸铜溶液浓度对化验血清中的白蛋白与球蛋白的影响,对蒸储水的pH值(A)取了四个不同水平,对硫酸的浓度(B)取了三个不同水平,在不同水平组合(A,, )下,各测一次白蛋白与球蛋白之比,将其结果列成表(3)。试在a=0.05下检验两个因素对化验结果有无显著差异。表(3)与b2当或Ai3.52.32.07.8a22.62.01.96.5&2.01.51.24.7A1.40.80.32.5Z.J9.56.65.4解检验假设H0l:a1=a2=aJ=a4=0,“02:B\= 瓦=。。通过计算得方差分析表(表(4))。表⑷方差来源平方和自由度均方和尸值A的影响5八=5.293S:=1.76Fa=40.9B的影响Sb=2.222S;=1.11Fb=25.8误差Se=0.266S;=0.043总和Sr=7.7711由于当假设成立时,Fa~F(3,6),查尸分布表得人〜(3,6)=4.8.因为Fi4=40.9>4.8=F1_a(3,6),所以拒绝”(“,即因素A的不同水平对化验结果有显著影响。又由于当”02假设成立时,Fb~F(2,6),查尸分布表得K.a(2,6)=5.1。因为Ffl=25.8>5.1=F,.a(2,6),所以拒绝即因素B的不同水平对化验结果有显著影响。考虑交互作用的方差分析在以上讨论中,由于只对两个因素各水平的组合进行了一次观察,所以不能了解4,8两因素之间是否存在交互作用的影响。上面假设均值/=〃+%+%i=1,2,—,p;j=1,2,—,q.而现在要考虑A,B各水平的交互作用,很自然为・#〃+«,+Bj,我们称学=/一"一名一用为因素A的第i个水平与因素8的第,个水平的交互效应(即交互作用的影响)。对两个因素A和8的各水平(4,吗),i=l,2,…,p;j=1,2,-,q,重复进行r次观察,设其观察值为%”,i=1,2,—,p;j=1,2,—,q,k=1,2,—,r,并假设(1)务”独立,^ijk~N(///y,cr2).i=1,2,—,p;j=1,2,—,q,k=1,2,—,r;(2)4=〃+生+4+2。于是TOC\o"1-5"\h\zp q p qZ%=0,XA=0,Z盘=0,j=q,2丹=0,i=l,2,…,pqf=l j=l j=l这样就得到两个因素有交互作用的方差分析模型为务k=〃〃=〃+%+/j+%+£,冰,P 4 P </=0,Z4=。,24句,»=1 j=l i=l j=\力”id,£桃~"(0,。2)(i=l,2,…,p;j=l,2,…,q,k=1,2,**\r)o因此要判断因素A,8的影响以及交互作用的影响是否显著,分别等价于检验假设H0]:%=%=…=。〃=0,"o2,P\~…=4=。,“03:2=0,i=1,2,—,p;j=1,2,—,qo为了检验上述假设,类似地将总偏差平方和S7进行分解。s产i=lJ=1k—\[(孩一:)+(蔡一孑)+(靠-1.~窘+占)+陶-黑)]2;=1;=1a=1=££f(屐-分+£££(占厂方+£汽f(蔡-矗Y/+办+;=!;=1*=1 /=lj=lk=\ i=lj=\k=\i=\y=lA=lTOC\o"1-5"\h\z+Sfi+54xfi+Seo (5)其中i=lJ=l*=1 f=lPJ7r_ _ q_ _氏T)2=p,£璃TPi=lj=\k=\ ;=lSa*b=£££(蔡-齐-8+分=「££(嘉-噩-乙+分,i=lj=\k=l i=ly=l= (%-蔡尸。/=!>1k=\_ 1prrTxzz务*。pq『i=\k=\k=\在平方和分解公式(5)中,Sa除反映误差波动外,还反映了A因素的各水平间效应的差

异;Sg除反映误差波动外,还反映了8因素的各水平间效应的差异;Sam除反映误差波动外,还反映了交互作用的差异所引起的波动;S,仅仅反映了误差的波动。可以计算得E(S人)=(p_l)<r,qr之a;,i=lE(SB)=(q-l)a2+pr^^j,六ipq成5例)=5-1)(4一1)。2+,££尾i=\j=lE(Se)=pq(r-l)a2o令C2_枭C2_枭c2_

$2- 79$3-夕一1SaxB(〃一1)(4一1),果—pq(r-1)则得E(S;)=内片少3

q_[E(S;)=内片少3

q_[j=iE(S;)=rPq(y2+ ,E(S:)=(T构造统计量:S2S2FaB=^FX=TT-Fb=-^'J4 J4当假设”01不成立时,尸A有偏大倾向,故可用配检验假设“01:当假设“02不成立时,Fb有偏大倾向,故可用七检验假设“02;当假设“03不成立时,工8有偏大倾向,故可用"b检验假设”03。可以证明士〜/2(pq(r_1))。cr-S当“01成立时,T■〜%2(p_l),且与凡独立,所以(7~FA~F(p-\,pq(r-1))。当“02成立时,-t~Z2(g-D>且与工独立,所以bFB-F(q-l,pq(r-l))。s当“03成立时,T〜((4-1)(4—1)),且与S,独立,所以O•一尸物〜尸((p-l)(q-l),pq(r-l))。将上面的结果列成有交互作用的方差分析表(表(5))。表(5)方差来源平方和自由度均方和产值A的影响Sa=t方舟.-修1=1p-1s;告p-1s2YB的影响Sb=p也旗一分>1qTs:=生I交互影响AXB邑卜8=*之藐W/+占)2/=17=1(p-1)(q-Dqr2_ °4x8L(p-l)(q-l)误差pqr _i=lJ=1*=1P<i(r-1)s:二」一pq(r-1)总和sT=ttt^-^2Z=1j=\k=\pqr-1例2在某橡胶配方中,考虑三种不同的促进剂,四种不同分量的氧化锌,同样的配方重复一次,测得300%的定伸强力如表(6)所示。试问氧化锌、促进剂以及它们的交互作用对定伸强力有无显著影响(a=0.01)?

表(6)当B、Ai31,33343635,3639,38&33,3436,3737.3938,41435,3737,3839,4042,44解山表(6)数据可算得相应的方差分析,结果见表(7)所示。表(7)方差来源平方和自由度均方和产值显著性ASA=56.62S;=28.3/a=19.4显著BSB=132.23S;=44.1Fb=30.2显著AXB§4x8*76S;=0.8F.„=0.55f\D不显著误差S«=17.512=1.46总和211.023由显著性水平a=0.01,查尸分布表得五%Q,⑵=69尸f(312)=60;4a(612)=4.82。所以在显著性水平a=0.01下,促进剂种类影响和氧化锌总量的影响都是显著的,而它们之间的交互作用则认为可以忽略。§3正交试验设计的直观分析试验设计是数理统计中的一个较大的分支,它的内容十分丰富,这里只介绍正交试验设计(简称正交设计或正交试验)。这种方法第二次世界大战后在日本全国普遍推广,据日本某些专家估计,“(日本)经济发展中至少有10%的功劳归于正交设计”,可见其经济效益之大。在我国,正交设计也有很多应用,它的进一步推广将会在我国现代化建设中获得更加丰硕的成果。正交设计是利用“正交表”进行科学地安排与分析多因素试验的方法。它的主要优点是,能在很多试验方案(也称试验条件)中挑选出代表性强的少数试验方案,并通过对这少数试验方案的试验结果的分析,推断出最优方案,同时还可以作进一步的分析,得到比试验结果本身给出的还要多的有关各因素(也称因子)的信息。在§2中介绍的两个因素的方差分析的计算已经比较复杂,当因素及水平数较多时,试验次数是惊人的。例如,考虑5个因素4水平的试验,若每个因素的水平搭配(水平组合)只做2次重:复试验,就要做2x45=2048次试验,而且,对这么多试验数据进行统计分析计算,也将是非常繁重的任务。此时如果用正交设计来安排试验,则试验次数会大大减少,而统计分析的计算也将变得简单。按“正交表”来安排回归试验,也会使多元线性回归分析的计算变得更简单。对正交试验结果的分析,通常采用两种方法,i种是直观分析法或称极差分析法,另•种是方差分析法。在实际工作中两种方法都有用,本节讨论直观分析法。正交表下面的表(1)是一张正交表,把它记为L8(2’)。表(1)列号12345671111111121112222312211224122221152121212621221217221122182212112记号院(27)中的“L”代表正交表,L右下角的数字“8”表示这个正交表有8行,即安排8次试验,括号内的数字“2”表示集中只出现“1”和“2”两个数字,它们分别是因子的1水平和2水平的代号,数字2的右上角“7”表示这张正交表有7歹IJ。正交表的列是用来安放因子和交互作用的,因此正交表L8Q7)最多可安排7个二水平因子的试验。常用的正交表有L403),L8(27),L16(215),L32(231),L9(34),L27(313),L/44)等,它们的含义与L8(27)类似。正交表有如下两个性质:(1)每列中不同水平出现的次数相等。例如L8(27)中的1水平和2水平在各列中各出现4次。(2)任意两列,将同一横行的两个数字看成有序数对时,每种数对出现的次数相等,例如表L8(27)中,可能的次序对为(1,1),(1,2),(2,1),(2,2),它们在任意两列中各出现两次。凡满足上述两条性质的表称为正交表。正交试验及其结果的分析根据试验指标(即表示试验结果特性的值),可把正交试验设计分为单(一个)指标试验设计与多指标试验设计。下面通过例子说明如何用正交表进行单指标正交设计,以及对试验结果进行分析。例1合成氨最佳工艺条件试验。数据以往生产积累的经验,决定选取的试验因素与水平如表(2)所示。假定各因素之间无交互作用。试验目的是提高氨产量,即要找到最高产量的最优的水平组合方案。

表(2)例1的因素与水平表水平A反应温度(℃)B反应压力(大气压)C催化剂种类1460250H12490270乙3520300丙解首先,选择合适的正交表。本例是一个3水平的试验,因此要选用Ln(3)型正交表。本例共有3个因素,不考虑因素之间的交互作用,所以要选一张t23的表,而LG,)是满足条件t23的最小的LK3')型表,故选用正交表1^(34)安排试验。选定正交表后,接着进行表头设计。本例不考虑因素之间的交互作用,只需将各因素分别填写在所选用的正交表的上方与列号对应的位置上,一个因素占有一列,不同因素占有不同的列,就得到表头设计(见表(3))。表(3)例1的表头设计因素ABC空列列号1234未放置因素或交互作用的列称为空白列(空列)。空白列在正交设计的方差分析中也称为误差列,它有着重要作用,一般要求至少有一个空白列。完成表头设计后,就可以判定试验方案。把表中各列的数字“1”、“2”、“3”分别看成是该列所填因素在各个试验中的水平数,而正交表的每一行就是一个试验方案。于是,本例得到9个试验方案。如:第六号试验方案:A2B3C,o这就是用温度490℃、压力300大气压、甲种催化剂三种水平组合进行试验。下面用正交表来分析试验结果。按正交表的各试验号中规定的水平组合进行试验。本例总共要进行9个试验,将试验结果(数据)月,丫2,…,、9(单位:0填写在表的最后一列中。例1的试验方案及试验结果见表(4)。表(4)例1的试验方案及试验结果分析ABC空白产量列号试验号234指标%(t)11(460)1(250)1(甲)1"=1.722I2(270)2(乙)2313(300)3(丙)3>2=1.82y3=1.80

42(490)123刈=1.925223162312K=1.83尤=19873(520)132>,7=1-598321393321y8=1.60y9=i.8i5.345.235.305.369K”5.735.255.555.395.005.595.225.32i=\=16.07K”y=-=1.7869F1.7801.7431.7671.7871.9101.7501.8501.797心1.6671.8631.7401.773心R,0.730.360.330.07因素主一次ABC优方案A]B3C2引进下列记号以计算极差和确定因素的主次顺序。K广第/列上水平号为i的各试验结果之和。用)=」储『其中S为第j列上水平号i出现的次数;用)表示第,列的因素取水平i时,进行试验所得试验结果的平均值。/?j=max{K/-min{K/。勺称为第,列的极差或其所在因素的极差。R,也可定义为R尸max{K“一min{K/。但对于水平数不等的试验,就只能用后者。对于本例,有-11^>1=-Kll=-(丫|+丫2+为)1, 、5.34=-(1.72+1.82+1.80)= =1.780;3 3-11勺1=§ (九+九+九)1, 、5.73=-(1.92+1.83+1.98)= =1.910;3 3-11^31=-^31=-(为+%+%)1/ 、5.00=-(1.59+1.60+1.82)= =1.667;3 3R]=max{4[],长2],43[}min{K■,K,K31}=5.73—5.00=0.73o其它的K,厂用尸勺的计算过程就不写出来了,它们的计算结果列在表(4)中。注意:如果第j列放置因素A,为了方便,有时也把KuM分别写成K泡,KiA,其它记号如KiB,KiB,KiC,KiC作类似的理解。一般地说,各列的极差是不相等的,这说明各因素的水平改变时对试验结果的影响是不相同的。极差越大,说明这个因素的水平改变对试验结果的影响越大,极差最大的那一列的因素,就是因素的水平改变对试验结果影响最大的因素,也就是最主要的因素。对于本例有Rx>R2>/?.>/?40IZJ4因此,它的各因素的主次顺序为主f次:ABC现在,可以根据分析结果确定最优试验方案了。挑选因素的优水平与所要求指标有关,若指标越大越好,则应该选取使指标大的水平,即各列K“,K2j,K3,(或%,.,冗,八玄3)中最大的那个水平;反之,若指标越小越好,则应取1J JJ 'J TJJ使指标最小的那个水平。本例的试验目标是提高合成氨的产量,指标越大越好,所以应该挑选每个因素的K“,K2j,J中最大的那个水平。由于故得最优方案为A2B3c2。即反应490℃,反应压力300大气压,乙种催化剂。我们通过分析计算得到的最优方案A?B3c2,并不包含在正交表中已做过的9个试验方案之中。这正体现了正交设计的优越性。但是,实际上它是不是真正的最优方案呢?这可以通过进一步的试验来验证,我们也可以作进一步的理论计算来证实。3.3有交互作用的正交试验设计分析前面讨论的正交试验设计和对试验结果的分析,都是在因素之间没有(或不考虑)交互作用的情况下进行的。实际上,在许多试验中,因素的交互作用不但存在,而且不能忽略。在这种情况下,对多因素的正交试验的表头设计还必须另外借助两列间的交互作用表,许多正交表的后面都附有相应的交互作用表。表(5)就是正交表L807)所对应的交互作用表。表(5) L807)两列间交互作用列表号列葭3\1234567(1)325476(2)16745(3)7654(4)123(5)32(6)1(7)用正交表安排有交互作用的试验时,把交互作用看成一个新的因素,它要在正交表上占有列,称为交互作用列。交互作用列不能随意安排在任意列上,应该通过查交互作用表来安排。从表(5)就可以查出正交表L8@7)中任何两列的交互作用列。例如,要查第2列与第6列的交互作用列,先在表6-25的对角线上查出列号(2)与(6),然后从(2)向右横看、从(6)向上竖看,交叉数字为4就是它们的交互作用列的列号。即是说,用LK27)安排试验时,如果因素A被安排在第2列,因素8被安排在第6歹IJ,那么,交互作用因素AXB就只能安排到第4列上,此列不能再安排其它因素,以避免发生效应之间的''混杂”。在分析试验结果时,AX8仍然作为一个单独因素,同样计算它的极差,极差的大小反映A和8的交互作用的大小。下面举例说明有交互作用的试验设计与试验结果的分析。例2工件的渗碳层深度要求为1±0.25mm,要通过试验考察的因素与水平如表(6)所示,还要考察交互作用AXB.BXC。表(6)例2的因素与水平表水平因素A催化剂B温度(℃)C保温时间(h)D工件重量(kg)甲70021乙80031.5试验目的是确定这4个因素及2个交互作用对渗碳指标的影响的重要性的主次顺序,并找到最优的生产方案。解首先,选定合适的正交表。这是一个4因素2水平试验,4个因素加上2个交互作用Ax8、BxC,因此所选的2水平正交表至少要有6列。满足这种条件的2水平正交表中以IQ7)为最小,因此选用正交表L8(27)安排试验。然后进行表头设计。把因素A、8分别放在表L807)的第1、2列上,查及(27)两列间的交互作用表,可知交互作用A义B占用第3歹U,因此第3列不能安排因素C(或其它因素),否则第3列的极差就分不清楚是因素。的作用还是AX5的作用,这便产生了效应“混杂”。现将因素C放在第4歹I」,查LgQ?)两列间的交互作用表,可知交互作用BXC占用第6歹IJ,因此第6列不能再安排别的因素。最后,因素。可安排在第5列或第7列上,现安排在第5列上,于是第7列成为空白列。这样,便得到不会有因素与交互作用“混杂”的表头设计,如表(7)所示。表(7)例2的表头设计因素ABAXBCDBXC空列列号1234567下面制订试验方案与进行试验。完成了表头设计以后,只要把表1(27)安排有因素的第1、2、4、5列上的数字“1”、“2”分别看成是该列所安排的因素在各个试验中的水平数,从而正交表的每一行就确定一个试验方案,于是得到本例的8个试验方案。注意,在完成了表头设计以后,交互作用所在列与空白列一样,对确定试验方案不起任何作用,因为那些列的数字“1”、“2”不代表任何实际水平。按正交表规定的试验方案进行试验,测定试验结果。试验方案与试验结果见表(8)»下面分析试验结果,计算极差,确定因素的主次顺序。由于渗碳层深度七越接近1越好,为了便于讨论,把试验指标为变换为Ix—\|=%,从而问题转化为匕越小越好。用%(i=1,2,…,8)来计算K”%,计算K",勺与第/列放置什么因素或交互作用无关,所以计算Kg,0的公式与无交互作用情形相同。计算所得结果以及根据极差0由大互小所确定的因素的主次顺序见表(8)o最后,确定最优方案。如果不计交互作用,注意到指标必是越小越好,很容易得到最优方案应该是A1B2C1D”但是,由于交互作用AX8是影响试验结果的最重要因素,是挑选水平组合的最主耍依据,所以不能不计。可是,AX8没有实际水平,说它取哪个水平是没有意义的,因而不能按63,长23值的大小来确定,应该按因素A,8的水平搭配的好坏来确定。怎样看出两因素水平搭配的好坏呢?通常把两因素各种水平搭配下对应试验结果(数据)之和列成的表格称为搭配表(也称为二元表),表(9)便是本例的A,8两因素的搭配表。表(8)例2的试验方案与结果分析夕试验号号ABAXBCDBXC空列渗碳层深度Xj(丽)y二1Xj-11123456711伸)1(700)1K2)1(1)110.850.1521112(3)2(1.5)220.750.25312(800)211221.030.03

412222110.980.0252(乙)1212121.090.09621221211.160.16722112210.810.19822121120.920.080.450.650.670.460.420.340.520.520.320.300.510.550.630.450.070.330.370.050.130.290.07因素主f次AXBBBXCDAC优方案A12c2D1表(9)例2因素A,B的水平搭配表B?D“=y1+为=0.15+0.25=0.40d12=y3+=0.03+0.02=0.05A?D2i=y5+y6=0.09+0.16=0.25D22=为+y8=019+0.08=0.27由于本例的指标.越小越好,根据正交表的综合可比性,表中最小值所对应的水平搭配就是因素A,8的最优水平搭配,即最好的搭配是A1?。由于交互作用8XC比因素C重要,我们也列出因素8,C的水平搭配表(见表(10))。表(10)例2的因素8,C水平搭配表GC2Di尸%%=0.15+0.09=0.24D]2=y2+儿=0-25+0.16=0.41生D2i=y3+y7=0.03+0.19=0.22d22=y4+y8=0.02+0.08=0.10与因素A,8找最优水平搭配的道理一样,由表(10)得到因素8,C的最优水平搭配为B2c2。综上所述,不考虑交互作用时得到的最优方案为A1B2CQ1,考虑交互作用时得到的最优方案为A|B2c2D.这两个方案一致之处在于因素C的水平选取上,在有交互作用时,这种矛盾现象是经常发生的。此时,因素C取哪一个水平好呢?一般来说,次要因素应该服从主要因素(交互作用AX8、8XC分别都看作是因素),本例交互作用BXC比因素。重要,因此应该选择由因素8,C的优水平搭配所确定的水平。于是,最后确定的最优方案为A|B2c2四。即甲种催化剂,温度800℃,保温时间3h,工件重量1kg。当因素取3水平或3水平以匕时,交互作用的分析比较复杂,不便于应用直观分析法(极差分析法),通常都用方差分析法。§4正交试验设计的方差分析前面介绍了用正交表安排多因素试验的方法,并对试验结果进行了极差分析。极差分析方法的优点是方法简单、直观,计算量较少,便于普及和推广,对于生产实际中的一般问题用极差分析法能够得到很好解决。但极差分析法不能估计试验过程中以及试验结果测定中必然存在的误差的大小,因而不能真正区分各因素各水平所对应的试验结果的差异究竟是由于水平的改变所引起的,还是由于试验误差所引起的。而且,对影响试验结果的各因素的重要程度,极差分析法不能给出精确的数量估计,也不能提供一个标准来考察、判断因素对试验结果的影响是否显著。特别,对于水平数大于等于3且要考虑交互作用的试验,极差分析法不便于使用。方差分析能弥补极差分析法的这些不足。4.1不考虑交互作用的正交试验的方差分析利用正交表对试验结果进行方差分析的思想与步骤类似于两个因素全面试验中的方差分析:先将数据(试验结果)的总偏差平方和分解为各因素以及误差的偏差平方和,然后求出F值,再应用F检验法。若用正交表L.(r')安排试验,总的试验次数为〃,试验结果为弘,打,…,尤,则数据的总偏差平方和ST为=±yj 工y,2_疗2=才匕2___0TOC\o"1-5"\h\zi=l i=\ /=1 〃其中,ni=] ,=i由一个因素的方差分析知道,因素A所引起的数据的偏差平方和(即组间平方和)为Sa=S〃,(1一切2=£明了,2一方2=£q-2_ZLOi=l (=1 i=l 〃其中,r为因素A的水平数;司为因素A的水平A,所对应的试验结果的平均值。用正交表安排试验时,每一个因素的任一个水平的试验次数都是相等的。设因素A的每一个水平的试验次数为5,则(记号K,尸月八斗与前节的含义相同)_-1〃j-Stn—rs;yj—K次=—K消©于是,Sa可表示为TOC\o"1-5"\h\zr 1 “ 1r 1 " rr T2Sa=,,Z舄一以2>)2」£代一,=l «i=l §i=l 〃,=l 〃,'=1 «若因素A安排在正交表的第,列上,记Sa=Sj,且称Sj为第/列所引起的数据的偏差平方和(简称邑为第/列平方和),于是有特别地,对于2水平的正交试验,计算邑的公式可简化为7 111Sj=—(&:+《)——(//+~=_(&厂KQ2=_R。Jn n n n若用正交表Ln(r')安排试验,可以证明有如下平方和分解公式:Sr=ZSj"j=i也就是说,我们用正交表将总偏差平方和力分解为各列偏差平方和邑之和,且S7的自由度fT=n—1;Sj的自由度fj=r—1。例1苯酚合成工艺条件试验。某化工厂在原有基础上要对苯酚的合成条件做进一步的研究,目的在于提高苯酚的产率。试验考察的因素与水平为(不考虑交互作用):A:反应温度CC)A|=300,42=320;B:反应时间(min)=20,B2=30:C:压力G=200,C2=250;D:催化剂种类O产甲,。2=乙;E:NaOH溶液用量(L)Et=80,E2=100.解由于各因素皆为2水平,共有5个因素,可选用正交表L8Q7)。表头设计、试验方案、试验结果及的计算结果见表(1)«表(1)例1的试验与计算表ABcDE试验结果以

列试验号号12345671211111112121212%=83.43411222212122121%=84.05622112212211221%=87.37822221112212112以=84.8%=873y6=88.0打=92.3丫8=90.4339.5358.0342.7354.8350.1347.4350.3347.2348.4349.1351.6345.9348.5349.07=697.5区=87.2院84.989.585.788.787.586.987.686.887.187.387.986.587.187.3碣R,18.512.12.73.10.75.70.5s.42.78118.3010.9111.2010.0614.0610.031S7=67.349本例是用正交表L807)安排试验,于是有:] 8 1 1Sr=£y;--(Xy,)2;Sj=、(K|j—R;。i=l8i=1 O 3各列的跖计算结果见表(Do山正交表的平方和分解分式及本例的表头设计,得Sr=S.+Sfl+Sr+S.,+Sf+S,+S7o//iOV/-/t1J/其中S3,S7均为空白列的偏差平方和。由于空白列的偏差平方和不是由任何因素所引起的,故是误差所引起的,因此误差平方和S,为所有空白列的偏差平方和之总和,本例为Se=S3+S-j且自由度有/e=+6,于是又有5r=S4+5»+Sr+SD+5F+5oi d uc.e要进行方差分析,还必须把试验结果理解为%理解为随机变量7(i=1,2,-,8),并假定它们服从正态分布。在无交互作用时,假定7,%,…,%满足下面模型。7]l=/j+al+bl+ci+dl+el+elrt2=M+al+bi+c1+d2+e2+£2〃3="+。[+b2+c]+d}+e2+s3〃4=〃+。1+/?2+c2+1/2+4+4%=N+ +c^d2+et〃6=〃+。2+么+。2+4+02+4%=〃+。2+62+0+d2+e2+e7r/s=^+a2+b2+c2+d,+e,+£g免s也=3i=\ /=1 ;=1i=l/=!£t,£2,…,/血~N(0,/),从而7,%,…,人相互独立其中q也,q,d,©分别为因素的水平A,,B,,C,,Dt,E,的效应(i=1,2),它们与〃及b?均是未知参数。检验A,8,C,O,E各因素对试验结果有无显著影响,分别等介于对下列假设:HA:a]=0,HH:b}=/??=0,Hc:C1—c^=0,HD:d]=d)=0,He:6]=6)=0。卜.面作出显著性检验。我们己指出有St=Sa+Sb+Sc+S[)+Sf+S°还可以证明有下列结论:(1)Sa,Sb,Sc,S‘,,Se,S,相互独立,且必〜/(/);(7s(2)当“八成立时,T•〜/(/a);(7~S当Hb成立时,—y-/2(fn);q当"c成立时,-T^Z2(/c);(7当”。成立时,—y*/2(//));crs当"e成立时,—7**Z-(fE)o其中人称为S.(或因素A)的白由度。有£=因素A的水平数一1。同理,可知力,人,4的含义及计算公式。。称为5/或误差)的自由度,它的另一个计算公式为。二37一各因素的自由度之和二(〃一1)一各因素的自由度之和。由此得到检验"a的统计量为F号"")其中,SA=SA/fA;&=S/A。一般$=Sj/力称为第j列的均方和。于是,对于给定的显著性水平a,由样本值必,力,…,为算出统计量%的观测值却,那么检验假设“A的法则为:若则拒绝”a,认为因素A对试验结果的影响是显著的;若E/居Y(i,/e),则接受”A,认为因素A对试验结果的影响不显著。类似可得到检验”8,“C,”。,"E的法则。但是,有些因素时试验结果的影响明显地不显著。应该把这些因素所在列的S,并入误差平方和S‘中。通常是比较Sa与S‘的大小,如果Sa<S/就可以将并入S,中。如果有若€7 zi C: Zl C J C.干列皆如此,就把这些列的Sj全部加起来,将它们与S.并在一起作为新的误差平方和S/相应的自由度也并入力成为//(注意,有时S,异常地小,此时甚至把满足,^>1,但相对于其它一些列的偏差平方和来说小得多的少数一些列的Sj也并入误差平方和S,中),然后再对其它因素用来作检验:若计算出的观测值尸闪》K-a(%,//),则以显著性水平a推断此因素对试验结果的影响显著,否则推断此因素对•试验结果的影响不显著。在例1中得到Se=S3+Sy=0.911+0.031=0,942;/小力+6=1+1=2;_o942-Sn=0.061〈匕丝=S,。2于是ASe=Se+SD=0.942+0.061=1.003。fe&=fe+fD/3+/7=1+1+1=3«查尸分布表得卑03(1,3)=34.12;F,_005(1,3)=10.13;Fl_010(l,3)=4.54.TOC\o"1-5"\h\zblS.42.781/1 广因匕="= =128.1>F,001(1,3)=34.12,*Se1.003/3 1-001故因素A对试验结果的影响是高度显著的。类似可得因素8的影响是高度显著的,而因素E的影响是显著的。对因素C,由于Fc=^~=L2。]/]=3.6<K0|0(1,3)=4.54,cS-1.003/3 1-010

故因素C对试验结果无显著影响。将以上分析计算列成方差分析表(表(2))。表(2)例1的方差分析表方差来源平方和s自由度f均方和3产值显著性A42.781142.781128.1**B18.301118.30154.8**C1.20111.2013.60A0.06110.061E4.06114.06112.2*e0.94220.4711.00330.334下面来确定最优方案。在无交互作用的情形,对试验结果影响显著的因素应该选最好的水平,由于Ka<K2A>故因素A的水平人2比A|好。(在本例中,指标越大越好)。类似可得因素8的水平生比与好;对于因素E,水平目比当好。对于作用不显著的因素,可根据提高效率、降低消耗、便于生产等多方面考虑任取•个水平。本例对作用不显著的因素C,。,可选G,R,故确定的最优工艺条件为aB2EiGR,即温度320℃、时间30min、NaOH溶液80L,大气压200及甲种催化剂。我们计算得出的最优方案A?B2E.C,2不包含在正交表排出的试验方案中,按正交表的安排在已做过的8个试验中,以第7号试验结果为最好,可将第7号试验方案与最优方案作对比验证试验。4.2考虑交互作用的正交试验的方差分析我们通过例子来说明。例2某纺织厂在梳棉机上纺粘棉混纺纱,为了降低棉结粒数,想通过试验确定有关因素的最优方案。试验要考察的因素与水平为:A:金属针布产地4=甲地,42=乙地;B:产量(kg)C:速度C:速度(r/rain)G=238,C2=320o还要考察3个因素之间可能存在的一级交互作用AX8,AXC,8XC。解选择正交表、表头设计、明确试验方案及进行试验等这些步骤都与前述类似,所得结果见表(3).为了便于计算,我们把试验结果进行了如下简化:y,.=100(X,—0.30) (i=l,2,…,8)。由于数据经过线性变换后方差分析的结论不变,故对正交试验的方差分析也是如此。表(3) 例2的试验与计算表AABAXBcAXCBxC棉结粒数%=100X列试验号1234567X:(xi~号0.30)11(甲)1(6)11(238)1110.30021112(320)2220.355312(10)211220.20-10412222110.300521212120.15-1562乙)1221210.502072211221040105-5010-150-5-403520-25-505-10T=—5y=-0.625s,3.12578.1253.125703.125253.1253.12528.125利用简化数据yg=l,2,…,8)计算勺,S,,计算与第,列安排什么因素或什么交互作用无关,所以计算K〃,Sj的公式与无交互作用的情形完全相同,具体计算结果见表(3)。下面对例2进行方差分析。为了进行方差分析,我们把试验结果,理解作随机变量,并记作?(i=l,2,…,8),假定它们满足下列模型:%/+fe|+(aZ?)j।+C]+(ac)H+(&c)n+£,(r/2=/j+at+bl+(ab)ll+c2+(ac)l2+(bc)l2+£2%=〃+4]+h,+(aZ7)12+c1+(ac)n+(Z>c)21+£,,7]4=/j+ai+b2+(ab)]2+c2+(ac)p+(bc)22+=〃+。2+仇+("bi+G+(ac)2]+(be)]1+£5〃6=〃+。2+4+(ab)2i+c2+(ac)22+(bc)l2+%=〃+〃2+%+(")22+C]+(ac)21+(bc)2]+£7%+(")22+c2+(ac)22+(be)l2+4TOC\o"1-5"\h\z=E&=Z,i=°i=li=\ /=12 2 2=Z(孙=Z(叫1=1 j=\ 1=]=£("%=£(反),7=£s%=0j=l /=1 J=1£},£2,…,4同〜NQtr?)(从而7,%,…,%相互独立)其中,〃,q,d,G,(ab%,(ac)u,(bearer?均是未知参数。〃称为理论总均值;《,2,二分别为A,B,,G的效应(,=1,2),它们的(估计值)计算方法与无交互作用的情形相同;("%,(。叫,仍叫分别表示从与Bj、A,与Cj、B.与g的交互效应,它们的(估计值)计算方法稍后再讨论。检验因素4,8,。及交互作用4乂8,4X。,8X。对试验结果有无显著影响,分别等价于对下列假设:HA:a1=。2=0,HB:/?)=b2=0»Hq:c[=c,—0>“axh:(。*=°(,=1,2;J=1.2),“Axe:(ac)(>=0(i=l,2;)=1,2),Hbxc:S%=0(i=l,2:j=l,2)。作显著性检验。前面已指出,正交试验的总偏差平方和分解公式为S7,对本例有;=1+Saxb+Saxc+Sbxc+S-。其中,Sa=S[,SB=S29SC=S49^AxB=^39^AxC=^59SBxC=S6, =S]。而且有fA=fB~fc=fAxB=fAxC=fBxC=S©=1。还可以证明有下列结论:⑴SA,S8,Sc,SAx3,SAxC,SwC,Se相互独立,且十二工);(7s(2)当"a成立时,(7~当Hb成立时,—y~/(于b);s当“C成立时,—y (fc);(J当“AxB成立时,9等~/(/*b);q当“A/成立时,一~/(九*Q。bS当〃8久成立时,号-/(/*C)。(T山此得到检验假设”A的统计量为Fa=沿?=》F5心,JJe'e于是,对于给定的显著性水平a,由样本值%,为,…,以算得统计量的观测值入,检验〃A的法则为:若FA》K-a(LJ)则拒绝"A,认为在显著性水平a下,因素A对试验结果的影响是显著的;若"(耳-a(L,/),则接受“A,认为在显著性水平a下,因素A对试验结果的影响不显著。类似地可以得到检验其它假设(包括交互作用的假设)的法则。但要注意,若有则应该把这些Sj并入误差平方和S,之中而成为sr,然后用/=去空〜Q(九,/「)/Je去检验那些没有并入力之中的邑的因素或交互作用的显著性(把交互作用看成因素)。对于本例,有?SA3.12528.125Se-34= =v= =3〃,A1i feeTOC\o"1-5"\h\z。 SAxB 3.125 -Saxb=3 =~\<28.125=Se,JAxB ,c SAxB 3.125 -SBc= = <28.125=S,oxv£ [ eJAxB 1故应该把Sa,Saxb,SbxC并入S,之中,得s/=se+sA+sAxB+sBxC=28.125+3.125+3.125+3.125=37.500,而相应的自由度为 f'=fe+fA+fAxB+fBxC=^剩下要检验的假设为“8,“c,”a*c,于是lSR/fR78.125/1Fb=- -= =8.33;S////37.500/4.Sc/fc703.125/1「…Fc=—; -= =75.00;Se/fe37.500/4尸Sa3,*c253.125/1、F.r= -= =27.00os//// 37.500/4查厂分布表,得尸y(加J「)的值为^i-o.oi(1,4)=21.2;K_(),o5(1,4)=7.71。把马,,尸C,FAxB与查得的Fj(/,*),//)值相比较,就可以得出各因素及各交互作用对试验结果影响是否显著的结论,见表(4)。表(4)例2的方差分析表方差来源平方和5自由度/均方和6产值显著性A3.12513.125B78.125178.1258.33*(AX8)A703.1251703.12575.00**AXC3.12513.125(BXC)A253.1251253.12527.00**E3.12513.125e28.125128.12537.50049.375山此知因素。及交互作用4XC对试验结果的影响是高度显著的,而因素6的影响显著。顺便指出,若用正交表)安排试验,对任意两个因素的交互作用4XB的自由度有Axb=/ax/B=(r—l)(r—1)o每一列的自由度为(r—1),故此时任何两个因素的交互作用都要在正交表L„(r,)上占用(r—1)列。例如,用2水平的正交表安排试验时,任何两个因素的交互作用占用(2—1)=1列;用3水平的正交表安排试验时,任何两个因素的交互作用占用(3—1)=2歹人下面考虑最优方案。令q,b,,c,.分别表示A.8,,G的效应,它们的计算公式(称为水平效应公式)为ai=KiA-y=-(Tk,a—t);n,—_1bi=KiB~y=-(rKiB——t);n-_1〃c产 —'=一任"—T)。n["%表示4与鸟的水平组合对试验结果的联合效应(也称总效应),它等于Aj与吗搭配条件下的均值与总均值之差。用(叭表示A,与Bj的水平组合对试验结果的交互效应,简称为A,与Bj的交互效应。在有交互作用的两个因素方差分析模型时,得到/=〃+%+凡+为,或写成为—〃=%+4+Ya。用我们现在的记号,这个式子就成为["%=《+鸟+(。%,或改写成(4”了=[。/?]“.一at—bjo可以用因素A与8的水平搭配表(也称A与8的二元表)来求出鸟(如果只求生,鸟),则用水平效应公式计算为简),从而易算得交互效应伍。),了。下面以因素A,8安排在表LK27)的第1,2歹U(从而AX8应占用第3歹口为例,来说明用二元表计算[必],了吗,句的方法(见表(5)).表(5)当KiAa.4Dif+y2Dl2=y3+y4j=l心一反口2尸治+”口22=丫7+y82Z£>2j=K”j=\K2A~yK,b£。.也/=!=K?bi=12 21=1j-lbi^«-yK2B-y表中。”为因素A,5取水平搭配从氏时所对应的试验结果之和。因为.等于4与当搭配条件下的均值与总均值之差(实际上这里计算出的是【。封,了的估计量或估计值),于是有["%=%一歹=<0厂y=J(22%—T)。Z o一般,若用表"(,)安排试验,则—„1„[ab]tj=Dtj—y=—(r~Djj—T),,其中,R,为A,吗搭配条件下各试验结果之和,及丁则为其平均值。在例2中,各交互作用中只有AXC是显著的,我们通过因素A与C的水平搭配表(二元表)来求米c]”。,“(见表(6)).表(6)例2的因素A,C的二元表GG%4Dii=J]+%=0-10=-10D12=y2+^4=5+0=5-5-0.625&021=y5+^7-15-15=-30D22=y6+y8=20+10=3000.625-4035T=-5Ci-9.3759.375于是,A,与C,的联合效应(总效应)为:_ _-10-5 — _5-5[ac]11=D11—y=^-——=—4.375;[ac]l2=D12—y=-——=3.125;[dc]2\=^2i-y=-一—~■=-14.375;[ac]22=^22-J -—^=15.625。再计算A与C.的交互效应(ac)..:(qc)u=[qc][]—%—C)=-4.375-(―0.625)一(—9.375)=5.625;(qc)]2=[〃c]]2—a\—c2=3.375—(—0.625)―9.375=一5.625;(〃c)2[=[ac]2i一a2一c\~-14.375—0.625-(-9.375)=一5.625;(〃c)22=[qc]22—a2—c2=15.625—0.625—9.375=5.625。注意,由于有2 2Z(a%=0,Z(a%=°i=l j=\因此,在水平数r=2时,只须求出(at%中的任一个,其它三个立即可以写出结果来。下面讨论有交互作用时,确定最优方案的方法,此时,可按以下四种情况分别处理(假定指标越大越好):(1)若因素A及交互作用AX8的影响显著,但因素8的影响不显著。则计算(ab)m=max{(a&)..},au=max{a,}及(ab)uv=max{(aZ?)uJ}。(若满足此条件的(ab)u或4不止一个,则凡满足此条件的都要进行下面的计算与比较,从中找出最大值用以确定最优水平组合。①若(ab')kl+ak>au+(ab)ui,,则优水平组合为AkB,②若(ab)kl+ak<au+(ab)uv,则优水平组合为AUBV③若(ab)kl+4=4+(")“,,,则优水平组合取A*B,或AUBV都可以。(2)若因素8及交互作用Ax8的影响均显著,但因素A的影响不显著,这种情况实质上就是情况(1),所以只需把情况(1)后面讨论中的A与8互换且。与b互换,便得到情况(2)的结论。(3)若交互作用AX8的影响显著,但因素A,8的影响均不显著,则选交互效应(ab%中最大者所对应的水平4Bj为优水平组合(若(ab%中最大者不止一个,则其中任一个皆可)。(4)若因素A,8及交互作用AXB的影响均显著,则选联合效应(ab%中最大者所对应的水平从鸟为优水平组合(若(ab%中最大者不止一个,则其中任一个皆可)。当然,如果交互作用AX8无显著影响,那就是属于无交互作用的情况,此时因素各自单独选优水平。如果讨论的问题是指标越小越好,那么把上述四种情况中的(ab%,[ab]ir/,鸟中的“最大”改为“最小”,“max”改为“min”,“>”改为“V”,便可得到指标越小越好时的最优水平组A口。在例2中,指标越小越好,由例2的方差分析知道,因素。及交互作用AXC的影响显著,但因素A的影响不显著,所以是属于情况(Do此时,有:}=(ac)]2=(QC)2i=—5.625;min{c-}=c.=9.375;1业2 1 1min{(QC)“}二(ac)2i=15.625。又有(ac)I2+c2=—5.625+9.375=3.750;(〃c)2]+C]=-5.625+(—9.375)=—15;(ac)21+C1=Cj+(ac)21=-15o比较上面算得的三个数值,以q+3c%为最小,因此,确定最优水平组合为4G。又由例2的方差分析表可以看出,因素5的影响显著,但交互作用4X3、6XC的影响均不显著,故因素B单独选优水平。由于K|b>K2b,因此因素3的优水平为82。综上所述,得到最优方案为A2%G,也就是正交表L8Q7)的第7号试验方案。第六章 多元数据的统计模型6.1多元数据在科研生产和社会实践中,我们的研究对象往往比较复杂,需要用多项指标对其进行描述与刻画。比如在嫦娥1号登月卫星的变轨过程中,我们会关注卫星的飞行速度、近地点高度,远地点高度、瞬态加速度增量、雷达及太阳帆板的朝向、卫星的姿态等多项参数。在对月观测中,我们也会观察月球的多项指标,形成大量的多元观测数据。在社会经济研究中,我们经常会同时关注国民生产总值、物价指数、消费指数、进出口贸易总额、劳动生产率等多项经济指标,也会面对大量的多元观测数据。对这些多元数据进行科学的分析和处理,可以为揭开月球的神秘面纱、揭示经济运行规律提供科学的分析平台。为了了解多元数据,我们以表6.1.1所示的多元抽样数据为例。在社会调查中经常会遇到类似的数据表。表6.1.1某小区居民情况抽样调查数据姓名X]性别年龄%3职业身高%5健康状况%6月收入X]颜色爱好%8黄玉梅女42教师1.65很好3800红田超男31工程师1.78较好2790黄张文逍男56公务员1.73一般4325黄王泰昊男48公务员1.81一般3978红郭放女22职员1.71较好2200XL.陈文韬男34工程师1.83很好3600AZ.叶珥女27教师1.61很好3000红杨学治男25职员1.69较差1800红在表6.1.1中,每个居民的状况有8项指标组成。根据指标度量特性的不同,通常可以把这些指标分为三种尺度:X|、*2、与、工8表明对象具有某种属性,称它们为名义尺度变量,这些变量没有量化,计算这些变量的均值方差没有什么实际意义,也无法对它们进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论