二水平正交饱和设计的统计分析_第1页
二水平正交饱和设计的统计分析_第2页
二水平正交饱和设计的统计分析_第3页
二水平正交饱和设计的统计分析_第4页
二水平正交饱和设计的统计分析_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

二水平正交饱和设计的统计分析

为了提高产品的质量和产量,我们需要进行不同的试验。然而在做具体的研究试验,特别是工业试验和医学试验时,由于经费、试验条件等方面的原因,做试验的次数受到很大程度的限制,无重复试验就变得很重要。一种广泛应用于筛选试验的设计是二水平正交饱和设计。1传统的统计模型水平正交表Ln(2m)(m=n-1)安排试验的饱和设计通常用如下的线性统计模型来描述:yi=m∑j=0βjχij+εi;i=1,2,⋯,n.(1)yi=∑j=0mβjχij+εi;i=1,2,⋯,n.(1)未知参β=(β0,β1,…,βm)T的最小二乘估计为:ˆβ=(∑ni-1xi0yin,∑ni-1xi1yin,⋯‚∑ni-1ximyin)Τ.(2)βˆ=(∑ni−1xi0yin,∑ni−1xi1yin,⋯‚∑ni−1ximyin)T.(2)且由高斯-马尔可夫定理知:ˆβ~Ν(βi,τ2),τ2=σ2n,j=0,1,2,⋯,m.(3)βˆ~N(βi,τ2),τ2=σ2n,j=0,1,2,⋯,m.(3)且ˆβ0,ˆβ1,⋯,ˆβmβˆ0,βˆ1,⋯,βˆm是相互独立的随机变量。对此饱和设计而言,模型(0-1)的总平方和SST与各列平方和SSj(j=1,…,m)之间满足:SST=SS1+…+SSm,SSj=(∑ni=1ximyi)2n=nˆβ2j,j=1,⋯,m.(4)其中,SST的自由度为n-1,SSj(j=1,…,m)的自由度为1。但由于不再有剩余的自由度可用于误差的估计。所以,无法再用通常的方差分析来对因子进行显著性检验。即:利用n个观测值y1,y2,…,yn借助某个方法来判断,在m个效应中哪些效应是显著的。即考虑如下的假设检验问题:Ηjo∶βj=0vsΗj1∶βj≠0‚j=1,2,⋯,m.(5)对二水平的正交饱和设计的分析方法,经过40多年众多学者的努力研究,至今己形成了丰富的内容,主要可分为图形法和数值分析法两大类。2已有方法回顾己有的方法有图形法和数值分析法。图形法中主要以半正态图法为重点,然而应用半正态图法简便直观,但结果不会很精确。人为因素很大,故在要求精确度较高时,一般应用数值分析法。数值分析法以Lenth方法,MaxUr法和零效应搜索法为典型。本文根据每种数值分析法的原理总结出各种方法的检验步骤如下。2.1Lenth检验的具体步骤(1)由(0-2)计算出所有效应的估计ˆβ0,ˆβ1,ˆβ2,⋯,ˆβm;(2)计算S0=1.5×(|ˆβj|‚j=1,2,⋯,m);(3)计算PSE=15×(计算的中位数);(4)计算SME=cα;m×PSE;(5)判断:|ˆβj|>SΜE的βj易相应的因子被认为是显著性因子。其中,临界值Cα;m可参见文献。2.2MaxUr检验显著性因子的步骤(1)根据专业知识和先验信息确定r的值,这里r是不等于o的βj个数的上界的一个估计量;(2)计算统计量MaxUr的值;其中:ΜaxUr=max1≤k≤r(u(k)).(6)u(k)=Fk,(m-k)[∑mj=m-k+1|ˆβ|2(j)/k∑m-kj=1|ˆβ|2(j)/(m-k)]=Fk,(m-k)[绝对值最大的k个ˆβj的均方绝对值最小的m-k个ˆβj的均方]‚k=1,2,⋯,r.(7)这里,|ˆβ|(1)≤|ˆβ|(2)≤⋯≤|ˆβ|(m)是|ˆβ1|,|ˆβ2|‚⋯,|ˆβm|次序统计量;(3)据给定的显著性水平α,确定临界值Cα;m,r;(4)若MaxUr>Cα;m,r,则拒绝H0并转第五步;否则接受H0。其中临界值Cα;m,r可在文献的附表中查得;(5)确定满足下式的k*,u(k*)=max1≤k≤r(u(k))并将k*个绝对值最大的ˆβj所对应的因子判定为显著的。2.3零效应搜索法的检验步骤(1)首先由观测值y1,…,yn利用(2)算得ˆβj,由(4)算得SSj(1≤j≤m);(2)计算Ws(3≤s≤m),Ws=Gs/σ4Μs/σ4=GsΜs.(8)Gs=1s-1s-1∑r=1Κr.(9)Κr=(rˆur+1;s+(s-r)ˆur;s-sˆur;s-1)2=(rξr+1+(s-r)ξr-s⋅12(ξr+1+ξr))2=(r-s2)2(ξr+1-ξr)2,r=1,2,⋯,s-1.(10)Μs=(ζ1+ζ2+⋯+ζ8s)2.(11)ξr=SSr;m,r=1,…,s是SSj(1≤j≤m)的次序计量SS1;m≤SS2;m≤…≤SSm;m的前s个平方和;(3)对给定的显著性水平α,我们可以按s由小到大的顺序比较每对Ws,Ws,α(3≤s≤m)的大小,若满足Ws>Ws,α的最小s=q+1,则零效应个数就是q;(4)利用tj=√nˆβj√SSe/q,j=jq+1,⋯,jn-1.(12)其中:SSe=SS1;m+…+SSq;m,其中自由度为q。进一步检验|tj|>t1-α/2(q),当时,拒绝Hj0,即认为βj是显著的非零效应。3本文解决的问题现在考虑一个基于L16(215)的二水平的正交饱和设计,共有15个因子,对应的模型为:y=β0+β1χ1+β2χ2+…+β15χ15+ε,其中ε~N(0,1),我们先用SAS的Rannor函数产生16个标准正态分布的随机数:ε1,ε2,…,ε16,记:ε=(ε1,ε2,…,ε16)T,再按上述模型得观测值向量y=(y1,y2,…,y16)T=(116,X)β+ε,假设其真实效应非零的因子是2个,5个,8个,12个时,我们分别用以上三种数值分析方法进行分析比较如下。假设其真实效应非零的因子是2个,分别是:β2=2,β3=7,而β0=β1=β4=…=β15=0上述模型的观测值向量y1~y16分别是:10.3118,8.3360,9.5410,11.0420‚-7.5608‚-8.0953‚-8.4466‚-9.3516,-5.8022‚-5.2951‚-4.3613‚-6.8486,4.8840,5.6832,5.0480,6.24763。另外各个效应的最小二乘估计ˆβj,j=1,2,⋯,15分别是:0.38881,1.78218,7.30344‚-0.02557,0.05143‚-0.20228‚-0.30739,0.11848,0.12082,0.18841‚-0.30897,0.03202,0.35627,0.02828,0.45263。(1)用Lenth方法分析。由(3)式可以求得:ˆΤ=ΡSE=0.282615,从而有ˆσ=16ˆΤ2=1.27794。又知C0.05;15=4.24,故SME=4.24×0.282615=1.19829。可见显著性水平为0.05时,可以判别显著因子为:因子2和因子3,与真实的显著性因子是一致的。ˆσ的估计很好;(2)用MaxUr方法分析。因为一般情况下,事先不知真实的非零效应个数的上界的值,故这里,取14,显著性水平取α=0.05,计算结果见表1。从表中可判断显著性因子有12个,分别是:因子3,2,15,1,13,11,7,6,10,9,8,5。由此可见在真实因子较少,而r取值较大时,用MaxUr方法判断出的显著性因子与真实的显著性因子的个数相去甚远。此时,用该方法犯第一类错误的几率很大;(3)用零效应搜索法检验。对其进行零效应搜索,在α取0.05时,零效应个数q=13。非零效应的个数为2,分别是因子2和因子3。再由t-统计量进行检验,注意到在显著性水平α=005下,t1-0.05/2(7)=2.365,观察可知,因子2,3的确是显著的。σ得到的σ=1估计为ˆσ=0.3560‚这是比较满意的。从此可见:在显著性因子稀少(占总效应个数的13.3%)时,应用Lenth方法和零效应搜索法的结果与实际情况相吻合。且对σ的估计也很好。而用MaxUr方法在:取值大时得到的显著因子与真实的显著因子的个数相差很大。故在真实效应较少时,不建议用MaxUr方法来判别显著性因子。当真实效应因子为5,8,12个时,应用同样的方法模拟100次分析所得的结果可得出如下结论:(1)Lenth方法适用于显著因子较少(不多于总因子数的40%)的场合,随着显著因子个数的增加,其检验效率逐渐降低。当显著性因子多于全部因子数的一半时,它常常无法检出任何显著性因子;(2)用Lenth方法中估计τ的PSE来估计δ2时,在显著因子较多的情况下,效果很差。用模拟100次的结果显示,当显著因子的个数小于总因子数的40%时,用Lenth的方法,能够有效地将显著因子判定出来,借助于PSE算出的ˆσ2的均值比较满意。但是当显著因子的个数多于总因子个数的一半时,用Lenth的方法凡乎不能选出任何显著因子,同时对应的ˆσ2的估计也特别大,均值达到73.7494,标准差达到37.9218。这也说明,Lenth方法能够有效的解决显著因子较少的2水平正交饱和设计问题,但是随着显著因子的增加,检验效率逐渐降低。当显著性因子多于全部因子数的一半时,它常常无法检出任何显著性因子。因此需要别的方法来解决。事实上,虽说在试验的筛选阶段效应稀疏原理经常是成立的,但又不是总是成立的。如果有太多的显著因子(比如说多于总因子个数的50%),大多数基于效应稀疏原理的直接的方法都会对误差的估计偏大(overestimate),从而导致将显著因子误判为非显著因子。如果遗漏了重要因子,将会导致优化过程中的失败,因此在试验的筛选阶段最重要的是要将所有的真正显著的因子找出来。这也说明在筛选阶段我们应该谨慎使用那些仅在效应稀疏原理假设下才适合使用的方法,一旦效应稀疏原理不再成立,大多数依赖于这一假设的方法将失去使用的价值。用MaxUr方法判断显著效应因子时,犯第二类错误的凡率很小,但是误将零效应因子判别为显著因子的概率很大。因而应用MaxUr方法只能找出显著性因子的大概范围,在要求确切的显著因子时,不能用此方法。况且通过模拟发现MaxUr方法在显著性因子的个数不大于11时,误判显著性因子为非显著性因子的概率很小。而在显著性因子不小于12时,检验效率很低,除非有一些显著性因子的真实值很大,否则基本上找不出任何显著性因子,这时误判显著性因子为非显著性因子的概率很大。对于零效应搜索法,模拟计算的结果显示,如果只是利用零效应搜索法来确定哪些效应是显著的,结果如下:有470次正好选出所有真正显著的因子,有165次误将一个不显著的因子判定为显著的,104次误判2个,60次误判3个,9次误判4个,7次误判5个,53次误判6个,42次误判7个,有3次会将显著的因子漏掉。为了更为精确的选出真正显著的因子,可以借助于本文提到的统计量进行改

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论