版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
均匀设计和均匀设计软件UniformDesignandit’sSoftware王玉方2003年6月16日报告的主要内容均匀设计的概念、特点、原理均匀设计的具体应用方法均匀设计软件关键词均匀设计
UniformDesign试验法
Experimentation均匀设计软件
UniformDesignSoftware1什么是均匀设计均匀设计的概念均匀设计的特点1.1均匀设计的概念
均匀设计(UniformDesign)是一种试验设计方法(ExperimentalDesignMethod),称为均匀设计(UniformDesign)或均匀设计试验法(UniformDesignExperimentation)。所有的试验设计方法本质上都是在试验的范围内给出挑选代表性点的方法,均匀设计也不例外,它是只考虑试验点在试验范围内均匀散布的一种试验设计方法。它由方开泰教授和数学家王元在1978年共同提出,是数论方法中的“伪蒙特卡罗方法”的一个应用。1.2均匀设计的特点
均匀设计遵从和具有试验设计方法的共性及本质内容,它能从全面试验点中挑选出部分代表性的试验点,这些试验点在试验范围内充分均衡分散,但仍能反映体系的主要特征。例如正交设计(OrthogonalDesign)是根据正交性来挑选代表点的,它在挑选代表点时有两个特点:均匀分散,整齐可比。“均匀分散”使试验点均衡地布在试验范围内,让每个试验点有充分的代表性,“整齐可比”使试验结果的分析十分方便,易于估计各因素的主效应和部分交互效应,从而可分析各因素对指标的影响大小和变化规律。但是,为了1.2均匀设计的特点(续1)照顾“整齐可比”,它的试验点并没有能做到充分“均匀分散”;为了达到“整齐可比”,试验点的数目就必须比较多(例如用正交表安排每因素为q个水平数的多因素试验,试验的次数为rq2,r为自然数)。均匀设计只考虑试验点在试验范围内充分“均匀散布”而不考虑“整齐可比”,因此它的试验布点的均匀性会比正交设计试验点的均匀性更好,使试验点具有更好的代表性。由于这种方法不再考虑正交设计中为“整齐可比”而设置的实验点,因而大大减少了试验次数,这是它与正交试验设计法1.2均匀设计的特点(续2)的最大不同之处。采用均匀设计,每个因素的每个水平仅做一次试验,当水平数增加时,试验数随水平数增加而增加,若采用正交设计,试验数则随水平数的平方数而增加。例如用正交设计需做961次5因素31水平的试验,采用均匀设计只需做31次试验,其效果基本相同。由于均匀设计不再考虑正交试验的整齐可比性,因此其试验结果的处理要采用回归分析方法—线性回归或多项式回归分析。回归分析中可对模型中因素进行回归显著性检验,根据因素偏回归平方和的大小确定该因素对回归的重要性;在各因素间无相关关系1.2均匀设计的特点(续3)时,因素偏回归平方和的大小也体现了它对试验指标影响的重要性。这些一般都要借助计算机才能完成。2均匀设计的原理均匀设计表和使用表各部分的含义均匀设计表的构造方法均匀设计表的使用表的产生方法混合水平均匀设计表的产生方法2.1均匀设计表和使用表各部分的含义均匀设计和正交设计相似,也是通过一套精心设计的表来进行试验设计的。均匀设计表用Un(qs)或Un*(qs)表示,其中U代表均匀设计,n代表要做的试验次数,q代表每个因素有q个水平,s代表该表有s列,有*和无*代表的是用两种不同类型的均匀设计表,*类型表是由Un+1类型的表构造形成的,后面再具体说明其形成方法。以下用均匀设计表U11(116)、U9*(94)和它们各自的使用表介绍一下表的各部分代表的意义(表中未用列已经删除):均匀设计表U11(116)和它的使用表均匀设计表U11(116)U11(116)的使用表1234561234567891011123571024610393694108481967510432661789573102548527139751821098641111111111111S列号D2150.163231450.2649413450.35285123450.428661234560.4942说明:设计表中的列代表的是各因素的水平,但具体代表的是哪个因素的水平,需按使用表确定,使用表s一栏的数字是试验的因素数,它后面的数字指定了各种因素数进行试验时该如何选择设计表的列;使用表中D栏代表不同因素数选择设计表的不同列时均匀设计的偏差,偏差越小,均匀性越好,试验成功的几率和结果的可靠性越大。均匀设计表U9*(94)和它的使用表均匀设计表U9*(94)U9*(94)的使用表1234123456789137924683917428655556824719384629731s列号D2120.157432340.19802.2均匀设计表的构造方法用好格子点法(GoodLatticePoint)构造均匀设计表的方法如下:(1)定义试验次数n,寻求比n小的整数h,且使n和h的最大公约数为1,符合这些条件的正整数组成一个向量h=(h1,…,hm);(2)均匀设计表的第j列由uij=ihj[modn](同余运算)产生,若jhi超过n,则用它减去n的一个适当的倍数,使差落在[1,n]之中。uij可以递推来生成:u1j=hj,ui+1,j=uij+hj(若uij+hj≤n)或者ui+1,j=uij+hj-n(若uij+hj>n),这里i=1,…,n-1。2.2均匀设计表的构造方法(续1)用上述方法生成的表记作Un(nm),例如n=11时,可以形成象前面介绍的U11(116)表。向量h称为该表的生成向量,可以将Un(nm)记成Un(h)。给定n,相应的h可以用上面的方法求得,从而m也就确定了,所以m是n的一个函数,称为欧拉函数,记为E(n)。这个函数告诉我们均匀设计表最多可能有多少列。根据数论结果可知:(1)当n为素数时,E(n-1)=n-1;(2)当n为素数幂时,即n可表示成n=pl,这里p为素数,l为正整数,E(n)=n(1-1/p),如n=9,可表为n=32,于是E(9)=9(1-1/3)=6,即U9最多可以有6列;(3)若n不属于上述两种情况,2.2均匀设计表的构造方法(续2)这时
n一定可以表示为不同数的方幂积,即:n=p1l1p2l2…psls,这里p1,…,ps
为不同的素数,l1,…,ls为正整数,这时E(n)=n(1-1/p1)…(1-1/ps),例如n=12可表为n=22×3,于是E(12)=12(1-1/2)(1-1/3)=4,即U12最多可能有4列。上述的三种情形中以n为素数时最好,最多可以有n-1列,非素数时表的结构中永远不可能有n-1列,比如E(6)=2,则最多只能安排两个试验因素,为此,王元和方开泰建议,用
Un+1
表划去最后一行构造形成新的Un*表,如U6*(66)可有6列之多。2.3均匀设计表的使用表的产生方法每个均匀设计表都规定了它的使用表,用于进行试验各因素水平组合的具体安排。这样做的原因是:从均匀设计表Un(nm)中选出
s列,
则可能的选择有(ms)种,
但不同列组合起来所代表的点集的均匀性是不同的,所设计试验的效果也是不同的,因而如何选用均匀设计表中的列必须引入一个判别表的均匀性好坏的准则。度量均匀性的准则很多,其中偏差(discrepancy)是使用历史最久、最为广泛接受的方法,均匀设计也同样采用偏差来衡量其设计表的均匀性,偏差越小,则设计表的均匀性越好。2.3均匀设计表的使用表的产生方法(续1)由于这个报告的目的是向大家介绍这种试验方法,而且关于偏差计算的内容也很多,因而关于均匀性偏差的计算方法和具体产生使用表的方法在此不做介绍(有特别需要者可以参见参考文献[1])使用者只需要按每个均匀设计表所附的使用表进行试验安排即可。比如,欲进行一个3因素、每因素13水平的试验,可以选用均匀设计表U13*(134),使用表中推荐的列为1,3,4,则所有13次试验时各因素的水平组合为:2.3均匀设计表的使用表的产生方法(续2)
均匀设计表U13*(134)和它的使用表及3因素时各次试验的因素水平组合方式12341234567891011121315911210483113546825113136212107777812249311110861211131912410613953S列号D2
130.09623
1340.14424
12340.2076试验次数序号因素1选用水平因素2选用水平因素3选用水平11911224833135448255131366121077778824991111010612111113912121061313532.4混合水平均匀设计表的产生方法上面介绍的是各试验因素水平数相等情况下的均匀设计表,若各因素的水平数不等,则需要采用混合水平的设计表进行试验设计。将均水平的设计表转换为混合水平的表的方法可采用常用的拟水平法。一个试验次数为n的设计表,试验因素中某个或几个因素的水平数不足n,为m(n必须为m的整数倍),则将设计表中代表该因素的水平合并,具体的合并方法是:设i为该试验因素的第i水平(i=1,2,…,n),将i从小到大分成m组,每组有n/m个i,用i所在的组的数值
m代替设计表中的
i,这样就形成了混合水平设计表混合水平的设计表的例子如下:2.4混合水平均匀设计表的产生方法(续1)
用U10*(108)产生3因素的U10(10×52)的过程
用U11构造U10→计算出U10中的3列→形成拟水平均匀设计表U10(10×52)
1234567891012345678910111234567891024681013579369147102584815926103751049382716617283941057310629518485210741963975311086421098765432111111111111111111111359123456789103596107945193431781010282765148621231234567891033565492315242174510142435128313均匀设计的应用方法试验设计的共性问题均匀设计的应用方法具体问题的解决方法3.1试验设计的共性问题试验设计(如正交试验设计、回归正交试验设计、旋转设计、D-最优设计等)过程必然离不开试验基础内容的构思(试验的评价指标;试验的因素、水平的选择和试验次数的拟定)、试验结果数据的分析等共性方面的问题。试验的因素和水平的选择关系到一个试验能否成功的关键,下列的注意事项和建议对使用试验设计(当然也包括均匀设计)的人员应该是有益的:3.1试验设计的共性问题(续1)(1)因素的含义:在一个试验过程中,影响试验指标的因素通常是很多的,通常固定的试验因素在试验方案中并不称为因素,只有变化的因素才称为因素;(2)关于因素数量:在一项试验中,因素不宜选得太多(如超过10个),那样可能会造成主次不分;相反地,因素也不宜选得太少(如只选定一、二个因素),这样可能会遗漏重要的因素,或遗漏因素间的交互作用,使试验的结果达不到预期的目的;3.1试验设计的共性问题(续2)(3)关于各因素的水平范围:试验水平范围应当尽可能大一点。如果试验在实验室进行,试验范围大比较容易实现;如果试验直接在生产中进行,则试验范围不宜太大,以防产生过多次品,或产生危险。试验范围太小的缺点是不易获得比已有条件有显著改善的结果;(4)关于因素的水平数:若试验水平范围允许大一些,则每一因素的水平个数最好适当多一些;3.1试验设计的共性问题(续3)(5)关于因素的水平间隔:水平间隔的大小和生产控制精度是密切相关的。如不切实际地降低试验的水平间隔,在试验范围确定了的情况下必然会引起试验次数的增加;而因素水平间隔太大,其试验结果的中不确定性成分也必然增加;(6)因素和水平的含意可以是广义的:例如五种棉花用于织同一种布,要比较不同棉花影响布的质量的效应,这时“棉花品种”可设定为一个因素,五种棉花就是该因素下的五个水平。3.2均匀设计的应用方法均匀设计的具体应用过程一般分以下六个步骤:(1)确定试验指标、因素、因素水平范围和因素水平数(这是关系到试验成功与否的关键);(2)选择合适的均匀设计表建立分次试验的具体因素水平组合;(3)执行分次试验并取得每次试验的指标值;3.2均匀设计的应用方法(续1)(4)用分次试验的指标值和取得该指标值的各因素水平值建立试验指标—各因素水平关系的回归模型(这也是均匀设计中的最重要的环节之一);(5)成功地建立了回归模型后在各试验因素的试验范围内寻找最佳的各因素水平组合并进行该组合的验证试验(也可和步骤6一起进行);(6)验证试验成功则进一步缩小各因素的试验范围,重新选择均匀设计表(即从步骤2开始)进行各因素范围缩小和水平划分更为细致的新的一轮的试验,进一步寻找最优试验条件组合。一般情况下,此次最优条件即为整个试验的最优条件,试验结束。3.3具体问题的解决方法试验次数问题设计表的选择回归模型建立回归模型优化试验参数优化使用均匀设计时需要注意的其它问题3.3.1试验次数问题均匀设计的最大特点是试验次数等于因素的最大水平数,而不是平方的关系,试验次数与被考察的因素的个数有关,建议试验次数选为因素数的3倍左右为宜,这样选择的均匀设计表的均匀性好,也有利于以后的建模和优化。3.3.2设计表的选择选择均匀设计表需要注意以下几点:(1)要满足试验次数的要求:即确定Un表n的问题,关于这一点,见前面的建议;(2)表的列数要满足试验因素数的要求:如U6(62)表和U6*(66)表,虽然
n值相同,可前者有2列,只能安排2因素试验,而后者最多却可以安排4因素试验。(3)Un*表比Un表有更好的均匀性,在确定了试验次数n的情况下,若Un*表也能满足因素数的要求,应优先采用Un*表:Un*表是由Un+1表划去最后一行3.3.2设计表的选择(续)得到的,若n为偶数,Un*表比Un表有更多的列,若n为奇数,则Un*表的列通常少于Un表。(4)Un*表比Un表更容易安排试验:
Un表的最后一行全部由n组成,而Un*表则不然。例如在化工反应中,若所有因素的水平都按一个方向排列,则在表的最后一行的所有因素的水平值不是最高就是最低,所有高水平组合很容易出现反应过分剧烈甚至爆炸,所有低水平组合则可能出现反应异常甚至不能进行的现象。3.3.3回归模型建立回归模型可分为线性回归模型和非线性模型等。
线性回归模型分为一元线性回归模型和多元线性回归模型。(1)一元线性回归模型模型为y=a+bx,线性相关的程度常用相关系数来衡量,在某一显著性水平α下,当相关系数的绝对值大于相关系数临界值时才可以认为x和y有线性相关关系。注意:回归模型不等于回归方程,回归方程只是回归模型中的表达方式的部分,一个完整的模型的表述,包括它的数学表达部分—回归方程,还有因素的组成、因素范围和置信水平、随机误差等内容,本文论述中为了直观的原因,可能将“回归方程”表述为“回归模型”。
线性回归模型(续)(2)多元线性回归模型当影响因变量y的自变量不止一个时,比如有m个x1,…,xm
这时y和x之间的线性回归方程为:y=a+b1x1+b2x2+,…,+bmxm,其回归显著性检验一般用F检验,方程中各项在回归中的重要性用该项的偏回归平方和进行判定。由于其回归系数的求解需要解用来确定回归系数的的方程组--正规方程,通常情况下仅此一项工作就导致分析过程中需要进行大量的计算,在方程项数很少的情况下还可以通过人工方式在可接受的时间内完成,否则一般都要借助计算机才能完成。
非线性回归模型一般分为二次型回归模型、多项式回归模型等。(1)二次型回归模型由于因素间常有交互作用,那么前面的回归模型就不足以反映实际,于是二次型回归模型常常为人们所采用。若有m个因素则二次型回归模型为:回归方程中的项数为m(m+3)/2,若使回归系数的估计成为可能,则需要试验次数n>1+m(m+3)/2,因此进入方程的变量必须经过筛选,如采用前进
非线性回归模型(续1)法、后退法、逐步回归法或最优子集法等进行变量的筛选。其回归系数求解可经过方程项的转换按多元线性回归的方法完成。(2)多项式回归模型一般地,包含多变量的任意多项式可表述为:可通过类似x1=Z1,x2=Z2,x3=Z12,x4=Z1Z2,x5=z22
的变换,将其按多元线性回归分析。多项式回归在回归分析中占特殊地位,因为任何函数至少在一
非线性回归模型(续2)个比较小的邻域内可用多项式任意逼近,因此在比较复杂的的实际问题中,可以不问y与各因素的确切关系如何,而采用多项式进行分析(一次多项式是多项式的特例)。在多项式回归模型中,常用的子模型结构如下:
非线性回归模型(续3)(1)对数(Logarithm):包括自然对数、常用对数和以n为底对数,数学表达式分别为Ln(x)、Lg(x)、Logn(x)[以下将“数学表达式”和“函数”类的语句省略](2)幂(Power):整数次幂、非整数次幂,xn(3)倒数(Reciprocal):1/x(4)三角函数(Trigonometricfunction)、反三角函数(Inversetrigonometricfunction)(涉及力学领域等常用,比如工件的切割、弹道轨迹等),包括有:正弦
Sin(X)、余弦
Cos(X)、正切
Tan(X)、余切
Cotan(X)、正割
Sec(X)、余割
Cosec(X)、双曲正弦
HSin(X)、双曲余弦
HCos(X)、双曲正切
HTan(X)、双曲余切
HCotan(X)、双曲正割
HSec(X)、双曲余割
HCosec(X)、反正弦
Arcsin(X)、反余弦
Arccos(X)、反正切
Atn(X)、反余切
Arccotan(X)、正割:Arcsec(X)、反余割:Arccosec(X)、反双曲正弦:HArcsin(X)、反双曲余弦:HArccos(X)、反双曲正切:HArctan(X)、反双曲余切:HArccotan(X)、反双曲正割:HArcsec(X)、反双曲余割:HArccosec(X)。(5)幂指数:anx
回归模型建立回归模型的建立过程在很大程度上需要结合专业知识和经验。虽然试验者正在用均匀设计研究的某个问题的未知因素很多,也可能有些问题是试验者全然不知道的(就象试验者在未建立回归模型前肯定不知道模型的具体形式一样),但试验者在试验中所采用具体试验实施操作肯定是和各种专业紧密相关的,只要试验者思考一下,哪个因素在什么时间、什么过程参加了什么反应,以及对试验的指标有何影响(有些时候可以比较明确地指出这个因素对试验指标的影响,而有些时候就不能断言),那么试验者只要寻着这样一个
回归模型建立(续1)思路考虑,肯定可以找出在模型中应该添加或不添加某个模型组成项的依据。下面用一个例子来说明建模的思路和过程:例子:为研究石墨炉原子吸收分光光度计法测定微量元素钯的工作条件,确定了灰化温度x1、灰化时间x2、原子化温度x3和原子化时间x4四个因素,其试验评价指标为吸光度。由原子化机理可知,灰化温度和原子化温度对吸光度的的影响可拟合为二次函数,即在模型中应该有x12和x32项,这两个因素发生在不同时间,因而不存在交互作
回归模型建立(续2)用,x1x3项可不列为考察目标。灰化时间和原子化时间对试验指标的影响比较复杂,也可用二次项逼近,忽略它们的交互作用,方程中应该有x22、x42项。因为还只是根据专业知识和经验进行推断,具体每个因素对结果的影响到底如何还属未知,那么,各因素的一次项理所当然也参加进方程中,这样就可以拟定出一个y=b0+b1x1+b2x2+b3x3+b4x4+b5x12+b6x22+b7x32+b8x42的原始的多项式回归模型。至于这个模型的表达效果到底如何,暂时可以不用理会,只是试验者
回归模型建立(续3)已经按照专业知识和经验拟定出一个有明确意义的回归模型了!接下来就是用多元回归分析的方法,进行模型的计算和按照一定的显著性水平对模型有效性及模型中各组成项的显著性进行检验的过程了,可以计算出原始模型的各回归系数分别为:b0=3.836×10-1;b1=1.001×10-5;b2=-3.324×10-3;b3=-3.529×10-4;b4=1.421×10-2;b5=-3.584×10-8;b6=4.034×10-5;b7=9.852×10-8;b8=-1.076×10-3。对模型进行回归显著性检验,其F检验值为66.620,临界值F0.05(8,3)=8.8452,高度显著性,复相关系数达到0.9972。3.3.4回归模型优化若对上面例子中列入回归方程中的项按某一显著性水平(本例中取α=0.05)逐个进行显著性检验,就可以发现,x1、x22、x3、x4及x42对回归无显著作用,将它们从模型中剔除,则可以确立如下的回归模型:y=b0+b1x2+b2x12+b3x22+b4x32回归系数分别为:b0=-5.35×10-2;b1=-3.05×10-3;b2=-3.14×10-8;b3=3.53×10-5;b4=3.42×10-8。对模型进行回归显著性检验,其F检验值为184.38,临界值F0.05(4,7)=4.1203,同样高度著,3.3.4回归模型优化(续1)复相关系数为0.9972。这样就成功地建立了一个去伪存真的精简的更能真实地表达因素和指标间关系的回归模型。观察上面的回归模型,我们还可以发现,原子化时间
x4这个试验因素在回归模型中没有出现,证明它是一个对试验指标影响不显著的因素,在后续的进一步的试验条件优化过程中,我们完全可以放弃对这个因素的观察,只将它保持在普通状态,使之成为一个静态的“因素”而将它从真正对试验起显著作用的行列中剔除,这样就减轻了3.3.4回归模型优化(续2)试验的负担,也进一步降低了试验的误差。若在其它试验中通过回归模型优化后同样发现了不显著因素,而它又是个实际消耗资源的因素,那么模型优化的意义则更加显著了。3.3.5试验参数优化建立了回归模型后,如何在试验范围内找到最好的试验因素组合?这就是所谓的参数优化(或称为试验优化)需要解决的问题了。需要补充说明的是,之所以是在试验范围内,是因为回归分析方法所建立的模型在试验范围内有效,不能说在扩大了范围的情况下它还是有效的(有时,根据具体情况做适当的外推是可以的,但也仅仅是限定在根据每个试验的具体情况,这是个经验,一般正式的学术方面的书籍或文献在论述这个问题时或不提倡外推或允许适度外推),否则外推则是在冒险。3.3.5试验参数优化(续1)
多元函数
f(x1,x2,x3,,,,xn)描述的是在多维空间中的一个响应面,求响应面极值的方法有很多,如间接的微分法、几何规划法、直接消去法、直接爬山法以及因素轮换法等,限于时间和篇幅,这里仅对微分法求函数极值进行简单的介绍,更详细的内容和其它方法见参考文献[5]或自行参考任何微积分或相关方面的书籍。若求得了函数的多个极值(极小值或极大值),那么将这些极值在函数的全域范围内进行比较,则可以得到我们想要的最大值或最小值,该极值点处各变量的值则是我们寻找的试验条件的最优值。3.3.5试验参数优化(续2)间接的微分法将寻求目标函数最优值的问题间接地归结为解它的一阶导数为零的方程组,即将函数按各自变量求一阶偏导数并使其等于零,解由此组成的方程组即可找到函数的极值点,将极值点的各变量值代入函数中即可求得函数极值(极值分极大值和极小值,但不对等于最大值或最小值),下面给出一个此方法的例子:3.3.5试验参数优化(续3)函数
y=1×103x1+4×109x1-1x2-1+2.5×105x2,其中0≤x1≤2200,0≤x2≤8。令函数关于x1和x2的两个一阶偏导数都为零,这样得到两个联立方程:解此联立方程,求得唯一的极值点,即得x1=1000,x2=4,
函数极值为y=3×106,
是极大值还是极小值呢?函数的限定条件是0≤x1≤2200,0≤x2≤8,3.3.5试验参数优化(续4)很明显,这几个系数都是正数,变量取值范围也都非负,而极值点的变量的值不是取各自的最大值,因此这个极值是极小值,因为函数在此区间上仅有一个极值点,所以这个极值点的值也是此函数区间上的最小值。这是最简单且快速的适合用手工方法求解函数极值的方法。关于求函数极值和试验最优条件的求解,许多已知的软件也可以做这方面的工作,比如MatLab(MatrixLaboratory)等等。上面介绍的是求函数极值的一种方法,当然,在实际中,任何均匀设计专门软件都可以将这个过程自动完成而不需要使用者自行通过类似的手工计算的方式求解试验最优条件。3.3.6使用均匀中需要注意的问题
最优条件在试验范围边界上的问题若试验优化后发现个别因素的最优条件在其试验范围的边界上,那么一般说来这是一个试验范围不足的信号,这一点,在初次大范围的试验结束并进行了首次试验优化后就应该发现,无论如何也不应该在全部试验都结束了才察觉到它,否则您找的最优试验条件则是真真正正的“局部最优”条件了。出现了这种现象,解决的办法一般是在进一步的试验中大力缩小该因素另外一端的范围而适
最优条件在试验范围边界上的问题(续)当加宽不足一边的试验范围。之所以是适当加宽,还是前面提到的模型适用范围的问题,因为进一步优化的基础是试验者承认了先前的那个试验范围条件下建立的模型,而偏偏个别因素最优值在边界上,实在是有进一步探询的必要。否定先前的模型是没有根据的,放弃模型不用更是不应该的,欲发现真正的最优试验条件,调整试验范围是必须的。F检验给出的显著性与否是判断回归模型是否有效的当然依据,一般情况下,回归平方和与剩余平方和的比值越大,则模型的可信度愈高,表现在复相关系数或相关系数上,R2
数值就越大(一元线性回归分析常用相关系数表述相关关系的大小,且R值可正可负),但是建模的过程中,我们不能简单地追求高的回归平方和与剩余平方和的比值(或大的R2
值),模型的建立一定要根据专业的知识进行,数理统计中一个重要的概念是自由度,若选进方程中的项过多,使误差自由度为1甚至为0,虽然R2
更加接近于1,模型看上去
模型好坏的判断标准的问题
模型好坏的判断标准的问题(续)很完美,但这时有关的结论的可靠性是很差的。一般应保持误差自由度(即剩余平方和自由度)≥5,这也就是为什么主张选用n值大一些的设计表进行设计或有前面的“试验次数选为因素数的3倍左右为宜”观点的原因了。以上是对均匀设计原理和应用方法等的简单介绍,大家只要按着这样的一条线索记忆就可以了:表的含义→安排试验→回归建模→参数寻优→继续试验→最优条件。因为均匀设计方法需要专门的计算机软件的支持,下面简要介绍一下均匀设计软件方面的内容。4均匀设计软件对均匀设计软件基本功能的要求均匀设计方面软件的介绍均匀设计软件功能的介绍4.1对均匀设计软件基本功能的要求1、遵循均匀设计基本原理,必须产生可见的能够用于指导试验者进行试验安排的均匀设计表;2、必须能对试验者的原始设计数据根据均匀设计表进行排列并产生供试验者进行试验的试验方案;3、程序必须具备回归模型建立和模型优化功能的模块;4、必须具备试验最优条件判定功能的模块。下面简单阐述一下这几个“必须”的理由:4.1对均匀设计软件功能的基本要求(续1)(1)之所以要求产生可见的均匀设计表,是便于用户对试验设计进行综合的考虑,对用户更加深入地理解均匀设计亦有好处;(2)作为均匀设计的软件,试验方案的建立必须在用户输入了原始设计数据后由系统自动生成,试验方案的输出可以是多样的,但在当前阶段,必须包括可以由打印机打印的输出方式;(3)均匀设计对试验数据的分析采用回归分析方法进行,而且用均匀设计方法设计的多是多因素、多水平的试验,其数据计算量非常巨大,这个工4.1对均匀设计软件功能的基本要求(续2)作必须由计算机完成。再者,均匀设计是一种通用的试验法,它的建模功能必须强劲,为适应多项式回归分析,其函数功能必须丰富,保证满足建立复杂和特殊模型的需求,这样才能满足各门类科学研究的需要;模型优化功能也是必需的,没有模型优化功能,用户所建模型的可信度就不好评价(主要是列入模型中的项和因为方程项的过多引入而导致误差自由度降低进而导致F检验结论的可靠性下降的问题)。4.1对均匀设计软件功能的基本要求(续3)(4)试验条件优化是给出最优试验条件的过程,在均匀设计专门软件中应该是必不可少的,软件应该具备根据回归模型自动给出试验范围内各因素的最优条件组合以获取最优试验指标的功能,不应该要求用户通过第三方软件或手工计算的方式来实现。4.2均匀设计方面软件的介绍根据几年来我对与均匀设计方面的有关软件的跟踪和调查,到目前为止,已知的这方面的专业软件有“均匀设计软件包(UST40)”,对于这个软件的前身,方开泰教授在其专著[1]中也曾经提过,该软件于1990年开始研制,1994年正式推出,作为均匀设计创始人之一的方开泰教授给这个软件以很高的评价,1994年4月4日的题词称其为“构思精巧,面向实际,菜单管理,方便使用。分析细腻,国内屈指,包装考究,水平国际”;1998年推出的UST4.0版本的均匀设计软件包是一个可在Windows95/98的MS-DOS环境下运行的中文软件,需要汉字辅助系统(如“成然CCDOS97”)的支持,“软件的主要功能有:均匀设计、数据输入、建立模型和参数优化四部分”。新增加功能有“在数据处理中增加了取对数和指数的变换”。4.2均匀
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度室内设计装修工程承包合同2篇
- 专题32【汇编】新八省期中读后续写通关16篇(满分攻略+八省名校模拟)【含答案解析】
- 二零二四年度版权购买合同:版权转让与支付条件
- 2024年度打桩机租赁合同(含租赁设备替换)
- 2024年度客户满意度调查与提升方案合同
- 海上集装箱运输合同三篇
- 池塘改造合同范本
- 2024年度体育馆铺砖施工合同
- 二零二四年度养殖场饲料供应合同
- 2024电商客户服务外包合同2篇
- 医院消防安全知识培训(30张)课件
- 林规发〔2016〕58号防护林造林工程投资估算指标
- 小学特教综合人教四年级上册目录它们都会跳(蔡倩双流特校)
- 肘关节及前臂解剖和手术入路示范课件
- 超星尔雅学习通【创业基础】章节测试附答案
- 全国河流水文站坐标
- 针灸治疗膝关节骨性关节炎PPT
- 消防中控室值班记录表(标准通用版)
- 五年级英语上册素材-Module 1课文翻译 外研版(一起点)
- 统编版小学语文一年级上册《比尾巴》预学单
- 富士施乐复印机扫描到PC设置方法
评论
0/150
提交评论