正交试验设计方法_第1页
正交试验设计方法_第2页
正交试验设计方法_第3页
正交试验设计方法_第4页
正交试验设计方法_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第5章 正交试验设计方法51 试验设计方法概述 试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。 例5-1 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验见表5-1。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。表5表51 因素水平水平因素温度压力Pa加碱量kg符号Tpm123T1 (80 )T2(100)T3(120) p1(5.0) p2(6.0) p3(7.0)m 1(2.0)m2(2.5)m3(3.0)很容

2、易想到的是全面搭配法方案如图5-1所示: 此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达3327次指数3代表3个因素,底数3代表每因素有3个水平。因素、水平数愈多,那么实验次数就愈多,例如,做一个6因素3水平的试验,就需36729次实验,显然难以做到。因此需要寻找一种适宜的试验设计方法。图5图51 全面搭配法方案试验指标:指作为试验研究过程的因变量,常为试验结果特征的量如得率、纯度等。例1的试验指标为合格产品的产量。因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。水平:指试验中因素所处的具体状态或情

3、况,又称为等级。如例1的温度有3个水平。温度用T表示,下标1、2、3表示因素的不同水平,分别记为T1、T2、T3。常用的试验设计方法有:正交试验设计法、均匀试验设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法等。可供选择的试验方法很多,各种试验设计方法都有其一定的特点。所面对的任务与要解决的问题不同,选择的试验设计方法也应有所不同。由于篇幅的限制,我们只讨论正交试验设计方法。52 正交试验设计方法的优点和特点用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:完成试验要求所需的实验次数少。数据点的分布很均匀。可用相应的极差分析方法、方差分析方法、回归分析方法等对

4、试验结果进行分析,引出许多有价值的结论。从例1可看出,采用全面搭配法方案,需做27次实验。那么采用简单比拟法方案又如何呢?先固定T1和p1,只改变m,观察因素m不同水平的影响,做了如图2-21所示的三次实验,发现 mm2时的实验效果最好好的用 表示,合格产品的产量最高,因此认为在后面的实验中因素m应取m2水平。图52 简单比拟法方案情案固定T1和m2,改变p的三次实验如图5-22所示,发现pp时的实验效果最好,因此认为因素p图52 简单比拟法方案情案 固定p和m2,改变T 的三次实验如图5-23所示,发现因素T 宜取T2水平。因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为T2pm2

5、。与全面搭配法方案相比,简单比拟法方案的优点是实验的次数少,只需做9次实验。但必须指出,简单比拟法方案的试验结果是不可靠的。因为,在改变m值或p值,或T值的三次实验中,说m2或p或T2 水平最好是有条件的。在T T,p p时,m2 水平不是最好的可能性是有的。在改变m的三次实验中,固定T T,p p 应该说也是可以的,是随意的,故在此方案中数据点的分布的均匀性是毫无保障的。用这种方法比拟条件好坏时,只是对单个的试验数据进行数值上的简单比拟,不能排除必然存在的试验数据误差的干扰。运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀,结论的可靠性较好。正交试验设计方法是

6、用正交表来安排试验的。对于例1适用的正交表是L934,其试验安排见表5-2。所有的正交表与L934正交表一样,都具有以下两个特点: 1 在每一列中,各个不同的数字出现的次数相同。在表L934中,每一列有三个水平,水平1、2、3都是各出现3次。 2 表中任意两列并列在一起形成假设干个数字对,不同数字对出现的次数也都相同。在表L934中,任意两列并列在一起形成的数字对共有9个:1,1,1,2,1,3,2,1,2,2,2,3,3,1,3,2,3,3,每一个数字对各出现一次。表52 试验安排表试验号列号1234因素温度压力Pa加碱量kg符号Tpm1234567891T11T11T12T22T22T23

7、T33T33T31p12p23p31p12p23p31p12p23p31m12m23m32m23m31m13m31m12m2123312231 这两个特点称为正交性。正是由于正交表具有上述特点,就保证了用正交表安排的试验方案中因素水平是均衡搭配的,数据点的分布是均匀的。因素、水平数愈多,运用正交试验设计方法,愈发能显示出它的优越性,如上述提到的6因素3水平试验,用全面搭配方案需729次,假设用正交表L27313来安排,那么只需做27次试验。在化工生产中, 因素之间常有交互作用。 如果上述的因素T的数值和水平发生变化时,试验指标随因素p变化的规律也发生变化,或反过来,因素p的数值和水平发生变化时

8、,试验指标随因素T变化的规律也发生变化。这种情况称为因素T、p间有交互作用,记为Tp 。3 正交表5.3.1 各列水平数均相同的正交表各列水平数均相同的正交表,也称单一水平正交表。这类正交表名称的写法举例如下:L 93 4正交表的列数每一列的水平数实验的次数正交表的代号 各列水平均为2的常用正交表有:L423,L827,L12211,L16215,L20L 93 4正交表的列数每一列的水平数实验的次数正交表的代号各列水平数均为3的常用正交表有:L934,L27313。各列水平数均为4的常用正交表有:L1645各列水平数均为3的常用正交表有:L25565.3.2 混合水平正交表L 8L 8412

9、42水平列的列数为44水平列的列数为1实验的次数正交表的代号 L 84124常简写为L 8424。此混合水平正交表含有1 个4水平列,4个2水平列,共有145列。5.3.3 选择正交表的根本原那么一般都是先确定试验的因素、水平和交互作用,后选择适用的L表。在确定因素的水平数时,主要因素宜多安排几个水平,次要因素可少安排几个水平。 1先看水平数。假设各因素全是2水平,就选用L(2)表;假设各因素全是3水平,就选L(3)表。假设各因素的水平数不相同,就选择适用的混合水平表。 2每一个交互作用在正交表中应占一列或二列。要看所选的正交表是否足够大,能否容纳得下所考虑的因素和交互作用。为了对试验结果进行

10、方差分析或回归分析,还必须至少留一个空白列,作为“误差列,在极差分析中要作为“其他因素列处理。 3要看试验精度的要求。假设要求高,那么宜取实验次数多的L表。 4假设试验费用很昂贵,或试验的经费很有限,或人力和时间都比拟紧张,那么不宜选实验次数太多的L表。 5按原来考虑的因素、水平和交互作用去选择正交表,假设无正好适用的正交表可选,简便且可行的方法是适当修改原定的水平数。6对某因素或某交互作用的影响是否确实存在没有把握的情况下,选择L表时常为该选大表还是选小表而犹豫。假设条件许可,应尽量选用大表,让影响存在的可能性较大的因素和交互作用各占适当的列。某因素或某交互作用的影响是否真的存在,留到方差分

11、析进行显著性检验时再做结论。这样既可以减少试验的工作量,又不致于漏掉重要的信息。5.3.4 正交表的表头设计所谓表头设计,就是确定试验所考虑的因素和交互作用,在正交表中该放在哪一列的问题。 1有交互作用时,表头设计那么必须严格地按规定办事。因篇幅限制,此处不讨论,请查阅有关书籍。2假设试验不考虑交互作用,那么表头设计可以是任意的。如在例5-1中,对L 93 4表头设计,表5-3所列的各种方案都是可用的。但是正交表的构造是组合数学问题,必须满足5.2中所述的特点。对试验之初不考虑交互作用而选用较大的正交表,空列较多时,最好仍与有交互作用时一样,按规定进行表头设计。只不过将有交互作用的列先视为空列

12、,待表5表53 L 93 4表头设计方案列 号1234方 案1234T空mppT空mmpT空空mpT54 正交试验的操作方法1分区组。对于一批试验,如果要使用几台不同的机器,或要使用几种原料来进行,为了防止机器或原料的不同而带来误差,从而干扰试验的分析,可在开始做实验之前,用L表中未排因素和交互作用的一个空白列来安排机器或原料。与此类似,假设试验指标的检验需要几个人或几台机器来做,为了消除不同人或仪器检验的水平不同给试验分析带来干扰,也可采用在L表中用一空白列来安排的方法。这样一种作法叫做分区组法。 2因素水平表排列顺序的随机化。如在例5-1中,每个因素的水平序号从小到大时,因素的数值总是按由

13、小到大或由大到小的顺序排列。按正交表做试验时,所有的1水平要碰在一起,而这种极端的情况有时是不希望出现的,有时也没有实际意义。因此在排列因素水平表时,最好不要简单地按因素数值由小到大或由大到小的顺序排列。从理论上讲,最好能使用一种叫做随机化的方法。所谓随机化就是采用抽签或查随机数值表的方法,来决定排列的别有顺序。 3试验进行的次序没必要完全按照正交表上试验号码的顺序。为减少试验中由于先后实验操作熟练的程度不匀带来的误差干扰,理论上推荐用抽签的方法来决定试验的次序。 4在确定每一个实验的实验条件时,只需考虑所确定的几个因素和分区组该如何取值,而不要其实也无法考虑交互作用列和误差列怎么办的问题。交

14、互作用列和误差列的取值问题由实验本身的客观规律来确定,它们对指标影响的大小在方差分析时给出。 5做实验时,要力求严格控制实验条件。这个问题在因素各水平下的数值差异不大时更为重要。例如,例5-1中的因素加碱量m的三个水平:m12.0,m2=2.5,m3=3.0,在以mm2=2.5为条件的某一个实验中,就必须严格认真地让m2=2.5。假设因为粗心和不负责任,造成m2=2.2或造成m2=3.0,那就将使整个试验失去正交试验设计方法的特点,使极差和方差分析方法的应用丧失了必要的前提条件,因而得不到正确的试验结果。55 正交试验结果分析方法 正交试验方法之所以能得到科技工作者的重视并在实践中得到广泛的应

15、用,其原因不仅在于能使试验的次数减少,而且能够用相应的方法对试验结果进行分析并引出许多有价值的结论。因此,有正交试验法进行实验,如果不对试验结果进行认真的分析,并引出应该引出的结论,那就失去用正交试验法的意义和价值。5.5.1 极差分析方法下面以表5-4为例讨论L423正交试验结果的极差分析方法。极差指的是各列中各水平对应的试验指标平均值的最大值与最小值之差。从表5-4的计算结果可知,用极差法分析正交试验结果可引出以下几个结论:1在试验范围内,各列对试验指标的影响从大到小的排队。某列的极差最大,表示该列的数值在试验范围内变化时,使试验指标数值的变化最大。所以各列对试验指标的影响从大到小的排队,

16、就是各列极差D的数值从大到小的排队。 2试验指标随各因素的变化趋势。为了能更直观地看到变化趋势,常将计算结果绘制成图。3使试验指标最好的适宜的操作条件适宜的因素水平搭配。 表 表54 L423正交试验计算 列 号123试验指标yi试验号123n4112212121221y1y2y3y4jjkjj/ kjj/ kj极差Dj1y1y21y3y4k121/ k11/ k1max -min 2y1y32y2y4k222/ k22/ k2max -min 3y1y43y2y3k323/ k33/ k3max -min 注:j第j列“1水平所对应的试验指标的数值之和;j第j列“2水平所对应的试验指标的数值

17、之和;kj第j列同一水平出现的次数。等于试验的次数n除以第j列的水平数。j/ kj第j列“1水平所对应的试验指标的平均值;j/ kj第j列“1水平所对应的试验指标的平均值;Dj第j列的极差。等于第j列各水平对应的试验指标平均值中的最大值减最小值,即 Djmaxj/ kj ,j/ kj , -min j/ kj ,j/ kj , 5.5.2 方差分析方法5.5.2.1 计算公式和工程试验指标的加和值,试验指标的平均值,以第j列为例:j“1水平所对应的试验指标的数值之和j“2水平所对应的试验指标的数值之和 kj 同一水平出现的次数。等于试验的次数除以第j列的水平数j/ kj“1水平所对应的试验指标

18、的平均值j/ kj“1水平所对应的试验指标的平均值 以上7项的计算方法同极差法见表5-4。 偏差平方和 fj 自由度。fj 第j列的水平数1。 Vj 方差。Vj Sj fj 。 Ve 误差列的方差。Ve Se fe 。式中,e为正交表的误差列。 Fj 方差之比 Fj Vj Ve 。 查F分布数值表F分布数值表请查阅有关参考书做显著性检验。 总的偏差平方和 总的偏差平方和等于各列的偏差平方和之和。即 式中,m为正交表的列数。 假设误差列由5个单列组成,那么误差列的偏差平方和Se等于5个单列的偏差平方和之和,即:Se Se1 Se2 Se3 Se4 Se5 ;也可用Se S总 S,来计算,其中S,

19、为安排有因素或交互作用的各列的偏差平方和之和。5.5.2.2 可引出的结论 与极差法相比,方差分析方法可以多引出一个结论:各列对试验指标的影响是否显著,在什么水平上显著。在数理统计上,这是一个很重要的问题。显著性检验强调试验在分析每列对指标影响中所起的作用。如果某列对指标影响不显著,那么,讨论试验指标随它的变化趋势是毫无意义的。因为在某列对指标的影响不显著时,即使从表中的数据可以看出该列水平变化时,对应的试验指标的数值与在以某种“规律发生变化,但那很可能是由于实验误差所致,将它作为客观规律是不可靠的。有了各列的显著性检验之后,最后应将影响不显著的交互作用列与原来的“误差列合并起来。组成新的“误

20、差列,重新检验各列的显著性。56 正交试验方法在化工原理实验中的应用举例例5-2为提高真空吸滤装置的生产能力,请用正交试验方法确定恒压过滤的最正确操作条件。其恒压过滤实验的方法、原始数据采集和过滤常数计算等见?过滤实验?局部。影响实验的主要因素和水平见表5-5a。表中p为过滤压强差;T为浆液温度;w为浆液质量分数;M为过滤介质材质属多孔陶瓷。 解:1试验指标确实定:恒压过滤常数Km2/s 2选正交表:根据表5-5a的因素和水平,可选用L 8424表。 3制定实验方案:按选定的正交表,应完成8次实验。实验方案见表5-5b。4实验结果:将所计算出的恒压过滤常数Km2/s列于表5-5b。 表5-5a

21、 过滤实验因素和水平因素压强差kPa温度质量分数过滤介质符号pTwM水平12342.943.924.905.88室温18室温1533稀约5%浓约10%G2* G3* 表2-5b正交试验的试验方案和实验结果列号j123456因素pTwMeKm2/s试验号水 平1234567811223344121212121212212112211221122121124.011042.931045.211045.551044.831041.021035.111041.101035指标K的极差分析和方差分析: 分析结果见表5-5c。以第2列为例说明计算过程: 4.011045.211044.831045.111

22、041.92103 2.931045.551041.021031.101032.97103 k24/ k21.9210-344.79104/ k22.9710347.42104 D27.42104 - 4.791042.63104 K4.88103 6.11104 S2k2/ k22k22/ k22 f2第二列的水平数1211V2S2f21.3810711.38107SeS5k55/ k52k55/ k52 fef51VeSefe1.0610911.06109F2 =V2Ve1.381071.06109130.2 查?F 分布数值表?可知:F0.01,f11,f214052 F2F0.05,f

23、11,f21161.4 F2F0.10,f11,f2139.9 F2F0.25,f11,f215.83 F2 其中:f1 为分子的自由度,f2 分母的自由度 所以第二列对试验指标的影响在0.10水平上显著。其他列的计算结果见表2-5c。表55c K的极差分析和方差分析列号j123456因素pTwMeKm2/s工程jjjjkjj/ kjj/ kjj/ kjj/ kjDjSjfjVjFjF0.01F0.05F0.10F0.25显著性6.941041.081031.501031.6110323.471045.381047.521048.061034.591042.6510738.8410883.65

24、403215.753.68.202*(0.10)1.921032.9710344.791047.421042.631041.3810711.38107130.24052161.439.95.832*(0.10)3.041031.8410347.611044.611043.001041.8010711.80107170.14052161.439.95.833*(0.05)2.541032.3510346.351045.861044.851054.7010914.701094.444052161.439.95.830*(0.25)2.491032.4010346.221045.991042.301

25、051.061091.061091.00K4.88103m2/s6.11104m2/s 6由极差分析结果引出的结论:请同学们自己分析。 7由方差分析结果引出的结论。 第1、2列上的因素 p、T 在0.10水平上显著;第3列上的因素w在0.05水平上显著;第4列上的因素M 在0.25水平上仍不显著。 各因素、水平对K的影响变化趋势见图5-3。图5-3是用表5-5a的水平、因素和表5-5c的j/ kj 、j/ kj 、j/ kj 、j/ k值来标绘的。从图中可看出: A过滤压强差增大,K值增大; B过滤温度增大,K值增大; C过滤浓度增大,K值减小; D过滤介质由1水平变为2水平,多孔陶瓷微孔直径

26、减小, K值减小。因为第4列对K值的影响在0.25水平上不显著,所以此变化趋势是不可信的。 图53 指标随因素的变化趋势 适宜操作条件确实定。由恒压过滤速率议程式可知,试验指标图53 指标随因素的变化趋势 过滤压强差为4水平,5.88kPa 过滤温度为2水平,33 过滤浆液浓度为1水平,稀滤液 过滤介质为1水平或2水平这是因为第4列对K值的影响在0.25水平上不显著。为此可优先选择价格廉价或容易得到者。上述条件恰好是正交表中第8个试验号。4.2 均匀试验设计方法上节讲的正交试验设计法,是一种优异的试验设计方法,其优点之一是实验的次数少。但假设考察的因素数和水平数较多,特别是水平数较多时,正交试

27、验设计法的实验次数仍然很多。例如要考察5个因素的影响,每个因素有5个水平。用因素水平全面搭配方法做试验,需做55=3125次实验;用正交表安排实验,至少要进行25次实验,实验工作量仍然不少。这时正交试验设计方法的实验次数之所以不能减至更少,是因为在正交试验设计方法中,为了简化数据处理,同时考虑了试验的均衡分散性和整齐可比性,每一列中,同一水平至少出现2次。如果不考虑试验数据的整齐可比性,只考虑让数据点在试验范围内均匀分散,那么将实验次数减少至比正交试验设计方法更少还是有可能的。这种单纯地从数据点分布均匀性出发的试验设计方法,称为均匀试验设计方法。我国数学家方开泰应用数论方法构思,在我国首先提出

28、了均匀试验设计方法。均匀试验设计方法是用“均匀设计表来安排试验,常用的均匀设计表见本书附录10。均匀设计表名称的表示方法及其意义如下:4.2.1 均匀试验设计方法的特点与正交试验设计方法相比,均匀试验设计方法的特点是:1试验工作量更少,这是均匀试验设计的一个突出的优点。如要考察4个因素的影响,每个因素5个水平。假设用正交试验设计法,宜用正交表L2556,需做25次实验。假设用均匀试验设计方法,可用表4-22所示的“均匀设计表U554来安排试验,只需进行5次试验,比正交试验设计法的实验工作量少得多。实验次数明显减少的主要原因是均匀试验设计表有一个特点:在表的每一列中,每一个水平必出现且只出现一次

29、。表4-22 均匀试验设计表U554列号1234试验号1123422413331424432155555表4-23 U996均匀设计表列号123456试验号112457822481573363636448721555127846636363775184288754219999999表4-24 U996表的使用表因素数列 号234561,31,3,51,2,3,51,2,3,4,51,2,3,4,5,62在正交试验设计表中各列的地位是平等的,因此无交互作用时,各因素安排在任一列是允许的。均匀设计表那么不同,表中各列的地位不一定是平等的,因此,因素安排在表中的哪一列不是随意的,需根据试验中要考察的

30、实际因素数,依照附在每一个均匀设计表后的“使用表来确定因素应该放在哪几列。例如为了使用均匀设计表U996见表4-23根据U996表的使用表见表4-24得知,当因素数为2时,可安排在第1、3列上。为说明这样做的必要性,可将因素的x1、x2水平号码分别作为横坐标和纵坐标,按U996均匀设计表的安排,画出2因素分别放在第1、3列,放在第1、2列,放在第1、6列时的 数据点的分布图,见图4-9。以上三个图,数据点分布的均匀性哪个图最好?哪个图最差?为此,首先应该就数据点分布的均匀性问题定出一个评价的方法。一般可用以下方法来评价:令二因素x1、x2的数据点分布图的坐标原点处,x1、x2的水平号码的数值均

31、为零。找出整个图形的中心点O。过中心点O,作水平线BF,作垂直线DH,作斜率为+1的直线AE,作斜率为-1的直线CG。数据点的分布是否均匀,应从BF、DH、AE、CG 4个方向上看。假设在4个方向上,数据点都能沿着该方向均匀地分布,既不集中于该方向的前部、中部也不集中于该方向的后部,那么即可认为数据点分布的均匀性很好。如图4-9中的a和(b),在4个方向上数据点的分布都比拟均匀,因此,对应的试验安排都是可取的。即按U996表的使用表,将2因素放在第1、3列上是可以的,但假设改将2因素放在第1、2列上也是可以的。在图4-9c中,在AE方向上,几乎全部的数据点都集中于该方向的中部,该方向前部、后部

32、的数据点数分别为1和0,数据点分布的均匀性极差,显然,将2因素放在第1、6列是不可取的。3试验设计表之间的关系。附录10中只给出了试验次数和水平数为奇数的表,如U554,U776,U996,U313130。如果试验次数为偶数,将试验次数为奇数的表划去最后一行就得到比它次数少1的偶数表,而“使用表不变。如将表U776划去最后一行即可得到U666,“使用表不变。4因为均匀设计表无整齐可比性,故在均匀试验设计中不能像正交试验那样,用方差分析方法处理数据,而需用回归分析方法来处理试验数据,也正因为处理数据用的是回归分析方法,所以在试验次数为奇数时,均匀设计表最后一行的存在,虽然对数据点分布的均匀性不利

33、,但其不良后果可以被忽略。5在正交试验中,水平数增加时,试验次数按平方的比例增加,如水平数从9增加到10时,试验次数那么从81增加到100。在均匀试验设计中,随着水平数的增加,试验次数只有少量的增加,如水平从9增加到10时,试验次数也从9增加到10。这也是均匀试验设计的一个很大的优点。一般认为,当因素的水平数大于5时,就宜选择均匀试验设计方法。优选法,是以数学原理为指导,用最可能少的试验次数,尽快找到生产和科学实验中最优方案的一种科学试验的方法。例如:在现代体育实践的科学实验中,怎样选取最适宜的配方、配比;寻找最好的操作和工艺条件;找出产品的最合理的设计参数,使产品的质量最好,产量最多,或在一

34、定条件下使本钱最低,消耗原料最少,生产周期最短等。把这种最适宜、最好、最合理的方案,一般总称为最优;把选取最适宜的配方、配比,寻找最好的操作和工艺条件,给出产品最合理的设计参数,叫做优选。也就是根据问题的性质在一定条件下选取最优方案。最简单的最优化问题是极值问题,这样问题用微分学的知识即可解决。 实际工作中的优选问题 ,即最优化问题,大体上有两类:一类是求函数的极值;另一类是求泛函的极值。如果目标函数有明显的表达式,一般可用微分法、变分法、极大值原理或动态规划等分析方法求解间接选优;如果目标函数的表达式过于复杂或根本没有明显的表达式,那么可用数值方法或试验最优化等直接方法求解直接选优。 优选法

35、优选法是尽可能少做试验,尽快地找到生产和科研的最优方案的方法,优选法的应用在我国从70年代初开始,首先由我们数学家华罗庚等推广并大量应用,优选法也叫最优化方法。 编辑本段优选法的优点怎样用较少的试验次数,打出最适宜的训练量,这就是优选法所要研究的问题。应用这种方法安排试验,在不增加设备、投资、人力和器材的条件下,可以缩短时间、提高质量,到达增强体质迅速提高运动成绩的目的。 编辑本段优选法根本步骤1选定优化判据试验指标,确定影响因素,优选数据是用来判断优选程度的依据。 2优化判据与影响因素直接的关系称为目标函数。 3优化计算。优化(选试验方法一般分为两类: 分析法:同步试验法 黑箱法:循序试验法

36、 编辑本段优选法的分类优选法分为单因素方法和多因素方法两类。单因素方法有平分法、0.618法(黄金分割法)、分数法、分批试验法等;多因素方法很多但在理论上都不完备主要有降维法、爬山法、单纯形调优胜。随机试验法、试验设计法等。优选法已在体育领域得到广泛应用。 1.单因素优选法 如果在试验时,只考虑一个对目标影响最大的因素,其它因素尽量保持不变,那么称为单因素问题。一般步骤: 1首先应估计包含最优点的试验范围,如果用a表示下限,b表示上限,试验范围为a,b; 2然后将试验结果和因素取值的关系写成数学表达式,不能写出表达式时,就要确定评定结果好坏的方法。 2.多因素优选法 多因素问题:首先对各个因素

37、进行分析,找出主要因素,略去次要因素,划“多为“少,以利于解决问题。4.3.3 回归正交设计法所谓回归的正交设计,就是通过安排一个合理的正交试验,以建立相应的回归模型,借以进行统计分析,按多项式回归模型的次数可分为一次回归的正交设计和二次回归的正交设计。但常用的是一次回归的正交设计,在此作简单介绍。一次回归的正交设计主要运用二水平正交表安排实验,在安排实验时,要对每个因素水平进行编码,即对因素水平的取值做如下线性变换:(4-34)其中:称为因素的零水平称为因素的变化区间由此建立了Z与x (=1,2m)的对应关系: Zj=Zj1与xj=1相对应;Zj=Zj2与xj=+1相对应。由此知,编码前,因

38、素水平值在区间Z1, Z2内变化,经编码之后,编码值xi在区间-1,+1间变化,将响应值y原来对Z1, Z2Zm的回归问题,转化为y对x1,x2xm的回归问题,只需在编码空间选择试验点进行回归设计。经编码之后,所有因素的上水平Zi1,和下水平Z2的取值分别变成了-1和1,那么在任意二水平正交表中因素的1水平取值仍为1,2水平取值为-1。这样就把普遍的二水平正交表的改造为用于回归正交设计的正交表了见表4-32。经编码改造后的正交表仍具有正交性。即 表4-32 给出了用于回归正交设计的二水平正交表L827因素符号x1x2x3x1 x2x1 x3x2x3x1 x2 x3试验号11111111211-

39、11-1-1-131-11-11-1-141-1-1-1-1115-111-1-11-16-11-1-11-117-1-111-1-118-1-1-1111-1注:如果为估计常数项可在表的最前面加上x0列,取值均为+1。用改造后的正交表安排试验,使试验数据的统计分析具有一定的优越性质。经编码之后,所有因素的取值均是-1和1,它们在所研究的区域内是平等的,使所求的回归系数不受各因素的单位与取值的影响,回归系数的大小,直接反映了该因素影响的大小,回归系数的符号反映了因素影响的性质,而且正交表中因素之间的交互作用列,可直接用表中相应列的对应元素相乘来得到,非常方便。由回归式可以确立各因素水平之间的最

40、优搭配。假定目标函数y与个变量x1、x2xm的内在联系,可用一次关系描述,其一般形式为:4-35其中 为待估计的常数, 是第i次试验的误差通过n次试验所得数据计算出来的方程为:4-36为了方便把式4-35中回归系数估计的计算过程列表见表4-33和,相应的方差分析列于表4-34。表4-33 一次正交回归设计的计算表试验号x0 x1x2xmyi11x11x12x1my121x21x22x2my231x31x32x3my3n1xn1xn2xnmynBjbj= Bj/nB0/nB1/nB2/nBm/n Pj= bjBjP0P1P2Pm表4-34 一次回归正交设计的方差分析名称平方和自由度方差估计值方差

41、比Fx11P1x21P2xmPm回归M剩余n-m-1总和n-1上述回归方程的检验,只相对于剩余方差余估计值而言,并不能保证在被研究的区域内回归方程与实测值是否拟合得很好,为了检验回归方程的拟合程度,必须在零水平Z01,Z02,Z0m,上再安排假设干次重复试验4.3.4 序贯试验设计1 选择试验点位置的意义举两个简单例子说明之。例如,在估计废水生化耗氧量模型 中的参数 , 。由于 ,说明在反响的前期,参数 和 相关密切。所以,如在 的小范围内进行试验,就难以得到准确的 和 ,因为 的任何偏差都会由于 的变化而补偿,因此这个试验必须在较大时间范围内进行才可靠。又比方,在模型筛选中,要用试验来区分反

42、响是按 进行,还是按 进行。根据这两种历程的反响动力学特征,B的浓度与时间 的关系由图4-12中两条示意曲线表示。要区分这两种不同反响机理所确定的数学模型,就应该在反响后期测定B的浓度变化情况来加以区分,完全没有必要在均匀时间间隔内进行试验。如果用反响前期取得的数据来判别,那么更是徒劳的,这就是模型筛选的试验设计目的。这两个例子说明,不同试验向人们提供的信息是不同的,试验点位置取得不好,即使试验数据点在多,数据计算再准确,也无法到达预期的目的。当然,对于上面这种简单情况,可以根据一定的专业知识通过定性分析来确定恰当的试验点。然而,对复杂模型,尤其是多因素模型就很难靠定性分析确定试验点,而必须借

43、助某种手段加以确定。目前已有很多种试验设计方法,只是各种方法由各自的目的和出发点。比方4.1节介绍的正交试验设计法的特点是在等概率条件下,比拟各变量对指标的影响,即运用方差分析方法将变量变化对观测量的影响与试验误差的影响加以分析比拟;检查它的显著性程度来确定该变量是否重要。如果主要是对几个数学模型进行鉴别或目的是为了参数估计,宜用序贯试验设计法。2 序贯试验设计的特点传统的试验设计方法都是一次完成试验安排。在这些试验全部完成以后再进行分析整理,显然“先试验,后整理的工作是不尽合理的。一个成熟的试验工作者总是不断地从试验中获得信息,结合专业知识进行判断,试验过程是研究者对研究对象逐步认识的过程。

44、因此,试验方案不断改变,试验方案不断修正是正常的。“边试验,边整理才是一个合理的试验设计方法,这样的试验设计方法称为序贯试验设计。1959年以来,G.E.P.Box等建立了以数学模型参数估计和模型筛选为目的的序贯试验设计方法。这个方法的特点是先做少数几个初步选定的试验,以获得初步信息,丰富试验者对过程的认识,然后在此根底上作出判断,以确定和指导后续试验的条件和试验点的位置。这样,信息在过程中有交流,反响,因此能最大限度地利用已进行的试验所提供的信息,使后续的试验安排在此刻最优的条件下进行,这就是序贯设计的整个思想,如图4-13所示。它通过一系列的计算公式、逻辑判断,并均在计算机上执行,因此也称

45、这样的试验设计为计算机在线试验设计法。当今,在计算机已广泛应用的时代里,这类试验设计法在科研和试验中理应得到推广应用。符号表英文字母: 因素 回归系数 因素 因素C 矩阵代号 因素;极差 正交表中误差列er 相对偏差 因素f 自由度fe 试验误差的自由度fj 正交表第j 列因素的自由度 方差比j 正交表第j 列因素的F值min 的最小值 正交表上列的序号j 正交表第列因素同一水平出现的次数lij 变量 正交表的代号L 矩阵代号 正交表的列数;变量个数 试验的次数 偏回归平方和 复相关系数 剩余标准差 总的偏差平方和;离差平方和 因素的偏差平方和 正交表第列因素的偏差平方和e 试验误差的偏差平方

46、和 均匀设计表的代号e 试验误差列的方差 正交表第列因素的方差;回归式中各项方差x 因素 平均值 因素希腊字母: 显著性水平;步长 误差代号下标: 误差, 第或个变量 第次试验 min 最小max 最大1,2,3, 因素序号第三十三章 第一节 诊断试验2005-8-2 0:0【大 中 小】第三十三章诊断试验和筛检试验提要疾病诊断研究的现状,诊断试验的研究方法和评价指标;提高诊断试验效率的方法。筛检意义及其应用。案例一批成年男性准备参加运动锻炼来医院作体格检查。其中195例过去曾有心前区疼痛史,经冠状动脉造影与运动心电图试验检查获如下结果:在104例显示冠状动脉狭窄75%者中,运动心电图试验阳性

47、为55例,阴性为49例。未显示冠状动脉狭窄的91例中,运动心电图试验阳性为7例,阴性为84例。请说明心电图运动试验对诊断冠状动脉狭窄的意义。第一节诊断试验一、概述正确的诊断在临床工作中意义重大,它是选择针对性防治措施的根底。临床医师应当研究和掌握现有诊断试验的特性和临床价值,以指导临床应用。随着自然科学的进展,新的诊断试验日益增多。为了提高诊断水平,应研究和评价这些新的诊断试验,以确定其能否取代或充实现有的诊断方法和能否推广。本章所讨论的诊断试验含义是广泛的,它包括各种化验室检查,询问病史,体检所获得的资料以及各种影像诊断和仪器诊断等。诊断试验主要应用于疾病诊断、疾病随访、疗效考核以及药物毒副

48、作用的监测。根据不同的目的选择适当的诊断试验。一般说来,临床医师经过一定期限的临床实践以后,都积累了选择诊断试验的经验。但单凭经验难免不够稳妥,有时可以耽误诊断,未能给患者及时有效的治疗,甚至造成不可弥补的损失。掌握科学的研究和评价诊断试验的方法可为其选择合理的诊断方法奠定根底,同时可防止单凭经验造成的错误。一般说来,临床医师须在较长时间内屡次使用某项诊断方法,而且在患同种疾病但不同类型的病例身上使用前方可对其性质和实用价值有较深入的理解。掌握科学的研究方法就可缩短上述过程。从文献中人们不难看到,当推出一项新诊断试验时,研究人员对该项试验倍加称赞,但使用一段时间后,发现其诊断价值并不理想,因此

49、只有不断地积累经验,才能对它有较全面的认识。如开始在临床上应用癌胚抗原时,人们认为它诊断结肠癌非常有价值,但后来发现这种抗原在其他癌症也会出现,甚至在近20%未患癌症的吸烟者中也呈阳性。应当说,开始在临床上应用时,研究人员并非有意夸大其效率,而是在当时缺乏科学的研究和评价方法。二、诊断试验的研究方法和评价指标一诊断试验的研究方法1.须同标准诊断方法金标准,gold standard进行盲法比拟。标准诊断方法是指可靠的,公认的诊断方法,它能正确地区分有病和无病。临床上常用的标准诊断方法包括病理学检查,外科手术所见以及长期随访病例所获得的肯定结论。例如,诊断冠心病的标准诊断方法是冠状动脉造影,诊断

50、肾炎的标准方法是肾组织活检和尸体解剖,诊断胆结石的标准方法是手术所见。具体作法是运用标准诊断方法,在“盲的条件下将病例区分为实际有病和无病两组,再将待评价的诊断试验与相同病例诊断的结果作比拟,然后列出四格表,就可得出真假阳性和真假阴性的结果,如表33-1所示,并计算灵敏度、特异度、预测值和正确指数等。表33-1 诊断试验评价指标金标准有病D+无病D-诊断阳性T+真阳性TP假阳性FPTP+FP阴性T-假阴性FN真阴性TNFN+TN合计TP+FNFP+TNTP+FP+FN+TNTNtrue negative=真阴性FPfalse positive=假阳性TPtrue positive=真阳性FNf

51、alse negative=假阴性如选用标准诊断方法欠妥,那么可造成四格表分类上的错误,影响诊断试验的评价。例如以外科手术诊断胆结石作为标准诊断方法,来评价超声图诊断胆结石的诊断价值时,可以得出结论。但假设以胆囊造影作为标准方法进行比拟时,就难以断定检出结果的真伪。在难以得到标准诊断方法时,医师们常将新推出的诊断试验与现有的诊断方法比拟。此时假设新试验比拟灵敏,检出的病例就多一些,如以现有方法作为标准,那么将新试验多检出的病例错判为假阳性。同样,假设新试验更特异,那么错判为假阴性的病例将增加。但获得一项标准诊断方法并非易事。如以检查组织贮存铁是否缺乏作为诊断铁缺乏的标准诊断方法,这就要作肝穿刺

52、或骨髓活检,再行铁染色检查。这种检查方法甚至在某些贫血病例也难以做到。因此,不少医师将铁剂治疗反响作为标准诊断方法。尚有一些病,如糖尿病,其标准诊断方法甚难确定。为了防止外界环境因素干扰评价工作,要求待评价的诊断试验与标准方法在同一时间和同一化验室内进行比拟。此外,为了减少或防止偏倚,检验人员在评价时应实施盲法原那么,即他们在不了解病例临床表现情况下进行比拟。2.被检查的病例要具备代表性,即要包括各临床型轻、中、重型;有或无并发症者病例。病例的代表性愈好,新的诊断试验的实用价值愈大。3.选择对照。对照应在性别、年龄、某些生理状态等方面与病例保持均衡。对照不应只包括健康人,还应包括确实未患该病的

53、其他病例以及确实未患该病但在临床上极易与该病混淆的其他病病例。4.确定正常值。正常值的含义应说清,否那么会直接影响正常值的数据。在正态分布时,正常值可用平均数2SD表示。非正态分布时可用中位数或百分位数表示。绘制患病人群与未患人群诊断试验测定值的频数分布曲线时常有重叠。区别正常与异常的界限是否是最正确的临界点,将对诊断试验的灵敏度和特异度产生明显的影响。5.要说明病例的来源。不同来源的病例对评价一项诊断试验有一定影响。这是由于不同人群某病患病率的差异对阳性预测值有影响。同时,对照的来源也应效待清楚。二诊断试验的评价指标1.真实性validity或准确性accuracy要求一项诊断试验具备能正确

54、地鉴别某病例患和未患某病的能力。这种反映患病实际情况的程度称作真实性,亦称准确性。一项诊断试验与标准诊断方法进行比拟时可得出四种结果表33-1。正确结果,即真病例得出阳性结果真阳性和非病例得出阴性结果真阴性;错误结果,即真病例得出阴性结果假阴性和非病例得出阳性结果假阳性。一项诊断试验得出的正确结果愈多,该试验的真实性也愈高。一项诊断试验的真实性包括灵敏度sensitivity和特异度specificity两方面。前者是指一项诊断试验能将实际患病的病例正确地判断为患某病的能力,后者是指一项诊断试验能将实际未患某病的病例正确地判断为未患某病的能力。灵敏度即真阳性率,为诊断试验阳性的患者占患者总数比

55、例,理想的应为100%.特异度即真阴性率,为诊断试验阴性非患者占无病总人数的比例,理想的应为100%.假阴性率为实际患病,经诊断试验判断为无病的百分率,即诊断试验判断为阴性的患者占患者总数的比例,又称漏诊率统计学上称错误,理想的应是0%.假阴性率为实际患病,经诊断试验判断为无病的百分率,即诊断试验判断为阴性的非患者占全部无病者的比例,临床上称为误诊率统计学上称为错误,理想的应是0%.灵敏度与特异度之和,减100%为正确指数,亦称约登指数Youdons Index,理想的应为100%.其值愈大愈好。但应注意,正确指数大时,并未告知是灵敏度高还是特异度高,因此,它不能代替上述四项指标。现以喉拭培养

56、结果为标准诊断方法,评价仅凭临床观察诊断-溶血性链球菌感染的真实性,结果见表33-2.表33-2 以喉拭培养法评价临床诊断的真实性喉拭培养合计阳性阴性临床诊断阳性273562阴性107787合计37112149灵敏度%=27/37100%=73%特异度%=77/112100%=69%假阳性率%=1-69/100=31%假阴性率%=1-73/100=27%从表33-2还可看出,计算诊断试验的灵敏度或假阴性率只与患者数有关,而与非患者数无关;计算诊断试验的特异度或假阳性率只与非患者数有关,而与患者数无关。还要看到灵敏度与假阴性率之和为1.特异度与假阳性率之和为1.在临床工作中,医师希望一项诊断试验

57、的灵敏度和特异度均高。但实际上很难如愿。事实是假设提高灵敏度必然以降低特异度为代价,反之亦然。这种反比关系在连续的计量资料测量中容易见到。现以诊断青光眼为例说明上述现象。眼内压升高,视神经萎缩和视野的典型缺损是诊断青光眼的三个重要组成局部。人的眼内压水平在一天内有波动,而在青光眼患者,其波动范围会更大,因而眼内压水平并非诊断青光眼的一个可靠指标。再者,眼内压水平相同的人,眼内病理改变并不一样。虽然眼内压水平高者患青光眼的可能性低者较大,但需作进一步检查才能作出诊断。图33-1 青光眼病人和正常人眼内压分布模式图眼内压水平与是否患青光眼的关系可见图33-1.甲组为未患青光眼者,眼内压水平波动在1

58、.93.5kPa1426mmHg之间。乙组为青光眼患者,其眼内压水平在2.95.6kPa2242mmHg之间。两组人眼内压水平在2.93.5kPa2226mmHg处有重叠。如欲诊断出全部青光眼患者,即要求试验的灵敏度为100%,那么诊断值应定为2.9kPa22mmHg,但相当一局部眼内压水平在2.93.5kPa2226mmHg之间的未患青光眼的人也将诊断为阳性,造成误诊,即特异度差。假设将诊断值规定为3.5kPa26mmHg,那么所有未患青光眼者均为阳性,特异度为100%,但眼内压水平在2.93.5kPa之间的青光眼患者将诊断为阴性,造成漏诊,即灵敏度差。上述事例说明一项诊断试验要同时兼顾高灵

59、敏度和高特异度是困难的。在临床实践中,是将诊断值定在2.93.5kPa之间,即在重叠区的某处。具体确定阳性诊断值的作法,一般只能从临床需要出发,权衡利弊得失再作出。假设所研究的疾病病死率高,预后不佳,漏诊将带来严重后果或早期诊断可明显改善预后,那么诊断试验的阳性界限可向左移。这样,试验的灵敏度高,阴性结果可排除疾病的存在,但同时假阳性增多。假设现有的治疗措施不够理想,可将阳性界限右移以降低灵敏度,提高特异度。当为假阳性者进一步检查所需费用太高,为了节约经费或假阳性可使人心身遭受严重的痛苦或经济受到损失时,高特异度尤为必要。在糖尿病,如以不同的血糖水平作为诊断标准时,同样可以看到灵敏度和特异度的

60、上述反比关系,如表33-3所示。随着血糖水平阳性界限的增高,试验的灵敏度下降,特异度升高,反之亦然。看来将糖尿病诊断试验阳性界限或标准规定在7.15mmol/L130mg/dl时为宜,因此时灵敏度和特异度均处在80%左右。表333以不同血糖水平作为糖尿病诊断标准时的灵敏度和特异度餐后2小时的血糖水平灵敏度%特异度Mmol/LMg/dl4.40801001.24.956098.67.35.5010097.125.36.0511092.948.46.6012088.668.27.1513085.782.47.7014074.391.28.2515064.396.18.8016055.798.69.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论