(概率论与数理统计专业论文)交互效应存在时超饱和设计的数据分析模拟.pdf_第1页
(概率论与数理统计专业论文)交互效应存在时超饱和设计的数据分析模拟.pdf_第2页
(概率论与数理统计专业论文)交互效应存在时超饱和设计的数据分析模拟.pdf_第3页
(概率论与数理统计专业论文)交互效应存在时超饱和设计的数据分析模拟.pdf_第4页
(概率论与数理统计专业论文)交互效应存在时超饱和设计的数据分析模拟.pdf_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 由于超饱和设计的试验因子数大于等于试验次数,可以节省试验的费用和时 间,所以近些年来受到了广泛关注和深入研究但是这种节省也带来了很大的问 题,即不能同时估计所有的主效应,故而通常用于筛选试验目前,超饱和设计的 构造和分析都是基于主效应模型的,而不考虑交互效应但因子交互效应的存在 与否不取决于采用何种设计,而是客观存在的在存在交互效应的超饱和设计中, 筛选试验是否应该引入交互效应是本文主要考虑的 本文通过计算机模拟分别讨论了在二因子交互效应存在时:( a ) 只建立主效应 模型,活跃的主效应的误选漏选情况;( b ) 将二因子交互效应引入数据分析时,对筛 选准确性的改进;( c ) 二因子交互效应的显著程度是如何影响筛选结果的 模拟结果表明显著的二因子交互效应是筛选结果不准确的重要原因之一,并 且交互效应越显著对筛选结果的影响就越大;模拟结果同时表明,适时的引入交 互效应对提高筛选的准确率有很大的改进,并且交互效应越显著,这种改进程度就 越大如果有先验知识表明存在交互效应,在筛选试验中考虑交互效应是必要的 关键词:超饱和设计;二因子交互效应;计算机模拟;超饱和设计的分析 学科分类号:0 2 1 2 6 a b s t r a c t a b s t r a c t b e c a u s eo fi t se c o n o m i c si nt h en u m b e ro fo b s e r v a t i o n ,c o s ta n d t i m ec o n s i d e r a - t i o n s ,t h es u p e r s a t u r a t e dd e s i g n sh a v e b e e ni n v e s t i g a t e dd e e p l ya n dw i d e l yt h e s ey e a r s h o w e v e r ,e f f e c t so ff a c t o r sc a nn o tb es i m u l t a n e o u s l ye s t i m a t e d ,t h es u p e r s a t u r a t e d d e s i g n sa r eu s u a l l yu s e df o rt h ep u r p o s eo fs c r e e n i n gf a c t o r s c o n s t r u c t i o n o fs u c hd e - s i g n sa n da n a l y s i so fd a t af r o mt h e ma r eb o t hb a s e do nm a i ne f f e c t sm o d e l ,i g n o r i n g i n t e r a c t i o n s i nf a c t ,w h e t h e ri n t e r a c t i o n se x i s to rn o ti so b j e c t i v e ,n o td e p e n d i n go n w h a tt y p eo fd e s i g nw ec h o o s e ,s oi ti so f t e nn e c e s s a r yt oc o n s i d e ri n t e r a c t i o n si nt h e a n a l y s i so ft h es u p e r s a t u r a t e dd e s i g n s ,i fw e k n o wp r e v i o u s l yt h a tt h e r ea r ep o s s i b l e i n t e r a c t i o n si nt h ee x p e r i m e n t i i l “sa r t i c l e 。w ea s s u m et h a tat w o f a c t o ri n t e r a c t i o ne x i s t s ,a n dw ei n v e s t i g a t e t h ef o l l o w i n gq u e s t i o n st h r o u g hc o m p u t e rs i m u l a t i o n :( a ) h o wt h es c r e e n i n gp r o c e s si s a f f e c t e db yt w o f a c t o ri n t e r a c t i o n s ;( b ) w h e t h e rt h es c r e e n i n gr e s u l ti si m p r o v e dw h e n t w o f a c t o ri n t e r a c t i o n sa r ei n t r o d u c e di n t od a t aa n a l y s i s ;( c ) h o wt h es i g n i f i c a n c el e v e l a f f e c t ss c r e e n i n gr e s u l t k e yw o r d s :s u p e r s a t u r a t e dd e s i g n s ;t w o f a c t o ri n t e r a c t i o n s ;c o m p u t e rs i m u l a - t i o n s ;d a t aa n a l y s i so ft h es u p e r s a t u r a t e dd e s i g n s a m s2 0 0 0s u b j e c tc l a s s i f i c a t i o n s :p r i m a r y6 2 k 1 5 ;s e c o n d a r y6 2 k 0 5 n 南开大学学位论文版权使用授权书 本人完全了解南开大学关于收集、保存、使用学位论文的规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、 扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供 本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名:纠齐釜复 吵易年,月刁日 经指导教师同意,本学位论文属于保密,在年解密后适用 本授权书。 指导教师签名:学位论文作者签名: 解密时间:年月日 各密级的最长保密年限及书写格式规定如下: 南开大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 学位论文作者签名:五i 在复 砂3 年岁其刁e t 第一章引言 第一章引言 以筛选活跃因子为目的的试验经常用在工业、农业、生物医药等存在多个潜 在重要因子的试验前期通常这类试验考虑的试验因子是比较多的,而实际上真 正活跃的却只有一小部分,此时若估计全部主效应是浪费的尤其是在试验很难 进行或试验次数受限制的时候,估计全部主效应也是不可能的超饱和设计因其 在试验次数和试验时间等方面的经济性,近年来受到了广泛的关注,设计的构造 和数据分析也取得了大量成果 超饱和设计是指试验因子数大于等于试验次数的因析设计设计的构造最早 是由s a t t e r t h w a i t e ( 1 9 5 9 ) 提出的b o o t h 和c o x ( 1 9 6 2 ) 第一次系统地提出构造这种 设计,他们提出了e ( s 2 ) 最优准则和m a z s l 最小准则,并依据这些准则构造和比较 超饱和设计此后,超饱和设计的研究就没什么大的进展直至u 1 9 9 3 年,l i i l ( 1 9 9 3 ) 和w u ( 1 9 9 3 ) 才做出了一些开创性的工作近年来比较有名的设计有:l i n ( 1 9 9 5 ) , n g u y e n ( 1 9 9 6 ) ,t a n g 和w u ( 19 9 7 ) ,c h e n g ( 19 9 7 ) ,l i u 和z h a n g ( 2 0 0 0 ) ,e s k r i d g e ( 2 0 0 1 ) 等 然而,由于超饱和设计列与列之间是非正交的,效应之间的别名关系极为复 杂,使得超饱和设计的数据分析极具挑战性a b r a h a m 和c h i p m a n ( 1 9 9 9 ) 通过 对2 3 个因子2 8 次试验的p b 设计进行分析来说明,在对超饱和设计进行分析时可 能出现的各种困难他们首先对此p b 设计进行数据分析,找出活跃因子然后由 此p b 设计构造出8 个超饱和设计,再分别对这8 个超饱和设计进行数据分析分析 结果表明:不同的设计导致不同的因子被选为活跃的,然而没有哪一个设计的分 析结果和原p b 设计的分析结果完全一致c h e n 和l i n ( 1 9 9 8 ) 经推导,给出了在给 定列与列之间最大相关系数的情况下,多少个活跃因子可以被有效的筛选出来并 且给出了筛选出来的活跃因子也是事实上真正的活跃因子的概率l i u 等( 2 0 0 6 ) 给 出了当两个或更多活跃因子存在时,这些因子可以被正确筛选出来所允许的设计 列之间的最大相关系数c h i p m a n 等( 1 9 9 7 ) 提出的b a y e s i a n 变量选择法用于处理 具有复杂别名的试验设计,为超饱和设计的数据分析又提供了一种非常有效的方 法 然而所有这些分析方法都是基于主效应模型的,也就是假设交互效应不存在 事实上,交互效应的存在与否并不取决于我们采用何种设计,而是客观存在的在 分析因子设计时,我们发现二因子交互效应常常是存在且显著的所以在超饱和 第一章引言 设计的数据分析中,如果存在较为显著的交互效应而我们却乎略它,筛选结果通 常是不准确的另一方面,h a m a d a 和w u ( 1 9 9 2 ) 对p b 设计的分析也启发我们,在 适当的时候将交互效应引入超饱和设计的数据分析中 h a m a d a 和w u ( 1 9 9 2 ) 突破传统限制,首次将二因子交互作用引人到p b 设计 的数据分析中,并通过实际例子说明这样做的合理性在这之前,对p b 设计的分析 也是限于主效应模型的,因为p b 设计的自身限制,不能对全部的主效应和二因子 交互效应进行分析d e n g ( 1 9 9 6 ) 指出饱和设计和超饱和设计的区别不是本质上 的而是混杂程度上的,l i n ( 1 9 9 5 ) 指出这种混杂程度随因子数和试验次数差异的 增大而增大由此我们认为,在适当的时候将二因子交互效应引人到超饱和设计 的数据分析中也是合理的( 虽然超饱和设计不能估计全部的主效应,更别说交互效 应) ,尤其是试验次数相对于真正活跃的主效应和交互效应个数较大的时候即试 验中真正活跃的因子数较少,二因子交互效应确实存在且显著时,我们把交互效 应引入数据分析是必要的 本文通过计算机模拟分别讨论了在二因子交互效应存在时:( a ) 只建立主效应 模型,活跃的主效应的误选漏选情况;) 将二因子交互效应引入数据分析时,对筛 选准确性的改进;( c ) 二因子交互效应的显著程度是如何影响筛选结果的 具体的数据模拟及基本结论放在第二章和第三章,第四章是讨论及扩展部分 2 第二章一个主效应和一个二因子交互效应的情形 第二章一个主效应和一个二因子交互效应的情形 本章讨论真实模型含有一个主效应和一个二因子交互效应的情形( 我们约定 不显著的因子效应均为0 ) ,并且在试验次数不变的情况下,按照试验因子数由小到 大的顺序分别进行模拟分析,然后再对这些模拟进行比较分析在所有的数据模 拟中,本文均采用m a n a b 语言来编写数据模拟程序在这篇文章中,我们考虑的是 包含二因子交互效应的模型: y = a t 五+ 忍x ,z ,j = 1 ,m i = 0 i j 2 1 数据模拟部分 在这章的数据模拟部分,我们分别对4 个e ( s 2 ) 最优设计进行筛选模拟模型 的选择原则采用拟合率( 兄2 ) 最大准则,并采用最优子集搜索的方法进行筛选 我们首先选择一个试验因子数和试验次数比较接近的e ( s 2 ) 最优设计进行 模拟,记为模拟2 1 取试验次数n = 6 ,试因子数m = 7 ( 我们约定始终用n 代表试验 次数,m 代表试验因子数) 的e ( s 2 ) 最优设计,此设计的相关系数分别是士o 3 3 3 3 , e ( s 2 ) - 1 0 设计阵见表2 1 : 表2 1 n = 6 ,m = 7 1 拘e ( 8 2 ) 最优超饱和设计 对这个模拟,我们假定真实模型如下: y = 5 x 1 + 4 x 1 托+ ,一n ( 0 ,1 ) ( 2 1 ) 3 ,1 l 1 1 1,l,l x 一 一 一 r v 1 l 1 1- 1 1 l x 一 一 一 e u 1 1 1 1 l 1 i x 一 一 一 4 1 1 1 l 1 1 l 1 l x 一 一 一 3 1 1 工1 1 1 上1 x 一 一 一 n二1上l l l 1 l x 一 一 一 1-1l,工1上1上l x 一 一 一 m 1 2 3 4 5 6 n 第二章一个主效应和一个二因子交互效应的情形 数据模拟如下: 1 数据的生成:用m a t l a b 语言中的r a n d o m 语句生成6 个均植为0 ,方差为1 的随 机数然后用模型( 2 1 ) 生成观测向量,我们注意到在模型中只有因子x 1 ,x 1 恐的 系数非零 2 数据分析:我们采用最优子集的分析方法首先对只含有1 个主效应的模 型进行最优搜索,在只含1 个主效应的模型中选出拟合最好的;然后对只含有2 个 主效应的模型进行最优搜索,在含有2 个主效应的模型中选出拟合最好的;最后对 含有1 个主效应和1 个相关的二因子交互效应的模型进行最优搜索,选出拟合最好 的模型相应的主效应和与此主效应相关的二因子交互效 3 重复第一步和第二步1 0 0 次,观察模拟结果的规律性,并记录每个模拟结果 的频率百分比 模拟结果如下: 1 在只含1 个主效应的模型的最优搜索中,主效应x 1 被1 0 0 选中,最大拟合 率为0 7 5 8 3 ,最小的拟合率为0 5 1 7 6 2 在含有2 个主效应的模型的最优搜索中,组合x 1 ,x 3 和组合x 1 ,* 分别 被选中,这两个组合分别被选中4 2 次和5 8 次,最大拟合率为0 9 4 3 8 ,最小拟合率 为0 7 4 2 0 3 在含1 个主效应和1 个相关二因子交互效应的模型的最优搜索中,主效应蜀 和交互效应x 1 咒被1 0 0 选中,最小拟合率为0 9 4 8 3 ,最大拟合率为0 9 9 9 8 下面要模拟的试验是在上面设计的基础上添加一个列,记为模拟2 2 且l j n = 6 , m = 8 的e ( s 2 ) 最优设计,此设计的相关系数分别是4 - 0 3 3 3 3 ,e ( s 2 ) = 9 1 4 2 9 设计阵 见表2 2 : 表2 2n - - 6 ,m = 8 的e ( 8 2 ) 最优超饱和设计 我们假定真实模型仍然为( 2 1 ) 式,数据模拟方法同模拟2 1 模拟结果如下: 4 r v 1 1 l 1 1 1 l 1 l x 一 一 一 7 l 1 1上1,i,l x 一 一 一 丘u l 1 上1 工l 1 上l x 一 一 一 5 1 1 1 ,i 1 l 1 l x 一 一 一 4 1 1 1 l 1 1 x 一 一 一 3 1 上1 1 1 1 1 x 一 一 一 o1- 1 1 l 1 l x 一 一 一 1 1 1 l 1 i 1 1,l x 一 一 一 m 1 2 3 4 5 6 n 第二章一个主效应和个二因子交互效应的情形 1 在只含1 个主效应的模型的最优搜索中,主效应x 1 被选中的频率为9 7 ,主 效应被选中的频率为3 最大和最小的拟合率分别为0 7 5 0 6 ,0 5 0 1 9 2 在含2 个主效应的模型的最优搜索中,因子组合x 1 ,x 3 ;因子组合x 1 ,* 和 因子组合x 。,拖分别被选中,且这三个组合被选中的频率基本相当最大和最小 拟合率分别为:0 9 3 2 0 ,0 7 9 8 9 3 在含1 个主效应和1 个相关二因子交互效应的模型的最优搜索中,主效应蜀和 交互效应托恐以8 3 的频率被选中主效应尥和交互效应托恐被选中的频率 为1 7 我们第三个要模拟的设计是在上面设计的基础上再添加一个列,记为模拟2 3 1 l p n = 6 ,m = 9 的e ( 8 2 ) 最优设计,此设计的相关系数分别是士o 3 3 3 3 ,e ( 8 2 ) = 8 5 设 计阵见表2 3 : 表2 3 n = 6 ,m - - 9 的e ( s 2 ) 最优超饱和设计 我们假定真实模型仍然为( 2 1 ) ,数据模拟方法同模拟2 1 模拟结果如下: 1 在只含有1 个主效应的模型的最优搜索中,x 】被选中8 8 次,拖被选中8 次,弱 被选中4 次,最小和最大拟合率分别为0 5 3 1 8 ,0 7 4 7 1 当我们把交互项系数提高 至1 1 7 的时候,x 1 被选中0 次,尥被选中4 2 次,x 9 被选中5 8 次,最小和最大拟合率分 别为0 5 2 9 3 和0 7 3 7 4 当我们把交互项系数提高n 8 的时候,x 1 被选中0 次,拖被选 中4 9 次,托被选中5 1 次,最小和最大拟合率分别为0 5 4 9 4 ,0 7 0 9 3 2 在含有2 个主效应的模型的最优搜索中,因子组合五,x s ;x 1 ,x t ;x 1 ,x s ; x 1 ,托分别被选中且有相近的选中频率,五,组合;凰,x 9 组合分别被选中一 次当交互项的系数提高到7 的时候,五,x g ;恐,x g ;蕊,x g ;x 8 ,x 9 组合分别被选 中当交互项的系数提高n 8 的时候,虬,弱组合被选中的频率为8 8 ,且拟合率也 较高,这说明二因子交互效应越显著,我们越有可能作出错误的选择 3 在含1 个主效应和1 个相关二因子交互效应的模型的最优搜索中,正确的因 子组合被选中的频率为5 9 ,因子组合托,凰咒和组合,弱恐被选中的频率 5 弱。o o o 8 1 上1 1上1上1 1 x 一 一 一 7 1 1 上1 1 工1 1 x 一 一 一 6 1 l 1 1,l 1 1 l x 一 一 一 e u 1 1 1 1 l 1 x 一 一 一 4 1上1工l 1 工1 1 x 一 一 一 3 1工1上1 1 1 1 x 一 一 一 2 1 1 l 1 ,l 1 l x 一 一 一 11l l 1 1 1 x 一 一 一 n 1 2 3 4 5 6 n 第二章一个主效应和一个二因子交互效应的情形 占4 1 当交互项的系数提高到7 的时候,正确的因子组合被选中的频率为9 3 当 交互项的系数提高n 8 的时候,正确的因子组合被选中的频率为1 0 0 下面我们要模拟的试验是在上面的设计的基础上再添加一个列,记为模拟2 4 耳p n = 6 ,m = 1 0 1 拘e ( s 2 ) 最优设计,此设计的相关系数分别是土0 3 3 3 3 ,e ( s 2 ) = 8 设 计阵见表2 4 : 表2 4n = 6 ,m = 9 的e ( s 2 ) 最优超饱和设计 我们仍假定真实模型为( 2 1 ) ,数据模拟方法同模拟2 1 模拟结果如下: 1 在只含有1 个主效应的模型的最优搜索中,主效应蜀被选中8 8 次,x 8 被选 中8 次,) 岛被选中4 次,最小和最大的拟合率分别为0 5 2 3 4 和0 7 9 4 2 当我们把交互 项系数调n 5 的时候,主效应x 1 被选中3 0 次,凰和弱各被选中3 5 次,最小和最大 的拟合率分别为0 5 0 8 0 ,0 7 0 4 5 当交互项系数调到7 的时候,主效应x 1 被选中o 次, 托被选中4 6 次,弱被选中5 4 次,最小和最大的拟合率分别为0 5 2 5 7 ,0 7 1 4 8 2 在含有2 个主效应的模型的最优搜索中,因子组合x 1 和托被选中2 2 次,x 1 和 x 7 组合被选中2 9 次,x 1 和凰组合被选中1 6 次,x 1 和弱组合被选中2 6 次,五和妫组 合,凰和玛组合分别被选中两次,凰和托组合,溉和尥组合,拖和x 1 0 组合分别被 选中1 次,最小和最大的拟合率分别为0 8 2 5 8 和0 9 6 2 3 当交互项系数提高到7 的时 候,因子组合尥和以6 5 的频率被选中,凰和碣组合以1 2 的频率被选中,最 小和最大的拟合率分别为0 8 3 2 0 和0 9 3 6 9 当交互项系数提高到9 的时候,因子组 合甄和托以9 8 的频率被选中,最小和最大的拟合率分别为0 8 4 5 2 和0 9 6 4 4 3 在含1 个主效应和1 个相关二因子交互效应的模型的最优搜索中,正确因子 组合被选中的频率为5 5 ,最小和最大的拟合率分别为0 9 6 2 5 和0 9 9 9 8 当交互项 的系数提高到7 的时候,正确的因子组合被选中的频率为9 5 当交互项的系数提 高n 8 的时候,正确的因子组合被选中的频率为9 9 6 一 一 一 9,i,l 1 1 1 1 l x 一 一 一 8 1 1 1 1 l 1 x 一 一 一 7 l 1 1 1 1 l l x 一 一 一 6 1 1 1 1 l 1 上1 x 一 一 一 5 1 1 1 ,l 1 l l x 一 一 一 4 1 1 1 1 1 l 1 x 一 一 一 3 1 上1 1 l 1 上1 x 一 一 一 2 1 上l 1 上1 1 1 l x 一 一 一 1 1,l 1 1 1 1 l x 一 一 一 仉1 2 3 4 5 6 n 第二章一个主效应和一个- - n 子交互效应的情形 2 2 模拟结果分析及结论 模拟2 1 的结果表明在试验次数略小于试验因子数( 相差1 ) ,并且设计的因子间 的最大相关系数( m a x l s l ) 也较小的时候,一个显著的二因子交互效应对于活跃因 子的筛选有明显的影响在含1 个主效应的模型的最优搜索中,五虽然被1 0 0 选 中,但模型的拟合率很低自然进行含2 个主效应的模型的最优搜索,结果因子组 合五,弱和x ,蜀分别被选中,拟合率较含1 个主效应的模型有很大的提高,但因 子组合x 1 ,托没被选中在这种情况下,我们很可能选用x 1 ,x 3 组合或x 1 ,局组合 作为活跃因子即使进行跟随试验,交互作用x 1 x 2 也不可能被识别 当采用含1 个主效应和1 个相关二因子交互效应模型进行最优搜索时,因子组 合蜀和x 】托被1 0 0 选中,拟合率非常接近1 然而对这个模型,如果不存在交互效应,依据l i u ( 2 0 0 6 ) 的结论,我们能够识 别出真正活跃的主效应通过模拟也证实了这一点,x 1 被1 0 0 选中 这说明当二因子交互效应存在时,就能对筛选结果有很大影响,导致误选 模拟2 2 的结果表明:在1 个主效应的模型的最优搜索中,五被选中的频率很 高,但拟合率依然很低此时,自然要进行含2 个主效应的模型的最优搜索,因子x 1 , * 组合;x 1 ,x 3 组合,x 1 ,凰组合以相近的频率被选中,拟合率都较高,因子组 合x 】,托依然没被选中这样我们还是会误选,而且跟随试验也同样不能识别出 真正活跃的交互效应 在1 个主效应和1 个相关交互效应的模型的最优搜索中,真正的活跃因子x 1 , 咒托被选中的频率为8 3 ,正确的因子被选出的可能性依然很高我们同时也发 现,相对于上个模拟,正确筛选活跃因子变得困难了这是因为试验因子数增加 了,正确筛选需要更多的信息事实上当墨x 2 的系数提高n 7 时,真正的活跃因子 就以9 6 的频率被选中五托的系数提高n 8 时,真正活跃的因子就以1 0 0 的频 率被选中 同样对这个模型,如果不存在交互效应,依据l i u ( 2 0 0 6 ) 的结论,我们能够识 别出真正活跃的主效应我们通过模拟也证实了这一点,x 】被1 0 0 选中 模拟2 3 的结果表明当设计中的因子数相对于试验次数比较多时( 试验次数不 变,试验因子数增) j i 至u 9 个) ,二因子交互效应对活跃因子的筛选的影响仍然很大, 即使考虑交互效应,要识别出真正活跃的因子也变得更困难但适当提高交互效应 显著性后,正确筛选的可能性就很大! 但如果不考虑交互效应,因子组合凰,托被 选中的可能性很大这时的筛选完全不合乎实际,跟随试验也不能提供任何有效 7 第二章一个主效应和一个二因子交互效应的情形 信息 对这个模型,如果不存在交互效应,依据l i u ( 2 0 0 6 ) 的结论,我们能够识别出 真正活跃的主效应通过模拟x 1 被1 0 0 选中 模拟2 4 的结果表明随着试验因子数增加到1 0 ,在采用2 个主效应的模型的最 优搜索时,所有被选中的因子组合虽然包含五,但不包含因子组合蜀,恐跟随 试验也不能识别出真正活跃的交互效应并且随着交互项系数的增加,凰和弱几 乎肯定被选中,造成完全误选当考虑交互效应时,真正活跃因子组合被选中的频 率5 5 ,依然很有可能做出正确的筛选这说明随着试验因子数的增加,即便考虑 二因子交互效应,真正的活跃因子被选中的困难也增加了如果将交互项系数适 当提高,就能以很大的把握选出真正活跃的因子 同样对于这个模型,如果不存在交互效应,依据l i u ( 2 0 0 6 ) 的结论,我们能够 识别出真正活跃的主效应模拟表明x 1 被1 0 0 选中 综合以上分析,我们得出如下结论: 对于模型( 2 1 ) ,当试验次数和试验因子数比较接近( 前两个模拟) 的时候,如果 我们在筛选时不考虑交互效应,我们误选主效应的可能性很大,并且后续的跟随 试验根本不能将真正的活跃因子识别出来并且相对于主效应而言,交互效应的 显著性越大越容易误选,甚至做出完全错误的结果而本文提出的二因子效应模型 对于正确筛选活跃因子有极大的提高作用进一步,随着交互效应显著性的增加, 这种作用就越明显,筛选的正确率越高 对试验次数和试验因子数相差较大( 后两个模拟) 的设计,如果在筛选时不考 虑交互效应,就更有可能选出完全不合乎实际的因子如果在筛选时考虑了交互 效应,虽然不能再像前面的两个模拟那样几乎肯定筛选正确,但正确筛选的可能 性依然很大,这是因为试验本身提供的信息太少所致但是通过上面的模拟分析, 我们发现随着交互效应显著性的增加,筛选的正确率也会提高 综上所述,显著的交互效应对筛选活跃因子都有非常大的影响如果筛选时 不考虑交互效应,几乎肯定误选或漏选,甚者选出的因子与实际情况完全不符但 如果考虑了交互效应,就很有可能筛选出真正的活跃因子这说明一个试验存在 显著的交互效应时,我们在筛选时将交互效应考虑进来,对筛选结果的正确性会 有很大的提高 8 第三章两个主效应和一个二因子交互效应的情形 第三章两个主效应和一个二因子交互效应的情形 本章我们讨论真实模型含有2 个显著的主效应和1 个显著的二因子交互效应的 情形( 我们依然约定不显著的因子效应均为0 ) ,同样在试验次数不变的情况下,按 照试验因子数由小到大的顺序分别进行模拟分析,然后再对这些模拟进行比较分 析 3 1 数据模拟部分 在这章的数据模拟部分,我们分别对4 个e ( s 2 ) 最优设计进行筛选模拟模型 的选择原则仍然采用拟合率( 兄2 ) 最大准则,并采用最优子集搜索的方法进行筛选 本章始终假设真实模型为模型( 3 1 ) : 可= 5 x 1 + 3 配+ 5 x 1 x 2 + g ,一n ( 0 ,1 ) ( 3 1 ) 我们首先对n = 6 ,m = 7 1 拘e ( s 2 ) 最优设计进行模拟,记为模拟3 1 此设计的相关 系数分别是土0 3 3 3 3 ,e ( 8 2 ) = 1 0 设计阵见表3 1 : 表3 1n = 6 ,m = 7 的e ( s 2 ) 最优超饱和设计 数据模拟如下: 1 数据的生成:首先我们用m a t l a b 语言中的r a n d o m 语句生成6 个均植为o ,方 差为1 的随机数然后用模型( 3 1 ) 生成观测向量,我们注意到在这个模型中只有效 应x 1 ,x 2 和x 1 恐的系数非零 2 数据分析:我们采用最优子集的方法首先对含2 个主效应的模型进行筛选, 选出活跃的因子组合;然后对含3 个主效应的模型进行筛选,选出相应的因子组合; 9 * 。o o o 。 o ,l 1 1 1 l 1 1 l x 一 一 一 e u l 1 1 上l 1 1 x 一 一 一 4 1 1 工1 1 1 1 x 一 一 一 3 1 1 1 1 1 工1 x 一 一 一 2 1 1 1 1 1 上1 x 一 一 一 1 l 1 l l 1 1 1 x 一 一 一 n 1 2 3 4 5 6 n 第三章两个主效应和个二因子交互效应的情形 最后对含2 个主效应和1 个相关二因子交互效应的模型进行筛选,选出活跃的主效 应和相关二因子交互效应 3 重复第一步和第二步1 0 0 次,观察模拟结果的规律性,并记录每个模拟结果 的频率百分比 模拟结果如下: 1 在含2 个主效应的模型的最优搜索中,x 】和恐组合被选中的频率为3 6 ,x 1 和* 组合被选中的频率为4 0 ,x 1 和弱组合被选中的频率为2 4 ,最小和最大的 拟合率分别为:0 6 0 3 1 ,0 7 6 5 0 当交互项的系数提高n 8 的时候,五和托组合被选 中的频率o ,x 1 和托组合被选中的频率为4 0 ,x 1 和弼组合被选中的频率为5 9 , 最小和最大的拟合率分别为:0 5 3 6 7 和0 7 4 6 1 当交互项的系数提高到1 0 的时候, 五和x 2 组合被选中频率为o ,x 1 和托组合被选中的频率为5 4 ,x ,和为组合被 选中频率为4 5 ,最小和最大的拟合率分别为:0 5 1 6 7 和0 6 8 6 8 2 在含3 个主效应的模型的最优搜索中,因子组合蜀,咒和* 被选中4 7 次;x 1 , 恐和托被选中3 7 次最小和最大的拟合率分别为:0 8 3 3 4 ,0 9 5 3 1 当交互项的 系数提高n 8 的时候,置,托和x 7 组合的选中频率为1 0 ;x 1 ,恐和咒组合的选 中频率为3 ;x l ,恐和恐组合的选中频率为3 9 ;x a ,x 3 和拖组合被选中的频率 为2 5 ;x 1 ,x 4 和姊组合被选中的频率为2 3 ;最小和最大的拟合率分别为:0 7 8 5 9 , 0 8 9 6 2 当交互项的系数提高到l o 的时候,x 1 ,托和拖组合被选中的频率为3 3 ; x 1 ,托和风组合被选中的频率为2 4 ;x 1 ,x 4 和曷组合的选中频率为4 0 3 在含2 个主效应和1 个相关交互效应的模型的最优搜索中,主效应蜀和交互 效应x 1 被选中的频率为3 0 ,最小和最大的拟合率分别为:0 9 8 6 2 ,1 0 0 0 0 当 交互项的系数提高到8 的时候,正确因子选中频率提高到5 2 ,最小和最大的拟合 率分别为:0 9 8 2 5 和0 9 9 9 9 当交互项的系数提高到1 0 的时候,正确因子被选中频 率提高至! u 7 1 ,最小和最大的拟合率分别为:0 9 9 2 5 和1 0 0 0 0 接下来对n = 6 ,m = 8 的e ( s 2 ) 最优设计进行模拟,记为模拟3 2 此设计的相关系 数分别是士0 3 3 3 3 ,e ( s 2 ) = 9 1 4 2 9 设计阵见表3 2 : 我们仍假设真实模型为( 3 1 ) ,且数据模拟方法同模拟3 1 模拟结果如下: 1 在含2 个主效应的模型的最优搜索中,x 1 和磁组合被选中的频率为o ;咒和 尥因子组合被1 0 0 选中,最小和最大的拟合率分别为:0 6 6 9 1 和0 8 9 8 9 当交互 项系数提高n 8 的时候,* 和磁组合选中频率为0 ;x 1 ,托组合被选中的频率 为4 4 ;x 5 和抵组合被选中的频率为5 6 ,最小的和最大的拟合率分别为:0 6 6 8 8 和 0 8 4 7 8 当交互项系数提高n l o 的时候,x 1 和恐被选中的频率为o ;x 5 ,凰组合 被选中的频率为9 7 ;x 1 ,凰组合被选中的频率为l ;最小和最大的拟合率分别 1 0 第三章两个主效应和一个二因子交互效应的情形 表3 2 n = 6 ,m = 8 1 拘e ( 8 2 ) 最优超饱和设计 为0 6 9 8 9 和0 8 4 4 3 2 在含3 个主效应的模型的最优搜索中,因子组合五,墨和被选中4 5 次,因 子组合x 1 ,x 4 和恐被选中5 1 次,其它因子组合分别被选中很少的次数,最小和最 大的拟合率分别为0 8 7 6 4 ,0 9 6 8 2 当交互项系数提高n 8 的时候,x 5 ,拖和尥组 合被选中9 9 次;x 】,和尥组合被选中一次,最小和最大的拟合率分别为:0 9 0 4 9 , 0 9 8 6 5 当交互项的系数为l o 的时候,恐,和凰因子组合被1 0 0 选中,最小和最 大的拟合率分别为0 9 6 2 9 ,0 9 9 9 8 3 在包含2 个主效应和1 个相关交互效应的模型的最优搜索中,x 1 和x 1 磁组 合被选中的频率为2 1 ;x 2 和托* 组合被选中的频率为1 1 ;x 3 和五组合被 选中的频率为2 3 ;x 】和x 】恐组合被选中的频率为1 3 ;曷和x t x 4 组合被选中 的频率为1 0 ;最小和最大的拟合率分别为:0 9 9 0 2 和1 0 0 0 0 当交互项系数提高 n 8 的时候,真正活跃的因子组合被选中频率提高到3 3 ,最小和最大的拟合率分 别为:0 9 8 7 5 和1 0 0 0 0 当交互项系数提高至1 1 0 的时候,真正活跃的因子组合被选 中频率提高n 5 0 ,最小和最大的拟合率分别为:0 9 8 8 9 和1 0 0 0 0 本章第三个要进行的模拟是n = 6 ,m = 9 的v ( s 2 ) 最优设计,记为模拟3 3 此设计 的相关系数分别是士0 3 3 3 3 ,e ( s 2 ) = 8 5 设计阵见表3 3 : 我们仍假设真实模型为( 3 1 ) ,且数据模拟方法同模拟3 1 模拟结果如下: 1 在含有2 个主效应和1 个相关交互效应的模型的最优搜索中,因子组合x 1 和 x 1 托被选中的频率为1 3 ,最小的和最大的拟合率分别为:0 9 9 3 4 和1 0 0 0 0 当 交互项系数提高n 8 的时候,因子组合x 1 和x 1 犸被选中频率提高到1 9 ,最小和 最大的拟合率分别为:0 9 8 8 7 1 和1 0 0 0 0 当交互项系数提高到1 0 的时候,因子组 合墨和x 1 x 2 被选中频率提高到4 5 ,最小和最大的拟合率分别为:0 9 8 5 1 和1 0 0 0 0 2 在含2 个主效应的模型的最优搜索中,因子组合x 1 和为被选中的频率为o , 因子组合五,甄被选中的频率为3 6 ,因子组合尥,托被选中的频率为6 4 ,最 8 l 1 1 上1 1 1 l x 一 一 一 1 1 1 1 l 1 x 一 一 一 6 1 1工1上1 1 1 x 一 一 一 5 1 l 1 1 1 l 1 x 一 一 一 4 1上1上l 1 工1 1 x 一 一 一 3 1 1 1 1 1 1 x 一 一 一 2 1 1 l 1 l 1 1 x 一 一 一 墨o 1。o o 。 n 1 2 3 4 5 6 n 第三章两个主效应和一个二因子交互效应的情形 表3 3n = 6 ,m = 9 1 勺e ( s 2 ) 最优超饱和设计 n o x 1x 2 x 3 x 4 x 5x 6x 7x 8x 9 111111l111 2111111111 3l一1 l 1一l一1111 4111111111 5111111111 61 11l1 1 11 l 小和最大的拟合率分别为:0 7 8 6 4 ,0 9 2 7 7 当交互项系数提高到8 的时候,因子组 合五和恐选中频率为0 ,因子组合x s ,x 9 被1 0 0 选中,最小和最大的拟合率分 别为:0 8 8 2 4 和0 9 8 5 6 当交互项系数提高到l o 的时候,因子组合x 】和恐选中频 率o ,最小和最大的拟合率分别为0 9 3 7 4 和0 9 9 5 7 ,因子组合,x 9 被1 0 0 选中 3 在含3 个主效应的模型的最优搜索中,因子蜀,托,托组合以9 3 的频率被 选中最小和最大的拟合率分别为:0 9 4 0 6 ,0 9 9 7 7 当交互项的系数为8 的时候, x 1 ,尥,x 9 的选中频率为9 5 ,最小和最大的拟合率分别为:0 9 8 3 3 和1 0 0 0 当交 互项的系数为1 0 的时候,x 1 ,托,托的选中频率为8 8 ,最小和最大的拟合率分别 为0 9 9 01 和0 9 9 9 9 最后取n = 6 ,m = 1 0 的e ( s 2 ) 最优设计进行模拟,记为模拟3 4 此设计的相关系 数分别是4 - 0 3 3 3 3 ,e ( s 2 ) - - 8 设计阵见表3 4 : 表3 4 n = 6 ,m = 9 1 拘e ( s 2 ) 最优超饱和设计 x 3 x 4x 5 x 6x 1x 8 x 9x l o 一1 1111111 1111111 1 11111111 1111 1 11 1 11111111 11111111 我们仍假设真实模型为( 3 1 ) ,且数据模拟方法同模拟3 1 模拟结果如下: 1 在含2 个主效应的模型的最优搜索中,因子组合x 1 和咒被选中的频率为o , 因子组合尥,托的选中频率为2 7 ;因子组合x 1 ,凰选中频率为3 9 ;因子组合x 1 , 秭选中频率为3 4 ;最小和最大的拟合率分别为:o 8 0 1 6 ,0 9 1 3 9 当交互项系数提 1 2 2 1 上,i 1 工,上 1 ,l x 一 一 一 墨o 。o o 。 n 1 2 3 4 5 6 n 第三章两个主效应和一个二因子交互效应的情形 高n 8 的时候,因子组合x 1 和配选中频率o ;因子组合甄和硒1 0 0 选中;最小 和最大的拟合率分别为:0 9 0 3 1 和0 9 8 1 3 当交互项系数提高至l j l 0 的时候,因子组 合x 】和恐选中频率o ,因子组合尥,凰被1 0 0 选中,最小和最大的拟合率分别 为:0 9 4 8 6 和0 9 9 6 2 2 在含3 个主效应的模型的最优搜索中,x 1 ,尥和弱组合以9 3 的频率被选 中,最小和最大的拟合率分别为:0 9 2 1 7 ,1 0 0 0 0 当交互项系数为8 的时候,x 1 , 托和组合的选中频率为9 6 ,最小和最大的拟合率分别为:0 9 8 5 2 和1 0 0 0 当交 互项系数为l o 的时候,x 1 ,和托的选中频率为8 4 ,最小的和最大的拟合率分 别为0 9 8 7 7 和1 0 0 l o o 3 在2 个主效应和1 个相关交互效应的模型的最优搜索中,因子组合x ,和蜀x 2 被选中的频率为1 0 ,最小的和最大的拟合率分别为0 9 9 3 7 和1 0 0 0 0 当交互项系 数提高n 8 的时候,因子组合x 1 和x 1 被选中频率提高到2 l ,最小和最大的拟合 率分别为0 9 9 1 7 和1 0 0 0 0 当交互项的系数提高到1 0 的时候,因子组合x 1 和x 1 x 2 被 选中频率提高到4 3 ,最小和最大的拟合率分别为0 9 9 0 4 和1 0 0 0 0 3 2 模拟结果分析及结论 模拟3 1 说明在含2 个主效应的模型的最优搜索中,真正的活跃主效应x 1 和x 2 被选中的频率很低,而且当交互项系数提高到到一定程度的时候,会完全误选在 含3 个主效应的模型的最优搜索中,包含x 。和磁( 如:x 1 ,x 2 和恐组合,x 1 ,恐和曷 组合) 的因子组合被选中的可能性较大,这时真正活跃的主效应被选中的可能性很 大但随着交互项系数的提高到一定程度,这样的因子组合完全不能被选中但当 采用包含二因子交互效应的模型进行最优搜索,真正活跃的因子( 以墨,x 。恐组 合;或,磁咒组合为标准) 被选中的可能性很大当交互项系数提高到一定程度 的时候,活跃因子被选中的可能性有很大提高 对于这个设计及模型( 3 1 ) ,当不存在交互效应的时候,依据l i u ( 2 0 0 6 ) 的结果, 我们能构正确筛选出活跃因子数据模拟也验证了这个事实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论