（概率论与数理统计专业论文）交互效应存在时超饱和设计的数据分析模拟.pdf

上传人：灰*** IP属地：宁夏上传时间：2019-12-07 格式：PDF 页数：24 大小：821.94KB 积分：12 举报 版权申诉

（概率论与数理统计专业论文）交互效应存在时超饱和设计的数据分析模拟.pdf_第2页

（概率论与数理统计专业论文）交互效应存在时超饱和设计的数据分析模拟.pdf_第3页

（概率论与数理统计专业论文）交互效应存在时超饱和设计的数据分析模拟.pdf_第4页

（概率论与数理统计专业论文）交互效应存在时超饱和设计的数据分析模拟.pdf_第5页

已阅读5页，还剩19页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要摘要由于超饱和设计的试验因子数大于等于试验次数，可以节省试验的费用和时间，所以近些年来受到了广泛关注和深入研究但是这种节省也带来了很大的问题，即不能同时估计所有的主效应，故而通常用于筛选试验目前，超饱和设计的构造和分析都是基于主效应模型的，而不考虑交互效应但因子交互效应的存在与否不取决于采用何种设计，而是客观存在的在存在交互效应的超饱和设计中，筛选试验是否应该引入交互效应是本文主要考虑的本文通过计算机模拟分别讨论了在二因子交互效应存在时：( a ) 只建立主效应模型，活跃的主效应的误选漏选情况；( b ) 将二因子交互效应引入数据分析时，对筛选准确性的改进；( c ) 二因子交互效应的显著程度是如何影响筛选结果的模拟结果表明显著的二因子交互效应是筛选结果不准确的重要原因之一，并且交互效应越显著对筛选结果的影响就越大；模拟结果同时表明，适时的引入交互效应对提高筛选的准确率有很大的改进，并且交互效应越显著，这种改进程度就越大如果有先验知识表明存在交互效应，在筛选试验中考虑交互效应是必要的关键词：超饱和设计；二因子交互效应；计算机模拟；超饱和设计的分析学科分类号：0 2 1 2 6 a b s t r a c t a b s t r a c t b e c a u s eo fi t se c o n o m i c si nt h en u m b e ro fo b s e r v a t i o n ，c o s ta n d t i m ec o n s i d e r a - t i o n s ，t h es u p e r s a t u r a t e dd e s i g n sh a v e b e e ni n v e s t i g a t e dd e e p l ya n dw i d e l yt h e s ey e a r s h o w e v e r ，e f f e c t so ff a c t o r sc a nn o tb es i m u l t a n e o u s l ye s t i m a t e d ，t h es u p e r s a t u r a t e d d e s i g n sa r eu s u a l l yu s e df o rt h ep u r p o s eo fs c r e e n i n gf a c t o r s c o n s t r u c t i o n o fs u c hd e - s i g n sa n da n a l y s i so fd a t af r o mt h e ma r eb o t hb a s e do nm a i ne f f e c t sm o d e l ，i g n o r i n g i n t e r a c t i o n s i nf a c t ，w h e t h e ri n t e r a c t i o n se x i s to rn o ti so b j e c t i v e ，n o td e p e n d i n go n w h a tt y p eo fd e s i g nw ec h o o s e ，s oi ti so f t e nn e c e s s a r yt oc o n s i d e ri n t e r a c t i o n si nt h e a n a l y s i so ft h es u p e r s a t u r a t e dd e s i g n s ，i fw e k n o wp r e v i o u s l yt h a tt h e r ea r ep o s s i b l e i n t e r a c t i o n si nt h ee x p e r i m e n t i i l “sa r t i c l e 。w ea s s u m et h a tat w o f a c t o ri n t e r a c t i o ne x i s t s ，a n dw ei n v e s t i g a t e t h ef o l l o w i n gq u e s t i o n st h r o u g hc o m p u t e rs i m u l a t i o n ：( a ) h o wt h es c r e e n i n gp r o c e s si s a f f e c t e db yt w o f a c t o ri n t e r a c t i o n s ；( b ) w h e t h e rt h es c r e e n i n gr e s u l ti si m p r o v e dw h e n t w o f a c t o ri n t e r a c t i o n sa r ei n t r o d u c e di n t od a t aa n a l y s i s ；( c ) h o wt h es i g n i f i c a n c el e v e l a f f e c t ss c r e e n i n gr e s u l t k e yw o r d s ：s u p e r s a t u r a t e dd e s i g n s ；t w o f a c t o ri n t e r a c t i o n s ；c o m p u t e rs i m u l a - t i o n s ；d a t aa n a l y s i so ft h es u p e r s a t u r a t e dd e s i g n s a m s2 0 0 0s u b j e c tc l a s s i f i c a t i o n s ：p r i m a r y6 2 k 1 5 ；s e c o n d a r y6 2 k 0 5 n 南开大学学位论文版权使用授权书本人完全了解南开大学关于收集、保存、使用学位论文的规定，同意如下各项内容：按照学校要求提交学位论文的印刷本和电子版本；学校有权保存学位论文的印刷本和电子版，并采用影印、缩印、扫描、数字化或其它手段保存论文；学校有权提供目录检索以及提供本学位论文全文或者部分的阅览服务；学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版；在不以赢利为目的的前提下，学校可以适当复制论文的部分或全部内容用于学术活动。学位论文作者签名：纠齐釜复吵易年，月刁日经指导教师同意，本学位论文属于保密，在年解密后适用本授权书。指导教师签名：学位论文作者签名：解密时间：年月日各密级的最长保密年限及书写格式规定如下：南开大学学位论文原创性声明本人郑重声明：所呈交的学位论文，是本人在导师指导下，进行研究工作所取得的成果。除文中已经注明引用的内容外，本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体，均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。学位论文作者签名：五i 在复砂3 年岁其刁e t 第一章引言第一章引言以筛选活跃因子为目的的试验经常用在工业、农业、生物医药等存在多个潜在重要因子的试验前期通常这类试验考虑的试验因子是比较多的，而实际上真正活跃的却只有一小部分，此时若估计全部主效应是浪费的尤其是在试验很难进行或试验次数受限制的时候，估计全部主效应也是不可能的超饱和设计因其在试验次数和试验时间等方面的经济性，近年来受到了广泛的关注，设计的构造和数据分析也取得了大量成果超饱和设计是指试验因子数大于等于试验次数的因析设计设计的构造最早是由s a t t e r t h w a i t e ( 1 9 5 9 ) 提出的b o o t h 和c o x ( 1 9 6 2 ) 第一次系统地提出构造这种设计，他们提出了e ( s 2 ) 最优准则和m a z s l 最小准则，并依据这些准则构造和比较超饱和设计此后，超饱和设计的研究就没什么大的进展直至u 1 9 9 3 年，l i i l ( 1 9 9 3 ) 和w u ( 1 9 9 3 ) 才做出了一些开创性的工作近年来比较有名的设计有：l i n ( 1 9 9 5 ) ， n g u y e n ( 1 9 9 6 ) ，t a n g 和w u ( 19 9 7 ) ，c h e n g ( 19 9 7 ) ，l i u 和z h a n g ( 2 0 0 0 ) ，e s k r i d g e ( 2 0 0 1 ) 等然而，由于超饱和设计列与列之间是非正交的，效应之间的别名关系极为复杂，使得超饱和设计的数据分析极具挑战性a b r a h a m 和c h i p m a n ( 1 9 9 9 ) 通过对2 3 个因子2 8 次试验的p b 设计进行分析来说明，在对超饱和设计进行分析时可能出现的各种困难他们首先对此p b 设计进行数据分析，找出活跃因子然后由此p b 设计构造出8 个超饱和设计，再分别对这8 个超饱和设计进行数据分析分析结果表明：不同的设计导致不同的因子被选为活跃的，然而没有哪一个设计的分析结果和原p b 设计的分析结果完全一致c h e n 和l i n ( 1 9 9 8 ) 经推导，给出了在给定列与列之间最大相关系数的情况下，多少个活跃因子可以被有效的筛选出来并且给出了筛选出来的活跃因子也是事实上真正的活跃因子的概率l i u 等( 2 0 0 6 ) 给出了当两个或更多活跃因子存在时，这些因子可以被正确筛选出来所允许的设计列之间的最大相关系数c h i p m a n 等( 1 9 9 7 ) 提出的b a y e s i a n 变量选择法用于处理具有复杂别名的试验设计，为超饱和设计的数据分析又提供了一种非常有效的方法然而所有这些分析方法都是基于主效应模型的，也就是假设交互效应不存在事实上，交互效应的存在与否并不取决于我们采用何种设计，而是客观存在的在分析因子设计时，我们发现二因子交互效应常常是存在且显著的所以在超饱和第一章引言设计的数据分析中，如果存在较为显著的交互效应而我们却乎略它，筛选结果通常是不准确的另一方面，h a m a d a 和w u ( 1 9 9 2 ) 对p b 设计的分析也启发我们，在适当的时候将交互效应引入超饱和设计的数据分析中 h a m a d a 和w u ( 1 9 9 2 ) 突破传统限制，首次将二因子交互作用引人到p b 设计的数据分析中，并通过实际例子说明这样做的合理性在这之前，对p b 设计的分析也是限于主效应模型的，因为p b 设计的自身限制，不能对全部的主效应和二因子交互效应进行分析d e n g ( 1 9 9 6 ) 指出饱和设计和超饱和设计的区别不是本质上的而是混杂程度上的，l i n ( 1 9 9 5 ) 指出这种混杂程度随因子数和试验次数差异的增大而增大由此我们认为，在适当的时候将二因子交互效应引人到超饱和设计的数据分析中也是合理的( 虽然超饱和设计不能估计全部的主效应，更别说交互效应) ，尤其是试验次数相对于真正活跃的主效应和交互效应个数较大的时候即试验中真正活跃的因子数较少，二因子交互效应确实存在且显著时，我们把交互效应引入数据分析是必要的本文通过计算机模拟分别讨论了在二因子交互效应存在时：( a ) 只建立主效应模型，活跃的主效应的误选漏选情况；) 将二因子交互效应引入数据分析时，对筛选准确性的改进；( c ) 二因子交互效应的显著程度是如何影响筛选结果的具体的数据模拟及基本结论放在第二章和第三章，第四章是讨论及扩展部分 2 第二章一个主效应和一个二因子交互效应的情形第二章一个主效应和一个二因子交互效应的情形本章讨论真实模型含有一个主效应和一个二因子交互效应的情形( 我们约定不显著的因子效应均为0 ) ，并且在试验次数不变的情况下，按照试验因子数由小到大的顺序分别进行模拟分析，然后再对这些模拟进行比较分析在所有的数据模拟中，本文均采用m a n a b 语言来编写数据模拟程序在这篇文章中，我们考虑的是包含二因子交互效应的模型： y = a t 五+ 忍x ，z ，j = 1 ，m i = 0 i j 2 1 数据模拟部分在这章的数据模拟部分，我们分别对4 个e ( s 2 ) 最优设计进行筛选模拟模型的选择原则采用拟合率( 兄2 ) 最大准则，并采用最优子集搜索的方法进行筛选我们首先选择一个试验因子数和试验次数比较接近的e ( s 2 ) 最优设计进行模拟，记为模拟2 1 取试验次数n = 6 ，试因子数m = 7 ( 我们约定始终用n 代表试验次数，m 代表试验因子数) 的e ( s 2 ) 最优设计，此设计的相关系数分别是士o 3 3 3 3 ， e ( s 2 ) - 1 0 设计阵见表2 1 ：表2 1 n = 6 ，m = 7 1 拘e ( 8 2 ) 最优超饱和设计对这个模拟，我们假定真实模型如下： y = 5 x 1 + 4 x 1 托+ ，一n ( 0 ，1 ) ( 2 1 ) 3 ，1 l 1 1 1，l，l x 一一一 r v 1 l 1 1- 1 1 l x 一一一 e u 1 1 1 1 l 1 i x 一一一 4 1 1 1 l 1 1 l 1 l x 一一一 3 1 1 工1 1 1 上1 x 一一一 n二1上l l l 1 l x 一一一 1-1l，工1上1上l x 一一一 m 1 2 3 4 5 6 n 第二章一个主效应和一个二因子交互效应的情形数据模拟如下： 1 数据的生成：用m a t l a b 语言中的r a n d o m 语句生成6 个均植为0 ，方差为1 的随机数然后用模型( 2 1 ) 生成观测向量，我们注意到在模型中只有因子x 1 ，x 1 恐的系数非零 2 数据分析：我们采用最优子集的分析方法首先对只含有1 个主效应的模型进行最优搜索，在只含1 个主效应的模型中选出拟合最好的；然后对只含有2 个主效应的模型进行最优搜索，在含有2 个主效应的模型中选出拟合最好的；最后对含有1 个主效应和1 个相关的二因子交互效应的模型进行最优搜索，选出拟合最好的模型相应的主效应和与此主效应相关的二因子交互效 3 重复第一步和第二步1 0 0 次，观察模拟结果的规律性，并记录每个模拟结果的频率百分比模拟结果如下： 1 在只含1 个主效应的模型的最优搜索中，主效应x 1 被1 0 0 选中，最大拟合率为0 7 5 8 3 ，最小的拟合率为0 5 1 7 6 2 在含有2 个主效应的模型的最优搜索中，组合x 1 ，x 3 和组合x 1 ，* 分别被选中，这两个组合分别被选中4 2 次和5 8 次，最大拟合率为0 9 4 3 8 ，最小拟合率为0 7 4 2 0 3 在含1 个主效应和1 个相关二因子交互效应的模型的最优搜索中，主效应蜀和交互效应x 1 咒被1 0 0 选中，最小拟合率为0 9 4 8 3 ，最大拟合率为0 9 9 9 8 下面要模拟的试验是在上面设计的基础上添加一个列，记为模拟2 2 且l j n = 6 ， m = 8 的e ( s 2 ) 最优设计，此设计的相关系数分别是4 - 0 3 3 3 3 ，e ( s 2 ) = 9 1 4 2 9 设计阵见表2 2 ：表2 2n - - 6 ，m = 8 的e ( 8 2 ) 最优超饱和设计我们假定真实模型仍然为( 2 1 ) 式，数据模拟方法同模拟2 1 模拟结果如下： 4 r v 1 1 l 1 1 1 l 1 l x 一一一 7 l 1 1上1，i，l x 一一一丘u l 1 上1 工l 1 上l x 一一一 5 1 1 1 ，i 1 l 1 l x 一一一 4 1 1 1 l 1 1 x 一一一 3 1 上1 1 1 1 1 x 一一一 o1- 1 1 l 1 l x 一一一 1 1 1 l 1 i 1 1，l x 一一一 m 1 2 3 4 5 6 n 第二章一个主效应和个二因子交互效应的情形 1 在只含1 个主效应的模型的最优搜索中，主效应x 1 被选中的频率为9 7 ，主效应被选中的频率为3 最大和最小的拟合率分别为0 7 5 0 6 ，0 5 0 1 9 2 在含2 个主效应的模型的最优搜索中，因子组合x 1 ，x 3 ；因子组合x 1 ，* 和因子组合x 。，拖分别被选中，且这三个组合被选中的频率基本相当最大和最小拟合率分别为：0 9 3 2 0 ，0 7 9 8 9 3 在含1 个主效应和1 个相关二因子交互效应的模型的最优搜索中，主效应蜀和交互效应托恐以8 3 的频率被选中主效应尥和交互效应托恐被选中的频率为1 7 我们第三个要模拟的设计是在上面设计的基础上再添加一个列，记为模拟2 3 1 l p n = 6 ，m = 9 的e ( 8 2 ) 最优设计，此设计的相关系数分别是士o 3 3 3 3 ，e ( 8 2 ) = 8 5 设计阵见表2 3 ：表2 3 n = 6 ，m - - 9 的e ( s 2 ) 最优超饱和设计我们假定真实模型仍然为( 2 1 ) ，数据模拟方法同模拟2 1 模拟结果如下： 1 在只含有1 个主效应的模型的最优搜索中，x 】被选中8 8 次，拖被选中8 次，弱被选中4 次，最小和最大拟合率分别为0 5 3 1 8 ，0 7 4 7 1 当我们把交互项系数提高至1 1 7 的时候，x 1 被选中0 次，尥被选中4 2 次，x 9 被选中5 8 次，最小和最大拟合率分别为0 5 2 9 3 和0 7 3 7 4 当我们把交互项系数提高n 8 的时候，x 1 被选中0 次，拖被选中4 9 次，托被选中5 1 次，最小和最大拟合率分别为0 5 4 9 4 ，0 7 0 9 3 2 在含有2 个主效应的模型的最优搜索中，因子组合五，x s ；x 1 ，x t ；x 1 ，x s ； x 1 ，托分别被选中且有相近的选中频率，五，组合；凰，x 9 组合分别被选中一次当交互项的系数提高到7 的时候，五，x g ；恐，x g ；蕊，x g ；x 8 ，x 9 组合分别被选中当交互项的系数提高n 8 的时候，虬，弱组合被选中的频率为8 8 ，且拟合率也较高，这说明二因子交互效应越显著，我们越有可能作出错误的选择 3 在含1 个主效应和1 个相关二因子交互效应的模型的最优搜索中，正确的因子组合被选中的频率为5 9 ，因子组合托，凰咒和组合，弱恐被选中的频率 5 弱。o o o 8 1 上1 1上1上1 1 x 一一一 7 1 1 上1 1 工1 1 x 一一一 6 1 l 1 1，l 1 1 l x 一一一 e u 1 1 1 1 l 1 x 一一一 4 1上1工l 1 工1 1 x 一一一 3 1工1上1 1 1 1 x 一一一 2 1 1 l 1 ，l 1 l x 一一一 11l l 1 1 1 x 一一一 n 1 2 3 4 5 6 n 第二章一个主效应和一个二因子交互效应的情形占4 1 当交互项的系数提高到7 的时候，正确的因子组合被选中的频率为9 3 当交互项的系数提高n 8 的时候，正确的因子组合被选中的频率为1 0 0 下面我们要模拟的试验是在上面的设计的基础上再添加一个列，记为模拟2 4 耳p n = 6 ，m = 1 0 1 拘e ( s 2 ) 最优设计，此设计的相关系数分别是土0 3 3 3 3 ，e ( s 2 ) = 8 设计阵见表2 4 ：表2 4n = 6 ，m = 9 的e ( s 2 ) 最优超饱和设计我们仍假定真实模型为( 2 1 ) ，数据模拟方法同模拟2 1 模拟结果如下： 1 在只含有1 个主效应的模型的最优搜索中，主效应蜀被选中8 8 次，x 8 被选中8 次，) 岛被选中4 次，最小和最大的拟合率分别为0 5 2 3 4 和0 7 9 4 2 当我们把交互项系数调n 5 的时候，主效应x 1 被选中3 0 次，凰和弱各被选中3 5 次，最小和最大的拟合率分别为0 5 0 8 0 ，0 7 0 4 5 当交互项系数调到7 的时候，主效应x 1 被选中o 次，托被选中4 6 次，弱被选中5 4 次，最小和最大的拟合率分别为0 5 2 5 7 ，0 7 1 4 8 2 在含有2 个主效应的模型的最优搜索中，因子组合x 1 和托被选中2 2 次，x 1 和 x 7 组合被选中2 9 次，x 1 和凰组合被选中1 6 次，x 1 和弱组合被选中2 6 次，五和妫组合，凰和玛组合分别被选中两次，凰和托组合，溉和尥组合，拖和x 1 0 组合分别被选中1 次，最小和最大的拟合率分别为0 8 2 5 8 和0 9 6 2 3 当交互项系数提高到7 的时候，因子组合尥和以6 5 的频率被选中，凰和碣组合以1 2 的频率被选中，最小和最大的拟合率分别为0 8 3 2 0 和0 9 3 6 9 当交互项系数提高到9 的时候，因子组合甄和托以9 8 的频率被选中，最小和最大的拟合率分别为0 8 4 5 2 和0 9 6 4 4 3 在含1 个主效应和1 个相关二因子交互效应的模型的最优搜索中，正确因子组合被选中的频率为5 5 ，最小和最大的拟合率分别为0 9 6 2 5 和0 9 9 9 8 当交互项的系数提高到7 的时候，正确的因子组合被选中的频率为9 5 当交互项的系数提高n 8 的时候，正确的因子组合被选中的频率为9 9 6 一一一 9，i，l 1 1 1 1 l x 一一一 8 1 1 1 1 l 1 x 一一一 7 l 1 1 1 1 l l x 一一一 6 1 1 1 1 l 1 上1 x 一一一 5 1 1 1 ，l 1 l l x 一一一 4 1 1 1 1 1 l 1 x 一一一 3 1 上1 1 l 1 上1 x 一一一 2 1 上l 1 上1 1 1 l x 一一一 1 1，l 1 1 1 1 l x 一一一仉1 2 3 4 5 6 n 第二章一个主效应和一个- - n 子交互效应的情形 2 2 模拟结果分析及结论模拟2 1 的结果表明在试验次数略小于试验因子数( 相差1 ) ，并且设计的因子间的最大相关系数( m a x l s l ) 也较小的时候，一个显著的二因子交互效应对于活跃因子的筛选有明显的影响在含1 个主效应的模型的最优搜索中，五虽然被1 0 0 选中，但模型的拟合率很低自然进行含2 个主效应的模型的最优搜索，结果因子组合五，弱和x ，蜀分别被选中，拟合率较含1 个主效应的模型有很大的提高，但因子组合x 1 ，托没被选中在这种情况下，我们很可能选用x 1 ，x 3 组合或x 1 ，局组合作为活跃因子即使进行跟随试验，交互作用x 1 x 2 也不可能被识别当采用含1 个主效应和1 个相关二因子交互效应模型进行最优搜索时，因子组合蜀和x 】托被1 0 0 选中，拟合率非常接近1 然而对这个模型，如果不存在交互效应，依据l i u ( 2 0 0 6 ) 的结论，我们能够识别出真正活跃的主效应通过模拟也证实了这一点，x 1 被1 0 0 选中这说明当二因子交互效应存在时，就能对筛选结果有很大影响，导致误选模拟2 2 的结果表明：在1 个主效应的模型的最优搜索中，五被选中的频率很高，但拟合率依然很低此时，自然要进行含2 个主效应的模型的最优搜索，因子x 1 ， * 组合；x 1 ，x 3 组合，x 1 ，凰组合以相近的频率被选中，拟合率都较高，因子组合x 】，托依然没被选中这样我们还是会误选，而且跟随试验也同样不能识别出真正活跃的交互效应在1 个主效应和1 个相关交互效应的模型的最优搜索中，真正的活跃因子x 1 ，咒托被选中的频率为8 3 ，正确的因子被选出的可能性依然很高我们同时也发现，相对于上个模拟，正确筛选活跃因子变得困难了这是因为试验因子数增加了，正确筛选需要更多的信息事实上当墨x 2 的系数提高n 7 时，真正的活跃因子就以9 6 的频率被选中五托的系数提高n 8 时，真正活跃的因子就以1 0 0 的频率被选中同样对这个模型，如果不存在交互效应，依据l i u ( 2 0 0 6 ) 的结论，我们能够识别出真正活跃的主效应我们通过模拟也证实了这一点，x 】被1 0 0 选中模拟2 3 的结果表明当设计中的因子数相对于试验次数比较多时( 试验次数不变，试验因子数增) j i 至u 9 个) ，二因子交互效应对活跃因子的筛选的影响仍然很大，即使考虑交互效应，要识别出真正活跃的因子也变得更困难但适当提高交互效应显著性后，正确筛选的可能性就很大! 但如果不考虑交互效应，因子组合凰，托被选中的可能性很大这时的筛选完全不合乎实际，跟随试验也不能提供任何有效 7 第二章一个主效应和一个二因子交互效应的情形信息对这个模型，如果不存在交互效应，依据l i u ( 2 0 0 6 ) 的结论，我们能够识别出真正活跃的主效应通过模拟x 1 被1 0 0 选中模拟2 4 的结果表明随着试验因子数增加到1 0 ，在采用2 个主效应的模型的最优搜索时，所有被选中的因子组合虽然包含五，但不包含因子组合蜀，恐跟随试验也不能识别出真正活跃的交互效应并且随着交互项系数的增加，凰和弱几乎肯定被选中，造成完全误选当考虑交互效应时，真正活跃因子组合被选中的频率5 5 ，依然很有可能做出正确的筛选这说明随着试验因子数的增加，即便考虑二因子交互效应，真正的活跃因子被选中的困难也增加了如果将交互项系数适当提高，就能以很大的把握选出真正活跃的因子同样对于这个模型，如果不存在交互效应，依据l i u ( 2 0 0 6 ) 的结论，我们能够识别出真正活跃的主效应模拟表明x 1 被1 0 0 选中综合以上分析，我们得出如下结论：对于模型( 2 1 ) ，当试验次数和试验因子数比较接近( 前两个模拟) 的时候，如果我们在筛选时不考虑交互效应，我们误选主效应的可能性很大，并且后续的跟随试验根本不能将真正的活跃因子识别出来并且相对于主效应而言，交互效应的显著性越大越容易误选，甚至做出完全错误的结果而本文提出的二因子效应模型对于正确筛选活跃因子有极大的提高作用进一步，随着交互效应显著性的增加，这种作用就越明显，筛选的正确率越高对试验次数和试验因子数相差较大( 后两个模拟) 的设计，如果在筛选时不考虑交互效应，就更有可能选出完全不合乎实际的因子如果在筛选时考虑了交互效应，虽然不能再像前面的两个模拟那样几乎肯定筛选正确，但正确筛选的可能性依然很大，这是因为试验本身提供的信息太少所致但是通过上面的模拟分析，我们发现随着交互效应显著性的增加，筛选的正确率也会提高综上所述，显著的交互效应对筛选活跃因子都有非常大的影响如果筛选时不考虑交互效应，几乎肯定误选或漏选，甚者选出的因子与实际情况完全不符但如果考虑了交互效应，就很有可能筛选出真正的活跃因子这说明一个试验存在显著的交互效应时，我们在筛选时将交互效应考虑进来，对筛选结果的正确性会有很大的提高 8 第三章两个主效应和一个二因子交互效应的情形第三章两个主效应和一个二因子交互效应的情形本章我们讨论真实模型含有2 个显著的主效应和1 个显著的二因子交互效应的情形( 我们依然约定不显著的因子效应均为0 ) ，同样在试验次数不变的情况下，按照试验因子数由小到大的顺序分别进行模拟分析，然后再对这些模拟进行比较分析 3 1 数据模拟部分在这章的数据模拟部分，我们分别对4 个e ( s 2 ) 最优设计进行筛选模拟模型的选择原则仍然采用拟合率( 兄2 ) 最大准则，并采用最优子集搜索的方法进行筛选本章始终假设真实模型为模型( 3 1 ) ：可= 5 x 1 + 3 配+ 5 x 1 x 2 + g ，一n ( 0 ，1 ) ( 3 1 ) 我们首先对n = 6 ，m = 7 1 拘e ( s 2 ) 最优设计进行模拟，记为模拟3 1 此设计的相关系数分别是土0 3 3 3 3 ，e ( 8 2 ) = 1 0 设计阵见表3 1 ：表3 1n = 6 ，m = 7 的e ( s 2 ) 最优超饱和设计数据模拟如下： 1 数据的生成：首先我们用m a t l a b 语言中的r a n d o m 语句生成6 个均植为o ，方差为1 的随机数然后用模型( 3 1 ) 生成观测向量，我们注意到在这个模型中只有效应x 1 ，x 2 和x 1 恐的系数非零 2 数据分析：我们采用最优子集的方法首先对含2 个主效应的模型进行筛选，选出活跃的因子组合；然后对含3 个主效应的模型进行筛选，选出相应的因子组合； 9 * 。o o o 。 o ，l 1 1 1 l 1 1 l x 一一一 e u l 1 1 上l 1 1 x 一一一 4 1 1 工1 1 1 1 x 一一一 3 1 1 1 1 1 工1 x 一一一 2 1 1 1 1 1 上1 x 一一一 1 l 1 l l 1 1 1 x 一一一 n 1 2 3 4 5 6 n 第三章两个主效应和个二因子交互效应的情形最后对含2 个主效应和1 个相关二因子交互效应的模型进行筛选，选出活跃的主效应和相关二因子交互效应 3 重复第一步和第二步1 0 0 次，观察模拟结果的规律性，并记录每个模拟结果的频率百分比模拟结果如下： 1 在含2 个主效应的模型的最优搜索中，x 】和恐组合被选中的频率为3 6 ，x 1 和* 组合被选中的频率为4 0 ，x 1 和弱组合被选中的频率为2 4 ，最小和最大的拟合率分别为：0 6 0 3 1 ，0 7 6 5 0 当交互项的系数提高n 8 的时候，五和托组合被选中的频率o ，x 1 和托组合被选中的频率为4 0 ，x 1 和弼组合被选中的频率为5 9 ，最小和最大的拟合率分别为：0 5 3 6 7 和0 7 4 6 1 当交互项的系数提高到1 0 的时候，五和x 2 组合被选中频率为o ，x 1 和托组合被选中的频率为5 4 ，x ，和为组合被选中频率为4 5 ，最小和最大的拟合率分别为：0 5 1 6 7 和0 6 8 6 8 2 在含3 个主效应的模型的最优搜索中，因子组合蜀，咒和* 被选中4 7 次；x 1 ，恐和托被选中3 7 次最小和最大的拟合率分别为：0 8 3 3 4 ，0 9 5 3 1 当交互项的系数提高n 8 的时候，置，托和x 7 组合的选中频率为1 0 ；x 1 ，恐和咒组合的选中频率为3 ；x l ，恐和恐组合的选中频率为3 9 ；x a ，x 3 和拖组合被选中的频率为2 5 ；x 1 ，x 4 和姊组合被选中的频率为2 3 ；最小和最大的拟合率分别为：0 7 8 5 9 ， 0 8 9 6 2 当交互项的系数提高到l o 的时候，x 1 ，托和拖组合被选中的频率为3 3 ； x 1 ，托和风组合被选中的频率为2 4 ；x 1 ，x 4 和曷组合的选中频率为4 0 3 在含2 个主效应和1 个相关交互效应的模型的最优搜索中，主效应蜀和交互效应x 1 被选中的频率为3 0 ，最小和最大的拟合率分别为：0 9 8 6 2 ，1 0 0 0 0 当交互项的系数提高到8 的时候，正确因子选中频率提高到5 2 ，最小和最大的拟合率分别为：0 9 8 2 5 和0 9 9 9 9 当交互项的系数提高到1 0 的时候，正确因子被选中频率提高至! u 7 1 ，最小和最大的拟合率分别为：0 9 9 2 5 和1 0 0 0 0 接下来对n = 6 ，m = 8 的e ( s 2 ) 最优设计进行模拟，记为模拟3 2 此设计的相关系数分别是士0 3 3 3 3 ，e ( s 2 ) = 9 1 4 2 9 设计阵见表3 2 ：我们仍假设真实模型为( 3 1 ) ，且数据模拟方法同模拟3 1 模拟结果如下： 1 在含2 个主效应的模型的最优搜索中，x 1 和磁组合被选中的频率为o ；咒和尥因子组合被1 0 0 选中，最小和最大的拟合率分别为：0 6 6 9 1 和0 8 9 8 9 当交互项系数提高n 8 的时候，* 和磁组合选中频率为0 ；x 1 ，托组合被选中的频率为4 4 ；x 5 和抵组合被选中的频率为5 6 ，最小的和最大的拟合率分别为：0 6 6 8 8 和 0 8 4 7 8 当交互项系数提高n l o 的时候，x 1 和恐被选中的频率为o ；x 5 ，凰组合被选中的频率为9 7 ；x 1 ，凰组合被选中的频率为l ；最小和最大的拟合率分别 1 0 第三章两个主效应和一个二因子交互效应的情形表3 2 n = 6 ，m = 8 1 拘e ( 8 2 ) 最优超饱和设计为0 6 9 8 9 和0 8 4 4 3 2 在含3 个主效应的模型的最优搜索中，因子组合五，墨和被选中4 5 次，因子组合x 1 ，x 4 和恐被选中5 1 次，其它因子组合分别被选中很少的次数，最小和最大的拟合率分别为0 8 7 6 4 ，0 9 6 8 2 当交互项系数提高n 8 的时候，x 5 ，拖和尥组合被选中9 9 次；x 】，和尥组合被选中一次，最小和最大的拟合率分别为：0 9 0 4 9 ， 0 9 8 6 5 当交互项的系数为l o 的时候，恐，和凰因子组合被1 0 0 选中，最小和最大的拟合率分别为0 9 6 2 9 ，0 9 9 9 8 3 在包含2 个主效应和1 个相关交互效应的模型的最优搜索中，x 1 和x 1 磁组合被选中的频率为2 1 ；x 2 和托* 组合被选中的频率为1 1 ；x 3 和五组合被选中的频率为2 3 ；x 】和x 】恐组合被选中的频率为1 3 ；曷和x t x 4 组合被选中的频率为1 0 ；最小和最大的拟合率分别为：0 9 9 0 2 和1 0 0 0 0 当交互项系数提高 n 8 的时候，真正活跃的因子组合被选中频率提高到3 3 ，最小和最大的拟合率分别为：0 9 8 7 5 和1 0 0 0 0 当交互项系数提高至1 1 0 的时候，真正活跃的因子组合被选中频率提高n 5 0 ，最小和最大的拟合率分别为：0 9 8 8 9 和1 0 0 0 0 本章第三个要进行的模拟是n = 6 ，m = 9 的v ( s 2 ) 最优设计，记为模拟3 3 此设计的相关系数分别是士0 3 3 3 3 ，e ( s 2 ) = 8 5 设计阵见表3 3 ：我们仍假设真实模型为( 3 1 ) ，且数据模拟方法同模拟3 1 模拟结果如下： 1 在含有2 个主效应和1 个相关交互效应的模型的最优搜索中，因子组合x 1 和 x 1 托被选中的频率为1 3 ，最小的和最大的拟合率分别为：0 9 9 3 4 和1 0 0 0 0 当交互项系数提高n 8 的时候，因子组合x 1 和x 1 犸被选中频率提高到1 9 ，最小和最大的拟合率分别为：0 9 8 8 7 1 和1 0 0 0 0 当交互项系数提高到1 0 的时候，因子组合墨和x 1 x 2 被选中频率提高到4 5 ，最小和最大的拟合率分别为：0 9 8 5 1 和1 0 0 0 0 2 在含2 个主效应的模型的最优搜索中，因子组合x 1 和为被选中的频率为o ，因子组合五，甄被选中的频率为3 6 ，因子组合尥，托被选中的频率为6 4 ，最 8 l 1 1 上1 1 1 l x 一一一 1 1 1 1 l 1 x 一一一 6 1 1工1上1 1 1 x 一一一 5 1 l 1 1 1 l 1 x 一一一 4 1上1上l 1 工1 1 x 一一一 3 1 1 1 1 1 1 x 一一一 2 1 1 l 1 l 1 1 x 一一一墨o 1。o o 。 n 1 2 3 4 5 6 n 第三章两个主效应和一个二因子交互效应的情形表3 3n = 6 ，m = 9 1 勺e ( s 2 ) 最优超饱和设计 n o x 1x 2 x 3 x 4 x 5x 6x 7x 8x 9 111111l111 2111111111 3l一1 l 1一l一1111 4111111111 5111111111 61 11l1 1 11 l 小和最大的拟合率分别为：0 7 8 6 4 ，0 9 2 7 7 当交互项系数提高到8 的时候，因子组合五和恐选中频率为0 ，因子组合x s ，x 9 被1 0 0 选中，最小和最大的拟合率分别为：0 8 8 2 4 和0 9 8 5 6 当交互项系数提高到l o 的时候，因子组合x 】和恐选中频率o ，最小和最大的拟合率分别为0 9 3 7 4 和0 9 9 5 7 ，因子组合，x 9 被1 0 0 选中 3 在含3 个主效应的模型的最优搜索中，因子蜀，托，托组合以9 3 的频率被选中最小和最大的拟合率分别为：0 9 4 0 6 ，0 9 9 7 7 当交互项的系数为8 的时候， x 1 ，尥，x 9 的选中频率为9 5 ，最小和最大的拟合率分别为：0 9 8 3 3 和1 0 0 0 当交互项的系数为1 0 的时候，x 1 ，托，托的选中频率为8 8 ，最小和最大的拟合率分别为0 9 9 01 和0 9 9 9 9 最后取n = 6 ，m = 1 0 的e ( s 2 ) 最优设计进行模拟，记为模拟3 4 此设计的相关系数分别是4 - 0 3 3 3 3 ，e ( s 2 ) - - 8 设计阵见表3 4 ：表3 4 n = 6 ，m = 9 1 拘e ( s 2 ) 最优超饱和设计 x 3 x 4x 5 x 6x 1x 8 x 9x l o 一1 1111111 1111111 1 11111111 1111 1 11 1 11111111 11111111 我们仍假设真实模型为( 3 1 ) ，且数据模拟方法同模拟3 1 模拟结果如下： 1 在含2 个主效应的模型的最优搜索中，因子组合x 1 和咒被选中的频率为o ，因子组合尥，托的选中频率为2 7 ；因子组合x 1 ，凰选中频率为3 9 ；因子组合x 1 ，秭选中频率为3 4 ；最小和最大的拟合率分别为：o 8 0 1 6 ，0 9 1 3 9 当交互项系数提 1 2 2 1 上，i 1 工，上 1 ，l x 一一一墨o 。o o 。 n 1 2 3 4 5 6 n 第三章两个主效应和一个二因子交互效应的情形高n 8 的时候，因子组合x 1 和配选中频率o ；因子组合甄和硒1 0 0 选中；最小和最大的拟合率分别为：0 9 0 3 1 和0 9 8 1 3 当交互项系数提高至l j l 0 的时候，因子组合x 】和恐选中频率o ，因子组合尥，凰被1 0 0 选中，最小和最大的拟合率分别为：0 9 4 8 6 和0 9 9 6 2 2 在含3 个主效应的模型的最优搜索中，x 1 ，尥和弱组合以9 3 的频率被选中，最小和最大的拟合率分别为：0 9 2 1 7 ，1 0 0 0 0 当交互项系数为8 的时候，x 1 ，托和组合的选中频率为9 6 ，最小和最大的拟合率分别为：0 9 8 5 2 和1 0 0 0 当交互项系数为l o 的时候，x 1 ，和托的选中频率为8 4 ，最小的和最大的拟合率分别为0 9 8 7 7 和1 0 0 l o o 3 在2 个主效应和1 个相关交互效应的模型的最优搜索中，因子组合x ，和蜀x 2 被选中的频率为1 0 ，最小的和最大的拟合率分别为0 9 9 3 7 和1 0 0 0 0 当交互项系数提高n 8 的时候，因子组合x 1 和x 1 被选中频率提高到2 l ，最小和最大的拟合率分别为0 9 9 1 7 和1 0 0 0 0 当交互项的系数提高到1 0 的时候，因子组合x 1 和x 1 x 2 被选中频率提高到4 3 ，最小和最大的拟合率分别为0 9 9 0 4 和1 0 0 0 0 3 2 模拟结果分析及结论模拟3 1 说明在含2 个主效应的模型的最优搜索中，真正的活跃主效应x 1 和x 2 被选中的频率很低，而且当交互项系数提高到到一定程度的时候，会完全误选在含3 个主效应的模型的最优搜索中，包含x 。和磁( 如：x 1 ，x 2 和恐组合，x 1 ，恐和曷组合) 的因子组合被选中的可能性较大，这时真正活跃的主效应被选中的可能性很大但随着交互项系数的提高到一定程度，这样的因子组合完全不能被选中但当采用包含二因子交互效应的模型进行最优搜索，真正活跃的因子( 以墨，x 。恐组合；或，磁咒组合为标准) 被选中的可能性很大当交互项系数提高到一定程度的时候，活跃因子被选中的可能性有很大提高对于这个设计及模型( 3 1 ) ，当不存在交互效应的时候，依据l i u ( 2 0 0 6 ) 的结果，我们能构正确筛选出活跃因子数据模拟也验证了这个事实

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（概率论与数理统计专业论文）交互效应存在时超饱和设计的数据分析模拟.pdf

文档简介

温馨提示

最新文档

评论

（概率论与数理统计专业论文）交互效应存在时超饱和设计的数据分析模拟.pdf

文档简介

温馨提示

最新文档

评论

相关文档