试验设计与数据处理_第1页
试验设计与数据处理_第2页
试验设计与数据处理_第3页
试验设计与数据处理_第4页
试验设计与数据处理_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、试验设计与数据处理方法总述及总结 王亚丽 (数学与信息科学学院 08统计1班 081120132)摘要:实验设计与数据处理是一门非常有用的学科,是研究如何经济合理安排试验可以解决社会中存在的生产问题等,对现实生产有很重要的指导意义。因此本文根据试验设计与数据处理进行了总述与总结,以期达到学习、理解、掌握的以及灵活运用的目的。1 试验设计与数据处理基本知识总述1.1试验设计与数据处理的基本思想试验设计与数据处理是数理统计学中的一个重要分支。它是以概率论、数理统计及线性代数为理论基础,结合一定的专业知识和实践经验,研究如何经济、合理地安排实验方案以及系统、科学地分析处理试验结果的一项科学技术,从而

2、解决了长期以来在试验领域中,传统的试验方法对于多因素试验往往只能被动地处理试验数据,而对试验方案的设计及试验过程的控制显得无能为力这一问题。1.2试验设计与数据处理的作用(1) 有助于研究者掌握试验因素对试验考察指标影响的规律性,即各因素的水平改变时指标的变化情况。(2) 有助于分清试验因素对试验考察指标影响的大小顺序,找出主要因素。(3) 有助于反映试验因素之间的相互影响情况,即因素间是否存在交互作用。(4) 能正确估计和有效控制试验误差,提高试验的精度。(5) 能较为迅速地优选出最佳工艺条件(或称最优方案),并能预估或控制一定条件下的试验指标值及其波动范围。(6) 根据试验因素对试验考察指

3、标影响规律的分析,可以深入揭示事物内在规律,明确进一步试验研究的方向。1.3试验设计与数据处理应遵循的原则(1) 重复原则:重可复试验是减少和估计随机误差的的基本手段。(2) 随机化原则:随机化原则可有效排除非试验因素的干扰,从而可正确、无偏地估计试验误差,并可保证试验数据的独立性和随机性。(3) 局部控制原则:局部控制是指在试验时采取一定的技术措施方法减少非试验因素对试验结果的影响。用图形表示如下:2试验设计与数据处理方法总述和总结2.1方差分析(1) 概念: 方差分析是用来检验两个或两个以上样本的平均值差异的显著程度。并由此判断样本究竟是否抽自具有同一均值的总体。(2) 优点:方差分析对于

4、比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时,是非常有用的。(3) 缺点:对所检验的假设会发生错判的情况,比如第一类错误或第二类错误的发生。(4) 基本原理:方差分析的基本思路是一方面确定因素的不同水平下均值之间的方差,把它作为对由所有试验数据所组成的全部总体的方差的第一个估计值;另一方面再考虑在同一水平下不同试验数据对于这一水平的均值的方差 ,由此计算出对由所有试验数据所组成的全部数据的总体方差的第二个估计值。比较上述两个估计值,如果这两个方差的估计值比较接近就说明因素的不同水平下的均值间的差异并不大,就接受零假

5、设;否则,说明因素的不同水平下的均值间的差异比较大。(5)数据处理基本步骤:定义总离差和为各样本观测值与总均值的离差平方和, 其中 :样本均值,即 式中:样本观测值总数 对离差平方和分解如下: 式中: 第个样本的均值即 交叉项: 令 其中,刻画了全部次试验中纯粹由随机因素影响所产生的离差平方和,简称为组内平方和,也称为误差平方和。刻画了因素水平的差异对数据离散型的作用,称为组间平方和,或因素平方和。例如 四种不同灯丝配料方案数据如下,问灯丝配料方案对灯泡使用寿命有无显著影响?解:运用方差分析发得总试验次数 计算如下: 灯泡品种 试验结果/h1600 1610 1650 1680 1700 17

6、20 1800 1580 1640 1640 1700 1750 1460 1550 1600 1620 1640 1660 1740 1820 1510 1520 1530 1570 1600 1680 将上述各项计算出结果后,可利用方差分析表进行方差分析表-1 方差分析表方差来源 离差平方和 自由度 均方差 统计检验量 显著性配料方案 44360.71 3 14786.90 2.15误差 15135.83 22 6879.58总方差 195711.54 25(6) 结论 : 从分布表中差得,因为故接受,即可认为灯丝不同配料方案对灯泡使用寿命无显著影响,亦可说明各方案都可制作灯泡。但在实际生

7、产中可选用工艺简单、造价经济的配料方案,进行方差分析的目的也在此。2.2正交试验设计(1) 基本思想:正交试验设计利用正交表即可对试验进行合理安排,挑选少数具有代表性的组合处理试验以少代多,又可对实施的少数个组合处理结果进行科学的分析,做出正确的结论以少求全。(2) 优点:正交试验设计从全面试验中挑选部分试验点进行试验,减少试验次数,且试验点均匀分散,整齐可比。(3) 缺点:为了照顾整齐可比,试验点有时不能保证均匀分散,且试验点的数目就会比较多(试验次数随水平数的平方而增加).(4) 表示符号: ,其中是正交表代号,是行数(安排试验次数),是因素水平数,是列数(最多安排因素个数)(5) 性质:

8、(1)表中任何一列,各水平都出现,且出现次数相等。 (2)表中任意两列之间,各种不同水平的所有可能组合都出现,且 出现的次数相等。(6) 正交试验设计和数据处理步骤 :(1)明确试验目的,确定试验指标(2)挑选因素与水平,制定因素水平表(3)选择正交表,并进行表头设计(4)确定试验方案例题:乙醇溶液提取葛根中有效成分的试验,试验考察指标有3项:提取物得率,提取物中葛根总黄酮含量,总黄酮中葛根素含量,且3个指标越大越好。选取3个相对重要的因素:乙醇浓度,液固比和提取物回流次数进行正交试验。解:运用综合平衡法,不考虑交互作用,选用正交表安排试验,试验和结果表如表-2表-2 葛根有效成分提取试验方案

9、与结果 试验方案 试验结果试验号 a乙醇浓度% b液固比 c回流次数提取物得率/%葛根总黄酮含量/%葛根素含量/%111116.25.12.121 2227.46.32.5313337.87.22.6421238.06.92.4522317.06.42.5623128.26.92.5731327.47.32.8832138.28.03.1933216.67.02.2 先对各指标分别进行直观分析,分别得出因素的主次和最优组合条件,结果如表-3:表-3 葛根有效成分提取试验结果分析试验结果 空列 提取物得率/%21.421.622.619.823.222.622.023.022.222.622.2

10、24.07.137.207.536.607.737.537.337.677.407.537.408.00极差1.81.00.64.2因素主次 最优组合条件 或 葛根总黄酮含量/%18.619.320.018.520.220.720.220.522.321.120.922.16.206.436.676.176.736.906.736.837.437.036.977.37极差3.71.80.93.6因素主次 最优组合条件 葛根素含量/%7.27.37.76.87.48.17.17.88.17.37.98.12.402.432.572.272.472.702.372.602.702.432.632.

11、70极差0.90.80.81.3因素主次 最优组合条件 再进行综合平衡分析得,最优组合条件,即乙醇浓度70%,液固比为6,回流3次。2.3均匀实验设计 (1) 概念:均匀实验设计就是只考虑试验点在试验范围,是部分因子设计的主要方法之一,它适用于多因素多水平的试验设计场合,试验次数等于因素的水平数,是大幅度减少试验次数的一种优良的试验设计方案。(2)特点:(1)每个因素的每个水平做一次且仅做一次试验。(2)任两个因素的试验点点在格子上,每行每列有且仅有一个试验 点,且这两点反映了试验安排的均衡性。(3)均匀设计表任两列组成的试验方案一般并不等价。(4) 当因素的水平数增加时,试验数按水平数的增加

12、在增加。(3)思想:均匀试验设计沿用近30年来发展起来的“回归设计”方法,运用控制论中的“黑箱”思想,把整个过程看作一个“黑箱”,把参与试验的因素,通过运用均匀设计法安排试验,并作为系统的输入参数而把试验指标(结果),作为输出参数(如图-1所示)。 系 统 (黑箱) 图-1 试验因素(输入)与试验指标(输出)系统 在数学上可以把输出参数与输入参数的关系用函数式表示 函数的模型对不同的系统可根据理论或凭经验进行假设,然后根据试验结果运用回归分析等方法确定模型中的系数。(4)优点:“均匀设计”方法的思路是去掉“整齐”可比的要求,通过提高试验点“均匀分散”的程度,使试验点具有更好的代表性,使得能用较

13、少的试验获得较多的信息。(5)表示符号:,其中,“”表示均匀设计,小标“”表示要做次试验,括号中“”表示每个因素有个水平(试验时水平数可以小于试验次数,但必须能被试验次数整除),“”表示该表有个因素(列),的右上角加“*”和不加“*”分别代表两种不同类型的均匀设计表。示例 表-4 1 2 3 1 1 2 42 2 4 33 3 1 214 4 3 15 5 5 5 的使用表因素数 列号 d2 1 2 0.31003 1 2 3 0.4570(7) 试验数据处理及步骤:具体步骤见例题例题:考虑一个三状态和两状态以及之定性因素的均匀设计。我们选的表如下所示 状态对应3个特征变量我们选其中2个;状态

14、对应2个特征变量,我们选,状态对应2个特征变量,我们取。这是可列出含有4个虚拟变量的回归方程为:建立回归方程后再求解即可,此处不再赘述。(8) 均匀试验设计应特别注意的问题:(1)试验次数为奇数时的均匀试验设计表的问题,对策之一在因素排列水平不变的条件下,将均匀设计表中某些列从上到下的水平号码做适当的调整,也就是将原来最后一个水平与第一个水平衔接起来,组成一个封闭圈,然后从任意一处开始定为第一水平,按原方向或相反方向排出第二水平、第三水平等等;对策之二改变因素水平的排列顺序。(2)选用的均匀设计表的试验次数应大于回归模型中回归系数的个数。2.4回归正交试验设计(1)回归正交试验简介:正交试验设

15、计是将试验安排与数据的回归分析结合起来考虑,在试验中,通过适当地安排试验点,使得在每个试验点上的获得的数据含有最大的信息,并且各自变量(因素)向量间满足正交性以便于回归分析;然后再用回归分析处理试验数据,将试验指标与被考察的各因素间的关系以回归方程表示出来。回归正交设计兼容了正交试验设计与回归分析的优点,是一种优良的试验设计方法。(2)一次回归正交试验设计模型:一次回归正交设计就是利用回归正交原理,建立试验指标(y)与m个试验因素,之间回归方程: 式中:回归模型的参数 模型的自变量(3) 一次回归正交试验设计的基本方法 (1)确定因素的变化范围,根据试验指标y,选择需要考察的m个因素,并确定每

16、个因素的取值范围。一般地说,上限于与下限的距离愈小,愈接近最佳水平范围,试验求得的回归方程的预测性就越好。设因素的变化范围为,分别称和为因素的下限和上限,并将它们的算术平均值称为零水平,即 上限与零水平之差称为因素的变化区间,用表示,即 (2)对因素的水平进行编码,编码的目的是为了将试验效应y对因素的回归关系转化为y对编码值的回归关系。编码值为 编码以后,试验因素被编为-1,0,和1,即一般称为自然变量,为规范变量。(3) 确定零水平的重复次数,零水平取值是各个因素的基准水平,其重复的次数应根据实际情况和实验要求而定。(4) 选择合适的正交表,回归正交表有如下特点1)任一列编码的和为0.即 2) 任两列编码的乘积之和等于零,即 (4)一次回归正交试验设计的统计分析:1)一次回归方程的建立,如果采用二水平正交表编制m元一次回归正交设计,一共进行了次试验,其试验结果以,则一次回归的数学模型为 根据最小二乘原理建立回归方程,可得回归系数为 (5) 二次回归正交组合设计及基本步骤: 正交组合设计由三类试验点组成,即二水平试验点、星号试验点和零水平点。二次回归正交组合设计的基本步骤为1)因素水平的编码 设与,为因素的上下星号臂水平,则与为因素的上下限,于是有 所以该因素的变化间距为 然后对因素的各个水平进行线性变换,得到水平的编码为 这样,编码公式就将因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论