高级生物统计045课件_第1页
高级生物统计045课件_第2页
高级生物统计045课件_第3页
高级生物统计045课件_第4页
高级生物统计045课件_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五节混料设计一、混料设计的概念与特点在工农业生产和科学研究中,时常会遇到配方配比问题。比如,将若干种成分(ingredient)按百分比混合在一起形成混料,混料的某种特性或综合性能只与混料成分的百分比有关,而与混料的总量无关。这种情况一般采用混料试验(experimentwithmixtures),即在各种混料成分的变化范围受到一定约束条件限制的情况下,通过试验探索各成分的百分比与试验研究指标之间的关系。在混料试验中,组成混料的各种成分至少应有三种,它们就是混料试验中的试验因素。混料成分也称为混料分量(component)。混料试验设计(designofexperimentswithmixtures)是在Scheffe(1958)提出单纯形格子设计以来发展起来的一种试验设计方法。所谓混料试验设计,就是合理地设计混料试验,通过各混料成分不同百分比的一些组合试验,获得试验指标与各混料成分百分比之间的线性或非线性的回归方程的设计方法,简称混料设计(designwithmixtures)。混料设计的特点

第一,混料设计是一种回归设计,因为混料试验一般都要求获得试验指标与各混料成分百分比之间的回归方程。

混料设计就受到这一约束条件的限制。因此,混料设计是回归设计中的一类特殊情况,是受到特殊条件约束的回归设计。在混料试验中,试验因素都是无量纲的,它们满足约束条件(4—68)。

第二,由于混料设计受到上述约束条件的限制,因此混料设计的回归方程比一般回归设计的回归方程更加简单。任何一个混料试验的设计,总是与混料成分的个数p和回归方程的次数d(d≤p)有关的。因此,我们用{p,d}来表示一个混料设计。在{3,2}混料设计中,其回归方程为它是由一般的三元二次回归设计的回归方程在混料约束条件(4—68)下得到的更加简化的形式。令则(4—71)式变为将bi'、bij'仍然写成bi、bij即得到{3,2}混料设计的回归方程(4—69)。

一般情况下,混料设计的回归方程常采用Scheffe形式。d=1时,回归方程为d=2时,回归方程为d=3时,不完全式回归方程为d=3时,完全式回归方程为

{p,d}混料设计的Scheffe式回归方程中需要估计的回归系数的个数,比一般的p元d次回归设计的回归方程少。例如,{p,2}混料设计比p元二次回归设计减少了p+1个回归系数,要获得{p,2}混料设计的回归方程,至少可以少做p+1次试验,即至少可以少p+1个观测值。

第三,如上所述,与一般的回归设计相比,混料设计可以减少试验的次数,使回归方程的计算简捷,分析容易,也便于寻求最佳的混料条件。目前,混料设计的方法已有多种,除了前面提到的单纯形格子设计外,尚有单纯形重心设计、有下界约束的混料设计、轴设计、凸多面体设计、多项式—例数设计、Cox混料设计、混料均匀设计等。本书只介绍单纯形格子设计和单纯形重心设计两种常用的设计方法。二、单纯形格子设计与统计分析

(一)设计方法

单纯形格子设计(simplexlatticedesign)又叫单纯形点阵设计。它是混料设计中最先出现的、最基本的一种设计方法。其特点是,试验点可以取在正规单纯形的格子点上,它可以保证试验点分布均匀,而且计算简单、准确。单纯形格子设计的试验次数,正好等于所采用的d次完全式回归方程中需要估计的回归系数的个数,所以它是饱和设计。

在{p,d}混料试验设计中,各混料成分构成了试验的p维因子空间。由于受到混料约束条件(4—68)的限制,因此各成分的变化范围可用高是1的p维正单形表示。所谓正单形,就是顶点数与因子空间维数相等的正凸图形,如3维空间的正三角形、4维空间的正四面体等。正单形的顶点代表单一成分组成的混料,棱上的点代表两种成分组成的混料,面上的点代表多于两种而少于p种成分组成的混料,而正单形内的点则代表全部p种成分组成的混料。

对于{p,d}混料设计,其p维正单形的p个顶点可分别表示为D1(1,0,0,…,0),D2(0,1,0,…,0),…,Dp

(0,0,0,…,1)。假设M(x1,x2,…,xp)为正单形的内点,定义x1为M点到D2D3…Dp面的距离,x2为M点到D1D3…Dp面的距离,…,xp为M点到面D1D2…Dp-1的距离。

显然x1+x2+x3=1{p,d}混料设计就是在p维正单形上选取适当的点进行试验,从而估计试验指标与各混料成分百分比之间的回归方程。1、{p,1}单纯形格子设计p维正单形在p-1维上就是所谓的单纯形。如前所述,由3种成分构成的3维正单形在2维(平面)上是一个正三角形;而由4种成分构成的4维正单形在3维(立体空间)上是一个正四面体。但通常在混料设计中,并没有严格区分正单形和单纯形的概念。2、{p,2}单纯形格子设计

这种设计除了选取p维正单形的顶点作为试验点外,还选取棱上的点进行试验,其设计编码如表4—57所示,共有Cp+12个试验点。3、{p,3}单纯形格子设计

该设计的试验点包括p维正单形的p个顶点,一个因子为1/3、另一因子为2/3、其余因子为0的p(p-1)个棱上点,以及三个因子为1/3、其余因子为0的Cp3个面上点,其设计编码如表4—58所示,共有Cp+23个试验点。单纯形格子设计的两个特点

第一,单纯形格子设计的水平组合数恰好等于回归方程中需要估计的回归系数的个数。试验点对称地排列在正单形上,构成正单形的一个格子,称为{p,d}格子;例如,{3,2}单纯形格子设计共有6个试验点,在正单形上的位置见图4—7,其设计编码见表4—59。【例4·15】编制一个{3,2}单纯形格子设计的试验方案。

第一步,明确试验研究的目的,根据试验目的确定混料的各种成分(即试验因素)。本例中混料成分的个数p=3。第二步,按照专业知识的要求,根据各混料成分所占百分比的范围,确定出试验研究范围内各成分百分比的最小值。用Z1、Z2、Z3表示混料中3种成分的百分比,用a1、a2、a3表示3种成分百分比的最小值。

第四步,确定各成分的实际百分比Zi与编码值xi之间的对应关系。其转换公式为:将a1=0.2,a2=0.4,a3=0.2代入,可得Z1=0.2x1+0.2,Z2=0.2x2+0.4,Z3=0.2x3+0.2。第五步,根据上式计算各试验点各成分的实际百分比,形成{3,2}单纯形格子设计的试验方案,见表4—59。(二)统计分析

单纯形格子设计统计分析的主要内容是由试验结果估计回归方程中的回归系数,从而得到混料的某种特性或综合性能与混料成分百分比的关系。

在单纯形格子设计中,回归方程的回归系数都可以表示成相应格子点的响应值(responsevalue)的简单线性组合。每一个回归系数的值只取决于按一定规律对应的一些格子点上的响应值,而与其他格子点上的响应值无关。比如,一次项的回归系数只由表示单一成分的正单形顶点的响应值决定,二次项的回归系数只受表示两种成分的正单形棱上点的响应值影响。所以,单纯形格子设计回归系数的计算非常简单。单纯形格子设计试验结果的符号表示

yi表示xi的编码值为1,其余成分的编码值为0的试验点的试验结果,i=1,2,…,p;

yij表示xi、xj的编码值为1/2,其余成分的编码值为0的试验点的试验结果,i,j=1,2,…,p;i≠j;

yiij表示xi的编码值为2/3,xj的编码值为1/3,其余成分的编码值为0的试验点的试验结果,i,j=1,2,…,p;i≠j;

yijj表示xi的编码值为1/3,xj的编码值为2/3,其余成分的编码值为0的试验点的试验结果,i,j=1,2,…,p;i≠j;xijk表示xi、xj和xk的编码值为1/3,其余成分的编码值为0的试验点的试验结果,i,j,k=1,2,…,p;i≠j,k;j≠k;……1、{p,1}单纯形格子设计回归系数的计算

在{p,1}单纯形格子设计中,每一个试验点只有一个成分的编码值为1,其余都为0。将第i号试验点各成分编码值及其相应的试验结果值代入回归方程(4—73),即可得到回归系数2、{p,2}单纯形格子设计回归系数的计算

在{p,2}单纯形格子设计中,1—p号试验点与{p,1}设计完全相同,所以将第i号试验点各成分编码值及其相应的试验结果值代入回归方程(4—74),即可得到回归系数

p+1—Cp+12号试验点,其成分编码值只有xi、xj为1/2,其余都为0。将每一号试验点各成分编码值及其相应的试验结果值代入回归方程(4—74),得到将(4—81)式代入上式,即可得到回归系数3、{p,3}单纯形格子设计回归系数的计算在{p,3}单纯形格子设计中,1—p号试验点与{p,1}设计完全相同,所以将第i号试验点各成分编码值及其相应的试验结果值代入回归方程(4—76),即可得到回归系数

p+1—p2

号试验点分两种情况,一是xi的编码值为2/3,xj的编码值为1/3,其余为0的试验点,将这些试验点各成分编码值及其相应的试验结果值yiij代入回归方程(4—76),得到二是xi的编码值为1/3,xj的编码值为2/3,其余为0的试验点,将这些试验点各成分编码值及其相应的试验结果值yijj代入回归方程(4—76),得到将(4—84)式和(4—85)式相加,整理后再将(4—83)式代入,从而得到将(4—84)式和(4—85)式相减,整理后再将(4—83)式代入,从而得到

p2+1—C3p+2号试验点,其成分编码值只有xi、xj、xk为1/3,其余都为0。将每一号试验点各成分编码值及其相应的试验结果值yijk代入回归方程(4—76),得到将(4—83)式和(4—86)式代入(4—88)式,从而得到【例4·16】按照【例4·15】编制的试验方案进行试验,结果见表4—59的最后一列。进行分析。

根据(4—81)式,得b1=y1=14.6,b2=y2=14.9,b3=y3=10.8。根据(4—82)式,得:

b12=4y12-2(y1+y2)=4×14.8-2×(14.6+14.9)=0.2b13=4y13-2(y1+y3)=4×13.8-2×(14.6+10.8)=4.4b23=4y23-2(y2+y3)=4×13.0-2×(14.9+10.8)=0.6于是得到用各成分编码因素表示的回归方程:

在实际工作中,通常需要用各混料成分的实际因素表示回归方程。为此,由(4—79)式得:将a1=0.2,a2=0.4,a3=0.2代入上式,得:将其代入上述回归方程,并加以整理,得到需要注意的是,单纯形格子设计回归方程中回归系数的估计只能先用设计编码因素进行估计,得到用编码因素表示的回归方程,然后再转化成用实际因素表示的回归方程;而不能直接将实际因素和试验结果代入回归模型估计回归系数。

从表4—57—表4—59可以看出,在{p,d}单纯形格子设计的混料试验中,绝大多数试验点混料的成分中都有一个或几个成分为零。但在实际工作中,不等于零的成分是大多数,而且一般情况下也不容许大多数成分为零,否则就失去了进行混料试验的意义。因此,【例4·15】和【例4·16】实质上属于有下界约束的混料设计,各混料成分的取值有最小值的限制。这就避免了混料中部分成分为零的问题。(三)控制点检验

通过混料试验的结果分析,可以得到相应的回归方程。该回归方程是否能够描述所研究的整个混料系统,尚需进行检验。由于混料试验设计不具有正交性,回归方程的统计检验比较复杂,因而在混料试验的结果分析中常采用控制点检验(referencepointtest)。所谓控制点检验,就是在正单形内选择少量的试验点(称为控制点)进行验证性试验,用这些试验结果来对回归方程的适合程度进行检验,推断回归方程是否可以使用。如果验证性试验结果与回归方程预测结果差异不大,说明所得的回归方程是适合的,可以交付使用。否则,就要修改模型,补做一些试验,用更高次的回归模型去描述混料系统。控制点选择的原则是,数量要尽可能少,而且各点在正单形内应尽量分布均匀,具有较强的代表性。

假设选择m个控制点,各控制点试验结果的指标值为yi(i=1,2,…,m),由回归方程预测各控制点的指标值为(i=1,2,…,m)。检验回归方程的适合程度可以使用以下两种方法之一。1、允许误差比较法

当可以根据专业知识确定一个允许误差δ时,使用允许误差比较法。若所有控制点试验指标值yi与预测指标值之差的绝对值都满足(4—91)则认为回归方程是适合的,能够较好地描述混料系统。如果有一个或多个△yi>δ,就认为回归方程不适合,不能用来描述混料系统,因而不能交付使用。2、方差比较法当可以根据专业知识确定试验的误差方差σ2时,使用方差比较法。若试验误差方差的估计值(4—92)则认为回归方程是适合的,可以交付使用。否则,回归方程是不适合的,不能交付使用。三、单纯形重心设计与统计分析

在{p,d}单纯形格子设计中,试验点各成分的编码值与回归方程的次数d有关,为1/d的整数倍。当d≥3时,在某些混料设计中部分试验点的非零成分的取值不相等,这些不相等的成分对试验结果所起的作用不同,也直接对回归方程的估计产生不同程度的影响。为了改进这一缺陷,Scheffe提出了单纯形重心设计(simplexbarycenterdesign)。(一)设计方法

在p维正单形中,单个顶点的重心就是顶点本身,称为单顶点重心。连接任意两个顶点形成一条棱边,棱边的中点为其重心,称为两顶点重心;任意三个顶点组成一个正三角形,该正三角形的中心为其重心,称为三顶点重心。依此类推,p顶点重心就是该正单形的重心。因此,在p维正单形中,i顶点重心共有Cpi个。所谓单纯形重心设计,就是在p维正单形中只选取i(i=1,2,…,p)顶点重心作为试验点的混料试验设计。对于单纯形重心设计,其试验次数为试验点的组成如下:以(1,0,0,…,0)为代表的Cp1个单顶点重心;以(1/2,1/2,0,0,…,0)为代表的Cp2个两顶点重心;以(1/3,1/3,1/3,0,0,…,0)为代表的Cp3个三顶点重心;……以(1/d,1/d,…,1/d,0,0,…,0)为代表的Cpd个d顶点重心。

表4-60—表4-63列出了{2,2}、{3,3}、{4,4}和{5,5}单纯形重心设计编码表。对于{p,d}单纯形重心设计的编码表,可在{p,p}单纯形重心设计编码表中取前M()号试验点构成。

单纯形重心设计的回归方程为:(4—93)其需要估计的回归系数共有个,与试验次数M相等。因此,单纯形重心设计也是饱和设计。这是该设计的一个显著特点。单纯形重心设计的第二个显著特点是,所有试验点的成分与回归方程的次数d无关,并且每一个试验点中非零成分的取值相等,这就消除了由于非零成分取值不等而对回归系数的估计产生的不同影响。(二)统计分析

与单纯形格子设计一样,单纯形重心设计回归方程中回归系数的计算也很简便。将以(1,0,0,…,0)为代表的Cp1个单顶点重心试验点各成分编码值及其相应的试验结果值代入回归方程(4—93),即可得到单一成分的回归系数

将以(1/2,1/2,0,0,…,0)为代表的Cp2个两顶点重心试验点各成分编码值及其相应的试验结果值yij以及(4—94)式代入回归方程(4—93),即可得到两个成分的回归系数

将以(1/3,1/3,1/3,0,0,…,0)为代表的Cp3个三顶点重心试验点各成分编码值及其相应的试验结果值以及(4—94)式、(4—95)式代入回归方程(4—93),即可得到三个成分的回归系数将以(1/d,1/d,…,1/d,0,0,…,0)为代表的Cpd个d顶点重心试验点各成分编码值及其相应的试验结果值yi1i2…id以及前面计算出的所有回归系数代入回归方程(4—93),即可得到d个成分的回归系数(4—97)对于{p,d}单纯形重心设计,其回归方程(4—93)中各回归系数的计算公式可归纳为q=1,2,…,d

sq为p个成分中取q个的所有集合yt(sq)为集合sq中取t个的所有组合(共Cqt个)的试验结果指标值的总和

例如,对于{4,3}单纯形重心设计,其回归方程为此时,q=1,2,3。假设q=2,则集合sq为{1,2},{1,3},{1,4},{2,3},{2,4}和{3,4}。当sq为{2,3},t=1时,yt(sq)为y2+y3;t=2时,yt(sq)为y23。所以回归方程(4—99)的回归系数计算如下:当q=1时,bi=1×[(-1)1-1×11-1×yi]=yi(i=1,2,3,4)当q=2时,

bij=2×[(-1)2-1×12-1×(yi+yj)+(-1)2-2×22-1×yij]=4yij-2(yi+yj)(i,j=1,2,3,4;i<j)当q=3时,

bijk=3×[(-1)3-1×13-1×(yi+yj+yk)+(-1)3-2×23-1×(yij+yik+yjk)+(-1)3-3×33-1×yijk]=3(yi+yj+yk)-12(yij+yik+yjk)+27yijk(i,j,k=

1,2,3,4;i<j<k)【例4·17】

在某配合饲料生产中,有Z1、Z2、Z3、Z4四种预混料,假定它们的用量最小值分别为a1=0.30,a2=0.16,a3=0.04,a4=0.20。试安排{4,3}单纯形重心设计试验方案。

在{4,4}单纯形重心设计编码表(表4-62)中,选择前C41+C42+C43=14号试验点构成{4,3}单纯形重心设计的试验点,其设计编码见表4-64。由(4—79)式可得各成分实际因素与编码因素之间的关系为:Z1=0.3x1+0.30Z2=0.3x2+0.16Z3=0.3x3+0.04Z4=0.3x4+0.20将各试验点编码值代入上式求得实际值,将编码值换为实际值即得到试验方案,见表4—64。【例4·18】按照【例4·17】编制的试验方案进行试验,结果见表4-64的最后一列。试进行分析。

由(4—94)式可得单一成分的回归系数,如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论