最佳培养基配比方案_第1页
最佳培养基配比方案_第2页
最佳培养基配比方案_第3页
最佳培养基配比方案_第4页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、最佳培养基配比方案何官勇王国敏正勇摘要 :本文通过建立三个模型来确定最佳培养基配比方案,其主要容如下:模型一单因素模型。我们直接由图表的数据得到,即在N2(或 C1)为准则的情况下,通过使用matlab 对图表中有同类性质的数据进行了拟合,得到了只有一个碳源(氮源)与IFN- (干扰素)的产量有关的几组拟合函数。通过对这些拟合函数的分析、并结合图形判断出在N2(或 C1)为准则下的优化配比方案。这个模型虽然可以得到比较优化的配比方案, 但是它要在某一因素不变的情况下才成立的, 而在实际求解最优配比方案时, 要考虑到各组成因素的变化情况,同时还要考虑各组成因素的交互效应,所以我们想到了逐步回归模

2、型。模型二逐步回归模型。 我们是运用逐步回归分析法分析图表的数据, 把 IFN- (干扰素)的产量作为要考虑的因变量 y,三种碳源和四种氮源的含量作为要考虑的七个自变量。 因为七个自变量对因变量 y 的影响是不同的, 所以我们通过使用逐步回归分析模型把七个可供选择的自变量中的那些对建立回归方程比较重要的因素选择出来, 从而可以得到这些确定出来的因素即为影响y 产量的主要因素, 即得到所选择的碳源和氮源的种类,在得到碳源和氮源的种类之后我们要解决的问题是如何确定其含量使得 IFN- (干扰素)的产量最大,即最终找出最优配比方案。由此我们想到了模型三。模型三。在确定了碳源和碳源的种类之后, 我们通

3、过借鉴模型一中运用的单因素准则法,先确定一个 C1,在 N1、N2 对 IFN- 产量影响的图像中进行比较,就可以得到 IFN- 的产量达到最大时碳源和氮源的含量。在得到模型之后,我们对所建模型进行了的可行性分析,自我评价和改进。在整个建模过程中我们运用 matlab 去进行计算,使得我们在建模过程中处理数据方便了许多。关键字 :最优配比matlab拟合逐步回归图像分析单因素准则一、问题重述及分析本题是某发酵实验中培养基的碳源(C1,C 2,C3)和氮源( N1,N2,N3,N4)含量及 IFN- ( -干扰素)的产量的关系问题(实验数据表见附件一):如何选择碳源和氮源的种类及含量使IFN-

4、的产量达到最大?本题是以生物化学知识为背景的数学建模。在建立模型之前首先要弄清楚发酵、 IFN- (干扰素)等生物化学上的专用词,弄清楚培养基原理,再从实验的数据出发,去建立一个最优的配比方案。二、模型假设与假设的说明模型假设:1)每个实验都是在相同的外界条件下进行的,且外界条件的变化对实验不会产生影响。2)每个实验都是独立进行、互不影响的。3)每个实验都是在所需的条件下顺利进行的。4)每个实验培养基中都有相同的且数量不变的真菌。5)每个实验培养基中的碳源、氮源和真菌都是均匀分布,且充满整个培养基。6)每个实验中的真菌利用氮源和碳源生成IFN- 的能力是一样的。7)每个实验中氮源、碳源的含量同

5、时成比例变化不影响氮源、碳源的转化率。8)每个实验中不同碳源(氮源)之间都是独立的,不互相影响。9)每个实验用到的数据都用同一的单位。10)因为 IFN- 是单一类型的干扰素分子,在下面的讨论中考虑不同的碳源和氮源被吸收后都只生成一种相同类型的干扰素分子。11)每个实验的培养基本身都含有一定数量的碳和氮。12)在求解最佳配比方案时,不同碳源(氮源)价格是相同的,或者说他们的价格的差别对于问题而言是可以忽略的。假设的说明:对于假设 1)、2)、3)、4)、5)、 6)、8)、 9),是为了保证实验具有可行性、可比性,在现实的情况下这些假设是可以做到的,符合实际的。对于假设 7),是为了便于从实验

6、数据中了解、得到更多的信息,从而建立模型。在实际情况下,当两个反应物在其他条件不变时,浓度成比例改变,它们的转化率一般是不变的,在这里也假设是不变的。对于假设 10),是为了在判断碳源和氮源的优劣进而选择合适的原料时,不需要去考虑因生成的 IFN-有不同种类,而导致在判断碳源和氮源时,无法根据表中的量去判断的情况,在现实中因为 IFN- 是单一类型的干扰素分子,考虑其只会产生一种 IFN- ,也是合理的。对于假设 11),是从实际情况出发,考虑到一方面每个培养基中本身就含有必备的营养素,也就会含有一定的碳和氮;另一方面, 因为实验中有五组数据是在只有碳或氮的情况下生成的,如果没有碳或氮是不会出

7、现这些情况的。对于假设 12),是为了在判断碳源和氮源的优劣进而选择合适的原料时,只需从相同原料时生成 IFN- 的产量的多少考虑即可,这样假设是从方便建模的角度出发的。在现实中,会出现价格不同,甚至相差很大的情形,在这个时候就必须要考虑经济效益了,我们将在模型改进中予以简要说明。三、模型建立及求解模型一:经过我们分析认为第14, 15,16,17, 23 五次实验为特殊情形,在以下分析中暂不考虑,将在模型二的第二步中予以说明。下面介绍模型一:首先,根据实验数据研究N2 含量不变的准则下,不同的C1(C2,C3)的含量对产生 IFN-的影响,主要思想如下:找出含C1(C2,C3)源的项及其对应

8、的 IFN- 的产量的项, 利用数学软件 matlab 把表中的 C1(C2,C3)的含量与 IFN-的产量有关的数据拟合成曲线, 建立它们两者之间的函数关系。 把建立 C(1 C2,C3 )的含量与IFN- 的产量的三条曲线图像放在同一个坐标系中,进行观察、比较,取图像在一定区间最上方的曲线所对应的碳源为在该区间所选择的碳源,对应区间取得函数最大值时的自变量即为碳源的含量。其次,根据实验数据研究C1 准则下,不同的N1(N2 N3 N4)的量的对产生 IFN- 的影响,主要思想和上面的一样,这里就不累述了。最后,根据在 N2 含量不变的准则下求出的一个最佳的碳源Ci (i 为 1、2 或3中

9、的一个),把 N2 ,Ci( i 为 1、2 或 3 中的一个)的组合作为一个优化的配比方案。同理,根据在 C1 含量不变的准则下求出的最佳的一个氮源Ni(为 、 、i1 23或 4 中的一个),把 C ,N ( i 为 1、2、3 或 4 中的一个)的组合也作为一个优1i化的配比方案。具体的做法如下:把实验设置为七组,把第 1 至第 5 个实验作为第一组,第 6 至第 9 个实验作为第二组,把第 10 至 13 个实验为第三组,把第 15 至第 18 个实验作为第四组,在第 1 至 5 个实验中把 C1 按假设 7)都化为 2 后所得的新结果分为一组作为第五组,把第 23 至 28 个实验作

10、为第六组,把第 29 至 32 个实验作为第七组。在 N2 含量为 0.5,N1 、N3 、N4 、C2、C3 含量均为零时,利用数学软件 matlab 对 1,2,3, 4,5 组实验中 C1 的含量 x 与 IFN- 的产量 y 的关系进行三次曲线拟合。具体的拟合曲线如下:Matlab 指令: >>x=0.1 0.4 1 2 3;>>y=11.6900 39.1297 68.2035 83.6580 75.4200; >>a=polyfit(x,y,3)>>x1=0.1:0.1:3;>>z=polyval(a,x1);>&g

11、t;plot(x,y,'k*',x1,z,'r')( 1)a =5.1683-41.8866103.46252.5470得到拟合曲线,如图(1)所示。拟合函数为: y = 5.1683 x 3 - 41.8866 x 2+ 103.4625 x+ 2.5470同理,对固定的 N2 ,可以按上述的方法拟合第二组,和第三组实验的数据,具体的拟合过程如下:对第二组:C2 的含量 x 与 IFN- 的产量 y 的关系进行三次曲线拟合,具体的拟合曲线如图( 2):拟合函数为: y = -9.0119 x 3 + 23.7190 x 2 -13.0696 x + 22.47

12、33对第三组:C3 的含量 x 与 IFN- 的产量 y 的关系进行三次曲线拟合,具体的拟合曲线如图( 3):拟合函数为: y =2.4244 x 3 -10.2156 x 2 +16.9070x + 4.0330(2)(3)0(2)把上面建立的 C1、C2 、C3的含量与 IFN- 的产量的三条曲线图像拟合在同一个坐标下,得到图( 4):(4)从上图可知,以N2 含量不变作为准则时,取C1 作为碳源, IFN-产量明显最大。因此,我们取 C1、N2 作为碳源和氮源。通过计算可以得到 C1 的最大值,该值即为 N2 不变准则下 IFN- 产量取最大值时的含量, 由此我们即得到一个优化配比方案。

13、该方案为: C1N2=1.9 0.5同理:以 C1 含量不变作为准则的情况下,可以得到另一个优化配比方案。模型二:模型一中我们只考虑了单一准则下各因素的最优时的情况,然而,实际上各个因素都在变化,要找到最优方案必须考虑周全。因此, 我们要同时考虑三种碳源和四种氮源,分析它们对 IFN- 产量的影响的大小,从中选取影响较大且合理的组合,由此我们想到了逐步回归分析方法, 建立了逐步回归模型。 通过使用这种方法选取出了对 IFN- 产量的影响较大的碳源、氮源。在运用这种方法时,我们是借助于数学软件 matlab 的,我们的具体计算过程为:第一步:分别记 C1、 C2、C3、N1、N2、N3、N4 等

14、 7 列的数据为列向量 x1、x2 x7 。记 rhIFN- 列的数据为列向量y。即:>> x1 = 0.1 0.4 1 2 3 0 0 0 0 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ;>> x2 = 0 0 0 0 0 0.2 0.5 0.8 1.5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ;>> x3 = 0 0 0 0 0 0 0 0 0 0.1 0.5 1.5 2.5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ;

15、>> x4 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5 2 3 4 5 0 0 0 0 0 0 0 0 0 0 ;>> x5 = 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0 0 0 0 0 0 00.523450000;>> x6 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5 2 3 4 5 0 0 0 0 ;>> x7 = 0 0 0 0 0 0 0 0 0 0 0

16、 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.01 0.05 0.1 0.3 ;>> y = 11.69 39.1297 68.2035 83.658 75.42 20.736 20.7417 22.5836 25.8213 5.624 10.2357 14.5909 20.3346 7.296 42.588 51.6 165.54 72 54.9 42.84 164.25 138.04 126.9 11.484 17.16 20.8 57.24 72.96 17.60830.94 11.475 12.084 '令 x = x1x2x3x4x5x

17、6x7 ,用 stepwise( x, y)得到一个 stepwise regression diagnostics table(如图 i 所示)可以看出结果不太好: p=0.0229,取 =0.05 时,此回归模型可用,但取 =0.01 时,模型不能用; R-square = 0.461,较小; F=2.932,也较小。(由图 ii 中各直线都是虚线可证明) 于是我们调整图 ii 中的各直线。 然而,无论怎么调整都无法使哪条虚线变为实线。故可知此回归模型不大合理,需改进。iii第二步:我们仔细分析实验数据 ,发现 x(14: 16,:)中,每行向量相等,而y 的值不等,说明此实验数据不可靠,

18、且在现实中如果只用单一氮源,那么培养基将因缺乏碳源而崩溃,x(17,:)和 x(23,:)也是如此,故将其删除掉。用其余数据组合成新的x、y。即:>> x1 = 0.1 0.4 1 2 3 0 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 ;>> x2 = 0 0 0 0 0 0.2 0.5 0.8 1.5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ;>> x3 = 0 0 0 0 0 0 0 0 0 0.1 0.5 1.5 2.5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ;

19、>> x4 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5 2 3 4 5 0 0 0 0 0 0 0 0 0 ;>> x5 = 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0 0 0 0 0 0.5 2 3 4 5 0 000;>> x6 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5 2 3 4 5 0 0 0 0 ;>> x7 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.01

20、 0.05 0.1 0.3 ;>> y = 11.69 39.1297 68.2035 83.658 75.42 20.736 20.7417 22.5836 25.82135.624 10.2357 14.5909 20.334672 54.9 42.84 164.25 138.04 11.48417.16 20.8 57.24 72.96 17.608 30.94 11.475 12.084 '>> x = x1' x2' x3' x4' x5' x6' x7'重复做第一步中的操作,得到另一个stepw

21、ise regression diagnostics table如图 iii 所示 :iiiiv可知此方案比较好了, p=7.4e-005,很小;R-square =0.7651,比较大;F=8.84,也比较大。可见此方案可取。但,由图iii 可知, x2、x3、 x7 不显著,调整图iv中的直线,移去这三个向量后统计结果如图v 所示 :v由 matlab 易知 :vi>> inin =1456>> outout =237图 vi 中 x2 、x3、 x7 三行用红线显示,表明它们已经移去。从新的统计结果可以看出,虽然剩余标准差s(RMSE)没有太大的变化,但是统计量

22、F 的值明显增大,因此新的回归模型更好一些。再运用 matlab 知识:>> x=ones(27,1) x1' x4' x5' x6'>> b,bint,r,rint,stats=regress(y,x);>> bb =-32.617124.653525.4289105.0067-96.6340>> statsstats =0.763017.70260.0000可以求出模型:y=-32.6171+24.6535x1+25.4289x4+105.0067x5-96.634x6第三步:由试验数据可知, C1、N3 和

23、N2 共存时, IFN- 的产量比只有 C1、N2 时要低得多。可见最优方案中要去掉N3。以下我们再次用逐步回归方法验证我们的结论:去掉与 N3 有关的数据之后我们得到新的x ,y。即:>>x1 = 0.1 0.4 1 2 3 0 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 ; >>x2 = 0 0 0 0 0 0.2 0.5 0.8 1.5 0 0 0 0 0 0 0 0 0 0 0 0 0 ; >>x3 = 0 0 0 0 0 0 0 0 0 0.1 0.5 1.5 2.5 0 0 0 0 0 0 0 0 0 ; >>x4

24、 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0.5 2 3 4 5 0 0 0 0 ;>>x5 = 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0 0 0 0 0 0 0 0 0 ; >>x7 = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.01 0.05 0.1 0.3 ;>>y = 11.69 39.1297 68.2035 83.658 75.42 20.736 20.7417 22.5836 25.8213 5.624 10.2357 14.59

25、09 20.3346 72 54.9 42.84 164.25 138.04 17.608 30.94 11.475 12.084 '>>x = x1' x2' x3' x4' x5' x7' ;调用 stepwise(x,y)得到另一个 stepwise regression diagnostics table如图 vii所示 :viiviii可知此方案好了很多,p=2.996e-004,很小; R-square =0.7808,比较大;F=8.903,也比较大。可见此方案可取。但是,有很多虚线,重复第二步中的操作,得到比较

26、好的结果,如图ix 以及图 x 所示:ixx从新的统计结果可以看出,统计量F 的值明显增大,因此这种回归模型比前面的更好一些。再用 matlab,知:>> x=ones(22,1) x1' x4' x5' ; b,bint,r,rint,stats=regress(y,x); bb =-27.697624.653524.114095.1678>> statsstats =0.773820.52600.0000求出最终的模型:y=-27.6976+24.6535x1+24.1140x4+95.1678x5综上所述:碳源 C1 和氮源 N1、N2 是

27、影响 IFN- 产量的主要因素。所以原问题中要求得最优培养基配比方案,可以转化为在选取碳源C1 和氮源 N1、N2作为原料后,确定它们的含量使得IFN- 产量最大(具体求解见模型三) 。模型三:通过上述讨论, 我们已经选出了碳源和氮源的类型,下面我们具体讨论它们的含量问题:鉴于 N2、 N3 共存时, IFN- 的产量低于仅有N2 时的情况,我们不能断定N1、N2 共存时 IFN- 的产量会达到最大;同时也没有C1、N1、N2 共存时的数据。因此我们通过分析,可以先任意给出C1 的含量,在 N1、N2 中选择一种,使之与 C1 共存时,让 IFN- 的产量达到最大,从而求出氮的含量。具体分析如

28、下:在假设 7)成立的情况下,通过数据分析,当C1 含量为 a 时(以下计算时,以 a=0.5 为例),通过作图来比较 N1、N2 的优劣情况:>> x1=0.5 2 3 4 5;>> x2=10 2.5 1 0.5 1/3;>> y1=72 54.9 42.84 164.25 138.04;>> y2=11.6900*20 39.1297*5 68.2035*2 83.6580 75.4200/1.5;>> a1=polyfit(x1,y1,3);>> a2=polyfit(x2,y2,3);>> x=0.1

29、:0.1:5;>> z1=polyval(a1,x);>> z2=polyval(a2,x);>> plot(x,z1,'r',x,z2,'b')由图一分析可知:在培养基中C1 的含量 a(a 取 0.5)已知的情况图一下,当氮源的量小于0.5 或大于 4.0 时,选择 N1,IFN- 的产量高;当氮源的量在 0.5 到 4.0 之间,选择 N2,IFN- 的产量高。(最大含量由 a 的具体值决定)四、模型的说明与可靠性分析本题是通过给我们一系列实验数据,要求我们分析数据来寻求最优配比方案。这本身就要求我们用那些数据去预测,而

30、那些数据的产生具有一定的随机性、和误差值,这就使得我们的模型的结果具有一定的随机性、预测性。同时,我们根据实验数据, 用拟合和逐步回归的方法建立上述模型,所得的结果与实验数据是基本吻合的,具有合理性,预测性。五、模型的自我评价对于模型一, 我们使用了在确定一个因素的量之后, 研究其它单一因素的改变对目标的影响。 运用这种方法, 我们可以粗略地判断不同的因素对目标的贡献大小,得到一个粗略的优化配比方案。 这个模型的优点在于我们可以直接利用实验数据表中的数据进行比较而得到方案 ;缺点在于没有把实验表中的每个因素都进行比较,得到的结果只是局部的一个最优, 不一定是整体的最优, 同时在比较时没有考虑第

31、 14,15, 16,17,23 五次实验,也会对所得的结果造成一定的影响。对于模型二, 我们用逐步回归分析法找出最优的碳源、氮源种类。运用这种方法得到一组最优组合是比较合理的, 它是根据实验数据考虑了全部变量而得到的。对于模型三, 我们是对模型二进行了补充说明。它在通过计算碳源、氮源的含量来获得最优方案时, 参照了模型一的方法。 这个模型的优点在于解决了我们在得到了回归方程之后, 无法由实验数据表求出三个因素都在变动时的最优配比方案的难题。 该模型通过确定一个因素之后, 就可以利用实验数据表求解最优配比方案了。缺点在于没有给出全部因素都在变动时的最优解。在整个建模过程中, 存在一个无法克服的

32、困难: 我们的模型是建立在实验数据之上的,由于实验数据具有随机性, 这就决定了模型所得结果具有随机性、 预测性。六、模型的改进1)我们的模型是建立在实验数据上的,运用的是数理统计的方法,可以从增加实验的测试次数来提高我们的模型的准确度。2)在实验设计时考虑运用正交实验设计。3)我们的模型假设12)如果不成立时,就要考虑到价格对我们选取碳源、氮源种类时的影响。 这种情况下,我们建议在建立模型时把价格乘上含量来代替原模型中的含量,这样就可以用上述模型去选择种类及含量。4)我们在建立模型时没有分析到氮过量时对模型的影响,事实上如果氮源过量,会导致 ph 值升高,从而会破坏培养基,导致IFN- 产量的下降。我们建议在添加原料控制好氮的含量。5)对于在得到最优配比方案时的碳源和氮源含量的求解问题中,我们在模型三中给出了一个特殊解法,事实上,如果我们可以找到关于IFN- 的产量与碳源和氮源含量的函数关系,就可以直接作为回归方程的约束条件来求解最值。6)由于表中数据没有具体的单位,在上述模型中我们把它当作物质的量来考虑。如果把表中数据当作百分比含量来考虑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论