毛细管电泳分离条件的小波神经网络优化研究.doc_第1页
毛细管电泳分离条件的小波神经网络优化研究.doc_第2页
毛细管电泳分离条件的小波神经网络优化研究.doc_第3页
毛细管电泳分离条件的小波神经网络优化研究.doc_第4页
毛细管电泳分离条件的小波神经网络优化研究.doc_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

毛细管电泳分离条件的小波神经网络优化研究摘要:本研究的主要目的编写离散小波神经网络计算程序,结合正交试验设计或均匀设计方法,用于不同模式的毛细管电泳分离优化的建模.采用遗传算法寻找确定最佳分离条件.本项目.关键词:设计,算法类别:专题技术来源:牛档搜索(Niudown.COM)本文系牛档搜索(Niudown.COM)根据用户的指令自动搜索的结果,文中内涉及到的资料均来自互联网,用于学习交流经验,作品其著作权归原作者所有。不代表牛档搜索(Niudown.COM)赞成本文的内容或立场,牛档搜索(Niudown.COM)不对其付相应的法律责任!345毛细管电泳分离条件的小波神经网络优化研究项目完成单位: 中国科学院大连化学物理研究所项目完成人:许国旺 熊建辉 石先哲 袁凯龙摘 要 在Matlab 5.0环境下,编写并测试了离散小波神经网络及遗传算法Matlab程序,其计算结果可靠稳定。 将小波神经网络和遗传算法应用到2-(9-咔唑)-乙基氯甲酸酯衍生化氨基酸的胶束电动力学色谱分离优化,离散小波神经网络结合正交试验设计用以建立分离模型,遗传算法用于模型的最优搜索,并将其用于2-(9-咔唑)-乙基氯甲酸酯衍生化氨基酸的胶束电动力学色谱分离优化,归一化分离度积提高了12.5%。结合功效函数方法,建立了手性毛细管电泳多指标同时优化方法,对肾上腺素对映体实现了分离度、迁移时间和峰灵敏度的同时优化,总功效函数值提高了10.4%。考虑到手性毛细管电泳分离机理的复杂性,本文又提出了不依赖于统计模型的二进制编码遗传算法多目标优化策略,并应用于华法令对映体的分离优化。自从毛细管电泳(CE)出现以来,电泳技术作为一种分离技术已应用到许多种化合物,特别是大分子物质的分离与分析中。毛细管区带电泳(CZE)、胶束电动力学色谱(MEKC)和毛细管凝胶电泳是CE中应用最广且最重要的三种分离模式。与传统分离技术如高效液相色谱或气相色谱相比,CE具有高效、快速和试剂消耗小的特点。但毛细管电泳的分离方法建立是其弱点,这是因为影响毛细管电泳分离选择性和效率的因素特别多,整个优化过程费时费力,而且更为复杂的是这些优化参数间存在交互效应。采用通常的单因素实验法,往往得到的并不是最佳分离条件。对不同分离模式中化合物电泳迁移规律的描述,出现了不少的定量数学模型,并应用到了CE的分离优化中。这种方法称之为“硬”模型法,即物理化学法。如果模型选择得当,可对分析物在不同组成的缓冲溶液中迁移行为进行模拟,从而可寻找最佳分离条件。但这种方法也非常费时,因为要得到计算模型中的参数,需要进行很多次实验。近年来有关“软”模型方法在CE优化分离中应用逐步增多,主要以人工神经网络结合试验设计法为代表。人工神经网络作为非线性拟合工具,在解决化学模式识别及多元校正等问题有着独特的优势,其中前向多层神经网络在化学中应用最为广泛。小波变换是处理非平稳化学信号的强有力的工具,与Fourier变换相比,它在时域和频域都具有较好的局部化功能。作为一种化学计量学方法,近年来在分析化学各个领域得到广泛的应用。小波神经网络(WNN)是基于小波变换和前向多层(BP)神经网络构造的新型神经网络模型。已有理论研究证明小波神经网络比经典多层神经网络具有更强的信息提取和逼近、容错能力。离散小波神经网络(DWNN)是WNN其中的一种,它采用离散小波函数作为隐含层激励函数。 本研究的主要目的编写离散小波神经网络计算程序,结合正交试验设计或均匀设计方法,用于不同模式的毛细管电泳分离优化的建模。采用遗传算法寻找确定最佳分离条件。本项目完成后,可为毛细管电泳工作者提供一套界面友好的离散小波神经网络优化软件和方法。一、离散小波神经网络的构建及Matlab程序的编写1. 离散小波神经网络的构建小波神经网络(WNN)是基于小波变换和前向多层(BP)神经网络构造的新型神经网络模型。已有理论研究证明小波神经网络比经典多层神经网络具有更强的信息提取和逼近、容错能力。离散小波神经网络是在连续小波神经网络基础上,对伸缩因子和位移因子进行二进制离散化构建的,其网络结构如图1-1所示。网络训练采用误差反传算法,具体如下: 图 1-1 离散小波神经网络的结构(a) 网络参数的初始化:输入层和输出层的结点数分别为S和M。隐含层的结点数为T,其值大小取决于伸缩因子和位移因子。如果伸缩因子2j取值在2-J到2J,位移因子k的取值范围在-K和K之间,那么T值为(2J+1)(2K+1)。网络连接权重ust、wtm 赋以随机的初始值。(b) 输入学习样本和目标期望值,其中n为学习样本数。(c) 利用当前网络参数计算出网络的输出 (1-1)其中,j值在-J和J之间,k值在-K和K之间,j和k分别由t计算得到,j=t/(2K+1)-J,k=mod(t,2K+1)-K,mod为取余函数。(d) 以均方误差作为误差函数 (1-2)计算瞬时梯度向量 (1-3) (1-4)其中,令,则 (1-5)(e) 误差的反向传递 (1-6) (1-7)其中为学习速率,为动量因子,进一步修改网络参数wtm、ust: (1-8) (1-9) (f)当输出误差值小于预先设定的某个值时,则停止网络的学习,否则返回步骤b。2. Matlab程序的编写离散小波神经网络程序采用Matlab语言编制,Matlab语言是以矩阵为运算对象的科学计算语言,并可实现计算结果的可视化。程序主要包括以下函数:主函数(trainwnn)、前向计算函数(FwdCal)、梯度计算函数(H_samplex、delta_U_W)和反向学习函数(learnwnn)。遗传算法(GA)是一族用计算机模拟生物进化过程随机搜索最优解的方法。它利用简单的编码技术和繁殖机制来表达复杂的现象,从而解决非常困难的问题。它不受搜索空间的限制性假设的约束,不必要求诸如连续性、倒数存在和单峰等假设,以及其固有的并行性,使它在化学中有相当大的应用潜力。程序主要包括以下函数:初始化群体函数(crtbp、crtrp)、自适应值排序函数(ranking)、选择函数(rws)、变异操作函数(mutate)和交叉操作函数(Recdis、recombin)。 二、小波神经网络-遗传算法用于2-(9-咔唑)-乙基氯甲酸酯衍生化氨基酸的胶束电动力学色谱分离优化根据已有氯甲酸酯类衍生氨基酸的MEKC分离的报道和一些初始实验,选择三个主要因素:缓冲溶液pH值、SDS浓度(CSDS)和尿素浓度(Curea),其它实验参数如硼酸盐浓度、分离电压和毛细管柱温保持不变。pH值选择在8.0至10.0间变化,CSDS在10至50 mmol/L之间, Curea在1.0至5.0 mol/L之间。选择5因素4水平正交试验表L16(45)来安排实验,共需16次实验(见表2-1)。在色谱和毛细管电泳分离中,有多种指标可评价分离结果。这里采用归一化分离度积r 作为优化指标: (2-1)其中 n是 峰的数目,Ri,i+1为第i个峰和i+1峰间的分离度。r在0至1间变化。分离度Ri,i+1按下式定义: (2-2)其中ti、ti+1分别为峰i、i+1的迁移时间,Wi 、Wi+1分别为峰i、i+1的基线宽度。将正交设计表中pH值、CSDS 、Curea和r分别做归一化至01间。采用上述WNN模型,输入层包括3个节点,输入层输入pH值、CSDS 和Curea等实验信息,隐含层为Morlet小波函数,输出层为线性函数,仅含r一个节点。优化后的隐含层节点数为9(伸缩因子J=1,位移因子K=1)。网络权重值初始化为-1.01.0的随机数,学习速率因子和动量因子分别为0.01和0.7,期望训练误差为0.001,采用自适应学习速率法进行训练,迭代至900次达到期望误差。在训练过程中,从样本中拿出1个作为测试集来监督其它表 2-1 按正交设计实验的r值和WNN计算得到的r值样本训练过程,当测试集的误差开始变大时结束训练过程。表2-1为采用交叉检验方法,得到的训练测试结果,与实验结果相比绝对误差均在0.004 以下。在小波神经网络模型建立训练好后,可寻找最优分离条件,即响应函数r最大时对应的pH值、CSDS和Curea。采用实数编码,以遗传算法求解已训练好WNN模型响应值r。生成的初始群体数取40,赋予0至1间的随机数,交叉概率(Pc)为0.5,变异概率(Pm)为0.01。遗传算法计算在迭代150次后搜索的rmax至0.372不再变化。搜索得到优化点对应的缓冲溶液条件为:SDS 26.4mmol/L,尿素3.75mol/L,pH值为10.0。遗传算法重复计算10次,均得到相同结果。从r随CSDS和Curea变化的三维图(固定pH在10.0,见图2-1)也可看出,r在此处为全局最大值。图 2-1 r值随尿素和SDS浓度变化的响应曲面图按照优化条件配制缓冲溶液,得到了9种氨基酸的MEKC分离图(见图2-2),此时r值为0.351,与计算值之间相对误差为6.0%,和正交设计表中最佳条件下的0.3116相比,提高了12.5%。在此条件下9种氨基酸得到了基线分离, CE峰分布更均匀。图 2-2 最佳条件下的9种CEOC衍生化氨基酸的MEKC谱图缓冲溶液条件:25.0 mmol/L borate, 26.4 mmol/L SDS, 3.75 mol/L urea (pH=10.0);分离电压:18kV, 毛细管温度: 25;峰:1.丝氨酸; 2.苏氨酸; 3. 丙氨酸; 4. 甘氨酸; 5. 缬氨酸; 6. 天冬氨酸; 7. 谷氨酸; 8. 蛋氨酸; 9. 亮氨酸。三、基于遗传算法的手性毛细管电泳分离中多指标同时优化根据已有的肾上腺素的CE手性分离报道,选择Tris浓度(x1)、缓冲溶液pH值(x2)、手性试剂DM-CD浓度(x3)和分离电压(x4)作为实验优化中的参数。需选择适当的试验设计方法来安排分离优化实验。这里选择均匀设计方法安排实验。x1在10.0至50.0 mmol/L间变化,x2在2.5至4.5之间,x3在5.0至45.0 mmol/L之间,x4在12.0至24.0 kV之间。每个实验参数取6水平变化,选用U12(1210)表安排实验(见表3-1),实验次数为各参数水平数的2倍,各因素每个水平实验次数扩展为2次,这样共需12次实验。按照表3-1进行肾上腺素的手性毛细管电泳实验,分别得到各个条件下的峰分离度(R)、第2个峰的迁移时间(t2)和第2个峰的峰高(h2)。采用多元线性回归分析,分别考察实验因素对各响应因子的影响;使用多元逐步回归分析,建立了R、t2和h2与实验因素之间的回归方程:缓冲溶液pH值(x2)和分离电压(x4)分别固定为3.5和18 kV,按照上述方程得到R、t2和h2对Tris浓度和手性试剂浓度的三维响应曲面图(图3-1)。从图3-1可看出,为得到较高分离度,缓冲溶液中需加入较高浓度的Tris和DM-CD;相反,为获得较短的迁移时间,需较低浓度Tris和DM-CD;另外,如要求获得较高的灵敏度(h2),需较高浓度的Tris和较低浓度的DM-CD。总之,分离度、峰迁移时间和峰高度三者之间的最优化实验条件是相互冲突的,需引入多指标优化来解决这三者同时优化问题。毛细管电泳多指标优化中目前一般采用Derringer功效函数法。首先将每个响应指标(Yi)转化为无量纲的功效尺度,即部分功效函数(di),其范围在0至1之间;对于峰分离度和灵敏度这些需最大化的指标,采用单边转换方法,其响应值如低于最小可接受值Y-,表3-1 按照均匀设计安排的初始实验图3-1 (a) 分离度 (R)、(b) 第2个对映体迁移时间 (t2)、(c) 第2个对映体峰高(h2)分别对Tris浓度(x1)和DM-CD浓度的三维关系图,pH值和分离电压分别固定为3.5和18 kV。di取0,如大于期望目标值Y+后,di取1,如Yi在Y- 和Y+之间,di按下式计算获得: (3-1)对于如迁移时间需最小化的响应指标,做反向单边转换。对于手性药物的旋光异构体杂质检测分析,如要检出0.1%含量的杂质,分离度必须在2.5以上,这里分离度的期望目标值取3.0。这样,响应指标R、t2和h2分别转换为相应的部分功效函数d1、d2和d3。一旦得到各个响应指标的局部功效函数后,可计算总功效函数D:D=(d1 d2 d3)1/3。按上述过程就建立了D与各实验参数间的优化模型,把多指标优化问题转化为求D的最大值及相应的实验条件。由均匀设计实验得到D值与相应的计算值,除实验点2和5外,其它实验点两者的相对误差均在10%以内。对遗传算法的各个参数进行了优化,选择初始种群数为80,赋予0至1间的随机数,交叉概率为0.5,变异概率为0.8。以遗传算法进行寻优迭代过程,迭代计算至200次时Dmax已趋于收敛,不再变化。遗传算法为随机搜索算法,每次得到的Dmax有所差异,但均在0.9370和0.9382之间,最大相对差异仅有0.13%,远低于所建立模型的误差,可以认为肾上腺素的多指标手性CE分离中存在多个最佳实验条件。由GA计算得到的3个最佳分离条件分别为:(1) Tris浓度为48.7 mmol/L, pH=3.91, DM-CD浓度为15.1 mmol/L,D为0.9382;(2) Tris浓度为42.7 mmol/L, pH=3.23, DM-CD浓度为12.3 mmol/L,D为0.9375;(3) Tris浓度为42.2 mmol/L, pH=2.5, DM-CD浓度为5.0 mmol/L,D为0.9370。三者分离电压均为24 kV,为试验设计中所允许的最大值。以得到的最佳分离条件1为例,固定分离电压为24 kV、Tris浓度为48.7 mmol/L,做拟合总功效函数对pH值和DM-CD浓度的等高线图(图3-2),从图可看出,此条件下得到的D值为全局最大。图 3-2 总功效函数的计算值随pH (x2)和DM-CD 浓度(x3) 变化等高图。Tris浓度固定在48.7 mmol/L,分离电压为24 kV。如图3-3中a所示,为按照预测的最佳分离条件1实验得到的CE谱图,其D值(0.910)与预测值间的相对误差均在3.0%以内,与均匀设计表中最佳实验点(图3-3 b)相比,增加了10.4%,迁移时间由7.5min缩短至不到5min,同时获得了较高的分离度、较短的迁移时间和较高的灵敏度。图3-3 肾上腺素对映体的毛细管电泳分离谱图(a): 15.1 mmol/L DM-CD in Tris-H3PO4 buffer pH 3.91, applied voltage 24.0 kV;(b): 13 mmol/L DM-CD in 34 mM Tris-H3PO4 buffer pH 2.9, applied voltage 16.8 kV.四、二进制遗传算法结合均匀设计用于手性毛细管电泳分离中多指标同时优化根据已有文献,选择NaH2PO4浓度(x1)、缓冲溶液pH值 (x2)、DM-CD浓度 (x3)、分离电压 (x4)和进样时间 (x5)作为华法令毛细管电泳分离优化的考察因素。Buchholz等将二进制遗传算法引入到毛细管的分离优化:对选择的实验参数进行编码,表达为二进制字节串,根据各实验的分离效果,对二进制字节串应用遗传操作,产生下一代新的实验条件,至到得到最佳分离结果为止。这里我们选择均匀设计表来安排初始实验。选用U16(1610) 均匀设计表,初始实验共需16次,每个因素水平数均为16。每个因素的状态用二进制数来表示,需4个字节,实验中5个因素共需20个字节,远超过实验次数;通常,遗传算法中每代的群体数应基本等于将这些群体基因进行编码所需的字节数。根据有关手性CE分离机理研究文献,缓冲溶液pH值和手性试剂浓度对分离度的影响较大,这两个因素水平数均取16,其它因素均为8水平,表达每个实验的染色体字节数为17(见图4-1),基本等于初始实验数。在第1轮16次实验中 (表4-1),pH值和DM-CD浓度各水平均只出现一次,而NaH2PO4浓度、分离电压和进样时间各水平均出现两次,符合均匀设计原则。图 4-1 表达实验参数的染色体结构按表4-1进行CE实验,得到华法令对映体间分离度Rs和第二个峰的迁移时间t2。大部分的Rs值均在0.8以下,这里为更准确描述对映体的分离情况,采用峰谷比R来替代Rs: (4-1)其中H1、H2、H3分别为第一个峰、第二个峰的峰高和两峰间峰谷的高度;对映体基线分离时R为100。仍采用总功效函数来评价CE分离结果。R的期望目标值取最大值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论