




已阅读5页,还剩53页未读, 继续免费阅读
(分析化学专业论文)神经网络杂化算法测定糖蜜中小分子有机酸的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
广西大学学位论文原创性声明和学位论文使用授权说明 学位论文原创性声明 本人声明:所呈交的学位论文是在导师指导下完成的,研究工作所取得的成 果和相关知识产权属广西大学所有。除已注明部分外,论文中不包含其他人已经 发表过的研究成果,也不包含本人为获得其它学位而使用过的内容。对本文的研 究工作提供过重要帮助的个人和集体,均已在论文中明确说明并致谢。 论文作者签名: 蜘 学位论文使用授权说明 内【年f 只如t t 本人完全了解广西大学关于收集、保存、使用学位论文的规定,即: 本人保证不以其它单位为第一署名单位发表或使用本论文的研究内容; 按照学校要求提交学位论文的印刷本和电子版本; 学校有权保存学位论文的印刷本和电子版,并提供目录检索与阅览服务; 学校可以采用影印、缩印、数字化或其它复制手段保存论文; 在不以赢利为目的的前提下,学校可以公布论文的部分或全部内容。 蝴糍。翔p 新獬哗冲舢 神经网络杂化算法测定糖蜜中小分子有机酸的研究 摘要 废糖蜜是制糖工业中的一种产量巨大的副产品,如何开发该种制糖工业的副 产品一直受到业内人士的关注。由于废糖蜜中含有一些非氮类小分子有机酸,如 果加以开发利用,将不仅能够解决污染的问题还能提高经济效益。对于复杂组分 体系的测定方法中,目前已有气相、液相、离子色谱等方法,但都存在成本较高, 样品处理起来繁琐等缺点。人工神经网络( a m i ) 作为一种人工仿生智能技术, 经过几十年的发展,应用的范围越来越广。近年来,人工神经网络已经被引入并 应用于化学计量学领域的多个方向。本文采用人工神经网络的预测能力,结合电 位滴定法,建立关于小分子酸主成分的模型,并应用在实际糖蜜样品中小分子有 机酸的测定。 在实际应用中,标准的b p 网络的缺点是训练容易陷入局部极小值,收敛慢 或是连接权值选择的随机性等,都给实际网络训练带来了困难。在本文中采集的 数据建立的标准b p 模型效果并不理想。针对上述情况,本文提出了l m b p 算 法尝试解决标准b p 算法的缺陷。l m 算法是一种高斯牛顿法和梯度下降法结合 改进算法,和标准b p 算法结合能解决局部极小的问题并加快网络的收敛速度。 而遗传算法( g a ) 是建立在自由进化模型上的一种全局优化搜索算法,具有全 局优化搜索和并行性的优点,和标准b p 算法结合能优化选择连接权值和阈值, 从而提高网络的性能。本文进一步的将l m 算法和遗传算法结合起来,充分发挥 两种算法各自的优点,并通过人工配制样品所采集的数据建立起来的网络模型对 废糖蜜中小分子有机酸进行了成分的测定,结果表明该网络具有良好的预测性, 可以应用于实际样品中小分子有机酸成分测定。 关键词:人工神经网络b p 网络遗传算法l m 算法电位滴定 法杂化算法 d e t e r m i n a t i o no fs m a l lm o l e c u l eo r g a n i c a c i d si nt h em o l a s s e su s i n gt h eh y b r i d n e u r a ln e t w o r ka l g o r i t h m a b s t r a c t m o l a s s e si so n ek i n do f b y p r o d u c t si ns u g a ri n d u s t r yw h i c h a r eo f l a r g ep r o d u c t i o n t h er e s e a r c h e r si ni n d u s t r i e sh a v ep a i da t t e n t i o nt o u t i l i z et h i sk i n do fb y - p r o d u c t a st h e r ea r es o m en o n - n i t r o g e no r g a n i c a c i dw i t hm o l a rm a s si nt h em o l a s s e s ,i fe x p l o i t e d ,w i l ln o to n l ys o l v et h e p o l l u t i o np r o b l e mb u ta l s oi m p r o v ee c o n o m i ce f f i c i e n c y f o rt h e d e t e r m i n a t i o no f c o m p l e xc o m p o n e n ts y s t e m ,t h e r ea r es o m em e t h o d s s u c ha sg c ,h p l co ri ca n do t h e rm e t h o d s b u tt h e s em e t h o d sa reo f h i g hc o s ta n dc o m p l e xt r e a t m e n to fs a m p l e sa n do t h e rd r a w b a c k s a r t i f i c i a ln e u r a ln e t w o r k ( a n n ) a sa na r t i f i c i a li n t e l l i g e n c eb i o n i c s t e c h n o l o g yh a sb e e nu s e di nm a n yf i e l d sa f t e rd e c a d e so fd e v e l o p m e n t t h ea r t i f i c i a ln e u r a ln e t w o r kh a sb e e ni n t r o d u c e da n da p p l i e dt ov a r i o u s f i e l d so fs t o i c h i o m e t r yi nr e c e n ty e a r s i nt h i sp a p e r ,t h ef o r e c a s t i n g a b i l i t yo fa n na b i l i t yi sc o m b i n e dw i t hp o t e n t i o m e t r i ct i t r a t i o nt o e s t a b l i s ham o d e li nt h ed e t e r m i n a t i o no fa c t u a lm o l a s s e ss a m p l e s i np r a c t i c e ,t h es h o r t c o m i n g so ft h es t a n d a r db pn e t w o r k ,s u c ha st h e t r a i n i n ge a s i e rt of a l li n t ol o c a lm i n i m u m ,s l o wc o n v e r g e n c e o rt h e r a n d o ms e l e c t i o no ft h ei n i t i a lc o n n e c t i o nw e i g h t s ,h a v eb r o u g h t p r o b l e m st ot h ea c t u a ln e t w o r kt r a i n i n g i nt h i sa r t i c l e ,t h es t a n d a r db p m o d e lw h i c he s t a b l i s h e db yt h ed a t ac o l l e c t i o ni sn o tg o o d ,s oal m - b p a l g o r i t h mi sp r e s e n t e dt ot r yt oi m p r o v e t h es t a n d a r db p a l g o r i t h m l m a l g o r i t h mi sam e t h o dw h i c h c o m b i n e dg a u s s n e w t o nm e t h o da n d i i i m p r o v e dg r a d i e n td e s c e n tm e t h o d ,a n d i tc a ns o l v et h ep r o b l e mo fl o c a l m i n i m u ma n ds p e e du pc o n v e r g e n c e t h eg e n e t i ca l g o r i t h mi sag l o b a l o p t i m i z a t i o ns e a r c ha l g o r i t h mb a s e d o naf l e ee v o l u t i o nm o d e l ,a n di th a s ag l o b a lo p t i m i z a t i o ns e a r c ha n d p a r a l l e l i s m t h eg e n e t i ca l g o r i t h m c o m b i n e dw i t ht h es t a n d a r db pa l g o r i t h mc a no p t i m i z ea n ds e l e c tt h e w e i g h t sa n dt h r e s h o l d s ,s oc a ni m p r o v et h en e t w o r k i nt h i sp a p e r ,t h e c o m b i n a t i o no fl m a l g o r i t h ma n dg e n e t i ca l g o r i t h mw i l lb ea l s o d i s c u s s e d ;t h ec o m b i n a t i o nw i l lf u l l ye x e r tt h ea d v a n t a g e so ft h e s et w o a l g o r i t h m s a n dt h en e wa l g o r i t h mi su s e di nt h en e t w o r km o d e lw h i c h t r a i n e db yt h ea r t i f i c i a l l ym i x e ds a m p l e so ft h ed a t a ,a n dt h en e t w o r ki s a p p l i e d t op r e d i c tt h ec o m p o s i t i o no fs m a l lm o l e c u l eo r g a n i ca c i d si nt h e m o l a s s e s t h er e s u l t ss h o wt h a tt h en e t w o r kw h i c hc o m b i n e dt w o a l g o r i t h m sh a sg o o dp r e d i c t a b i l i t y ,c a nb ea p p l i e dt op r e d i c tt h ea c t u a l c o m p o s i t i o no f t h eo r g a n i ca c i d si nt h ea c t u a l l ys a m p l e s k e y w o r d s :a n n ;b pn e t w o r k ;g a ;l ma l g o r i t h m ;p o t e n t i o m e t r i c t i t r a t i o n ;h y b r i d i i i 目录 摘要i a b s t r a c t i i 符号说明v i 第一章绪论1 1 1 人工神经网络1 1 2b p 神经网络3 1 2 1b p 神经网络3 1 2 2 遗传算法6 1 2 3l m 算法一9 1 2 4g a l m 杂化算法。1 2 1 2 5 程序软件说明1 3 1 3 废糖蜜的开发现状1 3 1 4 本课题研究的意义和内容1 5 1 4 1 本课题研究的意义15 1 4 2 本课题研究的内容16 第二章废糖蜜的总酸量的测定1 7 2 1 样品有机酸组成离子色谱分析1 7 2 2 有机酸的滴定曲线18 2 2 1 仪器和试剂18 2 2 2 实验步骤1 9 2 2 3 实验讨论2 2 2 3 样品滴定回收率测定2 3 2 3 1 样品来源2 3 2 3 2 实验步骤和数据处理方法2 3 2 3 3 人工混合有机酸的加样回收率测定2 3 2 3 4 废糖蜜加样回收率测定2 4 i v 2 4 本章小结2 5 第三章神经网络测定多组份有机小分子酸含量2 6 3 1 数据的采集2 6 3 1 1 仪器和试剂2 6 3 1 2 数据的采集和处理2 6 3 2b p 网络设计2 7 3 2 1 数据预处理和基本设定2 7 3 2 2l m b p 网络2 9 3 2 3g a b p 网络的建立3 0 3 2 4 结论和讨论3 4 3 3g a l m b p 杂化算法网络的建立3 5 3 4 本章小结3 7 第四章糖蜜样品的测定3 8 4 1 实验部分3 8 4 1 1 仪器、试剂和样品3 8 4 1 2 实验内容3 8 4 2 网络的预测3 9 4 3 本章小结4 0 第五章结论和展望4 1 附录4 3 参考文献4 6 致谢5 0 攻读学位期间发表论文情况5 l v 符号说明 意义 锤度 摩尔体积浓度 单个样本误差 第p 个样本的误差函数 目标函数 梯度函数 h e s s i n a 矩阵 单位矩阵 雅克比函数 输出值 p h 值 第j 个期望输出值 隐节点和输出层的连接权值 溶液体积 输入层和隐节点的连接权值 输入值 第i 个隐层输出值 第i 个节点阈值 意义 a r t i f i c i a ln e u r a ln e t w o r k s a n a l y t i c a lr e a g e n t b a c k - p r o p a g a t i o nn e t w o r k e q u i v a l e n c ep o i n tr e c o g n i t i o nc r i t e r i o n g e n e t i ca l g o r i t h m l e v e n b e r g - m a r q u a r d ta l g o r i t h m m e a ns q u a r e de r r o r r e l a t i v em e a ne r r o r v i 单位或量纲 m 0 1 l l m l 碍肘c e易删g,d出分乃v畅x玎岛 躺删根盯眦姒鐾|观 第一章绪论 化学计量学又称化学统计学,是一门由应用数学、统计学的原理和方法来处 理化学数据的跨学科学问,是分析化学与计算机科学的交叉学科。化学计量学可 以优化化学中量的测定和计算过程,以化学实验数据为基础,从数据中较大限度 的提取有用的信息。化学分析过程中,在很多情况下,单靠实验数据并不能得到 想要的信息,而需要通过各种相关参数结合数据计算而得。但当组分或实验条件 因素增多时,易造成体系的复杂化,使计算相当困难。 近年来,迅速发展的计算机技术,使得众多计算过程变得不再复杂,同时也 使利用应用数学、统计学来处理化学实验数据变得可操作和简单化,也为化学计 量学的发展提供了强有力的支持。化学计量学开始成为分析化学的一个基础理论 和方法学的一个重要组成部分。其中一个应用就是通过建立混合物或者反应等方 面的数学模型,简化其中一些复杂以及不确定的因素,加入统计经验结果以及一 些理论上的当量关系,计算出所需要的结果。 1 1 人工神经网络 人工神经网络【1 】( a r t i f i c i a ln e u r a ln e t w o r k , 简称a a 沦i ) 是一种仿生模型,是 由大量的神经元互相连接构成的,通过模拟人脑神经处理信息的方式,进行信息 并行处理和非线性转换的复杂网络系统1 2 1 。a n n 用计算机来模拟生物体中的神经 元网络,用其中的一部分理论来克服一些系统里不能解决的问题。a n n 可以有 效的对数据进行解析和建模,特别适合处理具有非线性测量数据。 作为一种新型的计量方法,在对复杂系统的模拟建模的问题上,a n n 显示 了与传统方法不同点的优越性,随着科技的发展,a n n 技术日趋成熟,越来越 广泛的应用在生物、物理、自控、机械和化学化工等领域,并取得了很大的进展。 人工神经网络有以下特点,使其可以作为一种新型的计量方法应用在化学数 据处理上: ( 1 ) 非线性映射:a n n 可以以极好的精度逼近任意非线性的连续函数,而在 分析化学中,很多问题并非线性而是具有高度非线性特征。 ( 2 ) 自我学习能力:a n n 可以从用来训练的输入和输出的数据中提取规律加 以记忆并泛化,即可应用于类似情况。 ( 3 ) 多变量分析能力:a n n 对于输入输出的变量数目没有太大的限制,对于 单变量系统和多变量系统提供了可以通用的模式。 在化学分析中,特别是多组分分析中,组分或溶液往往呈现高度的非线性关 系的特性,在演算过程中需用到大量的带有各种参数的计算公式和模型,很多时 候计算非常不便,尤其在模型的类型并不是非常典型和明确的情况下。用a n n 能够直接将输入和输出建立联系,绕开体系复杂的原理性的细节问题,避免复杂 的公式推导和演算,并且应用a n n 的建模所得的模拟结果呈现良好的预测能力, 故对于在复杂的化学分析体系中采用a n n 可以是一种新颖而且有效的方法。 目前来说,a n n 在化学领域上的应用主要集中在定量构效关系、光谱色谱 的谱图分析、药物药效预测模拟以及生物大分子结构的预测等方面。在构象方面 的研究预测,t h o m a s t 3 】等将遗传算法应用在a n n 中形成模糊遗传综合神经网络, 并用该网络对特定化合物中金属与氮原子之间的键长及其键角研究。在谱图分析 方面人们已经尝试着应用a n n 在质弹4 1 、红外【升、紫# l - m 、核磁【7 】等谱图的分析 上。b l a n c o t 8 】等在同时测定乙醇和甲醇的是应用a n n 对酶的分光光度法进行多 元校正,结果表明该方法比传统的主成份回归和多变量双直线校正得到的效果更 佳。现在有人将a n n 结合谱图分析应用到成分预测上。在预测模型系统方面, 王雁鹏掣9 】应用三层a n n b p 网络分析苯丙氨酸、色氨酸和酪氨酸的紫外可见吸 收光谱来测定三种氨基酸组分,通过对网络结构以及参数的修饰及优化,提高了 预测模型的准确度,最后对实际样品进行测定,结果令人满意。开小明 1 1 】应用 a n n 以l m b p 算法,对紫外光谱中严重重叠的邻苯二酚、间苯二酚和对苯二酚 三组分进行同时测定。在成分预测方面,张立安等【l o 】采用a n n 模拟了煤炭液化 过程中各种变量因素之间的关系,结果表明a n n b p 网络可以较好的模拟液化 过程中的反应条件与产率之间的复杂非线性关系,并能较为准确地预测催化剂所 需的浸渍量对煤炭的总转化率以及沥青中烯烃类轻质产物产率的影响。胡兰萍【1 2 】 等通过结合学习矢量量化a n n ,对大气中的8 组分混合体系进行快速定性分析 进行了建模。除了以上几种应用外,a n n 还被应用于化工过程设谢”】、实验条 2 件优化设计【1 4 】、药物配比效果监n t l 5 】等方面。而在a n n 中使用最多的就是b p 神经网络。 1 2b p 神经网络 1 2 1b p 神经网络 b p 神经网络即b a c k - p r o p a g a t i o nn e t w o r k ,又称反向传播网络,是由d e r u m e l h a r d 和w s m c c l e l l a n d 于1 9 8 6 提出。根据神经元的连接方式,b p 神经 网络属于反馈前向网络。典型的b p 网络一般由输出层、隐层,以及输出层组成。 各层之间通过传递函数来连接,强度由对应的权值来确定。b p 网络的隐层通常 有1 个或多个隐层,图1 1 描述了了一个典型的单隐层b p 网络: 蛔 e t i d d e a 0 i 唧雌 图l 1b p 神经网络结构 f i g 1 - 1s t r u c t u r eo f b pn e t w o r k s 传递函数一般采用的是( 0 ,1 ) s 型变换函数( s i g m o i d 函数) : 1 厂( x ) 2 毒 ( 1 - 1 ) 输出层的神经元通过线性变换函数进行变换,对于第p 个样本,误差函数的 表达如下: ( 0 一o p t ) 2 ( 1 - 2 ) 岛= 上i 一 其中亡表示为期望输出值o 表示网络计算输出值。 b p 网络的学习,一般是由4 个部分组成【1 6 1 : ( 1 ) 输入模式顺传播( 传入模式由输入层经隐层向输出层传播计算) ; ( 2 ) 输出误差逆传播( 输出的误差由输出层经隐层传向输入层) ; ( 3 ) 循环记忆训练( 模式顺传播与误差逆传播的计算过程反复交替循环 进行) ; ( 4 ) 学习结果判别( 判定全局误差是否趋向极小值) 。 b p 网络模型计算公式: ( 1 ) 输出节点的输出d ,计算公式 ( a ) 输入节点的输入:咒; ( b ) 隐节点的输出: 力= 厂( 吩一b ) ( 1 - 3 ) j 其中连接权值为w 盯,节点阈值为易; ( c ) 输出节点输出: d = 厂( 乃乃一q ) ( 1 - 4 ) f 其中连接权值为乃,节点阈值为研。 ( 2 ) 输出层( 隐节点到输出节点间) 的修正公式 ( a ) 输出节点的期望值为:幻; ( b ) 误差控制: 所有样本误差控n - e :p s ( 1 - 5 ) 单个样本误差控制: 气= 一研的j l = i 其中p 为样本数,i 为输出节点数目; ( c ) 误差公式: 4 = ( 一d ,) q 。( 1 一q ) ( d ) 权值修正值:其中七为迭代次数; 4 ( 1 - 6 ) ( 1 - 7 ) 瓦( 七+ 1 ) = 死( 七) + 7 7 6 ,y , ( e ) 阈值修i e o s ( k + 1 ) = o l ( 七) + ,z 艿f ( 3 ) 隐节点层( 输入节点到隐节点数) 的修正公式 ( a ) 误差公式: 4 k y ,( 1 一只) t 毛 , ( b ) 权值修正: w o ( k + d = w o ( k ) + q 、8 x j ( c ) 阈值修正: q ( 尼+ 1 ) = q ( 七) + 叩瞑 ( 1 8 ) ( 1 - 9 ) ( 1 1 0 ) ( 1 1 2 ) 根据实际情况设计b p 网络的时候,一般来说,可以通过网络的层数、学习 方法、隐层的神经元个数以及数值初始值这几个方面来考虑建立合适的b p 网络。 ( 1 ) 网络的层数 理论证明,具有偏差和至少一个s 型隐层外加一个线性输出层的网络m ,能 够逼近任何有理函数,若增加层数可以降低误差,提高精度;同样的会使网络的 结构复杂化从而增加训练网络权值的时间。 ( 2 ) 隐层的神经元个数 网络精度提高可以通过改变隐层的神经元个数来调节。通过调节神经元个 数,比增加网络结构来简单的多,所以一般情况下,优先考虑增加隐层中的神经 元数目。 ( 3 ) 权值初始值的选择 权值初始值的选择对于非线性系统影响较大,权值的初始值的大小对于学习 是否会落入局部最小、是否能收敛以及网络训练时间的长短关系很大。如果初始 值太大,使得加权后的输入落在传递函数的饱和区,从而导致导数的厂俐很小, 在权值修正公式中,当似专0 就会使w 专0 ,从而使调节过程几乎停滞,在系 统中,一般是希望加权后的神经元输出值接近于零,从而保证神经元的权值能够 在进行传递函数变换最大时进行调节。故在取值时,一般取( 1 ,1 ) 的随机数。 ( 4 ) 学习速率 学习速率会影响每次循环训练中所产生的权值变化量,学习速率大会影响系 统的稳定性但收敛速度快,学习速率小会导致训练时间长,收敛速度慢但可以保 证不落入误差局部最小而趋于总体最小。一般情况下,取学习速率在o 0 1 0 9 之间的数值。 原始的b p 算法具有较大的局限性,本身存在的以下缺崩1 6 】: ( 1 ) 对于复杂的问题,训练时间往往过长: ( 2 ) 当初始权值调整过大的情况下,网络容易出现麻痹现象,表现为无法训 练; ( 3 ) 容易陷入局部极小值,当计算收敛到一个解的时候可能只是局部最小值 而不是全局最小值。 针对b p 原始算法的种种不足,一般采取两种途径进行改进:一种是采用启 发式学习方法,另一种就是采用更有效的优化算法【l s l 。比较常见的优化算法有附 加动量法【聊、模拟退火法1 2 0 、遗传算法( g a ) 和l e v e n b e r g - m a r q u a r d t ( l m ) 算 法等。 本文针对b p 原始算法,采用了遗传算法和l m 算法对原始b p 算法进行优 化。 1 2 2 遗传算法 遗传算、法【2 ( g e n e t i c a l g o r i t h m s ,简称g a ) 的研究历史相对比较短,是从2 0 世纪6 0 7 0 年代由美国密歇根大学的j o h n h o l l a n d 及其同事共同研究形成一种完 整的理论方法。后经过多年的发展,遗传算法作为计算人工智能研究的一个重要 方向,受到了广泛的关注。 1 2 2 1 遗传算法的原理 遗传算法采用了自然进化模型,自然进化模型主要有以下三个方面: ( 1 ) 遗传:把代表特征信息传给子代,子代按照信息进行生长分化,并长成 具有母代绝大部分相似的特征性状,因为这个特性,物种才能稳定存在。 6 ( 2 ) 变异:母代和子代之间并不是一味的复制,而是子代在产生过程中出现 变异。变异是随即发生的,对变异部分个体的选择和积累就产生了物种的多样性 和进步。 ( 3 ) 斗争和适者生存:根据优胜劣汰的原则,淘汰一些繁殖过剩的个体,变 异物种中具有适应性强的个体被保留下来了,适应性弱或没有的个体被淘汰,经 过长期的选择积累,逐渐演变为一种新的具有强大适应性的新的物种。 遗传算法在这里应用了自然进化的基本思想,有选择、交叉、变异、迁移、 局域和领域等。基本的遗传算法可参见图1 2 。开始的时候,一定数目n 个个体 ( 父个体1 n ) 种群随即初始化,计算每个个体的适应度函数,若不满足优化准 则就开始新一代的计算,根据适应度的大小选择个体,父代的基因重新组合后并 有一小部分概率的基因发生变异产生子代。然后计算子代的适应度,然后和父代 的基因进行比较,优秀的留下来,构成新的父代。整个过程循环执行直至整个群 体的适应度满足优化准则为止。 图1 - 2 遗传算法的过程 f i g 1 - 2t h ep r o c e s so fg e n e t i ca l g o r i t h m 1 2 2 2 遗传算法的基本操作 遗传算法的基本操作包括:选择、交叉和变异。 ( 1 ) 选择:选择是用来重组或者是交叉个体以及被选择的个体将产生多少子 代个体。可以通过轮盘赌选择、局部选择、随机便利抽样或锦标赛选择算法计算 个体的适应度然后或按照比例的适应度计算或基于排序的适应度计算,按照适应 度进行父代个体的选择。 ( 2 ) 交叉:取父代交配种群中的信息进行互相结合产生新的个体。一般用实 值重组或二进制交叉重组。+ ( 3 ) 变异:交叉后,子代基因按小概率扰动产生一定的变化,一般也是有实 值变异和二进制变异两种算法。 g a b p 网络的建立其具体的操作过程如下: ( 1 ) 建立b p 神经网络; ( 2 ) 获取网络中输入端到隐层的权值矩阵以及隐层到输出端的权值矩阵 l 获取输入端到隐层的阈值矩阵所以及隐层到输出端阈值矩阵0 2 ; ( 3 ) 定义一个以连接权值和阈值转化的串行数m 为自变量的函数,通过自 变量m 将形、几岛、岛和染色体编码进行串行转换; ( 4 ) 网络进行训练,在其过程中,将形、丁、巩、仍转化成染色体编码后利 用设定好的遗传算法参数进行遗传搜索,最后返回最佳染色体m ,之后将得到适 应度最强的新的染色体后还原成新的矽、几口,、兜然后重新进行b p 网络训练 最后的到我们需要的网络。 1 2 2 3 遗传算法的优点和缺点 遗传算法应用了自然进化的基本思想,使之不同于枚举法、启发式算法、搜 索算法等传统的算法,具有如下特点【2 2 】: ( 1 ) 自组织、自适应和自学习性。遗传算法中的自然选择消除了一般算法设 计中的一个大障碍,即需要得知问题的全部特点,并要说明应用遗传算法削除了 算法设计中的一个最大障碍,即需要事先描述问题的全部特点以及针对该问题的 不同算法应采取的措施。遗传算法不需要了解问题领域的参数等情况,故通过遗 传算法来解决一些复杂的非结构化特点。 8 ( 2 ) 遗传算法的并行性。遗传算法是按照并行方式搜索种群数目的点,而不 是单点搜索。遗传算法采用种群的方式进行搜索,这样的方式可以同时搜索解空 间内的多个区域,并互相交流信息,使遗传算法能以较少的计算获得较多的收获。 ( 3 ) 遗传算法不需要目标函数求导之类或其他的辅助知识,只需要影响搜索 方向的目标函数和相应的适应度计算函数。 ( 4 ) 遗传算法的扩张性强,容易和其他的算法起结合来处理问题。 标准遗传算法也存在一些问题,例如早熟收敛,后期搜索度不足,收敛速度 不够以及局部搜索能力差等。 1 2 3l m 算法 l e v e n b e r g - m a r q u a r d t 算法( 简称l m 算法) 是牛顿方法例应用在梯度下降法的 一个简单的版本,是高斯一牛顿法和梯度下降法的结合。该算法由h a g a n 及m e n h a j 于1 9 9 4 年提出,目的是为了对以近似二阶训练速率进行修正时避免计算 h e s s i n a t 2 4 】矩阵而设计的。其主要思想是在b p 网络学习训练过程中,l m 算法利 用训练过程中目标函数的一、二阶导数以及全部样本的信息对网络连接权值和阈 值的修正,使计算量大幅度减小,从而达到优化目的。 1 2 3 1l m 算法的原理 l m 算法结合b p 算法,简称l m b p 算法,为牛顿方法提供了一个可行代替, 它具有近似想通的收敛速度和显著减少的复杂度。 牛顿法涉及目标函数俐的局部近似值,以二次函数的形式达到最小值。对 于点x 木,将目标函数刷在点x k 处进行二阶泰勒级数展开: 1 f ( x ) = 厂( 以+ 缸i ) f ( x k ) + g ( a x k ) + 去缸;巩缸 ( 1 1 3 ) 厶 其中戤为磁的梯度,风为x k 的h e s s i n a 矩阵 截取泰勒级数展开式1 1 3 在点孙1 达到最小值需满足: 飞x 赋 得到牛顿法迭代公式: l m 算法原理如下【明: = 0 ( 1 - 1 4 ) 9 ( 1 - 1 5 ) 若目标函数刷为平方函数之和: 厂( x ) = v ;! ( x ) = v ( x ) 7 v ( x ) f 暑l 其中: ( 1 1 6 ) 1 ,r = = 1 ,l ,2 v 一 :【p l ,l 。e 2 , i e s 。,le l 2 e s 。,q 】( 1 - 1 7 ) 那么第个梯度分量为: 删卜掣= 2 孙n o xx ) 掣o x 。 ,百i 则刷的梯度为: v r 厂( x ) = 2 j7 ( x ) v ( x ) 其中删为雅可比矩阵,其定义为 j = o v l ( x ) 缸l o v 2 ( x ) o x l o v 。( x ) 缸l o v l ( x ) 缸2 o v 2 ( z ) 缸l o v 。( z ) 叙l h e s s i n a 矩阵的定义如下: h = a 2 f ( x ) o x 。而 0 2 f ( x ) o x l x 2 a 2 f ( x ) o x h x 2 0 2 f ( x ) 徼1 x n 0 2 f ( x ) o x 2 x 月 ( 1 - 1 8 ) ( 1 1 9 ) ( 1 - 2 0 ) ( 1 - 2 1 ) 其中h e s s i n a 第k ,歹元素为: m m 广鬻= 2 斟掣掣裟) m 2 2 , 于是h e s s i n a 矩阵可以转换为: 1 0 一阮州一挑;一 丝彰 a 一 巡群丝毒=塑甄塑 ;掣 为: v 2 厂( z ) = 2 j r ( x ) ,( x ) + v ,( x 2 v ,( x ) f = l ( 1 - 2 3 ) 当要取目标函数的最小值的时候,u ( x 2 _ ( x ) 很小,则式1 - 2 2 可以简化 v 2 f ( x ) 2 j r ( x ) ,( x ) ( 1 2 4 ) 将式1 2 2 和式1 2 3 代入牛顿法的表达式1 1 5 中,得到: 砟+ 1 :x 乏:j 互渊! :篙j v ( x m 2 5 , = i - 【2 ( x i ) ( x i ) 以。( x i )i ) 、 7 式中迭代更新碰到的问题是需要矩阵如,厂的逆,但如,厂存在可能不可逆 的情况,为了克服这个问题,对式1 2 4 进行修改,令: h = h + ( 1 2 6 ) 其中为很小的数值,是一个单位矩阵。将式1 2 6 代入式1 2 5 中,得到 l m 算法的迭代公式: x 女+ l = x t - 【,r ( x t ) ( x t ) + j l l k ,】1 - 厂,( x 1 ) v ( x )( 1 2 7 ) 1 2 3 2l m 算法进行网络训练的过程 l m 算法进行b p 网络训练的过程一般分为4 个步骤【2 6 1 : ( 1 ) 初始化网络权值为很小的随机值并输入训练样本数列组,应用传统b p 网络的正向过程计算网络训练样本的误差平方和既评价函数: ( 2 ) 递归计算输入输出相对应的雅可比矩阵的元素; ( 3 ) 当提交最后输入输出后,实现权值更新; ( 4 ) 如果网络收敛到误差平方和小于预先给定的精度,即停止,若不收敛, 回到步骤( 2 ) 继续训练。 1 2 3 3l m 算法的优缺点 l m 算法的优点在于利用标准的数值优化技术,既具有高斯牛顿法的局部收 敛性也具有梯度下降法的全局特性,在局部搜索能力强,下降收敛速度快。 l m 算法也有缺点,其搜索方法属于单点搜索方法,通过一些改进使得到的 搜索空间从一个点移动到另外一个点,这种搜索方法对于多峰分布的搜索空间常 常会陷入局部最优解p 6 】,还有会因为收敛速度迅速而经常导致过度拟合而导致网 络泛化能力、对初始值依赖程度大,另外在复杂网络的情况下,其会占用相当大 的内存空间。 1 2 4g a l m 杂化算法 本文针对遗传算法和l m 算法的优缺点采用一种改进的杂化算、法【矧,简称 “g a l m 算法”。将遗传算法优化b p 网络随机选取的初始权值和阈值,然后应 用l m 算法在这个解空间里对网络进行学习,训练,直至收敛而得出最优解或近 似最优解。这样结合了两种算法的优点,即发挥了l m 算法的收敛快和广泛映射 能力的特性又发挥了遗传算法的优异全局搜索能力,从而提高了整个学习训练的 泛化能力以及逼近能力。 其具体操作方法如下: ( 1 ) 准备训练样本数据,确定网络的计算参数; ( 2 ) 进行遗传算法操作;进行种群的评估产生新一代的种群; ( 3 ) 用l m 算法训练网络,调整网络权值,计算网络适应度: ( 4 ) 如果网络适应度没有达到优化要求,则重复步骤( 2 ) 步骤( 3 ) 继续进行计 算;如果网络适应度达到优化要求,则输出预测结果。 具体的操作流程可见图1 3 : 1 2 一图1 3g a l m 的流程图 f i g 1 - 3t h ef l o wc h a r to fg a - l ma l g o r i t h m 1 2 5 程序软件说明 本文采用m a t l a br 2 0 0 7 编程。m a t l a b 是美国m a t h w o r k s 公司开发的一 种面向科学和工程计算的高级计算机语言 2 1 ,允许用户用数学形式的语言来编写 程序,使编写简单化便于使用。本文利用m a t l a b 自身带的神经网络工具箱 t o o l b o x 中的自带函数结合自编程序完成整个网络的设计和运行。 1 3 废糖蜜的开发现状 废糖蜜是一种制糖工业的副产品,除含有大量的糖份以外,亦含有大量的有 机无机物质。其成分及比例根据甘蔗的品种、产地、气候、成熟度以及生产工艺 手段等因素的不同而不尽相同。其中,南方糖厂生产的甘蔗废糖蜜主要含有以下 成纠2 s i : 】3 表1 - 1 废糖蜜的主要成分 t a b l e 卜1t h em a i nc o m p o n e n t so f m o l a s s e s 废糖蜜因为价格低廉,而且对其资源化利用的工艺较为简单,因此在轻工食 品,畜牧医药等等行业具有很大的开发价值和潜能。 ( 1 ) 初级回收利用:废糖蜜含有大量的蔗糖转化糖,是一种能量原料,对于 牲畜来说具有消化吸收快,在欧美等国已经被当作一种常用的能量饲料加入到奶 牛的食粮中以提高产量和改良产品成分【2 9 】。也有人利用废糖蜜作为混凝土外加剂 并有好的效果【3 们。 ( 2 ) 回收有效成分:废糖蜜中有大量的蔗糖及还原糖,通过硫酸钡沉淀法、 色谱分离、斯蒂芬法等方法【3 1 1 可以将部分的废糖蜜中的糖份提取出来,增加糖厂 的经济效益,减少了废糖蜜的蜜量。同时也有很多糖厂提取其中的焦糖色素【3 2 1 , 其整个生产工艺成本低,工艺较为简单且污染性较小。 ( 3 ) 发酵制品:糖蜜含糖分5 0 - - 5 5 ,可以作为发酵工业中的碳源材料用 于发酵。其优点在于除了价格低廉外,成分里含有的维生素、氨基酸等营养素能 够使发酵过程具有较高的生产效率。 ( a ) 酒精废糖蜜处理利用的一种重要的途径就是生产酒精,普遍采用的 是固定化酵母连续发酵工艺f 3 3 】。该生产工艺具有发酵周期短、发酵率高、生 产成本低等优点。目前来说,在很多甘蔗糖厂中都采用该工艺进行了酒精的 大宗生产。 ( b ) 氨基酸废糖蜜中还有不少氨基酸,其中谷氨酸和赖氨酸的发酵已实 现了工业大宗生产。 ( c ) 有机酸废糖蜜中含有较为丰富的有机酸,根据产地不同等可能还 有:柠檬酸 3 4 1 、草酸、l 乳酸、琥珀酸、乌头酸等多不饱和脂肪酸等。目 前来说,柠檬酸已经实现了废糖蜜再发酵的大宗生产,其他一些有机酸的生 产工艺还仍在摸索中。 1 4 ( d ) 生物制品废糖蜜中含有糖分,有适宜一些菌体生长繁殖的生长环境
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖北省黄石市2024-2025学年高三5月考试题语文试题试卷含解析
- 云南医药健康职业学院《专业英语阅读》2023-2024学年第一学期期末试卷
- 四川司法警官职业学院《数字信号处理及实验》2023-2024学年第二学期期末试卷
- 贵州财经大学《软件工程及UM》2023-2024学年第二学期期末试卷
- 北京警察学院《工程计量与计价(安装)》2023-2024学年第一学期期末试卷
- 吉林铁道职业技术学院《马克思主义经典文献导读》2023-2024学年第一学期期末试卷
- 河北资源环境职业技术学院《大坝工程设计》2023-2024学年第二学期期末试卷
- 辽宁商贸职业学院《统计基础与实务》2023-2024学年第二学期期末试卷
- 迪庆藏族自治州德钦县2025年三下数学期末学业水平测试模拟试题含解析
- 华大新2025年高补班下学期第三次月考化学试题含解析
- DB11-T 1526-2018 地下连续墙施工技术规程
- 风电制氢项目可行性研究报告
- 加气站安全生产奖惩规定模版(3篇)
- 细胞治疗政策环境分析-洞察分析
- 2024-2030年中国玄武岩纤维工业行业现状调研及投资战略研究报告
- 公园景观修复零星维修施工方案
- 挂靠免责协议书范本
- 小学数学青岛版五年级下册《异分母分数大小比较与通分》课件
- 社区矫正考试题及答案
- 幼儿园水池建设方案
- 安徽省宿州市省、市示范高中2024-2025学年高一上学期期中教学质量检测英语试题 含解析
评论
0/150
提交评论