(农业电气化与自动化专业论文)基于支持向量机的微生物发酵过程软测量方法研究.pdf_第1页
(农业电气化与自动化专业论文)基于支持向量机的微生物发酵过程软测量方法研究.pdf_第2页
(农业电气化与自动化专业论文)基于支持向量机的微生物发酵过程软测量方法研究.pdf_第3页
(农业电气化与自动化专业论文)基于支持向量机的微生物发酵过程软测量方法研究.pdf_第4页
(农业电气化与自动化专业论文)基于支持向量机的微生物发酵过程软测量方法研究.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(农业电气化与自动化专业论文)基于支持向量机的微生物发酵过程软测量方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

江苏大学硕士学位论文 摘要 随着生物技术的发展,豳发酵工程提供的产品同渐丰富,微生物发酵工程在 国民经济和社会生活中的地位越来越重要。为提高发酵过程的产鼹褥率和产品质 量,获得较好的经济效益,需要对发酵过程进行优化控制。但是幽于发酵过程复 杂的生化特性,发酵过程的许多重要特征参数( 如菌体细胞浓度、基质中麓萄糖 浓度、生成产物浓度等) 还不能够很好的在线实时测量,给发酵过程优化控带来 了困难,使得先进的控制算法和控制策略难以在发酵工业现场有效应用。本文以 北京棒杆菌培养产生赖氨酸发酵过程为研究对蒙,采用支持向量机回归算法建立 软测量模型,对发酵过程中的三个重要变量进行预测。支持向量机有严格的理论 基础,通过结构风险最小原则和推广性的界的实现,可实现数据样本空问的唯一 全局寻优。实验和仿真结果表明,软测量模型能够较准确的输出估计值,在小样 本训练集的情况下,具有更好的推广能力和预测能力,为发酵过程优化控制提供 了前提条佟。本文所傲的具体研究如下: 1 、在大量阅读消化文献和赖氨酸发酵实验的基础上,依据实际发酵过程微 生物生长代谢曲线,分别建立了径向基神经鼹络软测量模型和基于标准支持向量 机的软测量模型。对赖氨酸发酵过程中的参数( 生物量、糖浓度、产酸浓度) 进 行预测估计,并对两种模型的性能进行了研究和毙较。 2 、对软测量辅助变量的选取和数据的预处理方法进行了研究,采用一致相 关凄分析法确定辅助变量,并且用聚类方法对原始数据进行处理。 3 、在标准支持向量机的基础上,对原有算法进行了改进,分别建立最小二 乘支持向量机软测量模型和鲁棒最小二乘支持向量机的软测量模型。根据实验和 模型的仿真结果,并对二者的算法和模型性能进行了分析和比较。 4 、根据发酵过程优化控制的需要,提出了组合式多输入多输出支持内量视 回归算法软测量模型,对模型的算法的和参数选取进行了研究,并对两种组合模 型进行了仿真。 关键 雹:赖氨酸发酵,建模,软测量,支持向量机,参数估计 江苏大学硕士学位论文 a b s t r a c t w 池t l l ed e v e l o p m e n to fb i o l o 西c a lt e c l l l l o l o g 弘颤m 锄t a t i o np r o j e c to f f e 璐 e w 和i n c r c a s i n gr i c hp r o d 似s 髓c hd a y 锄dm i c r o b ef e m l t a t i o np r o j e c tp l a y sm o r e a n dm o r ei n 耳咖趾tr o l e si nc o f l d i t i o n a le c o n o m ya 1 1 ds o c i e t y i i lo r d e rt oe 砌 l 锄c e l e g a i n sa 1 1 dq u a l i 够o fp r o d u c t si l l 血ef 醣n e n t i n gp r o c e s s 锄ds e e km o r co c o n o m i c a l b e n e f i t s ,t h ef 醣n e n t a t i o np r o c 髂sn e e d st 0b eo p t i m i z e d w h e r e 够d u et 0t h ec o m p l e x b i o l o 西c a la 1 1 dc h a n i c a lf e a t u r e sa n dm 柚yc h a r a c t e r i s t i cp a r a m e t e 瑙s uc :ha st l l a l l ic e l l c o n c e n t r a t i o n ,d e x n o s ec o n c e n t r a t i o ni ns l l b s t r a t e ,c 他a t i n gp r d d u c t i o nc o n c e n 缸a t i o n 锄ds oo ni nt h e 矗釉e n t i n gp f o c e s s ,w h i c hc a nn o tb em e a 吼甜w e l la n d 仃1 l l yo n l i n e a tr e a lt i m e ,o l b s t a c l e s 孤ec r e a t e di nt h ef i e r m e n t a t i o np r o c e s sa n dc o n s e q u e n t l y a d v 锄c c dc o n t m la l g o r i t l l 】m 觚ds 仃a t 9 9 ya r ch a r dt oa p p l i e de 伍c i 锄t l yi i lm e f i e m e i l t a t i o nf i e l d 肌酉n e 耐n g w i t ht h e 向1 1 1 e n t i n gp r o c e s so fl y s i n ec r e a t i e db y c o r y i l e b a c t i 喇啪p e k i n e s 9 嬲t h em a i ns t u d 妒n go b j e c t ,t h i sp a p e ra d o p t c dr e t u m a l 蜀o r i t l l mo fs l l p p o n e dv e c t o rt 0s e tu pm es o rs e n s o rm o d e ls oa st op r e d i c tt l l r i m p o r t a l l tp a r a m e t e r si nt h ef i e m e n t a t i o np r o c e s s e x p e r i m e n t 锄di m i t a t es h o wt h a t s o rs e n s o rm o d e lc 觚e x p o ne x a c t e re s t i m a t e dv a l u ea n dc r e a t ep r e c o n d i t i o nf 0 r o p t i m i z i n gc o n t r o l i nt h ef e 咖饥t a t i o np r o c e s s t h ec 0 n c r 武ew o r ki sa sf o l l o w i n g f i r s t l y ,o nn l eb a s i so fr e a d i n gl i t e r 绷l r e sa n ds t u d y i n gl y s i i l ef 如n e n t a t i o n e x p 鲥m e n t ,a c c o r d i n gt oac u eo fm i c r o b em e t a b o l i z i n gi n 血ef k t u a lf 锄e n t i n g p 1 o c e s s ,t h es o rs e n s o rm o d e l so fr a d i a lb i a s e sn e r v a ln e ta n db a s e do ns t a n d a r d 吼l p p o n e dv e c t o rm a c h i n e 硼er e s p e c t i v e l ye s t a b l i s h e d t h e nt h ep a r 锄e t e r si nt h e f c 肌e n t i n gp r o c e s so fl y s i n es u c ha sb i o l o g yq u a n t i t y s u 髟i rm i c k n e s sa j l dp r o d u c e d a c i dt h i c k n e s sa r ep r e d i c t e da n ds u c hm o d e l sa 】汜c o m p a r e da n ds t u d i e d s e c o n d l y a c c o r d i n 2t ot h er e s e a r c ho fa s s i s t a n tv a r i a b l es e l e c t i o n 觚dd a t a p r e t r e 砌e n tm e t h o di ns o rs e n s o r t h ea n a l l 汴i c a lm e m o do fc o r t e s p o n d i n gc o n e l a t o d d e 黟e ei sa d o p t e dt of i x 嬲s i s t a n tv a r i a b l e 锄do r i 西n a ld a t aa r ep r o c e s s o dw i t hc l u s t e f m e t h o d t h i r d l y o nt h eb a s i so fs t a n d a r ds u p p o r t e dv e c t o rm a c h i n e ,ao d 百n a la l g o d t l i ni s i m p r o v e d 孤dm el e a s ts q u a r es 0 rs e i l s o rm o d e lo fs u p p o r t e dv e c t o rg r o u p 锄dt h e r o b u s te 弱ts q 呲s o ns e n s o rm o d e lo fs u p p o n e dv e c t o r 伊o u pa r cr e s p e c t i v e l y e s t a b l i s h e d a c c o r d i n gt o t h ee x p e r i m e i l ta 1 1 dm ef e s u l t so fi m i t a t i o n m et w 0 a 1 2 0 r i t l l l n sa i l dm o d e l sa f ec o m p a r e da n da n a l y z e d f o u r t h l y 西v e nm en e e d so fo p t i m i z i n gc o n t r o li nt h ef e m l e n t i n gp r o c e s s ,t h e c o m b i n e dt y i er e 佃ma l g o r i t l l mn e x i b l em e a s u r em o d e lo fs u p p o r t e dv e c t o r 粤0 u p w i t hm a n yi n p u t sa n do u t p u t si sp r o p o s e d ,a i l dw i t hm er e s e a r c ho fa l g o r i t l l l i la n d d a r a m e t e rs e l e c t i o no fm em o d e l ,t h et 、oc o m p o u n dm o d e l sa r ei m i t a t e d 1 ( e yw o r d s :l y s i n c 向m e i l t a t i o n ,m o d e l i n 舀s o ns 铋s o r ,s u p p o r tv e c t o rm a c h i n e 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定, 同意学校保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和借阅。本人授权江苏大学可以将本学位论文的全部 内容或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存和汇编本学位论文。 保密口, 在年解密后适用本授权书。 本学位论文属于 不保密。 学位论文作者签名:。陲岍彳夕 导师签名:护轳于 签字日期:2 0 0 8 年月弓同 签字同期:2 0 0 8 年二月;日 独创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究工作所取得的成果。除文中已经注明引用的内容以外,本 论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本 文的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。 本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名:7 f 事码彪 乃 日期:刎年月弓日 江苏大学硕士学位论文 第1 章绪论 生物工程中的发酵工业是技术密集型产业,涉及到微生物学、生物化学、生 化工程、自动控制技术和计算机技术等。随着社会经济的发展,发酵工业获得了 很大的进展。生产规模越来越大,向人们提供的产品越来越丰富,这就更加迫切 地要求发酵过程能够实现优化控制。利用计算机系统对发酵过程的微生物环境因 子进行在线实时优化控制,使发酵生产过程能够按照确定的优化模型和优化参数 进行,从而使发酵生产过程的生产效率和自动化水平,产品的产量和质量都得以 提高。 1 1 微生物发酵工业概述 微生物发酵技术是带动2 l 世纪经济发展的关键技术之一,它在化工、医药 卫生、农林牧渔、轻工食品、能源开发和环境保护等领域都将发挥重要作用。它 促进了传统产业的改造和新兴产业的形成,对人类社会产生了深远的影响。生物 发酵技术的源头可以追溯到公元前的酿造技术。这种原始的生物技术一直持续了 4 0 0 0 多年,直到上世纪法国微生物学家巴斯德揭示了发酵原理,从而为发酵技 术的发展提供了理论基础。到了2 0 世纪初,在工业生产中首先采用了大规模细 菌培养技术的是化工原料丙酮丁醇的发酵法生产。5 0 年代在抗生素工业的带动 下,发酵工业和酶制剂工业由此兴起,发酵技术和酶技术因而被广泛用于医药、 食品、化工、饲料和农产品加工等产业部门。7 0 年代初开始,分子生物学的某 些突破使人们能够分离基因,并在体外进行重组,从而迎来了生物技术的新时代。 生物技术对人类生活的作用越来越显示出它的重要性和迫切性,而其对人类的贡 献很大一部分是通过生化工程技术的开发来实现的。例如人们所用的抗生素药 物、酶制剂、味精、柠檬酸、酵母、啤酒、抗癌药物等等都离不开发酵工业,所 以微生物发酵过程是生物工程的核心。在发酵工业中,所用原料大多是粮食,因 此,对这一传统工业利用现代控制技术,进行自动化技术改造研究,对于促进我 国发酵技术的发展,降低原材料和动力能源消耗,提高经济效益有着非常重要的 作用。 利用现代控制理论、生物化工理论、计算机技术、现代测量技术来解决发酵 过程中测量、控制优化及辅助操作等问题,对于提升我国发酵工业水平,提高产 业经济效益,有着极为重要的意义。 1 1 1 国内外研究现状和发展趋势 江苏大学硕士学位论文 生物发酵设备是生物工程生产过程中的最为重要的设备之一,微生物在发酵 罐内的液态环境中完成代谢并形成产物。因此发酵设备是各种新型生化农业产业 发展的基础。 世界许多国家对生物发酵设备的研究与开发都高度重视。典型的有:瑞士比 欧生物工程公司( b i o e n 舀n e 耐n g a g ) 是一家有二十多年历史的生物反应器专业 厂,产品极具代表性,遍布欧洲、美洲、亚洲的许多国家,年产值达1 5 亿美元。 他们生产各种型号的生物反应器具有专用的控制软件包,既能进行s p c 控制, 又能进行d d c 控制,且能进行尾气分析控制和远程控制。德国贝朗国际生物工 程公司生产的b i o s t a t 系列生物发酵设备,具有数字检测和控制、远程化与可视 化等功能。美国的n e wb r u n s w i c hs c i e n t l f i c 公司,是一个具有五十多年 历史的专业生产科学仪器和装备的跨国公司,产品可通过空气、氧气、氮气和二 氧化碳来控制溶氧和二氧化碳,并开发了优化控制软件。 上述国际知名公司的产品占据着我国发酵设备的大部分高端市场,价格较 高。在我国,各级政府也制定了一系列优惠政策,对生物高技术产业给予大力支 持,许多科研院所都在积极丌展生物技术的研究,一些生物工程公司如雨后春笋 般的出现。典型的发酵设备生产企业有:北京中仪远大科技有限公司、镇江东方 生物工程设备技术有限责任公司、上海保兴生物设备工程有限公司、常州三环生 物工程成套设备有限公司等。国内从事生物发酵技术和设备研究的单位主要有: 华东理工大学、江苏大学、上海理工大学、华南理工大学以及江南大学等。在技 术方面,华东理工大学居首,能够进行尾气分析。华南理工大学有国家重点实验 室,研究海洋生物,在设备方面,他们主要在开发光( 合) 生物反应器,刚刚进 入市场,用于微藻的大规模工厂化生产。江南大学主要从事菌种及发酵工艺的研 究。 国内的微生物液态发酵设备大多通过对其生长环境的过程参量进行单独的 检测与控制,许多发酵过程的控制还停留于传统经验方式,方式落后,效率低下。 当前我国对生物技术非常重视,但由于国家对生物发酵的研制投入不足,缺乏交 叉型宽口径的人才,发酵过程关键参量软测量和解耦控制等关键技术没有得到充 分解决,生物发酵设备的控制精度达不到国际先进水平,导致高端的国外生物发 酵设备大量进入国内,占据国内很大的市场份额,且价格昂贵,制约了我国开展 生物技术的研究和生物制品的丌发。因此研究微生物的内在发酵机理,建立其数 学模型,并研制高性能的控制器,才能将我国的生物发酵设备和其它用于生物工 程的设备提高到国际水平,参与国际竞争,推动我国生物技术的现代化和产业化。 1 1 2 微生物发酵优化控制的方法和内容 2 江苏大学硕士学位论文 根据发酵过程中对菌体细胞的培养方式,可分为分批发酵( b a t c h f 锄朗t 撕o n ) 、分批流加发酵( f e d - b a t c hf 黜l 朗t a t i o n ) 和连续发酵( c o n t i n u o u s f e 肌e n t a t i o n ) 。分批流加发酵就是在分批发酵的过程中,按照一定的工艺条件向 反应器中添加发酵营养液。通常是一定浓度的葡萄糖液或其它一些营养素溶液。 对于赖氨酸来说,需要在发酵过程的中后期流加葡萄糖和硫酸铵溶液。这种培养 方式,能够确保菌体细胞的营养供应,使细胞能够按照最大比率生长,能够得到 较高的产物得率。分批流加发酵是发酵工业初次优化控制的结果,体现出人们对 发酵工业过程优化控制所作出的努力。这种方法虽然控制过程较为复杂,但能够 获得较大的生产效率和单位产率,因此广泛应用于现代发酵工业。 :一 太宁 渤嗣暑一t - 图1 2 某次发酵过程环境参数控制曲线 补料控制是分批流加发酵培养方式优化控制的基础。一般情况下,根据菌体 细胞的最优生长模型,需要流加多种营养物质以补充碳源和氮源。如在赖氨酸的 发酵中,需要补充葡萄糖、硫酸铵等。对流加营养物质的控制参数一般为流加时 间、流加速率、流加体积、流加次数等,流加参数的改变将对发酵过程产生重要 影响。对流加补料参数的控制,主要通过流加补料控制模块根据优化控制曲线对 补料泵( 蠕动泵) 转速和各进料管路电磁阀的开度进行控制来实现。如图1 3 所 江苏大学硕士学位论文 示的补料控制模块的操作曲线。 图1 3 分批补料控制模块的操作曲线 f 一流加速率;s 一基质流加量;y 一流加体积 各控制模块的相互联系程度不同,温度模块与p h 值模块相对独立。电机转 速控制模块、溶氧模块与压力模块则联系较紧密,它们共同实现对反应器溶氧的 控制。控制器部分是模块工作的核心,它的控制算法和控制策略决定了控制模块 的控制方式。基于多变量解耦的p d 组合控制方式是目前发酵控制过程中最常 用的控制算法了错算法实现容易,响应速度快等特点,在工业现场获得了较广 泛的应用。新出现的许多先进的控制算法,如神经网络p i d 、模糊p i d 、小波p i d 等也丌始在具体的控制模块中应用,取得了良好的控制效果。 广一一一一一一一一一t _ 一一一一一一一一l lp : 熬f 弗 p i d 刊蠢温度i 簿控制器ia ,洋一 控制器 a p _ 一一一一一一二一i 二 一一一一一一一一一j 图1 4 采用串级模糊p i d 的发酵罐温度控制器 控制系统的结构也是影响控制效果的另一个重要因素。各个模块需要在工业 计算机的控制下才能协调统一的工作。利用计算机强大的数据处理能力,可以实 时监控所有模块的工作状况,自动完成报表生成,生产同况曲线打印,预告报警 和故障诊断。一个典型的单罐计算机控制系统如图1 5 所示。 工 控 机 图1 5 单罐算计机控制系统 这个控制系统是分批发酵优化控制的一个基本的系统,其中的控制模块能够 完成闭环控制功能。对于发酵厂来说,尤其是大规模的发酵厂中,一般会有多个 反应器在同时工作。要求计算机能够监测控制多个反应器( 甚至是全厂) 的工作 4 江苏大学硕士学位论文 状态。与单罐的情况不同,这时需要采用结构较复杂豹计算橇集数控制系统来完 成优化控制任务,图1 6 为基于c a n 总线的多罐发酵过程机算机集散控制系统。 网1 6 基予e 惩总线瓣发酵过稷谤髯撬控猫系统 现代发酵工业应该提供一系列可及时满足市场需求的产品。产品制造必须以 经济的,环境能接受的方式来进行。理想的情况是工厂是能内部邀调节酶,只需 较少主动过程控制,不需人工干预。这需要快速和高效的产品设计能力,运用先 进控制技术和优化技术。自动化和信息系统功能所能产生的整体效益只有在充分 集成所有糟关功能的基础上方可能实现。充分集成包括整个工厂在横向和纵向上 的集成,横向集成涉及工厂所有区域、机组和单元,纵向集成涉及工厂的所有层 次,发酵过程成套专用控制装置在这样的条 孛下应运面生。罄翦在嚣内随着计算 机技术的不断发展,发酵过程计算机控制系统所采用的技术方案很多,常见的控 制方案包括:工业p c 机控制的发酵系统,用p l 控割的发酵系统,用e i c s 控 制的发酵系统。p l c 主要用在小型生化企业过程控制中,由于p l c 本身的局限 性,它难以实现高级的控制算法。d c s 系统主要应用在大型生化企业的发酵过 程控制中。其实施的成本较高,但易于维护和升级,并且可以和企业中的其它控 制系统以及管理系统通讯。对于模块中的微控制器也在向着运算速度更快,控制 熊力更强的基予嵌入式微处理器的方向发展。 。 ,3 微生物发酵优化控制面临的问题 先进的控制方法和控制策略以控制参数精确测量为前提条件。要实现发酵工 业过程的优化控制豳的,必须准确实时地检测到发酵过程中重要的生物化学参 数。目前,应用于生物发酵工业能够实现自动检测的参数,主要集中在一些相对 比较容易实现,有成熟的仪器仪表可以直接进行测量的物理参数上。比如温度、 p 飘值、溶解氧、罐压、搅拌电视转速、蠕动泵和消泡桨转速、流加速率( 流量) 等。而其他一些极为重要的作为控制对象的生物化学参数,如菌体细胞浓度、代 5 江苏大学硕士学位论文 谢生成产物浓度、发酵液中的总糖浓度、营养素金属离子浓度等,则必须采用离 线化验分析的方法得到。离线化验时滞性很大,无法满足现场实时优化控制的需 要,因此发酵过程关键参量的测量是一个关键问题。 对于测量问题,解决的办法有两个,一个是开发研制新型的生物传感器,使 现场的生物参数可以通过传感器来准确实时测定并驱动控制系统。然而到目前为 止,生物传感器还不能很好解决这一问题【l 巧】,另一个办法就是软测量技术( s o n s e i l s o r ) 。采用软测量技术对参数进行在线估计,是解决上述问题的有效途径睁】。 利用计算机的信息处理能力,通过模式辩识的方法由数值计算间接估算出发酵过 程参数是软测量技术应用的基本思想。将软测量技术应用到发酵过程中,对关键 变量进行在线估计是当前学术界和工程界一个的研究热点。此外,发酵过程是一 个多变量强耦合的过程,多变量解耦控制也是一个需要充分解决的重要问题。 1 2 软测量技术概述 软测量( s o f is e n s i n 曲的思想以及由此形成的软测量技术是过程控制和检测 领域出现的一种新思路与新技术,其理论体系正在逐渐形成,是目前检测和过程 控制领域研究的重要方向【2 4 】。软测量技术的基本思路是根据某种最优化准则, 选择一组既与主导变量( p r i m a 叫a b l e ) 有着密切联系又容易测量的变量,即辅 助变量( s u b s i d i a r yv 撕a b l e ) ,通过构造某种数学关系,利用计算机算法实现对主 导变量的最优估计。 图1 8 基于软测最过程控制原理 上图1 8 中,y ,为参考输入变量,多为软测量模型对系统状态的估计值,y 为主 导变量,口为可测的辅助变量,d 与“为可测的干扰和控制变量。软测量的目的 就是就是在可测信息集否上构造映射夕= r ( 护,j ,“) ,根据过程对象的特性可在系 统可测信息空间上得到主导变量的估计值多。 软测量模型的这一映射算法一般由计算机程序实现。工业现场的数据采集系 统向计算机提供辅助变量的实时数据,经预处理后送入软测量程序入口,由软测 量模型输出至控制器,实现对控制量的闭环控制。 6 江苏大学硕士学位论文 1 2 1 软测量的建模方法 软测量技术主要包括:软测量建模方法、软测量工程化实旄技术和软测量模 型校正技术。建立软测量模型是软测量技术的核心问题。从建模复杂性来看,软 测量模型经历了从线性到非线性的过程,线性软测量模型一般是建立在勋l m 觚 滤波理论的基础上,这类方法对模型误差和测量误差很敏感,很难处理严重非线 性问题。从建模手段来看软测量建模主要有基于工艺机理分析的方法( 即机理建 模) ,基于数据驱动的方法( 包括统计回归,主元回归等方法、神经网络、遗传算 法、模糊算法等) 及混合建模的方法。 软测量技术的关键是软测量模型的建立,建立软测量模型基本有两类方法, 机理方法和经验方法【l 纠3 1 。前者通过机理分析对微生物生长代谢过程的内在规 律作全面的描述建立动力学方程,通过对方程的求解【l 纠6 】来得到软测量的预测 模型。经验方法主要包括自适应模型推理、状态估计、输入输出估计、回归分析、 人工智能等【1 7 】。 采用工艺机理分析方法应用的前提是对过程对象的工艺机理有着深刻了解。 一般通过对过程对象的机理分析,运用化学反应动力学、物料平衡、能量平衡等 原理,列写有关的数学方程式,确定主导变量与辅助变量( 二次变量) 之间的数学 关系,建立估计主导变量的机理模型。对于工艺机理较为清楚的过程对象,该方 法能构造出性能较好的软仪表,但对于较为复杂,机理尚不清楚的过程,难以利 用此方法建立软测量模型。这种软测量方法是工程中常用的方法,其特点是简单、 工程背景清晰、便于实际应用,但要依赖对过程对象工艺机理的了解。与其它建 模方法相比,机理模型的可解释性强、外推性能最好,是最理想的软测量模型。 但是机理模型也有其不足的地方:一是模型的适用范围非常狭窄,不同的过程对 象其机理模型不论是模型结构还是模型参数都不一样,要移植起来相当困难;二 是机理建模需要花很大的人力物力和时间,从建立到调试,再到应用,又调试等, 需要时间非常长;三是当模型复杂时求解比较困难,由于机理模型一般是由代数 方程组、微分方程组甚至偏微分方程组所组成,当模型结构庞大时,其求解过程 的计算量很大、收敛慢,难以满足在线实时估计的要求。 基于经验方法的软测量是近年来研究最多、发展很快和应用范围很广的一种 软测量技术,它可以在不具备对象先验知识的条件下,根据过程的输入输出数据 直接建模或混合数学机理建模。模糊数学模仿人脑逻辑思维特点,是处理模型未 知或具有不确定性复杂系统的一种有效手段,在软测量中被大量地应用。模糊数 学经常和其它人工智能技术相结合,如模糊数学和神经元网络技术构成模糊神经 网络技术。模糊数学和模式识别技术结合构成模糊模式识别,可以取长补短以提 高软测量模型的精度。 7 江苏大学硕士学位论文 在缺乏系统先验知识的情况下,可以采用模式识别的方法对系统的操作数据 进行处理,从中提取系统特征,构成以模式描述分类为基础的模式识别模型。基 于人工神经网络( a i t i f i c i a ln 踟r a ln e m o r k s ) 的软测量建模方法【碍j 是目前软测量研 究中最活跃的领域,其优良的性质,如建模不需机理模型、能克服非线性、容错 性、可学习、并行计算等,可以用来解决控制工程中广泛存在的建模问题和模型 校正问题。 1 2 2 影响软测量性能的因素 影响软测量性能的因素由很多,一般分为内部因素和外部因素。内部因素主 要是软测量模型的构造方法和理论及模型的合理性、准确性、适用性等。内部因 素对软测量性能的影响是根本性的。外部因素分布广泛,主要是软测量过程数据 的质量和分析处理的方法等。外部因素对软测量性能的影响是很大的。辅助变量 对软测量模型的性能也将产生重要作用。 由于软测量是一门与实际过程密切联系的技术,数据的采集以及数据的分 布、系统的噪声、系统的不确定性和复杂性等因素都能对模型产生较大影响。从 现场采集的测量数据,由于受仪表精确度、可靠性和测量环境的影响,都不可避 免地带有误差,有时甚至有严重的过失误差,而软测量是根据过程测量数据经过 数值计算而实现的,其性能在很大程度上依赖于所获过程测量数据的准确性和有 效性,因此对测量数据的处理以获取最可靠的输入数据是软测量建模的首要问 题。 1 2 3 基于支持向量机的软测量模型 支持向量机( s u p p o r tv e c t o rm a c h i n e ) 是基于统计学习理论上的一种模式识别 的新方法。它根据有限的样本信息在模型复杂性和学习能力问寻求最佳折中,以 获得最佳的泛化能力。支持向量机在形式上类似于多层向前网络,可被用于模式 识别和非线性回归。最为重要的是支持向量机方法能够克服多层向前网络的缺 陷,它有以下几个优点: ( 1 ) 它是专门针对有限样本情况的,其目标是得到现有信息下的最优解而不仅 仅是样本数趋于无穷大时的最优解; ( 2 ) 算法最终将转化为一个二次寻优问题,在理论得到的将是全局最优点; ( 3 ) 算法通过核函数将实际问题非线性变换转换到高维的特征空间,在高维空 间中构造线性判别函数来实现原空间中的非线性判别函数,这一特殊的性质能保 证机器有较好的泛化能力,同时解决了维数问题,使得其运算复杂度与样本维数 无关; 江苏大学硕士学位论文 二十世纪九十年代支持向量机( s u p p o r t 、,仪:t o rm a c h i n e ) 方法应运而生【舡伽。 它是一种针对小样本学习问题所提出新的通用学习算法,由a t & t b e l l 实验室的 v a p n i l 【等人在1 9 9 5 年提出,起源于统计学习理论( s t a t i s t i c a ll c a n l i n gn 珂 和v c 理论的发展,随后s v m 在回归建模和时间系列预测方面取得了很好的效 果。现在s 垤已成为继神经网络之后一个新的研究热点,许多研究人员把s 垤 做成标准机器学习工具箱。 支持向量机在发酵工业中的应用目前还处于初级阶段,浙江大学的钟为民等 对抗生素发酵过程的菌丝浓度建立软测量模型【2 5 】,证明支持向量机模型的精度 和泛化能力优于神经网络建立的模型。孙宗海等【2 6 】对发酵过程的菌体细胞浓度 建立统计模型,仿真实验表明支持向量机模型的精度高于神经网络模型的精度。 目前的应用研究虽然表明了支持向量机确实优于其它传统的统计建模方法,但是 还只局限于将标准支拖囱量机方法引入发酵过程,并没有详细研究模型参数的调 节方法和对模型性能的影响,以及根据实际对象的特征改进算法。因此,支持向 量机在发酵过程软测量建模中的应用刚刚起步,有待于迸一步研究。本文所研究 的正是如何针对实际赖氨酸发酵过程的非线性动态特性,改进支持向量机的算 法,研究模型参数的选择以及核函数的影响,在改进算法中提出更适合于赖氨酸 发酵过程的建模方法。 本文针对北京棒杆菌( c o 呷c b a c t 舐u mp e h n e 船e ) 发酵生产赖氨酸( l y s i n c ) 过程为研究对象,研究基于支持向量机的微生物发酵过程软测量模型的建立方 法,实现发酵过程中重要生化参量的在线估计,为微生物发酵过程中优化控制提 供新的方法和条件。 1 3 本文研究的意义和主要内容 1 3 1 课题研究的意义 微生物发酵工程是生物工程和现代生物技术及其产业化的基础。生物量 ( b i o m a s s ) ,基质中的葡萄糖浓度( g l u c o s ec o n c e l l t r a 舡o n ) ,产物浓度( p r o d u c t i o n c o n c 朗t e a t i o n ) 是发酵过程中最重要的参数,直接影响着发酵过程的控制和优化, 也直接关系到发酵产品的产量和质量。为了对发酵过程进行有效的优化控制,构 建微生物生长的最优模型,使先进的控制算法和控制策略得到实际应用,迫切需 要对生物量,基质糖度和产物浓度进行在线实时检测。在赖氨酸发酵的过程中, 可直接在线测量的参数有温度、p h 值、溶解氧、罐压、搅拌电机转速、通气量、 反应尾气中的氧分压和二氧化碳分压等。生物量,基质糖度和产物浓度都不能在 线检测,给控制带来困难。以生物酶技术为基础的硬件生物传感器价格昂贵且适 9 江苏大学硕士学位论文 用性有限,难以满足优化控制的需要。随着信息技术和计算机技术的发展,新出 现的软测量技术是解决上述问题的有效途径。在生物发酵过程中,利用较易测出 的辅助变量和离线分析的大量数据,建立软测量模型对主导变量进行在线估计是 微生物发酵优化控制新的方法。因此,应用支持向量机理论,研究微生物发酵过 程中生物量,基质糖度和产物浓度软测量方法,实现它们的在线实时检测具有重 要的理论意义和非常实际的应用价值。 1 3 2 主要研究内容 本课题是江苏省高新技术基金项目的一部分,研究基于支持向量机的微生物 发酵软测量方法,建立赖氨酸发酵过程中生物量,基质糖度和产物浓度的软测量 模型,实现这些量在线估计和赖氨酸发酵过程的优化控制。课题的主要研究内容 如下: l 、在大量阅读文献和赖氨酸发酵实验的基础上,详细分析微生物发酵过程 中生物量、葡萄糖浓度、产物浓度检测方法与研究现状。应用统计学习理论和机 器学习理论,采用基于数据驱动机制的支持向量机回归算法做为软测量的建模方 法,建立了以上三种生物参数的软测量模型。 2 、结合赖氨酸发酵实验过程,对发酵工艺进行深入分析并确定辅助变量, 建立基于标准s v m 的软测量模型。在此基础上,进一步研究了s v m 模型与b i 心 模型的预测精度,推广能力和适用性及参数选择对模型精度的影响。 3 、在标准s v m 回归算法的基础上,结合具体发酵过程对象,对支持向量 机的改进算法进行研究。提出改进回归算法的支持向量机软测量模型,分析了目 标函数、约束规则、加权规则对估测量精度和推广能力的影响。 4 、进一步提出多输入多输出支持向量回归机的软测量模型,并对训练算法 与模型的输出性能进行了研究。对软测量的数据预处理方法进行了分析,采用聚 类算法对数据集中的粗大误差进行处理。 1 0 江苏大学硕士学位论文 第2 章支持向量机及其回归方法 2 1 支持向量机理论的提出 统计学习理论( s t 撕s t i c a ll e a n l i n gt h e o 啪研究有限样本下机器学习问题,具 有完备的理论基础和严格的理论体系,二十世纪九十年代在此理论体系框架下诞 生的支持向量机( s v m ) 方法,更使机器学习理论的研究成为新的热点,在诸如模 式识别和数据挖掘等领域都有广泛应用。基于数据驱动的机器学习是现代智能技 术中的重要方面,机器学习的目的是设计一种方法,使之能够通过对样本数据的 学习,找到数据内在的相互依赖关系,从而对未知数据进行预测或对其性质进行 判断。机器学习的模型如图2 1 所示, 图2 1 机器学习模型 其中g 是产生器,产生随机变量工,它是从固定但未知的概率分布函数f ( 工) 中 独立抽取的。t 是训练器,对于每个输入向量工产生一个输出,l m 是学习机 器,它能学习和选择一个函数集,学习问题就是从给定的函数集中选择出能够最 好地逼近训练器响应输出夕。其中,泛化能力是需关注的问题。 统计学在解决机器学习问题中起着基础性的作用,但是,传统的统计学所研 究的主要是渐进理论,即当样本无穷多时的统计性质。在现实问题中,我们所面 对的样本数目通常是有限的,所以统计理论上以样本数目无穷多作为假设提出的 各种算法往往不能表现出很强的泛化能力。二十世纪九十年代美国的v a p n i k 等 人提出的支持向量机方法,以及其理论基础统计学习理论因为其在机器学习 问题上的优良特性和对泛化能力合理的解释而得到应用。 2 2 统计学习理论 统计学习理论是一种专门研究小样本情况下统计学习规律的理论。k 等从二十世纪六、七十年代开始致力于此方面的研究,提出了关于学习过程已执 行收敛、学习过程的收敛速度、控制学习过程的泛化能力和构造学习算法等的一 系列理论。到九十年代中期,随着其理论的不断发展和成熟,v a p i l i k 提出了基于 江苏大学硕士学位论文 s l t 的支持向量机方法,该方法在解决实际问题时表现出优异性能,同时也出于 神经网络等学习方法在理论上缺乏实质性的进展,统计学习理论和支持向量机开 始受到越来越广泛的重视【2 0 1 。v a l h l i k 提出的统计学习理论建立在一套理论演绎 的基础之上,为解决小样本学习问题提供了一个框架,缓解了神经网络面临的结 构选择问题、局部极小点问题等。一些学者认为,s l t 和s v m 正成为继神经网 络研究之后的新热点,并将有力地推动基于观测数据的建模理论和技术的发展。 2 2 1 经验风险最小化原则 对于机器学习模型来说,为了选择所得到的对训练器响应最好的逼近,就要 度量在给定输入x 下训练器相应y 与学习机器给出的响应夕= 厂( x ,口) 的损失或差 异三( 少,厂( 工,口) ) 。这种选择是基于训练集的,训练集是由根据联合分布 ,( 工,y ) = ,( x ) ,( y i x ) 抽取出的一个独立分布观测数据组成: ( 而,j ,i ) ,( 而,儿) ,( 屯,乃) ( ,儿) ( 2 - 1 ) 损失的数学期望值称为风险( r i s k ) ,可表示为: r ( 口) = i 三( y ,( x ,口) ) c z f ( x ,口) ( 2 2 ) 其中f ( 工,y ) 为x 与y 的联合分布, f ( 墨y ) ) 为预测函数集,称为预测函数的自由参 数。学习的目的就是在联合概率函数f y ) 为未知,所有可用信息都包含在式( 2 。1 ) 中的情况下,在函数集( 工,口) 中寻找使r ( 口) 最小的函数,实际上是确定口的值。 因为联合概率函数f ( 工,y ) 未知,所有信息都来源于( 2 1 ) 式的训练样本,( 2 2 ) 式的 实际风险不能计算,因此传统基于观测数据的学习方法采用了经验风险最小化 ( e m p i r i c a lr i s km i n i m i z a t i o n ) 归纳原则,构造经验风险函数: 1j l r 唧o ) = 亡三( 咒,厂( ,口) ) ( 2 3 ) ,i f 作为对式( 2 2 ) 式的估计,经验风险最小化的实质是在样本趋于无穷的情况下,使 经验风险如垆( 口) 逼近于实际风险r ( n ) 的同时使如驴( 口) 达到最小的口唧值,也可 以使尺( 口) 最小。 e r m 原则多年来一直是人们在基于数据驱动建模方面采用的主要原则,但 随着研究的深入,发现e 1 w 原则存在很大的问题。例如,一般得到的有限数量 的观测数据,依据e r m 原则建立的模型所得到的结果,有时会出现过拟合的情 况。这主要是当观测数据中央带着噪声或随机误差,在拟合时,采用平方误差作 为唯一的最优目标,势必会将噪声当作有用信息考虑在拟合函数之中。这种情况 下训练误差最小,并不能导致好的预测结果。某些情况下,训练误差过小反而会 导致模型预测能力下降。因此,为了在有限的观测数据情况下,获得预测能力较 1 2 江苏大学硕士学位论文 强的模型,就必须对现有的e l w 准则进行改进。 2 2 2v c ( v a p n i kc h e r v o n e n k i s ) 维 v c 维是函数集 ( 口) ) 的一种性质,它具体描述了函数集无错误划分数据的 能力【3 2 1 。模式识别方法中给定v c 维的定义:对一个指标函数集,如果存在1 1 1 个 样本能够被函数集中的函数按所有可能的2 6 种形式分开,则称函数集能够把j 1 1 个 样本打散,函数集的v c 维就是它能打散的最大样本数的i i i 。例如,图2 2 ( a ) 中 3 个样本能完全被包含3 个分类超平面的函数集分开,所以该函数集的v c 等于 3 。而图2 2 ( b ) 中,样本不能被分类超平面的函数完全分开,因此它的v c 维数为 2 。 l ! i2 2v c 维水恿图 若对任意数目的样本,都有函数能将它们正确区分,则函数集的v c 维为 无穷大。有界实函数的v c 维可以通过阈值将其转化为指标函数来定义。v c 维 反映了函数集的学习能力,v c 维越大函数集的学习能力越强,学习机器也越复 杂。 4 v 2 星, 和 范0 6 围 o 4 0 2 。 。 。 7 a 0 2o3o4ose 8 0 7o 80 9 v c 维f 样本数 图2 3 刀与置信区问的关系 v c 维反映了函数集的学习能力,但目前尚没有通用的关于任意函数集v c 维计算的理论与方法,只对一些特殊的函数集知道其v c 维。比如在刀维实数空 间中,线性分类器和线性实函数的v c 维是刀+ 1 ,厂o ,口) = s i l l ( 似) 的v

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论