(热能工程专业论文)基于模糊聚类的多神经网络铝电解槽工艺参数软测量研究.pdf_第1页
(热能工程专业论文)基于模糊聚类的多神经网络铝电解槽工艺参数软测量研究.pdf_第2页
(热能工程专业论文)基于模糊聚类的多神经网络铝电解槽工艺参数软测量研究.pdf_第3页
(热能工程专业论文)基于模糊聚类的多神经网络铝电解槽工艺参数软测量研究.pdf_第4页
(热能工程专业论文)基于模糊聚类的多神经网络铝电解槽工艺参数软测量研究.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(热能工程专业论文)基于模糊聚类的多神经网络铝电解槽工艺参数软测量研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中南人学硕士学位论文 摘要 摘要 铝电解槽作为铝电解生产的最主要设备,电能消耗巨大。每年我 国铝电解生产的电力消耗就占全国用电总量的3 2 ,电费占总电解 铝生产成本的4 5 左右。因此降低铝电解槽电耗成为众多科技工作者 的重要研究课题。而铝电解槽电流效率是最主要的经济技术指标之 一,提高电流效率可以显著降低能耗。目前,虽然国内外已做过不少 电流效率的研究工作,但由于铝电解槽是一个非线性、多耦合和大时 滞的工业过程体系,故难以精确地确定短期内电解槽的电流效率。本 文针对铝电解槽槽况及历史运行工艺参数进行分析、数据挖掘并建立 了电流效率软测量模型。 本文通过采集电解槽槽电压、电解质温度、分子比、电解质水平、 铝水平、氟化铝投入量等工艺参数历史数据作为样本;使用自标准化 方法处理数据,运用插值方法填补分子比空缺值;样本数据处理后, 利用模糊均值聚类方法进行了聚类;将聚类结果建立子神经网络,由 子网络建立总神经网络模型。作者采用聚类分析和神经网络等智能研 究方法,模拟铝电解槽生产过程,挖掘生产过程潜在规律,实现电流 效率的精确测定。 利用m a t l a b 遗传算法工具箱,以电流效率最大为目标,采用遗 传算法对各工艺操作参数进行寻优,通过分析各参数对电流效率的影 响从而提出能够提高铝电解槽电流效率的建议。并以某2 0 0 k a 电解 槽为例,经过优化后,电流效率由平均9 2 5 提高到9 3 5 ,达到国 内领先水平。 关键词铝电解,电流效率,软测量,模糊聚类,多神经网络,遗传 算法 中南大学硕: 学位论文 a b s t r a c t a b s t r a c t a st h eu p p e r m o s tf a c i l i t y , a l u m i n u mc e l lc o n s u m e se l e c t r i ce n e r g ya l o t a l u m i n u me l e c t r o l y s i sm a k e su p3 2 o ft o t a le l e c t r i cp o w e r c o n s u m p t i o n ,w h i c hc o s t4 5 o fp r o d u c t i o nc o s t t h e r e f o r e ,h o wt oc u t d o w nt h ee n e r g y d e p l e t i o n i sa ni m p o r t a n tr e s e a r c ht a s kt o m a n y t e c h n o l o g yw o r k e r s o t h e r w i s e ,c u r r e n te f f i c i e n c y i st h e p r i m a r y e c o n o - t e c h n i c a li n d e x a n di m p r o v i n gc u r r e n te f f i c i e n c yc o u l dl o w e rt h e e n e r g yc o n s u m p t i o n u pt od a t a ,m u c hr e s e a r c hw o r ka b o u tc u r r e n t e f f i c i e n c yh a d d o n ea th o m eo ra b r o a dt h o u g hm o s ti sc o n f i n e dt oc e r t a i n e x p e r i m e n to rb a c k w a r dt y p eo f c e l l s i n c ea l u m i n u mc e l li san o n - l i n e a r , m u l t i - c o u p li n g ,t i m ev a r y i n ga n dt i m ed e l a yi n d u s t r i a lp r o c e s s i n gs y s t e m , i t sh a r dt od e t e r m i n ea c c u r a t e l yc u r r e n te f f i c i e n c yo fa l u m i n u mc e l li na s h o r tt e r m t h et e x ta i m st o a n a l y s i sa n dd a t a m i n g sa l u m i n u mc e l l c o n d i t i o na n dh i s t o r i c a lr e c o r do fp r o c e s sp a r a m e t e r s ,t h e nm o d e l i n g s o f t - s e n s i n gc u r r e n te f f i c i e n c ym o d e l ab r i e fi n s t r u c t i o na b o u ta l u m i n u m e l e c t r o l y s i sp r o d u c t i o n m e c h a n i s ma sw h i l ea sm e a s u r e m e n t sa b o u ts o f t - s e n s i n ga n d d a t a m i n i n g h a sd o n ei nt h ef i r s to ft h e t e x t a d o p t s h i s t o r i c a lr e c o r d p r o c e s s p a r a m e t e r si n c l u d eo fc e l lv o l t a g e ,e l e c t r o l y s i st e m p e r a t u r e ,m o l e c u l a r r a t i o ,e l e c t r o l y t eh e i g h t ,a l u m i n u mh e i g h ta n da l u m i n u mf l u o r i d ea s s a m p l e s ;a f t e rt h ep r e t r e a t m e n to fs a m p l e s ,c l u s t e r i n gs a m p l e sb yf u z z y c - m e a n sc l u s t e r s ;t h e nt a k e si t s c l u s t e r i n g r e s u l tt o c r e a t i n g n e u r a l s u b n e t w o r k ;f i n a l l y c r e a t e sm u l t i - n e t w o r km o d e l t h et e x t a d o p t s c l u s t e r i n ga n dn e u r a ln e t w o r ka sm e t h o d ,s i m u l a t e sp r o c e s so fa l u m i n u m e l e c t r o l y s i sp r o d u c t i o n ,d i g sp o t e n t i a lr u l e so fp r o c e s s i n g ,t h e nr e a l i z et h e s e n s i n go fc u r r e n te f f i c i e n c ya c c u r a t e l y a i m st oa t t a i nb e s tc u r r e n te f f i c i e n c yb a s e do ng e n e t i ca l g o r i t h m t o o l b o xo fm a t l a b 7 0 ,a d o p t sp a t t e r ns e a r c ha l g o r i t h mt o o p t i m i z i n g p r o c e s sp a r a m e t e r s a d v i c eh a sb e e ng i v e nb ya n a l y z i n gt h ea f f e c t i o nt o c u r r e n te f f i c i e n c y c e r t a i n2 0 0 k aa l u m i n u mc e l li st a k e na se x a m p l e , c u r r e n te f f i c i e n c yi si m p r o v e df r o m9 2 5 t o9 3 5 ,c o m e su pt ot h e a d v a n c e ds t a n d a r da f t e ro p t i m i z i n g k e yw o r da l u m i n u mc e l l ,c u r r e n te f f i c i e n c y , s o f t - s e n s i n g ,f u z z y c l u s t e r i n g ,m u l t i n e u r a l n e t w o r k ,g e n e t i ca l g o r i t h m 中南大学硕上学位论文 第一章绪论 1 1 铝电解工业发展现状 第一章绪论 铝在自然界中分布极广,地壳中铝的含量约为7 3 ,仅次于氧和硅,居第 三位【1 1 0 铝的化学性质十分活泼,故自然界中从未发现元素状态的铝,而只有氧 化态的化合物。目前,铝也是产量最多的有色金属产品之一。铝在工业上用途广 泛,原料来源充足,发展前景广泛,随着我国经济的迅猛发展,对铝的需求量日 益扩大。 从天然氧化铝矿石提取出金属铝,包括两段独立的工业生产过程。从矿石取 纯氧化铝( a 1 2 0 3 ) 为第一流程,采用冰晶石( n a a a l f 6 ) 熔融氧化铝电解生产铝为 第二流程。霍尔埃鲁特电解炼铝法自1 8 8 8 年诞生以来,一直是工业上大规模炼 铝的唯一方法【z j 。 铝电解槽主要有两种形式:预焙阳极槽和自焙阳极槽。所谓预焙阳极是指用 沥青粘结剂把焦炭颗粒粘结成固体炭块,在用于铝电解槽之前,放在单独的焙烧 窑内焙烧。这样的预焙阳极比较结实,质量能够得到很好的控制,且环保性好。 而自焙阳极则是把沥青粘结剂和焦炭颗粒放在铝电解槽上自行焙烧,利用铝电解 槽内电解产生的热量,使沥青热解而与焦炭构成固体阳极。自焙阳极铝电解槽一 般生产环境恶劣,容量较小,电流强度通常不超过8 0 k a ,电流效率较低,因此 正逐渐为预焙阳极槽所取代。 伴随新技术的开发和应用,我国铝电解工业取得了很大的进步。但与世界先 进水平相比,我国铝电解工业还存在阳极电流密度偏低、电流效率偏低、能耗偏 高、平均寿命短等明显差距。以上的诸多差距,使我国铝电解工业在国际竞争中 处于不利地位。为了赶上国际先进水平,必须加大铝电解工业的科技创新力度, 加快铝电解槽现有技术的改造和新技术的开发步伐。 1 2 铝电解工艺参数测量研究现状 铝电解生产过程中,氧化铝浓度、极距和电解质温度等参数的在线检测仍有 相当难度。另外,由于槽内物料平衡状态和能量平衡状态不断变化,两者相互影 响、相互制约,形成了复杂多变的铝电解槽槽况特征。由于这些工艺技术条件的 限制,阻碍了电解过程中监控工艺参数技术的发展。因此,铝电解过程的自动化 程度也不如钢铁工业和化工工业的自动化程度高。但铝电解槽也具有有利于操作 和控制的特性,那就是它具有较强的自平衡能力,这是因为槽内熔体处于较强的 对流状态,且电解槽槽膛和槽面结壳的厚度可随温度变化而改变。基于这样的原 中南大学硕士学位论文第一章绪论 因并随着机械化水平、计算机技术、自动化控制水平以及铝电解工艺水平的不断 提甜引。上世纪八十年代,国际上铝电解自动控制技术进展很大。在应用软件方 面,以法国的p e e h i n e y l g ,美国的k a i s e r 和r e y n o l d s ,以及挪威的h y d r o 铝业公 司为代表的自适应连续或准连续按需下料控制技术【4 】取代了传统的定时下料控 制技术,即用槽电阻辨识氧化铝浓度的相关参数实现氧化铝浓度的监控:在硬件 配置方面,采用分布式结构,系统采用“集散式”控制方式,具有很强的安全可 靠性1 5 】。槽控机能独立完成信号采集、解析运算以及下料和极距的控制,上位机 实现过程管理功能。这种按需下料自适应控制技术在国际上先进的高效能电解槽 上应用后,取得了电流效率大于9 4 、直流电耗小于13 2 0 0 k w t - a 1 的优异技术 经济指标1 6 i 。 目前多采用建立数学模型的方法实施电解槽的诊断,由于铝电解过程是多变 量、非线形、大滞后的复杂过程,而电解生产过程中,能直接在线测量的参数非 常少,因此建立数学机理模型的方法的一个弊端就是模型控制参数过少,而且过 于粗糙,诊断过程适时性差,诊断结果可靠性低,难以达到很好的诊断效果。 实践证明,采用计算机系统控制,不仅减轻了工人繁重的体力劳动,而且大 大提高了劳动生产率。自8 0 年代初我国开始研制铝电解控制系统以来,多数铝 厂已经实现了计算机控制。电解槽的技术条件主要包括有:电流强度、槽电压、 极距、电解温度、分子比、电解质水平、铝水平和阳极效应系数等。 由于电解槽内存在高温强腐蚀性电解质熔体,故迄今为止,仍有许多参数无 法直接测量,如电解质初晶温度、氧化铝浓度等只能靠现场取样在实验室中用传 统方法进行化验分析,分析一个样品需要l 2 天时间,且取样过程人为不可避免 会带来较大误差。故对生产指导意义不大,也为生产操作和自动控制的实施带来 很大困难。为了解决上述问题,国内外许多科技工作者对工艺参数软测量做了很 多研究工作,并取得一定的实际应用效果。 1 分子比测定方法 铝电解分子比是电解铝生产中务必控制的一个重要技术指标,其值的大小直 接反映了电解情况是否正常。因此中外学者一直在寻找快速测定分子比的新方 法。常用的分析方法有晶型法、热滴定法、x 射线衍射法、电位法、电导法及化 学分析法等f 7 1 。但这些方法不论简单与复杂,都无法实现在电解槽前直接测定分 子比。目前应用最广泛的方法是热滴定法、x 射线衍射法。 2 电解温度测定方法现状 温度控制是整个电解生产的中心。而电解温度是电解生产中最主要的一个生 产技术参数。b u t t o nd a v i d 首先提出了控制电解质成分来控制温度的思想 8 1 。 p m e n t e r 随后经过研究a 1 f 3 在电解过程中的反应机理,提出了较详尽的a i f 3 浓 2 中南大学硕上学位论文 第一章绪论 度控制数学模型 9 - 1 1 1 。氟化盐的自动点式加料技术也随之被开发和应用【1 2 1 3 1 。 d j m a d s e n 和v k m a n n 等人结合氧化铝点式下料过程对温度的影响,在调整 分子比的同时,研究了槽电压对槽温度的作用,并给出了具体的电压调整范围 【1 4 】【1 5 】。近几年来,人们逐渐达成这样一种共识:电解质过热度的大小是决定氟 化盐是否添加的条件,即在一定的分子比下,电解质必须维持一定的过热度。低 于必要的过热度,就应调整电压和添加氟化铝u 引。 3 极距测量方法 极距( a c d ) 是铝电解槽阳极底掌和铝液界面之间的电解层厚度,由于电 解质的电阻率很大,所以极距部分会消耗大量电能。过分降低极距会引起电解槽 不稳定,进而降低电流效率,所以对极距的研究是铝电解槽稳定操作和节能的重 点【1 7 1 。 目前国内测量极距主要采用传统方法,即插铁棒到铝液和电解质界面附近, 停留数秒后拔出,此时附在铁棒上的电解质和铝液因为环境温度突然降低而迅速 凝固在铁棒上,形成两种不同凝固层,中间的界面具有两层的共同性质,通过判 断此界面的位置来确定极距的大小。但此方法忽略了铝液界面波动,同时还有人 为观测误差因素,故极距测量值不够准确。 sr o l s e t h 找出了电流效率与极距的关系【1 8 】,bdo v s y a n n i k o v 找出了槽电阻 和极距的关系【1 9 1 ,他们只是利用数学统计方法找出极距与其他某些参数的回归 关系,或只着眼于平均极距,未能细化到各阳极。有人利用国内外对电解槽稳定 性、铝液波动以及阳极电流波动检测的研究成果,针对极距建立动态、非均一性 软测量模型,实现极距在线监测,为电解槽的操作优化提供了信息支持1 2 。 4 电流效率测定方法 电流效率的测定方法很多,包括稀释法、盘存法、传统的数理统计方法1 2 1 1 。 稀释法是将某种指示剂加入电解槽的铝液中,根据加入指示剂的量和它在铝 液中均匀分布后的浓度,计算出槽内存铝量。指示剂元素,一般选用c u 、m n 、 t i 。添加指示剂后,立即跟踪铝液中指示剂的变化,从而计算出在此其间内的电 流效率( 回归法) 。或根据前后两次添加指示剂计算出来槽内存铝量,并准确统计 测定周期内的出铝量,也可计算出此期间内的电流效率( 盘存法) 。 对工业电解槽来说,精确地确定短期内电解槽的电流效率是非常困难的,用 加入惰性金属,如银、铜或放射性金属等稀释技术,所获得的1 2 h 的电流效率, 精确度可以达到士1 。而许多研究者无论从理论上,还是从使用的研究上都可以 确认阳极气体中的二氧化碳含量与电流效率有确定的关系,并将这种关系应用于 工业电解槽和实验室电解槽电流效率的测量之中。由于二氧化碳气体分析法测量 电流效率是基于p e a r s o n w a d d i n g t o n 公式,以及对该公式的修正,但这都是建立 中南大学硕士学位论文第一章绪论 在铝的电流效率损失是铝的二次氧化的假定基础之上。就一般正常生产情况而 言,这种假定一般是正确的,但在非正常情况下,如电解槽出现病槽、极间短路、 漏电、阳极长包等情况,以及阳极效应出现和阳极副反应增大时,会导致用二氧 化碳气体分析法测量出的电流效率必然会出现很大的误差。 已有研究表明,电流效率受各种电解工艺参数影响,包括熔体成分、电解质 温度、电流密度、极距和槽结构。电流效率与影响它的参数之间关系复杂,呈现 非线性。用传统的数理统计回归方法,很难实现对电流效率进行预报【2 2 1 。 1 3 铝电解槽工艺参数软测量方法研究 1 3 1 数据挖掘技术 数据挖掘是2 0 世纪9 0 年代新兴的一项新技术,它是知识发现的关键步骤, 国内外学术界和企业界都非常重视对数据挖掘技术和软件工具的研究和开发。数 据挖掘是多门学科和多门技术相结合的产物,也是一个非常年轻而富有活力的研 究领域。 从技术角度上看,数据挖掘是指从数据库中抽取隐含的、先前未知的、有用 信息( 如知识、约束、规则和规律等) 的一个非平凡过程。数据挖掘是一个处理 过程,它利用一种或多种计算机学习技术,从数据库的数据中自动分析并提取知 识阱】。数据挖掘绘画的目的是确定数据的趋势和模式。这个定义包含以下4 个 层次的含义: 1 ) 数据源必须是真实的、大量的、含噪声的; 2 ) 发现的是用户感兴趣的知识; 3 ) 发现的知识是可接受、理解、运用的,最好能用自然语言表达发现结果; 4 ) 并不是要求发现放之四海而皆准的知识,也不是要去发现崭新的自然科 学定理和纯数学公式,更不是什么机器定理证明,所有发现的知识都是 相对的,是有特定前提和约束条件、面向特定领域的。 许多人把数据挖掘等同于另一个常用的术语数据库中的知识发现 ( k n o w l e d g ed i s c o v e r yi nd a t a b a s e ,简称k d d ) ,而也有很多人仅仅是把数据挖 掘看做是为数据库中的知识发现过程的一个基本步骤【2 5 1 。本文采用数据挖掘的 广义定义:数据挖掘是从存放在数据库、数据仓库或其他信息库中的大量数据中 挖掘有用和未知知识的过程。一个简单的数据挖掘处理模型如下: 广义地讲,数据挖掘可定义为有4 个步骤的处理过程。一个数据挖掘会话可 如下执行: 1 ) 集合用于分析的数据集; 4 中南大学硕士学位论文第章绪论 2 ) 将数据提交给数据挖掘软件程序; 3 ) 解释结果; 4 ) 将结果运用于新问题或新情况。数据挖掘的过程不是简单的线性流程, 步骤之间包含了循环和反复。 图卜1 数据挖掘过程示意图 ( 1 ) 数据挖掘中的分类与回归技术【2 6 】 数据分类就是事先利用训练数据建立起来数据库中的类,进而从数据库中的 每一类数据中挖掘出关于该类数据的描述或模型。作为数据挖掘的一个重要主 题,分类在统计学、机器学习、人工智能等领域中得到了较早的研究,只是近些 年来,人们才将它与数据库技术结合起来解决实际问题。 预测模型以通过数据库中的某些数据得到另外的数据目标。如果预测的变量 是离散的,这类问题就称为分类:如果预测的变量是连续的,这类问题就称为回 归。 分类要解决的问题是为一个时间或对象归类。在使用上,既可以用此模型分 析已有的数据,也可以用它来预测未来的数据。分类算法的工作原理是通过分析 已知分类信息的历史数据总结出一个预测模型。这里用于建立模型的数据成为训 练集,通常是已经掌握的历史数据,或者是通过实际的实验得到的数据。 回归是通过具有已知值的变量来预测其他变量的值。通常的回归分析需要依 靠一定的先验知识给出变量之间的函数关系形式;基于前向神经网络的回归分析 方法虽然解决了这一问题,但其“黑箱模型”的形式不利于理解和解释问题。在 最简单的情况下,回归采用的是像线性回归这样的标准统计技术。但在大多数实 际应用中的问题很难找到简单有效的方法来预测,如商品的品牌、股票价格、产 品合格率等。因为要描述这些事件的变化所需的变量方法以上百计,且这些变量 本身往往都是非线性的。为此又发明了许多新的方法来试图解决这个问题,如逻 辑回归、决策树、神经网络等。 中南大学硕士学位论文 第一章绪论 一般同一个模型既可以用于回归也可以用于分类。如c a r t 决策树和神经网 络算法。既可以用于建立分类树,也可以建立回归树。分类的目的是把数据库中 的数据项映射到给定类别中的某一个。分类器的构造方法有统计方法、机器学习 方法、神经网络方法等等。统计方法包括贝叶斯法和非参数法,对应的知识表示 则为判别函数和原型事例。神经网络方法应用较为广泛的是f f n n 的b p 算法。 ( 2 ) 数据挖掘中的聚类技术 在机器学习中,数据分类称之为监督学习,而数据聚类则称为非监督学习。 两者所采用的方法相差甚远。数据聚类是讲物理的或抽象的对象分为几个群体, 在每个群体内部,对象之间具有较高的相似性,而在不同群体之间,相似性较低。 一般地,一个群体也就是一个类,但与数据分类不同的是,聚类结果主要基于当 前所处理的数据,我们事先并不知道类目结构及每个对象所属的类别。另外,数 据聚类计算量巨大,其时间复杂度也要比数据分类大得多。 近年来,聚类作为数据挖掘的主要方法之一,越来越引起人们的关注。所谓 聚类,就是把大量的d 维数据对象( n 个) 聚集成k 个聚类( k m ,可由最小二乘法得: 秒= ( 中7 ) 叫 ( 4 8 ) 上式解的存在性取决于样本数据库。当输入变量均为线性无关时, 中南大学硕士学位论文第四章基于模糊聚类神经网络的铝电解槽软测量模型研究 ( 。) 存在。反之,为病态阵,表明输入变量中包含多余的信息。为此可在 输入变量中选出对输出贡献较大的独立变量为二次变量,然后用最小二乘法回归 算式求解。针对病态阵问题也可采用部分最t j 、- - 乘法( p l s ) 加以解决。总之, 线性模型计算方便简单,外延性好。对于严重非线性对象,采用线性拟合的精度 就会较差,但可采用非线性模型的拟合方法。 ( 3 ) 非线性软测量模型的建立。人工神经网络技术无须具备对象的先验知 识,而是根据对象的输入输出数据直接建模,在估算高度非线性和严重不确定 性系统方面具有非凡潜力。多层前向网络( m f n ) 是神经元网络的一种,它提 供了能够广泛逼近非线性函数的模型结构,理论上只要允许有足够多的神经元, 任何非线性连续函数都可由一个三层前向矩阵以任意精度来近似。在m f n 中应 用最广泛的学习算法是b p ( b a c kp r o p a g a t i o n ) 方法,前向网络在软测量技术中 已得到广泛应用,目前已有针对产品成分、生化反应特征参数以及高炉铁水含硅 量的在线软测量应用报道【7 4 1 。本文将神经元网络与模糊聚类技术有机结合起来, 取长补短,形成基于模糊聚类的神经网络技术,在软测量中发挥作用【7 5 】。 4 1 2 软测量模型实时演算的工程化实施技术 软测量是一种工程实用技术,它通过对软测量模型的在线计算,给出被测量 即主导变量的估计值。完成这个工作的装置被称为软测量估计器或软测量仪表, 对其要求是简易、有效、可靠。设计一个软测量估计器的工作可以分为以下几个 步骤: ( 1 ) 二次变量的选择 根据对生产工艺机理的分析,二次变量的可选数目应大于或等于被估计的变 量数,而最佳数目则与对象的自由度、测量噪声度及模型的不确定性有关。 ( 2 ) 现场数据采集与处理 对二次变量的采集,应从时问和空间的分布上尽量多地加以包容。但数据要 经过粗大误差的删除,要注意纯滞后特性的影响。在大量数据中经过除噪滤波后 可作为软测量的输入变量,采用主元分析法对数据做统计计算后,找出与主导变 量相关性好,灵敏度高和精度高的数据作为二次变量。 ( 3 ) 软测量模型结构选择 根据生产工艺特点来选择模型的类型,如线性、非线性或混合型。 ( 4 ) 参数的估计 线性模型一般采用最小二乘法便可估计出模型的参数。 中南大学硕士学位论文第四章基于模糊聚类神经网络的铝电解槽软测量模型研究 4 2 模糊聚类算法概述 将物理或抽象对象的集合分组成为由类似对象组成的多个类的过程被称为 聚类【7 6 1 。聚类就是按照一定的要求和规律对事物进行区分和分类的过程,在这 一过程中没有任何关于分类的先验知识,没有教师指导,仅靠事物间的相似性作 为类属划分的准则。聚类分析则是指用数学的方法研究和处理给定对象的分类。 聚类分析是多元统计分析的一种,也是非监督模式识别的一个重要分支。它把一 个没有类别标记的样本集按某种准则划分成若干个子集,使相似的样本尽可能归 为一类,而不相似的样本尽量划分到不同的类中。 聚类方法可以与先验知识结合,有时能够起到更好的效果。目前聚类算法比 较多且比较成熟:如当种类数已知时,可以采用通常的基于距离计算的聚类算法; 而在种类和个体都未知的情况下,就可以采用基于贝叶斯统计理论的a u t oc l a s s 方法以及基于自适应振荡理论( a r t 2 ) 的聚类算法。分类的目的是把数据库中 的数据项映射到给定类别中的某一个。目前已经提出了许多不同的方法来解决聚 类问题,聚类算法主要包括模糊聚类算法、顺序聚类算法、层次聚类算法、基于 代价函数最优的聚类算法以及一些其它的算法等。 传统的聚类分析是一种硬划分r 7 7 1 ,它把每个待辨识的对象严格地划分到某 个类中,具有非此即彼的性质,因此这种类别划分的界限是分明的。而实际上大 多数对象并没有严格的属性,它们在形态和类属方面存在着中介性,适合进行软 划分。z a d e h 提出的模糊集理论为这种软划分提供了有力的分析工具,人们开始 用模糊的方法来处理聚类问题,并称之为模糊聚类分析。由于模糊聚类得到了样 本属于各个类别的不确定性程度,表达了样本类属的中介性,即建立起了样本对 于类别的不确定性的描述,能更客观地反映现实世界,从而成为聚类分析研究的 主流。 4 2 1 常用模糊聚类方法概述 m a t l a b 模糊逻辑工具箱中提供了对两种聚类方法的支持,一种是模糊c 均 值聚类( f c m ) ,另一种为减法聚类( s u b c l u s t ) 。 ( 1 ) 模糊c 均值聚类( f c m ) 在模糊c 均值聚类方法中,每一个数据点按照一定的模糊隶属度隶属于某 一聚类中心。这一聚类技术作为对传统聚类技术的改进,j i mb e z d e k t s l 于1 9 8 1 年提出。该方法首先随机选取若干聚类中心,所有数据点都被赋予对聚类中心一 定的模糊隶属度,然后通过迭代方法不断修正聚类中心,迭代过程以极小化所有 数据点到各个聚类中心的距离与隶属度值的加权和为优化目标。该算法是从硬c 中南大学硕士学位论文第四章基于模糊聚类神经网络的铝电解槽软测量模型研究 均值( h c m ,h a r dc - m e a n s ) 聚类算法发展而来的。 ( 2 ) 减法聚类( s u b c l u s t ) 减法聚类方法将每个数据点作为可能的聚类中心,并根据每个数据点周围的 数据点密度来计算该点作为聚类中心的可能性。被选为聚类中心的数据点周围具 有最高的数据点密度,同时该数据点附近的数据点被排除作为聚类中心的可能 性;在选除了第一个聚类中心后,从剩余的数据点中继续用相同方法选择下一个 聚类中心,直至所有剩余的数据点作为聚类中心的可能性低于某一阈值时停止。 本文采用第一种方法,即模糊c 均值聚类算法。 4 2 2 模糊c _ 均值聚类算法 给定数据集x = x l ,x 2 ,x n ,其中每个元素包括s 个属性。模糊聚类就是要 将x 划分为c 类( 2 c n ) ,v = v l ,v 2 ,v c 为c 个聚类中心。在模糊划分中, 每一个样本点都不能被严格的划分到某一类,而是以一定的隶属度属于某一类。 令u i j 表示第j 个样本点属于第i 类的隶属度,u i j e o ,1 1 ,三。材= 1 。 模糊c 均值聚类的目标函数为: j ( u ,矿) = :;。:。“”d 2 , ( 4 - 9 ) 其中,办= i l 一一圳为样本点均与聚类中心v i 之间的聚类,m 1 是模糊加权 参数。 则f c m 算法就是求在满足u i j e o ,1 】,三。= 1 的情况下,目标函数j 的最 小值。j 的条件极值可以由拉格朗日乘数求得: j ( u ,矿) = :。,:,甜m f 口2 + 力( 二- 1 ) ( 4 - l o ) 因此,模糊均值聚类的算法思路为:通过迭代调整( u ,v ) ,使得目标函数j 最小。步骤如下: 1 ) 取定c ,m 和初始聚类中心培,迭代步数l = o : 2 ) 计算隶属度矩阵u l : = ( 4 1 1 ) 当l 彩时,v f j :,l = 0 ,且f e ,l j1 = 1 , v 一f e -v 3 ) 用u 工计算1 ,“1 = 器 件 4 ) 判断是否满足终止迭代条件:对应x 的模糊划分。可用以下两种方式使 划分清晰化,得到x 的普通分类: 中南大学硕士学位论文第四章基于模糊聚类神经网络的锚电解槽软测量模型研究 1 ) 嘉: l x j - v , 。0 = m i n0 一一v i i ,则将x j 归入第i o 类。也就是说x j 与哪一个聚 类中心最为接近,便归为哪一类。 2 ) 在u 的第j 列中,如果,= 啦a ) 【( ) ,则将x j 归入第i o 类,即x j 属于隶 属度最大的那一类,即最大隶属度原则。 当f 充分小,且m = l 时,上述两种方法的分类结果相同。 f c m 算法简单、运算速度快,具有较为直观的几何含义,可以应用于铝电 解槽工艺数据的数据挖掘上。 4 3b p 神经网络技术 神经网络提出了一种数学模型。它是基于人脑组织结构、活动机制的初步认 识而提出的一种计算机体系。它不依赖于模型即可实现任意的函数逼近的自适应 函数估计器。神经网络具有自学习和任意精度非线性映射功能、联想储存功能、 快速寻找有化解的能力【7 9 1 。典型的神经元模型主要由输入、网络权值、阈值、 求和单元、传递函数、输出组成。利用给定的训练样本进行分类或模仿。训练样 本通常由输入矢量和目标矢量组成。在学习和训练过程中,神经网络将样本实际 输出与目标输出进行比较,然后比较结果和误差,按照一定规则或算法对网络权 值、阈值进行调节,从而使网络输入与目标值之间误差逐渐减小。 x i x i x n y l k u l u i u n y “ 图4 - 2 多层前馈神经网络 图4 1 所示就是一种前向网络,因网络信号处理的方向是从输入层到各隐含 层再到输出层逐层进行而得名。前向网络中某一层的输出是下一层的输入,信息 的处理具有逐层传递进行的方向性,一般不具有反馈环路。前向网络的结点可分 为输入结点和具有处理能力的结点。即只负责从外界引入信号后传递给第一隐含 层的节点,与各隐含层和输出层的节点。 根据隐含层传递函数的不同,前向网络可分为b p ( 误差反向传播) 网络, r b f ( 径向基) 网络和小波神经网络。b p 网络隐含层的传递函数为s 型函数: 中南大学硕士学位论文 第四章基于模糊聚类神经网络的铝电解槽软测量模型研究 r b f 网络隐含层的传递函数为高斯函数,输出层的传递函数为线性函数;小波 网络隐含层传递函数为小波函数,输出层的则是线性函数。本文主要介绍b p 网 络算法。 b p 网络是一种单向传播的多层前向网络。b p 网络可以包括三层或三层以上 的神经网络,其中包含输入层、隐层和输出层。上下层之间实现全连接,每层神 经元之间则没有连接。当学习样本提供给网络时,神经元的激活值从输入层经过 各中间层( 隐层) 向输出层传播,在输出层的各神经元得到网络的输入响应。然 后,按照减少目标输出与实际误差的方向,从输出层经过各中间层逐层改进各网 络权值,最后回到输入层。这种算法即为误差逆传播算法,即b p 算法。随着误 差逆的传播不断修正,网络对输入输出模式响应的正确率也不断上升。一般三层 结构的b p 神经网络即可满足任意精度的非线性逼近。 单个实例内所发现的输入属性的个数决定了输入层结点的个数。用户指定隐 层的个数,以及特定隐层内的结点个数。确定这些值的最好选择是进行大量的实 验。b p 算法的一个主要缺陷就是隐层节点数无法确定。虽然已经证明,具有两 个隐层的前向型网络可以任意精度逼近任意连续函数,但针对具体问题,如何设 置隐层数和隐节点数尚无理论指导。理论上讲,隐节点数越多,其系统误差就越 小,但随着隐节点数的增加,计算量也大大增加,机器运算耗费的时间也越多。 多层前馈神经网络有输入层输出层和一个( 或多个) 隐层。其中输入层有1 1 个神经元,隐层有m 个神经元,设输入层神经元i 与隐层神经元i 之间的权值为 w i i ,且隐层神经元j 的阈值为b i ,则隐层神经元j 的输出为: j l 乃= 丌t + 包】 陪1 ( 4 1 3 ) 式中:f 为激励函数。 厂 ) :_ 上 这里采用扁平的s i g m o i d 函数 1 + e x p ( 一“j 作为传递函数。同样,输出 层有p 个神经元。设隐层神经元j 与输出层神经元k 之间连接权值为w i k ,输出 层神经元k 的阈值为b l 【,则输出层神经元k 的输出为 - 苎l = 以w j k 乃+ 】 1 ( 4 1 4 ) b p 算法的学习过程由正向传播到反向传播两个阶段组成。首先,输入样本 的各分量x i ,正向传播通过网络产生输出值,把输出值与期望值进行比较,对 于每一神经元产生误差,然后采用梯度下降法将误差反向传播,通过网络调整输 出层、隐层和输入层之间的连接值和神经元阈值,以使误差信号逐渐减小,最终 使误差满足精度要求。 3 l 中南大学硕士学位论文第四章基于模糊聚类神经网络的铝电解槽软测量模型研究 网络中连接权值的学习算法思路如下:采用误差函数来估计在当前权值集下 网络根据输入模式集得到的输出结果的好坏,然后设法找到个权值集将误差函 数变得最小。误差函数定义如下: e 2 莩( 似y ( 4 - 玢 式中:下标i 表示输出单元集中的某个单元u i ,2 ,为u i 应具有的理想状态: 口f 为该单元的实际状态。 为使e 最小,可采用梯度下降方法,即当模式输入后先计算误差,然后修 改每个权值,使得该模式的误差梯度趋向它的最小值。权值的改变量与误差的负 导数成比例,即 瞩:一k 竺 9 ( 4 - 1 6 ) 式中,k 为比例常数。 由于网络中的连接都可以分为两类,即连接到隐单元的和连接到输出单元 的,因而存在两个相异的学习公式分别对应于该两类权值变化的计算,有 2 d 4 。乃 ( 4 1 7 1 式中按照不同情况d ,分为两种表达式: ( 1 ) 当单元u i 是输出单元时: 4 = ( 一q ) f ,( 力p ) ( 4 1 8 ) ( 2 ) 当单元u i 是隐单元时: 巧= c ,( 门p ,i ) 瓯 k ( 4 1 缈 式中: 力e t = 口+ 6 l j ( 4 2 0 ) 是单元u i 收到的总输入信息,e ,( ,z e ) 是单元的激励函数对总输入的导数, 表示学习率,这是b p 学习算法的一般形式。当采用s 型的s i g m o i d 函数作为单 元的激励函数时,相应的有 2 占4 a j ( 4 2 1 ) 式中,嚷的具体表达式亦有两种情形: ( 1 ) 当单元u i 是输出单元时,有 4 = ( 一q ) 哆( 1 一q ) ( 4 2 2 ) ( 2 ) 当单元u i 是隐单元时: 3 2 中南大学硕士学位论文第四章基于模糊聚类神经网络的铝电解槽软测量模型研究 4 = a i ( 1 一口j ) e 瓯既 ( 4 - 2 3 ) 这是b p 学习算法在实际应用中的常见形式。 1 输入和输出变量的选择 结合实际生产,本文所建神经网络输入采用铝电解槽工艺参数:槽电压、电 解温度、电解质水平、铝水平、分子比、氟化铝料量;电流效率为输出变量,即 6 输入单输出。 2 输入层和输出层节点数的确定 输入层的神经元数是由输入特征向量的维数来确定,根据上面分析确定输入 特征向量的维数为6 ,也就是说输入层的节点数为1 5 2 5 。 输出层即电流效率,其神经元个数为1 ,节点数也设置为1 。 3 隐含层节点数的确定 三层b p 网络已经成为应用最广泛的b p 网络,但选取b p 网络的隐含层的 节点数,目前尚无准确的理论和方法,以下是几个确定三层b p 网络隐含层节点 数h 的经验参考公式【8 0 】: 办打磊+ 口 ( 4 2 4 ) 其中:n 为输入神经元数;m 为输出神经元数;a 为1 l o 之间的常数。 h l 0 9 2 刀( 4 2 5 ) 4 学习参数的选择 b p 网络中计算单元( 隐含层、输出层的神经元) 的传递函数通常取s i g m o i d 型函数。初始权值的量级通常根据经验公式来选取,其中s ,为第一层神经元数 量,t 为输出层神经元数量。一般总是希望经过初始加权后的每个神经元的输出 值都接近于零,这样可以保证每个神经元的权值都能够在它们的s 型激活函数变 化最大之处进行调节。所以,在设计神经网络时,一般取初始权值在( 1 ,1 ) 之间 的随机数。学习速率决定每一次循环训练中所产生的权值变化量。如果学习速率 较大,训练时间可能短一些,收敛速度可能快一些,但这样会导致系统的不稳定: 如果学习速率较小,则训练时间较长,收敛速度很慢,但是能保证网络的误差值 不会跳出误差表面的低谷而最终趋于最小误差值。所以,在一般情况下,倾向于 选择较小的学习速率以保证系统的稳定性和精确度。学习速率的选取范围一般在 o 0 1 o 8 之间。经过反复实验仿真,将学习速率确定为0 。0 8 。期望误差也是比较 重要的一个参数,较小的期望误差值要靠增加隐含层的节点以及增加训练时间来 获得的。在这里,将期望误差确定为0 0 0 5 。 4 4 铝电解槽电流效率软测量模型 由第二章铝电解槽工艺参数对电流效率的影响可知槽电压、分子比、两水平、 中南大学硕士学位论文第四章基于模糊聚类神经网络的铝电解槽软测量模型研究 电解质温度均与之有着密切关系。但又无法得到精确的数学模型。其困难在于: 1 ) 电解槽非稳定过程,槽况变化又是若干工艺参数变化的耦合; 2 ) 铝电解槽受干扰因素较多,很多因素很难量化其对整个槽况的影响; 3 ) 为充分反映内在规律,需要大量原始数据,但若采集样本时间较久,铝 电解槽的操作状态和管理水平可能发生变化,则更加加大数据挖掘的困 难。 神经网络对于原始数据的要求较弱,也无须处理噪声数据,识别电解槽数据 能力较强。故针对铝电解槽电流效率无法在工业条件下准确用数学关系式表达和 推理的情况,使用神经网络方法建立模型效果较好。 但神经网络的不足之处在于输入层变量的数目和训练样本数量会严重影响 到神经网络的运算速度。综合模糊聚类可以将大样本空间分割为较小空间子集, 假设在同一类数据中不确定因素的影响程度相类似等优点,取长补短,可以很好 实现电流效率的软测量。 整个电流效率软测量及优化模型流程图见图4 4 : 图4 _ 4 铝电解槽电流效率在线检测模型流程图 基于f c m 和多神经网络的铝电解槽实时模型算法步骤如下: 1 ) 根据f c m 的分类结果来选定神经网络个数c ; 2 ) 用子网络训练c 个样本,得到子网络输出向量 y l ,y 2 , y c 3 ) 以【c e ,y l ,y 2 , y c 】为样本建立总神经网络而得到模型的综合输出c e 。 利用此模型算法可完成对大量测试样本的训练,从而得到实时电流效率模 型。多神经网络模型( m m l ) 是由多个相互独立、协同作用的子神经网络组成 的系统。本文所研究的基于模糊c 均值聚类的多神经网络软测量模型中,对象 中南大学硕士学位论文第四章基于模糊聚类神经网络的铝电解槽软测量模型研究 的输入空间通过模糊c 均值聚类算法被划分为较小的局部空间,在每个局部空 间中用子神经网络实现期望的非线性映射关系。将每个子网络的输出作为总神经 网络的输入,进行创建总神经网络,经过反归一化,最后得到网络的总输出。子 神经网络的可供

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论