基于聚类分析的间歇过程时段划分的MPCA建模的故障分析_第1页
基于聚类分析的间歇过程时段划分的MPCA建模的故障分析_第2页
基于聚类分析的间歇过程时段划分的MPCA建模的故障分析_第3页
基于聚类分析的间歇过程时段划分的MPCA建模的故障分析_第4页
基于聚类分析的间歇过程时段划分的MPCA建模的故障分析_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、各专业全套优秀毕业设计图纸基于聚类分析的间歇过程时段划分的mpca建模的故障分析摘要对于具有过渡特性、多阶段特性的间歇过程的故障检测是非常复杂的。间歇过程最基本的特征就是多阶段,每个阶段操作条件、参数等特性都有一定的差异。由于对于间歇过程的建模和故障诊断都要求对数据进行预处理才能得到有效的检验结果,所以需要找到合适的方法对间歇过程进行阶段划分,才能有效提高建模和故障诊断的准确性。为了实现更加准确地对间歇过程进行阶段划分,最终实现更加精准、有效的故障检测及诊断,降低系统误报率。本文采用一种基于马氏距离的k-means聚类算法,该方法依据基于协方差距离的方法实现对间歇过程的阶段划分,在matlab

2、编程环境下,完成基于马氏距离的间歇过程时段划分算法程序的整体设计方案,编写马氏距离实现以及k-means聚类算法的相应程序,完成对间歇过程进行划分的实现;最后通过pensim青霉素发酵仿真软件获取青霉素发酵过程的间歇过程仿真数据,设计基于多向主元分析(mpca)模型的故障检测方法,并利用mpca建模对基于马氏距离的k-means聚类划分的子时段进行故障检测。实验结果表明,在k-means聚类算法对间歇过程进行分段模块,基于马氏距离的k-means聚类方法的分段效果较符合生产实际;在故障检测的效果方面,基于马氏距离的k-means聚类的故障检测准确,误报率低,达到了预期效果。关键词:间歇过程;聚

3、类分析;k-均值;马氏距离目录前言1第1章绪论2第2章基于聚类分析的间歇过程时段划分算法原理3第2.1节聚类分析算法原理32.1.1 聚类分析算法概述32.1.2 k-means聚类分析算法原理42.1.3 马氏距离基本原理52.1.4 马氏距离与欧氏距离的比较5第2.2节基于mpca的故障检测原理62.2.1基于批次展开的mpca方法原理62.2.2主元分析方法原理7第2.3节总体方案设计9第3章基于聚类分析间歇过程时段划分算法程序的设计与实现10第3.1节数据获取及预处理模块设计与实现10第3.2节基于k-means的聚类分析算法模块设计与实现12第3.3节基于mpca的故障检测模块设计与

4、实现15第4章实验与分析18第4.1节基于k-means的聚类分析算法模块的实验与分析184.1.1实验数据获取184.1.2 基于马氏距离的k-means聚类分析算法的实验与分析194.1.4 聚类结果分析19第4.2节基于mpca的故障检测模块的实验与分析204.2.1 mpca的数据预处理与建模204.2.2 故障检测结果214.2.3 故障溯源23v前言复杂工业过程往往伴随着很多危险因素,一个环节控制不准确就可能会引起生产运行不稳定、产品质量不可靠等问题,甚至可能造成财产及人身安全的重大事故。所以对生产过程的故障检测、预测、排除等技术的研究近年来一直受到国内外的广泛关注,也成为一个炙手

5、可热的研究热点。随着社会对工业产品高精度、高质量、多品种的需求,小批量的精细生产也成为一个重要的发展趋势。工业化生产更加依赖间歇过程。间歇过程具有多时段和过渡性的特点,导致这类系统通常是非线性、时变、滞后的,并且模型不确定,对这类系统很难建立一个精确的数学模型来对其进行控制和检测,这个问题一直是控制界一个非常具有挑战性的课题之一,因而对间歇过程系统控制问题的研究,具有一定的理论价值和实际应用价值。传统聚类分析方法采用欧氏距离进行计算,即用两点之间的距离的平方和来比较实际操作数据与质心的距离。这种方法虽然比较简单,而且比较实用,但是也存在着明显的缺陷。欧氏距离将不同属性的变量等同对待,这一点有时

6、并不能满足实际的要求。而采用马氏距离不受量纲的影响,可以排除变量之间相关性的干扰,克服指标变量不同量纲不同权重所造成的误判。本课题对传统的欧氏距离方法上进行改进,采用马氏距离方法进行聚类分析。在matlab编程环境下实现基于马氏距离的间歇过程时段划分算法程序设计。并使用pensim青霉素发酵仿真软件对青霉素发酵过程的间歇过程数据进行实验测试。第1章绪论随着工业水平的不断发展和提高,间歇过程已经广泛应用于各个领域,如精细化工产业、生物产业、农产品深加工等。同时为了适应市场对于产品多品种、多规格、高质量的要求,间歇生产越来越受到重视。间歇过程中,受生产设备的物理结构,或其他经济和技术上因素的影响,

7、使生产过程由一个或多个一定顺序执行的操作阶段组成。在执行过程中,都会受其生产环境和动态特性的影响,使得生产的产品和工艺操作条件频繁发生变化。与连续生产过程相比,间歇过程具有动态性,多样性,不确定性等特征。如果分段不合理,就不能很好的反映过渡阶段特性的变化,从而造成相邻阶段的过渡过程特性变化对监控结果产生很大影响1。多阶段是间歇过程的一个固有特征,过程的每个阶段都有不同的过程特征及过程主导变量,而且过程变量相关关系并非随着时间变化,而是跟随过程操作进程或过程机理特性变化呈现分阶段性2-4。然而由于这些过程本身其动态特性,以及当在同一设备上要求运行不同的生产批次,所需要产生的各批次之间的操作条件的

8、变化会带来产品质量不高或重复性差等问题,也会造成许多安全隐患5。k-means聚类算法是一种经典的划分的聚类算法,具有算法简单,收敛速度快,适用于处理大数据集等优点,该算法在当聚类是密集的,且类与类之间区别明显时,效果较好,该算法本身具有优化迭代功能,可以在已经求得的聚类上再次进行迭代修正确定部分样本的聚类,对初始样本分类不合理的地方进行。在处理大数据集时,k-means聚类算法是相对可伸缩和高效的,是一种简单快捷的方法。因此针对间歇过程的动态特性,k-means聚类分析算法是一种可行性很强的方法,能行之有效地实现对间歇过程的故障检测。第2章基于聚类分析的间歇过程时段划分算法原理第2.1节聚类

9、分析算法原理2.1.1 聚类分析算法概述聚类是一种将未知变量划分成类的方法,这也是聚类与分类的根本差别。通过将不同数据划分成簇,一个簇内部的对象之间有很强的相似性,而不同的簇之间则有很大的区别。这样一个搜索簇的无监督的学习过程不需要依赖事先定义好的类或者带有类标记实例,而是需要聚类学习算法自动地确定标记。因此,聚类是一种观察式学习而非示例式学习。聚类可以定义如下:在数据空间中,数据由许多个数据点(或对象)组成,数据点的每个属性既可以是数值型的,也可以是非数值型的。假设数据集x有n个对象,则x可以用一个的矩阵表示。聚类的最终目的是把数据集x划分为p个分割,当然,也可能有些对象不属于任何一个分割,

10、将这些对象归类为噪声。所有这些分割和噪声集的并集就是数据集x,并且这些分割之间的交集为空。聚类分析是多元统计方法之一,按照隶属度的取值范围,则可以把聚类算法分成传统的硬聚类算法(如k-平均算法)和模糊聚类算法(如模糊c 均值) 等。模糊聚类技术基于模糊集合论,被广泛应用于模式识别和数据挖掘等领域,成为一个研究的热点,不断涌现出一些聚类分析算法16,17。但目前为止大多数算法都是以欧氏距离作为相似性度量的,只考虑了各类别样本均值这种一阶统计特征,得到的聚类结果是超球型的。而实际大多数情况下因为每个变量的方差并不是相同的,尤其在间歇过程中,各阶段变量变化特征不同,每一类的域应该是超椭圆而不是超球面

11、,这样,传统的聚类方法会导致数据不正确的分类。基于欧氏距离的聚类算法倾向于发现具有相近尺度和密度的球状簇,即在不同的方向上相似性的尺度都一样,然而,簇可能是任意形状的,因此提出能发现任意形状簇的算法是很重要的。聚类分析算法旨在将相似的失误进行归类,是依据事物本身的特征来研究个体。这种方法具有同一类的个体相似度较高,不同类的个体差异度很大的原则。聚类分析算法的三个特征分别为:(1) 对没有先验知识的分类适用。即便没有先验知识或其他的国际标准、国内标准以及行业标准,聚类分析算法可以通过设定一些边角完善的分类变量,来实现较为合理、科学的分段。(2) 能处理由多个变量决定的分类。例如根据一个学生每月的

12、开支分类比较容易。但是在进行数据挖掘的过程中,要求根据该生的家庭收入、家庭支出、平均每天消费金额等多个指标完成分类比较困难的,不过聚类分析解决这一类问题。(3) 聚类分析算法属于一种探索性的分析方法,可以利用聚类分析探索一些事物的内在的规律和特点。然后按照相似性原则对研究对象进行分组。现有的主要聚类算法大致可以分为以下几种:划分聚类算法、层次聚类算法、基于密度的聚类算法、基于网格的聚类算法以及基于模型的聚类算法等。本文采用的k-means聚类分析算法属于划分聚类算法,划分聚类算法是指对于一个给定的n个数据对象的数据集,采用目标函数最小化策略,通常把数据分成k个组,每个组为一个类(或簇)。可以看

13、出,这种聚类方法同时满足以下两个条件:(1) 每个类至少包含一个数据对象;(2) 每个数据对象必须属于且只属于一个类。当然,在有些情况,如模糊聚类、可能性聚类等,条件(2)可以放宽要求。最著名与最常用的划分聚类算法是k-均值算法和k-中心点算法,其他划分算法大都是这些算法的变种。2.1.2 k-means聚类分析算法原理k-means算法是一种经典的基于划分的聚类方法。它的基本思想是先随机产生k个初始点作为k个簇的中心点,将靠近它们的相似的点分到不同的簇,然后按照一定的方法计算各个簇的质心,从而确定新的质心,不断进行迭代,直到质心的移动范围满足给定的要求。这种算法比较简单快捷,但是它的关键在k

14、值的选择和距离公式是否准确。k-means算法实现的具体步骤可以概括为以下5步:(1) 从m个数据中任意选取k个对象作为初始的聚类中心;(2) 分别计算每个数据对象到每个聚类中心的距离,距离最近的一个中心所在的聚类就是该点所在的聚类;(3) 聚类完成后运用一定方法重新计算该聚类中距离每一个点的最近的中心点;(4) 如果与上一次计算出的聚类中心相同则说明聚类结果成立,转(5);如果不同,则转(2)重新进行计算;(5) 输出聚类结果。基于欧氏距离的k-means算法非常简单而且便于解决实际问题,该算法应用比较广泛,但是有一定的缺点。首先,欧氏距离适用于超球形聚类,在不同的方向上相似的尺度一样,倾向

15、于发现具有相近尺度和密度的球状簇。同时,由于基于欧氏距离的k-means算法对野值点和噪声敏感。即使对于一个远离聚类中心的目标,算法也强行将其划入一个类中,从而扭曲了聚类形状。本文采用一种基于马氏距离的k-means算法进行聚类。马氏距离定义了空间中样本之间的协方差距离。考虑了指标变量的协方差矩阵结构及相关性对分类的影响,可以减弱由变量属性之间的相互影响而使聚类产生的误差。2.1.3 马氏距离基本原理马氏距离表示数据的协方差距离。设总体g为m维总体(考虑m个指标),均值向量为=1,2,m,协方差矩阵为=ij,则样品x=x1,x2,xm与总体g的马氏距离定义为:d2x,g=x-1x- (21)其

16、中,=covx,y=ex-exy-ey,当m=1时,d2x,g=x-x-2=x-22 (22)利用马氏距离进行计算在聚类上具有显著的优势,它可以使分类过程中的相似的数据点距离较近。这样可以减弱各属性数据间的相关性影响,降低误差。在具体间歇过程应用中,既能考虑到稳定阶段下的监控,也能兼顾不同阶段间的监控和故障检测。2.1.4 马氏距离与欧氏距离的比较欧氏距离是在m维空间中两个点之间的真实距离。设m维空间中两点x=x1,x2,xp,和y=y1,y2,yp,它们之间的欧氏距离为:d2x,y=x1-y12+xp-yp2 (23)可以看出,欧氏距离算法虽然简单,但是在分析处理多元数据时会体现出一些缺点。

17、例如,欧氏距离没考虑到总体的变异对于距离远近的影响,并且欧氏距离会受到变量的量纲影响。而经过协方差矩阵逆矩阵处理的马氏距离则可以排除测量单位的影响。但是两者之间也有这一定的联系,由(21),(23)两式可以看出,当协方差矩阵为单位矩阵时,马氏距离就简化为欧氏距离。说明马氏距离算法对于欧式距离是一种补充和改进。前文提到,k-means算法实现过程非常重要的一个部分就是各点到聚类中心距离的计算。传统研究通常采用欧氏距离进行计算,即距离的平方和。而马氏距离表示的是数据之间的协方差距离,可以更加有效地计算数据样本集的相似度。运用马氏距离计算聚类中各点到中心的距离可以排除变量之间的干扰。同时也无需考虑原

18、始数据的测量单位的影响。第2.2节基于mpca的故障检测原理2.2.1基于批次展开的mpca方法原理多向主元分析(mpca)方法建立统计模型,模型数据矩阵结构和表达方式相较于pca方法都发生了变化。间歇过程的反应数据通常是以三维数据矩阵的形式来表示,其中,代表间歇过程的个数,代表过程变量的个数,代表每一次间歇过程的采样时刻的个数。pca方法要求每一个子数学模型具备独立的子数据空间,mpca模型就是由这一系列子数据空间构成。mpca方法的原理是,首先将三维矩阵的操作数据进行二维展开,得到一个二维矩阵,不同间歇过程具有不同的特性,其在建模方面的需求不同,所采用的展开方式也有所不同。对间歇过程的数据

19、进行二维展开后,先要对展开处理后的二维数据矩阵进行标准化处理,经过标准化的二维数据可以通过pca方法进行建模。mpca方法建模实质是将一个大型复杂的数据空间,沿这一个轨迹分割成一系列子数据空间,在每一个子数据空间上分别建立子统计模型,多个子模型构成了非线性多元统计数学模型。2.2.2主元分析方法原理给定一个在正常状态下工作的历史数据,设该数据集有个过程变量,个观测值,将该数据集变为矩阵()的形式,其中,每一列代表一个测量变量,每一行代表一个样本。矩阵如式24所示。(24)对pca模型的数据预处理即对矩阵的标准化通常是将x的每一列减去相应的变量均值且除以相应的变量标准差。利用pca对样本数据进行

20、建模。定义标准化的样本协方差矩阵为:(25)对其进行特征值分解,并且按章特征值得大小降序排列。pca模型对x进行如下分解:(26)(27)其中为负载矩阵,由s的前a个特征向量构成。为得分矩阵,t的各列被称为主元变量,a表示主元的个数,也是得分矩阵的列数。得分矩阵的各列是相互正交的,说明这些主元是统计线性无关的。主元的协方差矩阵可以由来得到,其中表示是s的前a个较大的特征值。基于pca方法的过程监控通过监视两个多元统计量,hotellings和残差子空间的,来实现对间歇生产过程是否正常运行的实时监控的。其中,统计量的控制限可采用分布来计算,公式如式28。(28)其中,为主元个数,为建模批次数,为

21、显著性水平。统计量,是指预测误差平方和指标(squared prediction error,spe),表示测量量偏离主元模型的距离值。spe统计量的控制限可由下式计算:(29)(210)(211)其中,为建模数据集中所有批次测量数据在第个时刻spe统计量的均值,为其对应的方差。完成建模后,根据标准轨迹分段情况对在线数据进行阶段划分,使用基于马氏距离的k-means算法对每个阶段进行分段建模,然后再根据公式(212)、(213)、(214)、(215)就得各点和spe值。(212)(213)(214)(215)检查各点是否超过控制限,若超过和spe控制限,则发现故障,则说明该点出现故障;若没有

22、超过控制限,则该批次数据正常。对于使用mpca对在线数据建模检测,使用spe和控制限检验系统是否出现故障,可能会有4种不同的结果:(1) 故障使用spe和同时超过控制限;(2) 故障使用spe超过控制限,而没有超过控制限;(3) 故障使用超过控制限,而spe没有超过控制限;(4) 两者均没有超过控制限。尽管两者总是同时用于检测故障,但这两者具有不同的物理意义,而且重要性也并不相同。对于pca模型,如果建模合理,那么它便描述了变量之间因为各种物理约束形成的相关性,如质量守恒、能量守恒,以及各种操作约束。spe可以检测打破了各种约束的过程异常。根据上面的分析,spe可以区分并检测故障情形(1)、(

23、2)、(4)。在spe的基础上,指标只是补充了没有破坏变量关系,但是无法被spe监测的故障。第2.3节总体方案设计本课题的目标是在matlab环境下设计一个利用基于马氏距离的k-means算法对间歇过程时段进行划分的算法程序。主要实现对间歇过程的阶段划分,以期达到更准确地进行系统的故障检测,降低系统误报率。图21是本文提出的基于聚类分析间歇过程时段划分算法程序的设计的整体设计方案。图21 总体设计流程图该方案主要由数据的预处理,间歇过程阶段划分,基于mpca的故障检测,故障溯源四个模块组成。本程序首先从一个间歇过程工业模型获得仿真数据;对数据进行预处理,包括标准化等等;然后通过基于matlab

24、环境下编写的分段算法分别对间歇过程进行基于欧氏距离的k-means聚类和基于马氏距离的k-means聚类,实现对间歇过程的阶段划分,其中基于马氏距离的k-means聚类是本文设计的方法,基于欧氏距离的k-means聚类算法作为对照实验;实现分段后,为检验本文方法的优劣,分别对该两种方法进行mpca建模,对其进行故障检测;最后通过故障溯源来找到出现故障的变量。第3章基于聚类分析间歇过程时段划分算法程序的设计与实现第3.1节数据获取及预处理模块设计与实现数据获取模块:对典型的间歇过程工业模型进行建模和故障检测,产生故障1(斜坡故障)数据和故障2(阶跃故障)数据,作为故障检测样本。数据处理模块:在实

25、际操作过程中,由于不同变量具有不同的量纲,对检测结果会有所影响。为了消除这种由量纲的差异而引起的不合理的影响,所以要对测量数据进行标准化处理。通常的方法是将x的每一列减去相应的变量均值且除以相应的变量标准差。数据获取及预处理模块的流程如图31所示。图31 数据获取及预处理模块流程图关键部分代码如下:% 读入数据选取有用变量filepath=c:usersqiudesktop故障检测作业大作业仿真数据data;data_n=20;j=1;batch_data=cell(1,data_n);for i = 1:data_n temp = strcat(filepath, num2str(i),.t

26、xt);data_temp = load(temp); vr(:,j)=data_temp(:,2); %ventilation_rate mp(:,j)=data_temp(:,3); %mixing power fr(:,j)=data_temp(:,4); %feed rate sc(:,j)=data_temp(:,6); %substrate concentration do(:,j)=data_temp(:,7); %dissolved oxygen concentration cc(:,j)=data_temp(:,8); %cell concentration pc(:,j)=

27、data_temp(:,9); %penicillin concentration bvc(:,j)=data_temp(:,10); %broth volume change cocd(:,j)=data_temp(:,11); %concentration of carbon dioxide ho(:,j)=data_temp(:,14); %heat outputbatch_datai=vr(:,j) mp(:,j) fr(:,j) sc(:,j) do(:,j) cc(:,j) pc(:,j) bvc(:,j) cocd(:,j) ho(:,j);enddata1=batch_data

28、1 batch_data2 batch_data3 batch_data4 batch_data5 batch_data6 batch_data7 batch_data8 batch_data9 batch_data10 batch_data11 batch_data12 batch_data13 batch_data14 batch_data15 batch_data16 batch_data17 batch_data18 batch_data19 batch_data20;% 数据标准化data=zscore(data1);第3.2节基于k-means的聚类分析算法模块设计与实现该模块主要

29、内容是关于基于k-means的聚类分析算法的设计,结合本文具体思路和方案,设计出基于马氏距离的k-means聚类分析算法,并实现对间歇过程的阶段划分。k-means算法的流程如图32所示。图32 k-means算法流程图无论基于欧氏距离还是马氏距离,k-means算法整体流程大致相同。但是在第四步、第六步中需要分别按照不同的距离公式进行计算。欧氏距离的计算公式为两点之间距离的平方和。如式31。d2x,y=x1-y12+xp-yp2(31)而马氏距离的的计算公式为两个数据点之间的协方差距离。如式(32)。d2x,g=x-1x-(32)如果协方差矩阵是奇异的,将导致马氏距离无法直接被求得。根据矩阵

30、理论,任一秩为的实对称半正定矩阵,都可按下述方式进行分解。为实对称半正定矩阵,假设的秩为,那么就可以分解为,其中为的对角阵,是由的非0特征值向量构成的非奇异矩阵,为矩阵,由中的特征值所对应的特征向量构成。通过这种方式,便可以根据来求的伪逆(33)另外,除了通过协方差矩阵的非零特征值集其相应的特征向量来求的伪逆,也可以通过样本的内积求得。关键部分代码如下:% 基于马氏距离的k均值阶段划分% 对k个中心点进行初始化m1=100;m2=300;m3=500;m4=700;% 循环迭代求取马氏距离count=1;co=cov(data);u,s,v=svd(co);c=inv(s);mx1=data(

31、m1,:);mx2=data(m2,:);mx3=data(m3,:);mx4=data(m4,:);while(count50) k1=0; k2=0; k3=0; k4=0; clear new1 clear new2 clear new3 clear new4 for i=1:800 t1=(data(i,:)-mx1)*c*(data(i,:)-mx1); t2=(data(i,:)-mx2)*c*(data(i,:)-mx2); t3=(data(i,:)-mx3)*c*(data(i,:)-mx3); t4=(data(i,:)-mx4)*c*(data(i,:)-mx4);% 将

32、数据点划分到最近的聚类中心 values,number=min(t1,t2,t3,t4); switch number case 1 k1=k1+1; new1(k1,:)=data(i,:); case 2 k2=k2+1; new2(k2,:)=data(i,:); case 3 k3=k3+1; new3(k3,:)=data(i,:); case 4 k4=k4+1; new4(k4,:)=data(i,:); end end mx1=mean(new1); mx2=mean(new2); mx3=mean(new3); mx4=mean(new4); count=count+1;en

33、d第3.3节基于mpca的故障检测模块设计与实现mpca方法利用正常数据集合确定各子数据空间的统计控制指标,预测误差平方和,=1,2,并向各自的模型空间投影,进行故障检测。故障检测的流程如图33所示。利用mpca进行数据建模,分别计算和spe统计量,并利用其检测一组新的操作数据。用上述分段结果进行分段建模,检查各点是否超过控制限。超过控制限,说明系统运作在该点出现异常,否则,则说明运行正常。为了清晰直观地表示离线监视结果,可以采用多种统计控制图如、spe监视图形,每种统计控制图分别给出95%,99%两种统计控制限。如果新批次过程的统计指标处于统计控制域或控制限内时,表明监视过程处于一种统计控制

34、状态,否则表明系统处于故障失控状态。图形化表达信息丰富,表达方式直观、易于理解。如果检测到故障,则寻找故障发生的时间、种类、引发故障的主要变量将是进一步研究的问题。图33基于mpca的故障诊断流程图关键部分代码如下:%求取各阶段和spe控制限r=mainpc3(latent1);phaset2limit1=(19*r)/(20-r)*finv(0.95,r,20-r);n=size(phase1,2);for i=1:nspem=mean(phasespe1(1+20*(i-1):20*i);spev=std(phasespe1(1+20*(i-1):20*i); phasespelimit1

35、(i)=(spev/(2*spem)*chi2inv(0.95,(2*(spem2)/spev);endfor i=1:n t2limit(phase1(i)=phaset2limit1;spelimit(phase1(i)=phasespelimit1(i);end%在线故障检测 if(it2limit(i) | spe(i)spelimit(i)fprintf(判断该点为可能故障点,i) end continue end第4章实验与分析第4.1节基于k-means的聚类分析算法模块的实验与分析4.1.1实验数据获取本文检测仿真数据从pensim青霉素发酵仿真平台获得16,pensim仿真平

36、台是由伊利诺科技学院(illinois institute of technology,iit)cinar教授的过程建模、检测及控制研究小组于1998-2002年研究开发的。pensim仿真平台是专门为青霉素发酵过程二设计,该软件的内核采用基于bajpai机理模型改进的birol模型,在该平台上可以简易实现青霉素发酵过程的一系列仿真,相关研究表明该仿真平台的实用性与有效性,因此已经成为国际上较有影响的青霉素仿真平台。青霉素仿真平台如图41所示。图41pensim仿真平台本课题所采用的多元批次轨迹数据均来自pensim仿真平台。采集数据均400h,采样时间间隔为0.5h,选择10个过程变量。产生

37、20批次正常数据作为训练样本x(2010800),产生故障1(斜坡故障)数据和故障2(阶跃故障)数据,作为故障检测样本。通过对比基于马氏距离的k-means算法与基于欧氏距离的k-means聚类划分子时段的mpca建模方法的检测效果,以验证本文算法的有效性。4.1.2基于马氏距离的k-means聚类分析算法的实验与分析通过pensim仿真平台获得仿真数据,采集数据均400h,采样时间间隔为0.5h,选择10个过程变量。利用节3.3设计的基于马氏距离的k-means聚类算法进行时段划分,选取其中青霉素浓度作为分段样本数据。具体划分的时间段如表41所示。分段结果如图42所示。表41基于马氏距离的k

38、-means聚类阶段划分时间表阶段第一阶段第二阶段第三阶段第四阶段时间161629394459460800图4.2基于马氏距离的k-means聚类阶段划分图4.1.4聚类结果分析通过基于马氏距离的k-means聚类分析算法的实验聚类结果图可以看出,基于马氏距离的聚类分析算法产生的分段结果中,青霉素在不同阶段生成的速率有明显的不同,而在相同阶段内则比较近似,这与青霉素的实际生产阶段比较符合。第4.2节基于mpca的故障检测模块的实验与分析4.2.1 mpca的数据预处理与建模1. 基于mpca的数据预处理对20个批次的训练样本按变量方向展开,获得每个阶段的二维子数据矩阵,通过使用4.1节所述的k

39、-means聚类分析算法对20个批次的训练样本进行阶段划分,得出四个阶段,对每个阶段数据矩阵进行标准化处理,消除由量纲的差异而引起的不合理的影响。2. 基于mpca的训练样本建模对每个阶段数据矩阵使用pca建模获得每阶段的得分矩阵、负载矩阵,根据主元贡献率求得所需主元个数,并使用式(28),(29)分别计算和spe控制限,为在线故障检测提供有效的检测依据。3. 基于mpca的在线数据建模由于在线数据是按时间发展获得的,必须使用历史数据所求得的每阶段的均值与标准差,再对在线数据进行实时标准化,根据公式(212)、(213)、(214)、(215)使用pca建模方法求得该点的和spe值。图4.3基于马氏距离分段后的和spe控制限4.2.2故障检测结果图45给出使用基于马氏距离的k-means聚类划分子时段的mpca建模方法对故障1(斜坡故障)的检测结果。故障设定在160-180时刻加入一个10%的斜坡故障,如图44所示。故障情况图中每个变量的说明如表42所示。表42故障情况变量说明表变量单位ventilation_rate,通风量l/hmixing power,搅拌功率wfeed rate,补料速度l/hcell concentration,菌体浓度g/lsubstrate concentration,底物浓度g/lpenicillin concentr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论