毕业设计论文基于数据分析的传感器故障诊断方法_第1页
毕业设计论文基于数据分析的传感器故障诊断方法_第2页
毕业设计论文基于数据分析的传感器故障诊断方法_第3页
毕业设计论文基于数据分析的传感器故障诊断方法_第4页
毕业设计论文基于数据分析的传感器故障诊断方法_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1章 前言 1.1课题研究的目的和意义 现代化测控装置中,传感器是不可缺少的部件。传感器常常工作在高温、高压、高湿等恶劣的工作环境下,因此在使用过程中,会由于种种原因发生故障。在整个测控系统中,传感器的可靠性是整个装置良性运行、甚至是能否运行的前提条件和保证。如果传感器发生故障,轻者会使系统性能下降,影响控制性能,无法达到所期望的控制结果,使生产出来的产品不合格,严重的可能导致灾难性的后果1。这种情况下,为了提高控制系统的可靠性、可维修性和安全性,通过人工巡检,虽然可以发现一些明显的传感器物理损坏,但是不能察觉传感器内在的故障,而且多数传感器的安装位置非常危险,靠人为去发现和修复传感器故障很

2、难做到及时有效,而且工人们的健康也会受到生产现场强烈噪声和有毒有害气体的危害。同时,目前的dcs(distributed control system)控制系统存在着以下的不足【4】: (1)实时画面和历史曲线不在同一窗口,使操作人员要切换到不同的画面中,才能查看到相关变量的历史曲线,以便发现故障。 (2)采用判断变量上下限的运行监控方法,难以发现一些像传感器失灵等的故障。 (3)仅能以简单文字报警显示方式,不能进一步给出故障幅度、故障原因。 (4)当故障发生时,不能给出相应的故障处理方案。 如今的控制系统的卡件一般都带有自诊断功能,可现场的仪表却没有这样的功能,对于这样的情况一般有两种处理办

3、法:一是研制具备自诊断功能的仪表,目前该方案已经在迸行中,相信很快就会实现,可这种情况对于新装置来说可以实现,可对于已有的装置来说,更换所有的仪表的代价比较昂贵,在目前要节省投资,增加效益的口号下,是不可能的;另一种情况是利用现有的条件,通过编制软件对仪表的性能进行监控。 因此,需要建立一个监控系统来监控整个系统的传感器运行状态,在故障发生时及时检测到故障,进而采取必要的措施,防止系统发生灾难性的事故。对传感器的运行状态实施监控,及时的进行故障检测并诊断隔离,这就是传感器故障检测和诊断系统,它将成为防止故障蔓延的一道防线,并能帮助维修人员争取时间迅速查找出故障源,并进行排除。从而保证生产系统的

4、正常运行。 同时,有效的故障诊断,能够延长仪表的使用寿命,降低维修费用,将会在过程运行状态超出正常运行区域时,及时检测到异常现象,对故障进行定位和分离,指导工作人员采取相应的处理措施,从而避免对产品质量造成影响或发生事故。所以,有效的故障诊断不但能够延长仪表的寿命,降低维修费用,而且可以帮助管理者及时做出决策。有了故障诊断系统,操作者就能及时发现系统中出现的各种故障,及时进行故障排除。目前,传感器的故障诊断研究己成为一种能够提高系统可靠性的新研究热点2。 1.2课题的发展现状 1.2.1硬件冗余法 最早对传感器的故障诊断,主要是采取硬件冗余的方法,也称为直接冗余法,该方法的原理是使用多个同类型

5、的传感器测量同一个物理量,当测量值出现明显的差值时,就可以立即判断出其中必然有一个传感器出现了故障。通常要准确判断传感器的故障一般需要三个同类型的传感器同时测量同一个物理量,与其它冗余方法相比较,该方法具有检测原理简单、不需要了解系统的数学模型、检测速度快而且比较可靠的优点,所以至今还在航空航天和核电站等领域广泛的应用。但是这种方法需要大量的重复设备,导致了系统安装难度的增加以及投资费用升高等不利之处,因此在石油化工领域中并不通用,只运用于一些非常重要的场合,如用于加热炉的炉膛温度检测、参与紧急连锁停车的某些检测点等处3。 1.2.2解析冗余法 随着计算机技术的不断发展,在1971年美国麻省理

6、工学院的beard博士首先提出了用解析冗余代替硬件冗余231,标志着故障诊断技术的开始。该方法是通过建立一个适当的数学模型来表示系统的动态特性,通过比较模型输出同实际系统输出之间的差异来判断传感器是否发生故障,因此也叫模型方法。解析冗余方法就是利用控制系统中各传感器输出之间存在的冗余关系进行故障诊断的,其工作的原理如图11所示4。 模型的设计模型统计检验逻辑判断 传感器的输出 残差 特征 诊断结果图11 解析冗余方法故障诊断原理 该方法主要通过系统不同输出量之间的残差来检测传感器是否出现故障了。当残差为零时4,表示传感器没有故障:当残差不为零时,表示传感器出现故障。解析冗余方法不但能够发现传感

7、器的故障,而且能够定位是哪一个传感器出现故障,还可以估计出现的故障的大小以及严重性。同时,和硬件冗余方法相比,解析冗余方法不需要增加硬件设备,因此,投资成本较低。其缺点是,在系统参数存在不确定性,以及系统参数随时间变化会产生变化,或者系统有未知的输入干扰时,要考虑鲁棒性的问题。使用解析冗余方法时还必须知道被控对象的精确数学模型,这种方法对非线性的、难以得到数学模型的系统是无能为力的。此外,这种方法只能进行故障诊断,不能恢复出现故障的传感器的信号。 1.2.3神经网络方法 90年代,随着神经网络的出现,利用神经网络所具有的非线性特性、大量的并行分布结构以及学习和归纳能力成为研究故障诊断的一种重要

8、方法。神经网络通过对样本的学习掌握系统的物理规律,无需对传感器的测量信号作模型假设,具有较强的鲁棒性。因此,得到了广泛的应用。主要的应用方式有两类:一类是建立在线神经网络预测器,用神经网络对传感器输出序列建立预测模型,将传感器实际输出与神经网络预测输出比较生成残差。对残差分析进行故障诊断;另一类方法是收集各种故障状态下的历史数据样本对其进行训练,输出为故障模式。 在实际应用当中,故障诊断针对的对象一般都是具有模型难以确定、非线性极强的特点,这些故障都是硬件冗余方法和解析冗余方法无法解决的。然而人工神经网络具有很强的非线性拟合能力,而且不需要已知系统的数学模型,人工神经网络的这一特点正好解决了硬

9、件冗余和解析冗余方法无法解决的问题。神经网络允许输入偏离学习样本,对外界输入信息的少量丢失或网络的局部缺损不太敏感,因而具有鲁棒性,同时它具有容错能力强和运行速度快的特点。其缺点是:需要较多的训练样本用于神经网络的学习才能使网络收敛,这对于训练故障数据很难实现复杂系统的网络各层节点数较多,其结构参数往往需多次实验才能确定,训练所需的计算量大,花费时间长;模型结构的物理意义不明确,无法对诊断结果做出明确的解释5。 1.2.4基于数据的方法 基于数据驱动的方法是直接利用仪表检测数据的一种传感器故障诊断方法。自动化程度的提高使生产现场用到了越来越多的仪表,这些仪表会产生大量的数据。虽然可以从这些数中

10、获得一些我们需要的信息,但是要从观测的数据中发现一些不易观察到的传感器故障,对操作工来说有一定的难度。因此,通过各种数据处理与分析方法(如多元统计方法、聚类分析、频谱分析、小波分析等)挖掘出数据中隐含的信息,从而指导操作工进行生产。基于数据分析的流程工业故障诊断的研究与应用于上世纪90年代以来逐渐兴起。这主要来自于两个方面的原因。一方面,随着dcs和各种智能化仪表、现场总线技术在工业过程中的广泛应用,大断方法。自动化程度的提高使生产现场用到了越来越多的仪表,这些仪表会产生大量的数据。虽然可以从这些数据中获得一些我们需要的信息,但是要从观测的数据中发现一些不易观察到的传感器故障,对操作工来说有一

11、定的难度。因此,通过各种数据处理与分析方法(如多元统计方法、聚类分析、频谱分析、小波分析等)挖掘出数据中隐含的信息,从而指导操作工进行生产。基于数据分析的流程工业故障诊断的研究与应用于上世纪90年代以来逐渐兴起。这主要来自于两个方面的原因。一方面,随着dcs和各种智能化仪表、现场总线技术在工业过程中的广泛应用,大量的过程数据被采集并存储下来。另一方面,随着上世纪90年代以来工业计算机技术和数据库技术的发展,廉价的计算资源和可靠的存贮技术为工业数据的分析提供了物质基础。在理论方面,有关数据挖掘的理论和算法也有大量的报道。基于数据驱动的性能监控的研究不需过程的精确解析模型,所获得的理论成果和方法能

12、够较快地应用于实际工业生产中6。 1.2.5基于数据融合的方法 多传感器数据融合是20世纪80年代发展起来的新技术。最早应用于军事领域,在敌我识别、航迹跟踪、目标定位等方面的应用已经 比较成熟。而应用于故障诊断方面的研究是近几年开始,在这方面的研究工作还处于起步阶段。多个传感器数据融合是对多传感器的测量数据进行分级处理,精确、及时的判断出系统的状态以及传感器故障与否。 该方法的优点是:1)与使用单个传感器相比,多传感器信息融合处理后可以获得更准确,更全面的信息;2)不同类型传感器采集的信息具有明显的互补性,可以补偿单一传感器的不准确性和测量访问的局限性;3)一组相似的传感器采集的信息存在冗余性

13、,这种冗余信息的适当融合可以在总体上降低信息的不确定性,这是由于每个传感器的噪声是相关的,融合处理后可明显的抑制噪声,降低不确定性;4)多传感器集成可增加系统的可靠性,某个或几个传感器失效时,系统仍能正常工作7。 存在的问题:1)虽然数据融合的研究已经相当广泛,但未形成基本理论框架和有效广义模型及算法,目前对信息融合的研究都是根据问题的种类,各自建立融合准则,并在此基础上形成所谓最佳融合方案,而且目前很多研究工作是基础研究、仿真性工作。实际的在故障诊断方面的应用较少;2)数据融合方法与融合系统实施问题数据融合系统的设计实施目前还存在许多实际的问题:传感器动态测量误差模型的建立、传感器系统优化、

14、复杂动态环境下系统实时性、大型知识库的建立与管理、与其他领域的很多新技术的“嫁接与融合”,如人工智能技术、计算神经网络计算、遗传算法、进化计算、虚拟现实技术性等,这些尚无成熟理论。3)融合系统的容错性和稳健性没有得到很好的解决冲突信息或传感器故障所产生的错误信息等的有效处理,即系统的容错性或稳健性也是信息融合理论研究中必须考虑的问题。 1.3课题研究的思路 传感器的故障诊断主要包括四个步骤,分别为故障检测、故障辨识、 故障诊断和故障重构。故障检测就是确定故障是否发生,快速准确地检测出故障有利于及早地采取有效的措施,从而避免严重问题的出现。故障辨识是找到发生故障的传感器,以便有效及时地消除故障所

15、带来的不良影响。故障诊断是确定发生故障的类型和导致故障的原因。故障重构是暂时去除故障所带来的影响。 课题以连续搅拌反应釜系统(continuous stirredtank reactor,cstr)作为研究对象,根据物料和能量平衡建立其数学模型,在此基础上,利用matlab进行仿真得到研究需要的正常工况和故障工况下的数据。利用正常运行状况下采集的仿真传感器数据作为训练数据,分别采用不同的方法建立模型;然后采用含有故障的数据作为测试数据,判断其与模型的符合程度,根据符合程度判断是否传感器数据发生了故障。具体的程序是: 首先在系统正常工况下对各个传感器采集来的信号进行预处理,去除掉采集信号中所含有

16、的噪声和粗差;其次针对处理之后的传感器信号采用上述基于数据的方法进行提取特征信息,然后在系统运行过程中根据提取的新的传感器数据对系统进行故障检测和故障识别。文中最后将对所提出的诊断方法进行仿真试验,并对结果进行分析说明8。 1.4课题研究的内容 在过去的十几年里,基于数据驱动的故障诊断方法的研究已经获得持续的进展,但是对于基于数据驱动的故障诊断方法的研究相对其它方法还有待提高。因此,本论文主要在现有研究成果的基础上对故障诊断问题作进一步的研究。第2章 传感器故障分类及仿真对象介绍 传感器一般由敏感元件、传感元件和其它辅助件组成,有时也将信号调节与转换电路、辅助电源作为传感器的组成部分传感器是测

17、量装置和控制系统的首要环节。如果没有传感器对原始参数进行精确可靠的测量,那么,无论是信号转换或信息处理、或者最佳数据的显示和控制,都将成为一句空话。可以说,没有精确可靠的传感器,就没有精确可靠的自动检测和控制系统。现代电子技术和电子计算机为信息转换与处理提供了极其完美的手段,使检测与控制技术发展到崭新阶段。但是如果没有各种精确可靠的传感器去检测各种原始数据并提供真实的信息,那么,电子计算机也无法发挥其应有的作用。 对大型设备运行状态监测和故障的早期诊断与预报活动中,传感器自身故障的及时发现与判别尤为重要。长期的高温、高压、高湿度等恶劣环境以及不确定因素的干扰,常使传感器的输出失真,影响测量系统

18、的准确性、稳定性和可靠性。人们已在如何提高信号处理精度上、在弥补或挽救传感器的“非理想”输出信号方面做了大量工作。但如若在挽救的同时或之前就能判断出由于传感器本身故障所致的“非理想”信号,提前将其滤出并及时修复传感器,不但对后续的信号处理有益,而且更能确保传感器监测功能的实施9。 2.1传感器的故障类型 传感器可能发生各种各样的不同类型故障,为了便于对传感器故障进行研究,有必要对这些故障进行分类,很多学者已从不同的方面提出了多种分类方法。按故障程度的大小可分为硬故障(泛指结构损坏导致的故障,一般幅值较大变化突然)和软故障(泛指特性的变异,一般幅值较小。变化缓慢),硬故障一般由于传感器元件损坏、

19、电系统发生短路、断路或受较强脉冲干扰等原因引起,软故障一般是由部件老化、零点漂移等原因引起;按故障存在的表现形式可分为间歇故障和永久故障;根据故障的发生、发展的进程可分为突变故障和缓变故障;从建模的角度考虑可分为乘性故障和加性故障;按故障的原因可分为偏置故障、漂移故障、精度下降故障(指传感器测量误差的方差增加)和短路和开路故障4种故障形式。在研究方面,常用的是仿真按原因分类的故障得到故障数据,同时由于传感器短路和开路故障比较容易识别,因此本文主要考虑前三种故障形式10。 下面分别描述按原因分类的故障发生时模型。令是第个传感器的实际输出,是第个传感器正常时应该输出的信号。 (1)第个传感器发生短

20、路或开路的故障模式为: (21) 式中:趋于0时称为短路故障,趋于满量程时称为开路故障11。 (2)第个传感器漂移故障变化的故障模式为: (22) 式中:为增益变化的比例系数。 (3)第个传感器发生偏置或精度下降故障时的故障模式为: (23) 2.2 cstr仿真对象介绍 本课题中以带控制的连续搅拌反应釜系统(continuous stirred-tank reactor,cstr)作为仿真对象,利用机理分析的方法建立动态数学模型,通过加入不同的干扰来模拟不同传感器故障得到论文研究所需要的数据。 2.2.1 cstr连续搅拌模型 化学反应器是化工生产中的重要设备之一。为了正确设计反应器的控制系

21、统,建立反应器的数学模型是一个十分重要的内容12。如图2-1图2-1 连续搅拌反应器控制系统所示是液体物料在容器内连续流动的连续搅拌反应器(cstr),为了能够控制反应器的温度及反应产品的成分,必须用流过夹套的冷却物料移去部分热量。假定夹套外层保温较好,热损失忽略不计。可以得到以下几个反应方程式:(1) 化学反应速度方程假设反应器内进行的是一级不可逆放热反应,反应温度r和浓度巴是均匀分布的,并分别与产物出口的温度和浓度相同13,由此可得到反应物的反应速度的方程式为: (2-4)式中:反应频率因子;e:反应活化能;r:气体常数;:反应器出口物料浓度; (2) 物料平衡方程式 根据在单位时间内进入

22、容器的物料量和流出容器的物料量和反应生成的物料量,可得到物料平衡方程: (2-5)式中:反应器出料浓度;:反应物进料流量;:进料反应物浓度;:反应容器内物料的体积。(3)能量平衡方式 (2-6) (2-7)式中:反应器内温度;:冷却剂进口温度;:冷却剂出口温度;:冷却剂体积流量;:夹套内体积;:冷却剂比热容;:反应物密度;:冷却剂密度;:反应进出物料的平均比热容;:反应进料的温度;:单位反应热;u:载热体与反应器内物料总传热系数;:传热面积。2.2.2控制方案的介绍 温度是与反应转化率、产品质量、产量或收率等直接指标有关的间接工艺指标。为了使反应器的操作能够正常进行,必须保持物科与能量的平衡。

23、串级控制能够加快系统的响应速度,对进入主、副回路的干扰有较强的抑制作用,对副对象及控制阀特性变化具有较好的鲁棒性,而且当副变量为流量时,副回路可以按照主回路的需要对质量流和能量流实施精确的控制。因此,控制系统采用双回路串级控制。第一个回路,以反应器温度为主变量,以冷却剂流量为副变量。由反应物的温度控制 tic-101和冷却水的流量控制fic-102组成串级控制,调节阀位于冷却水入口管线上。第二个回路,以反应器液位调节为主变量,反应器出料流量为副变量。由lic101液位调节器(正作用)和反应物料出口流量 fic-101调节器组成串级调节14。 2.2.3 闭环控制系统仿真 利用matlab编程和

24、表21提供的数据对上述的模型进行仿真。控制器采用常规pid控制算法,pid控制算法采用增量型公式: 表2-1 cstr模型的稳态参数及操作条件 (2-9)例如,当反应器进料温度产生一的阶跃变化时,闭环控制系统的响应曲线见图22。 图2-2 闭环仿真曲线图为了更加真实的模拟现场仪表的数据,本文在仿真时对所有的变量加入了噪声,由于对数据的要求不同,所以加入的噪声也不同,如pca的方法仿真时为了满足数据服从正态分布,加入了服从正态分布的白噪声,而ica的方法考虑了现场的实际数据可能不服从正态分布,因此加入的是服从均匀分布的噪声15。 2.2.4 故障描述 本文采用了5个典型的故障进行仿真分析,见表2

25、.2其中,故障l 和故障4为偏置型故障;故障2,3为缓慢漂移型故障;故障5为精度下降故障。所有故障都分别单独设定在开始仿真第501个采样时刻开始发生的。第3章 主元分析在传感器故障诊断中的应用 主元分析法(principal component analysis,pca)是由jackson于1901年提出的一种多变量统计技术。它依据系统变量的相关性进行分析。作为一种不依赖于过程精确机理模型的检测方法,它是解决多变量高维复杂系统的简便、有效的统计方法。所以是常用的工业过程故障诊断方法之一。核主元分析借助核实现非线性映射,通过非线性映射将输入向量映射到高维特征空间,使之在高维空间具有更好的可分行,

26、然后对高维空间的数据做主元分析,得到原始数据的非线性主元。kpca充分利用核的思想,因而更加适于解决非线性问题。本文在pca方法的基础上研究了用核主元分析(kpca)的方法进行传感器故障诊断,在高维特征空 间中构造了统计和平方预测误差(spe)来判定传感器的工作状态。并对两种方法进行了对比分析,分析结果表明了kpca比pca的优越性15。 3.1基于主元分析的方法 3.1.1主元分析法 主元分析的工作目标就要对多变量数据表进行综合简化。如果在数据表中有个变量,pca将考虑对这个数据表中的信息重新调整组合16,从中提取k(k<m)个主成分,使这个主成分能最多地概括原数据表中的信息。即pca

27、可以在力保数据信息损失最少的则下,对高维变量进行降维处理。很显然,在一个低维空间分析数据要比在高维空间容易得多。 主元分析过程的实质就是对原坐标系进行平移和旋转变换,使得新坐标系的原点与本点集合的重心重合,新坐标系的第一轴和数据变异的最大方向对应,新坐标系的第一主轴第二主轴标准正交,并且对应于数据变异的第二大方向,以此类推。这些被称为第一主轴,第二主轴,若经舍弃少量信息后所形成的新的子空间能够十分有效的表示原数据的变异情况,则原来的m维空间就被降至k维。原数据在这些轴上的投影被称为第一主成分,第k主成分。 假设对过程的共m个传感器变量进行监控,并且数据都是服从正态分。在正常工况下从传感器的采集

28、的数据集为x为n×m维矩阵(n为样本数,m为变量数)由于实际存在的数据,如温度、压力、流量等都有不同的单位,因此,为了消除由于单位的带来的影响,通常应将测量数据进行归一化处理,使处理后的数据集满足均值为0,方差为1。即: (3-1)计算的协方差阵: (3-2)对进行奇异值分解: (3-3) 其中:(按降序排列);,p为酉矩阵。矩阵可以分解为m个向量的外积之和,即 (3-4) 称为得分矩阵,为载荷矩阵。是系统主元,也称得分向量,提取采样数据间关联信息,各个得分向量之间是正交的;露是主元特征向量,也称载荷向量,提取变量问关联信息。各个主元向量之间也是正交的,于是可得到第i个得分向量的描述

29、: (3-5)上式表明每一个得分向量实际上是数据矩阵j在这个得分向量相应的载荷向量方向上的投影。当矩阵足中的变量间存在一定程度的线性相关时,数据的变化将主要体现在最前面的几个负荷向量方向上,向量的长度反映了数据矩阵在方向上的覆盖程度。它的长度越大,在方向上的覆盖程度或变化范围越大17。如果将得分向量按其长度做以下排列: (3-6) 那么,载荷向量将代表数据变化最大的方向,与垂直并代表数据变化的第二大方向。矩阵在最后面的几个负荷向量上的投影将会很小,它们主要是由于测量噪声引起的。 假设前k个主元可以代表数据的主要变化,这样数据矩阵可分解为两部分之和,主元子空间和残差子空间,主元子空间由前k个主元

30、线性表出,残差子空问由后(m一k)个主元线性表出,设为x的估计,e为残差空间,则用和e表示训练的数据集x为18: (3-7) (3-8) (3-9)那么利用前k个方向向量确定的子空间,即pca模型空间,就能对系统进行很好的描述。而主元个数k的选取是pca模型中重要的步骤之一,主元个数选取的好坏直接影响到pca在过程监测中的性能19。 主元的确定方法主要:贡献率法、scree检验、平行分析法和press统计法,但似乎还没出现一种占主导地位的技术。贡献率法相对简单。只要合理的选取门限贡献率,则可取得较好的结果20。 (3-10) 上式定义了第j个主元的贡献率,定义k个主元的贡献率之和为k个主元的累

31、积贡献率。主元累积贡献法确定主元数就是当主元的累积贡献率达到门限贡献率时的k即为所求的主元个数。3.1.2基于主元分析故障检测 当主元模型建好以后,就可以利用它对新的测量样本进行故障检测。在对测量数据分析以前,需要对它们进行归一化处理,值得注意的是,此时要以计算出的训练集的均值和方差处理测试数据。 首先将测试样本分别投影到主元子空间和残差子空间,对的进行分解,可以的到的估计值和残差e: (3-11) (3-12) 根据贡献率确定主元的个数k,于是原来的m维数据空间被k维数据代替,而且过程变量之间的相关性被消除,通过在这两个子空间中建立pca过程统计模型,就可以在低维的子空间中实现对多变量过程的

32、监测。具体就是建立两个统计量:统计和spe(squared prediction error)统计21。统计的定义为: (3-13) (3-14) 统计定义了每个时刻的测量值对主元模型的一致程度;spe统计定义了每个时刻的测量值对低维主元模型的偏离程度。当没有故障发生时,和spe小于阈值。相反,当故障发生时,由于变量之间的相关性被破坏,就会检测到或spe超过阈值。 定义了统计和spe统计之后,就需要确定运行的控制限。控制限的计算是建立在一定的假设基础上的,当检验水平为时(指定了权衡误报警率和误检测率的程度),二者的控制限可以按下式进行计算22: (3-15) 式中,置信度为,自由度分别为k和n

33、一k的f分布的上限值 (3-16)式中,是一个正态分布在检验水平下的临界值,本文中口的取值为0.05。 对于从现场来的数据首先要判断发生的故障是否是传感器故障。定性的分析:对于过程扰动而言,它导致的后果是一个或几个变量发生变化。而传感器故障的情况就比较简单,因为一个传感器的故障只会导致该传感器的测量值发生偏离,而不会影响到其它的测量值的变化(如果该传感器的测量结果没有通过控制器转移到其它的变量)。定量的分析:通过对r2和spe的监控共有4种可能的结果:(1 和spe统计量均超过控制界限;(2) 统计量超过控制限,spe没有超过;(3) 统计量没有超过控制限,spe统计量超过;(4) 和spe统

34、计量均未超过控制限。然而,已有的大部分文献均笼统的认为结果(1)和(3)对应于故障发生(包括过程故障和仪表故障);结果(2)对应于过程扰动;结果(4)则表明过程处于正常运行状态。笔者的实验结果表明仅靠和spe很难区分出过程故障和仪表故障,必须要和其它的知识相结合来分析。只是spe对传感器故障的表现有时后要比好。当通过分析和spe的变化确定是传感器发生故障后,下一步就要检测出发生故障的传感器。故障诊断的目的就是找出发生故障的传感器尽管和spe统计方法对于故障检测非常有效,但对于故障辨识却显得无能为力。很多研究者提出了不同的方法,例如基于重构的方法、svi(sensor validity inde

35、x)方法、相关系数法cc(correlation coefficient)和贡献图法等。本文首先采用贡献图的方法,然后基于建立故障库的原理故障提出了一种新的故障诊断方法23。 3.1.3基于贡献图的故障辨识 贡献图方法是一种基于pca模型的简单的故障诊断方法。它考虑了空间的相关性,是单变量统计技术的一种改进。该方法的基础是量化每个变量相对于pca表示的个别得分的贡献率。具体的方法是:(1)计算每一个变量,相对于得分向量的贡献率; (3-17) (2)当计算出的是负值时,把它置为零; (3)计算第j个变量的对所有得分向量的总贡献率: (3-18) (4)把m个变量的总贡献率画在同一个图上。 通过

36、这种方法,操作工程师可以明显的看出那个具有最高的cont值的变量。值得指出的是,这种基于pca模型的贡献图故障诊断方法比较简单,它们是以变量之间的关联性作为依据进行故障诊断,它们无法为过程的故障与变量建立一种一一对应的因果关系,即无法进行直接的故障诊断,而只能显示出一组与该故障相关联的系统变量,然后再由工程操作人员根据经验进行合理的判断。当然,对于简单的传感器故障,由于只有某一个变量与其他变量之间的关联性被破坏,因此运用该方法可以有效地进行故障分离。此外,由于pca方法是以历史测量数据集为基础建立主元模型,因此它对故障的检测和诊断局限于仅有的测量变量之中,而无法对由于过程内部机理变化或其他未测

37、量变量变化引起的故障进行诊断,这势必导致pca方法对于一些复杂过程故障误判24。 3.1.4基于相似度方法的故障辨识 相似度的物理意义就是两个向量的空间夹角的余弦值。不同的故障向量z可利用己建pea模型在主元空间和残差空间分解成z和z两部分: (3-19) 于是可以得到全部已知故障信号在主元子空间和残差予空间投影的故障库: (3-20) (3-21)一个新的测量向量x在两个子空间分解后可以得到: (3-22) (3-23) 于是可以得到新的向量x和x故障库中的一个已知故障之间的夹角的余弦为: (3-24) (3-25) 根据上式,利用已知的故障库和新的测量信号之间的夹角就可以进行故障诊断。当两

38、个余弦值均接近1时,新的测量向量就与已知的故障 向量的方向相同。因此,检测到故障后,就可以通过由和,组成的联合图判断出故障源25。 3.1.5 基于主元分析的故障重构 本小节讨论传感器的重构问题。当检测到某个传感器发生故障的时候,有的时候不能判断出传感器故障的原因,同时又要保证在一段时间内装置的正常运行,为了尽快避免故障所带来的损失,需要第一时间的处理故障,使得过程的故障状态自动的返回到正常运行状态。如果此时能够利用故障前的数据使故障状态尽快回到正常状态,就可以为我们处理故障争取时间26。对于给定的一个主元模型。 (3-26)式中:则新的采样数据y在主元模型下的估计为: (3-27) 式中:为

39、新的数据在主元向量下的得分。矩阵c称为传感器之间的相关系数。假设某一时刻采样数据y的第j个传感器发生了故障,则对第j个传感器的重构,由(327)式可以得到: (3-28) 由上式可以看出,当时,时,说明第j个传感器与其它的传感器不相关,不能由剩余的传感器重构。所以在重构之前一定要首先判断一下故障传感器所对应的是否为1。才能进行下一步的重构工作。可是式(3-28)的重构过程包含了故障数据,这势必会对重构的数据产生一定的影响。 为了消除故障传感器的影响,这里采用重构数据代替式(328)中的故障数据,然后利用传感器之间的相关性,来重构故障传感器。则式(3-28)变为: (3-29) (3-30)可以

40、得到新的重构值: (3-31)3.2 基于核主元分析的方法 3.2.1核主元分析法 kpca是非线性pca的一种,它是利用一个非线性函数把原始输入空间的数据映射到一个高维特征空间日中,然后在高维特征空间中进行pca变换旧。我们可以从主元分析的算法导出核主元分析的算法。设训练集样本为而,恐定义非线性映射: (3-32) 将样本从原始输入空间映射到高维特征空间h。首先假设训练样本映射到高维特征空间后的均值为零,即,这样在特征空间h中相应的协方差矩阵是: (3-33)对应的特征方程为: (3-34) 则对于所有满足的特征向量,它位于所张成的空间中。因此存在系数满足: (3-35) 把式(3-35)代

41、入式(3-34)中,并两边同时乘上,可以得到: (3-36) 但是,非线性变换往往不容易求得,因此使用核函数来完成非线性变换。定义核函数,即特征空间中两向量的内积可以用输入空间中两变量的核函数来表示,则对于数据矩阵x,由于k是一个对称阵,所以式(336)就可以写成27: (337) 通过归一化特征向量,即,由式(335)可以得到: (338) 则测试向量x在特征空间中的第k个主元得分向量为: (339) 值得注意的是,在应用kpca之前,数据应该在高维空间经过标准化处理,本文通过下面的公式来处理: (3-40) (3-41) 3.2.2基于核主元分析的故障检测 利用kpca完成变换以后,采用和

42、pca相同的两个统计量和spe来实现故障的测: (3-42)假设得分向量服从正态分布,则的阈值可以通过下式的f分布获得:,其中 表示置信区间为的f分布上限值。 (3-43)假设预测误差服从正态分布,则spe的阈值通过下式计算: ; ,式中,m,v,分别是估计均值和方差。 3.2.3 pca与kpca对比 线性pca变换相当于对原始空间中的坐标轴进行了一定的旋转,消除了数据之间的相关性;核主元分析就是在特征空间中进行主元分析。因此,在特征空间中,它有着和主元分析相同的特性:如在特征空间中,各个主元之间是不相关的;大部分的能量集中在前面的最大几个主元上28。 在降维和特征提取方面,与pca相比,k

43、pca能够抽取更多的主元。如果训练样本的数量n大于样本的维数m,对于pca来说,最多能够获得m个主元;而kpca则能够获得n个非线性主元。 另外,从核函数的选择方面来看,kpca可以看作是pca的一般形式。事实上,当核数k(x,y)=(x,y)时,kpca就变为了常规的pca算法。因此,pca是kpca的一个特例。与其他的一些非线性pca算法(如神经网络或主曲线)相比,kpca不涉及非线性优算法,所需要的工具只是普通的线性代数;从结构上来说,它无需知道网络的结构和具体维数;从具 体的映射方式来看,它没必要知道非线性映射的具体形式,通过核函数它可以输入空间就能方便地计算非线性问题,能够克服了一般

44、非线性算法的复杂性。另外,通过择适当的核函数,我们能够有效地提取识别所需要的信息。 kpca方法保留了线性pca在处理线性问题的优良特性,同时也具有在高维空间进行数据压缩和提取的特性。核函数的引入避免了维数灾难,使我们仅需要对核矩阵进行特征值分解。 3.3 仿真结果与分析 3.3.1基于贡献图法的故障诊断 采用cstr仿真的数据进行分析,仿真时间是50分钟,采样间隔是3秒。当仿真进行到第25分钟时,通过第2章所述的不同故障情况进行仿真。记录故障数据,然后分别用pca和kpca两种方法进行故障检测。根据公式(3-10),确定模型中保留的主成分的个数。在本章中,当主成分对原有观测变量的累计贡献率达

45、85以上时,模型中保留的主成分的个数为3,实现了降维。同时计算出当显著水平为95时的和统计spe的阈值。 图3-1正常工况下统计图 图3-2正常工况下变量贡献 图3-1和3-2是正常情况的统计图和变量贡献图,从图中可以看出,在没有故障发生时,统计图中偶尔有符合统计要求的采样的统计值超出阈值,认为那一部分是随机噪声。 (1)假设在采样第25分钟时发生故障,由于实际的进料没有变化,而由于传感器的偏差故障导致系统认为进料的流量增加,所以导致了如图3-3所示的后果:冷却水的温度降低,反应物的浓度升高。如果简单的从数据曲线的变化,无法判别出是哪个传感器发生了故障。 基于pca的统计量对故障1:当的流量发

46、生变化由100lmin变为110lmin时的统计量的故障检测结果在图3-4中给出。图中红色的线是统计量的阈值,超出阈值的统计量则表明检测到故障。测试数据取是故障前后各5分钟的采样。因此,按照预测,前5分钟的统计量都应落在阈值的下方,结果也确实如此。从贡献图3-5可以明显的辨识出是变量出了问题。由于基于kpca的方法对偏置故障的检测和辨识和pca的方法相比无明显的差别,在这里就只给出了pca仿真结果29。 图3-3 发生故障时数据历史曲线图 图3-4 qf故障统计图 图3-5 qf故障变量贡献图 故障2,当迸料的浓度从第25分钟开始发生了以每分钟速度为的漂移故障时,其数据变化曲线如图3-6:由于

47、发生的漂移变化量十分的微小,以至于在各个数据曲线图上用肉跟几乎看不出什么变化。但从图3-7可以看出,基于pca的方法的统计对故障的检测有明显的滞后30,本来应该是在图中的第5分钟发生的故障,可直到第7.5分钟以后才检测出故障发生。spe统计表现稍微好些。在第6分钟以后可以明显看到故障发生。而从图中可以看出,基于kpca的方法对于故障的检测的及时性要好些。 图3-6 发生故障时数据历史曲线图pca kpca 图3-7故障统计图 pca kpca 图3-8 故障变量统计图 同样,故障3发生时,进料的温度品从第25分钟开始发生了以每分钟0.1kmin的速度升高时。其统计图如图3-8所示。同样基于kp

48、ca的方法对于故障的检测比pca更加及时。 由(1),(2)可以得出结论,对于测量变量的传感器偏置故障,分别用pca和kpca两种方法进行故障检测,基于pca和kpca的方法都可以快速的诊断出故障源,在时间上也没有滞后;但是对于测量变量的传感器漂移故障,如图3-7和图3-8,基于pca的方法虽然也可以检测出有故障发生,但是在时间上的滞后比基于kpca的方法要大。由此可以的出结论,对于漂移故障基于kpca方法的检测效果优于基于pca的方法。 以上是测量变量发生故障时的诊断结果,通过以上三个典型故障可以得出,当发生故障的传感器是测量变量时,可以通过贡献图识别出是哪个传感器故障。但是,如果发生故障的

49、传感器是控制变量时,情况又怎样呢?假设变量在同样的采样时刻t发生漂移故障,由于该变量是闭环控制下的输出量,因此该故障将影响到系统中的其它变量。统计 图和贡献图如图3-9和图3-10所示,从图中可以看出spe和都在故障发生后检测出了故障,但从贡献图看,变量、和变化比较明显,这是由于系统闭环调节的结果。因此无法准确对故障进行分离,并已出现误报。 图3-9 t故障统计图 图310 t故障变量贡献图 纵上所述,这种基于pca(kpca)模型的贡献图故障诊断方法比较简单,它们是以系统过程变量之间的相关性作为依据进行故障诊断,对于简单的传感器故障,由于只有某一个变量与其他变量之间的关联性被破坏。因此运用该方法可以有效地进行故障分离。同时kpca方法可以pca方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论