版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、毕业设计(论文)任务书题目:基于PCA的流程工业故障诊断系统的研究系 名 信息工程系 专 业 自动化 学 号 学生姓名 苑 萌 指导教师 扈书亮 职 称 讲 师 2012年12 月15日一、原始依据(包括设计或论文的工作基础、研究条件、应用环境、工作目的等。)工作基础:了解数据挖掘技术的基本方法,能熟练使用MATLAB软件。研究条件:将流程工业生产过程正常运行的样本数据作为PCA矩阵并通过对数据的预处理,得到特征值和特征向量,建立主元模型,计算SPE和Hotelling统计量的控制限。应用环境:基于主成分分析法的数据信息挖掘技术的研究工作目的:熟练掌握MATLAB的M文件编程 掌握故障诊断技术
2、的基本分类以及基于信号处理的方法的基本步骤。二、参考文献1刘磊,张宇明,钱积新.统计过程在连续生产中的应用J.化工自动化及仪表,第24卷,1995. 2于俊英,连岳.SPC在柔性设计制造中心生产加工中的应用J.航空制造技术, 2005. 3张公绪,孙静.统计过程控制与诊断J.质量与可靠性,2002. 4刘阶萍,罗振璧,陈禹六.工序能力指数的统计分析与改进J.北京科技大学学报,第26 卷第2期,2004. 5高岩,杨慧中.一种主元分析方法在聚合生产过程故障检测与诊断中的应用J.江南大学学报(自然科学版), 2005. 6王海清,宋执环,李平.改进 PCA 及其在过程监控与故障诊断中的应用J.化工
3、学报, 第52卷第6 期, 2001 年6 月.7J. F. MarcGregor and T. Kourti, Statistic Process Control of Multivariate Processes J, Control Practice, Vol.3, No.3, 403-414.三、设计(研究)内容和要求(包括设计或研究内容、主要指标与技术参数,并根据课题性质对学生提出具体要求。)1、掌握MATLAB的基本使用方法,能够独立完成基本的算法设计。2、对典型生产过程-油气水分离系统进行分析,了解其基本过程。3、研究基于PCA和DPCA方法的故障诊断的方法和程序实现。4、对实际
4、的诊断效果做出相应的评价。指导教师(签字)年 月 日审题小组组长(签字)年 月 日天津大学仁爱学院本科生毕业设计(论文)开题报告课题名称基于PCA的流程工业故障诊断系统的研究系 名 称信息工程系专业名称自动化学生姓名苑 萌指导教师扈书亮一、课题来源及意义PCA可以称为主成分分析(Principal Component Analysis ,PCA )或者主元分析。是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。计算主成分的目的是将高维数据投影到较低维空间。给定n个变量的m个观察值,形成一个n*m的数据矩阵,n通常比较大。对于一个由多个变
5、量描述的复杂事物,人们难以认识,那么是否可以抓住事物主要方面进行重点分析呢?如果事物的主要方面刚好体现在几个主要变量上,只需要将这几个变量分离出来,进行详细分析。但是,在一般情况下,并不能直接找出这样的关键变量。这时我们可以用原有变量的线性组合来表示事物的主要方面, PCA 就是这样一种分析方法。PCA技术被广泛应用到各种领域,在生产中有着重要意义。PCA的应用包括数据压缩和编解码、模式识别、图像处理、自适应波束形成、降阶控制器设计、高分辨率频谱分析(用于频率估计)等。具体的有以下几个方面:减少维数;确定变量的线性组合;特征选取,即选择最有用的变量;多维数据的可视化;潜在变量的识别;识别目标或
6、异常值的分组。主成分分析就是试图在力保数据信息丢失最少的原则下,对这种多变量的数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。很显然,识辨系统在一个低维空间要比在一个高维空间容易得多。其几何意义在于主成分分析的过程也就是坐标旋转的过程,各主成分表达式就是新坐标系与原坐标系的转换关系,新坐标系中各坐标轴的方向就是原始数据方差最大的方向,可达到简化数据结构的目的,新产生的综合变量具有不相关的性质,从而避免了信息重叠所带来的虚假性。二、国内外发展现状我国经过近十年来的发展,运用主成分分析的方法对高光谱遥感矿物信息特征提取已经取得了很大进展。航空遥感中心高光谱遥感课题组对这方面进行了理论
7、、技术方法以及规模化应用示范研究,取得了丰硕成果,取得了良好的经济与社会效益,申请了多项发明专利。环境污染问题已经成为人们关注的焦点,为更好地监控治理污染,有必要对大气状况进行实时监测。传统的湿式化学技术以及后续发展起来的气相色谱法、质谱和色谱联合技术等是以吸气取样后的实验分析为基础,不具备实时和连续监测能力。近几年,运用主成分分析的光谱压缩特征提取方法对大气进行分析得出大气状况。在国内还运用主成分分析的方法对人口、教育、地区的经济发展发面等方面研究,都取得了一定的成果。在国外运用主成分分析的方法对医学,地质,人脸识别等领域。在美国、英国等国家采用主成分分析的方法对氯吡格雷、肝素钠、肝素钙等低
8、分子肝素相关产品的销售额数据进行处理,形成新的指标体系,而后应用BP神经网络的方法建立模型,评价模型的拟合能力。在一些欧美国家用核主成分分析方法也就是主成分分析的改进算法,其采用非线性方法提取主成分,把核主成分分析应用到人脸识别中,利用核主成分分析方法选择合适的核函数在高维空间提取人脸图像的主成分,核主成分分析与传统主成分分析相比,可以得到更好的适合分类的特征,基于ORL人脸库,识别核主成分分析提取出的主成分的相关性系数。实验结果表明,核主成分分析不仅实现了降维,而且能取得比传统主成分分析更好的识别性能,正确识别率为92.5%。三、研究目标熟练掌握MATLAB的M文件编程。掌握故障诊断技术的基
9、本分类以及基于信号处理的方法的基本步骤。四、研究内容1、掌握MATLAB的基本使用方法,能够独立完成基本的算法设计。2、对典型生产过程-油气水分离系统进行分析,了解其基本过程。3、研究基于PCA和DPCA方法的故障诊断的方法和程序实现。4、对实际的诊断效果做出相应的评价。五、研究方法与手段图1 基于主元分析法的故障诊断过程基于主元分析的生产过程故障诊断包括离线模型建立和在线故障诊断两部分。其中离线模型建立部分实现了系统正常运行状态下相关变量的主元模型的建立, 其建立过程包括: (1)选择正常运行的样本数据作为PCA 矩阵并建立DPCA 增广矩阵;(2)对PCA矩阵进行数据预处理;(3)计算协方
10、差矩阵的前k 个特征值以及特征值所对应的特征向量;(4)建立主元模型;(5)计算SPE统计量/Hotelling统计量控制限。在线故障诊断部分则实现了对实时数据的故障检测与确定故障源, 其建立过程包括:(1)选取第i时刻的实时数据向量Xi进行标准化处理;(2)计算基于主元模型的SPE统计量和Hotelling 统计量;(3)将各统计量的计算结果与各自的控制限比较,以确定故障状态的发生(4)计算第j个变量在第i个时刻对第l个主元的贡献, 以确定故障变量;(5)根据故障变量确定故障源和故障原因。基于主元分析的故障诊断流程图如图1所示。六、进度安排1、2012.12.07-2013.03.15 查找
11、资料,了解PCA主元分析法的意义以及其故障诊断的方法和过程,了解基本的算法,了解典型生产过程-油气水分离系统及其基本过程,完成开题报告。2、2013.03.16-2013.03.31 建立主元模型,计算SPE和Hotelling统计量的控制限3、2013.04.01-2013.04.15 编写关于基于PCA的流程工业故障诊断系统m文件的程序4、2013.04.16-2013.05.09 通过做实验和仿真,对实际的诊断效果做出相应的评价5、2013.05.10-2013.06.01 撰写论文,准备答辩。七、主要参考文献1R. Isermann and P. Ball. Trends in the
12、 application of model based fault detection and diagnosis of technical processes. In Proc. of the 13th IFAC World Congress, volume N, pages 1-12, Piscataway, New Jersey, 1996. IEEE Press.2P. Kesavan and J. H. Lee. Diagnostic tools for multivariable model-based control systems. Ind. Eng. Chem. Res. ,
13、 36: 2725-2738, 1997.3J. E. Jackson. Quality control methods for two related variables. Industrial Quality Control, 7:2-6, 1956.4J. E. Jackson. Quality control methods for several related variables. Technometrics, 1:359-377,1959.5R. O. Duda and P. E. Hart. Pattern Classification and Scene Analysis.
14、John Wiley & Sons, New York, 1973.6 Seongkyu Yoon , MacGregor J F. Statistical and causal model-based approaches to fault detection and isolation J . AIChE J , 2000, 46( 9):1813-1824.7M. J. Piovoso, K. A. Kosanovich, and R. K. Pearson. Monitoring process performance in real time. In Proc. of the Ame
15、rican Control Conf. ,pages 2359-2363, Piscataway, New Jersey, 1992. IEEE Press. 8E. W. Jacobsen. Studies on Dynamics and Control of Distillation Columns.PhD thesis, University of Trondheim, Trondheim, Norway, 1991.9B. M. Wise, N. L. Ricker, D. J. Velkamp, and B. R. Kowalski. A theoretical basis for
16、the use of principal component models for monitoring multivariate processes. Technnical report, Eigenvector Research, Manson, Washington,1989.10S. Wold. Cross-validatory estimation of components in factor and principal components models. Technometrics, 20:397-405.11J. F. MacGregor and T. Kourti. Sta
17、tistical process control of multivariate processes. Control Engineering Practice, 3:403-414,1995.12 J. E. Jackson. A Users Guide to Principal Components. John Wiley & Sons, New York,1991.13J. E. Jackson and G. S. Mudholkar. Control procedures for residuals associated with principal component analysi
18、s. Technometrics, 21:341-349,1979.14R. A. Johnson and D. W. Wichern. Applied Multivariate Statistical Analysis. Prentice Hall, New Jersey, 3rd edition, 1992.15J. Kresta, J. F. MacGregor, and T. Marlin. Multivariate statistical monitoring of process operating performance. Can. J. Chem. Eng. ,69:35-47
19、,1991.16S. Wold, K, Esbensen, and P. Geladi. Principal components analysis. Chemometriics and Intelligent Laboratory Systems, 2:37, 1987.17B. M. Wise, N. L. Ricker, and D. F.Veltkamp. Upset and sensor failure detection in multivariate processes. Technical report, Eigenvector Research, Manson, Washin
20、gton,1989.18W. W. Hines and D. C. Montgomery. Probability and Statistics in Engineering and Management Science. John Wiley & Sons, New York, 3rd edition,1990.选题是否合适: 是 否课题能否实现: 能 不能指导教师(签字)年 月 日选题是否合适: 是 否课题能否实现: 能 不能审题小组组长(签字)年 月 日毕业设计(论文)说明书 题目:基于PCA的流程工业故障诊断系统的研究系 名 信息工程系 专 业 自动化 学 号 学生姓名 苑 萌 指导教
21、师 扈书亮 2013年6月6日摘要目前,计算机、各种智能仪表和控制设备在工业生产中广泛应用,大量数据能够被读取和存储,在享受便利的同时,一些故障造成的错误数据和信息也随之产生,如何利用存储下来的数据信息进行故障诊断,加强过程监控,日益成为研究热点。本设计主要研究基于PCA的流程工业的故障诊断,对主元分析法进行理论研究,学习主元分析算法,以及过程监控和故障诊断的相关基础理论。应用基于PCA的故障诊断方法对浮式油轮生产储油卸油系统(FPSO)进行故障检测与诊断研究。通过对系统历史数据进行预处理分析,建立主元模型;利用主元模型对仿真实时数据进行故障检测;应用SPE统计法和Hotelling统计法判断
22、系统是否发生故障;利用贡献图法实现故障分离。关键词:主元分析法;SPE统计量;Hotelling统计量;故障诊断;FPSOABSTRACT At present, the computer, all kinds of intelligent instrument and control equipment is widely used in industrial production, a large amount of data can be read and stored, enjoying convenient at the same time, some failure caused
23、by wrong data and information has been produced, causing damage. How to use the stored data information for fault diagnosis, strengthening process monitoring, has become the research direction of The Times.In this paper, we study the fault diagnosis of process industry based on PCA, the theory study
24、 on the principal component analysis method, the learning algorithm of principal component analysis and process monitoring and fault diagnosis of related basic theory. Application of fault diagnosis method based on PCA for floating production storage tanker unloading system (FPSO) train was studied
25、by means of fault detection and diagnosis. Through analyzing historical data preprocessing system, pca model is set up; Using the principal component model for fault detection simulation data in real time; Application of SPE statistics and Hotelling statistics to determine whether a system failure o
26、ccurs; Using the Matlab software to use contribution figure method to realize fault isolation.Key words: The SPE statistics; Hotelling statistics; Fault diagnosis; FPSO目录第一章绪论11.1工业系统的故障监测与诊断11.1.1过程监控的步骤11.1.2过程监控的量度21.1.3过程监控的方法21.2本课题所完成的主要内容3第二章主元分析法42.1引言42.2主元分析PCA42.2.1降阶52.2.2故障检测62.2.3故障识别8
27、2.2.4故障诊断102.2.5主元分析的算法112.3 动态PCA13第三章基于PCA的流程工业故障诊断系统153.1基于主元分析的故障诊断步骤153.2基于主元分析的故障诊断简析15第四章FPSO典型流程的故障检测与诊断164.1离线模型的建立164.2在线故障诊断164.3总结16第五章总结与展望165.1总结165.2研究展望16参考文献16附录16外文资料中文译文致 谢第一章绪论1.1工业系统的故障监测与诊断在加工业和制造业,人们正在努力生产高质量的产品,降低产品的不合格率,以满足不断增强的、严格的安全和环保规章。过去认为可以接受的过程操作方法现在已不再适用。为了满足更高的标准,现代
28、工业过程包含大量的闭环控制变量。设计的标准过程控制器常常通过补偿过程中产生的干扰或变量的影响来维持满意的运行。尽管这些控制器能够补偿许多类型的干扰,但对有些过程的变化,这种控制器就不能恰当的处理。这些变化被称为故障。更准确地说,故障被定义为系统中至少一个特性或变量的一种不允许的偏离1。工业系统中发生的故障类型包括过程参数的变化、干扰参数的变化、执行器的问题和传感器的问题2。为了确保过程运行状况满足给定的性能指标,需要对故障进行检测、诊断和消除。这些任务就与过程监控相联系。过程监控的目标是通过识别不正常行为来确保过程成功的按计划运行。这些信息不仅保持系统操作员和维护人员不断了解过程的运行状态,而
29、且还帮助这些人员做出适当的补救措施,以消除过程的不正常行为。其结果是,正确的过程监控使停车时间最小化,设备运行的安全性得以改进,生产成本得以减少。由于工业系统愈加集成化、复杂化,监控问题不易用单变量控制解决;而从各种不同的运行状态和故障状态下采集的数据的可用性对故障监控至关重要,因此利用现代计算机的存储容量和计算速度使得过程监控算法的大量数据运算成为可能。1.1.1过程监控的步骤图1-1过程监控环示意图过程监控的四个步骤是故障检测、故障识别、故障诊断和过程恢复。其中,故障检测就是确定故障是否发生了。及早进行检测,对将会出现的问题提出有价值的警告,并采取适当措施,避免严重的过程颠覆;故障识别就是
30、把那些与诊断故障最有关联的观测变量识别出来;故障诊断就是确定故障状态的原因;过程恢复,也称作干预,就是去除故障的影响,这是使过程监控环闭合的必须步骤(如图1-1)。一旦检测到故障发生了,故障识别、故障诊断以及过程恢复程序就会按照各自的顺序执行。1.1.2过程监控的量度一个典型的过程监控系统通常包括一个或多个量度,它们是从系统论、模式分类理论、信息论和系统论发展而来的。这些量度在某种程度上代表了过程的状态或行为。把从过程中采集的在线数据转换成几个有意义的量度,从而帮助操作员确定设备运行的状况,必要时,还能帮助诊断故障。就故障诊断而言,可以给某些量度施加一些界限值,一旦计算出来的某个量度超出了这些
31、临界值,就认为检测到了一种故障。过程监控量度可以按其与三种方法中的一种或多种相关联的情况来分类,即数控驱动的、解析的和基于知识的方法。1.1.3过程监控的方法数据驱动、解析的和基于知识方法的效果不仅依赖于可用模型的质量、类型,还依赖与所得数据的数量和质量。传统的监控方法包括限幅传感和偏差检测。偏差检测通过比较仿真值和实际观测值来产生报警。但是它依赖于模型的准确性,而模型的不准确在实际中是不可避免的,使其很难将真正的故障与模型的误差区别开来。限幅传感在确定每个观测变量的阈值时,并不使用其他变量的任何信息。它忽略了观测变量之间的相关性以及同一变量在不同时间的测量值之间的相关性。解决空间相关性的需要
32、导致了基于多变量统计技术的过程监控统计学的发展和应用。主元分析法(PCA)就是在监控工业系统时使用的最为广泛的数据驱动技术。PCA是一种用于过程监控的降维技术,是一种根据以获取数据的方差而进行最优降维技术,他解决了变量间的相关性3。由PCA给出的对数据的降维表示,可以改善应用多变量统计学进行检测和诊断故障的效果。根据PCA提炼出的结构可用于识别与故障有关的变量或受故障影响最大的变量。费舍尔判别分析(FDA)是在模式分类领域里研究和发展起来的一种降维技术。FDA用来确定观测空间中的这样一个部分,该法部分在区分几种数据类时是最有效的。判别分析法就是把观测空间的这一部分应用到故障诊断中。而降维技术是
33、被同时应用到全部类的数据中。部分最小二乘(PLS)是数据分解的方法,它将每个部件的预测器数据块与被预测数据块之间的协方差最大化。基于PCA、PLS和FDA的过程监控统计方法,通过把在某一特定时刻采集到的数据扩充到前几个连续采样周期中采集到的数据中,经扩展后也可以包含序列相关法。处理序列相关的一种方法就是求取多个数据点上测量值的均值。另一方法就是使用较大的采样间隔。然而这些方法在求解序列相关时,都没有利用在系统辨识理论中取得的有价值的研究进展。直接从数据中产生状态变量的一类系统辨识方法被称为子空间算法(CVA)。它与PCA、FDA和PLS有着紧密的联系。PCA、FDA、PLS和CVA的量度可以完
34、全基于数据来计算。解析法能够提供比数据驱动技术更有效的过程监控效果。解析法基于被测的输入和输出,使用详细的数学模型来生成一些特征量。其最常用的特征量包括残差、参数估计和状态估计。通过观测到的特征直接的或经过变换后,同正常运行条件下的相应特征进行比较,故障就能被检测或诊断出来了。当有故障存在时,残差或残差的变换取值相对较大;当仅存在干扰、噪声或模型误差时,取值较小。所有方法,无论是基于数据驱动的、解析的,还是基于知识的方法都有其优缺点。1.2本课题所完成的主要内容本论文主要研究的是基于PCA的流程工业故障诊断系统的研究。了解主元分析的算法,及故障的检测、识别和诊断。在了解过主元分析法后,引用到动
35、态主元分析法,对比PCA与DPCA的优缺点。针对PCA主元分析法的具体算法及应用,扩展到基于PCA的FPSO典型生产流程油气水分离系统的故障诊断。将流程工业生产过程正常运行的样本数据作为PCA矩阵并通过对数据的预处理,得到特征值和特征向量,建立主元模型,计算SPE和Hotelling统计量的控制限。利用Matlab软件进行基于主元分析的故障诊断的仿真实验,利用主元贡献图等直接观察并分析数据。第二章主元分析法2.1引言通过把数据投影到能够准确表征过程状态的低维空间,降维技术可以大大简化和改进过程监控程序。主元分析(Principal Component Analysis, PCA)就是这样的一种
36、降维技术。它以某种方式产生低维表示,这种方式保留了过程变量间的关系结构,按获取数据的变化度来说是最优的。作为监控工业过程的一种降维工具,PCA在这些方法中的应用,受到了如下一个或多个因素的启发。第一,PCA可以产生数据的低维表示,与用全维观测空间相比,可以更好地推广到独立于训练集的数据,从而提高监测和诊断故障的效率。第二,不论是造成故障的变量,还是严重受故障影响的变量,用PCA提取的结构都可以有效地对他们进行识别。第三,PCA能够把观测空间分离成一个获取过程的系统趋势的子空间,和一个基本上包含随机噪声的子空间。本章主要叙述的是过程监控的PCA方法。2.2主元分析PCAPCA是一种线性降维技术,
37、是按获取数据的变化度为最优的。主元分析方法( PCA , Principal Component Analysis)是一种利用统计原理建立描述系统的低维模型的方法,经过几年的研究和发展,成功地应用于过程的分析和监测6。从实际应用来看,PCA方法目前主要用于故障监测,本文结合T2统计、Q统计方讨论了PCA方法用于过程故障检测的原理,同时结合贡献图进行了简单故障诊断。PCA确定了一系列相互正交的向量,称为负荷向量,按照在负荷向量方向的方差大小来排序。它有n个观测值,m个过程变量。负荷向量是矩阵V中正交的列向量,训练集沿矩阵V第i列的投影的方差等于i2,则样本协方差矩阵S的特征值分解:S=1n-1X
38、TX=VVT 式(2-1)其中VRmm为酉矩阵,=TRmm包含幅值递减的非负实特征值(12m0),并且第i个特征值等于第i个奇异值的平方。为了最优的获取数据的变化量,同时最小化随机噪声对PCA表示的影响,与a个最大奇异值相对应的负荷向量被保留。选择负荷矩阵PRma的列,使其与前a个奇异值相关联的负荷向量相对应,则X观测到低维空间的投影就包含在得分矩阵中: T=XP 式(2-2)并且,T返回到m维观测空间的投影为: X=TPT=t1p1T+t2p2T+t3p3T+tmpmT 式(2-3)其中T为得分矩阵,T=t1t2 tm;P为负荷矩阵,P=p1p2 pm。当X的变量间存在一定程度的线性相关时,
39、矩阵X的变化将主要体现在最前面几个负荷向量的方向上, 矩阵X在后几个负荷向量上的投影将会很小。X和X的差就是残差矩阵E: E=X-X 式(2-4)这个残差矩阵获取了用与m-a个最小奇异值相关联的负荷向量所张成的观测空间的变化量。由X和E张成的子空间分别称为得分空间和残差空间。包含在矩阵E中的子空间具有小的信噪比,并且把这个空间从X中去除就会产生一个更精确的过程表示,X。定义ti为训练集中T的第i列,则有下列特性7:1、Var(t1)Var(t2)Var(t3)。2、Mean(t)=0; i。3、tiTtk=0; ik。4、不存在能够获取更多数据变化的a个元素的其他正交扩展。测试集的一个新观测向
40、量(列)xRm,可以投影到低维得分空间ti=xTpi,这里pi是第i个负荷向量。被转换变量ti也称为x的第i个主元8为了区分被转换变量和被转换的观测值,称被转换变量为主元,单独被转换的观测值为得分。用PCA把向量投影到低维空间后只需要监控a个变量,如果在测试集中收集了足够的数据,就可以形成得分向量。如果在测试集中收集了足够的数据,就可以形成得分向量t1,t2,ta。如果这些得分向量不满足上述4个特性,测试集合很可能是在区别于训练集的不同运行状况下收集的。这种从多维数据进行结构提取的过程是得分贡献法用于故障识别的关键部件。2.2.1降阶通常认为,并且在某些假设下也可从理论上证实9PCA空间中与较
41、大奇异值相对应的部分描述了过程中所产生的大部分系统的或状态的变化,与较小奇异值对应的PCA空间的那部分则描述了随机噪声。通过适当确定在PCA模型中保留的负荷向量的数目a,系统变化就可以从随机变化中解耦,从而可以把两种类型的变化分开监控。以下四种技术可以确定a的降阶方法:1.百分比变化量测试。2.Scree检验。3.平行分析法。4.RESS统计。百分比变化法通过计算负荷矩阵的最小数目来确定a,这个最小数目用来解释总方差的一个指定的最小百分比。由于这个百分比是随意选取的,所以他对某一特定应用来说,可能太大或者太小。Scree检验做了一个假设,即与随机噪声对应的方差i2形成一个线性轮廓线。得分空间的
42、维数a是通过确定轮廓线不再是现行的那些点的i2值来确定。这个断点的识别可能不明确,因此这种方法很难自动实施。尤其当轮廓线上发生几个断点时。平行分析法通过把方差轮廓线与通过架设独立观测变量获得的轮廓线进行比较来确定维数。降阶有两个轮廓线的交叉点确定。这种方法确保在得分空间中获得显著的相关性,而且它直观且容易自动实施,所以特别具有吸引力。得分空间的维数,也可以利用交叉验证(Cross-Validation)的方法来确定,及采用预测残差平方和(Prediction Residual Sum of Squares,PRESS)统计量10 PRESS(i)=1mnX-XF2 式(2-5)这里i是用来计算
43、X的负荷向量的个数。为实现这种技术,把训练集分成许多组,在得分空间的不同维数的基础上,利用所有其他组,计算一个组的PRESS统计量。每个组都这样重复,与最小平均PRESS统计量相关联的i确定了得分空间的维数。2.2.2故障检测T2统计量用来对多变量过程数据进行故障检测。给定一个观测向量x并假设=T是可逆的,则T2=zTz中T2统计量可以直接通过PCA表示式 1n-1X=UVT 式(2-6)计算,得到T2=XTV(T)-1VTx 式(2-7)当观测变量数目大且可获数据量相对较小时,式(2-7)T2统计量不能精确代表受控过程行为,尤其是在与较小奇异值对应的负荷向量的方向上。这些较小的奇异值的不精确
44、性对计算T2统计量的影响巨大。除此之外,较小奇异值有错误倾向,因为这些值包含小的信噪比,并且相关联的负荷向量的方向通常缺乏充分激励。因此在这种情况下,计算T2统计量时,应该保留只与较大奇异值相关联的负荷向量。如果将只与a个最大奇异值相关联的负荷向量包括在矩阵P中,则低维空间的T2统计量可用下式计算T2=xTPa-2PTx 式(2-8)这里a包含的前a行和列。T2统计量式(2-8)只测量得分空间中的变化。因T2统计量就遵循自由度为m的2分布11: Ta2=a2(m) 式(2-9)若实际的均值和协方差已知,则式(2-9)可导出T2统计量的阈值为 Ta2=a2(a) 式(2-10)对于取自训练集外的
45、观测值,故障也能通过下式决定的阈值检测出来: Ta2=mn-1n+1nn-mFa(m,n-m) 式(2-11)由于实际的协方差矩阵是从样本协方差矩阵中估计出来的,根据式(2-11)可导出T2统计量的阈值为 Ta2=an-1n+1nn-aFa(a,n-a) 式(2-12)又因为训练集的样本协方差矩阵等于: S=1n-1XTX 式(2-13)为检测训练集的野点,可从式(2-13)导出的阈值为 Ta2=n-12an-a-1Fa(a,n-a-1)n(1+an-a-1Fa(a,n-a-1) 式(2-14)由式(2-8)的T2统计量不受协方差矩阵较小奇异值的不精确性的影响,所以与式(2-7)的T2统计量相
46、比,它能更好的表示正常过程行为,且能提供鲁棒性更强的故障检测措施。同时可以认为式(2-8)中的T2统计量是测量过程的系统变化,而且偏离阈值就意味着系统变化是失控的。式(2-7)中T2统计量对在PCA空间中与较小奇异值相对应的误差极为敏感,因为它直接测量沿着每个负荷向量的变化。也就是说,它直接测量与较小奇异值相对应的得分。观测空间中与m-a个最小奇异值相对应的那部分可以用Q统计量进行更强的鲁棒性监控12。 Q=rTr,r=I-PPTx 式(2-15)这里r是残差向量,是观测值x到残差空间的投影。由于Q统计量不是直接测量沿着每个负荷向量的变化,而是测量残差空间的变化总量,所以Q统计量不受对较小奇异
47、值的误差过度敏感的影响13。Q统计量也称为平方预测误差,用来度量观测值相对低维PCA表示的偏差。Q统计量的分布可以按Jackson和Mudholkar的方法来近似为: Qa=1h0ca221+1+2h0h0-1121h0 式(2-16)这里i=j=a+1nj2i,h0=1-213322,ca是与(1-a)分位点对应的标准差。给定显著性水平a, Q统计量的阈值可以用式(2-16)计算,也可应用来检测故障。Q统计量用于度量过程的随机变化,例如与测量噪声相关联的变化。阈值式(2-16)可以用来判定随机噪声的正常变化。带有恰当阈值的T2统计量和Q统计量可以检测不同类型的故障。两种统计一起使用从而发挥他
48、们各自的优点。当这两种统计一起使用并分别带有各自的阈值时,将产生一个圆柱形的受控区域。2.2.3故障识别故障识别的目的就是确定哪个观测变量与诊断故障最密切相关,一旦故障检测出来,下一步就需要查处失控状态的原因。若过程变量数目较大且集成化较高,则诊断故障的难度就较大。另一种情况,当故障发生时,许多测量变量可能会偏离设置值,且在系统中持续存在。这类系统会掩饰故障,从而很难正确分离系统真正发生故障的原因。传统上,过去使用单变量统计技术进行故障识别。给定一个观测向量,每个变量的标准误差为 ej=(j-j)sj 式(2-17)其中j是均值,sj第j个变量的标准差。但是单变量统计技术在故障识别时,可能会遗
49、漏与故障相关的变量。贡献率图是一种用于故障识别的PCA法,它改进了单变量统计技术,考虑到了空间相关性。量化每个过程变量相对于PCA表示的个别得分的贡献率,然后只对造成失控状态的得分的贡献率求和。该方法应用于不符合T2统计量的情况,可总结为:1.检查每个观测值的标准化得分(tii)2,并确定造成失控状态的ra个得分。2.计算每个变量Xj相对于失控得分tj的贡献率 conti,j=tii2pi,j(j-j) 式(2-18)3.当contij为负时,设它为0。4.计算第j个过程变量的Xj总贡献率 CONTj=i=1r(conti,j) 式(2-19) 5.把所有m个过程变量Xj的CONTj画在一个曲
50、线图上。造成故障的变量可以根据总贡献率值CONTj区分优先次序,但是整体贡献率值CONTj对较小奇异值极为敏感,所以这种方法并不实用。Wise等人17研究出了用于故障识别的PCA方法,量化每个过程变量在残差空间的总变化。假设m-a个最小奇异值全相等,那么残差空间内每个变量Xj的方差可以估计为17: sj2=i=a+1ppi,ji2 式(2-20)给定q个新观测值,那么PCA模型空间外的第j个变量的方差可被测试出来,其中 sj2 sj2F(q-a-1,n-a-1) 式(2-21)意味着是失控变量。sj2和sj2分别是新观测值和训练集观测值中第j个变量的方差估计值,F(q-a-1,n-a-1)是F
51、分布的(1-a)分位点18。式(2-21)是检验零假设,零假设是sj2=sj2,单边备择假设是sj2sj2。如果式(2-21)满足,则单边备择假设成立。在大多数情况下,造成故障的变量比训练集中的变量有更大的方差。然而,这并不是始终成立。假如,一个坏的传感器显示一个恒定的读数时,sj2sj2F/2(q-a-1,n-a-1) 式(2-22)或 sj2sj2F/2(n-a-1,q-a-1) 式(2-23)时,sj2sj2。除此之外,若 j-jsi1q-a+1n-at/2(q+n-2a-2) 式(2-24)或 j-jsi1q-a+1n-a-t/2(q+n-2a-2) 式(2-25)则残差空间内的均值会
52、出现较大偏移17。这里j和j分别是新观测值和训练集观测值中Xj的均值,t/2(q+n-2a-2)是t分布的(1-/2)分位点。式(2-24)和式(2-25)用来检测零假设,其中零假设是j=j,备择假设是jj。若满足式(2-24)或式(2-25)则备择假设成立18。利用Q统计量检测出的造成失控状态的变量,可以根据式(2-21)、式(2-24)和式(2-25)进行识别。这些变量还可以利用(2-21)、式(2-24)和式(2-25)的表达式的值区分优先次序,且表达式值最大的优先。除此之外,该方法进行故障识别时需要一组q1的观测值。基于几个连续观测值的测量与只基于一个单观测值的测量相比,能够增加鲁棒性和敏感性,但对较大过程偏移的影响时间变得更长。一个观测向量在某一时刻的故障识别量度就是标准差 RESj=rjsj 式(2-26)其中,rj是残差向量的第j个变量。式(2-26)的值可以用来区分变量的优先次序,标准差最大的变量排序在前。与式(2-21)、式(2-24)和式(2-25)相比,式(2-26)能够在发生大的过程漂移之后立即显示过程的当前
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 沈阳理工大学《环境设计》2023-2024学年第一学期期末试卷
- 全国统考2024高考历史一轮复习第九单元20世纪世界经济体制的创新与世界经济全球化趋势第27讲古代中国的科学技术与文学艺术课时作业含解析新人教版
- 煤矿应急应急救援
- 2024年合作小车客运从业资格证考试
- 2024年毕节道路客运从业资格证考试
- 美食广场租赁管理合同附件
- 2024标准房屋租赁合同书(常用版)
- 2024二手车分期付款合同
- 卫生部临床检验中心详解
- 2024建筑工程钢筋承包合同书格式
- 盐田采盐生产示范
- 科室院感自查报告
- 2024年中央国债登记结算有限责任公司招聘笔试参考题库含答案解析
- 客情关系维护技巧课件
- 《小学急救知识培训》课件
- 小红书平台调研分析报告
- 4中小学毒品预防专题教育大纲
- 旅游小程序策划方案
- 北京市东城区2023-2024学年六年级上学期期末数学试卷
- 急诊护理质量安全管理
- 加装电梯设计方案
评论
0/150
提交评论