(系统工程专业论文)基于学习算法的复杂故障诊断模型与方法研究.pdf_第1页
(系统工程专业论文)基于学习算法的复杂故障诊断模型与方法研究.pdf_第2页
(系统工程专业论文)基于学习算法的复杂故障诊断模型与方法研究.pdf_第3页
(系统工程专业论文)基于学习算法的复杂故障诊断模型与方法研究.pdf_第4页
(系统工程专业论文)基于学习算法的复杂故障诊断模型与方法研究.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要:铁路信号系统是一个由多种机电设备组成的复杂的控制系统,实际信 号系统的故障现象具有多样性,很多复杂故障产生的原因往往具有模糊性、随机 性和组台性等特点,所以铁路信号设备的故障诊断需要通过建立专家系统予以解 决。如何基于铁路信号设备故障的实际,选择合适的复杂故障诊断模型,并开发 实际应用算法,是建造实际铁路信号设备故障诊断专家系统需待研究的一个关键 问题。 本论文结合参加导师主持的铁道部科研项目“铁路信号设备故障诊断专家系 统”的实际研究工作,对基于学习算法的复杂故障诊断模型与方法进行了选题研 究。 论文在对国内外研究现状及发展趋势分析的基础上,首先,针对铁路信号设 备故障的特点,对故障诊断的过程、内容和方法进行了系统分析,主要包括基于 解析模型的方法分析、基于信号处理的方法分析和基于知识的方法分析。其次, 以决策树理论为基础,针对传统的知识表示与获取方法的不足,对基于决策树的 知识表示方法进行了深入探讨,重点对c 4 5 算法在铁路车站信号设备故障诊断专 家系统中的应用进行了构模研究,研究提出了基于决策树的知识表示与获取方法 的应用模型,以及基于决策树模型的复杂故障诊断算法该算法具有充分利用决 策树把知识表示与获取融于一身的优点,使知识表示与知识获取同时进行,克服 了传统人工智能系统中知识表示与知识获取分离的缺点。晟后,利用该方法对实 际的铁路信号设备故障诊断专家系统进行了应用研究,包括复杂故障诊断决策树 的生成软件开发与事例分析;铁路信号设备复杂故障诊断专家系统知识库的建立; 应用c 4 5 算法实现复杂故障诊断效果的评价等结果表明,该方法不仅能够实现 知识的自动获取与表示而且所获得的以决策树形式表示的知识具有很高的推理 效率。 关键词;故障诊断;决策树;知识获取;c 4 5 算法 j e 虚窑煎盍堂亟堂焦监皇垦s ! b 工 a b s t r a c t a b s t r a c t :b 哪eo fs i 印ls y s t e i i lo ft h er a i l w a yb e i n gac o m p l i c a t c d c o n d 1s y s t e mm a d el 币o f m 卸yl 【i n d so fe l e c 嘶n c c h a l l i c a lc q l l i p m 龃t ,t h ev a r i e t yo f n n o l 锄o n gt b es i 印a ld e v i c e si 1 1m e s t a h o nm a k 鼯也cr c 啪t h a tc a u s e ( h ef a u l t s o b v i o u s l ym l c “nf i | z 强锄d 埘1 d o n m s ,t h ef h hd i a g n o s i so fs i 舻a ld e v i c e si nt h e r a i l w a ys 础o n n d st 0b ef i t i i s h e db y 唧e r ts y s 锄h a wt og e l e c tas l l i 诅b l em o d e lo f c o m p l i t e d 劬l td i a g o s i s 衄dd 亭y e l o par e a l i s 石ca l 嘶m mi s ak e yp r o b l 锄o f b l l i l d i l l gm e 鹅t i l a le x p e r ts y s t 锄b 鹬c d 仰t l l ep r i n c i p l co f m a l f i l n c 吐o no f s i 酬d e y i c i n t h er a i j w a ys 洳o n 1 k sp 印盯咖d i e dm em o d e la n dm 甜d0 fi n i e m g 即tf a u l td i a 印o s i sb a s e d d i s i o n 订a 1 9 0 r i t h m 5b ys 伽e t i i a lw o r ko ft t i e 喇e c th l t e l h g e n ts ”t e mo ff 舭n d i a g n o s i se x p c ns y 咖mo f t h cr 棚w a ys i 弘a 1d e v i c e s ,w 勰l e db yt h et u t o f 删y ,t h ep 印盯s t i l d i e ds y s t i 湎c a l l ym ep r o c e s s ,c o n t c n t 锄dm e t h o do fr a i l w a y s i 肌a l sm a l f l i n c 矗sd i a g 呻s i s c o r d i n gt 01 1 1 ec h a m c 妇bo ft l l es i g r l a ld c y i c 鼯i n 增 m i l w a ys t a d o n 疵hm a i n l yi n c 】u d e 山ea 1 1 a l y s i sm 甜l o do fp a r s i i l g - b 鹪e dm o d e l , s i 即【“- b 勰e dd i s p o s a l 趾dl m o w l c d g e - b 勰c d s o n d l y ,na i l i l c da t 也es h o r t a g eo fl h e h o w l 甜g er e l 脱洲i a t i 柚da c q u i s i t i o nm 幽d s ,缸dd i s c u s s e di h eh o w k d g e f q 锝翩t a 石蚴a n d q l l i s i h 朋m e f h o db 罄e d 佃d j 或伽疵岛唧撕a l l y 咖d i e d 也e m o d e lo f b l l i l d h l gi l l 印p l i c 撕o na l g o d t h lc 4 5t ot h c 伽l l td i a 鳃ec x p c f ts ”t e n lo f t b er a i l w a ys t a t i o ns i 割i a ld e “p u tf b 刑a r dt h e 印p k c dm o d c lo fa c q l l i s i 廿o n 粕d 托p 懈c n t a 娃o no fh m w l e d g ea n dt l l ec o n l p l i c a t e df 缸i td i a 昱皿o s i sa l 鲥t l l mb 船e d d e c i s i o n 由t h ep r o p o s c dm e 删u s e dt h ea d v 粕t a g et h a t l ed e c i s i 蛐虹e ep o s s e s s 豁 t b eh w l e d g c 郴s 酬i o n 龃d q l l i s i d o n dc a 耐e do u tt h c1 m a w l e d g c r e p r e s 朗曲d o n 锄dh o w l 酣g ea c q t l i s i 廿o n 咖u l t a i l 吣1y f m a l l y 廿1 ep r 叩o s e dm e t i i c d w 越印p l i e dt o 血er 鼯e 盯c ho ft l i ea c t l l a l 伽td i a g n o 舒s 唧e r ts ) r s t e r no fl 五e 翔i l w a y s i g n “d e v i c 嚣,w h i c hi n c l u d e dt l l ed e v d 叩m t 孤dl l l ec a 辩卸a l y s i sb 勰c do nd e c i s i 蛐 n ,t h eb i i i l d i n go f k n o w l e d g co f i l l e 既p e ns y s 把m 锄d t h ee s t i i i i a t eo f 朋窖丽t i i mc 4 5 t h e ”鲫l ts h o w e dt h a tn o to l i l y tc 缸曲p l e z n e m 血ea u t o m a t i ca c q u i s i 廿o n 柚d r e p r 嚣e n _ c a 廿o f h o w l e d g e ,b u ta l s o 吐l e 粒q u i r e dh a w l e d g eb 嬲c d 彻d i s j o nh p o s s di i ig r e a l l y l 】i 曲i i l f 音r e n c ee 伍c i 吼c y 1 皿y w o r d s :f 枷td i a g n o s i s ;d e c j s i o i it r e e ;k 力o w l c d g ea c q u i s i t i o n ;a l g 谢廿1 m “5 致谢 本论文的工作是在我的导师张喜教授的悉心指导下完成的。在我攻读硕士学 位的近三年时间里,从基础学习、论文选题,研究方案制订、研究内容到论文撰 写、修改和定稿的整个过程中,无不凝聚着导师的大量心血。导师的渊博学识、 一丝不苟的治学态度、雍容大度的学者风范、敏锐的科学思维和丰富的学术研究 经验使我终生受益;对论文内容与深度提出的高标准和严要求,使我能够以严谨 而认真的科研态度从事以后的研究工作;同时导师的忘我敬业精神也将是我以后 学习和研究中坚持不懈的精神支柱。此外,张老师平易近人,在工作和生活上也 曾给予我极大的关心和帮助,在此论文完成之际,谨向他表示最诚挚的感谢和崇 高的敬意! 同时,在课题的完成过程中,也受到了计算机学院田盛丰教授的悉心指点, 在这里也要向田老师表示感谢。在我攻读硕士学位期间,我的家人都给予了我持 续的关心和支持,我也借此机会向他们表示衷心的谢意。 此外,也向支持和帮助过我的各位老师、同学和所有参考文献的作者表示衷 心的感谢! 最后,衷心地感谢对本论文进行评审并提出宝贵意见的各位专家和教授! 1 引言 1 1论文选题背景及研究意义 铁路行车安全是铁路运输追求的重要目标之,铁路车站信号设备是保证铁 路行车安全的主要设施,因此,确保铁路车站信号设备无故障地良好工作,对铁 路运输安全具有非常重要的意义。根据我国铁路跨越式发展的战略要求,铁路列 车的运行速度与密度都在不断增加,这对铁路信号设备豹安全性又提出了更高的 要求。另外,面对信息技术特别是计算机网络技术的飞速发展,我国铁路信号控 制系统正在由站控向线控和面控式的调度集中控制方式转型。因此,如何适应铁 路发展的新形势,利用现代新技术,建立保障铁路运输安全的维修和检测系统, 是需待研究解决的重大课题。 利用新技术和方法,实现铁路信号设备状态监测和故障诊断,是保障铁路运 输安全中需待研究的重大课题之一。为了保证铁路车站信号设备经常处于良好的 工作状态,铁道部已建立并实施了多种维修制度,主要包括年修、大修、中修、 厂修、假修等定期维修,以及不定期维修和日常维修等。这些制度的严格执行, 为铁路行车安全奠定了重要基础。但是,总体而言,这些维修制度均具有超前或 事后维修的特点,缺乏基于设备状态维修的预钡4 性和设备维修的经济性因此, 面对铁路运输的不断大幅度提速、对安全要求越来越高的形势,由超前或事后维 修向着基于状态维修的转变已经成为维修制度改革的方向。状态维修的重要手段 是采用先进的故障监测诊断设备和方法,建立故障监测诊断系统。目前我国铁路 信号微机监测系统已经不同程度得到了推广应用,故障诊断决策支持系统处于研 究开发阶段。 由于铁路信号系统是一个由多种机电设备组成的复杂的控制系统,实际信号 系统的故障现象具有多样性,很多复杂故障产生的原因往往具有模糊性、随机性 和组合性等特点,所以铁路信号设备的故障诊断需要通过建立专家系统予以解决 如何基于铁路信号设备故障的实际,选择合适的复杂故障诊断模型,并开发实际 应用算法,是建造实际铁路信号设备故障诊断专家系统需待研究的一个关键问题 综上所述,为了适应铁路发展的新形势,利用现代新技术和方法,建立保障 铁路运输安全的铁路信号设备故障诊断专家系统,具有重大的现实意义。通过建 立和开发专家系统,实现为故障分析和诊断提供辅助决策,可提高状态维修和预 防故障发生的水平从而达到保障安全运输的目的。 扯毫窑通盘堂亟堂焦论窑 i 宣 本论文,结合导师主持的铁道部科研项目“铁路信号设备故障智能诊断专家 系统”,通过实际参加系统的研制与开发,就基于决策树学习算法的复杂故障诊断 模型与方法进行了选题研究。 1 2国内外研究现状及发展趋势 1 2 1国内外研究现状 故障检测与诊断技术是发展于本世纪中叶的一门科学技术,是指对运行中的 机械或设备的异常状态的检测、异常状态原因的识别以及包括异常状态预测在内 的各种技术的总称。它是一项建立在机械工程、测试技术、信号处理、计算机应 用技术、人工智能等众多理论基础上的新兴综合性科学技术。自从故障诊断技术 在美国诞生以来,便逐渐引起了学术界的关注,各发达国家都很重视,但直到7 0 一8 0 年代,随着传感器技术、计算机技术、光纤技术等高新技术的发展与应用,设备 在线诊断技术才真正得到迅速发展。 特别是近年来随着控制理论、信号处理、人工智能、模式识别等学科的发展, 故障诊断技术也得到了迅速的发展,各国都展开了这方面的研究,并取得了许多 成果,故障诊断技术的内涵也从初始的某一台机械或设备的故障诊断发展为工业 过程动态系统的故障诊断,并得到了广泛应用。如美国德克萨斯州在三家大发电 厂七台汽轮机组上实现了属于人工智能的检测和故障诊断。目前国外大型机电系 统大都安装有检测诊断系统。另外,还出现了一些专门从事这方面工作的公司, 比较著名的有美国b & k 、w e s 皿n gh o u s e 公司、s d k 公司、日本三菱公司、 荷兰p h 皿皿s 公司等。 我国对故障诊断技术的研究也十分重视。从7 0 年代末开始,不断学习吸收西 欧、美国的先进技术。八十年代初,清华大学等部分高校和科研单位首先开展了 诊断技术的理论研究和实际应用,并取得了许多可喜的成果。化工、石化行业也 投入了较大的资金对重点设备进行监测,特别加强了对压缩机等大型旋转机械的 振动监测和压力容器等设备的安全性能检验,并开发了相关设备在线监测和故障 诊断系统,如哈尔滨工业大学的m 咖d _ m 在线故障检测与诊断系统【i i 故障诊断技术发展至今已经历了三个阶段:第一阶段由于机器设备比较简单, 故障诊断主要依靠专家或维修人员的感觉器官、个人经验就能胜任故障的诊断与 排除工作;传感器技术、动态监测技术及信号分析技术的发展使得诊断技术进入 了第二阶段;8 0 年代以来,随着计算机技术、人工智能技术特别是专家系统的发 展,诊断技术进入第三个发展阶段智能化阶段。 目前,故障诊断的基本方法可以分为三类,分别是:基于解析模型的方法、 基于信号处理的方法和基于知识的方法。其中主要应用的基于知识的故障诊断方 法有:模糊逻辑方法、基干神经网络的方法、基于遗传算法的方法和故障诊断专 家系统等。 虽然故障诊断技术获得了蓬勃发展,但由于其自适应能力和学习能力不强, 使其应用收到了一定的限制,针对这些问题,国内外作出了不少研究成果对此加 以改善,如基于信息熵和最大信息增益机制的决策树学习方面的研究川,基于二元 决策系统的粗糙集知识获取方法方面的研究哪,基于退火演化算法的知识获取机制 方面的研究等等【4 1 ,基于g a 的知识获取方法及在故障诊断上的研究【5 l ,支持向量机 在故障诊断中的应用研究1 6 】等等,都推动了故障诊断技术的发展与应用。 总体来看,故障诊断是一个新兴的研究领域,尽管经过多年的发展,已经取 得了很大进步,内容得到很大充实,在工程实践中也得到了一些应用,取得了较 为满意的效果,但是同时也暴露出了很多尚待解决的问题。其中如何增强诊断系 统的自适应能力、学习能力就成为一个值得十分关注的问题。另外,在实际应用 方面,虽然故障检测与诊断方法在理论上己取得了大量研究成果,但相比之下, 在实际工业过程或装置上应用得还不是很多,如何使已有的理论研究成果转化到 工程实际中也将是故障检测与诊断技术未来研究的一个重点。 1 2 2发展趋势 随着故障诊断技术的广泛应用,人们对故障诊断专家系统i 的要求越来越高, 世界各国已开始进行“新一代故障诊断专家系统”的研制。新一代故障诊断专家 系统的发展方向主要体现在:由基于规则的系统发展到基于混和模型的系统;由 领域专家提供知识发展到机器通过自学习来获取知识;由非实时诊断发展到实时 诊断;由单机诊断发展到分布式全系统诊断;由单一推理控制策略发展到混和控 制推理策略嗍。新一代故障诊断专家系统与以前的系统相比,它将会采用并行技术、 分层分布式求解:采用新的专家系统专用语言;知识表示更直观,知识库的验证 和维护方便;配备智能的知识获取子系统以此来解决当前知识处理系统所存在 的一些缺陷( 如知识获取瓶颈问题、自适应能力不强、实时性差以及低的自学习 能力等) 。 l - 3 论文研究的内容 故障诊断的过程就是根据从系统的某些检测量得到的故障表征和故障模式, l b 直銮适太堂亟堂撞论塞l 宣 经过分析处理,判断是否存在故障及查找故障源。铁路信号系统是一个由多种机 电设备组成的复杂的控制系统,实际信号系统的故障现象具有多样性,很多复杂 故障产生的原因具有模糊性、随机性和组合性等特点如何基于大量的信号设备 故障实例信息获取领域知识,并采用适当的知识形式化表示方法建立知识库,是 建造实际铁路信号设备故障诊断专家系统的一个重要内容。 本文针对传统的知识表示与获取方法的不足,提出了基于决策树的故障诊断 模型与方法,该方法充分利用决策树把知识表示与获取融于一身的优点,使知识 表示与知识获取同时进行,克服了传统人工智能系统中知识表示与知识获取分离 的缺点,实现了知识的自动获取。同时,根据实际铁路信号系统故障的特点,提 出了将c 4 5 决策树学习算法应用于该系统中,实践证明该算法的有效性。 1 3 1研究目标 ( 1 ) 研究基于决策树的故障诊断模型和方法,找到能够较好解决知识获取瓶颈问 题和具有较好自学习能力的基于决策树学习算法的故障诊断模型和方法 ( 2 ) 研究基于决策树学习算法的故障诊断模型和方法在铁路信号系统中的应用。 ( 3 ) 开发铁路信号设备故障诊断专家系统。 1 3 2主要研究内容 ( 1 ) 分析在故障诊断中应用决策树学习算法的可行性; ( 2 ) 研究故障诊断的一般过程、需要解决的问题和需要用到的一些方法; ( 3 ) 研究可以在故障诊断中应用的决策树学习算法及这些方法的优缺点及适用情 况; 提出基于决策树的故障诊断模型和算法,详细讨论该方法在实际故障诊断中 的实现过程; ( 5 ) 研究了基于决策树的故障诊断方法在铁路信号设备故障诊断专家系统中的应 用,并利用v c 语言开发了铁路信号设备故障诊断专家系统的一个模块。 4 2 故障诊断的模型与方法研究 2 1故障及故障诊断的基本概念 所谓系统的故障嗍,是指系统的运行处于不正常状态( 劣化状态) ,并可导致 系统相应的功能失调,即导致系统相应的行为超过允许范围,使系统的功能低于 规定的水平,这种不正常状态称为故障。对于复杂系统来说,故障主要表现为如 下几个性质:层次性、时间性、相关性、模糊性、随机性、不确定性及相对性。 故障诊断是指系统在一定工作环境下查明导致系统某种功能失调的原因或性 质,判断劣化状态发生的部位或部件以及预测状态劣化的发展趋势等在工程技 术领域,也需要根据各种可测量的物理现象和技术参数的检测水平推断设备是否 正常运转,判断发生故障的原因和部件,预测潜在故障的发生等等。 故障诊断是以可靠性理论、信息论、控制论和系统理论为基础,以现代测试 仪器和计算机为技术手段,结合各种诊断对象的工作原理而逐步形成的一门新兴 学科。 2 2故障诊断研究的主要内容 图2 1故障诊断的实现过程 故障诊断的实现过程如图2 - 1 所示,这就决定了设备故障诊断技术的主要内 容为: ( 1 ) 状态检测 主要是测取与设备运行有关的状态信号状态信号是故障信息唯一载体,也 是诊断的唯一依据。因此及时、准确获取状态监测信号是十分重要的。 状态信号的获取主要是依靠传感器或其他检测手段进行故障信号的检测。检 测中主要有以下几个过程: 信号测取:主要是通过电量的或传感器组成的探测头直接感知被测对象参 数的变化; 韭童窑通盍堂亟堂焦监塞戡睦盗匦的撼型皇左鎏虹窟 中间变换:主要完成由探测头取得的变换和传输; 数据采集:就是把中间变换的连续信号进行离散化过程。数据是诊断的基 础,能否采集到足够长的客观反映设备运行状态的信息,是诊断成败的关键 这一阶段主要是检测系统获取状态信号反映的主要功能指标的变化。当出现 异常,可按其程度分别给出早期警报、紧急警报、强迫系统停机等处置。 ( 2 ) 特征信号提取 就是从状态信号中提取与设备故障有关的特征信息【9 】当特征信号为静态信号 时,特征信号即是征兆。对征兆的取值进行检验,看其是否在允许范围,然后做 出决策。当特征信号为动态信号时,首先要根据情况选择既能反映系统功能指标, 又便于测取的特征信号组:其次是通过对特征信号分析提取便于决策的征兆;最 后根据征兆、标准模式和某种判别准则,识别系统状态。 ( 3 ) 诊断故障 诊断故障又叫故障分离或状态分析,就是根据所提取的特征判别状态有无异 常,并根据此信息和其他补充测试的辅助信息寻找故障源对于不同的要求,故 障源可以是零件、部件或子系统根据这些信息和故障对系统的性能指标影响程 度做出估计,综合给出故障等级。诊断故障可以用正常信息来分析故障源,这要 求被诊对象具有较明确的结构和功能关系。也可用异常信息来分析故障源,这要 求被诊断对象的各种特征信号中包含有足够的故障源信息 在诊断故障中,判别是根据故障向量模型的识别来估计故障状态的。由于故 障类型的多样性,故障向量模式也很多1 1 0 l 。建立各种模式的过程也是建立故障档 案尽管各种模式各异,但都是根据设备运行资料,按照简单、实用、可靠原则 来进行的。根据模式可进一步分析故障征兆和状态,弄清设备故障性质、程度、 类别、部位及产生原因 ( 4 ) 规划决策 规划决策是根据设备故障特征状态,预测故障发展趋势,并根据故障性质和 趋势,作出决策,干预其工作过程( 包括控制、调整、维修等) 铁路信号设备的状态检测将由微机监测系统完成,而故障诊断则需要通过建 立相应的专家系统等手段实现。 2 1 3故障诊断的基本方法 故障诊断的策略1 可以分为两类:一类是基于故障模型的,另一类是基于正 常模型的。前者用故障模型来解释当前观测结果,它需要事先了解所有的故障模 式,通过模式的匹配来判断系统是否有故障并确定故障的位置和类型;后者不需 6 韭立奎运太堂亟堂僮逾室垫睡盗堑盐搓型皇直选班塞 要了解故障模式,它根据当前的观测结果是否符合所有可能的预测状态来检测故 障,所以它可以检测出系统是否有故障,但是不能判断系统故障的类型和发生的 位置。 实际系统可能发生的故障是各种各样的,研究故障诊断需要对故障进行分类, 并且这种分类也可以从多个不同的方面进行从故障发生的部位来看,可以分为 仪表故障( 常称为传感器故障) 、执行器故障和元部件故障;根据故障的性质,可 以分为突变故障和缓变故障;从建模的角度出发,又可以分为乘性故障和加性故 障。对复杂系统进行故障诊断,就是要准确的确定故障发生的位置和故障的性质, 因此实际上是一个对故障分类的过程目前故障诊断的方法主要可以分为三大类: 基于解析模型的方法、基于信号处理的方法和基于知识的方法。 2 - 3 1基于解析模型的方法 这种方法是最早发展起来的故障诊断方法,该方法需要建立被诊断对象的较 为精确的数学模型进一步。该方法又可以分为参数估计方法,状态估计方法和 等价空间方法。状态估计方法的基本思想是:首先重构被控过程的状态,通过与 可测变量比较构成残差序列,再构造适当的模型并用统计检验法,从残差序列中 把故障检测出来,因此该方法要求系统是可观测或部分可观测的,通常用各种状 态观测器或滤波器来进行状态估计;参数估计方法不需要计算残差序列,而是根 据参数变化的统计特性来检测故障的发生这种方法在实际系统中很难被直接应 用,难点在于实际系统的准确数学模型【l q 很难建立。 2 3 2基于信号处理的方法 当难以建立被诊断对象的数学模型时,基于信号处理的方法是非常有用的, 因为这种方法回避了抽取对象的数学模型的难点而直接利用信号模型,如相关 函数、高阶统计量、频谱和自回归滑动平均模型( a r 姒模型) ,以及小波分析技术 的方法进行故障诊断。目前主要应用的方法有两种:利用k u n b a c k 信息准则检测 故障的方法和基于小波变换的故障诊断方法利用k u l l b a c k 信息准则进行故障诊 断的方法的基本思想是:首先用基于g o o 曲i n 的随机嵌入方法把未建模动态特性 当作软界估计,利用遗传算法和梯度方法辩识参数和软界,然后在k u l l b a c k 信息 准则中引入一个新指标评价未建模动态特性,合理设计阈值,选择合适的决策方 案实现故障诊断;另一种是小披变换的方法i ,j ,这是一种新的信号处理方法,是一 种时间尺度分析方法,具有多分辨率分析的特点。 7 e 立銮通盘堂亟堂僮监塞丝匣丝堑的丝型量左选班塞 基于信号处理的方法对于线性系统和非线性系统都是适用的。但是该方法只 对被诊断对象的一种故障信号进行分析,忽略了其他的故障信号,同时这种处理 方法回避了对象的模型,因此丢失了对象模型所蕴涵的信息。 2 3 3基于知识的方法 基于知识的方法和基于信号的方法类似,也不需要对象的定量数学模型,但 它克服了后者的缺点,引入了诊断对象的许多信息,特别是可以充分地利用专家 诊断知识。基于知识的方法还可以分为基于症状的方法和基于定性模型的方法。 基于症状的方法包括专家系统方法、模糊推理方法、模式识别方法和神经网 络方法等;基于定性模型的方法包括定性观测器,定性仿真和知识观测器等。 目前主要应用的基于知识的故障诊断方法有:模糊逻辑方法、基千神经网络 的方法、基于遗传算法的方法和故障诊断专家系统等 ( 1 ) 模糊理论及其在故障诊断中的应用 模糊理论i ”】晟初是由z a d e h 在1 9 6 5 年提出的,其目的是为描述与处理广泛存 在的不精确,模糊的事件和概念提供相应的理论工具。基于模糊理论的模糊逻辑 系统、模糊神经网络等,已经成为目前理论与应用研究的热点领域,模糊理论、 模糊逻辑系统以及模糊神经网络为解决复杂系统的故障诊断问题提供了重要的理 论方法和实现工具。 模糊逻辑系统有着极其广泛而重要的应用,因为对于大多数应用系统面言, 其主要的信息有两种类型:来自传感器的数据和来自提供系统性能描述的专家语 言信息,而客观世界中人类大量的知识是用语言形式来表达的,它本身就具有模 糊的性质模糊集合、模糊运算、模颧逻辑系统对模糊信息的强大处理能力,使 得它成为故障诊断的一种有力工具,因为在许多故障诊断问题中,故障诊断的机 理非常适合用模糊规则来描述,比如:“如果参数a 很大且参数b 的变化率较大则 是系统故障f ”,这条故障规则中的“很大”、“较大”正是模糊的语言。 ( 2 ) 神经网络技术及其在故障诊断中的应用 神经网络技术【1 4 1 代表了一种新的方法体系,它以分布的方式存储信息,利用 网络的拓扑结构和权值分布实现非线性映射,并利用全局并行处理实现从输入空 问到输出空间的非线性信息变换神经网络技术的出现,为故障诊断问题提供了 一种新的解决途径,特别是对复杂系统,由于基于解析模型的故障诊断方法面l 临 难以建立系统模型的实际困难,基于知识的故障诊断方法成了重要的、也是实际 可行的方法,神经网络的i 0 非线性映射特性、信息的分布存储、并行处理和全 局集体作用,特别是其高度的自组织和自学习能力,使其成为故障诊断的一种有 8 效方法和手段。 目前故障诊断系统中应用较为广泛的神经网络【l 包括b p 网络、h o p f i l e d 网 络、r b f 网络,自组织特征映射网络和递归神经网络等。另外,近年来,一种将模 糊理论与神经网络技术相结合的模糊神经网络技术又成为研究的一个新热点 ( 3 ) 故障诊断专家系统叫 专家系统是基于逻辑的数学模型,是具有领域专家知识的特殊计算机程序, 这种计算机程序使用知识与推理过程,求解那些需要专家知识才能求解的高难度 问题。因此专家系统的实质是借助人类的知识,采取一定的搜索策略并通过推理 的手段去解决某一个特定领域的困难问题。 诊断专家系统作为专家系统的一个分支,其研究得到了各国的高度、重视, 并相继在各行业中开发出了一些诊断专家系统,如e g g 公司于1 9 8 2 年开发的 r 卧c t o r ( 用于核反应堆故障诊断与处理) 系统、b e l l 实验室于1 9 8 3 年开发的 a c e ( 用于电话电缆故障诊断与维护) 系统。 诊断专家系统在很多领域( 如机械、医疗、计算机、航空等) 中得到了广泛的 应用,且取得了不少的成果,显示出了相当出色的工作能力。 ( 4 ) 基于遗传算法的故障诊断方法【l o l o 】 遗传算法是模拟生物自然进化过程的人工算法,这种算法具有很强的全局优 化搜索能力,并具有简单通用鲁捧性强、具有隐并行结构等优点。将遗传算法 应用于故障诊断是近年来的最新研究成果 利用基于遗传算法的最优统计聚类分析法可以通过对不同工况及各种故障状 态下的系统监控参数测量值进行聚类分析,来提取系统的各种故障模式及工况模 式,组成典型故障数据集,存入专家系统知识库中,更新知识库,增强诊断能力、 扩大诊断范围。 综上所述,目前国内外的研究热点m 主要包括:小波变换、模糊理论、神经 网络和专家系统,故障诊断技术发展到今天已经经历了由传统诊断技术到现代智 能诊断技术等阶段,取得了相当客观的成绩。但是这些诊断方法都针对某一故障 模式,而且是诊断对象在工作过程中出现了故障征兆后进行的。这对中小型设备 是合适的,但对大型设备就难以适用了。其主要原因是: ( 1 ) 现有诊断方法都是以设备在工作过程中出现的外部特征为基础的,故障特 征提取主要基于状态响应、时域响应或频率响应分析。由于外部干扰等多种因素 影响,这些特征可能减弱、消失和重叠,因而难以获得所需的特征信息。 ( 2 ) 在设备运行中,元素的故障和特征并不总是一一对应的,尤其在复杂的非 线性系统中,特征和故障之间是复杂的非线性关系,因而当故障出现时,难以根 据一个或几个特征找到故障源因此在检测与诊断过程中,常常要尽可能多地获 j g 夏窑垣盘堂塑堂撞监衰蓝睦盗堑盟撼型曼直选鲤直 取故障信息以增加测点数,结果使检测设备过于复杂,或因设备运行状态复杂而 使诊断失败。 随着人工智能和知识工程的发展,基于知识的铁路车站信号智能系统获得广 泛的研究与应用。就铁路车站信号设备故障诊断系统而言,锖4 约其应用的主要问 题是故障诊断知识的表示与获取问题。虽然一些学者提出许多故障诊断知识的获 取方法,如基于粗糙集、基于人工神经网络、基于p e t r i 网等知识获取方法,但 它们大都作为获取专家规则知识的工具,不能实现知识表示与获取的融合。另外, 利用所得的规则知识构成的故障诊断专家系统也存在许多不足,不能适应铁路车 站自动化系统发展的需要。本文试图采用决策树学习算法对铁路车站信号设备进 行故障诊断。 韭立变通太堂亟堂焦监塞基王迭筮控鳆翅堡盘丞直茎班窥 3 基于决策树的知识表示方法研究 3 1归纳学习的相关知识 3 1 1机器学习 自上个世纪八十年代以来,机器学习作为人工智能的途径,在人工智能界引 起了广泛的兴趣。特别是近些年来,机器学习领域的研究工作发展很快,它已成 为人工智能的重要研究方向之一 1 学习的定义及基本系统结构1 1 8 ,1 目 学习是智能的基本特征,学习是以组织化的知识出发,然后变得更为组织化。 s i m o n 认为,如果一个系统能够通过执行某种过程而改进它的性能,这就是学习。 这个说法的要点是:首先,学习是一个过程;其二,学习是对一个系统而言,这 个系统比较复杂,可以是一台计算机,也可以是计算系统,甚至是包括人的人机 计算系统;其三学习改进系统性能,但未限制这种“改进”的方法。图3 一l 给 出了一个简单的学习系统结构模型。 图3 一l 一个简单的学习系统结构模型 从普遍的观点来看,学习一般被认为是获取一种显式的知识的过程。更进一 步的看法则是把学习看作建立理论、形成假设和进行归纳推理的过程。不论哪一 种学习过程,它都与环境和知识库密切相关 模型中的四个部分构成了学习系统的基本组成环节环境可以是系统的工作 对象,也可以包括工作对象或客体所处的外界条件。知识库的内容用来理解环境 提供的信息并进行推理,通过学习系统它将得到扩充和改善。环境和知识库共同 构成以某种知识表示形式表达的信息描述体,分别代表外界信息的来源和系统拥 有的知识( 包括信息的结果) 。 学习部分是核心模块,是和外部交互的接口。学习部分对环境提供的这些信 息进行整理、分析、归纳或类比,生成新的知识元或利用这些信息修改知识库, 以增进系统执行部分完成任务的效能。同时,执行环节利用知识库的信息来完成 韭基窑通厶芏亟堂焦论室基王迭筮扭曲翅迟塞丞左洼妥窟 某种任务,然后把完成任务过程中所获得的一些信息反馈给学习环节,以指导进 一步的学习。学习环节的目的是要改善执行环节的行为,执行环节的动作就是力 求改进学习环节的动作删,因此执行环节的复杂程度、反馈能力和透明性等都会 对学习环节产生重要的影响。 2 学习的任务 机器学习的主要任务包括以下两个方面: 获得对于输入的数据进行分类的能力。如语音信号处理,文字识别,天文 等图像处理等,医疗诊断也可以认为是某种意义下的分类。 获得解决问题,行为计划和行为控制等地能力。如解决微分问题、下跳棋 和象棋、平衡杠杆、驾车等。 3 学习方法 机器学习方法种类繁多,并且,由于机器学习正处于发展高峰阶段,各种新 思潮不断涌现。下面介绍一下常用的机器学习方法f 2 1 盈】; ( 1 ) 统计方法 统计方法是从事物的外在数量上的表现去推断该事物可能的规律性。科学的 规律性一般总是隐藏得比较深,最初总是从其数量表现上通过统计分析看出一些 线索。然后提出一定的假说或学说,作进一步深入的理论研究。当理论研究提出 一定的结论时,往往还需要在实践中加以验证。就是说,观测一些自然现象或专 门安排的实验所得资料,是否与理论相符、在多大程度上相符、偏离可能是朝哪 个方向等等问题,都需要用统计分析的方法。与统计学有关的机器学习方法有: 传统方法 统计学在解决机器学习问题中起着基础性的作用。传统的统计学所研究的是 渐近理论,即当样本趋向于无穷大时的统计性质。统计方法主要考虑测试预想的 假设是否与数据模型拟合。它依赖于显式的基本概率模型。统计方法处理过程可 以分为三个阶段:( i ) 搜集数据,包括采样和实验设计:( i i ) 分析数据,包括建模、 知识发现和可视化;( “i ) 进行推理,包括预钡4 和分类常用的统计方法有回归分 析、判别分析、聚类分析和探索性分析。 模糊集 模糊集是表示和处理不确定性数据的重要方法。模糊集不仅可以处理不完全 数据、噪声或不精确数据,而且在开发数据的不确定性模型方面是有用的,能提 供比传统方法更灵巧、更平滑的性能。 支持向量机 支持向量机( s u p p o r tv e c t o r 嘲c h i n e ,s v m ) 建立在计算学习理论的结构风 险最小化原则之上其主要思想是针对两类分类问题,在高维空间中寻找一个超 平面作为两类的分割,以保证最小的分类错误率。 粗糙集 租糙集( r o u g hs e t ) 理论是由z d z i s k wp w l a k 在1 9 8 2 年提出。它是一种新 的数学工具,用于处理含糊性和不确定性,在数据挖掘中发挥重要作用粗糙集 是由集合的下近似、上近似来定义的。下近似中的每一个成员都是该集合的确定 成员,而不是上近似中的成员肯定不是该集合的成员。粗糙集的上近似是下近似 和边界区的并集。边界区的成员可能是该集合中的成员,但不是确定的成员。可 以认为粗糙集是具有三值隶属函数的模糊集,即是、不是、也许与模糊集一样, 它是一种处理数据不确定性的数学工具,常与规则归纳、分类和聚类方法结合起 来使用,很少单独使用。 ( 2 ) 规则归纳 规则反映数据项中某些属性或数据集中某些数据项之间的统计相关性。a q 算 法是有名的规则归纳算法。关联规则一般形式为五 五 。e j y 【c s 】,表示由 置 墨 j - 可以预测y ,其可信度为s 。近年来提出了许多关联规则算法。 ( 3 ) 决策树 决策树的每一个非终节点表示所考虑的数据项的测试或决策。一个确定分枝 的选择取决于测试的结果。为了对数据集分类,从根节点开始,根据判定自顶向 下,趋向终节点或叶节点。当到达终节点时,则决策树生成。决策树也可以解释 为特定形式的规则集,以规则的层次组织为特征。 ( 4 ) 范例推理 范例推理是直接使用过去的经验或解法来求解给定的问题。范例常常是一种 己经遇到过并且有解法的具体问题。当给定一个特定问题,范例推理就检索范例 库,寻找相似的范例。如果存在相似的范例,它们的解法就可以用来求解新的问 题该新问题被加到范例库,以便将来参考目前将范例推理与培近邻原理 ( n e a r e s tn e i g h b o r ) 、格子机( 1 a t t i c e c h i n e ) 相结合。 ( 5 ) 贝叶斯信念网络 贝叶斯信念网络是概率分布的图表示。贝叶斯信念网络特别是一种直接的非 循环的图,节点表示属性变量,边表示属性变量之间的概率依赖关系。与每个节 点相关的是条件概率分布,描述该节点与其父节点之间的关系。 ( 6 ) 科学发现 科学发现是在实验环境下发现科学定律。在s i n 著名的b c o n 系统中,核 心算法基本上由两种操作构成。第一种操作叫做双变量拟合判定一对变量之问 的关系。第二种操作是合并多对关系到一个方程中。 ( 7 ) 遗传算法 韭立窑适盘堂亟堂位熊塞基王凌董扭鲍翅迅盔丞友洼班左 遗传算法是按照自然进化原理提出的一种优化策略。在求解过程中,通过最 好解的选择和彼此组合,则可以期望解的集合将会愈来愈好。在数据挖掘中,遗 传算法用来形成变量间依赖关系假设 4 学习的性能评价 另外,我们可以从以下几个方面对系统学习性能进行评价口目: 分类精度:是否能够对输入的数据进行j 下确的、精确的分类。系统精度性 能由分类规模、待分类样本的性质、质量、系统结构、系统学习方法等多种因素 决定系统输出结果也有多种形式例如,分类结果是精确的、模糊的,还是含 有多义性的以及给出分类结果的同时是否还可以给出分类结果的可信度、分类精 确度等。 解答的正确性和质量:无论是用于分类的系统,还是解决问题的系统都有 解答正确性问题同时,正确性不一定保证有好的质量,好的质量包括可读性、 稳定性等多方面的因素。 学习的速度:虽然大多数系统的学习是在后台进行的,但是,学习速度还 是一个很重要的系统指标。它不仅仅影响系统的设计,同时影响系统的实现。一 个费时的学习方法,某种意义上也是很难实现的。 3 1 2分类 分类是数据挖掘中的一个重要课题,目前在商业上应用最多,主要用于预测 和决策。分类的目的是提出一个分类函数或分类模型( 也常称作分类器) ,该模型 能把数据库中的数据项映射到给定类别中的某一个 要构造分类器,需要有一个训练样本数据集作为输入。训练集由一组数据库 记录或元组构成,每个元组是一个由有关字段( 又称属性或特征) 值组成的特征向 量,此外,训练样本还有一个类别标记。一个具体样本的形式可为样本量:( v l , v 2 ,v n :c ) 。在这里v i 表示字段值,c 表示类别。 分类器的构造方法有统计方法、机器学习方法、神经网络方法等等统计方 法包括贝叶斯法和非参数法( 近邻学习或基于范例的学习) ,对应的知识表示则为 判别函数和原型事例。机器学习方法包括决策树法和规则归纳法,前者对应的表 示为决策树或判别树,后者则一般为产生式规则。神经网络方法主要是b p 算法, 其模型表示是前向反馈神经网络模型,b p 算法本质上是一种非线性判别函数另 外,粗糙集方法也可以用于分类,其知识表示是产生式规则。 数据分类( d a t ac l a s s i “c a t i o n ) 是一个两步过程,如图3 2 所示。第一步, 建立一个模型,描述预定的数据类集或概念集,通过分析由属性描述的数据库元 组来构造模型假定每个元组属于一个预定义的类,由一个称作类标号属性( c l a s s l a b e la t t r i b u t e ) 的属性确定。对于分类,数据元组也称作样本、实例或对象, 为建立模型而被分析的数据元组形成训练数据集。训练数据集中的单个元组称作 训练样本,并随机地由样本群选取。由于提供了每个训练样本的类标号,该步也 称作有指导的学习( 郾模型的学习在被告知每个训练样本属于哪个类的“指导”下 进行) 。它不同于无指导的学习( 或聚类) ,那里每个训练样本的类标号是未知的, 要学习的类集合或数量也可能事先不知道。 通常,学习模型用分类规则、决策树或数学公式的形式提供。例如,给定一 个顾客信用信息的数据库,可以学习分类规则,根据他们的信誉度优良或相当好 来识别顾客,如图3 2 a ( 这里,类标号属性是信誉度,学习模式或分类法以分类规 则形式提供) 。这些规则可以用来为以后的数据样本分类,也铯对数据库的内容 提供更好的理解。 坦兰 一l = 二二= l i 矗l ! 名年龄收入信誉度 f 二 s a n d v1 0 n e s 4 0 由 一般 m 叽杂誉废= 优良 n d r eb e a u3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论