《基于粗糙集和概率神经网络的变压器故障诊断方法》5200字_第1页
《基于粗糙集和概率神经网络的变压器故障诊断方法》5200字_第2页
《基于粗糙集和概率神经网络的变压器故障诊断方法》5200字_第3页
《基于粗糙集和概率神经网络的变压器故障诊断方法》5200字_第4页
《基于粗糙集和概率神经网络的变压器故障诊断方法》5200字_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于粗糙集和概率神经网络的变压器故障诊断方法综述目录TOC\o"1-2"\h\u27154基于粗糙集和概率神经网络的变压器故障诊断方法综述 1213001.1粗糙集理论基础 1243971.1.1粗糙集的理论 156811.1.2粗糙集的约简及规则 327951.2结合粗糙集理论与神经网络实现故障诊断 381241.2.1故障数据的选择 427511.2.2数据初始处理决策表建立 515391.3仿真及结果分析 10在进行变压器故障诊断时,采集的故障气体信息往往是不完备及不准确的,对于信息不完整且有不确定因素的样本集,如何去除重复无效的信息并筛选出核心诊断判据成为研究的热点。粗糙集是由波兰的两位学者所创立的[36],是一种针对数据缺失不完整及模糊不精确问题进行数据处理分析的工具,实际应用中只需数据样本集,无需其他条件和先验知识储备[37],实际应用性较强。粗糙集理论可以对关键有效的信息进行保留,从而建立潜在的模糊知识信息的联系,并处理冗余数据样本[39],是一种简单高效的解决方法,对于故障诊断技术更有积极的影响力。该理论近年来在机器学习、模式识别及知识获取等方面都已得到了深入的应用和研究。1.1粗糙集理论基础1.1.1粗糙集的理论粗糙集理论通过将知识引入信息系统后,建立知识空间和数据表的内在联系[38]。下面介绍几个粗糙集理论的定义。(1)信息系统、决策表信息系统作为粗糙集理论研究对象,需将研究对象先整合为信息系统的数据集再进行分析,其中行表示样本事件的具体研究对象,列表示特征、标准等研究对象所对应的各个属性,一个完整的系统可用S=(U,A,V,F)表示,其中U,A,V,F有着各自的含义:U表征一个论域,可以表示一些的概念、事物、状态、对象等,是一个有限的非空集合,其中U集合包含(x1,x2,...,xn)集合。A表征关于属性的有限非空集,各个属性用a表示,则有A=(a|a∈A)。V表征关于属性的值域,各个属性在U中均有映射,Va可以表示属性a的一个值域。F表征一种映射关系,也表示各个属性的具体值,Fa(x)就可以表示目标对象x属性a值的大小。针对故障诊断而言,信息系统的属性A由两部分构成,一部分是归为条件属性C的故障特征集组成的集合表示,另一部分由归为决策属性D的故障分类类型所组成的集合表示,可表示为S=(U,C∪D,V,F)。当信息系统的属性集合由条件属性C和决策属性D构成且两属性各自独立C∩D为空集,此时信息系统成为决策表。(2)不可分辨关系、近似集不可分辨关系即为IND(P)[36],R是U上的一簇等价关系,有定义对于一个近似空间知识集K=(U,R)而言,假定P是R中的一个非空子集P⊆R,则∩P仍是U上的等价关系,P将U划分为互不相交的基本等价类,此时称为P上的不可分辨关系或不可区分关系。依照子集的不可分辨关系,可将域U进行划分,即为U/IND(P)或U/P。若存在P⊆A时,目标对象的不可分辨关系还可表示为:IND(P)={(x,y)∈U*U|∀a∈H,Fa(x)=Fa(y)},当(x,y)存在于不可分辨关系P的同一个等价类中时,无法区分x和y。基于不可分辨关系的的基础上,对解决一些较为模糊且无法精确表示的概念进一步定义上近似与下近似及边界区。假定集合X属于论域U,B表示一等价关系,且H⊆A,可表示近似集及边界区。上近似:`HX=(x∈U|[x]H∩X≠ø);下近似:HX=(x∈U|[x]H⊆X);其中[x]H表示x在H上不能被表示的集合。则(1)边界区:LNH(X)=`HX-HX表示X的边界区;(2)正区域POSH(X)=HX表示判定H属于X的目标对象所组成的最大集合;(3)负区域NEGH(X)=U-HX表示判定H不属于X的目标对象所组成的集合。粗糙集近似集及边界区可表示如4-1所示。图4-1近似集和边界区示意图Fig.4-1Schematicrepresentationofapproximatesetsandboundaryzones由上图可知,若x位于X集蓝色区域的下近似集内时,一定是X集的范围,可将对象x归属于正区域POSH(X);同理对象x在紫色框围成白色区的上近似集时,可能是X集的范围,可将对象x归属在边界区LNH(X)。所以当有上近集`HX与下近似集HX相等时称X是H的精确集,若不等时称X是H的粗糙集。1.1.2粗糙集的约简及规则粗糙集的核心思想就是对于知识的约简,而属性的约简对于故障诊断知识的属性分析起着重要的作用,属性各自之间的依赖程度决定属性最终能否约简,根据依赖程度判定属性的重要等级是决策表简化过程的突破点[40]。决策表作为表达属性约简的工具,其可看做是一种判断决策的信息表,当满足条件可指导决策行为。决策表简化通常将表中冗余条件属性进行约简删除,使得决策表适应度和实用性得到提升。(1)在信息系统S中(U,C∪D,V,F),若存在H⊆C有U/RH≠U/RH\h时,认为h∈H是必要的,反之则非必要,而当h是H的子集且属性均为必要的,则有H是独立的,反之成为是依赖的。D对于H的依赖度为。(2)在论域U中,若定义T、Y是U中的等价关系簇,且有T⊆Y时,若T是独立的且有关系IND(T)=IND(Y)时,认为T是Y的绝对约简,即:Y⊆RED(T)。(3)在信息系统S中,条件属性C中的必要属性共同构成C的核,即:CORE(C)。当有H⊆C且H⊆RED(C)时,C的核就是C约简后的交集,即:CORE(C)=∩RED(C),C的核值等价于C中约简的交集。在决策信息系统中进行属性约简就是一个在条件属性中进一步寻找必要条件的过程,并保证约简前后的条件属性具有相同指导系统分类的能力[41-51]。本文通过判别属性依赖度对属性列进行约简,将条件属性列依次单独计算依赖度,若=0时,认为该条件属性是独立且冗余的,则可以删除该列属性,若计算结果不为0时,则需保留该列属性。在论域中,粗糙集的知识结构具有分散颗粒性,针对约简的知识结构也需有相同属性,在故障气体信息中,气体数据均为连续变量,故需要进行连续数据的离散化处理后才可执行,即离散化处理,离散化方法会影响至十月间的准确度和复杂度,离散区间过窄时,会增大约简计算量,存在多余无效的数据,离散区间过宽时,会丢失一定的属性信息。本章中在考虑到特征属性的输入较多,对数据分为三个模块进行离散化处理。将文献中的先验知识及基于油中溶解改良溶解气体知识的相关规则作为依据,利用现有结果进行离散,再以基于python软件等频分箱函数的方法对部分数据进行离散化处理。1.2结合粗糙集理论与神经网络实现故障诊断利用粗糙集作为前端处理对冗余数据的删简可先确立诊断流程如图4-2,粗糙集结合概率神经网络诊断思路如下:(1)选择用于故障诊断的原始决策表。由于粗糙集的约简方法对于输入样本数量较多的才具有明显优势,所以要选择输入特征量多的样本作为约简目标。(2)由于粗糙集仅作用于离散值,而故障特征气体确定的原始决策表多为连续值,所以需将其进行离散化处理。(3)利用粗糙集理论对离散后的决策表进行约简,删减冗余无关的条件属性列,得到最简决策表。最简决策表将作为故障诊断网络最终的输入特征向量。图4-2粗糙集做前端优化诊断流程图Fig.4-2FlowchartforOptimizedDiagnosisoftheFrontEndofRoughSet保留必要信息的特征进行降维,在删减决策表中的某属性时,决策规则相同而剩余条件规则发生矛盾,则此条属性不能删减,相反情况则允许,1.2.1故障数据的选择在选取数据时,需要涵盖变压器故障运行时的各种特征及类型,在2.2、2.3两节中分析了溶解气体含量因故障程度及位置的不同,产生气体的成分与含量也各不同,为能多维度去评价故障,增加故障诊断的判据,由改良IEC的3组比值扩充至15组特征气体比值作为约简输入特征量做属性集:包括C2H2/C2H4,CH4/H2,C2H4/C2H6,C2H6/CH4,CH4/总烃,C2H4/总烃,C2H6/总烃,C2H2/总烃,H2/H2+总烃,CH4/C2H4,C2H2/CH4,C2H2/C2H6,C2H6/H2,C2H4/H2,C2H2/H2,输出定义5种故障类型并重新编号为D1-D5,包括放电兼过热、低能放电(即火花放电、局放)、高能放电(即电弧放电)、中低温过热、高温过热,做决策集。为达到诊断效果横向对比的目的,选取与3.1.4节仿真案例中相同的70组故障数据做粗糙集约简的初始数据。具体样本数据的分布情况如图4-3所示。下图中字母GZLX表示故障类型,ZT表示总烃,以竖列形式看每种故障对应的气体比值关系,在最后一行表示故障类型。图4-370组气理数据的比值分布情况Fig.4-3Distributionofprocessedgasdatain70groups1.2.2数据初始处理决策表建立在早期大多数的各类智能算法处理变压器故障时,基于第二章介绍变压器故障产气及相关原理,大都选用与故障关系明确的5种相关气体含量为判断故障的基础,(即:甲烷CH4、氢气H2、乙烷C2H6、乙烯C2H4、乙炔C2H2),考虑到变压器故障特征的关联性模糊且内部机理复杂,若仅仅选择基础比值作为故障特征参量的方法,难以满足故障诊断的可靠性,运用改良IEC法作为模式分类故障特征量仍有一定局限性。为了进一步提升诊断精度,需要探究故障气体比值与故障类型的关系,结合文献[41][42]中各类型故障涉及的特征气体比值与故障类型的关系,引入C2H2/C2H4,CH4/H2,C2H4/C2H6,C2H6/CH4,CH4/总烃,C2H4/总烃,C2H6/总烃,C2H2/总烃,H2/H2+总烃,CH4/C2H4,C2H2/CH4,C2H2/C2H6,C2H6/H2,C2H4/H2,C2H2/H2,15种比值关系作初始特征量,分别编号G1-G15,令G1-G15为条件属性。由于变压器故障较为复杂,根据第二章的变压器故障类型介绍及《油中溶解气体导则分析》指出的相关类型,把电故障中电弧放电归为高能放电,火花放电与局部放电归为低能放电,并将热故障中的中温过热和低温过热合为一种中低温过热,最终定义5种故障类型为放电兼过热、低能放电(即火花放电、局放)、高能放电(即电弧放电)、中低温过热、高温过热,并按照数字D1-D5编号,令其为决策属性。确定初始决策表后,下面进行离散化操作。运用改良IEC编码规则对G1-G3进行离散化,G4-G9由文献[45]中的油中溶解气体分析的先验知识进行离散,G10-G15结合Python软件中sklearn.preprocessing中的KbinsDiscretizer函数进行数据离散化,等频分箱函数设置k=3,(函数调用格式为:est=KBinsDiscretizer(n_bins=k,encode=’ordinal’,strategy=’quantile’)),通过该方法能够将待离散化的数据属性值域在整个空间范围划分成子区间再进行编码规则。最终得到离散化结果后定义规则如表4-1所示。表4-1离散结果规则Tab.4-1DiscreteResultsRule得到初始离散化决策表后,利用粗糙集约简原理对必要知识提取,通过matlab建立约简仿真模型后获得最简核值决策表,结果如表4-2所示,将初始决策表中的7条非必要属性约简,最终保留了8个用于输入神经网络的必要属性,将8组气体比值作为概率神经网络的输入,分别是G1(C2H2/C2H4)、G2(CH4/H2)、G3(C2H4/C2H6)、G5(CH4/总烃)、G6(C2H4/总烃)、G8(C2H2/总烃)、G9(H2/H2+总烃)、G10(CH4/C2H4),如表4-2、4-3所示;表4-2最简决策表Tab.4-2Summarydecision-makingtableG1(C2H2/C2H4)G2(CH4/H2)G3(C2H4/C2H6)G5(CH4/总烃)故障类型1101D10220D10000D10001D2G1(C2H2/C2H4)G2(CH4/H2)G3(C2H4/C2H6)G5(CH4/总烃)故障类型1011D20011D20001D20011D20101D21031D31021D31020D31020D32020D31020D30221D40201D40201D40011D40211D40201D40211D50210D50221D50220D52220D50221D50221D50101D21021D31021D31020D32020D31020D31020D30221D40202D40201D40012D40211D40212D40211D40202D40220D50220D50222D50220D50220D50221D50221D50101D21020D31021D3G1(C2H2/C2H4)G2(CH4/H2)G3(C2H4/C2H6)G5(CH4/总烃)故障类型1120D31120D31120D31020D30221D40201D40201D40011D41002D10220D10000D10101D21011D20111D20101D20011D20101D2表4-3最简决策表(续表)Tab.4-3Summarydecisiontable(continued)G6(C2H4/总烃)G8(C2H2/总烃)G9(H2/H2+总烃)G10(CH4/C2H4)故障类型1012D10000D11011D11012D21012D21012D21012D21012D21012D21000D31011D30110D31110D31110D31101D32001D40012D40011D42011D41001D40012D40000D52000D52011D51000D52200D51001D5G6(C2H4/总烃)G8(C2H2/总烃)G9(H2/H2+总烃)G10(CH4/C2H4)故障类型2000D51022D21000D31011D31110D31120D31110D31101D31001D40012D40011D40011D41001D41011D41001D41012D40000D50000D52011D51200D51000D51001D51000D51022D21000D31011D31110D31110D31110D31101D31001D41022D40011D41011D41112D11000D11011D11022D22012D22122D21022D22012D21012D21.3仿真及结果分析故障气体数据仍选择与3.1.4节中大型变压器3号主变历年采集的真实故障信息进行实例训练诊断,经1.2.1节进行约简剔除多余属性后最终将,将原来的15个条件属性简化为表4-2、4-3中约简后的8个必要属性,为下一步神经网络输入的训练和诊断做好优化数据的准备,在约简结果的8个条件属

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论