基于粗糙集的故障诊断特征提取-_第1页
基于粗糙集的故障诊断特征提取-_第2页
基于粗糙集的故障诊断特征提取-_第3页
基于粗糙集的故障诊断特征提取-_第4页
基于粗糙集的故障诊断特征提取-_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1引言随着设备结构日趋复杂,其故障类别越来越多,反映故障的状态、特征也相应增加。在实际诊断过程中,为了使诊断准确可靠,总要采集尽可能多的数据样本,以获得足够多的信息。但是,数据样本的分类边界常常是不确定的,并且故障与征兆之间的关系往往也是不确定的。因此,需要进行故障特征提取,从数据样本中提取对诊断故障贡献最大的信息。故障特征提取的方法受到了广泛的重视。研究成果很多1,2。有主元特征提取,基于人工神经网络的提取,模糊信息优化处理提取及基于互信息熵提取方法等。但是,主元特征提取会因为输入变量的变化而改变主分量的特征值计算结果;当特征输入太多时,基于人工神经网络的方法存在耗时费工以及合适的网络结构选

2、取问题;模糊信息优化处理和基于互信息熵的方法需要预先确定隶属函数或数据样本的概率分布。粗糙集(Rough Set,RS理论由波兰的Z.Pawlak教授于上世纪80年代初提出3,被认为是处理模糊和不确定性问题的新的数学工具,近年来在人工智能界引起了极大关注。它最显著的特点是不需要任何预备的或额外的有关数据信息,比如统计学中的概率分布、DS证据理论中的基本概率赋值、模糊集理论中的隶属函数等。本文主要研究基于粗糙集理论的故障特征提取方法。首先阐述粗糙集的基本概念,然后介绍常用的连续数据样本离散化方法,继而在“知识的依赖性”概念和定义的基础上,提出根据条件属性(集对决策属性的正域的大小来选择属性,进行

3、故障诊断特征提取的方法。最后,通过对热电厂发电机组和汽车发动机两个实例的故障诊断特征提取对该方法进行了验证。2粗糙集的基本理论3-72.1知识表达系统和决策表在粗糙集理论中,知识表达系统S是一个四元组。S=(U, A,V,f,其中U:对象的非空有限集合,称为论域;A:属性的非空有限集合;V=aA"V a,V a是属性a值域;f:U×AV是一个信息函数,它为每个对象的每个属性指定一个属性值。设S=(U,A,V,f,A=CD,CD=!,C和D分别称为条件属性集和决策属性集。具有条件属性和决策属性的知识表达系统称为决策表。基于粗糙集的故障诊断特征提取郭小荟1,2,马小平1GUO

4、Xiao-hui1,2,MA Xiao-ping11.中国矿业大学信息与电气工程学院,江苏徐州2210082.徐州师范大学计算机科学与技术学院,江苏徐州2211161.College of Information and Electrical Engineering,CUMT,Xuzhou,Jiangsu221008,China2.College of Computer Science and Techology,XZNU,Xuzhou,Jiangsu221116,ChinaE-mail:gxhzjrGUO Xiao-hui,MA Xiao-ping.Fault diagnosis featu

5、re subset selection using rough set.Computer Engineering and Applications,2007,43(1:221-224.Abstract:Feature subset selection is of prime important for effective fault diagnosis.But the classification boundary of real fault diagnosis data sets is often ambiguous,and the relationships between faults

6、and symptoms are always uncertain.Rough set theory is a novel mathematical tool dealing vagueness and uncertainty.This paper introduces rough set theory and proposes a method for fault diagnosis feature subset selection.By two fault diagnosis examples,this paper validates the method.The results show

7、 that this method can efficiently extract the main fault features while the fault classification result is invariable.The research in this paper supplies a basis for further study of applying rough set theory in fault diagnosis.Key words:rough set theory;feature selection;fault diagnosis摘要:故障的特征提取对于

8、进行准确可靠的诊断非常重要。而实际的故障诊断数据样本的分类边界常常是不确定的,并且故障与征兆之间的关系往往也是不确定的。粗糙集理论是处理模糊和不确定性问题的新的数学工具。论文将粗糙集理论引入到故障诊断特征提取,提出了一种基于粗糙集的故障诊断特征提取方法。并通过两个故障诊断实例对该方法进行了验证。结果表明:在有效地保持故障诊断分类结果的情况下,该方法可以提取出最能反映故障的特征,从而为粗糙集在故障诊断中的深入应用打下了基础。关键词:粗糙集理论;特征提取;故障诊断文章编号:1002-8331(200701-0221-04文献标识码:A中图分类号:TP271Computer Engineering

9、and Applications计算机工程与应用2007,43(12212.2不可分辨关系(Indiscernible Relation 不可分辨关系是粗糙集理论中的另一个重要概念。在决策表中,描述对象的属性是一种不精确信息,这种不精确信息造成了对象之间是不可分辨的或不分明的,观察这种不可分辨关系的对象正是粗糙集理论研究的出发点。S 为知识表达系统,令P !A 定义属性集P 的不可区分关系ind (P 为:ind (P =(x ,y U ×U|#a P ,f (x ,a =f (y ,a 如果(x ,y ind (P ,则称x 和y 是P 不可区分的。不可分辨关系实际上是一种等价关系

10、,具有不可分辨关系的对象是属性值完全相同的对象。符号U/P 表示不可区分关系ind (P 在U 上导出的划分,ind (P 中的等价类称为P 基本集。2.3上下近似、边界和正域给定知识表达系统S=(U ,A ,V ,f ,对于每个子集X ,X !U和属性子集P ,P !A ,定义两个子集:P X=Y ind (P :Y !XP X=Y ind (P :Y X !分别称它们为X 的P 下近似和P 上近似。Bnd P (X =P X-P X 称为X 的P 边界域。Pos P (X =P X 称为X 的P 正域。令P ,Q 为U 中的等价关系,Q 的P 正域记为Pos P (Q =X U/Q$P X

11、 。Q 的P 正域反映的是U 中所有根据分类U/P 的信息可以准确地划分到关系Q 的等价类中去的对象集合。2.4知识的依赖性给定知识表达系统S=(U ,A ,V ,f ,P !A 。当k="P (Q =Pos P (Q /U 时,称知识Q 是k 度依赖于知识P 的。2.5属性约简与核粗糙集中有两个重要的概念:约简和核。由于不涉及它们,不作介绍。3连续数据样本的离散化粗糙集只能处理离散化数据,而原始故障诊断决策系统中的数据往往是连续的。因此,必须先对原始故障诊断决策系统中的数据进行离散化处理。离散化的原则是:(1属性离散化后空间维数尽量小,也就是每一离散化后的属性值的种类尽量少;(2属

12、性值被离散化后的信息丢失尽量少。下面介绍几种常用的离散化方法7-12:(1经验分割法该方法是由人们凭经验在属性的值域中设定断点。(2等频分割法、等距分割法等距离划分、等频率划分法是基于统计基础上的,方法简单。(3Na #ve Scaler 算法、Semi Na #ve Scaler 算法设决策属性已经离散化。该算法每次只考虑一个单独属性下的值域,如果相邻两个实例所对应的决策值不同,则取相邻两个实例的平均值为一个断点。依次对每个属性进行,最后得到一个断点集。Semi Na #ve Scaler 算法则是将由Na #ve Scaler 算法得到的断点集作为候选集,然后对该断点集做进一步处理。(4布

13、尔逻辑和RST 相结合的离散化算法该算法的思想是在保持信息系统不可分关系不变的前提下,尽量以最小数目的断点把所有实例间的不可区分关系分开。(5自组织特征映射(SOM 网络方法SOM 网络对连续属性进行离散处理,输出层神经元数量等于聚类数目。正确选取聚类数目非常关键,聚类数目少可能会得到不相容的决策系统(存在相互矛盾的规则,即规则的条件相同但是结论不同,导致实际应用时根据判断条件无法做出决策;聚类数目多,会出现过离散情况。一般过程如下:确定数据样本离散化后的空间维数n ;根据n 确定SOM 网络的结构,建立SOM 网络;训练SOM 网络;对训练好的网络,输入需要离散化的数据样本,网络就会输出相应

14、的分类值。(6GA 方法遗传算法(Genetic Algorithm 是一种非常有效的搜索和优化技术。GA 算法应用于粗糙集的连续属性离散化处理,最主要的优势就是其全局寻优能力,即将所有属性值编码成个体位串,得到关于所有属性的全局离散化结构,避免了属性局部离散独立性所带来的弊端。以上各种离散化方法的具体操作可以见参考文献7-12。各种算法具有其自身优势,在实际应用中,通常是根据领域特点,探寻比较合适的算法。4故障特征提取方法4.1基本思想由粗糙集的基本概念可以知道,知识表达系统S 中,知识P ,Q 之间有依赖性。k="P (Q =Pos P (Q /U ,称知识Q 是k度依赖与知识P

15、 的。因此,k 的大小说明了Q 对P 的依赖程度。根据知识依赖性的思想,在故障诊断特征提取时,就可以求出决策属D 对条件属性集C 中每个条件属性(集C i 的依赖程度k ,并根据k 的大小进行故障特征的选择。由k 的定义知道,k 的值是通过正域来刻画的,因此,只需求出条件属性(集C i 对决策属性D 的正域,并按正域的大小进行选择即可。同时,为了保证选择出来的特征属性集合F 对决策属性D 的分类能力保持不变,可以先求出条件属性集C 对决策属性D 的正域Pos C (D 。这样,在进行故障特征选择时,求出故障特征集F 对决策属性D 的正域Pos F (D ,并判断是否等于Pos C (D 。4.

16、2故障特征提取方法下面给出根据条件属性(集对决策属性的正域的大小来选择属性,进行故障诊断特征提取的方法。过程如下:(1建立原始故障诊断决策表A ;(2根据实际问题的特点,选择一种离散化的方法,进行连续属性离散化和(或定性属性的离散化,得到离散化的故障诊断决策表B ;(3计算条件属性集C 对决策属性D 的正域Pos C (D 。(4计算表B 中每个属性对决策属性D 的正域,并按照正域的大小降序排序,形成属性集C ,同时需要记下每个属性的正域的大小。(5设故障特征子集为F=;(6从属性集C 中选择当前正域最大的属性a ,计算Pos F a (D ,当Pos F a (D =Pos C (D 时,F

17、=F a ,C =C -a ,转入(8。如果不相等,则转入(7。(7判断属性集C 中是否有和选取的属性a 的正域一样Computer Engineering and Applications 计算机工程与应用2007,43(1222序号1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24a128.3036.2018.1038.1021.2055.1028.0079.207.5026.1013.806.2036.1011.5033.1037.2040.2070.1012.408.157.2125.7071.208.11a21

18、8.3030.1010.5012.4018.7021.6037.5029.309.2011.209.7128.2026.8044.1020.5014.2033.5015.2030.2025.3035.20b12.110.810.510.751.79-1.510.41-1.31-0.02-0.75-0.81-0.01-0.61-0.81-0.79-0.810.223.82-0.380.15-0.41-0.373.81-0.81b22.561.820.350.310.311.611.751.440.00-0.92-0.72-0.04-0.01-0.93-0.85-0.87

19、-0.421.78-0.62-0.14-0.510.191.85-0.13c11.431.22-0.91-0.901.11-0.561.21-0.10-0.22-0.31-0.29-0.22-0.23-0.31-0.07-0.06-0.110.000.030.070.01-0.110.010.01c21.69-0.541.111.41-2.14-0.10-0.210.19-0.230.07-0.18-0.45-0.41-0.080.160.010.100.01-0.060.160.11FN松动松动松动松动松动松动松动松动喘振喘振喘振喘振喘振喘振喘振喘振流体激励流体激励流

20、体激励流体激励流体激励流体激励流体激励流体激励表1主轴故障诊断决策表A序号123456789101112131415161718192021222324a1234341214244343311444214a2314432114444441113414121b1433341312112111124121141b2113331112442244441444214c1441141421111112222332222c2433314412131311123232233FN111111112222222233333333表2主轴故障诊断离散化决策表B大的属性ai ,如有一个或多个,则依次计算Pos Fa

21、i(D,并选择PosFai (D最大的那个属性ai,F=Fai,C=C-ai,然后转入(6;如果没有,则F=Fa,C=C-a,则转入(6。(8输出故障特征子集F。5故障诊断特征提取实例利用提出的方法提取了两种设备的故障诊断特征。其中,热电厂发电机组的故障诊断数据取自文献2,汽车发动机故障诊断数据取自文献13。5.1发电机组故障诊断特征提取热电厂的发电机组工作中,有些故障在频域内分析难以区分,但在时域内却能收到很好的效果。如轴承松动、喘振、流体激励等故障在频域内往往表现为连续分布的有色噪声,难于进行频谱特征提取。但采用时域的方差、峭度、偏斜度等参数再结合一定的分析方法就可以较好地提取特征。下面就

22、采用基于粗糙集理论的故障特征提取方法来研究如何从这6个参数中寻找最能反映故障的特征。步骤1建立原始故障诊断决策表A。表1为根据参考文献2中的相关数据建立的原始故障诊断决策表。a1,a2,b1,b2, c1,c2分别为垂直和水平方向的方差、峭度和偏斜度,FN为故障名称。步骤2选择自组织特征映射(SOM网络方法进行连续属性离散化和(或定性属性的离散化,得到离散化的故障诊断决策表B;表2为主轴故障诊断离散化决策表B。其中Va1,a2,b1,b2,c1,c2=1,2,3,4,VFN=1,2,3,轴承座松动=1,喘振=2;流体激励=3。步骤3计算条件属性集C对决策属性D的正域PosC(D;U/a1=1,

23、7,10,22,2,4,13,15,16,3,5,9,11,12,14,19, 20,21,24,6,8,17,18,23;U/a2=2,7,8,15,16,17,20,22,24,6,23,1,5,18,3,4,9,10,11,12,13,14,19,21;U/b1=1,5,18,23,2,3,4,7,6,8,10,11,13,14,15,16, 19,21,22,24,9,12,17,20;U/b2=1,2,6,7,8,18,23,3,4,5,9,12,13,22,10,11, 14,15,16,17,19,20,21,24;U/c1=1,2,5,7,3,4,6,9,10,11,12,13

24、,14,8,15,16, 17,18,21,22,23,24,19,20;U/c2=1,6,7,2,3,4,11,13,18,20,23,24,5,8,10,12, 14,15,16,9,17,19,21,22;所以,U/C=1,2,3,4,518,19,20,21,22, 23,24U/D=1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17, 18,19,20,21,22,23,24可求得PosC(D=1,2,3,4,5,6,7,8,9,10,11,12,13,14, 15,16,17,18,19,20,21,22,23,24;步骤4计算表B中每个属性Ci对决

25、策属性的正域,并按照正域中对象元素的多少进行排序,形成属性集C。Posa1(D=!;Posa2(D=!;Posb1(D=2,3,4,7;Posb2(D=3,4,5;Posc1(D=1,2,5,7,19,20;Posc2(D=1,6,7。于是得到属性集C=c1,b1,b2,c2,a1,a2步骤5,6,7对于步骤5,6,7进行的过程,以表3来说明。步骤8输出故障特征子集F。经过步骤5,6,7,由故障特征选择过程,可以得到故障特征子集T=c1,c2,b1。于是,就得到了在保持故障分类能力不变的前提下,最能反映故障的特征集合。具体在本问题中,由于a1,a2代表的是方差,b1,b2代表的是峭度,c1,c

26、2代表的是偏斜度,则也可以直接求出Posa1,a2(D,Posb1,b2(D,Posc1,c2(D,特征选择的结果是一样的。郭小荟,马小平:基于粗糙集的故障诊断特征提取2234迭代修正然而由于地物的复杂性和影像质量问题,Hough 算法可能会产生误匹配点。所以必须对Hough 算法搜索出来的方里网网点进行修正。做法是把其中方里网网点图像坐标和由方里网网点理论坐标映射而得到的图像坐标相差较大的点剔除,再把剩余的对应点做最小二乘拟合。接着把拟合后的图像坐标再用上述直线参数精确定位算法进行搜索得到更精确的方里网网点的图像坐标,如此逐步增大精度参数反复迭代这个过程10次左右,很好地纠正了Hough 算

27、法误检的方里网网点,同时也 达到了亚像素级的精度。5结论本文设计的算法首先把扫描得到的地形图灰度化,再利用Hough 算法检测出内图廊点和方里网网点,再由内图廊点和方里网网点的理论坐标和图像坐标的一一对应关系多次进行最小二乘拟合,在每次拟合中都用直线参数精确定位算法搜索得网点得精确位置。结合该技术形成了自动或者半自动扫描生成DRG 的软件系统。该系统自动化程度高,有较好的鲁棒性,而且精度也有很高的保障,可以适用于多种不同质量的纸质地形图的校正,有很好的实际应用价值。(收稿日期:2006年4月参考文献:1Basu M.Gaussian-based edge-detection methods-a

28、 surveyJ.IEEE Transactions on Systems ,Man and Cybernetics ,2002,32(3:252-260.2Steger C.An unbiased detector of curvilinear structures J.IEEETransaction on Pattern Analysis and Machine Intellegence ,1998,20(2:113-125.3孙家广,杨长贵.计算机图形学M.北京:清华大学出版社,1994.4章毓晋.图象分割M.北京:科学出版社,2001.5阮秋琦.数字图像处理学M.北京:电子工业出版社,

29、2001.6郭仁忠.空间分析M.武汉:武汉测绘科技大学出版社,2000.7陈述彭,鲁学军,周成虎.地理信息系统导论M .北京:科学出版社,1999.8廖克.现代地图学M.北京:科学出版社,2003.9李汝昌,王祖英.地图投影M.北京:中国地质大学出版社,1992.10蒋长锦.科学计算和C 程序集M.北京:中国科学技术大学出版社,1998.(上接216页故障特征子集F c1c1,b1c1,b1,b2c1,b1,c2排序的属性集C c1,b1,b2,c2,a1,a2b1,b2,c2,a1,a2b2,c2,a1,a2c2,a1,a2b2,a1,a2Pos F (D 1,2,5,7,19,201,2,

30、3,4,5,7,12,17,18,23,19,201,2,3,4,5,6,7,8,9,10,11,12,13,14,17,18,19,20,22,231,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24Pos F (D =Pos C (D ?n n n n y表3故障特征选择过程这个结果说明,最能反映三种故障特征的是偏斜度。从实践中可知三种故障动态轨迹变化是有明显区别的。流体激励故障的轨迹重心稳定,轴承座松动故障的轨迹重心变化较大,而喘振故障的重心偏移介于二者之间。6结语故障的特征提取对于有效可靠的诊断是十分重要的。而实际的故障诊断数据样本的分类边界常常是不确定的,并且故障与征兆之间的关系往往也是不确定的。粗糙集理论能够分析隐藏在数据中的真实特性,而不需要任何附加的信息。本文结合粗糙集理论和知识的依赖性的概念和定义,提出根据条件属性(集对决策属性的正域的大小来选择属性,进行故障诊断特征提取的方法。并通过对热电厂发电机组故障诊断特征提取对该方法进行了验证。结果表明,这种方法能够有效地提取故障特征,为进行准确的故障诊断打下了基础。这种方法也可以用在其他涉及特征提取或重要属性选择的应用上。(收稿

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论