版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
故障特征提取的方法研究
摘要:针对常规特征提取方法存在着问题不足,提出了基于BP神经网络和基于互信息熵的特征提取方法,并通过特征提取实例加以说明。结果表明这两种方法是可行和有效的。
关键词:特征提取故障诊断神经网络互信息熵
随着科学技术的发展,现代设备的结构日趋复杂,其故障类型越来越多,反映故障的状态、特征也相应增加。在实际故障诊断过程中,为了使诊断准确可靠,总要采集尽可能多的样本,以获得足够的故障信息。但样本太多,会占用大量的存储空间和计算时间,太多的特征输入也会引起训练过程耗时费工,甚至妨碍训练网络的收敛,最终影响分类精度。因此要从样本中提取对诊断故障贡献大的有用信息。这一工作就是特征提取。
特征提取就是利用已有特征参数构造一个较低维数的特征空间,将原始特征中蕴含的有用信息映射到少数几个特征上,忽略多余的不相干信息。从数学意义上讲,就是对一个n维向量X=[x1,x2,…,xn]T进行降维,变换为低维向量Y=[y1,y2,…,ym]T,mn。其中Y确实含有向量X的主要特性。
特征提取的方法有很多,常用的方法主要有欧式距离法、概率距离法、统计直方图法、散度准则法等。本文针对现有方法的局限性,研究基于BP神经网络的特征提取方法和基于互信息熵的特征提取方法。
1基于BP神经网络的特征提取方法
要从N个特征中挑选出对诊断贡献较大的n个特征参数(nN),通常以特征参数X对状态Y变化的灵敏度ε作为评价特征参数的度量
εij=|(аYi)/(аXj)|
采用三层BP网络,输入层n个单元对应n个特征参数,输出层m个单元对应m种模式分类,取中间隐层单元数为q,用WBiq表示输入层单元i与隐层单元q之间的连接权;用wOqj表示隐层单元q与输出层单元j之间的连接权,则隐层第q单元的输出Oq,为
输出层第j个单元输出yj为
式中j=1,2,…,m;εj为阈值。
则特征参数xi对模式类别yj的灵敏度为
代入式,则特征参数Xi的灵敏度εij和特征参数Xk的灵敏度εkj之差可整理为
大量的试验和研究表明,当网络收敛后有:a1≈a2≈…≈aq。
从上式可以看出,如果
则必有:εij>εki
即特征参数Xi对第j类故障的分类能力比特征参数Xk强。
将特征参数X和分类模式分类结果y组成的样本集作为BP网络的学习样本,对网络进行训练。设Wiq和Wkq分别为与特征参数Xi和Xk对应输入单元与隐层单元q之间的连接权系数,记
│Wεi│=│Wi1│+|Wi2|+…+|Wiq|
│Wεk│=│Wk1│+|Wk2|+…+|Wkq|
如果│Wεi││Wεk│,则可以认为Xi的特征灵敏度εi比特征参数Xk的灵敏度εk大。这样可知特征参数Xi的分类能力比特征参数Xk的分类能力强。
2基于互信息熵的特征提取方法
由信息特征可知,当某特征获得最大互信息熵,该特征就可获得最大识别熵增量和最小误识别概率,因而具有最优特性。特征提取过程就是在由给定的n个特征集X二{XI~X2,…,zn)所构成的初始特征集合情况下,寻找一个具有最大互信息熵的集合:X={X1,X2,…,Xk},kn。由于最大互信息熵由系统熵和后验熵决定,而系统熵是一定的,后验熵越小,则互信息熵越大,分类效果越好。因此有效的特征提取就是在X给定后,寻找一个具有最大互信息熵或后验熵的集合Y。即已知该域R上的初始特征集合X=[x1,x2,…,xn]T,寻找一个新的集合Y=[y1,y2,…,yk]T,kn,使互信息熵最大,i=1,2,…,k。
在一定的初始特征集合下,识别样本的后验熵是一定的。在实现特征优化过程中,随着特征的删除,会有信息的损失,使得后验熵趋于增加。因此后验熵增值大小反应了删除特征向量引起的信息损失的情况。当删除不同特征及删除特征数逐步递增时,会对应有不同的后验熵。按后验熵由小到大排列,可获得对应的特征删除序列。其过程可描述为
(1)初始化:设原始特征集合F={N个特征},令初始优化特征集合S=[K个特征,K=N];
(2)计算后验熵;
(3)实现递减:S=[K-1个特征],并计算相应的后验
熵;
(4)选择优化特征集合:以多个递减特征集合所对应的后验熵为依据,选择具有最小后验熵增的特征向量集合为优化特征集合S[N-1个优化特征];
(5)返回(3),重新计算,直到满足分类要求,选择具有最小后验熵的优化特征集合;
(6)输出优化特征集合。
3特征提取实例
在热电厂的发电机组工作中,发电机组主轴经常遇到如喘振、流体激励等故障。这些故障不仅会引起生产效率下降,而且会对机器造成严重危害,影响机组的安全运行。传统的诊断方法是在主轴轴承处加传感器进行振动测试,得到其频谱图;然后在频域内分析,根据基于能量分布的故障诊断理论将振动信号功率谱密度按一定的规则进行量化,利用神经网络等工具进行故障诊断。但是喘振、流体激励等故障在频域内通常表现为连续分布的有色噪声带,在频域内分析难以区分,难以进行频谱特征提取,全息谱分析方法也不甚有效。传统方法增加了系统的开销,诊断效果不理想。如果在时域内采用信息优化方法做预处理,再用传统的诊断方法进行诊断,可以收到很好的效果。
本文采用时域内故障振动信号的方差、峭度、偏斜度等参数,分别利用BP神经网络和后验熵分析对其进行特征提取,研究如何从中找出最能反映故障的特征。
表1为主轴喘振、流体激励故障时振动信号在垂直和水平方向的方差、峭度、偏斜度等6个参数的数据。
表1主轴故障的特征参数序号喘振流体激励均方差峭度偏斜度均方差峭度偏斜度垂直水平垂直水平垂直水平垂直水平垂直水平垂直水平
设原始特征集合F={x1,x2,x3,x4,x5,x6},其中x1、x2分别为垂直、水平方向的均方差,x3、x4分别为垂直和水平方向的峭度,x5、x6,分别为垂直和水平方向的偏斜度。
①基于BP神经网络的特征提取方法:采用表1中的数据作为BP神经网络的输入,编制程序对神经网络进行训练,训练算法采用标准BP算法和Levenberg-Mar-quardt法两种方法来训练BP网络,从而计算特征参数的特征灵敏度,确定出对结果影响最大的特征参数。
喘振
│W1│={}
流体激励
│W2│={}
从结果可以看出:偏斜度对这两种故障最为敏感,反映了低频自激故障的主要特征。
②基于互信息熵的特征提取方法:原始特征集合F={x1,x2,x3,x4,x5,x6}对应表1中的特征参数。在特征参数优化过程中,随着特征的删除,后验熵变化较大。当删除的特征中包含有x5、x6时,后验熵明显降低;如仅保留x5、x6时,后验熵最小。说明偏斜度对这两
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 玉溪师范学院《电气控制技术》2022-2023学年期末试卷
- 2024标准正规借款合同书
- 盐城师范学院《微机原理与接口技术》2021-2022学年期末试卷
- 人教版四年级上册数学第四单元《三位数乘两位数》测试卷可打印
- 北京版四年级下册数学第三单元 平行与相交 测试卷附参考答案【巩固】
- 苏教版四年级下册数学第三单元 三位数乘两位数 测试卷附答案(考试直接用)
- 年产10GWh储能电池系统项目环评报告表
- 废旧轮胎、塑料再生资源回收利用项目环评报告表
- 心脏骤停的应急处理练习卷含答案
- 盐城师范学院《轮滑》2022-2023学年第一学期期末试卷
- 有机肥料项目验收方案
- 餐券模板完整
- 三查四定表完整版本
- 江苏省连云港市东海县2023-2024学年七年级上学期期中道德与法治·历史试卷(解析版)
- (完整文本版)货物验收单
- 广东省深圳市2023一2024学年三年级上学期科学期中核心素养提升试卷
- 江苏省南通市海门区多校2023-2024学年上学期期中联考八年级数学试卷
- 人教版九年级道德与法治 上册 第三单元《文明与家园》大单元整体教学设计
- 铭记历史勿忘国耻(课件)小学生主题班会通用版
- 电能表安装作业指导书
- 新时代外语教育课程思政建设的几点思考
评论
0/150
提交评论