下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于svm的轴承故障特征选择方法研究
在机械故障诊断中,由于诊断对象的复杂性,故障特征和故障类别之间的对应关系尚不清楚。人们提出使用多个原始特征来识别故障。但受分类器规模、训练过程的复杂性以及计算机容量等诸多因素的制约,往往不能取得良好的效果。为了提高识别精度,在设计分类器前,必须去除两类冗余特征:(1)与分类目标无关的特征;(2)与其他特征量有较高相关性的特征,即从一组维数为N的特征中选择出维数为n(N>n)的一组最优特征子集来,使得分类错误率最小。特征选择需要解决两个问题,一是选择的标准,即特征的评价准则,二是采用何种寻优方法来解决这一组合问题。诊断结果的直接表现来源于决策分类的错误,即决策分类的错误率越大,诊断能力越差。所以使分类错误率最小的那一组特征就是最好的特征。但在实际应用中,特征与类条件分布密度是不知道的,理论上无法直接计算学习错误率。一般采用分组轮换法(Cross-Validation)来估计学习错误率,但是需要多次训练分类器,然后对计算的结果取均值,计算量很大。支持向量机(SupportVectorMachine)是在90年代出现的新的、有效的分类器,它已经应用到许多领域,如模式识别、数据挖掘、特征选择等。支持向量机基于结构风险最小化原则,它可以克服维数灾难问题,可以在有限样本的基础上取得良好的分类效果,所以目前得到越来越多的应用。在本文中采用SVM作为分类决策器,并且采用SVM学习错误率的理论上界代替学习错误率作为SVM性能的评价,这只需要训练一次SVM,因而它的计算效率要高于分组轮换法,而且可以避免错误率估计中多次训练样本出现的过拟合问题,寻优结果相对比较稳定。1svm的算法支持向量机是通过将低维的输入空间数据x∈Rn通过非线性映射函数映射到高维属性空间H,映射记为x→Φ(x)∈H,在此高维空间找到最优分类超平面。这种映射是通过核函数实现的,它定义了H空间的内积。在找到最优分类平面的过程中,在高维空间实际上只需要进行内积运算,这种内积运算是可以用原空间中的函数实现的,甚至没有必要知道变换的具体形式。因此,在最优分类面中采用适当的内积核函数K(xi,x)就可以实现从低维空间向高维空间的映射,从而实现某一非线性变换后的线性分类,而计算的复杂度却没有增加。设给定的训练集为{(xi,yi)}1≤i≤l,其中样本xi∈Rn,它所属于的类别yi∈{-1,1},采用的核函数为K(xi,x),SVM分类算法可归结为下列二次规划问题:min12∥w∥2+Cl∑i=1ξis.t.yi(w⋅Φ(xi)+b)-1+ξi≥0(1)式中:ξi≥0为松弛项,表示错分样本的惩罚程度;C为常数,用于控制对错分样本惩罚的程度,实现在错分样本数与模型复杂性之间的折衷;w和b为判决函数中的权向量和阈值。当无错分样本时,最小化目标函数的第一项等价于最大化两类间的间隔,可降低分类器的VC维,实现结构风险最小化原则。上述二次规划的对偶形式为{maxQ2(α)=l∑i=1αi-12l∑i,j=1αiαjyiyjΚ(xi⋅xj)s.t.l∑i=1αiyi=00≤αi≤C,i=1,2,⋯,l(2)式中:αi为Lagrange乘子。利用式(3)得到αi的优化值α*i,最后得到SVM决策函数为f(x)=w⋅Φ(x)+b=∑iα⋆iyiΚ(xi,x)+b(3)对决策分类器的性能估计一般采分组轮换法估计它的分类错误率得到。对于SVM,这些方法的计算量很大,效率较低。对于支持向量机存在已被证明的关于错误上界的描述,包括支持向量数上界、Opper-Winther上界、Jaakkola-Haussler上界、半径-间距(Radius-Margin,简称RM界)上界和跨距上界等5种。对其进行比较后认为,RM界的计算容易实现和控制,且最小化RM界也能得到相当好的结果,因此在实际应用中推荐使用RM界。其定理和计算公式如下所述。定理:设ρ为最大的分类间隙,Φ(x1),…,Φ(xl)为训练特征样本在高维空间的映射,所有映射都包含在一个最小的半径为R的超球内。假设α*为式(2)所求得的α值。如果高维映射在R中以间隙ρ为可分的,则期望错误概率EPerr存在上界为EΡerr≤1lE(R2ρ2)=1lE{R2Q2(α*)}(4)R2可通过下式计算得到{R2=maxβl∑i=1βiΚ(xi,xj)-l∑i,j=1βiβjΚ(xi,xj)s.t.l∑i=1βiyi=0βi≥0,i=1,2,⋯,l(5)式(5)计算还比较繁琐,为简化计算,提高运算效率,R2的近似值可通过下式计算得到R2≈1ll∑i=1Κ(xi,xj)-1l2l∑i,j=1Κ(xi,xj)(6)即在式(5)中令βi=1/l得到。因为从式(2)得到α*只需对全体样本进行训练SVM一次就可得到,相比分组轮换法需要多次训练SVM,可以减少训练时间,提高选择效率。在多故障情况下,可以计算每对故障类别间的上界求其和作为总的上界。2特征算子法特征选择是一个典型的组合优化问题。从一组维数为n的原始特征中选择特征子集,共有2n种子集。当n较大时,这是非常大的数目。本文采用遗传算法寻优特征子集,因为遗传算法具有强大的并行模式空间搜索能力,可以收敛到全局最优解。遗传算法的优化实施过程基本类似,不同的是针对问题的具体编码方式和适合度函数的实现过程。在此选择问题中,染色体的编码方式采用二进制,令特征子集x为染色体位串,如果x的第i位为1,则此特征被选中;如果为0,则此特征未被选中,x的位数为总的特征维数N。特征子集的适合度采用RM上界,即适合度函数为f(x)=EΡerr(x)=1lE{R2Q2(α*)}(7)3基于svm特征选择仿真样本集有两类样本组成,各有50组样本,原始特征集维数为8,其中前2个特征是有效的分类特征,可以由一个线性超平面分开。第三个特征为前2个特征的相关特征,后5个特征量的取值为0与1间的随机数,不含有任何分类信息。即原始特征集同时含有两类冗余特征量。对于此特征数据,采用基于SVM特征选择方法进行选择。为简化计算,选择了RBF核函数,相应的参数σ=1,即核函数为K(xi,xj)=exp(-‖xi-xj‖2/2)。设置遗传算法的初始种群数为10,杂交率为0.9,变异概率为0.09,迭代次数为20。惩罚参数C为10。图1特征选择过程中适合度随遗传代数的变化趋势。图2为特征随遗传代数的发展情况。由图1,图2看出经过12次遗传迭代,找到优化子集,它包含两个特征1,2。这与仿真设定是相吻合的,所以此方法有良好的选择有效特征的性能。4振动加速度传感器的安装为验证此特征选择算法的有效性,对某直升机减速器滚珠轴承故障数据进行了分析。该组数据在减速器试车台测得,振动加速度传感器安装在中减速器表面。轴的额定旋转频率为58.25Hz,选定采样频率为10kHz。根据直升机的工作状况,对5种工作状况下的减速器进行了试验,每种工况10次重复采样,对轴承的3种状态即:正常、滚子点蚀和外环剥落进行了采样,得到150个样本,每种状态50个样本。4.1振动信号的处理数据预处理的目的从原始振动信号中提取特征。对轴承数据分别从时域统计、常规谱分析和小波变换生成特征。(1)时域统计。在时域,选取无量纲参数斜度因子、峭度因子、峰值因子、波形因子、脉冲因子和裕度因子为特征参数。这些特征参数的计算方法参见文献。选取无量纲指标的目的在于最大限度的减小工况参数带来的影响。(2)常规谱分析。诊断监测最经典的方法是谱分析法,采用常规谱分析的给定频带范围的功率累积与总功率累积的比值为特征输入。给定频带的功率累积为Gi=∫fifi-1s(f)df(8)总功率累积为G=∫fΝ0s(f)df(9)式中:s(f)为功率谱密度函数;fi代表第i个频带频率上限;N为频带数。选取N=32,即各频带宽为156.25Hz,由低到高分布,如频带1的范围为0~156.25Hz,频带2的范围为156.25Hz~312.5Hz,依次类推。分别为计算出各频带的相对能量比值,即Gi=Gi/G。由此生成32个特征。(3)小波包变换。由于减速器工作时,引起其振动的因素很多,通过安装在减速器上的振动传感器所拾取的振动信号是非常复杂的宽带信号。本文采用小波包分解的方法来进行信号预处理。对信号经过小波包5层分解后,可以得到N=32个特征频带的小波包系数,各频带设置同常规谱分析。然后利用小波包能量谱的方法来得到原始特征。在小波包能量谱中,可以选取各个频带内信号的平方和作为能量的标志。对于第i个频带,小波包变换结果用序列{ωi(k),k=1,2,…,M}表示,其中M为该频带的样本长度。由于小波包分解后的各频带宽度相同,因此利用小波包分解的结果作为能量谱的输入,则各频带的能量为Gi=∑k=1Μ|ωi(k)|2,令G=∑i=1ΝGi,可以计算出各频带的相对能量比值,即Gi=Gi/G,作为故障样本特征,由此又得到32个特征。4.2试验结果及分析经过预处理,最后产生(6+32+32)=70个原始特征,对特征数据采用基于支持向量机的特征选择。同仿真一样核函数选择RBF核函数,参数σ=1。为了说明基于RM界特征选择的优越性,把它和传统的分组轮换法估计错误率的方式相比较。分组轮换法把样本分为5组进行估计错误率。遗传算法的初始设置相同,初始种群数为50,杂交率为0.9,变异概率为0.09,最大迭代数为50。为考察惩罚系数C对选择结果的影响,初步给出C取不同值时选择结果的变化。惩罚参数C分别取0.01,0.1,1,10,100。图3为采用RM界(惩罚系数C=10)的特征选择过程中,遗传算法适合度随遗传代数的变化趋势,可以看出遗传算法有较好的寻优性能,大约经过40次迭代,找到优化子集。最后的试验结果如表1所示。从表1中可以看出,基于分组轮换法的特征选择结果不太稳定,原因是对样本多次训练可能导致过拟合问题。而基于RM界的选择则相对稳定。参数C对基于RM界的选择结果几乎没有影响,参数C对基于分组轮换法的选择有所影响,但影响不大。另一方面是基于RM界相对基于分组轮换法的特征选择可以大大节省计算时间,效率提高近6倍。5基于支持向量机的特征选择方法,主要来源于受精于和受教育系统的支持向量机特征,其特
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年冷链运输行业环保要求合规性审计合同
- 宠物行业传染病防治方案
- 铝合金门窗施工进度管理方案
- 高中科学教学模板
- 济宁学院《编译原理》2021-2022学年第一学期期末试卷
- 校园心理危机干预培训
- XXX公司技术岗位职称申请流程制度
- 福建省泉州市永春县永春第一中学2024年高三3月月考数学试题试卷
- IT设备配件管理制度
- 三年级数学计算题专项练习及答案
- 2024年中远海运物流限公司直属单位招聘高频难、易错点500题模拟试题附带答案详解
- 第1课 课题二《中外节日·中秋节和感恩节的比较》(教案)-2024-2025学年六年级上册综合实践活动浙教版
- 2024年共青团团课考试测试题库及答案
- 能源岗位招聘面试题与参考回答2024年
- 团队协作课件教学课件
- 24秋国家开放大学《0-3岁婴幼儿的保育与教育》期末大作业参考答案
- 相对湿度计算公式
- 7.1促进民族团结 (课件) 2024-2025学年九年级道德与法治上册 (统编版)
- 2024版肿瘤患者静脉血栓防治指南解读 课件
- 2023-2024学年四年级上册信息技术第一单元第1课《身边的数据》教学设计浙教版2023
- 福建省龙海市龙文区2022-2023学年五年级上学期期末英语试题
评论
0/150
提交评论