一种基于核密度估计和K-L散度的旋转机械故障诊断方法_第1页
一种基于核密度估计和K-L散度的旋转机械故障诊断方法_第2页
一种基于核密度估计和K-L散度的旋转机械故障诊断方法_第3页
一种基于核密度估计和K-L散度的旋转机械故障诊断方法_第4页
一种基于核密度估计和K-L散度的旋转机械故障诊断方法_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、权利要求书发明名称:一种基于核密度估计和K-L散度的旋转机械故障诊断方法发明人:刘宇(身份证号码、张凡、陈初杰、李彦锋、杨圆鉴、米金华、黄洪钟1. 基于核密度估计和K-L散度的旋转机械故障诊断方法,如图1所示,其步骤包括:步骤1:采集被监测对象的原始振动数据,并划定训练样本集和测试样本集;步骤2:利用集合经验模态分解方法(Ensemble Empirical Mode Decomposition,EEMD)和希尔伯特变换等信号处理方法从各样本集中提取指定时频域特征;步骤3:利用基于距离的特征评估方法从步骤2中得到的特征集中选择出少数敏感特征,并且计算这些

2、敏感特征的分类贡献率;步骤4:利用核密度估计计算训练样本中不同故障类别样本集关于步骤3中提取的敏感特征的概率密度函数,并计算加入一个未知故障类别待测样本后各类样本集新的概率密度函数;步骤5:求出在选定的特征描述下,训练样本中各类故障样本集原始概率密度函数和加入一个待测样本后的新概率密度函数两者的K-L散度值;步骤6:计算集成K-L散度,并通过集成K-L散度的大小判断待测样本的故障类别。2. 根据权利要求1所示的基于核密度估计和K-L散度的旋转机械故障诊断方法,其特征在于,所述步骤3不但从原始特征集中选择出少量敏感特征,而且将选择出来的敏感特征按照其贡献率区别对待,使特征选择更加合理。对于选择出

3、的第j个特征,其贡献率计算公式为:,(1)其中,为在第j个特征描述下,各类样本集类间距离与类内距离的比值,n为选择的敏感特征个数。3. 根据权利要求1所示的基于核密度估计和K-L散度的旋转机械故障诊断方法,其特征在于,步骤4中利用核密度估计方法得到每类故障样本集的概率密度函数,在任意点x处的总体密度函数 的核密度估计定义为:(2)其中, 称为核函数(kernel function),h为窗宽。相比传统的分类器算法,这种算法不但能够考虑到每个样本所带来的个体信息,更重要的是,它很好的考虑到了各类样本集中样本的聚集情况;换句话说,它很好的考虑到了样本间的关联统计信息,这对于处理样本分布的随机性是至

4、关重要的,因此可以更好的实现正确分类。4. 根据权利要求1所示的基于核密度估计和K-L散度的旋转机械故障诊断方法,其特征在于,步骤5中使用对称化的K-L散度来量化两个分布的相似性。原始的K-L散度定义不满足距离的对称性,于是在本发明中使用了如下的对称化K-L散度:(3)使用该K-L散度来量化分布相似性,可以方便地实现算法的程序化,提高算法的效率。除此之外,在步骤6中定义了集成K-L散度指标,从而将所有敏感特征描述下的散度值归一化,方便分类判断,这样做既考虑了全面性,又考虑了可行性。说明书一种基于核密度估计和K-L散度的旋转机械故障诊断方法技术领域本发明属于机械装备故障智能诊断领域,具体涉及基于

5、核密度估计和K-L 散度等统计学工具的故障诊断方法。背景技术旋转机械广泛应用于工业生产实践中,例如风力发电机、数控机床、航空航天发动机等关系到国防民生的重要领域。在生产工作中,滚动轴承、齿轮等旋转机械中的关键部件由于需要承受交变机械应力和偶然冲击,加上本身固有的制造误差,经常会产生一些早期缺陷,例如轻度磨损、点蚀等。这些缺陷如果不及时诊断发现,就会不断恶化,最终导致系统失效,带来很大的财产损失,甚至对国防和人身安全带来巨大威胁。对于现代化大型复杂旋转机械设备而言,尽管可以通过改善设计、制造工艺来提高零部件的质量,但仍难以确保不出故障。所以,有必要利用先进的传感和监测技术,对关键零部件及系统进行

6、有计划、有组织、有针对性的状态监测和故障诊断,尽早发现设备运行过程中的各种隐患,从而防止巨额财产损失和灾难性事故的发生。数据驱动方法是近年来逐渐兴起的一种故障诊断技术,计算机技术的快速发展使得大数据并行高速计算变得非常容易,推动了依靠大量数据分析的故障诊断技术的发展。从应用的角度看,基于数据驱动的故障诊断方法较基于模型的方法更为切实可行,这是由于数据采集通常要比精确建立物理模型更加容易。除此之外,数据驱动的故障诊断方法还有两个明显的优点:一是该类方法更容易实现自动诊断,这与现代工业的智能化发展是切合的;二是该类方法不需要太多参数设置和专家经验知识。一般来说,一种数据驱动的故障诊断方法应包括数据

7、获取、特征提取、特征降维、分类器设计和结果输出等五个步骤,其中分类器设计和选择是该类方法的关键。现有的数据驱动的故障诊断方法大多都是在样本的特征空间寻找一个最优分类超曲面,从而将不同类型的故障样本分开。例如,基于支持向量机(Support Vector Machine,SVM)的故障诊断方法,基于BP(Back Propagation)神经网络的故障诊断方法等。然而,由于噪声、测量误差等对有效振动信号的污染,使得分类问题存在一定的不确定性,进而导致了分类错误的现象,即很难找到一个恰当的超曲面将所有样本全部归类正确。以上常用方法产生分类错误的现象的原因与它们的分类原理是分不开的。传统的智能故障诊

8、断方法往往忽略了样本间的统计信息和关联信息,而统计信息对于随机信号处理是极为关键的,即对于正确分类很有帮助。目前,国内外从样本统计角度开展的智能故障诊断方法的研究或报道还非常少。发明内容本发明的目的是为了从原始样本中提取更加全面、有效的统计学信息,从而提高分类器的准确率和推广能力,提出一种基于核密度估计(KDE,Kernel Density Estimation)和K-L散度(Kullback-Leibler Divergence)两种统计学工具的智能故障诊断方法。本发明的技术方案是:一种基于核密度估计和K-L散度的旋转机械故障诊断方法,具体包括如下步骤:步骤1:采集被监测对象的原始振动数据,

9、并划定训练样本集和测试样本集;步骤2: 利用集合经验模态分解方法(Ensemble Empirical Mode Decomposition,EEMD)和希尔伯特变换等信号处理方法,从原始振动数据中提取指定时频域特征;步骤3: 利用基于距离的特征评估方法,从步骤2中得到的特征集中选择出少数敏感特征,并且计算这些敏感特征的分类贡献率;改进的基于距离的特征评估方法包括以下四步:(1)计算第j个特征C个类的类内距离的平均值:(1)(2)式中,Mc表示第c类的样本个数,J表示特征个数,C表示类别个数,qm,c,j表示第c类第m个样本的第j个特征的特征值。(2)计算第j个特征C个类的类间距离的平均值:(

10、3)(4)式中,uc,j、ue,j分别表示第c和第e个类第j个特征的平均值。(3)数据集A的类间距离与类内距离的比值:(5)越大表示第j个特征对于类别越敏感,更符合评估原则,也是更应该被选择使用的特征。 (4)计算选择的前n个特征的分类贡献率:对于第j个特征,定义:, (6)为其分类贡献率。当完成特征选择之后,得到的敏感特征将作为后续分类器的输入,基于核密度估计和K-L散度的分类器是本发明的核心内容,包含步骤4到步骤6。步骤4: 利用核密度估计计算训练样本中不同故障类别样本集关于步骤3中提取的敏感特征的概率密度函数,并计算加入一个未知故障类别待测样本后各类样本集新的概率密度函数;核密度估计是概

11、率论中一种用来估计随机变量概率密度函数的非参数方法。设是取自一元连续总体X的样本,在任意点x处的总体密度函数 的核密度估计定义为:(7)其中, 称为核函数(Kernel Function),h为窗宽。选用高斯函数作为核密度估计方法的核函数。h是核密度估计方法中唯一要优化的参数,根据最小化平均集成平方误差方法,最优化h的取值由(8)式得到:(8)式中,是样本标准差,n为各类样本集所包含的样本数。步骤5:求出在选定的特征描述下,训练样本中各类故障样本集原始概率密度函数,以及加入一个待测样本后的新概率密度函数两者的K-L散度值;K-L散度也称为相对熵或者信息增益。在概率论和信息论中,K-L散度用来计

12、算两个分布的分对称性或者差异性。K-L散度值越小,表明两个分布越相似。原始的K-L散度定义式为:(9)由于其不满足距离的对称性,于是在本发明中定义了下式的对称化K-L散度:(10)由步骤4得到各类样本集的原始密度函数和加入测试样本后的新密度函数之后,就可以根据(10)式计算出对应的K-L散度值,即量化原始密度函数和新密度函数的差异性。 步骤6:计算集成K-L散度,并通过集成K-L散度的大小判断待测样本的故障类别。由步骤5可知,我们计算得到了前n个特征描述下的K-L散度值,为了便于判断,在这里,我们定义了一个集成K-L散度值():(11)式中,为步骤3得到的前n个特征分类贡献率。(11)式中通过

13、将第j个特征描述下的K-L散度值与第j个特征的分类贡献率加权,可以得到各类样本集的集成K-L散度值。越小,原始分布和加入待测样本后的新概率密度函数越相似;反之,当集比较大时,原始概率密度函数与新概率密度函数差别越大。换句话说,待测样本应该归类于K-L散度值最小的类别。附图说明图1为本发明的基于核密度估计和K-L散度的旋转机械故障诊断方法的流程示意图图2为本发明实例所针对的来自凯斯西储大学的滚动轴承故障诊断平台图3数据集A所有特征类间/类内距离比值图4基于核密度估计和K-L散度的分类器原理示意图图5将本发明用于表1中数据集A的实验结果:四类样本集原始概率密度曲线及对应的加入一个正常样本后新的概率

14、密度函数图6为不同特征数量下,本发明方法在数据集A-E上的分类准确率图7为不同训练样本下,本发明方法在数据集A-E上的分类准确率具体实施方式下面结合附图和具体的实例对本发明做进一步的阐述。附图1所示为基于核密度估计和K-L散度的旋转机械智能故障诊断方法的流程图,如图1所示,其步骤包括:步骤1:采集被监测对象的原始振动数据,并划定训练样本集和测试样本集。本发明以凯斯西储大学的滚动轴承故障诊断平台为例,具体的实验参数如下:如附图2所示,实验平台包括一个2马力的电机(左侧),一个功率计(右侧)和电子控制设备(没有显示)。被测轴承起到支撑电机轴的作用。利用电火花加工技术在驱动端轴承上人为制造了单点故障

15、,故障直径分别为0.007、0.014、0.021和0.028英寸。这些故障单独分布在轴承内圈、滚动体和外圈上。电机转轴上加载了一个冲击力,使用两个加速度传感器测量振动,一个传感器布置在电机壳体上,另一个传感器布置在驱动端轴承外圈上。采样频率为12KHz,单采样样本长度为12000。为了验证上文所提方法的有效性,我们进行了两种实验,第一种是不同故障类型判别实验,第二种是同故障损伤程度判别实验,详细信息如表1和表2所示。数据集A包括轴承4种不同的运行状态(正常、外圈故障、内圈故障、滚动体故障)的280个数据样本,损伤尺寸为0.007 英寸。数据集A分为两部分,140个样本用来训练,140个用来测

16、试,很明显这是一个四种不同健康状态的模式识别问题。数据集B同样包含280个数据样本,其中训练样本与测试样本仍然各占一半,包含内圈和滚动体两种故障类型。数据集B又包含B1和 B2两个数据子集,每个包含140个样本。数据子集B1包含70个训练样本,每个样本的损伤程度为0.007英寸,同时包含损伤程度为0.021英寸的70个测试样本。数据子集B2与B1类似,只是将B1的训练样本和测试样本进行交换,即B1的测试样本作为B2的训练样本。使用数据集B的作用是验证该方法对于同种故障下、不同于训练样本损伤程度的测试样本的检测能力,即验证该方法的稳健性。数据集C、D和E各包含210个样本,训练和测试样本各占一半

17、。数据集C、D和E的故障类型分别为内圈故障、滚动体故障和外圈故障。每种故障损伤程度分为三个层次,0.007、0.021和0.028英寸。使用数据C、D和E的目的是验证该方法对于同种故障不同损伤程度的分辨能力。表1 故障类型判别实验数据集数据集训练样本数测试样本数损伤尺寸(英寸)状态A35350/0正常35350.007/0.007内圈故障35350.007/0.007滚动体故障35350.007/0.007外圈故障BB135350.007/0.021内圈故障35350.007/0.021滚动体故障B235350.021/0.007内圈故障35350.021/0.007滚动体故障表2 故障损伤程

18、度判别实验数据集数据集训练样本数测试样本数损伤程度(英寸)状态C35350.007内圈故障35350.01435350.021D35350.007滚动体故障35350.01435350.021E35350.007外圈故障35350.01435350.021为了精简篇幅,这里仅以数据集A为例叙述本发明方法的后续步骤。步骤2: 利用EEMD和希尔伯特变换等信号处理方法从原始振动数据中提取指定时频域特征。利用EEMD对数据集A所对应的振动信号样本进行分解,白噪声初始值为0.3,集成数为100,于是可以得到每个样本的前四阶IMF(固有模态分量)。接下来,分别从数据集A原始振动信号和四阶IMF分量中提取

19、制定的9个时域特征和10个频域特征,从而得到每类样本集所对应的95个原始特征。所提取的时域特征和频域特征种类如表3和表4所示。表3 时域特征表()振动信号的离散时间序列;是数据点数。表4 频域特征表是时间序列的频谱, (); 是频谱谱线条数; 是第k条谱线。步骤3:利用基于距离的特征评估方法从步骤2中得到的特征集中选择出前10个敏感特征,并且计算这些敏感特征的分类贡献率,以供后续步骤使用。应用基于距离的特征评估方法包括以下四步:(1)计算数据集A中四类样本集在第j个特征描述下的类内距离的平均值:数据集A中共包含四类故障,各类样本数为35,总的特征数为95,所以Mc=35,C=4,J=95;将这

20、些参数带入(1)和(2)式,有:式中,qm,c,j表示第c类第m个样本的第j个特征的特征值。(2)计算数据集A中四类样本集在第j个特征描述下的类间距离的平均值:同上步骤,将相关参数带入(3)和(4)式,得:式中,uc,j、ue,j分别表示第c和第e个类第j个特征的平均值。(3)数据集A的类间距离与类内距离的比值:,95个特征的值如附图3所示。(4)在本实验中,我们选取了值排名前10的特征作为敏感特征,并计算得到了这10个特征的分类贡献率。这10个特征的编号和值如表5所示,进一步,计算选择的这10个敏感特征的分类贡献率。对于第j个特征,有:, 表5 敏感特征的类间、类内距离比值特征编号15142

21、0221316191056 1.000.950.860.860.850.850.790.760.690.66 附图4中以两种故障为例,介绍了本发明基于核密度估计和K-L散度的分类器原理,应用于此实例,具体如以下步骤4到6所述。步骤4:利用核密度估计计算训练样本中不同故障类别样本集关于步骤3中提取的敏感特征的概率密度函数和加入一个未知故障类别待测样本后各类样本集新的概率密度函数。针对数据集A,各类故障样本集训练样本数是35,带入(8)式有:则可以计算出核密度估计的最佳带宽h。 基于上述方法,可得到四类样本集的关于第j特征的原始核密度函数()以及加入一个相同待测样本后四类样本集新的核密度函数(),示例如附图5所示。步骤5: 求出在选定的特征描述下,训练样本中各类故障样本集原始概率密度函数,以及加入一个待测样本后的新概率密度函数两者的K-L散度值。由步骤4得到数据集A中四类样本集的原始密度函数和加入测试样本后的新密度函数之后,根据对称化K-L散度定义,(10)求得在步骤3中选择的10个敏感特征描述下,数据集A中各类样本集原始密度函数与新密度函数的K-L散度值。步骤6:计算集成K-L散度,并通过集成K-L散度的大小判断待测样本的故障类别。由步骤5可知,我们计算得到了前10个特征描述下的K-L散度值,根据式(11)中集成K-L散度值的定义,有:,式中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论