下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 决策树在汽轮机故障诊断中的应用 梁 娜本文研究了决策树挖掘方法在故障诊断中的应用,根据设备的历史运行记录,对其可能的运行状态进行分类,提取出故障特征。实例证明,利用决策树挖掘技术进行知识提取,有效克服了故障诊断系统知识获取的瓶颈,具有实际的应用价值。1.引言汽轮发电机组是电力工业中的关键设备,其结构复杂,运行环境特殊,因此故障率较高。随着电厂信息化水平的不断提高,越来越多的数据被das系统存储到实时数据库中,这些数据包含了机组运行状态的各种特征。怎样从过去的数据中发现有用的信息,把所获得的知识用于过程监控,提高生产过程自动化水平是值得研究的
2、课题。数据挖掘就是从大量不完全、有噪声、模糊的或者随机的数据中提取出有价值的知识。本文将数据挖掘技术应用于汽轮机的故障诊断,具有实际的意义。2.数据挖掘概述2.1 数据挖掘技术数据挖掘,也称为数据库中的知识发现(kdd),是指发掘隐藏在堆积如山的数据中的真知灼见。通过数据挖掘,有价值的知识、规则或高层次的信息就能从数据库的相关集合中抽取出来,并从不同角度显示,从而使大型数据库作为一个丰富可靠的资源为知识归纳服务。2.2 决策树算法决策树是数据挖掘分类方法的一种。决策树的表现形式类似于流程图的树结构,它的基本组成部分包括决策节点、分支和叶子。决策树中最上面的节点称为根节点,是整个决策树的开始。每
3、个分支是一个新的决策节点。每一个决策节点代表一个问题或决策,通常对应于分类对象的属性。每一个叶节点代表一种可能的分类结果。qulnlan设计的id3方法是国际上最有影响和最为典型的决策树学习算法。设s是数据样本的集合,集合中的样本数用s来表示。假定故障类别具有m个不同值,它们将样本分为m个类,用mi(i=1,2,m)来表示,mi表示类mi中的样本数。则任意一个样本属于mi的概率为pi=mi/s,一个给定样本分类的平均信息熵为 e(s)=-mi=1pilog2pi。设属性a具有n个不同的值,它们将样本划分为n个子集,每个子集sk中的样本在a上的取值相同。设sik是子集sk中类mi的样本数。则由a
4、划分的决策树分类的条件熵为:e(s/a)=nk=1pk-mi=1piklog2pik,其中,pk=sks,pik=siksk表示sk中的样本属于类mi的概率。熵的变化量称为属性a对分类的信息增益gain(a),则gain(a)=e(s)-e(s/a)具体的操作是:(1)计算每一个属性的信息增益,选择信息增益最大的属性a作为根结点;(2)属性a的不同取值将全体样本分成若干个样本子集,按照前面的方法在每一个新的样本集合中选择信息增益最大的属性作为这一级的结点;(3)重复上面的步骤,直至所有的子集都属于同一个类别。3.实例分析3.1 数据准备与预处理本文在现场调研和查阅文献的基础上收集整理了一个汽轮
5、机振动故障数据库,该数据库包含21组故障数据,五种典型故障。我们定义几个在故障诊断中常用的频段作为测试属性: a1 0.01-0.49fa2 0.5fa3 0.51-0.99fa4 1f a5 2f a6 3-5fa7 >5f3.2 构造决策树根据上一节介绍的构造决策树的方法,计算表31中每一个测试属性的信息增益如表32所示。表32 属性对应的信息增益属性信息增益属性信息增益a10.24a50.80a20.95a60.19a30.19a70.36a41.88从表32可以看出,属性a4的信息增益最高,因此以a4为根结点构造决策树。对于根结点以下的各级子集按照同样的方法计算信息增益。最后形成
6、的决策树如图32所示。图32 汽轮机故障决策树3.3 结果评价为了检验规则的正确性,我们用五组实际的故障数据进行验证。诊断出来的结果如表34所示。表34 检验样本实际故障与诊断结果的比较检验样本实际故障诊出故障1油膜振荡油膜振荡2不对中+不平衡不对中3不平衡+碰摩碰摩4不对中+碰摩碰摩5气流激振气流激振从上面的结果可以看出:使用一个数量有限的故障样本集得到的诊断规则还是令人满意的。对于单一故障都够能诊断出来,对于混合故障也能够诊断出其中的一种故障,说明规则的正确率还是很高的。4.结束语决策树方法是从样本中学习规则,所以样本集对决策树的形成是至关重要的,但决策树始终在寻找信息增益最大的属性作为当前节点的测试属性,所以具有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024宾馆客房出租合同范本
- 2024年国际版权转让协议(图书)
- 2024年城市穿梭巴士租赁合同
- 2024-2025学年新教材高中生物第2章神经调节第3节神经冲动的产生和传导课堂达标含解析新人教版选择性必修1
- 2024-2025学年新教材高中物理课时作业五向心力含解析新人教版必修2
- 2024-2025高中生物第5章生态系统及其稳定性1生态系统的结构学案新人教版必修3
- 2024年幼儿园合作项目保密协议
- 网络广告投放代理合同
- 物联网传感器设备研发与应用服务合同
- PROTAC-HPK1-Degrader-3-生命科学试剂-MCE
- 辽宁省大连市金普新区2024-2025学年七年级上学期11月期中英语试题(无答案)
- 河南科技大学《材料科学基础》2021-2022学年第一学期期末试卷
- 区病案质控中心汇报
- 期中测试卷(1-4单元)(试题)2024-2025学年四年级上册数学人教版
- 2024塔吊司机的劳动合同范本
- 2024年国家公务员考试《行测》真题卷(副省级)答案及解析
- 教育局职业院校教师培训实施方案
- 《万维网服务大揭秘》课件 2024-2025学年人教版新教材初中信息技术七年级全一册
- 2024年新华社招聘应届毕业生及留学回国人员129人历年高频难、易错点500题模拟试题附带答案详解
- 江苏省南京市秦淮区2023-2024学年八年级上学期期中语文试题及答案
- 2024年个人车位租赁合同参考范文(三篇)
评论
0/150
提交评论