随机森林算法教学提纲_第1页
随机森林算法教学提纲_第2页
随机森林算法教学提纲_第3页
随机森林算法教学提纲_第4页
随机森林算法教学提纲_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、随机森林算法随机森林算法随机森林算法简单地说,随机森林就是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看哪一类被选择最多,就预测这个样本为那一类。随机森林算法主要包括决策树的生长和投票过程决策树的生长和投票过程决策树的生长决策树的生长生长步骤:决策树的生长决策树的生长3、分类树为了达到低偏差和高差异而要充分生长,使每个节点的不纯度达到最小,不进行通常的剪枝操作。投票过程投票过程基本思想: 给定一个弱

2、学习算法,和一个训练集; 单个弱学习算法准确率不高; 将该学习算法使用多次,得出预测函数序列,进行投票; 最后结果准确率将得到提高.投票过程随机森林采用Bagging方法生成多个决策树分类器。投票过程投票过程 算法: For t = 1, 2, , T Do从数据集S中取样(放回选样)训练得到模型Ht对未知样本X分类时,每个模型Ht都得出一个分类,得票最高的即为未知样本X的分类也可通过得票的平均值用于连续值的预测投票过程投票过程C1 C2 CT traintraintrainxc1(x)c2(x)cT(x)C* c*(x) = maxcntt ct(x)S1 S2 ST 投票过程投票过程随机森

3、林投票算法公式:数据C1C2Ct组合得票新数据样本类预测投票过程投票过程基于随机森林算法的故障诊断基于随机森林算法的故障诊断数据训练集测试集导出分类法评估准确性故障分类决策阶段的实现步骤: 装入随机森林学习阶段的有关数据; 输入未知故障样本,由各个决策树分别判别这个未知故障数据所属的类别; 采用多数投票法,决定输入未知故障样本的所有故障类型。基于随机森林算法的故障诊断基于随机森林算法的故障诊断以12脉波可控整流电路为例,并假设变流器发生故障主要是晶闸管开路。共有12个晶闸管,故障形式可分为11类、115种状态。基于随机森林算法的故障诊断基于随机森林算法的故障诊断故障分类表基于随机森林算法的故障诊断基于随机森林算法的故障诊断对每种状态电路的输出采样30个周期的信息,前10个周期作为训练样本数据,后20个周期数据作为测试。 诊断过程: 获取1150个样本(10周期,115种状态)相应的故障信息特征向量 建立随机森林算法的决策树和分类决策器 按照故障分类决策步骤将2300个(20周期,115种状态)在10%噪声情况下测试的样本输入到随机森林分类器的决策树中。 进行投票,做出故障状态的判断,生成分类混淆表CM基于随机森林算法的故障诊断基于随机森林算法的故障诊断混淆表CM谢谢 谢!谢!此课件下载可自行编辑修改

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论