决策树方法应用实例_第1页
决策树方法应用实例_第2页
决策树方法应用实例_第3页
决策树方法应用实例_第4页
决策树方法应用实例_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、决策树方法应用实例第1页,共16页,2022年,5月20日,8点42分,星期一解:由题意可知: s14,类标号属性“购买电脑”有两个不同值(即会购买,不会购买),因此有两个不同的类(即m2)。设类C1对应于“会购买”,类C2对应于“不会购买”。则s19,s25,p19/14,p2=5/14。计算对给定样本分类所需的期望信息:计算每个属性的熵。先计算属性“年龄”的熵。对于年龄“40”:s13=3,s23=2,p13=3/5,p23=2/5,如果样本按“年龄”划分,对一个给定的样本分类所需的期望信息为:因此,这种划分的信息增益是 Gain(年龄)=I(s1,s2) - E(年龄)=0.246。计算

2、“收入”的熵。对于收入“高”: s11=2,s21=2,p11=0.5,p21=0.5,对于收入“中等”: s12=4,s22=2,p12=4/6,p22=2/4,第3页,共16页,2022年,5月20日,8点42分,星期一对于收入“低”: s13=3,s23=1,p13=3/4,p23=1/4,如果样本按“收入”划分,对一个给定的样本分类所需的期望信息为:因此,这种划分的信息增益是 Gain(收入)=I(s1,s2) - E(收入)=0.940-0.9110.029。计算“学生”的熵。对于学生“是”:s11=6,s21=1,p11=6/7,p21=1/7,第4页,共16页,2022年,5月2

3、0日,8点42分,星期一对于学生“否”: s12=3,s22=4,p12=3/7,p22=4/7,如果样本按“学生”划分,对一个给定的样本分类所需的期望信息为:因此,这种划分的信息增益是 Gain(学生)=I(s1,s2) - E(学生)=0.940-0.7890.151。计算“信用等级”的熵。对于信用等级“一般”: s11=6,s21=2,p11=6/8,p21=2/8,对于信用等级“良好”: s12=3,s22=3,p12=3/6,p22=3/6,第5页,共16页,2022年,5月20日,8点42分,星期一如果样本按“信用等级”划分,对一个给定的样本分类所需的期望信息为:因此,这种划分的信

4、息增益是 Gain(信用等级)=I(s1,s2) - E(信用等级)=0.940-0.8920.048。由于 “年龄” 属性具有最高信息增益,它被选作测试属性。创建一个节点,用“年龄”标记,并对每个属性值引出一个分支。样本据此划分,如图所示。第6页,共16页,2022年,5月20日,8点42分,星期一收入学生信用等级类高否一般会购买低是良好会购买中等否良好会购买高是一般会购买收入学生信用等级类高否一般不会购买高否良好不会购买中等否一般不会购买低是一般会购买中等是良好会购买收入学生信用等级类中等否一般会购买低是一般会购买低是良好不会购买中等是一般会购买中等否良好不会购买40年 龄第7页,共16页

5、,2022年,5月20日,8点42分,星期一收入学生信用等级类高否一般不会购买高否良好不会购买中等否一般不会购买低是一般会购买中等是良好会购买表1 年龄=30当年龄40第12页,共16页,2022年,5月20日,8点42分,星期一年 龄?学 生?信用等级?会购买不会购买会购买会购买不会购买40一般良好是否“购买电脑” 的决策树第13页,共16页,2022年,5月20日,8点42分,星期一由决策树产生分类规则 对上图进行分析,提取的关联规则是:IF 年龄“=30” AND 学生“否” THEN 购买电脑“不会购买” IF 年龄“40” AND 信用等级“良好” THEN 购买电脑“不会购买”IF

6、 年龄“40” AND 信用等级“一般” THEN 购买电脑“会购买”第14页,共16页,2022年,5月20日,8点42分,星期一 论文中的应用题目:决策树算法的研究与应用 作者:杨静1,张楠男2,李建1,刘延明1,梁美红1 (1西南石油大学,四川成都610500; 2西南油气田分公司信息中心,四川成都610500) 发表期刊: 计算机技术与发展 第20卷第2期 2010年2月 摘要:主要研究了数据挖掘中决策树算法的基本思想和算法。针对目前钻井过程故障诊断的需求,结合决策树算法的特点,提出了一种基于决策树的钻井过程故障诊断专家系统模型。分析了钻井系统事故状态下的相关特征参数,并对基于决策树的钻井过程状态和知识获取进行了详细的论述。通过实例运用ID3算法实现了决策树的建立,为钻井过程故障诊断奠定了坚实的基础。最后提出了对算法的改进,综合对实际数据的处理结果表明,基于数据挖掘的决策树算法可以很好地识别钻井过程中的不同状态,能够实现故障诊断。第15页,共16页,2022年,5月20日,8点42分,星期一论文中的应用结语:文中在论述了决策树算法的基础上,结合钻井工程与工艺,将决策树应用于这一领域。利用决策树知识表示与获取集于一身的优点,对基于决策树的钻井过程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论