下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、决策树实验一、实验原理1 所示。它表示概念 buys_computer,它预测顾客是否可能购买计算机图 1ID3 算法:叶结点代表从树根到叶结点之间的路径对应的记录所属的类别属性值。每一个非叶结点都将与属性中具有最大信息量的非类别属性相关联。采用信息增益来选择能够最好地将样本分类的属性。ID3 总是选择具有最高信息增益(或最大熵压缩)”。二、算法伪代码算 法 Decision_Tree(data,AttributeName) 输入由离散值属性描述的训练样本集data; 候选属性集合 AttributeName。输出一棵决策树。创建节点N;If samples 都在同一类Cthen返回N作为叶节
2、点,以类C标记;If attribute_listthen返回Nsamples 多数表决attribute_list test_attribute;test_attribute 标记节点N;For each test_attribute 的已知值v/划分samples(9) 由节点N 分出一个对应 test_attribute=v 的分支;(10 Sv 为 samples 中 test_attribute=v 一个划分块If Sv为空 thensamples中最普遍的类标记;(13)Else Decision_Tree(Sv,attribute_list-test_attribute)返回节点
3、值。三、实验数据预处理三、实验数据预处理Age:30 岁以下标记为 岁以上50 岁以下标记为 岁以上标记为。Sex:FEMAL-“1”;MALE“2”Region:INNER RURAL-“3”; SUBURBAN:2 万12 万4 4 万以上 3”Married Children Car Mortgage12Age sex region income married children car mortgage pep12112112212112222121412122121111222212111222212112121121211211221112112121312212121222122
4、2221222211212211211221212212111212221321211122111211121113222121312212221323311121322312112313311221321312122321311111311312112313312222324312211313322112四、实验主函数function main clc;DataSet=1 211211221211222212141212212111122221211122221211212112121121122111211212131221212122212222212222112122112112212
5、12212111212221321211122111211121113222121312212221323311121322312112313311221321312122321311111311312112313312222324312211313322112;AttributName=11 12 13 14 15 16 17 18 19;Tree RulesMatrix=DecisionTree(DataSet,AttributName) End五、实验结果The Decision Tree:(The Root):Attribut|1Attribut|1Attribut|1Attribut
6、|1leaf 1|2leaf 2|2leaf 2|3Attribut|1Attribut|1leaf 1|2leaf 2|3leaf 1|2leaf 2|2Attribut|1Attribut|1leaf 2|2leaf 1|2leaf 1|2Attribut|1leaf 2|2Attribut|1leaf 1|2leaf 2|3leaf 2|3Attribut|1leaf 2|2Attribut|1leaf 1|2Attribut|1leaf 1|2leaf 2|4leaf 1Tree =Attribut: 3Child: 1x4 structRulesMatrix =1110100011210100022010100023011110013012110023013110013010120021010201022010201010010202010021000020022100010022200020023000020030000120030001
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 会计数据分析DAA-1e-IRM-2018-v3
- 新生儿缺氧缺血性脑病课件
- 中国欧盟商会商业信心调查 European Business in China POSITIONPAPER 2024 2025
- 陕西省渭南市韩城市2024届九年级上学期期中考试数学试卷(含答案)
- 神奇圣人王阳明课件
- 5年中考3年模拟试卷初中道德与法治八年级下册05专项素养综合全练(五)
- 人教版小学音乐教案三年级下册
- 脍炙人口的歌-小城故事 课件 2024-2025学年粤教花城版(简谱)(2024)初中音乐七年级上册
- DB11-T 2056-2022 环境空气总悬浮颗粒物网格化监测技术规范
- DB11-T 1938-2021 引调水隧洞监测技术导则
- 新世纪大学英语综合教程第二版第一册全套教材课件
- 金坛区苏科版五年级心理健康教育第1课《我的自画像》课件(定稿)
- 《动物的行为》-完整版PPT
- 初中数学人教八年级下册第十八章 平行四边形《平行四边形的对角线的性质》教案
- 东京审判-通识2
- 思想道德与法治教案第四章:明确价值要求践行价值准则
- 生鲜店食品安全管理制度
- 2022年云南现代烟草农业现状及发展策略
- 人教版高中语文选修-中国现代诗歌散文欣赏《雪落在中国的土地上》课件(共15张PPT)
- 幼儿园保教实习与指导课件
- 意外伤害保险业务监管办法(征求意见稿)政策解读培训试题
评论
0/150
提交评论