一种决策树分类模型的设计与实现课件_第1页
一种决策树分类模型的设计与实现课件_第2页
一种决策树分类模型的设计与实现课件_第3页
一种决策树分类模型的设计与实现课件_第4页
一种决策树分类模型的设计与实现课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一种决策树分类模型的

设计与实现计算机与通信学院设计人:吴坤班级:通信四班指导老师:钟清流一种决策树分类模型的

设计与实现计算机与通信学院1课题背景数据挖掘技术的主要算法有:统计分析方法,神经元网络,决策树方法,遗传算法等。其中决策树分类作为数据挖掘工具和方法之一是运用树结构图的方式把数据特征直观地表述出来,可用于对数据的分类和预测,其核心是如何构造精度高,规模小的决策树。课题背景数据挖掘技术的主要算法有:统计分析方法,神经元网络,2课题研究目的主要目的:利用matlab开发平台和统计工具箱设计并实现决策树的分类模型实验系统。决策树分类有其特有的分类过程,本实验系统的是通过算法的实现使分类的过程,剪枝的过程以及分类的结果可视化。借助Matlab软件用比较直观、鲜明的形式——图形、图像来展现决策树分类过程和结果。具体通过比较决策树分类与一般的二次分类和线性分类,展现决策树分类的优势。课题研究目的主要目的:利用matlab开发平台和统计工具箱设3决策树分类步骤a)建立决策树:利用训练样本生成决策树模型。开始,数据都在根节点递归的进行数据分片b)使用决策树对未知数据进行分类:按照决策树上采用的分割属性逐层往下,直到一个叶子节点。c)修剪决策树:去掉一些可能是噪音或者异常的数据。决策树分类步骤a)建立决策树:利用训练样本生成决策树模型。4决策树分类步骤:决策树表示法:决策树分类算法训练集决策树inputoutput天气状况风级湿度

多云下雨

晴天高强正常弱YesYesNoYesNo决策树分类步骤:决策树分类算法训练集决策树inputoutp5决策树的剪枝剪枝目的其实质是消除训练集中的异常和噪声。两种剪枝标准最小描述长度原则(MDL)做法:对决策树进行二进位编码,编码所需二进位最少的树即为“最佳剪枝树”期望错误率最小原则做法:对树中的内部节点计算其剪枝/不剪枝可能出现的期望错误率,比较后加以取舍决策树的剪枝剪枝目的其实质是消除训练集中的异常和噪声。6系统功能需求设计和实现一个图形界面的决策树分类模型。显示决策树分类、决策树剪枝过程,使实验内容、实验过程、实验结果可视化。运用决策树分类得到的分类结果和一般分类相比较,展现决策树分类优势。能对不同数据集进行处理。系统功能需求设计和实现一个图形界面的决策树分类模型。7系统模块架构系统模块架构8系统实现图形、图像:表示数据分布-散点图;表示分类区域-栅格图;表示决策树表示-树结构图;表示决策树代价-曲线图;系统实现图形、图像:9系统主界面该界面主要是设置路径和进入实验。设置路径是为了能找到运行模型所需的所有程序。系统主界面该界面主要是设置路径和进入实验。设置路径是为了能10线性分类界面界面1.‘散点图’2.‘线性分类’3.‘区域划分’4.‘命令解释窗口’线性分类界面界面11决策树分类界面界面1.决策树分类2.决策树构图3.决策树代价测试4.选择最佳决策树5.决策树剪枝。决策树分类界面界面12散点显示数据分布散点显示数据分布13线性分类显示线性分类显示14区域划分显示区域划分显示15分类结果我们通过计算得到ans=0.32,也就是说被错误分类的数据有32%之多,也就说用线性分类所得到的效果并不好。分类结果我们通过计算得到ans=0.32,也就是说被错误分类16决策树分类显示决策树分类显示17决策树构图决策树构图18决策树代价测试决策树代价测试19决策树剪枝决策树剪枝20结果分析由分类得到ans=0.09,即在150个样本中,只有9%样本被错误分类。从误差比较中很容易看出决策树分类具有更高的精度。结果分析由分类得到ans=0.09,即在150个样本中,只21误差比较误差比较22总结研究过程中所遇到的困难此课题所包含的概念、内容、理论在本科阶段并无涉及,所以掌握难度比较大。matlab虽然在矩阵、数组运算上有优势,但是对于用其开发全图形界面却有一定难度,这也是为什么很少见到全图形界面的Matlab系统软件的原因之一。总结研究过程中所遇到的困难23总结收获

通过本次毕业设计,我学习到了新的理论知识,掌握了一门新的编程语言,培养了学习能力,使自己各方面能力得到了提高。

总结收获24感谢衷心感谢各位老师的指导

你们辛苦了!

感谢衷心感谢各位老师的指导25一种决策树分类模型的

设计与实现计算机与通信学院设计人:吴坤班级:通信四班指导老师:钟清流一种决策树分类模型的

设计与实现计算机与通信学院26课题背景数据挖掘技术的主要算法有:统计分析方法,神经元网络,决策树方法,遗传算法等。其中决策树分类作为数据挖掘工具和方法之一是运用树结构图的方式把数据特征直观地表述出来,可用于对数据的分类和预测,其核心是如何构造精度高,规模小的决策树。课题背景数据挖掘技术的主要算法有:统计分析方法,神经元网络,27课题研究目的主要目的:利用matlab开发平台和统计工具箱设计并实现决策树的分类模型实验系统。决策树分类有其特有的分类过程,本实验系统的是通过算法的实现使分类的过程,剪枝的过程以及分类的结果可视化。借助Matlab软件用比较直观、鲜明的形式——图形、图像来展现决策树分类过程和结果。具体通过比较决策树分类与一般的二次分类和线性分类,展现决策树分类的优势。课题研究目的主要目的:利用matlab开发平台和统计工具箱设28决策树分类步骤a)建立决策树:利用训练样本生成决策树模型。开始,数据都在根节点递归的进行数据分片b)使用决策树对未知数据进行分类:按照决策树上采用的分割属性逐层往下,直到一个叶子节点。c)修剪决策树:去掉一些可能是噪音或者异常的数据。决策树分类步骤a)建立决策树:利用训练样本生成决策树模型。29决策树分类步骤:决策树表示法:决策树分类算法训练集决策树inputoutput天气状况风级湿度

多云下雨

晴天高强正常弱YesYesNoYesNo决策树分类步骤:决策树分类算法训练集决策树inputoutp30决策树的剪枝剪枝目的其实质是消除训练集中的异常和噪声。两种剪枝标准最小描述长度原则(MDL)做法:对决策树进行二进位编码,编码所需二进位最少的树即为“最佳剪枝树”期望错误率最小原则做法:对树中的内部节点计算其剪枝/不剪枝可能出现的期望错误率,比较后加以取舍决策树的剪枝剪枝目的其实质是消除训练集中的异常和噪声。31系统功能需求设计和实现一个图形界面的决策树分类模型。显示决策树分类、决策树剪枝过程,使实验内容、实验过程、实验结果可视化。运用决策树分类得到的分类结果和一般分类相比较,展现决策树分类优势。能对不同数据集进行处理。系统功能需求设计和实现一个图形界面的决策树分类模型。32系统模块架构系统模块架构33系统实现图形、图像:表示数据分布-散点图;表示分类区域-栅格图;表示决策树表示-树结构图;表示决策树代价-曲线图;系统实现图形、图像:34系统主界面该界面主要是设置路径和进入实验。设置路径是为了能找到运行模型所需的所有程序。系统主界面该界面主要是设置路径和进入实验。设置路径是为了能35线性分类界面界面1.‘散点图’2.‘线性分类’3.‘区域划分’4.‘命令解释窗口’线性分类界面界面36决策树分类界面界面1.决策树分类2.决策树构图3.决策树代价测试4.选择最佳决策树5.决策树剪枝。决策树分类界面界面37散点显示数据分布散点显示数据分布38线性分类显示线性分类显示39区域划分显示区域划分显示40分类结果我们通过计算得到ans=0.32,也就是说被错误分类的数据有32%之多,也就说用线性分类所得到的效果并不好。分类结果我们通过计算得到ans=0.32,也就是说被错误分类41决策树分类显示决策树分类显示42决策树构图决策树构图43决策树代价测试决策树代价测试44决策树剪枝决策树剪枝45结果分析由分类得到ans=0.09,即在150个样本中,只有9%样本被错误分类。从误差比较中很容易看出决策树分类具有更高的精度。结果分析由分类得到ans=0.09,即在150个样本中,只46误差比较误差比较47总结研究过程中所遇到的困难此课题所包含的概念、内容、理论在本科阶段并无涉及,所以掌握难度比较大。matlab虽然在矩阵、数组运算上有优势,但是对于用其开发全图形界面却有一定难度,这也是为什么很少见到全图形界面的Matlab系统软件的原因之一。总结研究过程中所遇到的困

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论