数据挖掘实验报告二_第1页
数据挖掘实验报告二_第2页
数据挖掘实验报告二_第3页
数据挖掘实验报告二_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.实验二一、 基本原理分类算法是解决分类问题的方法,是数据挖掘、机器学习和模式识别中一个重要的研究领域。分类算法通过对已知类别训练集的分析,从中发现分类规则,以此预测新数据的类别。分类算法的应用非常广泛,银行中风险评估、客户类别分类、文本检索和搜索引擎分类、安全领域中的入侵检测以及软件项目中的应用等。二、 实验目的:掌握CART决策树构建分类模型。三、 实验内容对所有窃漏电用户及真诚用户的电量、告警及线损数据和该用户在当天是否窃漏电的标识,按窃漏电评价指标进行处理并选取其中291个样本数据,得到专家样本,使用CART决策树实现分类预测模型。注意:数据的80%作为训练样本,剩下的20%作为测试样

2、本。四、 实验步骤1、 对数据进行预处理2、 把数据随机分为两部分,一部分用于训练,一部分用于测试。分成testData和trainData文件 即测试数据和训练数据数据的80%作为训练样本,剩下的20%作为测试样本。3、 使用tree包里的tree函数以及训练数据构建CART决策树模型,使用predict函数和构建的CART决策树模型分别对训练数据和测试数据进行分类。4、 使用nnet包里面的nnet函数以及训练数据构建神经网络模型,使用predict函数和构建的神经网络模型分别对训练数据和测试数据进行分类。5、 对比分析CART决策树和神经网络模型对数据处理的结果。五、 实验结果六、 思考与分析尝试采用神经网络对数据进行分类,并与CART决策树的结果进行比较。答:与神经网络相比,决策树可以很好地处理非数值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论