基于weka的数据分类分析.doc_第1页
基于weka的数据分类分析.doc_第2页
基于weka的数据分类分析.doc_第3页
基于weka的数据分类分析.doc_第4页
基于weka的数据分类分析.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于weka的数据分类分析实验题目基于weka的数据分类分析小组合作否姓名班级12级信管班学 号一、实验目的1、 使用数据挖掘中的分类算法,对数据集进行分类训练并测试;2、 应用不同的分类算法,比较他们之间的不同;3、 了解Weka平台的基本功能与使用方法。二实验环境1、win7+eclipse+weak;2、实验室网络环境三、 实验内容与步骤(一)数据准备及预处理1、 格式转换方式;(二)三种分类方法分析1、决策树分类;2、K最近邻算法分类;3、朴素贝叶斯分类;4、三类分类方法的校验结果比较;四、实验过程与分析(一) 数据准备及预处理1、 格式转换方式;原始数据是excel文件保存的xlsx格式数据,需要转换成Weka支持的arff文件格式或csv文件格式。由于Weka对arff格式的支持更好,这里我们选择arff格式作为分类器原始数据的保存格式。转换方法:在excel中打开“weather.xlsx”,选择菜单文件-另存为,在弹出的对话框中,文件名输入“weather”,保存类型选择“CSV(逗号分隔)”,保存,我们便可得到“weather.csv”文件;然后,打开Weka的Exporler,点击Open file按钮,打开刚才得到的“weather”文件,点击“save”按钮,在弹出的对话框中,文件名输入“weather”,文件类型选择“Arff data files(*.arff)”,这样得到的数据文件为“weather.arff”。(二)三种分类方法分析1、 决策树分类:用“Explorer”打开刚才得到的“train-data.arff”,并切换到“Class”。点“Choose”按钮选择“tree (weka.classifiers.trees.j48)”,这是WEKA中实现的决策树算法。选择Cross-Validatioin folds=10,然后点击“start”按钮:2、 K最近邻算法分类:点“Choose”按钮选择“laze-ibk”,这是WEKA中实现的决策树算法。选择Cross-Validatioin folds=10,然后点击“start”按钮:3、 朴素贝叶斯分类;点“Choose”按钮选择“bayes”,这是WEKA中实现的决策树算法。选择Cross-Validatioin folds=10,然后点击“start”按钮:4、 三类分类方法的校验结果比较;据上述数据,虽然朴素贝叶斯分类算法有最高的准确率, 而标准误差较高;而决策树的准确率相对较高而标准误差也较高,综合评价可以得知,当前最好的分类算法是KNN算法。五、实验总结通过本次实验,使我对Weka平台有了比较完整和深入的认识,对Weka中进行分类分析的KNN算法、素贝叶斯算法和决策

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论