数据挖掘WEKA实验报告_第1页
数据挖掘WEKA实验报告_第2页
数据挖掘WEKA实验报告_第3页
数据挖掘WEKA实验报告_第4页
数据挖掘WEKA实验报告_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据挖掘-WEKA实验报告一姓名及学号:杨珍20131198班级:卓越计科1301 指导老师:吴珏老师一、实验内容1、Weka工具初步认识(掌握weka程序运行环境)2、实验数据预处理。(掌握weka中数据预处理的使用)对weka自带测试用例数据集weather.nominal.arrf文件,进行一下操作。1)、加载数据,熟悉各按钮的功能。2)、熟悉各过滤器的功能,使用过滤器Remove、Add对数据集进行操作。3)、使用 weka.unsupervised.instance.RemoveWithValue 过滤器去除 humidity 属性值为high的全部实例。4)、使用离散化技术对数据集

2、glass.arrf中的属性RI和Ba进行离散化(分别 用等宽,等频进行离散化)。(1)打开已经安装好的weka,界面如下,点击openfile即可打开weka自带测试 用例数据集weather.nominal.arrf文件rrep-0CCE =5 tains-! cofib t thm V-aksi. tipldrcrLOC# 0O Weka Explorer打开文件之后界面如下:可对数据进行选择,可以全选,不选,反选等,还可以链接数据库,对数据进行编辑,保存等。还可以对所有的属性进行可视化。如下图:留凹 W使用过滤器Remove、Add对数据集进行操作。 Wek日 ExplorerEpLa

3、tnon: *a*atiaif. sjnbolic-Acka. f:.GtazLCs: L4SwnAtti-3buts: 6 oE aeldiis: 14ALtr l hut a-zAILStat Leti cVal-aeNininiunnnN-uziniunMlNs &fiITaHSt dficvHailDl stlXLEt: 0Iyya: ITujicr l eUmqy: 0 邮Hmroc : nr工硕c:dHisELng: L4 (1。此霉PatterntTsneDUtlOdfehum di ty :indyClass: iifiiLaned (Thin)Visuftli ze AILd

4、Zcmav-aPreproctse Clsify Cluster Aeeociate I Select attributes VLud.i3e口叩H fil A Opg. 1TRL.p6TL DH .IT迎口Edit .SfiVA .FiltfiirCh3/OB4AdJ -3T muxs 电d -C lastCjrrpnt reliticaicd it tri tut(5)点击此处可以增加属性。如上图,增加了一个未命名的属性unnamed.再点击下方的remove按钮即可删除该属性.使用 weka.unsupervised.instance.RemoveWithValue 过滤器去除 humi

5、dity 属性 值为high的全部实例。没有去掉之前:I 冬 Viewer卜 一|Undo OKL 3TLC elGelati on: athr. symbolicKo.1: ontlo ok Nauixil2: temp eratm-e NoDir-3.13: hxun i di ty Hcenir.3.14: wlndyNniiL3.15: pla.yNccai nal1EUTiTtyhothighFALSENO2EUTiTtyhothighTRUENO3overcasthotHighJALSEye s4rainymildHighJALSEye s5rainycooliLorm alJAL

6、SEye s6rainycooliLorm alTRUEno匚 iovercastcooliLorm alTRUEye sszuTinymildkihFALSEno9zuTinycooliLorm alFALSEye s10rainymiliLorm alFALSEye s11zurixiymiliLorm alTRUEye s12overcastmilhighTRUEye s13overcasthotnormalFALSEyes1-LrainymildhighTRUE去掉其中一个属性之后:No.1 : ou-tlook aL2 : temper alui- eNrais.il3 : hujn

7、i di ty4: w iridy5: play X-Miral1rainyeoolnormalFALSEyes2riiny己mlnormsiTRUEne3overeast己mlnormsiTRUE4EUMty己mlnormsiFALSE5rainymildnormalFALSEyes6suiLnymildnormalTRUEyesiovercas thotnormalFALSEyes|园 ViewerRelation:symtiDliiG一filt-rM uTLsnpurwi 吕哈d. intaiL任己 Elhii(), i th.UrLilc OKC qilc el(7)选择 choose

8、 里的 removewithvalue :Qt WdL explorer=I- fJ ”WW d3 dFid:1 | Sa!. rlllTi-bnJya | Vi|I fil. . Itpisr. UFLCpen 3B.CIA*h_lt g LLJlILv up = aa i ir-VL-i J*, It IT i b UT I- *i n nt* an rv-ITeSj w fbT gpsirm 日顽浦1ULs, * ol MIbrikTBLuiEV H L L slaikBil! l iSL-nCV P KT =m .jl.-BEL*ic-irB kt.距H=?-km p RVft TAT

9、Jsl !5政”丁原浦皿*SuttitMaprESiWiFlit !F.flLttr-K B.LU3:Jt选择huminity属性:Q Weka Explorer II曰点(9)使用离散化技术对数据集glass.arrf中的属性RI和Ba进行离散化(分别用等宽,等频进行离散化)。RI等宽:(10)Ba 等频:二、思考与分析1.使用数据集编辑器打开weather.nominal.arrf文件,实例编号为2的分类属性值是多少?| 垒| Viewer尽Relat 1 on: weather. EymhoIlcIk.1: outlookNninbl2: temp eratnreW口MH3: humid

10、ityNd 赤 al4:育indy5: play Nwinal1suxmyhethigliJALSEIlQ2suxmyhethigliTRUEIlQ3overcasthethigliJALSEyesrainymildhigliJALSEyes5rainycoclriorm:ilJALSIyes6rainycoclriorm:ilTRUETlOovercastcoclriorm:ilTRUEyes8surinymildhighJALSITlO9EurinycoclnormalJALSIyes10rainymildnormalJALSIyes11EurinymildnormalTRUEyes12overcastmildhighTRUE

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论