数据挖掘WEKA实验报告1_第1页
数据挖掘WEKA实验报告1_第2页
数据挖掘WEKA实验报告1_第3页
数据挖掘WEKA实验报告1_第4页
数据挖掘WEKA实验报告1_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.专业整理.数据挖掘-WEKA实验报告一姓名及学号:杨珍 20131198班级:卓越计科1301指导老师:吴珏老师.学习帮手.一、实验内谷1、Weka工具初步认识(掌握 weka程序运行环境)2、实验数据预处理。(掌握 weka中数据预处理的使用)对weka自带测试用例数据集 weather.nominal.arrf 文件,进行一下操作。1)、加载数据,熟悉各按钮的功能。2)、熟悉各过滤器的功能,使用过滤器Remove Add对数据集进行操作。3)、使用 weka.unsupervised.instance.RemoveWithValue 过滤器去除 humidity属性值为high的全部实例

2、。4)、使用离散化技术对数据集glass.arrf中的属性RI和Ba进行离散化(分别用等宽,等频进行离散化)。(1)打开已经安装好的weka,界面如下,点击open刊e即可打开weka自带测 试用例数据集weather.nominal.arrf文件| 口 |l回J前Ql WbIcb Exp 口rerFreTT0ccES j,电4.| 他卓# V%,邨D事.一I S-imwiat is rGrip宜根T a*,*Iw-akT d: 1 l ct5 dL aluwO bre a!Si- ncer. a rflfQ ccntact- 小Di cpu.af-H。cpui.vr th v-endDf .

3、srffQ crediL-g.arffQ dimb走十日三餐卡Q glsss a rtf0 iorcipherr arff。iri&.2D.arffO 在也自市9 l3bor.arffQ Re jte rsCa rr te-zt arffQf Rri/tr rsC.ar-trai nB5rff Rr ulr rsGra in-t arffO Rt-JBercGra宿 in wrffsrgm-ent-trsij rtf toybea- .a-rtf M pern-market ar ff un bail 3nced.3i4ftTd ebicne IlXc ±*nf;-k.*E

4、±isir tiUcrhfii fhiicli can le uu,匕n»i里费色*lr*Ti'$ B-pt i.«iLE 41 il文件包卬J京件木型;Jurff data filac (*. arf£)!馆眈百1-a.tTLEG? a不,f t由 m E,rplrfir(2)打开文件之后界面如下:可对数据进行选择,可以全选,不选,反选等,还可以链接数据库,对数据进行编辑,保存等。还可以对所有的属性进行可视化。如下图:tenperttcrety4方5T(4)使用过滤器Remove Add对数据集进行操作。(5)点击此处可以增加属性。如上图,增加

5、了一个未命名的属性unnamed再点击卜方的remove按钮即可删除该属性过滤器去除humidity(5)使用 weka.unsupervised.instance.RemoveWithValue属性值为high的全部实例。没有去掉之前:ViewerRelati on: »eather.ITo.1 : outlook£七3"!2. l«mperslurs3: hwnt di. ty4i: *iadyS二 pliyKmi nal1EUMiyhothighJAL£IM匚snuimyhoth.ighlEUtmo3cbvercasthothi«

6、;hFALSEyts4rainymildkighFALSEyts5rainyc o oLikDrm a,lFALSI:.咋E6FSirty"E OC>LiL-Di-malTRUEno(ffvfrcBst«0«1n*rri JTRUI9suMiymildkifihFALSE靠尊13sunny-c o oLxkDrri aJL:FALSEye s1Gh rainyim ildiLDmalTAL£Iye £11sinmym门dzvomolTRUI12o>v«rc&st用式3hi aTRUE13v电ru thitiLcrn

7、d.FALSEyes14rainymildhJghTRUEno. utc(6)去掉其中一个属性之后:Ik 一1: oatlook N:s.inaL2 : timp«r atur e XmihlI3 : htunidi ty Xsainal1 : windy5 play ysaiml1rainycoolnormalFALSEVhS2eaolrmH43CTCtnormalTRUEy4s4narinilFiLSEy*£5rauiymildnormalFUSEy«sEsuimymil AnormalIRUEyes1ovfrrcas thMFALSE产5xj View er

8、Eel atLDii: weather, syalialic_1 eka. filters, niisnpervi sefl. instanc&. EernoveWi th.LM.C «L(7)选择 choose 里的 removewithvalue :(8)选择huminity 属性:(9)使用离散化技术对数据集glass.arrf 中的属性RI和Ba进行离散化(分别用等宽,等频进行离散化)RI等宽:Q V/eLe EzqnlorerLsJLeJSFrk1r2m CLjwm自 Lluacr 触Sdcct aturi*by.t«fl V15ua.le<Ovin

9、 fiLt.工 w UFiHitbtD=c li sci at lie T -J 10 T -E0 -R 15 3115r左必At tri ball i|-Ui i J卅日皿(10)Ba 等频:I o II E7/ekj ExalorerFr>pr口Su”行| CJbmjtriMr | SUst *>»1 内.!»!.<Oven file.gm皿,D*SivcHCvr<&t rtltia tnRfil 耳kJ an G |<-ETnsl BATA S' Jl 1Sdl«cUd attrib七,口5注肛Ni EEi% a

10、 5*GacrQit nTyi:* 加mrie 止平总1屿归&£1Lttrihci il田上工 ?U2且3i3B=4_疝5Sl$ 一K-cBa.9in 二r/ptIM®HiidnuR1.511lot nun-M。儿口 003mi j3n uL;hv -r -1 UJ -1 -L C -R 8露Lahd.C。也tViiSktLH (一皑/176174. G*2'c 05-0 E95 03J O.125-0 33544.Q. 1J Q,用-0 元5144.«J & 5B5-0 g5'd4 0aj 口735r4i.Otfjrm£

11、sj44.6一>i stinc 1T河,UfiFtlIfni,铲g 0SiNiEEfb n ot!IHtrib血耳卜、姓*1。0 UIEwe,Sltt3£i 0IU1&H 口倡filter s ubieuTns1 aric a sUI耳EvvBrt?-1 -1Jo.lucl|Edl22Ma3_*54 AL5_Si4Kaansagfa10、思考与分析2的分类属1.使用数据集编辑器打开weather.nominal.arrf 文件,实例编号为 性值是多少?i $i ViewerReZall on.: n eatlier. symb all cIk,1: outl ook2

12、t«n»p*ratur«3 : honi di tjr4:*indy51 pl1sunnyh”high:FALSEno2suimyhathigh1削IILQgvrcasthNhi曲IAL5Eya4r tinywildhighJAlEyts5rainyCOfllnormalTALSIye: 5k_rainyCQfOlnormalTRUEILOfovercastcaclncrnalTRUEyes3sunnymildhighJAL5E凡09sunnyCOfllnormalFALSEyfei10rainymildnormalFALSET*EItsunrijrmildnormalTRUEyes12o

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论