数据挖掘-WEKA实验报告一_第1页
数据挖掘-WEKA实验报告一_第2页
数据挖掘-WEKA实验报告一_第3页
数据挖掘-WEKA实验报告一_第4页
数据挖掘-WEKA实验报告一_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据挖掘-WEKA实验报告一一、实验内容1、Weka工具初步认识(掌握weka程序运行环境)2、实验数据预处理。(掌握weka中数据预处理的使用)对weka自带测试用例数据集weather.nominal.arrf文件,进行一下操作。1)、加载数据,熟悉各按钮的功能。2)、熟悉各过滤器的功能,使用过滤器Remove、Add对数据集进行操作。3)、使用weka.unsupervised.instance.RemoveWithValue过滤器去除humidity属性值为high的全部实例。4)、使用离散化技术对数据集glass.arrf中的属性RI和Ba进行离散化(分别用等宽,等频进行离散化)。(1)打开已经安装好的weka,界面如下,点击openfile即可打开weka自带测试用例数据集weather.nominal.arrf文件rrtprocess艾气1'rrtprocess艾气1'力QWekaExplorer51-a.t-a:Y«1ccnat□thmY-aka.tiplorfir打开文件之后界面如下:(QlW&kaExplorerUi足1[Open£il«...Qpez.UEL...•jeri?rate...1...ive..CurreaiiSeLected.uttrLbuitOpEDBS...K-alaLtiUi足1[Open£il«...Qpez.UEL...•jeri?rate...1...ive..CurreaiiSeLected.uttrLbuitOpEDBS...K-alaLtiaii.*fis.thfiTEynholicIn.-=tiuv=4s14kttribiitiE:5Sunofv-aights::LAttributesInwirtfait9EtBinjir-atTirahwnidi.1萝Distinct:3ClassflayOFkn)TyptllominmlinHqiK.:0if2%)tTaiii&:outLaokMilling:.0(DI*)VisuaLiEemCla.553EyCLnslsrAsEocioisSeLeciatitrih-at^E处心:mPioproEase艮5DV4Stia+usDE可对数据进行选择,可以全选,不选,反选等,还可以

链接数据库,对数据进行编辑,保存等。还可以对所有的属性进行可视化。如下图:(4)使用过滤器Remove、Add对数据集进行操作。El曰OpcoifilA..Cip1TRL..DpcnLB.UndoEdit..liltsrCurrantr-alaticaiB^L为tianEl曰OpcoifilA..Cip1TRL..DpcnLB.UndoEdit..liltsrCurrantr-alaticaiB^L为tian:wiaihir.s^nliDlic-N^ks.£1...InslaiLcea:L4AtlirLhutEi-;Uli.I|.cm|FIimrkTattern.kriricutLmktemperaturepixnidity|HndySdlfietAds.ltrihulaUhj您:花dlyp-:ITiuricrlcNL33ll!E:L4(IM%)DisliiLEt:0Uniq心:0'E%)Statist:cValueMimniunIT阳NajciniijnJTailNtar:典S1dE'evJTatlLlas^i:nr皿硕已d(thin)■Zisu&liEtAILMlrihuA町:6StltioEflei-shis:1zKamaYeClac-EifyClmtsrAccoeistaELttrihutb£FleuoIisAPreprocesa(5)点击此处可以增加属性。如上图,增加了一个未命名的属性unnamed.再点击下方的remove按钮即可删除该属性.(5)使用weka.unsupervised.instance.RemoveWithValue过滤器去除humidity属性值为high的全部实例。没有去掉之前:

HViewer|-£S-|Gelation:athei-.symbolicITo.1:ontlook2:temperatm-eNosdii^bI3:humidityNceninaL■1::wlndyN£<niiL3.15:pla_yNccainal1EUTiTtyhothighFALSENO2EUTiTtyhothighTRUENO3overcasthothighJALSIyeerainymildhighJALSIyee5rainycoolitormalJALSIyee£rainycoolitormalTRUEno匚overcastcoolitormalTRUEyeeszuTinymildhi故FALSEno9zuTinycoolitormalFALSEyee10rainymil』iLormalFALSEyee11zuTinymil』iLormalTRUEyee12overcastmil』highTRUEyee13overcasthotncrmalFALSEyes1-LrainymildhighTRUEUndoOKCsncel⑹去掉其中一个属性之后:|鸟|ViewerRelation:symtiDlif一uTLsnpurwi吕哈d.in^taiL任己Elhiid"哈With...No.1:ou-tlookXraijiaL2:temperalui-eNrais.il3:hujnidity4:wiridy5:playXaoiiril1rainyeoolnormalFAL5Eyes2riiny己mlnormsiTRUEne3overeast己mlnormsiTRUE4EUMty己mlnormsiFALSE5rainymildnormalFALSEyes6suiLnymildnormalTRUEyesovercasihotnormalFALSEyes(7)选择choose里的removewithvalue:(8)选择huminity属性:QWekaExplorer□I'曰[吾Quveks.gui.Gene-ricObjectEditor—£3—*elza.filters,uitsupervised..iriEtance.RemovedittiV:ilu&sAboutFiltersinstancesaccordingtothevalueofanattribute.More(9)使用离散化技术对数据集glass.arrf中的属性RI和Ba进行离散化(分别用等宽,等频进行离散化)。RI等宽:

(10)Ba等频:二、思考与分析

1.使用数据集编辑器打开weather.nominal.arrf文件,实例编号为2的分类属性值是多少?|垒|Viewer尽Relat1on:weather.EymhoIlcIk.1:outlookNomiiul2:temperature3:humidityN«d赤al4:育indy赤3.15:playNcfininai1suxmyhethigliJALSEIlQ2suxmyhethigliTRUEIlQ3overcasthethigliJALSEyes£rainymildhigliJALSEyes5rainycoclriorm:ilJALSIyes6rainycoclriorm:ilTRUETlOovercastcoclriorm:ilTRUEyes8surinymildhighJALSITlO9EurinycoclnormalJALSIyes10rainymildnormalJALSIyes11EurinymildnormalTRUEyes12overcastmildhi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论