




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验三:基于Weka进行关联规则挖掘实验步骤1.利用Weka对数据集contact-lenses.arffi行Apriori关联规则挖掘。要求:描述数据集;解释Apriori算法及流程;解释Weka中有关Apriori的参数;解释输出结果Apriori算法:1、发现频繁项集,过程为(1)扫描(2)计数(3)比较(4)产生频繁项集(5)连接、剪枝,产生候选项集(6)重复步骤(1)(5)直到不能发现更大的频集2、产生关联规则(1)对于每个频繁项集L,产生L的所有非空子集;(2)对于L的每个非空子集S,如果P(L)/P(S)呈min_conf(最小置信度阈值)则输出规则"S=>L-S
2、Weka中有关Apriori的参数:Qweka,gui,Gen#ricObjertEdrtorweka.assodaiions.AprioriAbouta1. car如果设为真,则会挖掘类关联规则而不是全局关联规则。2. classindex类属性索引。如果设置为-1,最后的属性被当做类属性。3. delta以此数值为迭代递减单位。不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。4. lowerBoundMinSupport最小支持度下界。5. metricType度量类型。设置对规则进行排序的度量依据。可以是:置信度(类关联规则只能用置信度挖掘),提升度(lift),杠杆率(le
3、verage),确信度(conviction)。在Weka中设置了几个类似置信度(confidence)的度量来衡量规则的关联程度,它们分别是:a)Lift:P(A,B)/(P(A)P(B)Lift=1时表示A和B独立。这个数越大(>1),越表明A和B存在于一个购物篮中不是偶然现象,有较强的关联度.b)Leverage:P(A,B)-P(A)P(B)Leverage=0时A和B独立,Leverage越大A和B的关系越密切c)Conviction:P(A)P(!B)/P(A,!B)(旧表示B没有发生)Conviction也是用来衡量A和B的独立性。从它和lift的关系(对B取反,代入Lif
4、t公式后求倒数)可以看出,这个值越大A、B越关联。6. minMtric度量的最小值。7. numRules要发现的规则数。8.outputItemSets如果设置为真,会在结果中输出项集。9 .removeAllMissingCols移除全部为缺省值的列。10 .significanceLevel重要程度。重要性测试(仅用于置信度)。11 .upperBoundMinSupport最小支持度上界。从这个值开始迭代减小最小支持度。12 .verbose如果设置为真,则算法会以冗余模式运行。对数据集contact-lenses.arff进彳AApriori关联规则挖掘的结果:=RminzoTir
5、jazcn=5cnare:re.aaaoclat1ms-IT10一1D-口.3-C.05-U,1,3-M口,-5-l.D-c-1国elaElon.:;acc-lenae3Inst,andcs;24Jfztributes:5specta3l-e-pre?rripastioziatianitEar-psccl-raTEc3ntac二-1ens=口-Aaacciatcrntxielfulltrni-nijngsetJApriariEiniiLuiDwupF口rt;0.25>口耳匚3匚匚七日)KinimummetriG<contidence>Q,9NuzberDicyclespert
6、crmed:16Generatedsetsoflarjeiteraets;Sizeufser3fla工q士ireiL3E3L(1):11LsrgeItejuetsL(l):age«anng3age=pre-presbcpicBage=peig3spectac1e-pre5crip=myope12apecuacl«-prescrlp»hypennetr2?L245tigrati5m=rL512匚L2tear-pro<l'rate=reduGEd12Ear-prDd-rate=aDiiral1Zecr.tact-lenses=BDft5contact-l
7、ense5=rLGii&15SizeofsetorlargeittiriaecsL(2):21LargeIternseta工;age=pre-preabycpiccontact-Lenses=nonE5Age-preatyapicccnLact-lensej-ncne后speccacle-ptescrip=iriy<jpepeccaclt-prs3criprci/opespectacle-pre3cri口peapectaele-prtscrspectacle-premcrip=H9口peaaEigmaLism=rLCa.azijmarijm=yesCtear-prod-rate&
8、#171;TeducedStear-p*cd-rat&=rieriraL6contact-lenae3=ncne7。七iga山E=ncasDigiiaDiatD=ye36rear-prod-rate=reduced.6tear-prod-raLe=ncriDaL6cen-iit-lerL3e3=ne?!ie8apecuacle-pEescripfirrezrsptapectaGlE-pre3crlp=hi,pettDe-rapespecmcLe-prescrip=iypemet匚杂apectacle-prescrip=hyperme二r*pe。©巨itaele一9亡县3&am
9、p;rip=hi*p&ft;白二亡士亡是astigmatisin=nDdstigmatis=iioa3DlofM-isffi=noascigmati31n=n口a5tL3mat;i3D=ye3asEigiiuti3ii=7egstigmsti3ri=yescontac.t-lense=ncneStearprcxi-rate=reducedcontact-lenaes-none12T;ear-prod-rate-ncrmfilccnuaci;-1tnaa-sofz55izofactoflargeitemseraL(3);6Larg-eItensetsL3:apt二匚acle-pr&
10、;sGrip=inyDpfnear-pr&drate=reductdconnact-1enjej=mneflapec-tacle-prsstropeaatigirtism=ye3ccntact-lenaE3=aanE5ape(7ta&le-preacrip=tiypErinetropetear-prod-rate=reducedcontact;-lenaea=noiitAastijroatisirnQteaz-prod-rate=reducedcontact-lense3=no-ne6astigmatism-notear-prod-rate-ncrma1conEact-lens
11、M-softSaacigmati31£=stear-prchI-rate*reducedcontact-Len3e3=aon&ESiS-itcultA1. 1D*ET-proc!-Taz-.i-s-±jC*iS1;szqtiibcx-1-nses-r:zns12<ce-2:IJijIzfi:iL.fe|iZ-eifO-lSi4:dutvi4.S)2. cprfi,.a.cli-tEtsczLrE.j-tcitEeir-prEia-iitc-zEiJZf!JH->czi_ta:B-l-ezizsBQCZLrE<czxZ:111>.LlfC3(1
12、(Lt:;'Z«591L*cccltiiJZ.ils3. =h'M墨9fi£=皿yrrcd”*&*二工I4JCB,匕;1»舵;雷££二过;|i|第UEs:|L.nLr*;壮,。务|2;磊4. Mt11一日nr-n口;tesr-prai-Eaic-ceci书>co苜tct-L«e门疗日一二m£Ccotif;|1|yLift;ll-£|Irvs<4.|04>2Jgoot;5. urziba-口gye.«-ar-pc23-z1aj£41也£«
13、;tsafdM5,iE二24L.JlIflvif3.OS5:21aovq二-2事ft.S3mtKE:EAlEI,i3e*9«3&£Ti-iAlTl?nBT13!»CSCtOKflL|>1-FT:0A>|JJCCIW:|2_1|。帛K晒-仪:于UTA3CFM。64/"Mil*llfEI129LEW)/E二£勺工十:Dd-r、1:ur=ixa-c-jztazz-len-a=sa£_5=>总工tdxa:二13je=zi匚5<=czizz2)lev:|tLl|2|eczr-f:>2.51awtinFDit
14、-xritr-ectSG-heiiEES-i口ft$1>te-az-j-rnd-ra'&etoETJol,<Gn£r411l£1<)l-v-j.fl,1J芝Etor*;(i.S410-COT3cmfl中EOmS“LlgdtllE中CHr-prH-WW««0r&iL5ILfti抬levsUIBM'NLTSn由输出:共进行16轮搜索,生成11个频繁1项集,21个频繁2项集,6个频繁3项集;产生10条(设置的)关联规则;如第条规贝U,tear-prod-rate=reduced=>contact-lens
15、es=none的置信度为1,即在tear-prod-rate=reduced的条件下,contact-lenses=none的概率为1;2 .根据CarInfo.txt和CarInfoDescription.tx幽个文件将CarInfo.txt转换成CarInfo.arff文件,并进行Apriori关联规则挖掘。要求同1将txt文件数据复制到excel1并保存为CSV&式,在weka中打开CSVi件,并保存为arff文件即可。其他同1;3 .解释FPGrowth算法;解释Weka中关于FPGrowth算法的参数;比较FPGrowth和Apriori算法的区别FPGrowth算法:1、构
16、造项头表:扫描数据库一遍,得到频繁项的集合F和每个频繁项的支持度。把F按支持度递降排序,记为L。2、构造原始FPTree把数据库中每个事物的频繁项按照L中的顺序进行重排。并按照重排之后的顺序把每个事物的每个频繁项插入以null为根的FPTree中。如果插入时频繁项节点已经存在了,则把该频繁项节点支持度加1;如果该节点不存在,则创建支持度为1的节点,并把该节点链接到项头表中。3、对FP树挖掘:由长度为1的叶子节点开始,构造它的条件模式基,然后构造它的条件FP树,并递归的在该树上进行挖掘,模式增长通过后缀模式与条件FP树昌盛的频繁模式连接实现。FPGrowth算法的参数:0.05False.IFa
17、ewekaassaciations.FPGrawtliAboutClasslimDiementingtheFP-growttialgorithmforfindiricilareitemsetsMorewithoutcardidategeneration.CapabilitiesdeltadoNotCheckCapabilitiestind/JIRulesFarSuppoilLeveihwerBaundMinSuppartmaWurriberOftteimsmetricTypeminMetricnumRulesToFindpositiv'elnd&trulesMustContsi
18、ntransactionsMustContainup口酊BouridMinSu口portuseORFortvlustContainListl.delta:以此数值为迭代递减单位。不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。2 .findAllRulesForSupportLevel:查找满足最小支持下限和最小度量约束的所有规则。打开此模式将禁用迭代支持减少过程,以查找指定数量的规则。3 .lowerBoundMinSupport:最小支持度下界4 .maxNumberOfItems:频繁项集中最多项的个数5 .metricType:度量类型。设置对规则进行排序的度量依据。可以是:置信度(类关联规则只能用置信度挖掘),提升度(lift),杠杆率(leverage),确信度(conviction)。6 .在Weka中设置了几个类似置信度(confidence)的度量来衡量规则的关联程度,它们分别是:a)Lift:P(A,B)/(P(A)P(B)Lift=1时表示A和B独立。这个数越大(>1),越表明A和B存在于一个购物篮中不是偶然现象,有较强的关联度.b)Leverage:P(A,B)-P(A)P(B)Leverage
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村合资合作建房合同范本
- 不标准水电施工合同范本
- 内江小区保安合同范本
- 东亮驾照合同范本
- 两方协议合同范本
- 买房假合同范例
- 农村秸秆销售合同范本
- 合同范本押金退还
- 化工重苯销售合同范例
- 卡车购车合同范本
- 《茎和叶》名师课件
- 玻璃体腔注射-操作流程和注意事项(特选参考)课件
- JGJ114-2014 钢筋焊接网混凝土结构技术规程
- 110kV升压站构支架组立施工方案
- CONSORT2010流程图(FlowDiagram)【模板】文档
- 前厅月工作计划
- 生物医学工程伦理 课件全套 第1-10章 生物医学工程与伦理-医学技术选择与应用的伦理问题
- 新战略营销课件
- 人文地理学考试名词解释全套
- 统编版五年级下册第五单元 习作:形形色色的人 课件 (共16张PPT)
- 大数据介绍课件
评论
0/150
提交评论