




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、讲解人: XXXFrequent Pattern Algorithm频繁模式算法Frequent Pattern Algorithm 频繁模式算法TidItems1牛奶,鸡蛋,面包,薯片2鸡蛋,爆米花,薯片,啤酒3鸡蛋,面包,薯片4牛奶,鸡蛋,面包,爆米花,薯片,啤酒5牛奶,面包,啤酒6鸡蛋,面包,啤酒7牛奶,面包,薯片8牛奶,鸡蛋,面包,黄油,薯片9牛奶,鸡蛋,黄油,薯片ItemsTimes啤酒,鸡蛋3啤酒,面包3牛奶,鸡蛋4牛奶,鸡蛋,面包3牛奶,鸡蛋,面包,薯片3牛奶,鸡蛋,薯片4牛奶,面包5牛奶,面包,薯片4牛奶,薯片5鸡蛋,面包5鸡蛋,面包,薯片4鸡蛋,薯片6面包,薯片5频繁模式算法
2、Frequent Pattern Algorithm 频繁模式算法项与项集基本概念这是一个集合的概念,在一篮子商品中的一件消费品即为一项(Item),则若干项的集合为项集,如尿布,面包构成一个二元项集。支持度 支持度是指在所有项集中X, Y出现的可能性,即项集中同时含有X和Y的概率。通过设定最小阈值(minsup),剔除“出镜率”较低的无意义规则设定最小阈值为5%,由于尿布,啤酒的支持度为800/10000=8%,满足基本输了要求,成为频繁项集,保留规则;而尿布,面包的支持度为100/10000=1%,被剔除。 有10000个消费者购买了商品,其中购买尿布1000个,购买啤酒2000个,购买面
3、包500个,同时购买尿布和面包800个,同时购买尿布和面包100个。Frequent Pattern Algorithm 频繁模式算法1FP-Growth算法演示-构造FP树TidItems1I1,I2.I52I2,I43I2,I34I1,I2,I45I1,I36I2,I37I1,I38I1,I2,I3,I59I1,I2,I3事务数据库的建立扫描事务数据库得到频繁项目集FI1I2I3I4I567622定义minsup=20%,即最小支持度为2,重新排列FI2I1I3I4I576622Frequent Pattern Algorithm 频繁模式算法TidItems1I2,I1,I52I2,I4
4、3I2,I34I2,I1,I45I1,I36I2,I37I1,I38I2,I1,I3,I59I2,I1,I3重新调整事务数据库Frequent Pattern Algorithm 频繁模式算法构建FP树TidItems1I2,I1,I52I2,I43I2,I34I2,I1,I45I1,I36I2,I37I1,I38I2,I1,I3,I59I2,I1,I3rootI2:1I1:2I5:11I4:13I3:142I4:1I1: 1I3: 1522263I3:1I5:1742Frequent Pattern Algorithm 频繁模式算法rootI2:I1:I5:14I4:1I3:2I4:1I1:
5、 2I3: 2I3:2I5:17FP树1FP-Growth算法演示-FP-树挖掘挖掘从表头header的最后一个项开始I2I1I3I4I576622Frequent Pattern Algorithm 频繁模式算法rootI2:I1:I5:14I4:1I3:2I4:1I1: 2I3: 2I3:2I5:17挖掘I5FP树 在FP树中可以看到,从根节点到i5:1的路径有两条:i2:7-i1:4-i5:1i2:7-i14-i3:2-i5:1 i2:7-i1:4和i2:7-i14-i3:2因为最终到达的节点肯定是i5,所以将i5省略就是i5的条件模式基,记为i2,i1:1i2,i1,i3:1为什么每个
6、条件模式基的计数为1呢? 虽然i2和i1的计数都很大,但是由于i5的计数为1,最终到达i5的重复次数也只能为1。所以条件模式基的计数是根据路径中节点的最小计数来决定的。Frequent Pattern Algorithm 频繁模式算法rootI2:I1:2I3:2挖掘I5条件FP树1条件模式基:i2,i1:1i2,i1,i3:1根据条件模式基,我们可以得到该商品的条件FP树因为i3:1x小于最小支持度2,所以讲i3:1省略不计,i5的条件FP树记为 i2:2,I1:2项条件模式基条件FP树产生的频繁模式I5I2 I1:1,I2 I1 I3:1I2 I5:2, I1 I5:2, I2 I1 I5:2I4I2 I1:1,I2:1I2 I4:2I3I2 I1 :2,I2:2,I1:2,I2 I3:4,I1 I3:4,I2 I1 I3:2I1I2:4I2 I1:4Frequen
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 创新技术打造高效的医疗保险服务流程
- 信息共享与智慧化在医疗服务中的应用
- 利用区块链强化医疗知识产权的解决方案和投资策略分析
- 企业办公场景下的区块链技术应用及法律风险评估
- 企业管理中的数据整合与智能决策系统建设
- 以法治思维推动医疗行业健康发展
- 办公室AI智能助手的技术与伦理考量
- 伦理医疗实践塑造健康未来
- 公众参与的医疗创新与健康普及教育
- 办公网络环境下的医疗信息安全保障
- 人教版(部编版)小学语文五年级下册期中复习课件1
- 农贸市场消防应急预案演练总结
- 牙周病学全套教学课件
- 酒店合作协议书酒店工程维修
- 《化解冲突收获友谊》心理健康课件
- DB42-T 2185-2024 高速公路运营管理服务规范
- 基于AI人工智能的智慧园区融合感知平台建设方案
- JB T 7689-2012悬挂式电磁除铁器
- 课件-错账更正
- 现代汉语语料库词频表CorpusWordlist
- 宁德时代社招测评试题
评论
0/150
提交评论