Apriori挖掘关联规则 省赛获奖_第1页
Apriori挖掘关联规则 省赛获奖_第2页
Apriori挖掘关联规则 省赛获奖_第3页
Apriori挖掘关联规则 省赛获奖_第4页
Apriori挖掘关联规则 省赛获奖_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Apriori关联规则1.了解Apriori算法简介

2.理解Apriori定义

3.掌握

算法步骤

4.掌握频繁项集与关联规则1.Apriori算法简介

2.Apriori定义

3.算法步骤

4.频繁项集与关联规则用于发现隐藏在大型数据集中的有意义的联系,所发现的联系可用关联规则或频繁项集的形式表示。Apriori算法是常用于挖掘出数据关联规则的算法,能够发现事物数据库中频繁出现的数据集,这些联系构成的规则可帮助用户找出某些行为特征,以便进行企业决策。例如,某食品商店希望发现顾客的购买行为,通过购物篮分析得到大部分顾客会在一次购物中同时购买面包和牛奶,那么该商店便可以通过降价促销面包的同时提高面包和牛奶的销量。1.Apriori算法介绍支持度(support):support(A=>B)=P(A∪B),表示A和B同时出现的概率。置信度(confidence):confidence(A=>B)=support(A∪B)/support(A),表示A和B同时出现的概率占A出现概率的比值。频繁项集:在项集中频繁出现并满足最小支持度阈值的集合,例如{牛奶,面包}、{手机,手机壳}等。强关联规则:满足最小支持度和最小至此年度的关联规则。2.Apriori定义从记录中计算所有的候选1项集,并计算频繁1项集及支持度。由频繁1项集生成k项候选集,并由k项候选集计算k项频繁集。用k项频繁集生成所有关联规则,计算生成规则置信度,筛选符合最小置信度的关联规则。3.算法步骤对训练数据进行预处理(包括离散化、缺失值处理等)关联规则挖掘频繁项集挖掘关联规则生成规则处理对测试集进行测试3.算法步骤频繁模式和对应的关联或相关规则在一定程度上刻画了属性条件与类标号之间的有趣联。系,因此将关联规则挖掘用于分类也会产生比较好的效果。4.频繁项集与关联规则1.对Apriori算法进行了简介

2.介

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论