关联分析及案例应用_第1页
关联分析及案例应用_第2页
关联分析及案例应用_第3页
关联分析及案例应用_第4页
关联分析及案例应用_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关联分析及案例应用-[数据挖掘]-07-28版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明简朴谈谈关联分析准备分3个部分来介绍:第一部分

关联分析(association)介绍及模型实现核心点第二部分

关联分析在clementine中的具体案例实现第三部分

时序分析在clementine中的具体案例实现今天先谈谈第一部分1、

关联分析是一种无监督机器学习办法,用来发掘经常一起发生的事情。在公司营销中重要应用于产品搭配销售cross-selling。分析:买了a(和b)的人还买了c

即特性1和特性2发生,特性3随着发生时序分析

买了a的人,然后再买了b,最后又买了c两者区别:关联分析,一次购物,买了什么会买什么。时序分析,这次购物,下次会买什么。(零售、流程改善、网络日志分析)2、

在clementin中的数据格式:apriori能够接受2中排列方式,但只接受名义字段,且字段在方向设定时必须为both。GRI和CARMA只能接受第一种排列方式3、有关阀值的设定:支持度和置信度,定多少才适宜?没有最适宜,固然是这两个值越高出来的规则越有说服力,但这样的规则往往很难得到。因此我个人认为只要符合业务需求且合理,都能够进行布署。建议将支持度和置信度从低往高不停调节,查看规则的变化状况。举个简朴的例子,某条规则置信度为90%,规提高水平为2,而支持度只有1%,原始数据量有1000万。请问,这条规则与否故意义?我们能够看到这条规则的规模有10万,且有较高的置信水平,因此它的实际布署能力还是比较强的。4、再说说提高水平lift这个参数。假定设定规则的最小阀值为支持度30%,置信度为60%,然后你得到了诸多的强关联规则。例如有这样一条,总数据10000个,A商品6000个,B商品7500个,然后同时购置A和B的4000个。我们发现A-B(即购置了a的同时购置b)这条规则也是一条强关联规则。支持度为=4000/1000o=40%,置信度=4000/6000=66.7%.但是我们发现原总数据集中,购置b产品的比例有75%,要不不大于66.%,即购置a产品会对购置b产品产生反向作用,即负有关。因此才有了lift这样一种参数,来弥补支持度和置信度在解释规则方面的局限性:Lift=

P(AUB)

/

P(A)P(B)

当lift=1时,A、B互相独立当lift<1时,A、B负有关当Lift>1时,A、B正有关

即A/B中一种的出现,都提高了另外一种出现的可能性。关联分析在clementine中的具体案例实现-[数据挖掘]-08-09版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明接着上篇文章

第一部分

关联分析(association)介绍及模型实现核心点今天来谈谈第二部分

关联分析在clementine中的具体案例实现基础数据准备:在clementine中,进行关联分析,为了能够尝试多个算法,这里我采用第一种模型输入数据,建模前需先将数据整顿成以下格式2个字段:客户编号和产品编号(一种客户编号可能有多条产品统计)环节以下:1、原始数据格式2、然后将产品字段转换成名义字段即集字段,clementine里面一种字段选项按钮,导出按钮,其作用是基于现有字段生成新字段3、根据集字段生成新的产品字段,作用就是生成将数据转换成关联分析规定的数据格式生成的格式以下:每一行数据表达没一种顾客购置了哪些产品,1表达购置,0表达没有5、字段输入方向选择为both:6、整个建模过程以下:这里我选择的是GRI算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论