![关联分析及案例应用_第1页](http://file4.renrendoc.com/view/dc351093e86ba4147083a79a36ffbc75/dc351093e86ba4147083a79a36ffbc751.gif)
![关联分析及案例应用_第2页](http://file4.renrendoc.com/view/dc351093e86ba4147083a79a36ffbc75/dc351093e86ba4147083a79a36ffbc752.gif)
![关联分析及案例应用_第3页](http://file4.renrendoc.com/view/dc351093e86ba4147083a79a36ffbc75/dc351093e86ba4147083a79a36ffbc753.gif)
![关联分析及案例应用_第4页](http://file4.renrendoc.com/view/dc351093e86ba4147083a79a36ffbc75/dc351093e86ba4147083a79a36ffbc754.gif)
![关联分析及案例应用_第5页](http://file4.renrendoc.com/view/dc351093e86ba4147083a79a36ffbc75/dc351093e86ba4147083a79a36ffbc755.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关联分析及案例应用-[数据挖掘]-07-28版权申明:转载时请以超链接形式标明文章原始出处和作者信息及本申明简朴谈谈关联分析准备分3个部分来简介:第一部分
关联分析(association)简介及模型实现要点第二部分
关联分析在clementine中的详细案例实现第三部分
时序分析在clementine中的详细案例实现今天先谈谈第一部分1、
关联分析是一种无监督机器学习措施,用来发掘常常一起发生的事情。在企业营销中重要应用于产品搭配销售cross-selling。分析:买了a(和b)的人还买了c
即特性1和特性2发生,特性3伴随发生时序分析
买了a的人,然后再买了b,最终又买了c两者区别:关联分析,一次购物,买了什么会买什么。时序分析,这次购物,下次会买什么。(零售、流程改善、网络日志分析)2、
在clementin中的数据格式:apriori可以接受2中排列方式,但只接受名义字段,且字段在方向设定期必须为both。GRI和CARMA只能接受第一种排列方式3、有关阀值的设定:支持度和置信度,定多少才合适?没有最合适,当然是这两个值越高出来的规则越有说服力,但这样的规则往往很难得到。因此我个人认为只要符合业务需求且合理,都可以进行布署。提议将支持度和置信度从低往高不停调整,查看规则的变化状况。举个简朴的例子,某条规则置信度为90%,规提高水平为2,而支持度只有1%,原始数据量有1000万。请问,这条规则与否故意义?我们可以看到这条规则的规模有10万,且有较高的置信水平,因此它的实际布署能力还是比较强的。4、再说说提高水平lift这个参数。假定设定规则的最小阀值为支持度30%,置信度为60%,然后你得到了诸多的强关联规则。例如有这样一条,总数据10000个,A商品6000个,B商品7500个,然后同步购置A和B的4000个。我们发现A-B(即购置了a的同步购置b)这条规则也是一条强关联规则。支持度为=4000/1000o=40%,置信度=4000/6000=66.7%.不过我们发现原总数据集中,购置b产品的比例有75%,要不小于66.%,即购置a产品会对购置b产品产生反向作用,即负有关。因此才有了lift这样一种参数,来弥补支持度和置信度在解释规则方面的局限性:Lift=
P(AUB)
/
P(A)P(B)
当lift=1时,A、B互相独立当lift<1时,A、B负有关当Lift>1时,A、B正有关
即A/B中一种的出现,都提高了此外一种出现的也许性。关联分析在clementine中的详细案例实现-[数据挖掘]-08-09版权申明:转载时请以超链接形式标明文章原始出处和作者信息及本申明接着上篇文章
第一部分
关联分析(association)简介及模型实现要点今天来谈谈第二部分
关联分析在clementine中的详细案例实现基础数据准备:在clementine中,进行关联分析,为了可以尝试多种算法,这里我采用第一种模型输入数据,建模前需先将数据整顿成如下格式2个字段:客户编号和产品编号(一种客户编号也许有多条产品记录)环节如下:1、原始数据格式2、然后将产品字段转换成名义字段即集字段,clementine里面一种字段选项按钮,导出按钮,其作用是基于既有字段生成新字段3、根据集字段生成新的产品字段,作用就是生成将数据转换成关联分析规定的数据格式生成的格式如下:每一行数据表达没一种顾客购置了哪些产品,1表达购置,0表达没有5、字段输入方向选择为both:6、整个建模过程如下:这里我选择的是GRI算法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智研咨询-电机行业市场调查、产业链全景及市场需求规模预测报告(2025版)
- 2025年01月中国贸促会直属单位公开招聘笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 体格检查课件
- 人类的生殖系统课件
- Unit+3+Weather+Part+B 人教PEP版英语四年级下册
- Unit 1 Keeping Healthy Lesson 1【知识精研】五年级英语下学期同步备课(人教新起点版)
- Recycle Mike's happy days Day 7 Day 8 【知识精研】人教PEP版英语六年级下册
- 生活在大自然的怀抱里课件
- 6.1法律保护下的婚姻 课件 【知识精研】高中政治统编版选择性必修二法律与生活
- 合理安排文章结构课件
- 员工培训、考试、积分记录表
- 风冷热泵主机改造-模块机汇总
- 摄影摄像技术专业申请表
- 牡丹区中心医院食源性疾病监测培训课件
- 职业卫生工程控制技术课件
- 六年级下册综合实践活动教案(II)
- 高中英语常用词汇表(动词、名词、形容词和副词)
- 16万吨_年液化气综合利用装置废酸环保综合利用项目环境报告书
- T∕CAEPI 43-2022 电絮凝法污水处理技术规程
- 品牌简单之道讲义
- 水转印检验规范(吉利)
评论
0/150
提交评论