北大版客户关系管理第十章数据挖掘资料_第1页
北大版客户关系管理第十章数据挖掘资料_第2页
北大版客户关系管理第十章数据挖掘资料_第3页
北大版客户关系管理第十章数据挖掘资料_第4页
北大版客户关系管理第十章数据挖掘资料_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第10章 数据挖掘湖北工程学院经济(jngj)与管理学院北京大学出版社客户关系管理(gunl)课件2022/7/171共二十八页第10章 数据挖掘学习(xux)目标: (1)掌握数据挖掘的概念和分类 (2)数据挖掘的功能 (3)熟悉电子商务CRM中数据挖掘的主要算法 (4)熟悉电子商务CRM中数据挖掘的主要流程 (5)理解和掌握数据挖掘在CRM中的应用2022/7/172共二十八页啤酒(pji)与尿布的故事 2022/7/173共二十八页101数据挖掘的概念(ginin) 数据挖掘(Data Mining),又称数据库中的知识发现(Knowledge Discovery in Database

2、, KDD),是指从大型(dxng)数据库或数据仓库中的大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式。 2022/7/174共二十八页2022/7/175共二十八页【中国移动互联网10大族群】移动互联网从一诞生就不是个需求聚焦和“大众化”工具,而是一个(y )充满个性化需求,进而有着鲜明“族群化”特性的新世界。族群分类1)折扣族;2)搜族;3)手游族;4)拍客;5)理财族;6)IM族;7)App达人;8)手机签到;9)手机购物;10)手机社交。2022/7/176共二十八页2022/7/177共二十八页文本(wnbn)数据挖掘 网络(

3、wnglu)数据挖掘 生物信息或基因数据挖掘 根据信息存储格式,用于挖掘的对象有关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库、空间数据库、时态数据库、异质数据库以及Internet等。因此数据挖掘也就因此被分为了数据仓库挖掘,文本数据挖掘,web挖掘以及生物信息或基因的数据挖掘等一系列的种类。102数据挖掘的分类数据仓库挖掘 2022/7/178共二十八页103数据挖掘的功能(gngnng) 关联(gunlin)分析(association rules) 聚类(clustering)分析 偏差分析(deviation) 预测(predication) 序列模式(time-se

4、riespattern)分析 优势分类(classification)分析 估值(Estimation) 2022/7/179共二十八页关联(gunlin)分析关联分析,即利用关联规则进行数据挖掘。关联分析的目的是挖掘隐藏在数据间的相互关系。在超市中通过POS系统收集存储了大量售货数据,记录了什么样的顾客(gk)在怎样的时间购买了什么商品,通过关联分析可以发现数据库中“90%的顾客(gk)在一次购买活动中购买商品A的同时购买商品B” 之类的知识。2022/7/1710共二十八页关联规则发掘技术(jsh)在国内外的应用 目前,关联规则挖掘技术已经被广泛应用在西方金融行业企业中,它可以成功(chn

5、ggng)预测银行客户需求。一旦获得了这些信息,银行就可以改善自身营销。银行天天都在开发新的沟通客户的方法。2022/7/1711共二十八页各银行在自己的ATM机上就捆绑了顾客可能感兴趣的本行产品信息,供使用本行ATM机的用户了解。如果数据库中显示,某个高信用限额的客户更换了地址(dzh),这个客户很有可能新近购买了一栋更大的住宅,因此会有可能需要更高信用限额,更高端的新信用卡,或者需要一个住房改善贷款,这些产品都可以通过信用卡账单邮寄给客户。2022/7/1712共二十八页关联规则发掘(fju)技术在国内外的应用电子购物网站使用关联规则进行挖掘,然后设置用户有意要一起购买的捆绑(knbng)

6、包。也有一些购物网站使用它们设置相应的交叉销售,也就是购买某种商品的顾客会看到相关的另外一种商品的广告。 2022/7/1713共二十八页但是目前在我国,“数据海量,信息(xnx)缺乏”是商业银行在数据大集中之后普遍所面对的尴尬。目前金融业实施的大多数数据库只能实现数据的录入、查询、统计等较低层次的功能,却无法发现数据中存在的各种有用的信息。2022/7/1714共二十八页聚类分析聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同(b tn)类中的数据相异。聚类分析输入的是一组未分类记录,并且事先不知道这些记录应分成几类,通过分析数据库中的记录数据,根据一定的分类规则,合理地划

7、分记录集合,确定每个记录所在类别。它所采用的分类规则是由聚类分析工具决定的。采用不同的聚类方法,对于相同的记录集合可能有不同的划分结果。 2022/7/1715共二十八页序列(xli)分析时序模式是指通过时间序列搜索出的重复发生概率较高的模式。与回归一样,它也是用己知的数据预测未来的值,但这些(zhxi)数据的区别是变量所处时间的不同。它能发现数据库中形如“在某一段时间内,顾客购买商品A,接着购买商品B,而后购买商品C,即序列A-B-C出现的频度较高”之类的知识。2022/7/1716共二十八页序列(xli)分析利用序列模式分析这些按时间排列的数据记录,零售商可以发现客户潜在的购物模式,如客户

8、在购买房屋后,往往(wngwng)在一段时间后会购买家具或装修材料。这类发现可以提示那些直接销售的公司针对性地向某些客户寄发产品目录。如果将序列模式分析用于股市分析,则可能发现:在5个交易日中,如果X股涨幅在10%内,Y股涨幅在10%到20%之间,那么Z股下周上涨的可能性大约为60%。 2022/7/1717共二十八页如果超市中客户(k h)在购买A的同时,经常会购买B,即是应用了关联规则;如果客户在购买A后,隔一段时间,会购买B ,则是作的序列分析。 2022/7/1718共二十八页分类(fn li)分析分类分析就是通过分析数据,找出代表了一类数据的整体信息,为每个类别做出准确的描述,并用这

9、种描述来构造模型或挖掘出分类规则(guz),然后用这个分类规则(guz)对其它数据库中的记录进行分类。分类是利用训练数据集通过一定的算法而求得分类规则(guz)。分类可被用于规则描述和预测。例如:公司按照产品售价的高低,将客户分为高层,中产,大众等三个层次。2022/7/1719共二十八页预测(yc)预测是利用历史数据找出变化规律,建立(jinl)模型,并由此模型对未来数据的种类及特征进行预测。 2022/7/1720共二十八页104电子商务CRM中数据挖掘的主要(zhyo)算法1、神经网络方法 神经网络是建立在可以自学习的数学模型基础之上的,在结构上模仿生物神经网络,是一类(y li)非线性

10、的、通过训练达到学习目的的预测模型。2022/7/1721共二十八页2、决策树法 决策树是一种常用于预测模型的算法,它通过将大量数据有目的分类,从中找到一些有价值的,潜在的信息。决策树提供了一种展示(zhnsh)类似在什么条件下会得到什么值这类规则的方法。它的主要优点是描述简单,分类速度快,特别适合大规模的数据处理。2022/7/1722共二十八页3、遗传算法(Genetic Algorithm) 遗传算法是一类借鉴生物界的进化规律,即适者生存,优胜劣汰遗传机制而提出的随机化搜索方法。遗传算法最早起源于对人们生物系统进行的计算机模拟研究。遗传算法具有强大的全局最优解搜索能力,能处理数据库中各种

11、不同属性间的相互关系,遗传算法被广泛(gungfn)用于数据库领域,实践证明利用遗传算法进行数据挖掘是可靠的,可以得到数据库中具有较强预测能力的规则。遗传算法常用于分类规则和关联规则的挖掘。 2022/7/1723共二十八页4、统计分析方法 在数据库字段项之间存在两种关系:函数关系和相关关系,对它们的分析可采用统计学方法,即利用统计学原理对数据库中的信息进行分析。可进行常用统计(求大量数据中的最大值、最小值、总和、平均值等)、回归分析(用回归方程来表示变量间的数量关系)、相关分析(用相关系数来度量变量间的相关程度)、差异(chy)分析(从样本统计量的值得出差异来确定总体参数之间是否存在差异)等

12、。2022/7/1724共二十八页105电子商务(din z shn w)CRM中数据挖掘的主要流程1、定义问题2、数据准备3、数据挖掘4、结果分析5、知识(zh shi)的运用2022/7/1725共二十八页106数据挖掘在CRM中的应用(yngyng) 数据挖掘所能解决的典型商业问题包括:数据库营销(Database Marketing)、客户群体划分(hu fn)(Customer Segmentation & Classification)、背景分析(Profile Analysis)、交叉销售(Cross-selling)等市场分析行为,以及客户流失性分析(Churn Analysis)、客户信用记分(Credit Scoring)、欺诈发现(Fraud Detection)等。2022/7/1726共二十八页非你莫属20120101,0924, 10292022/7/1727共二十八页内容摘要第10章 数据挖掘。2022/1/20。【中国移动互联网10大族群】移动互联网从一诞生就不是个需求聚焦和“大众化”工具,而是一个充满个性化需求,进而有着鲜明“族群化”特性的新世界。关联分析,即利用关联规则进行数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论