数据挖掘应用.ppt_第1页
数据挖掘应用.ppt_第2页
数据挖掘应用.ppt_第3页
数据挖掘应用.ppt_第4页
数据挖掘应用.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据挖掘的应用,1金融数据挖掘2零售业数据挖掘3电信业数据挖掘4生物学数据挖掘5入侵检测的数据挖掘,1.金融数据挖掘,1.1贷款偿还预测和顾客信用政策分析,与贷款偿还风险相关的因素包括贷款率、贷款期限、负债率、偿还收入比、顾客收入水平、受教育程度、居住地区和信用史。例如,分析顾客偿还史信息可以发现,偿还收入比是主要因素,而受教育程度和负债率则不是。于是银行可以据此调整贷款发放政策,将贷款发放给那些申请以前曾被拒绝,但根据关键因素分析,其基本信息表明风险相对较低的顾客。,1.2对目标市场客户的分类与聚类,分类与聚类的方法可用于用户群体的识别和定向销售。例如,通过多维聚类分析,可以将具有相同储蓄和贷款偿还行为的客户分为一组。识别客户组,将新客户归为到适合的客户组,推动目定向销售。,1.3洗黑钱和其它金融犯罪的侦破,首先把多个数据库的信息(如银行交易数据库,联邦或州的犯罪历史数据库等)集成起来。然后可以采用多种数据分析工具来找出异常模式,如某段时间内,通过某一组人,发生大量现金流量,等等。分析工具包括:数据可视化工具链接分析工具分类工具聚类分析工具孤立点分析工具序列模式分析工具,2.零售业数据挖掘,2.1销售,顾客,产品,时间,和地区的多维分析,影响销售相关因素:顾客的需求,产品的销售,趋势和时尚,以及日用品的质量,价格,利润,和服务的及时的信息。因此提供强有力的多维分析和可视化工具是十分重要的一件事情,这包括提供根据数据分析的需要构造复杂的数据立方体,有利于复杂条件的聚类分析。,2.2促销活动是否有效,多维分析通过比较促销期间与促销活动前后同一商品的销售量。关联分析可以找出哪些商品可能随降价商品一同购买,特别是与促销活动前后的销售相比。,2.3.顾客忠诚分析,序列模式挖掘例1,同一顾客在不同时期购买的商品可以分组为序列,用于分析顾客的消费或忠诚的变化,据此对价格和商品的品种加以调整,以便留住老客户,吸引新顾客。例2,通过序列模式的发现,客户在一周以来经常浏览关于某旅游地方面的资料,可以预测他有去该地的想法。这时可以把有关该旅游地最近的旅游活动和广告发送到客户的邮箱,以满足他对旅游信息的需求。,2.4.产品推荐和商品的交叉推荐,从销售记录中挖掘关联信息,可以发现购买笔记本电脑的顾客很可能购买其它一些商品。这类信息可用于产品推荐。,3.电信业中的数据挖掘,3.1.客户消费模式分析,对客户历年来通话记录详单数据以及档案资料等相关数据进行关联分析,从消费能力、消费习惯、消费周期等方面对客户的话费行为进行分析和预测,从而为运营商的相关经营决策提供依据。,3.2.客户市场推广分析,利用数据挖掘技术实现优惠策略的仿真,根据数据挖掘模型进行模拟计费和模拟出账,其仿真结果可以揭示优惠策略中存在的问题,并进行相应的调整优化,以达到优惠促销活动的收益最大化。,3.3.客户欠费分析和动态防欺诈,通过数据挖掘,总结各种骗费、欠费行为的内在规律,并建立一套欺诈和欠费行为的规则库。当客户的话费行为与该库中规则吻合时,系统可以提示运营商相关部门采取措施,从而降低运营商的损失风险。,3.4.客户流失分析,根据已有的客户流失数据,建立客户属性、服务属性、客户消费情况等数据与客户流失概率相关联的数学模型。然后根据此模型来监控客户流失的可能性,如果客户流失的可能性过高,则通过促销等手段来提高客户忠诚度,防止客户流失的发生。,4.生物学数据挖掘,4.1.DNA序列相似搜索和比对,为识别一个新发现的基因和一个已知基因家族之间的进化关系,确定他们的同源性或相似性,通常需要序列比对,找出它们之间的最大匹配,从而定量给出其相似程度。由于序列数据是非数字的,其内部不同种类核苷酸之间的精确交叉扮演着重要的角色。因此高效的搜索和比对算法在序列分析中非常重要。,4.2.基因组特征及同时出现的基因序列的分析,对于基因家族的成组序列来说,必须阐明多个序列之间的关系,才能揭示整个基因家族的特征。多序列比对在识别一组相关序列中有重要生物意义。利用关联规则、聚类分析有助于发现一组序列之间的差异以及相似性关系,以便对一个基因家族的特征有基本了解。另外在生物医学研究上,人们发现疾病的产生大多数是由多基因决定的,利用关联规则分析帮助确定在目标(疾病)样本中同时出现的基因种类。,4.3.路径分析:发现在不同阶段的致病因,引起一种疾病的基因不止一个,不同基因在疾病的不同阶段发挥作用。利用路径分析、演变分析等找到在不同阶段的致病遗传基因序列,可开发不同阶段的治疗药物,从而取得更有效的治疗效果。,4.4.生物数据可视化和可视的数据挖掘,由于生物数据的复杂性和高维性,可借助各种可视化工具以图、树、方体、链的形式展现其复杂结构和序列模式。常用的生物数据可视化工具有语义镜技术、信息壁技术、基因调控网格等。同时,将经过数据挖掘工具得到的数据结果也以图形、图像的形式展现给用户,便于用户寻找数据间规律和关系。,5.入侵检测的数据挖掘,入侵检测技术,对系统的运行状态进行监视,发现各种攻击企图、攻击行为或者攻击结果,以保证系统资源的机密性、完整性与可用性。入侵检测系统分为两类误用检测和异常检测。误用检测。它是根据已知的攻击行为建立一个特征库,然后去匹配已发生的动作,如果一致则表明它是一个入侵行为。异常检测。它是建立一个正常的特征库,根据使用者的行为或资源使用状况来判断是否入侵。,1.借助关联和聚类选择和建立判别属性,可以使用关联和相关挖掘发现描述网络数据的系统属性之间的联系。这样的信息有助于为入侵检测选择有用的属性。例1,通过关联规则建立正常的行为模式,然后通过模式比较算法来区别正常行为和入侵行为。例2,聚类分析的基本思想主要源于入侵与正常模式上的不同及正常行为数目应远大于入侵行为数目的条件,因此能够将数据集划分为不同的类别,由此分辨出正常和异常行为来检测入侵。,2.流数据分析,由于入侵和恶意攻击的瞬时性和动态性,在流数据环境中进行入侵检测是非常关键的。此外,一个事件自身是正常的,但是如果看做事件序列的一部分,则被认为是恶意的,因此,有必要研究什么样的事件序列频繁的遇到,发现频繁模式并识别离群点。,3.分布式数据挖掘,入侵可以从多个不同位置发动并指向许多不同目标。可以使用分布式数据挖掘方法,从多个网络位置分析网络数据,以便检测这种分布式攻击。,数据挖掘发展趋势,1.生物数据挖掘2.分布式数据挖掘3.实时数据挖掘4.图挖掘、连接分析和社会网络分析5.多关系和多数据库数据挖掘,1.生物数据挖掘,研究领域:DNA和蛋白质序列高维微阵列数据生物路径和网络分析异构生物数据的连接分析,2.分布式数据挖掘,传统的数据挖掘方法是既重视的,在当今很多分布式计算环境下不能很好的工作,因此分布式数据挖掘方法能有新进展。,3.实时数据挖掘,一下领域需要建立动态数据挖掘模型:电子商务、Web挖掘、股票分析、入侵检测、移动数据挖掘和反恐数据挖掘。,4.图挖掘、连接分析和社会网络分析,例如,化学化合物和生物网络、隐藏罪犯网络分析的数据集的序列、拓扑、几何和其他联系特征需要用到图挖掘连接分析和社会网络分析,,4.图数据挖

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论