5.3数据的分析教学课件_第1页
5.3数据的分析教学课件_第2页
5.3数据的分析教学课件_第3页
5.3数据的分析教学课件_第4页
5.3数据的分析教学课件_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

粤教版必修一5.3数据的分析第五章第三节如果旅游服务平台希望通过了解用户的旅游喜好和旅游习惯,来增加平台的订单量。哪些信息?平台了解用户喜好和习惯,预测用户购买行为。诊断过去,预测未来!数据清洗数据分析前,需要对数据进行预处理——数据清洗,发现缺失数据、重复数据、异常数据等。活动一:数据清洗任务1:对数据进行清洗,删除缺失值、重复行和无效的异常数据。运行“数据清洗.py”对“travel.csv”数据表进行处理。读取处理保存活动一:数据清洗任务2:使用python对“出行工具”进行统计,并绘制统计图。运行“特征探索.py”对“travel_new.csv”中的“出行工具”进行统计。1--自驾游2--高铁3--汽车4--普通火车5--飞机6--其他活动一:数据清洗思考:分析得到的这些数据对你的出行规划有什么指导意义?关联分析

聚类分析

数据分类关联分析关联分析——对大量数据进行分析,

企图发现数据之间的关联性和相关性。关联分析订单编号商品1商品2商品3商品4商品5商品61啤酒面包2牛奶苹果薯片3苹果香蕉薯片4啤酒牛奶面包香蕉5苹果香蕉牛奶面包6苹果薯片面包7啤酒

苹果香蕉面包牛奶奶酪8薯片牛奶奶酪面包9香蕉奶酪薯片10牛奶薯片啤酒香蕉支持度越高,说明购买这个组合的顾客越多。它们可能适合“捆绑销售”。

(牛奶-面包)出现的次数总的记录数关联分析订单编号商品1商品2商品3商品4商品5商品61啤酒面包2牛奶苹果薯片3苹果香蕉薯片4啤酒牛奶面包香蕉5苹果香蕉牛奶面包6苹果薯片面包7啤酒

苹果香蕉面包牛奶奶酪8薯片牛奶奶酪面包9香蕉奶酪薯片10牛奶薯片啤酒香蕉置信度越大表明了,顾客购买了牛奶,再购买面包的可能性就越大。缺点:如果面包很受欢迎,那么包含了牛奶的订单中出现面包的几率自然就高。

(牛奶-面包)出现的次数(牛奶)出现的次数订单编号商品1商品2商品3商品4商品5商品61啤酒面包2牛奶苹果薯片3苹果香蕉薯片4啤酒牛奶面包香蕉5苹果香蕉牛奶面包6苹果薯片面包7啤酒

苹果香蕉面包牛奶奶酪8薯片牛奶奶酪面包9香蕉奶酪薯片10牛奶薯片啤酒香蕉

(牛奶-面包)的置信度(面包)的支持度关联分析若提升度>1,顾客购买了牛奶,有较大概率会购买面包;若提升度=1,顾客购买牛奶与购买面包之间无关联性;若提升度<1,顾客购买了牛奶,不太可能购买面包。在含牛奶的订单中面包出现的概率面包单独出现的概率活动二:关联分析运行“关联分析.py”程序,体验使用python程序对“order.xls”中的数据进行关联分析。Apriori算法是第一个关联规则挖掘算法。读取数据预处理关联分析活动二:关联分析思考:如果你是超市老板,根据数据分析的结果,你会采取什么销售策略?活动二:关联分析商业领域社会民生文娱体育气象关联分析交通事故成因分析……影视演员组合球员最优组合……购物篮分析穿衣搭配推荐……金融行业银行客户交叉销售分析银行营销方案推荐……各领域的应用聚类分析通过对大量数据进行分析,根据数据特征,将数据对象分组。聚类的目标是,组内相似,组间差异。“物以类聚”购买次数购买金额聚类分析——K平均算法32475681聚类分析—K平均算法(以k=2为例,将数据分成两类)32475681step1:随机选取2个点作为质心。聚类分析——K平均算法32475681step2:计算其他点到质心的距离,根据距离划分为2个簇。聚类分析——K平均算法32475681step3:分别计算2个簇样本的平均值作为新的质心。聚类分析——K平均算法32475681step4:重复步骤2、3,直至聚类完成。活动三:聚类分析运行“聚类分析.py”程序,体验使用python程序对某零售商店顾客的消费情况(“customer_data.csv”)进行聚类分析。活动三:聚类分析思考:根据聚类分析形成的可视化图表,你能否提出一些提高销售额的建议?数据分类我们可以使用数据分类中的“贝叶斯定理”,帮助人们对数据进行分类,作出决策。课后请小组内:1、学习微课——“贝叶斯概率与数据分类”,了解贝叶斯分类在各领域中的应用。2、运行调试程序——“数据分类.py”,了解垃圾邮件和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论