![基于案例学习数据挖掘-第12周_第1页](http://file4.renrendoc.com/view/6cabec774f5a48b4ff69a0ce65d04013/6cabec774f5a48b4ff69a0ce65d040131.gif)
![基于案例学习数据挖掘-第12周_第2页](http://file4.renrendoc.com/view/6cabec774f5a48b4ff69a0ce65d04013/6cabec774f5a48b4ff69a0ce65d040132.gif)
![基于案例学习数据挖掘-第12周_第3页](http://file4.renrendoc.com/view/6cabec774f5a48b4ff69a0ce65d04013/6cabec774f5a48b4ff69a0ce65d040133.gif)
![基于案例学习数据挖掘-第12周_第4页](http://file4.renrendoc.com/view/6cabec774f5a48b4ff69a0ce65d04013/6cabec774f5a48b4ff69a0ce65d040134.gif)
![基于案例学习数据挖掘-第12周_第5页](http://file4.renrendoc.com/view/6cabec774f5a48b4ff69a0ce65d04013/6cabec774f5a48b4ff69a0ce65d040135.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于案例学习数据挖基于案例学习数据挖掘 第十二【】【】GGM(炼数成金),组看的培训GGM(炼数成金),组看的培训实质:分类算法实际上是根属性来计和类别的从属过程:对于实质:分类算法实际上是根属性来计和类别的从属过程:对于这个优秀的算法来讲,其实它的任务从来都是进行概率的分配,例如针对三个类的分类任务,那么算法的主要任务就是将每属于类别的可能性以概率形来使用来,对于分类算法的使用率可谓是十分低下 每一个分类算法都精准地将概率分配计算只利用了一个阈值来确定类别归 分类算法浅谈(一已知概可以假设有这样一个执行过分已知概可以假设有这样一个执行过分类任务的数据集,即每都被赋予了类别归属为 的方法来自定
2、义:对于拥有大量数据的销售项目可以有另外的使用方置信度为 该如 个置信度为 分类算法浅谈(二前提:算法计算后,每的置信度都在【 】区间,那么为了最大化利用这个“得之不易的结果其实可以自定前提:算法计算后,每的置信度都在【 】区间,那么为了最大化利用这个“得之不易的结果其实可以自定义分分级代替分类:事实上,有时不仅需要知道用户决定,还需要知道用愿的强烈程度,很明显,置信度是可以代意愿自定义:可以根据实际需要对用户进行分级,例如按照置信度分为等距的 级用户置信区组 【 【 【 【 【 分类算法浅谈(三【 【 【 【 【 解释没有办法认为置信度为 的客户和置信度为 的客户对是解释没有办法认为置信度为
3、 的客户和置信度为 的客户对是同样重要的方便检验:在6中已经提到在普通的阈值下,置信度为 左右的用户被误判的可能性大,所以按照分组来“整体观察”的话,会减少不必要的思考时示例分级检验(非真实数据分级的意级别区用户实实比【 【 【 【 【 【 【 【 【 【 向:即最强的客户开,这样向:即最强的客户开,这样可以做到效率最大图:横轴客户量占比,纵轴客户量占分级指 图 】一个假设:假有每个用的置信度(注意,这个和实行为不同用户 置信 如何计算置信指标标准化:之前提过,标准化支持自定义模式,即按照需求进行标准化指标KPI:这样每个指标(即指标标准化:之前提过,标准化支持自定义模式,即按照需求进行标准化
4、指标KPI:这样每个指标(即维度)都可以理解成16/,反映用户的关键指 用户置信 用户评价体与属性:属性是描较为相的,所以如果两的每个属性都很接近可以认为两户与属性:属性是描较为相的,所以如果两的每个属性都很接近可以认为两户以类聚:如能够把满足如下条件都划分到一起,人工在一起,那么优有两个,首先,可以看到人共划分组的规模大小,即一般的客户集中在那些区域;其次,可观察这些相组成的整体,整体的表现如)()用户分用户将 和 这样在一起,观察群属性,对于研究用户行为的意义是十分的,这其中有一个明显怎么提取群体特征:按照之前的步这些组呢可以将怎么提取群体特征:按照之前的步这些组呢可以将所有用户分成若干个
5、组,那如何来描述已有用户代表(虚拟用户):给出几个参考概念,4平均先生()、各科平均分等概用户代率 用户 用户 *E *E *E GES GES ES组 算学生成绩每 这个操作让群体用户数据量4变成了一条用户组的用户量:不同的4在一定程度代表用户组的用户量:不同的4在一定程度代表了两件事,首先是这个群组的规掉的,一般4$ 为约束条件(所以精准用户组用户*平平均 率让4比较率- - (- (有效群组和代线性回归:在这个模型之需要两个假第一:组内客线性回归:在这个模型之需要两个假第一:组内客户特征相同(实际上为相近,并非相同第二:4足够大率可以认为是该组用户代的置如果以上两个概念你理解,那么这个分
6、析过程几乎会在逻辑上贯穿始终率(66)为2GHKR变量,其他变量为常规变量,数最后的公式自然是66#2 2 + 4其中24为模型结果对应的系就直接记住24可以在*3十分简单的模用户评用户评评价如何理解:置信度即在这一次的挖掘下该用商品可能性的一个度量,注意,信度不等同于概率的含评价如何使用:尽管如此, 仍然 成用户的 概率这一概念,但注意的是这是一个群体概念,因为对于个人来讲, 的行为只可能为 和 ,不存在中间的情况, 这里给不能简地认为置信用户 的用户定,而置信度为 则意味着 名这的期望为 人 用户评初始客户分等级(对比6 概率的一点处理这里用到的是线性回归,所以在应用模型后,难免会初始客户
7、分等级(对比6 概率的一点处理这里用到的是线性回归,所以在应用模型后,难免会有一小部分用户概率会在【 】之外采取就近原则来处理,替换为或客户分等级: 等级制,在下面的表格中可以看的 等级制是如何划分 等级制是一个参考,为和管理分组,如果实际方掘项目用户量与此差别较大,可采取别的标准能计算概率续的,支持一切自定义用户等KES( ,0( ( ( 如何来验证值来进行比根据每个用户率来计算一个群组期望(概率相加),期望值和真如何评价:要结合群组内的用户误差来综合评价准确度,实践证明,该方法准确度十分理数客户比用户占比用户占比结合向验证两条的可 如何来验证值来进行比根据每个用户率来计算一个群组期望(概率相加),期望值和真如何评价:要结合群组内的用户误差来综合评价准确度,实践证明,该方法准确度十分理数客户比用户
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电子产品物流合同要点分析
- 2025年度办公室绿植养护与室内环境美化合同
- 房屋租赁合同公文
- 企业人才测评及职业发展规划支持方案设计
- 云计算服务配置与管理手册
- 解决方案设计与实施指南
- 设计服务合同书
- 企业信息化解决方案操作手册
- 建设工程施工分包委托协议书
- 车床购买合同样本
- 寒假生活回顾分享小学主题班会 课件
- 湖南省长沙市2024-2025学年高一数学上学期期末考试试卷
- 2024-2025学年上外版高二上学期期中英语试卷与参考答案
- 抓住人工智能科学机遇 A new golden age of discovery Seizing the AI for Science opportunity 2024
- 松材线虫调查培训
- 方志敏《可爱的中国》全文阅读
- DB52T 1167-2017 含笑属栽培技术规程 乐昌含笑
- 2024年广西区公务员录用考试《行测》真题及答案解析
- 2025年全国高考体育单招考试政治模拟试卷试题(含答案详解)
- 助理医师医院协议书(2篇)
- 驾驶证学法减分(学法免分)试题和答案(50题完整版)1650
评论
0/150
提交评论