推荐系统综合案例介绍_第1页
推荐系统综合案例介绍_第2页
推荐系统综合案例介绍_第3页
推荐系统综合案例介绍_第4页
推荐系统综合案例介绍_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、推荐系统综合案例介绍技术创新,变革未来智慧IT目 录010203概述模型介绍代码详解实验结果04推荐算法中的一些问题:协同过滤无法解决冷启动问题基于内容的推荐无法利用协同过滤信息如何建模用户的上下文信息(地理位置、时间、天气)没有某种算法能够完全解决问题, 多重算法+交互设计才能解决特定场景的需求1. 概述学术界工业界数据量多种规模的数据集供选择数据量巨大数据种类用户、物品、知识图谱、图片用户、物品、日志、广告商、设备、算法种类单模型多模型算法效率一般不追求要求能够迅速的给出结果性能尽可能对单模型优化追求最终上线结果1. 概述工业界常用的推荐算法流程Item1Item2Item3原始物品集生成

2、候选集排序物品、用户特征过滤1. 概述目 录010203概述模型介绍代码详解实验结果04MF(Matrix factorization)模型矩阵分解是指将一个矩阵分解成两个或者多个矩阵的乘积。在推荐系统中则是将评分矩阵分解为用户矩阵和物品矩阵的成绩。然后再用分解后的矩阵补全原始评分矩阵。2. 模型介绍FISM(FISM-Factored Item Similarity Methods)模型在矩阵分解的基础上,人们提出里基于物品相似度的推荐算法。但这种算法需要维护一个大矩阵在物品数量庞大时无法使用。FISM算法的思想是将相似度矩阵进行分解,用两个小矩阵来代替原有的大矩阵。2. 模型介绍LR(Lo

3、gistic regression)模型LR是一种二分类模型,可以用于预估某种事件的可能性,如用户是否点击广告、购买商品等等。由于算法实现简单、复杂度低且具有较高的分类精确度,在工业界的大规模数据场景中国非常常见。2. 模型介绍GBDT(Gradient Boosting Decision Tree)模型是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的输出累加起来做最终结果。基分类器采用cart回归树,每次迭代生成一个新的cart树用于拟合残差。由于其算法效率高,不需要大量的特征工程就能有较好的效果,且具有很强的泛化能力,在工业界中也非常常见。2. 模型介绍目 录010203概述模型介绍代码详解实验结果04模型接受的参数分别设置第一阶段和第二阶段使用的算法3. 代码详解初始化第一阶段的模型3. 代码详解初始化第二阶段的模型3. 代码详解目 录010203概述模型介绍代码详解实验结果04FISMMFLR0.0090.0106GBDT0.02220.0434由表格可以看出,GBDT是优于LR的,优于GBDT能够更好的利用用户即物品的特征,且不需要特征工程就能捕捉特征间的非线性关系,故而效果比较好。但是可能由于训练不充分或者数据集的原因,FISM的效果比MF的效果略差。从表格中可以看出,在具体的推荐过程中,第一阶段的预筛选和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论