基于用户的协同过滤算法的推荐系统介绍ppt课件_第1页
基于用户的协同过滤算法的推荐系统介绍ppt课件_第2页
基于用户的协同过滤算法的推荐系统介绍ppt课件_第3页
基于用户的协同过滤算法的推荐系统介绍ppt课件_第4页
基于用户的协同过滤算法的推荐系统介绍ppt课件_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 推荐系统介绍 基于用户的协同过滤算法的 电影推荐系统 成员:塔娜 郭静 戈文豹-目录一. 推荐系统研究背景二. 个性化推荐技术三. 基于用户的协同过滤推荐算法四. 电影推荐系统五. 电影推荐系统实现构想-1. 推荐系统研究背景 近年来,社会信息趋向于数字化、网络化,通过各种互联网络联系起来的人越来越多,互联网网民日益增加。互联网上的信息源越來越丰富,包括电子邮件、Web数据、客户项目等信息,这些信息构成了社会网络。我国的互联网用户数也与日俱增,已发展到一个很客观的数字。 截止至2011年底,全球博客(blog)数量已经达1.81亿。 在国内,拥有博客(或个人空间)的网民比例达42.3%,用户

2、规模达1.07亿,其 中活跃用户数超过7000万人。 腾讯QQ的活跃账户数量达到3亿,同时在线人数达到3000万。 中国网站总数为230万个。 可见,在如今这个高速发展的信息时代,人们的生活与五联网的关系越来越紧密,互联网己经成为人们获取信息的一个重要途径。- 互联网信息的日益庞大与大量用户的需求形成了巨大矛盾。人们需要花费大量的时间去搜索和选择各自所需的项目。因此,各种知名的搜索引擎已经成为人们寻找项目的必备工具,如Google、Yahoo、Soso、Baidu、Sogou等。当用户搜索信息是,搜索引擎就在数据库中搜索,找到相应的网站,按一定顺序反馈给读者。显然,搜索引擎是一种“一对多”的工

3、具,它只能区分不同的搜索语句,忽略了重要的用户信息,对不同的用户不会推荐不同的项目。 个性化推荐服务就是针对此类问题提出来的,根据不同用户的行为、信息、习惯、喜好等特点,提供各自不司的服务。 目前,各大型纯商务网站,例如Dangdang、Amazon、Taobao、Tmall等,都不同程度地使用了推荐系统,用以向用户推荐商品,提高经济效益。-2.个性化推荐技术 个性化推荐系统的使用对象是用户,推荐对象是项目(Item),比如音乐、电影、商品等。根据推荐对象的特点,可以将目前的推荐系统分为两类: (1)以网页为推荐对象的系统。这类推荐系统主要采用web数据挖掘的理论和技术来分析用户的行为习惯、兴

4、趣爱好等特点,向用户推荐用户可能会喜爱的项目(网页链接)。这类推荐系统在音乐或电影类网站最常见,比如推荐相关音乐、电影、歌手、演员等,能够吸引用户兴趣,提高用户满意度。 (2)以产品为主要推荐对象的系统。这类推荐系统在电子商务网络购物环境中最长使用,主要功能是向用户推荐他们可能会感兴趣的商品。这类推荐系统除了带给用户更好的购物体验,同时能提高产品销售量,增加网站收益。 推荐系统首先收集用户的历史行为数据,然后通过预处理的方法得到用户-评价矩阵,再利用机器学习领域中相关推荐技术形成对用户的个性化推荐。有的推荐系统还搜集用户对推荐结果的反馈,并根据实际的反馈信息实时调粮推荐策略,产生更符合用户需求

5、的推荐结果。-个性化推荐系统流程图:-3.基于用户的协同过滤算法-3.基于用户的协同过滤推荐算法:基于邻域的方法是协同过滤算法中应用最为广泛的一种。基于邻域的方法比较直观,容易理解。这类方法使用统计技术寻找与目标用户有相同或相似兴趣偏好的邻居,根据邻居用户的评分来预测目标用户对项目的评分值,选取预测评分最高的前N个项目作为推荐集反馈给目标用户。它的中心思想是有相同兴趣或偏好的用户往往会对同样的项目感兴趣,这也非常符合人们的心理。这类方法的核心是要准确计算目标用户的邻居,也就是用户相似性,所以也称为基于用户(User-based)的协同过滤方法。类似地,可以考虑项目之间的相似性,使用目标用户评价

6、过的项目合集来预测用户可能感兴趣的其它项目,这类方法称为基于项目 (Item-based)的协同过滤方法。-3.基于用户的协同过滤推荐 基于用户的协同过滤 (User-based CF)又称 KNN (K-Nearest-Neighbor,K最近邻)算法,其基本思想是利用与目标用户具有相同(或相似)兴趣爱好的用户的观点向目标用户提供商品推荐或评分预测。 基于用户的协同过滤算法的基本思想 其基本思想是:通过计算用户对项目评分之间的相似性,搜索目标用户的最近邻居,然后根据最近邻居的评分向目标用户产生推荐。 典型的协同过滤算法是基于用户的。- 这里的评分值可以是用户的浏览次数,购买次数等隐式的评分,

7、还可以采用显示评分,如用户对商品的直接评分,本算法的实现是采用用户对所购买商品的直接评分作为评分矩阵中评分值的。-3.基于用户的协同过滤推荐 寻找最近邻居:在这一阶段,主要完成对目标用户最近邻居的查找。通过计算目标用户与其他用户之间的相似度,算出与目标用户最相似的“最近邻居”集。即:对目标用户i产生一个以相似度sim(i,j)递减排列的“邻居”集合。该过程分两步完成:首先计算用户之问的相似度,可采用皮尔森相关系数、余弦相似性和修正的余弦相似性等度量方法,其次是根据如下方法选择“最近邻居”:(1)选择相似度大于设定阈值的用户;(2)选择相似度最大的前k个用户;(3)选择相似度大于预定阈值的k个用

8、户。-寻找最近邻居通常有三种方法余弦相似性(Cosine)每一个用户的评分都可以看作为n维项目空间上的向量,如果用户对项目没有进行评分,则将用户对该项目的评分设为0。用户间的相似性通过向量间的余弦夹角度量。设用户i和用户j在n维项目空间上的评分分别表示为向量i和向量j,则用户i和用户j之间的相似性sim(i,j)为: 其中,分子为两个用户评分向量的内积,分母为两个用户向量模的乘积。-相关相似性(Correlation)-修正的余弦相似性(AdjustedCosine) - 产生推荐项目:计算方法如下:-3.基于用户的协同过滤算法存在的问题及解决方案 基于用户的协同过滤虽然当给出足够清楚的偏好信

9、息时,它通常表现出良好的性能,但随着站点结构,内容的复杂度和用户人数的不断增加,一些缺点逐渐暴露出来,主要存在稀疏性问题、可扩展性问题,也有人提出传统的协同过滤不能反映用户兴趣的变化等问题。这些问题都大大影响了系统的性能,为用户和商家带来不便,针对协同过滤表现出的各种问题,学者们提出了多种解决方案,有基于模糊聚类的可扩展的协同过滤算法,基于用户等级的协同过滤推荐算法,适应用户兴趣变化的协同过滤推荐算法,压缩稀疏用户评分矩阵的协同过滤算法,个性化服务中基于用户聚类的协同过滤推荐等。 通常在电子商务网站中,用户购买或评分的商品相对于总商品数量仅占有限的百分比,为总数量的1%以下,这导致用户项目评分

10、数据集稀疏。在这种数据量大而评分数据又极端稀疏的情况下,一方面难以成功的定位邻居用户集,影响推荐精度;另一方面在整个用户空间上计算相似用户群的过程不可避免地成为了算法的瓶颈,继而增加了响应时间。-协同过滤推荐系统存在的一些弊端:(1)数据稀疏性问题,这也是协同过滤系统目前存在的最为普遍的问题,大多数用户只评价了部分项目,这样导致用户-评分矩阵十分稀疏,这样不利于推荐系统为用户推荐信息;(2)冷启动问题。新产品没有任何用户的评分,在协同过滤中是无法推荐的。新用户没有历史信息,也是无法推荐的。当一个新项目刚加入系统的时候,由于没有任何用户对它评分,该项目便无法得到推荐。(3)同一性问题。对于那些内容相同但是名称不同的项目,协同过滤是无法发现它们内在的联系。(4)扩展性问题。越来越多的用户和电影加入系统后,增加了系统的复杂性,此时系统准确、高效地推荐都具有一定的挑战性。-4.电影推荐(我们的想法) 电影推荐模块的参与者是用户,用户登录时该模块启动。这个模块的功能是为登录的用户动态推荐他们感兴趣的电影。这个模块中主要的推荐算法是:基于用户的协同过滤推荐算法。-5.电影推荐系统的实现构想系统模块结构概述电影管理:主要包括电影查询、修改、删除和添加。管理员根据需要搜集电影信息,然后整理综合添加到系统中,管理员还可以根据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论