基于用户的协同过滤推荐技术_第1页
基于用户的协同过滤推荐技术_第2页
基于用户的协同过滤推荐技术_第3页
基于用户的协同过滤推荐技术_第4页
基于用户的协同过滤推荐技术_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于用户的协同过滤保举技能摘要随着因特网普及利用和电子商务迅猛生长,保举体系已成为紧张研究范畴,人们对保举技能作了普及的研究。本性化的保举体系以本性化方法向用户保举商品,帮助用户寻到他们所必要的商品,并便捷地完成购置历程。先容了电子商务体系中的协同过滤保举技能,详细阐发了基于用户的协同过滤保举算法,同时指出了它的长处和缺点。关键词电子商务协同过滤保举体系保举技能当前,电子商务体系迅猛生长,随之而来地出现了电子商务体系中的信息“超载征象。海量的物品信息无疑增长了用户购置所需物品的难度,使得用户很难敏捷正确地寻到本身真正中意的商品。为此,很多电子商务网站引入了保举体系,以进步用户的点击率,变网站的

2、欣赏者为购置者,进步用户购置乐成率和交织贩卖本领,进而提拔网站的美誉度和用户对网站的忠诚度。所谓电子商务保举体系是在相识和学惯用户的需求与爱好的底子上为用户提供商品信息和发起,模拟商家向用户保举其大概感爱好的商品,帮助用户完成购置历程。提供本性化办事已经成为进一步进步网络内容办事质量急需办理的紧张课题之一,也是将来网络内容办事的一个生长标的目的。如今,险些全部知名电子商务网站,诸如亚马逊、dn、ebay、淘宝网等都接纳了各式百般差异本性化程度的保举体系。保举体系中最焦点和关键的是所接纳的保举技能,它决定了保举体系性能的优劣。因此,增强对电子商务体系本性化保举技能研究具有非常紧张的现实意义。如今

3、,重要的保举技能有:基于内容保举、协同过滤保举、基于关联规矩保举、基于效用保举、基于知识保举和组合保举。此中,协同过滤保举是应用最早和最为乐成的技能之一,而基于用户的协同过滤保举又是最轻易明白的一种技能。一、协同过滤保举协同过滤保举技能在本性化保举体系中应用最广,重要的可分为基于用户和基于工程标协同过滤算法。它一样平常接纳比来邻技能,利用用户的汗青爱好信息盘算用户之间的间隔,然后利用目的用户的“比来邻人对商品评价的加权评代价来猜测目的用户对特定商品的爱好程度,体系从而按照这一爱好程度来对目的用户举行保举。协同过滤最大长处是对保举工具没有特别的要求,能处置惩罚如音乐、影戏等如许非布局化的庞大工具

4、。协同过滤是基于如许的假设:为一用户寻到他真正感爱好的内容的好要领是起首寻到与此用户有相似爱好的其他用户,然后将他们感爱好的内容保举给此用户。基于协同过滤的保举体系可以说是从用户的角度来举行相应保举的,而且是主动的,即用户得到的保举是体系从购置形式或欣赏举动等隐式得到的,不必要用户积极地寻到得当本身爱好的保举信息,如填写一些观察表格等。协同过滤保举的一样平常步调是:生意业务数据库丈量用户间相似性探求相似用户盘算商品的购置大概性按照购置大概性保举商品。二、基于用户的协同过滤保举1.算法基于用户的协同过滤是到如今为止现实应用中最为乐成的本性化保举技能,算法的根本头脑是将具有雷同爱好的用户感爱好的工

5、程保举给目的用户。假设目的用户对工程标评价与他的“比来邻人相似,而目的用户对某个工程标评价可以从他的“比来邻人的评价中综合得到。基于用户的协同过滤保举算法重要包罗三个历程:(1)表现:创立一个用户-工程评价矩阵形貌用户对工程标评价。用户的断定和偏好明白地表现为一个*n的用户-工程评价矩阵r,这里是用户数,n是工程数,r=(rij),元素rij表现用户i对工程j的评价。在电子商务保举体系中,元素rij既可表现用户是否购置商品(比方0大概1),也可表现用户对商品的偏好程度(比方评分从1到10)。(2)天生“邻人:通过盘算全部用户对之间的相似度形成“邻人。盘算体系中目的用户与其他全部用户的相似度,以

6、寻出k个最相似用户集“比来邻人。k-“比来邻人依相似度排序。(3)产生保举:通过加权目的用户“邻人对目的工程标评价产生保举。按照“比来邻人集,可盘算目的用户对工程标猜测评代价,进而产生保举。假定用户i的“比来邻人集为si,用户i对工程x的猜测评代价为pi,x,用户i和用户j的相似度为si(i,j),用户i和用户j的均匀评代价别离为,那么有:2.相似度盘算要领盘算两个用户之间相似度的要领重要有三种:余弦相似度、相干相似度以及修正的余弦相似度,分述如下:(1)余弦相似度:每个用户的评分作为n维工程空间中的一个向量。假设某个用户没有对一个工程评价,那么其默认评代价设为0。两个用户i和j之间的相似性通

7、过盘算两个向量和夹角的余弦得到,记为si(i,j),盘算公式如下:(2)相干相似度:在余弦相似度盘算中没有思量差异用户之间评价范畴的差异。相干相似度通过减去用户对工程均匀评代价来落服上述缺陷。两个用户i和j之间的相似性通过盘算pearsn相干性得到。假定用户i和用户j配合评价的工程聚集为,那么相干相似度盘算公式如下:此中:ri,x为用户i对工程j的评代价,和别离为用户i和用户j的均匀评代价。(3)修正的余弦相似度:在相干相似度盘算公式中,假设同时思量用户i和用户j的评价工程聚集,那么得到修正的余弦相似度盘算公式如下:此中:ii和ij别离为用户i和用户j的评价工程聚集。3.算法长处和缺点基于用户

8、的协同过滤算法很轻易明白,与其他浩繁现实应用中的保举算法比拟表现出较高的保举精度,它具有如下一些长处:(1)可以或许过滤难以举行呆板主动内容阐发的信息,如艺术品,音乐等。(2)共享其别人的履历,制止了内容阐发的不完全和不正确,而且可以或许基于一些庞大的,难以表述的观点如信息质量、小我私家咀嚼举行过滤。(3)有保举新信息的本领。可以创造内容上完全不相似的信息,用户对保举信息的内容事先是意料不到的,可以创造用户埋伏的但本身尚未创造的爱好偏好。(4)可以或许有效的利用其他相似用户的反响信息,较少用户的反响量,加速本性化学习的速率。固然基于用户的协同过滤作为一种典范的保举技能有其相称的应用,但随着电子

9、商务体系范围的不竭扩大,用户空间和工程空间急剧增长,该算法也存在以下缺点:希罕性:在一个大型电子商务体系中,用户涉及的信息量相称有限,用户评价工程数少于总工程数的10%,造成评价矩阵数据相称希罕,难以寻到相似用户集,导致保举结果大大低落。冷开始:这个题目可看作是极度严峻的希罕性题目。一方面,它很难向新用户提供本性化保举办事;另一方面,在这种环境下,仅有少量评价数据不成能产生正确保举。扩展性:基于用户的协同过滤算法的盘算量随着用户和工程标增长而急剧增长,其最坏环境下的盘算庞大度为(n)。对付一个典范的具有成百上万万用户和工程标电子商务体系,算法将遭碰到严峻的扩展性题目。三、结论基于用户的协同过滤虽是一种较为乐成的保举技能,但也存在着希罕性、冷开始、扩展性和正确性题目。为了办理这些题目,如今常用聚类阐发的要领,它大概将“比来邻人搜刮工具限定在最相近的聚类中,大概用聚类的质心提取保举结果,但并不克不及从底子上办理以上题目,这些都有待进一步研究。参考文献:1赵亮胡乃静张守志:本性化保举算法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论