基于评分预测协同过滤推荐算法比较及改进_第1页
基于评分预测协同过滤推荐算法比较及改进_第2页
基于评分预测协同过滤推荐算法比较及改进_第3页
基于评分预测协同过滤推荐算法比较及改进_第4页
基于评分预测协同过滤推荐算法比较及改进_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

报告人:周海平浙江万里学院第十五届全国机器学习会议报告纲要4课题背景及应用领域12改进的推荐算法3传统协同过滤算法的介绍55工作总结课题背景及应用领域研究背景:由于互联网的普及,越来越多的人开始使用互联网进行购物或参加社交活动。另一方面,由于互联网上的信息每年都以爆炸式的速度增长,人们在如此众多的信息中极其容易迷失方向,要改变这种现状,就必须使互联网从被动地接受用户的信息转变为主动感知和探测用户的需求,推荐系统就是在这种背景下产生的。推荐系统的功能对于消费者:寻找感兴趣的物品缩小选择的范围发现新事物寻找与自己相似的用户对于提供者:为客户提供个性化服务增加客户的信任和忠诚度提高销售量获取更多关于消费者的信息推荐系统的应用领域电子商务----亚马逊电影和视频网站---Netflix推荐系统的应用领域音乐网站----豆瓣音乐个性化邮件----Gmail推荐系统的应用领域社交网络----Facebook一、两种协同过滤推荐算法的介绍基于用户的协同过滤推荐基于用户的协同过滤推荐的基本原理是,根据所有用户对物品的偏好,发现与当前用户口味和偏好相似的邻居用户,然后,基于这些邻居的偏好信息,为当前用户进行推荐。基于物品的协同过滤推荐基于物品的协同过滤推荐的基本原理与基于用户的协同过滤推荐算法类似,只不过此时推荐算法计算的是物品和物品之间的相似度,然后根据用户的偏好信息,将类似的物品推荐给用户。相似性度量标准(1)欧氏距离(Euclidean

Distance)(2)皮尔森相关系数(Pearson

Correlation

Coefficient)jic˛I

i

,

jj

,ci,c-

r

)2(rc˛I

i

,

j(r

-

r

)2(ri

,c

-

ri

)(rj

,c

-

rj

)c˛I

i

,

jsim

(i

,

j

)

=ni

ii

=1dist

(

X

,Y )

=

(

x

-

y )

2(3)余弦相似度(Cosine

Similarity)(4)Jaccard相似系数(Jaccard

Coefficient)x

yfi

fix

ysim

(

X

,Y )

=

cosq

=X

YJaccard(

X

,Y )

=

X

Y评分预测预测用户u对未购买物品c的评分v˛

Nu=

Nurv,cu

,c

sim(u,

v)

rv,c

sim(u,

v)

d推荐系统的评价指标I----准确率

˛

u˛Uu

Upresition

=T

(u)R(u)

T

(u)R(u)是根据用户在训练集上的行为给用户作出的推荐列表,而T(u)是用户在测试集上的行为列表推荐系统的评价指标II----召回率R(u)是根据用户在训练集上的行为给用户作出的推荐列表,而T(u)是用户在测试集上的行为列表u˛U=

u˛UrecallR(u)R(u)

T

(u)结果:数据集来源:grouplens网站提供了10万条影片评分数据基于用户的过滤算法比基于物品的过滤算法要推荐质量要好一点。改进的相似性算法传统的相似性算法仅将用户之间评分的差异做为相似性度量标准,实际上两个用户的共同评价数也是衡量相似性的重要指标。(例如:两个用户共同只看过一部电影,并且评分相同,另两个用户共同看了10部电影,其中有9部影片评分相同,1部影片评分不同,显然后者的相似性要高,但传统算法却认为前者的相似性更高,很不合理。)改进后的相似度:sim(u,

v)¢=

sim(u,

v)

Iu,vIu

,v

表示用户u和用户v的共同评价过的影片数目。结果显然,改进后的算法的推荐质量远远高于传统算法第二次改进:考虑到共同评价的影片中有一些非常热门,这些影片几乎所有用户都给了好评,这种影片对计算用户之间的相似性几乎没有什么贡献,因此需要减小热门影片在相似性指标中的权重,因此我们对相似性进行了优化:Nu

Nv•1

1sim(u,

v)

=

Nu

Nv

1

+

log(1

+

rui

-

rvi

)

log(1

+

Ni

)结论:降低热门影片的权重能提高推荐的准确率和召回率第三次改进Nu

Nv•log(1

+

Ni

)11sim

(u,

v)

=

Nu

Nv

1

+

log(1

+

rui

-

rvi

)Nu

N

vlog(

1

+

N

i

)1sim

(u

,

v)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论