版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能技术与应用6.推荐系统课程概况—基本情况PART01推荐系统推荐系统概述推荐系统实现隐含语义模型推荐系统概述推荐系统:推荐系统:推荐系统概述推荐系统:推荐系统概述协同过滤:如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?如何确定一个用户是不是和你有相似的品位?如何将邻居们的喜好组织成一个排序的目录?推荐系统-协同过滤协同过滤:实现步骤收集用户偏好找到相似的用户或物品计算推荐推荐系统-协同过滤协同过滤:实现步骤推荐系统-协同过滤协同过滤:相似度计算推荐系统-协同过滤协同过滤:相似度计算欧几里德距离(EuclideanDistance)皮尔逊相关系数(PearsonCorrelationCoefficient)
Cosine相似度(CosineSimilarity)推荐系统-协同过滤协同过滤:相似度计算皮尔逊相关系数(PearsonCorrelationCoefficient)协方差皮尔逊相关系数Pearson相关系数是用协方差除以两个变量的标准差得到的推荐系统-协同过滤协同过滤:皮尔逊相关系数推荐系统-协同过滤协同过滤:皮尔逊相关系数邻居的选择
固定数量的邻居
基于相似度门槛的邻居推荐系统-协同过滤基于用户的协同过滤:推荐系统-协同过滤基于用户的协同过滤:基于用户的协同过滤要解决的问题已知用户评分矩阵MatrixR(一般都是非常稀疏的)
推断矩阵中空格emptycells处的值推荐系统-协同过滤基于用户的协同过滤:基于用户协同过滤UserCF缺点
对于一个新用户,很难找到邻居用户。对于一个物品,所有最近的邻居都在其上没有多少打分注意事项
相似度计算最好使用皮尔逊相似度
考虑共同打分物品的数目,如乘上min(n,N)/Nn:共同打分数N:指定阈值
对打分进行归一化处理
设置一个相似度阈值推荐系统-协同过滤基于用户的协同过滤:基于用户协同过滤UserCF为啥不流行1.稀疏问题2.数百万的用户计算,这量?3.人是善变的注意事项
推荐系统-协同过滤基于物品的协同过滤:
推荐系统-协同过滤基于物品的协同过滤:基于物品的协同过滤优势!计算性能高,通常用户数量远大于物品数量可预先计算保留,物品并不善变
推荐系统-协同过滤基于物品的协同过滤:
推荐系统-协同过滤r_51=(0.41*2+0.59*3)/(0.41+0.59)=2.6基于物品的协同过滤:用户冷启动问题引导用户把自己的一些属性表达出来利用现有的开放数据平台根据用户注册属性推荐排行榜单物品冷启动问题文本分析、主题模型打标签、推荐排行榜单推荐系统-协同过滤基于物品的协同过滤:推荐系统-协同过滤基于物品的协同过滤:推荐系统-协同过滤基于用户的推荐实时新闻突然情况基于物品的推荐图书电子商务电影隐语义模型:隐语义模型从数据出发,进行个性化推荐用户和物品之间有着隐含的联系(有一个隐含方程)隐含因子让计算机能理解就好将用户和物品通过中介隐含因子联系起来隐语义模型:隐语义模型分解用户和隐藏因子之间的关系电影和隐藏因子之间的关系(F*M)T*(N*M)=(F*M)组合隐语义模型:隐语义模型梯度下降方向:隐语义模型:隐语义模型隐语义模型目标函数隐语义模型负样本选择:隐语义模型负样本采样:对每个用户,要保证正负样本的平衡(数目相似)选取那些很热门,而用户却没有行为的物品对于用户—物品集K{(u,i)}其中如果(u,i)是正样本,则有=1,负样本则=0隐语义模型:隐语义模型特征的重要程度隐语义模型:重新计算USV的结果得到A2来比较下A2和A的差异,看起来差异是有的,但是并不大,所以我们可以近似来代替隐语义模型隐语义模型:
将U的第一列当成x值,第二列当做y值,即U的每一行用一个二维向量表示,同理V的每一行也用一个二维向量表示。
从图中可以看到,S5和S6特别相似,Ben和Fred也特别相似隐语义模型隐语义模型:寻找相似用户寻找相似用户:依然用实例来说明:假设,现在有个名字叫Bob的新用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 常识听评课活动记录
- 《麻雀》听评课记录
- 暑假安全教育课件13
- 《中位数和众数》课件
- 大学生创业法律指南1教学教材
- 土地利用规划学课件-张兆福
- 《方圆标志认证中心》课件
- 会客室地毯施工方案
- 上学期小学科研室科研工作计划
- 广电网络分公司工作总结及工作计划
- (完整版)Berg平衡量表
- 中小学学校固定资产教育分类代码财政部2021
- 中国108种烹饪技法名称
- 现代高层写字楼的创新管理和增值服务
- 插花艺术形考大作业1119
- GB/T 35792-2018风力发电机组合格测试及认证
- GB/T 22085.2-2008电子束及激光焊接接头缺欠质量分级指南第2部分:铝及铝合金
- GB/T 19492-2020油气矿产资源储量分类
- GB/T 1933-1991木材密度测定方法
- GB 25501-2019水嘴水效限定值及水效等级
- 高教版中职语文(基础模块)上册写作《记叙文-人物描写(片段)》课件1
评论
0/150
提交评论