系统基础知识与整体框架详细设计_第1页
系统基础知识与整体框架详细设计_第2页
系统基础知识与整体框架详细设计_第3页
系统基础知识与整体框架详细设计_第4页
系统基础知识与整体框架详细设计_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

推荐系统的基础知识与整体框架详细设计

一、推荐算法的理解................................................2

二、推荐系统的整体框架............................................2

三、用户画像.......................................................3

3.1用户标签...................................................3

3.2用户画像的分类............................................3

3.2.1.原始数据..........................................4

3.2.2.事实标签..........................................4

3.2.3.模型标签..........................................5

四、内容画像.......................................................5

4.1内容画像..............................................5

4.2环境变量...............................................6

五、算法构建.......................................................6

5.1推荐算法流程..............................................6

5.2召回策略..................................................8

5.3粗排策略..................................................9

5.4精排策略..................................................9

5.4.1精排目标............................................9

5.4.2精排模型............................................11

5.4.3逻辑回归---最简单Model-based模型...............14

5.4.4深度学习一一当前最新发展方向......................16

5.5重排层策略...............................................20

5.5.1EE问题............................................20

5.5.2多样性问题........................................21

5.5.3上下文问题........................................21

5.6冷启动...................................................22

5.6.1用户冷启..........................................22

5.6.2内容冷启..........................................23

六、当前发展......................................................23

七.算法衡量标准...............................................25

7.1指标选择.................................................25

7.2推荐效果.................................................26

八.算法之外....................................................27

8.1推荐算法是否会导致信息不平等和信息茧房?...............27

8.2算法可能产生的蝴蝶效应..................................27

8.2.1推荐算法对feed传播的影响........................28

8.2.2推荐算法对平台的影响...............................29

一、推荐算法的理解

如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更

加有效率的连接,节约大量用户与内容和服务连接的时间和成本。如果把

推荐系统简单拆开来看,推荐系统主要是由数据、算法、架构三个方面组

成。

.数据提供了信息。数据储存了信息,包括用户与内容的属性,用户

的行为偏好例如对新闻的点击、玩过的英雄、购买的物品等等。

这些数据特征非常关键,甚至可以说它们决定了一个算法的上

限。

.算法提供了逻辑。数据通过不断的积累,存储了巨量的信息。在巨

大的数据量与数据维度下,人已经无法通过人工策略进行分析干

预,因此需要基于一套复杂的信息处理逻辑,基于大量的数据学

习返回推荐的内容或服务。

.架构解放了双手。架构保证整个推荐自动化、实时性的运行。架构

包含了接收用户请求,收集、处理,存储用户数据,推荐算法计

算,返回推荐结果等。一个推荐系统的实时性要求越高、访问量

越大,那么这个推荐系统的架构会越复杂。

二、推荐系统的整体框架

客户爱

用户与内容

协设接入

接入调度层1

分发调度

推荐翼法层

公用组件

报表

系靛

存储单元内容索引Redis

推荐的框架主要有以下几个模块

•协议调度:请求的发送和结果的回传。在请求中,用户会发送

自己的ID,地理位置等信息。结果回传中会返回推荐系统给用户

推荐的结果。

•推荐算法:算法按照一定的逻辑为用户产生最终的推荐结果,

不同的推荐算法基于不同的逻辑与数据运算过程。

•消息队列:数据的上报与处理。根据用户的ID,拉取例如用

户的性别、之前的点击、收藏等用户信息。而用户在APP中产生

的新行为,例如新的点击会储存在存储单元里面。

•存储单元:不同的数据类型和用途会储存在不同的存储单元

中,例如内容标签与内容的索引存储在mysql里,实时性数据存

储在redis里,需要进行数据统计的大量离线数据存储在

hivesql里。

三、用户画像

3.1用户标签

标签是我们对多维事物的降维理解,抽象出事物更具有代表性的特

点。我们永远无法完全的了解一个人,所以我们只能够通过一个一个标签

的来刻画他,所有的标签最终会构建为一个立体的画像,一个详尽的用户

画像可以帮助我们更好的理解用户。

3.2用户画像的分类

原始

数据

用户行为日志用户数据内容数据外部数据

静态画像动态画像

事实

性别年龄

标签显式行为:点赞、评论、分享、关注、评分

建学历■常住位置■隐式行为:点击、时长、次数、天数、间隔

用户游戏偏好用户内容偏好用户标签偏好

模型

标签用户活跃度分层用户关键词偏好

3.2.1.原始数据

原始数据一共包含四个方面(以游戏内容推荐为例)。

•用户数据:例如用户的性别、年龄、渠道、注册时间、手机机型等。

•内容数据:例如游戏的品类,对游戏描述、评论的爬虫之后得到的

关键词、标签等。

•用户与内容的交互:基于用户的行为,了解了什么样的用户喜欢什

么样的游戏品类、关键词、标签等。

•外部数据:单一的产品只能描述用户的某一类喜好,外部数据标签

可以让用户更加的立体。

3.2.2.事实标签

事实标签可以分为静态画像和动态画像。

•静态画像:用户独立于产品场景之外的属性,例如用户的自然属性,

这类信息比较稳定,具有统计性意义。

.动态画像:用户在场景中所产生的显示行为或隐式行为:

1.显示行为:用户明确的表达了自己的喜好,例如点赞、分享、评分、

评论(可以通过NLP来判断情感的正负向)等。

2.隐式行为:用户没有明确表达自己的喜好,但用户会用实际行动,

例如点击、停留时长等隐性的行为表达自己的喜好。隐式行为的权

重小于显性行为,但是在实际业务中,用户的显示,亍为都比较稀疏,

所以需要依赖大量的隐式行为。

3.2.3.模型标签

模型标签是由事实标签通过加权计算或是聚类分析所得。通过一层加

工处理后,标签所包含的信息量得到提升,在推荐过程中效果更好。

•聚类分析:例如按照用户的活跃度进行聚类,将用户分为高活

跃-中活跃-低活跃三类。

•加权计算:根据用户的行为将用户的标签加权计算,得到每一

个标签的分数,用于之后推荐算法的计算。

四、内容画像

4.1内容画像

推荐内容与场景通常可以分为以下几类,根据所推荐的内容不同,其

内容画像的处理方式也不同。

•文章推荐:例如新闻内容推荐,需要利用NLP的技术对文

章的标题,正文等提取关键词、标签、分类等。

•视频推荐:除了对于分类、标题关键词的抓取外,还依赖于

图片与视频处理技术,例如识别内容标签、内容相似性等。

短视班

内容画像外,环境画像也非常重要。例如在短视频的推荐场景中,用

户在看到一条视频所处的时间、地点以及当时所浏览的前后内容、当天己

浏览时间等也是非常重要的信息,但由于环境变量数据量较大、类型较

多,对推荐架构以及工程实现能力的要求也较高。

五、算法构建

5.1推荐算法流程

推荐算法其实本质上是一种信息处理逻辑,当获取了用户与内容的信

息之后,按照一定的逻辑处理信息后,产生推荐结果。热度排行榜就是最

简单的一种推荐方法,它依赖的逻辑就是当一个内容被大多数用户喜欢,

那大概率其他用户也会喜欢。但是基于粗放的推荐往往会不够精确,想要

挖掘用户个性化的,小众化的兴趣,需要制定复杂的规则运算逻辑,由机

器完成。推荐算法主要分为以下几步:

.召回:当用户以及内容量比较大的时候,往往先通过召回策略,将

百万量级的内容先缩小到百量级。

.过滤:对于内容不可重复消费的领域,例如实时性比较强的新闻等,

在用户己经曝光和点击后不会再推送到用户面前。

.精排:对于召回并过滤后的内容进行排序,将百量级的内容按照顺

序推送。

.混排:为避免内容越推越窄,将精排后的推荐结果进行一定修改,

例如控制某一类型的频次,EE问题处理等。

•强规则:根据业务规则进行修改,例如在活动时将某些文章置顶以

及热点内容的强插等。

5.2召回策略

•召回层目的:当用户与内容的量级比较大,例如对百万量级的用户

与内容计算概率,就会产生百万*百万量级的计算量。但同时,大

量内容中真正的精品只是少数,对所有内容进行计算将非常的低效,

浪费大量的资源和时间。因此采用召回策略,例如热销召回,召回

一段时间内最热门的100个内容,只需进行一次计算动作,就可以

对所有用户应用。

•召回层重要性:召回模型是一个推荐系统的天花板,决定了后续可

排序的空间。

•召回层方法:召回对算法的精度、范围、性能都有较高要求。当前

业界常采用离线训练+打分或离线训练达到向量表达+向量检索的

方式。(对比精排为了提高准确率,更多用离线-实时打分,或在

线学习的方式)。

召回方法主要特点优势局限性

利用标签、时效等单一策略召回

•热销召回:将一段时间内的热门内容召

回.

•协同召回;基于用户与用户行为的相似

性推程,可以很好的突破,定的限制,发现

用户潜在的兴电偏好.

单策略4回•标签召回:根据每个用户的行为,构建速度快,实现同单革•策略词召问题较大

标签,并根IK标签召回内容.

•将•段时间内靖新的内容召

H.在新网视麒等有时效性的加域常用.

•其他策略:例如利用美系锤、或对某类

用户实现某类具体的策略.

大量人工调参来决定每路规

方法相互补充,可以覆盖不

多路召回融合多个单•策略模,召回通路之间可比较性、

同的召回需求

可解择性较弱

新、新缺失

基于^训练好的用户、物品embedding向量可以融合大量的用户和物品itemuser

embedding召回

特征,提高整体精准度

召回实时性更弱

•召回层与业务场景的结合

除了常规召回方式外,召回可以更多的与实际业务目标与场景结合,例如

在飞猪业务场景中,其存在几类行业特点:1.订单类型较多(涉及到交

通、酒店、景区、周边游),且业务之间具有一定的相关性和搭配性。2.

用户存在周期性复购情况。3.用户订单的稀疏性较大。针对这些问题,

其召回层会结合以下解决方案:1.相关性&搭配性问题

•协同往往只能召回相似的商品,而考虑到推荐目标的替代性和互补

性,更多挖掘反应搭配关系的行为集合。

•数据稀疏且噪音较大,仅仅基于数据构建图,badcase较多,所以

需要利用行业的知识图谱。

•结合行为序列:行为序列挖掘-〉构件图(通过知识图谱来增加约束)

序列采样(降低噪音,抑制热门问题)训练。

2.周期性复购问题

•部分用户存在固定的购买模式。利用Poission-Gamma分布的统计建

模。计算在某个时间点,购买某个商品的概率,在正确的时间点给

用户推出合适的复购商品。

5.3粗排策略

•粗排层目的:为后续链路提供集合。

•粗排层特点:打分量高于精排,但有严格的延迟约束。

•粗排层方法:主要分为两种路线

1.集合选择:以集合为建模目标,选出满足后链路需求集合。其可控

性较弱,算力消耗较小。(多通道、listwise、序列生成)

2.精准预估:以值为建模目标,直接对系统目标进行值预估。可控性

较高,算力消耗较大。(pointwise)

•粗排层发展历史:质量分->LR等传统机器学习-〉向量内内卷积(双

塔模型)->COLD全链路(阿里)

5.4精排策略

5.4.1精排目标

・精排层多目标融合原则

1.用户的效用需要通过多个指标反馈:例如用户对视频的喜好,会通

过停留时长、完播、点赞等多个动作反应。

2.产品的目标需要通过多个指标衡量:例如短视频产品不仅需要考虑

用户效用,也需要考虑作者效用、平台目标与生态影响。

•精排层多目标融合实例

以短视频行业为例,推荐目标主要由几个方面组成:

•对用户价值。

•对作者价值,包括给作者的流量,互动,收入等。

•对内容生态价值,包括品牌价值、内容安全、平台收入。

•间接价值,非直接由视频产生,例如用户的评论提醒,会改善用户

的留存率。

1上3|窘床笠二笳而察

ScoreA:互动和时长的多目标线性加权公式

ScoreB:长皿[0,300s)

ScoreC:观看完成度收益[0,1]

ScoreD:点例概率•点?m用户效用

ScoreE:关注微率♦关注的用户效用

ScoreF:分享概率♦(分享的用户效用的卜部效用)

ScoreG:进入原声页概率•(原声收藏概率■收藏

的用户效用♦原声拍摄概率•作品价值)

ScoreL:Pointwiselearn2Rank排序分

ScoreM:PairwiseLearn2Rank排序分

参考:《多目标排序在快手短视频推荐中的实践》

•精排层多目标融合方法

i.改变样本权重/多模型分数融合:(1)改变样本权重:先通过权重

构造目标值,再进行模型拟合。(2)多模型分数融合:先进行模型

拟合在进行加权融合。缺点:依赖规则设计,依赖人工调参,且经

常面临以A目标换取B目标的问题。

2.Learntorank:pairwise、listwise直接排序。

3.结合在线数据自动调参:5%线上流量探索,每次探索N组参数,根

据用户的实时reward来优化线上的调参算法。设计约束项,在阈

值内线性弱衰减,超出阈值指数强衰减。

4.多任务学习:结合深度学习网络,可以共享embecding特征,采用

多种特征组合方式,达到相互促进以及泛化的作用。例如MMOE模

型,不同的专家可以从相同的输入中提取出不同的特征,由gate

attention结构,把专家提取出的特征筛选出各个task最相关的

特征,分别接入不同任务的全连接层。不同的任务需要不同的信息,

因此每个任务都由独立gate负责。

Figure1:(a)Shared-Bottommodel,(b)One-gateMoEmodel,(c)Multi-gateMoEmodel.

5.4.2精排模型

•精排模型发展历史

CollaborativeFilteringModelsGenericFeature-basedModels

^DeepLearning-basedDeepLearning-based

oNeuMF[He]ONFM[He]

oONCF[He]oDeepCross[Shan]

oDeepMF[Xue]oYouTubeRecommender

oACF(Chen)[Covington]

NAIS[He]oWide&Deep[Cheng]

2016-20I9Q

DeeplCF(Xue]oDeepFM[Guo]

2016~201SQ4、

oxDeepFM[Lian]

Model-based(ItemCF)oFNN[Zhang]

oFISM[Kabbur]oPNN[Qu]

JoSLIM[Ning]

oCrossNet(Wang]

6A.OSVD4[Yehuda]

oTEM[V/ang]

Model-based(UserCF)\o^..y

20l(k20l6O

oMF[Koren]^^FactorizationMachines

oBPR-MF[Rendle]

2009|oFM[Rendle)

Memory-basedFFM[Juan]

oUserSimilarity[Thomas]

1994-2004oItemSimilarity[GregLinden]

oCosineSimilarity[Stuart]

oPearsonCorrelation[Paul]

•精排模型分类

基于内容属性的相似性推卷

SVDFeature

•精排模型基本原理

精排模型基本原理

根据内容的相似性,例如标题、标签、正

基于内容属性的相似性推荐

文相似性进行推荐

根据用户过去的行为判断用户之间的相似

基于用户的协同过滤

性,推荐相似用户喜欢的内容

基于用户

行为的协

同过滤

根据用户过去的行为判断内容之间的相似

基于内容的协同过滤

性,推荐相似的内容

逻辑回归

FM

将点击率作为变量,预测用户对于每一

分类模型Y

个内容之间的点击率

树模型0-1

深度学习DNN

将评分矩阵分解为用户与内容矩阵,根据

因子分解

相似性预测其他评分

•精排模型优缺点

精排模型优点缺点

单纯的从内容的相似性进

基于内容属性的相似性对于新内容友好,较为公

行判断,会忽略用户的行

推荐平

更适用于内容海量频繁更用户量大的时候,矩阵过

基于用户的协

新,但用户较为稳定的场于稀疏推荐结果可能会产

同过滤

景(例如社交推荐的场景:;生马太效应,会越推越热

基于用户

行为的协

同过滤

物品量大的时候,矩阵过

基于内容的协更适用于用户数量远远大

于稀疏推荐结果可能会产

同过滤于内容的场景

生马太效应,会越推越热

模型简单易用,比较容易

逻辑回归需要手动进行特征工程

控制和解释

相对于逻辑回归,无需进

交叉特征的解释性较逻辑

行特征交叉,自动产生隐

FM回归差

变量

分类模型

相对于逻辑回归,不需要

在高维度稀疏特征的情况

树模型进行特征处理(归一化、

下容易产生过拟合

离散化)

深度学习DN在处理大数据量,高维度

复杂,难以解释

N表现更好

解决矩阵稀疏性问题,节

因子分解

省计算资源

5.4.3逻辑回归----最简单Model-based模型

•原理介绍

1.概念:逻辑回归通过sigmoid函数,将线性回归变为可以解决二分类

的方法,它可用于估计某种事物发生的可能性。

2.计算公式:Y根据目标设计:例如是否点击(是:1,否:0,最后预

测一个0-1之间的点击概率);X根据特征工程设计:这一块就涉及到了

前面提到的用户画像与内容画像,所有的画像都是对样本的特征的刻

画。特征工程需要根据业务场景选择合适的特征并进行一定的加工:W由

模型训练得到。

丫是否点击=simnod(〃用户X用户+卬物品X物品+”其他X其他)

•构建流程

基于我们的目标,需要进行样本的收集(样本是对客观世界的具体描

述),通过对己收集到的样本进行特征构造,并对其进行训练,最终求出

模型参数的具体数值。

1.建立样本

逻辑回归为有监督模型,因此需要有已经分类好的样本。正样本:

用户曝光过某物品并点击。负样本:用户曝光过某物品并且没有点击。

如果正负样本差距过大,可以将负样本随机抽样后与正样本一起训练。

或只保留有点击行为的用户作为样本,将曝光但是没有被点击的物品作

为负样本。

负样本

2.特征工程

特征工程是对收集到的样本进行更加深度的特征刻画。虽然作为算法

人员与用户接触较少,但对身边使用该产品的同学,进行深入的观察与访

谈,了解他们对于所推荐内容的反馈,往往可以得到意料之外的特征开发

方向。主要分为以下几个维度。

基础数据

趋势数据

时间数据

交叉数据

不同交叉方法得到的不同的参数数量

5.4.4深度学习一一当前最新发展方向

1.深度学习基础Embedding+MLP模型

•Embedding+MLP模型结构:微软在2016年提出DeepCrossing,

用于广告推荐中。

•从下到上可以分为5层,分别是Feature层、Embedding层、

Stacking层、MLP层和Scoring层。

•对于类别特征,先利用Embedding层进行特征稠密化,再利用

Stacking层连接其他特征,输入MLP(多层神经元网络),最后

用Scoring层预估结果。

2.深度学习主要特点

(1)embedding技术在召回层的应用:embedding,即用一个数值向量来

表示一个对象的方法,对于处理稀疏特征有比较重要的应用,其将稀疏高

维特征向量转换为稠密低维特征向量,可以融合大量价值信息。其主要方

法有基于文本的Word2Vec,基于物品的Item2Vec,基于图结构(社交关

系、知识图谱、行为关系等)的deepwalk、Node2Vec(增加了随机过程

中跳转概率的倾向性)

等。

Output

Inputsoftmax

(2)深度学习模型在排序层的应用:深度学习模型以MLP为基础结构,

embedding+MLP是最经典结合,google在此基础上提出的Wide&Deep在业

界得到了广泛的应用。

3.目前主要的衍化方向

改变神经网络的复杂程度。

改变特征交叉方式。

多种模型组合应用。

与其他领域的结合,例如自然语言处理,图像处理,强化领域等。

4.深度学习模型举例

(1)Wide&Deep模型

2016年谷歌发表的Wide&Deep模型与YouTube深度学习推荐模型,

引领推荐算法走向了对深度学习的应用。相比传统机器学习推荐模型,

深度学习具有更加复杂的模型结构,而使其具备了理论上拟合任何函数

的能力。同时深度学习的结构灵活性可以让其模拟出用户兴趣的变迁过

程。左侧传统推荐模型与右侧深度学习推荐模型对比,其模型复杂度增

加:

(2)DeepFM模型

由FM与深度学习模型的结合生成的DeepFM模型:即FM替换了

Wide&Deep的Wide部分,加强了浅层网络部分特征组合的能力,右边的

部分跟Deep部分一样,利月多层神经网络进行特征的深层处理。

特征域,特征域,・・・特征域用

(3)深度兴趣DIN模型

DIN模型为阿里的电商广告推荐模型,预测其广告点击率。它主要利

用注意力机制,即通过用户历史行为序列,为每一个用户的历史购买商

品上面加入了激活单元,激活单元相当于一个嵌套在其中的深度学习模

型,利用两个商品的embedding,生成了代表他们关联程度的注意力权

重。

(Outjxjt)

ActivationWeight

Softmax(2)

PReLU/Dice(M)Lineor05

PReLU/Dice(200)Eu/Dice(36)

■■■■(Concot)

Concat&Flatten•t

7J、

Out

Product

fraaUserInputsfro«Ad

ActivationUnit

•Product

•GoodsID

•ShopID

EmbeddingOCateID

LayerOOther10

DeepInterestNetwork

(4)深度兴趣进化网络DIEN

弥补DIN没有对行为序列进行建模的缺点,通过序列层,兴趣抽取

层,兴趣进化层。其中利用序列模型利用商品ID和前一层序列模型的

embedding向量,输出商品embedding与兴趣embedding,

Sofgx(2)

PRelU/Dice(28)

Const&Flatten

h-(n

®Product

Interest

AuxiliaryLossEvolvinglayer

CiyicNotptdc

AttentionInterest

Extroctorlayer

e(tn)h(t)Behavior

NegLayer

___•

KT1)

b(T-l)MT)TargetAdContextUserProftle

Feotur«Feature

userbehaviorsequence

5.5重排层策略

5.5.1EE问题

•MBA问题:所有的选择都要同时考虑寻找最优解以及累计收益最大

的问题。

•解决方案:Bandit算法,衡量臂的平均收益,收益越大越容易被选

择,以及臂的方差,方差越大越容易被选择。

T

RT=E(“-W))

i=l

=Tvv*-£wB(i)

1=1

•常用算法:汤普森采样算法,UCB算法,Epsilon贪婪算法,LinUCB

算法,与协同过滤结合的C0FIBA。

5.5.2多样性问题

•多样性问题

1.多样性过差:用户探索不够,兴趣过窄,系统泛化能力以及可持续

性变差;流量过于集中在少数item上,系统缺乏活力。

2.多样性过强:用户兴趣聚焦程度弱;item流量分配平均,对优质

item激励不足。

•多样性解法:L根据内容的相关性以及相似性进行打散。2.保持

用户以及内容探索比例。3.人工规则控制。

5.5.3上下文问题

pointwise排序中,仅考虑item与user之间的相关性,而较少考虑

前序item对后续item的影响,主要的解决方案有两种。

listwise排序

•Pointwise考虑单点目标/Pairwise考虑一个pair/Listwise考虑

整个集合的指标。

•Listwise对视频组合进行transformer建模,刻画视频间的相互影

响,前序视频对后续视频观看有影响,前后组合决定总收益。

Candidateevaluatiorr

layer(评估S)

Encoderlayer

EncoderLayernorm

Featureextraction

layer

Inputfeature

强化学习

•考虑序列决策,从前向后依次贪心的选择动作概率最大的视频。

•Reward=f(相关性,多样性,约束)。

序外决货过程

y

5.6冷启动

5.6.1用户冷启

其主要几个方向为:加强特征与信息的补充、EE问题平衡、实时化加

强。

信息补充

1.sideinformation补充:例如商品类目、领域知识图谱、第三方

公司数据的补充。

2.Crossdomain:利用共同的用户在不同地方的数据进行冷启。

3.用户填写兴趣。

4.元学习:利用多任务间具有泛化能力的模型,进行少样木学习(few­

shotlearning)。

快速收敛

1.主动学习、在线学习、强化学习:快速收集数据,且反馈到特征与

模型中。

2.增强模型实时化以及收敛能力。

5.6.2内容冷启

以短视频推荐为例,平台常常采用大小池逻辑,对内容进行不同流量的

探索,并根据实际的反馈数据来决定内容可以进入的推荐范围。其中表

现优质的内容将不断的进入更大的流量池中,最终进入推荐池,形成精

品召回池。

六、当前发展

因果与推荐结合

•推荐系统中的特征向量和用户最终的反馈(比如点击、点赞等)之

间的关系是由因果关系和非因果关系共同组成。因果关系是反应物

品被用户偏好的原因,非因果关系仅反应用户和物品之间的统计相

关性,比如曝光模式、公众观念、展示位置等。而现有推荐算法缺

乏对这两种关系的区分。

•AModel-AgnosticCausalLearningFrameworkfor

RecommendationusingSearchData。论文提出了一个基于工具变

量的模型无关的因果学习框架IV4Recf联合考虑了搜索场景和推

荐场景下的用户行为,利用搜索数据辅助推荐模型。即将用户的搜

索行为作为工具变量,来帮助分解原本推荐中特征(treatments),

使用深度神经网络将分离的两个部分结合起来,来完成推荐任务。

序列/会话推荐

•推荐系统倾向于学习每个用户对物品的长期和静态的偏好,但一个

用户的所有的历史交互行为对他当前的偏好并非同等重要,用户的

短期偏好和跟时间相关的上下文场景所包含的信息更加实时也更

加灵敏.基于会话的推荐系统从一个用户的最近产生的会话中捕获

他的短期偏好,以及利用会话和会话间的偏好变化,进行更精准和

实时推荐。

•TKDE2022/DisentangledGraphNeuralNetworksfor

Session-basedRecommendation。用户选择某个物品的意图是由该

物品的某些因素驱动的,本文的方法建模了这种细粒度的的兴趣来

生成高质量的会话嵌入。

图神经网络与推荐结合

•大部分的信息本质上都是图结构,GNN能够自然地整合节点属性信

息和拓扑结构信息,来减少特征处理中的信息折损。

•ICDE2021/Muiti-BehaviorEnhancedRecondnendationwith

Cross-InteractionCollaborativeRelationModeling。利用图

神经网络建模Multi-Behavior推荐。

知识图谱与推荐结合

•先验的知识图谱可以对推荐系统进行很好的信息补充和信息约束,

特别是在数据较为稀疏的场景下。(1)知识图谱中的结构化知识

可以在冷启动场景中提供更多的信息。(2)对于数据稀疏,方差

过大的情况下,增加有效约束。(3)先验知识纠正数据偏差。(4)

增强推荐算法可解释性。

•ConditionalGraphAttentionNetworksforDistillingand

RefiningKnowledgeGraphsinRecommendation由于知识图谱

的泛化性和规模性,大多数知识关系对目标用户-物品预测没有帮

助。为了利用知识图谱来捕获推荐系统中特定目标的知识关系,需

要对知识图谱进行提取以保留有用信息,并对知识进行提炼以捕获

更准确的用户偏好。这篇文章提出了Knowledge-aware

ConditionalAttentionNetworks(KGAN)网络,对于给定target

(即用户-物品对),基于知识感知的注意力自动从全局的知识图

谱中提取出特定于target的子图。通过在子图上应用条件注意力

机制进行邻居聚合,以此实现对知识图谱的细化,进而获得特定

target的节点表示。

强化学习

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论