2024Ranking经验分享应用_第1页
2024Ranking经验分享应用_第2页
2024Ranking经验分享应用_第3页
2024Ranking经验分享应用_第4页
2024Ranking经验分享应用_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

知Ⓖ推荐页Ranking经验分享知乎推荐页场景和Ranking深度学习在RankingRankingAPPFeedRankingGlobal能处理更高维度特征,如几十万话题量级,GBDT无法完成训练;使用GPUHDFS2、内容画像Multihot:内容多个话题OnehotwithvalueMultihotwithvalue特征原始值全:比如加历史CTR特征的时候,可以把pv和click都带上;显式交叉特征:DNN能学习特征的非线性能力,增加交叉特征可以降低模型搜索的会大,什么样的内容更容易被用户点,比如视频在wifi下更容易被点,视频点击率高数据挖掘特征:如内容Embedding特征。文本角度:tfidfword2vec等;数据:将搜索行为进行session切分,组织成类似于sentence序列;样本:85oloss:nce-loss“上下文”就是指在点击该Item事件前后,固定窗口下其他Item的Id信息。DNN两个独立的隐含层cancat最后输出sigmoid与交叉熵损失作为lossDNN将用户和内容的特征,分别按照内容的field分为不同的每个block将上面的隐含层concat再经过后面的DNN模型。Deep增加了一阶和FM模块,FM通过block之间的内积实现;AUC提升0.2LastView+Lastviewtopic与当前内容的几个topic计算AttentionScore,再按权重进行sumpooling;AUC提升约0.2我们基于的考虑是用户过去点击的内容肯定对他2将要点击的内容产生动态影响,这个模EmbeddingLastDisplay+点击的内容对当下的点击行为同样会产生影响,所以这里面增加了LastDisplay(包括点击LastDisplay经过Embedding后与是否点击结合,再进入GRU模块,最后状态当做DNN输入;AUC提升约0.4CTR点赞率,基于评论率等等,一共设计8个目标。每个taskLoss可以是几个task的loss做简单线性加权;上线仍然要确定各个ctr1、对于随时间变化的统计特征,比如用户和内容画像的统计值,线上service应当纪录请2、如果发现线下效果好,比如AUC和NDCG提升明显,但上线效果不显著,很可能是们GlobalRanking使用同一套proto结构和特征抽取模块实现;4、做特征归一化操作,发现有特别大的值,比如几万或者几十万,要先取log,不然会导致这个特征大部分值都趋向0,相当于征失效;5、输入特征要做非法检查,防止出现inf,nan6、对于线上的每次请求,用户特征都是一样的,可以只计算一遍用户特征相关的block,7、训练数据量要尽可能大,可以使用FlatBuffer结构把训练数据存放在HDFS上,训练时直接从HDFS读取,边读取边训练;搜索带着query来的,结果与之相关性越高越好,不用太关心结果的多2、CTR预估模型是pointwiseCr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论