专13-4-深度学习在新闻推荐中应用_第1页
专13-4-深度学习在新闻推荐中应用_第2页
专13-4-深度学习在新闻推荐中应用_第3页
专13-4-深度学习在新闻推荐中应用_第4页
专13-4-深度学习在新闻推荐中应用_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

深度学习在新闻推荐中应用鞠奇机器学习博⼠推荐/搜索/⼴告变现技术总监基于内容(个性化)推荐数据平台技术经理POI平台建设与策略应用狗名字TFIDF丁丁在西藏丁丁在西藏·⼤开本经典收藏版(全22册)(比利时著名连环画⼤师埃尔热的经典巨著)标题详情描述TFIDF•IDF--低频词:⾼权值关键词,放⼤了⽣僻词的重要性;--新闻源的质量,IDF使用的新闻源和需要处理的新闻出自不同的⽹站,编辑习惯,甚⾄新闻频道的划分等等都会带来误--新闻源是⾄少半年以前的资料,新闻的时效性影响这关键字的波动。TextRank算法基于PageRank,用于为⽂本⽣成关键字图,节点是⽹页。如果⽹页A存在到⽹页B的链接,那么有⼀条从⽹页A指向⽹页B的有向边。数量假设:在Web图模型中,如果⼀个页面节点接收到的其他⽹页的⼊链数量越多,那么这个页面越重要。向其他页面传递更多的权重。所以越是质量⾼的页面指向页面A,则页CAFDCAFDPageRankBBEE并只保留指定词性的单词(noun,verb等)。nkk依次由下面的单词组成:⼀个窗⼝中的任两个单词对应的节点之间存在⼀个⽆向⽆权的边。基于上面构成图,可以计算出每个单词节点的重要性。最重要的若⼲单词可以作为关键词。导致结果的相关性和主题性降低;•旧的页面等级会比新页面⾼。因为即使是非常好的新页面也不会有很多上游链接,除非它是某个站点的⼦站点。pageRank,•Tfidf,CADFCEDCADFCEDBBEEtBBFFAAUnimportantSemanticWordRank–关键词提取并只保留指定词性的单词(noun,verb等)。假设每篇⽂本依次由下面的单词组成:通过SemanticWordRank的算法计算每⼀个word的重要性最重要的若⼲单词可以作为关键词。义聚类层次语义聚类算法0.30.50.30.5层次语义聚类算法0.70.9d1d2d3d4……d5d6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论