探秘社交相关性排序算法_第1页
探秘社交相关性排序算法_第2页
探秘社交相关性排序算法_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

探秘社交相关性排序算法

社交相关性排序(SocialRelevancyRank)即将诞生。届时,当你搜索“活动流”时,所得的结果不会再按照时间顺序排列,而是会根据每条信息与用户的“社交图谱(socialgraph)”之间的相关性来排列。也就是说,那些与你关系更为紧密的人将会排在前面。这种模式的流程如何?实际上,需要通过一个算法,就像谷歌的PageRank一样。以好友为依据将你所关注的人排在搜索结果的前端是一种显而易见的做法,但Twitter目前仍未采用。现在,当你在Twitter上搜索“Wilco”时,所得的结果会按照时间先后排列。这种方式其实并没有很好的体现“相关性”,因为搜索结果中的多数信息都来自于陌生人。但如果所列信息来自于你所关注的人,那么搜索结果就将更为有用。Twitter目前并不支持这种模式,但FriendFeed却已经很好地采纳了这一模式。FriendFeed会根据用户的社交图谱对搜索结果进行过滤。对于FriendFeed而言,要做到这一点并不困难。一方面,它了解你所关注的人;另一方面,它会将高端feed搜索技术整合到了用户的社交图谱中。这种方式听起来很很棒,但也存在一个问题。搜索“Wilco”时,效果不错,因为这支乐队刚刚推出了新专辑,但是很多其他的关键词却无法返回任何结果。道理很简单,你在Facebook上的好友以及在Twitter上所关注的人不可能对你所感兴趣的每个话题都发表评论。问题在于数据稀疏,也就是缺乏可信赖的观点。寻找更多数据来源很明显,想要解决数据稀疏的问题就需要更多的数据。解决方案之一就是整合其他可信赖的资源,比如拓宽社交图谱。例如,搜索结果所列的内容未必来自于你直接关注的人,它还会包含那些你关注的人所关注的其他人。在Facebook中,就是所谓的“好友的好友”。你或许会认为,自己并不熟悉这些人的观点,因而并不信任他们,但“六度分隔理论”表明,人们的社交圈都很小,因此,这类内容通常会拥有相同的价值。还有一种方法就是将兴趣类似的人整合到一起,这也就是所谓的“兴趣邻居(tasteneighbors)”。这种方法在垂直社交网络中非常普遍,例如Last.fm、Flixster和Goodreads等。这些网络都能够帮助你了解,除好友之外还有哪些人与你类似。然而,这种运算成本较高,而且非常耗时。如果Twitter要完成类似的功能,就需要根据人们所发布的链接和Twitter信息的语义来判定。即使这一问题非常棘手,但随着时间的推移,应该可以解决。群体因素除了使用社交图谱的“第二度”和“兴趣邻居”外,社交相关性排序还可以为具有影响力的人赋予更高的权重。在缺乏任何其他衡量标准时,那些拥有数十万名关注者的人有可能会比其他陌生人具备更高的相关性。使用关注者的数量来衡量剩余的“活动流”是一种不错的方式。总之,将来自陌生人的无数信息机械地整合在一起并非上策。正如人们很少会查看谷歌搜索第一页以后的内容一样,以时间顺序排列的Twitter信息也将很快令人厌倦。社交相关性排序需要将群体的共同感受考虑进来,以此来提供一种过滤标准,从未为你提供更多的结果。完美算法完美的算法并不存在,即使PageRank也不够完美,但我们依然觉得它很有用。正如PageRank在互联网中所起的作用一样,假以时日,社交相关性排序也将帮助我们了解社交网络中无穷无尽的“活动流”的意义所在。这种排序将会对我们了解好友的方式产生深远的影响。假以时日,社交相关性排序还将改变通用网络搜索。如今,通用网络搜

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论