今日头条的人工智能技术实践课件_第1页
今日头条的人工智能技术实践课件_第2页
今日头条的人工智能技术实践课件_第3页
今日头条的人工智能技术实践课件_第4页
今日头条的人工智能技术实践课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

今日头条的人工智能技术实践

今日头条的人工智能技术实践1媒体形式的历史变迁书籍公元前1000年传唱史诗公元前2000年《吉尔伽美什》《尚书》公元200年《威尼斯公报》报纸20世纪20年代匹兹堡KDKA电台

贝尔德的电视机

广播&电视互联网20世纪70年代互联网雏形ARPANET诞生

媒体形式的历史变迁书籍公元前1000年传唱史诗公元前22从人工到智能算法的媒体革命创作

人工

智能算法

分发管理从人工到智能算法的媒体革命创作人工智能算法分发管32016年是一个历史拐点

“近日,第三方监测机构易观发布了一个具有“里程碑式意义”的数据:2016年,在资讯信息分发市场上,算法推送的内容将超过50%。

这将成为一个分水岭。它意味着,我们以后接触到的信息,将主要由“智能机器人”为我们准备,而以往看似不可或缺的“人工编辑”角色,则不可避免地被边缘化。

自2012年今日头条开启算法分发的尝试,4年之后,算法时代正式宣告来临。”

-----《钛媒体》

2016年是一个历史拐点 “近日,第三方监测机构易观发布4互联网时代内容分发形式的变革门户社交媒体&社交网络推荐引擎互联网时代内容分发形式的变革门户社交媒体&社交网络推荐引擎5智能算法给内容分发带来的红利平台类型 优势 缺陷门户

人工精选内容,质量有保障

分发效率低,日均分发数百条内容,用户长尾兴趣无法被满足社交媒体

个性化,内容分发效率高信噪比低,充斥大量不感兴趣的内容

社交网络

个性化,内容分发效率高互动性好

,信噪比低,充斥大量不感兴趣的内容

算法推荐

个性化,内容分发效率高需要更多,更好的数据

智能算法给内容分发带来的红利平台类型 优势 缺陷门户人工62012.3字节跳动成立2012.8今日头条APP上线2012.12日活跃用户超过100万2013.5B轮融资2014.6C轮融资2014.12超越所有国外同行2016.8用户规模超过5.5亿日活跃用户超过6000万一直被模仿,从未被超越:大量的“山寨”头条追赶,其中不乏互联网巨头,均落后于头条。已有美、日、印尼等国的互联网公司宣称自己是“xx(本国)”的今日头条。2013.7日活用户超过1000万开创最早技术 用户最领先

规模最大字节跳动是移动互联网成长最快的公司之一2015.11日活超过3000万推出短视频平台2012.32012.82012.122013.52014.7传统内容分发平台纷纷拥抱算法推荐Twitter近年股价变化Facebook近年股价变化

除了以今日头条为代表的新兴智能推荐平台,传统新闻APP,浏览器,搜索应用,社交平台(Facebook,微博)纷纷上线资讯智能推荐功能《Facebook披露信息流排序方式

:发布新功能》

2013

新浪科技《Twitter调整消息流排序

不再严格按时间顺序》2016

新浪科技

传统内容分发平台纷纷拥抱算法推荐Twitter近年股价变化8基于智能算法的内容推荐推荐系统的核心算法可以根据用户标签,内容标签和情景信息,计算用户对内容感兴趣的概率基于智能算法的内容推荐推荐系统的核心算法可以根据用户标签,内9典型推荐算法协同过滤Logistic

Regression

Factorization

Machine

GBDTDNN典型推荐算法协同过滤LogisticRegression10典型推荐特征相关性特征关键词匹配分类匹配主题匹配来源匹配环境特征地理位置时间

热度特征全局热度分类热度主题热度关键词热度

Bias特征用户先验点击率用户性别用户年龄

协同特征点击相似用户兴趣分类相似用户兴趣主题相似用户兴趣词相似用户

上下文特征

上一刷内容最近N次推荐内容最近N天推荐内容

典型推荐特征相关性特征环境特征热度特征Bias特征11基于智能算法的文本内容分析文本内容自动分析是新闻推荐系统的基石,主要应用包括精细分类,主题分析和实体词提取体育/足球/德甲

拜仁,安切洛蒂,多特蒙德基于智能算法的文本内容分析文本内容自动分析是新闻推荐系统的基12典型的层次化文本分类算法元分类器元分类器元分类器元分类器元分类器元分类器

元分类器元分类器元分类器root元分类器类型:SVM

SVM+

CNNSVM+CNN+

RNN

典型的层次化文本分类算法元分类器元分类器元分类器元分类13实体词识别算法

分词&词性标注

英超

N

利物浦

N

0-0

曼联

N

,德赫亚N

。。。

抽取候选

英超联赛利物浦足球俱乐部*利物浦市*曼联俱乐部德赫亚。。。去歧

英超联赛利物浦足球俱乐部曼联俱乐部德赫亚。。。计算相关性

实体词识别算法分词&词性标注英超N利物浦N0-14基于智能算法的图像识别对全自动化的智能推荐引擎而言,准确快速的图像识别对于分析内容特征,广告色情识别至关重要奥巴马

美国

国际基于智能算法的图像识别对全自动化的智能推荐引擎而言,准确快速15一种识别易引起不适图片的算法基于ImageNet训练好的CNN抽取向量标注样本图片训练NN分类器一种识别易引起不适图片的算法基于ImageNet训练好的C16基于智能算法的写稿机器人人工智能已经可以在财经报道,体育赛事报道等领域自动创作内容,可读性完全可以媲美人工编辑图片库直播语料素材基于智能算法的写稿机器人人工智能已经可以在财经报道,体育赛事17算法辅助视频封面选择封面选择对视频的点击率有重要影响,智能算法可以自动给出封面建议,减少视频上传者的选择成本预估点击率

0.2预估点击率

0.3预估点击率

0.1预估点击率

0.2算法辅助视频封面选择封面选择对视频的点击率有重要影响,智能算18算法自动生成视频集锦智能算法可以从体育比赛,MV等长视频中自动抽取精彩片段,甚至生成gif,可以节省用户时间和流量算法自动生成视频集锦智能算法可以从体育比赛,MV等长视频中自19

Q&AQ&A20今日头条的人工智能技术实践

今日头条的人工智能技术实践21媒体形式的历史变迁书籍公元前1000年传唱史诗公元前2000年《吉尔伽美什》《尚书》公元200年《威尼斯公报》报纸20世纪20年代匹兹堡KDKA电台

贝尔德的电视机

广播&电视互联网20世纪70年代互联网雏形ARPANET诞生

媒体形式的历史变迁书籍公元前1000年传唱史诗公元前222从人工到智能算法的媒体革命创作

人工

智能算法

分发管理从人工到智能算法的媒体革命创作人工智能算法分发管232016年是一个历史拐点

“近日,第三方监测机构易观发布了一个具有“里程碑式意义”的数据:2016年,在资讯信息分发市场上,算法推送的内容将超过50%。

这将成为一个分水岭。它意味着,我们以后接触到的信息,将主要由“智能机器人”为我们准备,而以往看似不可或缺的“人工编辑”角色,则不可避免地被边缘化。

自2012年今日头条开启算法分发的尝试,4年之后,算法时代正式宣告来临。”

-----《钛媒体》

2016年是一个历史拐点 “近日,第三方监测机构易观发布24互联网时代内容分发形式的变革门户社交媒体&社交网络推荐引擎互联网时代内容分发形式的变革门户社交媒体&社交网络推荐引擎25智能算法给内容分发带来的红利平台类型 优势 缺陷门户

人工精选内容,质量有保障

分发效率低,日均分发数百条内容,用户长尾兴趣无法被满足社交媒体

个性化,内容分发效率高信噪比低,充斥大量不感兴趣的内容

社交网络

个性化,内容分发效率高互动性好

,信噪比低,充斥大量不感兴趣的内容

算法推荐

个性化,内容分发效率高需要更多,更好的数据

智能算法给内容分发带来的红利平台类型 优势 缺陷门户人工262012.3字节跳动成立2012.8今日头条APP上线2012.12日活跃用户超过100万2013.5B轮融资2014.6C轮融资2014.12超越所有国外同行2016.8用户规模超过5.5亿日活跃用户超过6000万一直被模仿,从未被超越:大量的“山寨”头条追赶,其中不乏互联网巨头,均落后于头条。已有美、日、印尼等国的互联网公司宣称自己是“xx(本国)”的今日头条。2013.7日活用户超过1000万开创最早技术 用户最领先

规模最大字节跳动是移动互联网成长最快的公司之一2015.11日活超过3000万推出短视频平台2012.32012.82012.122013.52014.27传统内容分发平台纷纷拥抱算法推荐Twitter近年股价变化Facebook近年股价变化

除了以今日头条为代表的新兴智能推荐平台,传统新闻APP,浏览器,搜索应用,社交平台(Facebook,微博)纷纷上线资讯智能推荐功能《Facebook披露信息流排序方式

:发布新功能》

2013

新浪科技《Twitter调整消息流排序

不再严格按时间顺序》2016

新浪科技

传统内容分发平台纷纷拥抱算法推荐Twitter近年股价变化28基于智能算法的内容推荐推荐系统的核心算法可以根据用户标签,内容标签和情景信息,计算用户对内容感兴趣的概率基于智能算法的内容推荐推荐系统的核心算法可以根据用户标签,内29典型推荐算法协同过滤Logistic

Regression

Factorization

Machine

GBDTDNN典型推荐算法协同过滤LogisticRegression30典型推荐特征相关性特征关键词匹配分类匹配主题匹配来源匹配环境特征地理位置时间

热度特征全局热度分类热度主题热度关键词热度

Bias特征用户先验点击率用户性别用户年龄

协同特征点击相似用户兴趣分类相似用户兴趣主题相似用户兴趣词相似用户

上下文特征

上一刷内容最近N次推荐内容最近N天推荐内容

典型推荐特征相关性特征环境特征热度特征Bias特征31基于智能算法的文本内容分析文本内容自动分析是新闻推荐系统的基石,主要应用包括精细分类,主题分析和实体词提取体育/足球/德甲

拜仁,安切洛蒂,多特蒙德基于智能算法的文本内容分析文本内容自动分析是新闻推荐系统的基32典型的层次化文本分类算法元分类器元分类器元分类器元分类器元分类器元分类器

元分类器元分类器元分类器root元分类器类型:SVM

SVM+

CNNSVM+CNN+

RNN

典型的层次化文本分类算法元分类器元分类器元分类器元分类33实体词识别算法

分词&词性标注

英超

N

利物浦

N

0-0

曼联

N

,德赫亚N

。。。

抽取候选

英超联赛利物浦足球俱乐部*利物浦市*曼联俱乐部德赫亚。。。去歧

英超联赛利物浦足球俱乐部曼联俱乐部德赫亚。。。计算相关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论