视频智能技术与平台论坛

上传人：1*** IP属地：北京上传时间：2023-03-19 格式：DOC 页数：27 大小：116KB 积分：15 举报 版权申诉

已阅读5页，还剩22页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

主题：视频智能技术与平台论坛时间：2017年9月15日地点：国家会议中心主持人：尊敬的各位来宾、各位朋友，大家下午好，欢迎大家莅临2017百度云智峰会智能视频技术与平台专题论坛。我是本场论坛的主持人，我叫康盛，谢谢大家。风云际会，AI先行，百度在今年6月份的AI开发者大会上，百度COO陆奇发布了Allin（英文）AI的主题演讲，在上午的会议中百度总裁张亚勤以及百度云总经理尹世明分别介绍了ABC驱动时代的发展，以及百度云如何在ABC时代唤醒万物，赋能各行各业。今天我们有幸邀请到了视频行业各位专家，以及百度云在媒体行业的技术专家，来一起讨论，ABC如何赋能视频行业。首先我们有请百度多媒体云总经理李旭来为本场论坛点题-ABCinspire媒体行业。有请。百度多媒体云总经理李旭李旭：欢迎大家来到视频技术论坛。我相信大家听过早上主论坛演讲已经感知到了百度通过ABC技术给各个行业的变革做改变的这样一个决心和力量，所以接下来这个论坛我们重点讲一下百度ABC技术是怎么给视频相关行业带来变革的。我们以媒体行业作为例子，其实媒体行业从活字印刷术这个技术被发明创造出来到如今，每一项新技术都给媒体行业带来一次新的革命，让我们媒体行业从原来的纸质图文方式开始往视频方向去演进，如今视频已经取代了图文，变成了传递信息的主要载体。视频特别是通过移动互联网时代的到来，直播短视频这种新型视频技术已经成为人们传播文化和，表达情感的主要途径。当人工智能时代成为移动互联网下一幕的时候，我们整个视频时代也进入了下一幕。去年，一年之前我们其实就提出了视频时代的下一幕：读懂视频，今年我们给各位在座的朋友们去汇报一下，我们在过去这一年时间百度云做了什么，我们整个行业发生了什么样的变化？首先来看一下整个视频人工智能技术的发展。首先是我们视频人工智能技术所依托底层的硬件，当传统处理期CPU已经逐渐不再照着摩尔定律去发展的时候，其实在AI领域包含像GPU，TPU以及百度早上发布的XPU这种AI专业的芯片仍然在高速发展，依托于这样一个AI的硬件基础，我们各种适应不同场景的深度学习框架开元开源开放，为训练出更优的计算机视觉、NLP的AI服务带来了可能。特别是在计算机视觉这个领域，AI技术已经逼近了人类的判断，在视频领域我们权威的评测集合在指数级的增长，意味着AI感知能力在不断地提升，在图片领域、在理想情况下AI感知能力已经超越了人类感知。所以当整个行业技术在发生翻天覆地变化的时候，整个人工智能包括大数据的技术在给整个视频行业，包括互联网，包括视频监控，包括广电领域带来了很多革命。在电视编目，短视频生产，搜索推荐和视频场景化营销方面，人工智能和大数据无不带来变化，百度也及时抓住了行业发展脉搏，我们把整个云计算带代入了一个2.0时代，我们在把传统云计算之上引入了人工智能和大数据能力，通过三位一体的云计算技术，我们赋能企业发展的核心环节，流量获取，流量变现，市场推广，在每一个核心环节都有很多实现的方式，这些方式如何进行有机的结合，这才是企业赢得市场的关键。所以百度云视频ABC就是为了企业视频业务的发展所带来的最佳实践。我们通过ABC的这种视频技术的结合在依托于百度的内容生态，我们会通过提供技术革新的视频基础云的技术，帮助我们互联网直播平台带来更好的观看体验，通过业内首创的视频AI产品，帮助广电融媒体做更好的内容审核和我们内容的编目效率的提升。帮助我们的视频监控领域带来更多更及时的行为检测，我们的合作伙伴中科大洋，央广视讯，包括威创集团，包括天闻数媒都将给大家带来相关方向的分享。在视频大数据这块，我们也结合视频人工智能技术两者相结合给我们短视频社交带来最佳实践，人人视频也带来在这块的分享。最后通过我们的百度内容生态连接给各行各业企业带来更多的流量曝光的渠道和能力。我们希望通过百度云ABC的技术，能够为用户带来视听体验的质变，这就是百度在视频行业的使命。接下来由我同事为大家带来精彩的分享，谢谢大家！黄锋百度云高级产品专家黄锋：大家好，刚才李总介绍了整个视频的ABC和生态怎么样赋能我们视频相关的行业，我的这个部分重点针对其中A的这一部分，也就是AI这一部分来介绍一下百度云在这方面的一些产品。大家知道，通过我们看到一些权威数据，互联网上产生的这些流量当中，视频流量占73%，而这个数字预计到2021年达到82%。在互联网泛云的领域全国有数百家直播平台，每天有数百万主播在进行着直播。在我们国内有很多短视频平台上所有的PGC，UGC每天会产生上百万的新增的视频，全国有上千个电视台，几千个频道也在每天新增着很多电视节目。每年我国会新增数千万个摄像头，而这些摄像头其实无时无刻不在产生着新的数据，视频数据其实非常重要，它的价值很大，而我们对于它的这种理解其实有非常地困难。传统的做法是其实大家都会组建一个人工的这种审核标注团队，由人来理解这个视频打一些标签，做一些审核，人工审核有一些什么样的问题呢？首先第一个问题成本比较高。这个成本包括人力成本、培训成本，我们知道人力成本其实每年都在逐渐地往上涨。我们看到有些客户特别是广电领域有一些四级的编目，分析一个小时的视频花费数百元。第二个问题是效率低，还拿四级编目来看，分析一个小时视频需要两个多小时才能完成。第三，召回比较低。因为你分析这件事情其实对于分析员、对于人的要求是比较高的，同样一个视频可能不同人去看，大家对它的理解是不一样的。所以质量其实也是参差不齐的。我在想，能不能用机器，用AI的技术来替代人工做繁琐的这种事情呢？实际上，在百度内部视频AI相关的这些基础的AI能力早在百度内部得到了广泛使用，比如说图像识别技术，其中文字识别，人脸识别，物体识别，图像审核，这样的技术早已经用于百度的图像搜索，包括贴吧这样一些产品线。语音识别也都用于比方说百度的语音输入法度秘这样的产品，百度拥有17年的自然语言处理技术，包括百度的搜索，百度的新闻，其实后台都是自然源处理，这是一个非常重要的一个功能。今年我们今年这个团队很大的一个重心就是怎么样利用百度已有这样一些视频AI的基础能力，实现真正视频这个层面的一些AI的能力，我们今年跟上百个种子客户一起去摸索探索应用场景，去优化我们的技术，去迭代，非常高兴也看到了我们的技术，对我们客户的业务产生了价值。所以今天我会发布三个视频AI的产品，分别是视频内容分析VC，视频内容审核VCR和视频封面选图VCS。我们首先看VC，VC做了一件什么事情呢？将某一个视频结构化，因为我们知道一个视频它包含的信息很多，往往我们对于视频里面的一些信息，如果人不去做，不去看很难去理解，我这个结构化包含哪几个部分？首先第一是场景识别，我们可以识别出来一个视频它是一个体育比赛，还是一个娱乐节目，还是一个演唱会。这个可能更多是一些比较泛的这样一些标签。包括我们也可以识别出来视频里面画面中出现的公众的人物，识别出画面中出现的一些物体，还得到了一系列关键词的标签。同样我们还可以得到一个人识别不了，但是机器能识别的视频的特征向像量（音）。整个VC的这种分析的原理是什么？首先我们知道，一个视频它是由音频和一系列联合国的帧组成的，首先我们将视频分层，会在整个视频大的维度进行视频场景识别的模型，真正地去从一个宏观角度去看这个视频是在讲什么？从细力度的来看我们从图像维度会做，首先会在图像中通过（英文）找到一些关键帧，对这些帧做一些人脸识别，物体识别这样的处理。对于音频来讲，我们将音频通过语音识别的技术转成文字，然后图片和语音这种细力度的数据产生非常多的这样一些文本，我们再用自然语言处理的技术，将分析它的一些词性，词频得到一些标签，多个维度再做一些交叉验证，最终输出各个维度的标签，最后对视频进行结构化的描述。相信大家上午参加主论坛可以看到演示的最终效果。我们VC有什么样的特点和优势呢？首先，在整个视频主体场景识别这个维度，我们积累了有上千万训练标注好的这种数据，训练我们场景识别的模型，我们可以识别出来5000多个场景，在今年8月份刚刚结束的国际权威的Activity（英文）这样一个视频内容分析的一个比赛当中百度获得了第一名。在视频的人物识别这个维度，我们拥有世界领先的人脸识别技术，这不是最重要的，重要的是我们还有全球最大的百度百科公众人物的人脸库，并且我们技术也可以支持客户自定义自己的人脸库。在视频的物体识别这个维度，我们识别超过4万种的物体，通过人工来讲，整个AI分析效率可以提升5倍，每天吞吐能力可以相当于一万个人，并且这个吞吐能力可以随着我的机器水平扩展。我们分析的成本相比于人工降低了50%，召回率提高了10倍。我们通过VC得到了包括视频里面的一些人、物体、时间、地点等等这样一些结构化的表述，它有什么用呢？通过上半年我们跟种子客户的一些交流探索去摸索这样一些应用场景，我们目前看到的有几个比较典型的应用场景。第一，视频内容搜索，我可以搜索出某一个视频里面某个人讲了什么样的话，在哪一秒钟，在哪个画面中出现了一个什么样的物体，这个更常见于我们电视台内部很多这种素材的检索，特别是在制作一些新的电视节目的时候。第二，视频的个性化推荐和相关性推荐。这个在短视频平台里面比较常见，关于搜索和推荐后面有一个主体，我的同事张爽会详细介绍，还有一个应用场景，就是场景化营销。比方说我在看一个手机评测视频的时候有可能直接推给我关于这个手机的一个购买链接，我可能购买的欲望就很强，转化率很好，比方说我在看一个旅游的视频节目，给我推荐一个飞机票这样一个购买链接，我也很有可能去点击购买，这其实都是一些营销相关的一些应用场景。其实，在VC它的能力开放出来了之后，我们会看到可能还有很多我们现在还不知道的应用场景，这些应用场景就靠我们一起去探索。为大家介绍的第二个产品是视频内容审核VCR。顾名思义内容审核就是将视频里面的色情、暴恐、政治人物、广告等等各种不太合规的内容识别出来，我们识别的原理是什么呢？同样跟VC类似，我们也是将视频分层，分为帧和音频，首先我们会过一个视频指纹的黑库，这个黑库是客户之前通过人工或者通过其他方式标记过的确认是违规的一些内容，同样我们提取图样的一些特征，生成文的一些特征，通过这两个特征对在视频黑库里面进行比对。这种比对方式比传统的镜头检测，或者纯图像维度的特征抗干扰能力会更强，确保有一些被命中的一些视频可以被找出来。如果命中那可能直接就封禁掉，如果没有命中，那我们再进行一些实时的审核，同样从两个维度，从图像维度我们对图像帧进行色情识别，政治人物识别和暴恐识别，和文本识别，我们文本审核出来的文字再在过文本的黑库。从语音维度分两个层面，一个将语音转成文字，将这些文字过文本黑库。另外一个维度，就是纯语音的维度，有一些交传识别的模型，可以发现这种非常隐蔽的违规的内容。综合我们从图像和音频得到了这样一些结果，我们最终会输出整个视频整体的一个审核结果，要么没有违规内容通过，要么确认是违规的我们就可以把它封禁掉，有一些疑似的我们可以推给人工再二次审核，我们跟合作伙伴央广视讯有一个合作，既有人审还有机审神。其实VCR还有更多应用场景，比如说视频去重，有很多上传上来的视频有的仅仅是分辨率不一样，有的是加了一些贴片，其实它的主体内容是一样的，我们就可以用VCR里面视频比对的技术，来查出来这种重复的内容。第二个广播监播，我们看到一个应用场景，我们可以对电视台直播流里面的一些视频广告进行检测，可以统计出来某一支只广告在哪些频道，什么时段进行了播出，对广告投放效果进行一些数据分析。第三个应用场景，就是侵权检测，我们可以把一些版权内容入库，如果UGC，或者PGC上传上来的内容跟我们版权库的这个有重复，说明它很有可能涉及侵权，我们也可以把这个视频找出来，当然VCR可能还有很多很多我们目前还没有探索到的应用场景，同样也需要跟我们的客户合作伙伴一起去探索。最后介绍的产品是视频封面选图VCS，我在市面上主流的几款视频APP做了首页的截图，大家可以看到，其实这个封面图在视频APP里面的显示占比非常大吸引网民去点击有两个因素，要么是这个标题比较吸引人，要么你的图片，这个封面比较吸引人，所以视频质量的好坏其实一定程度上决定了网民要不要点进去，要不要去看，间接的决定了用户的在线停留时长，就是你视频APP的黏性。针对这个问题，我们发布了一个VCS这个产品，首先我们会用（英文）这样的技术去识别分析出来找到一些关键帧，然后对这些每一帧进行一些主观和客观质量的过滤，包括美观程度，色彩搭配、清晰度这样一些主客观的质量，筛选过后会得到一些侯选的集，当时我们读懂了这个内容，可以找出这个相似度的某一帧更能代表视频主体的内容，它可能更能够吸引网民去点击。同样一个视频我上传到了国内几个主流的视频APP上，多数情况下大家截的都是首帧，首帧的画面是一个播音员，是一个播音员是很难让网民播音员知道，这个视频内容里面讲的是什么的。我们看更多的一些视频封面选图的一些效果，这是两个百度的一些宣传片的视频，通过常规的通用这种封面图选取的技术，会得到上面这两幅图，通过VCS得到下面这两幅图，下面的图更加吸引人去点击浏览。上面跟大家分享的三款产品其实已经在百度云的官网开放了，大家感兴趣的话可以登陆我们的官网去申请，我们会线下跟大家去对接，去探索更多应用场景，去测试，包括我们希望我们的技术还是能够赋能大家，能够为大家的业务产生真正的价值，谢谢大家！主持人：感谢旭哥的主题演讲以及黄锋对百度云视频AI产品的重磅发布。让大家也感受到了我们视频时代的下一幕是读懂视频，通过百度云视频的AI能力可以理解视频的内容，深度去挖掘视频的价值，相信在百度云的视频AI能力将为媒体行业带来前所未有的变革。接下来我们将举行一个神圣的签约仪式。百度云将和天江智媒科技（北京）有限公司签署战略合作协议，双方将在智能内容生产方面、智能媒体内容运营等多方面展开合作，推动传统媒体行业结合百度人工智能技术进行技术转型，更好的服务大众。接下来有请签约人天江智媒科技（北京）有限公司董事长肖志彦，以及百度云渠道与生态总经理吴凯立上来签约。还有4位鉴签人，天闻数媒科技（北京）有限公司董事长向江，天闻数媒提问舒眉媒体业务部总裁韦宇鹏和百度多媒体云总经理李旭。有请。开始签约。（签约仪式）主持人：谢谢各位领导，可以场下先休息一下。感谢签约人以及鉴签人，相信百度云的智能多媒体服务，能够让更多的传统媒体行业进行转型，结合百度云的人工智能技术，让机器去替代人力，让采编播更高效、更智能。接下来我们有请天闻数媒媒体业务部总裁韦宇鹏韦总，用实例来给大家分享如何借力人工智能，推进媒体融合。有请韦总。韦宇鹏：天闻数媒媒体业务部总裁韦宇鹏各位下午好，我们也是刚刚跟百度云建立了一个传媒行业的战略合作，我就给各位行业专家，还有各位行业朋友，给大家汇报一下我们对于人工智能在传媒行业应用的简单一些探索。如果说媒体行业最热门的词应该是“媒体融合”，媒体融合的需求本质是什么？其实它还是在互联网环境下怎么样拉通用户和内容之间传统媒体，承担的还是这样一个桥梁的作用。如果我们套用通常的互联网+的说法，它有两层含义，一层就是互联网+宣传。因为我们的传统媒体，或者说主流媒体代表的是党和国家的发声，它是有宣传的属性，归结起来就是我们提的四力，传播力，影响力，引导力，和公信力，另外还有一个有互联网+资讯的增值属性，要向用户提供个性化、定制化资讯私讯的服务，在大背景下，互联网行业经历了几个探索的过程，第一，做的是载体的升级，更多偏重于新媒体端的建设，微博、微信、客户端，可能还有现在小程序新的模式，大部分的媒体在全国范围内已经完成了这一步的建设。第二步就是中央厨房的建设，中央厨房目前偏重业务流程的升级，包括建立统一的这样一个大屏指挥的中心，建立相关的采编播平台的升级，包括统一稿库的升级，这一步在很多央媒基本上已经实现，去年开始在今年各个省的地方媒体已经开始在紧锣密鼓的在进行，下一步中央厨房2.0，或者说我们媒体融合的再在新一个阶段往哪里走？在我们看来，更多是要把大数据，把人工智能这些技术融入，把我们现在的一个媒体越来越向这样一个智慧媒体的方向去走，这个就是我们现在理解的媒体融合后面，我们理解的演进方向。天闻数媒是一家科技和文化合作的公司，是新闻出版业技术出版实验室，专注于在文化传媒领域这样一个相关的发展，我们现在已经服务了众多中央级的媒体和部委，借助于百度的人工智能的技术，我们认为可以从资源、发布、生产、增值等多个方向与传统的媒体行业发酵，为了进一步加强我们也是和湖南五江集团一个比较强大的资本方合作成立了天江智媒，一家公司专注于AI和大数据技术在媒体行业的应用的公司。我们现在基本的产品构思就是基于百度云提供的强大（英文）的技术，主要是天算，天像，天智，天文在媒体领域长期业务的探索和对行业一个理解，我们将从资源管理，内容生产、发布传播、内容增值这四个层面去做对应的产品和这方面（英文）的应用，为这个行业客户提供更加优质的服务，这是我们从资源生产传播领域做的一些简单的梳理。今天因为时间相对比较宝贵。我主要就谈三个点。第一点，智能化的资源管理。任何一个媒体单位它都有它自己的资源，资源是它的一个重中之重，资源一般我们都会放的是所谓的一个资源库，在报社一般叫稿库，在电视台一般是叫媒资库，随着互联网的发展出现了三个比较大的问题，第一个大量的互联网信息，互联网的稿件信息进入你的资源库，怎么样进行处理，第二个是大量的富赋媒体信息，图片、音频、视频进入你的资源库，我怎么进行处理，特别是它的混和处理。第三个层面，就是知识体系，现在我这个资源不希望是一个零散的信息孤岛，我希望我的资源可以形成一个可重构可重组的支持服务的框架，这个怎么进行处理，有两个技术难点，第一个就是富赋媒体的处理，我怎么抽取它的公众人物，包括它的字幕、语音等等，这个一直是困扰行业的问题。第二就是知识化的处理，我一系列一个庞大的资源，我里边人物、场景，我相关的学科信息，我相关的地域信息怎么样给它做知识的量化，我要实现这两步，第一个先把它打碎，然后再融合起来。非常好的是，现在百度云提供了它的智能化的处理一个手段，像VCA，VCR这样一个核心能力，我们借助于百度它的大数据的文字处理，借助于它的图像处理，借助于视频处理，我们就可以实现，把所有的资源素材全部打碎，按照统一的逻辑进行重组，按照知识化的框架去进行一个重新的构建，基本上我们会经历这样一个采集、加工、智能化的管理，再对外提供统一的服务。服务的能力有两类，一类的是常规的检索调用。第二类就是深度应用，媒体这些静态的资产想要变现，我们想要做运营化资产化，一定它要具备这样相关的能力，通过这样的能力我们可以支持一些智能刊物，智能的创作，包括一些行业深度的洞察和应用，更多的能力都是可以逐步去进行一个发掘，这是我分享的第一个结合百度AI产品的方向，我们智能的一个媒资库。第二，我分享一下智能的内容生产，智能内容生产现在就是行业里比较热的，就所谓的一个机器人创作，智能内容生产第一步，我们定义为智能的辅助创作，第一个环节是辅助的选题策划，现在基于互联网，我用户关注的点是什么？关注的话题是什么？我要把相关的话题，包括话题的一些报道角度，报道的一些推荐我要传递给编辑记者，让他知道我现在要干什么？第二步，就是我们基于已经选择好的一个报道角度，我给他自动化的推荐相关的这些内容，给它拼成一个相对粗的稿件，这是我们叫做机器全自动的撰稿，但是这个撰写出来的稿件是相对比较糙操的东西。第三步人工要接入了，我们叫做智能化写作的一个参考，我们可以对这些稿件进行一些精细化的修改，我们通过AI的技术会推给它一些相关的内容，给它自动摘要，一些相关的话题，甚至互联网报道的情况，自动给它进行这种分析。基本上通过这样一个手段，这篇稿件就具有了雏形，最后就是一些辅助的手段，包括配上一些对应专家的信息库，一些语句自动的修改，通过这样一个手段可以非常方便的辅助一个内容的生产者实现一个半自动的一个机器的生产。生产出来的内容在发布之前还要做的就是智能刊物，过去的校对系统核心是在于对于拼写错误的检查，但是对于它的内容本身是否有错，是否有些领导人的文字和图片不匹配，是否有一些经典语录的描述错误，包括有一些涉政，涉敏的一些内容，这些我们通过AI在智能刊物系统里都可以得到处理。但是这里边核心也用到了百度对这个图片、视频这样一个智能刊物的手段。我们这个文章写出来，经过了智能的刊物，下一步就可以做智能的发布，在除了传统的编辑记者发稿以外，我们还可以提供互联网的新闻生产的模式，我从主流网站抓新闻，自动化的转载，同时我后边的自动生产的系统可以用机器人创作这个新闻来进行一个填充，也就是说我们可以把这个重量新闻，或者深度比较浅的浅表新闻，可以把它的内容量做得比较大。通过智能生产的体系可以极大的解决现在的传统媒体它的内容生产量不足的问题，以及提高生产效率把它的生产的效率，过去生产的文章我过去需要五千块钱，现在只需要一千块钱，更多的编辑记者做更多更深更好的内容的生产。第三个点，智能运营传播这样一个体系。智能运营传播就是我们的新闻已经上了互联网，用户已经可以看到了，传统的APP在用户没有产生相关浏览记录的时候是没有用户行为的，我没有办法对用户做相关服务的，但是现在有了互联网平台厂家一个借助，有了像百度它的基于全平台用户的画像，它基于这些画像提供给我们一些非常好的服务，基于这个听不清服务，这个白用户第一次进入我的APP，我就知道你大概的喜好，我就知道该给你推荐什么样的内容，这是最典型的就是新闻的智能推荐，一个用户进入我只需要把用户ID，还有对应新闻的整个一个列表上传到百度云，百度云就可以把它的一个推荐结果告诉我。也就是说对于新用户我有了一个更好的处理办法，随着我的用户行为记录的逐步提高，我可以把云和本地化两套作为一个部署，不断提高向用户服务的精准度，这个既包含了内容，也包含了对应的一些广告。听不清我们做这些的目的是什么？就是为了在互联网环境下做更好用户的运营，我怎么样提高我用户的黏性，提高我用户的活跃度，我怎么样做出来更多的优质用户，进而把这些用户去做变现，从哪个渠道获取用户的方式更好，这个我们也是有一套基于百度云一套运营分析的一个产品，可以去做一个比较好的支撑。刚才做了一个简单的分享，的运营分析的数据。刚才做了一个分析，这个就是基本上我们现在说在看到传媒领域，从资源管理到内容生产，到生产好的内容在互联网上进行传播，这样跟AI、大数据相结合的契合点，当然我相信我们还有更多的契合点去发现，我们天闻数媒，还有天江智媒，我们也有信心，也非常希望能跟百度一起，跟在座的各位朋友一起我们去探索这个人工智能怎么样更好的为这个行业服务，最后真的达到我们智慧媒体这样一个最终的效果，谢谢大家。主持人：感谢韦总，让大家看到了结合百度云多媒体AI技术，实现资源管理的智能化、内容生产的智能化、运营传播的智能化。接下来，我们来分享一个视频AI在广电行业的应用实践。我们非常有幸请到了中科大洋能力产品部经理杜伟给大家带来视频AI在广电行业的应用实践分享。谢谢！杜伟中科大洋能力产品部经理杜伟：大家好，我来自中科大洋的杜伟，我给大家分享的是视频AI在广电行业里面的应用实践。我先简单介绍一下我们公司。我们公司成立的时间也比较长，1989年，在广电这个行业也是一个非常知名的公司，我们公司给自己的定位是做泛传媒产业的一个技术服务提供商，我们公司因为历史比较长，合作的客户非常地多，包括什么中央台、新华社，反正就是广电行业的各种用户，在过去取得了一些成绩。这是我们公司主要提供的一个产品架构，可以给大家简单介绍一下，我们本身是一个做产品的公司，我们产品线相对比较全，在传媒行业有所谓的采编自保制播存的业务版权，我们做的东西，包括像新闻产品，新媒体，包括一些后期制作、图文包装，还有播出，还有前面大家提到的媒资、内容管理，这样一些。基于这些产品线我们会形成各个业务方面的一些解决方案，包括内容生产的解决方案，内容管理的解决方案，分发方面的，最后我们主要服务的对象，主要是电视台、网络运营商、互联网机构、各种内容制作的。这是我们公司大概的情况。最近这些年广电这个行业，在我们广电行业自己内部的一些会议，或者论坛，像CCBN，BRTV这些行业会议上面讨论的非常多，因为我们广电行业确实受到了很大的挑战和冲击，现在大家都在想怎么去做，怎么去转型，另外我们广电行业也有是一个比较特殊的定位，我们确实是主流媒体一个舆论阵地，这个也是一个国家战略。从政策层面，刚刚这位同事也提到了，国家对这一块，包括广电的转型，怎么去做融合生产？怎么去做新媒体的这些融合的业务，最新的这个在今年1月份，中宣部发布了一个文章，打造新型媒体，打造中央厨房是一个非常重要的目标和实践。因为中央厨房这个话题在我们广电领域里面是非常地火热，现在很多项目也都在做，都在上，我们公司也有幸和人民日报社有一个战略合作，双方一块来建设这个中央厨房，现在也形成了一个标杆，大家都非常感兴趣。有很多人在问，中央厨房这个词相对来说它有一点不太好理解，大家不都是做广播传媒的吗？你建厨房啥意思呢？厨房的意思我们简单总结一下，它就是有4个一，第一个一，有一个统一的工作平面，从这个上面看到的，它有一个类似于航母这样的结构，有一个中心指挥区，有一些工作区，技术区，这是一个统一的工作平面。第二个一，有一个统一的资源库，前面也讲到了媒资，因为我们要做全媒体融合化的话，统一的资源库是一个合一，因为现在除了以前传统的来源，包括现在的互联网来源，还有PGC，UGC移动端的来源，所以统一资源库是非常重要的一部分，不管是稿件也好，素材也好，产品节目也好都会在一个统一的资源库里面，有了这个东西最后才能形成一个资源的共通共享，发布到所谓的两微一端，还有一条，现在还有头条。第三个一，统一的技术支撑体系。这个跟百度讲的话题比较有关系了，因为所有广电厂房也好，或者广电客户也好大家都会做这方面的考虑，因为以前建系统都是一个一个独立建的，现在大家技术体系都会做一个通盘的考虑，统一的建大数据分析平台，舆情的平台。第四个一，有一个统一的从生产到反馈一个统一的闭环，这也是非常重要的。这边的图它展现的是有一个统一的指挥调度，包括统一的看到之后你在不同发布的渠道，不同的途径，最后传播的情况怎么样，所谓的闭环，吗？它是怎么分发出去的，怎么传播的，反馈如何？回过头来再来指导生产。所以简单说中央厨房大概就是这么一个概念。然后今天大家的会议主要是说，我主要讲的是AI这一块，因为在前面说做融合生产，做中央厨房建设，这些东西很多方面AI都可以提供一个非常好的助力，因为我本人一直是做研发的，现在也还是在做研发这方面的管理工作，所以我技术方面讲的稍微多一点。我们总结来说，在几个业务领域，内容汇聚、内容管理、内容生产、内容分发。这几个大的生产环节上面，我们可以引入的技术有这么一些。重点说一下内容管理这一块，大家前面都说了VCA，VCR，到了生产的领域我们要编片子，做节目，做新媒体的加工生产，做出东西来，在这一块人脸保护，智能拆条，还有同期声字幕制作，这也是非常实用。到了分发环节就是人脸黑名单过滤。这个是我们公司自己开发的一个，就是为了集成员工人工智能有一个基础框架，人工智能是各种能力，我们自己开发的框架它本身是一个分公司的框架，因为我们公司一直都是做视频的公司，所以我们自己有很强的，因为它AI有的时候不是直接拿过来就可以用的，它有的是支持的格式，或者说支持的形式是有一定局限的，因为广电行业有的时候是有一些特殊的东西，比如说一些特殊的编辑格式等等可以做一些预处理，基于这个框架我们可以很容易的像百度的人工智能这些服务，在电视台也好，或者说我们服务的厂商能够很容易的落地。这个场景就是现在电视台里面非常感兴趣的场景，大家都知道，在做一个节目的时候，像所有的节目都有字幕，比如做字幕这个过程，我们会用小蜜蜂这样的系统，基本上靠人工扒词核对，工作量很大，也比较繁琐，所以我们现在就通过我们的编剧工具，视频节目生产的工具和语音识别，语音转写做一个深度融合，恩就能够很好的提高这个工作效率，直接把语音识别的结果甚至直接可以转换成字幕文件，基本上能达到，比如像普通话，如果声音还比较好，准确率访谈类的能达到95%以上，所以这个极大地提高了他们的生产效率，这个我们和一些电视台也一块做这方面的尝试和科研项目。这个就是VCA这一块的介绍，我就不多说了，因为前面有百度产品的同事已经说的非常多了。我要说的就是，它解决的问题主要还是传统编目的成本比较高的问题，而且现在你比如说像我们在一些电视台做的媒资系统都是用的这种编目方式，当然现在所有的电视台都在做融合媒体，融合生产的转型，谈到以前的媒资库，就变成了融合资源库，融合资源库之后就会有大量的PGC，UGC的内容进来，如果还用原来的四级编目的方式显然不太现实，因为量太大了，而且这个内容可能价值也没有那么大，如果你都这样做编目的话就非常地不划算。所以我们用了VCA这个技术之后，这是我们软件界面的截图，这是一个资源的详情界面，分几个部分，第一块通过VCA直接提取出来的标签，标签会有一些维度，前面应该有介绍，识别圈场景的标签，还有里面物件的标签，还有通过语音识别的结果，还有OCR的结果产生的标签。另外一块还有一个中间结果，像语音识别的文本在资源库里面是可以直接使用的，比如说我们会跟一些客户合作。比如像新闻联播，或者他认为比较重要的一些节目，也是可以把文本直接审核出来，可以做全文检索或者做浏览等等，还有人脸结果也是可以直接识别出来的，在后面会对资源的查询检索会起到一个作用。前面就说到了VCA它最后出来的结果是提取的标签，但是它的价值还不只这些，现在更大的问题，我们现在很多客户都在向我们抱怨，因为我们有做很多资源库的项目，因为现在存在一个问题，东西不好找，原因就是用户通过一些调研总结，他们就是说有几个问题。第一，比如说我一个电视台，我是做体育的，你是做新闻的，我们都去找一个资源，我输入一个北京这个词，这个检索结构是一样的，因为东西太多了，都找不到，比如像中央台他的资源都是几千量级的，所以东西还是非常多，因为资源库的东西它不会减少，只会增加，所以到后来就会越来越不好找，东西非常多，所以我们就结合到前面VCA的技术，加上前面说到的用户画像，把这两者结合起来就能够比较好的解决这个问题，大概的意思就是说，因为我们系统里面都会记录，因为我们检索系统都有日志的，会记录用户的信息，他的检索历史，浏览历史，下载的历史都是会记的。刚才我们说到，通过VCA这个技术又给所有资源打了若干的标签，有场景的标签，人物的标签，还有一些语音识别的标签，还有一些关键词标签等等。通过这个用户的行为记录，加上用户自己的基本信息，我们就可以通过他的这个下载历史，或者是检索历史，就可以给这些用户打上一些标签，而这个用户的标签其实和资源标签完全是一个体系的，就是标签体系肯定是一个的。这个用户标签能产生出来的标签，完全取决于他对什么资源感兴趣，结果把资源标签带到了用户的身上，变成了用户的标签。因为我们在做中央厨房或者做融合资源库这样一些场景的时候，它和我们平常说的，比如我们在用百度的搜索引擎，或者我们平常购物，和这个用户标签的概念是不一样的，因为在我们融合生产的过程中，或者说在我们融合资源库的使用过程中，或者在中央厨房业务开展过程中，大家都还是在工作，是要完成自己的工作，而不是一个大家个人一个娱乐的事情。在我们这个里面所有的用户标签都是和资源相关的，相当于你的个人爱好如何。有了用户标签之后，就可以应用于检索的排序和优化，我同样去搜索一个词，它的结果级其实是一样的，检索到的数量是一样的，但是排序不一样，第一页展现出来的东西不一样，这样对样对用户来说它就有一个个性化，是一个很好的体验。再一个有了用户的标签，再通过协同过滤我们可以给出相关的推荐，这样在我们中央厨房非常重要的融合资源库能够大大地提升它日常做工作做业务的体验。这是我们用户画像的一些维度，分成几个方面，也有编目类的，因为先有的编目信息，也是非常重要的一个资源，我们现在可以通过语音分析这样的能力，因为有的资源它并没有标签体系，当然它有很丰富的编目原数据，这也是可以的，你也可以从编目原数据里面提一些标签出来，再加上它资源的类型、日期，包括它是哪个栏目的，包括它时间上分布的，也就是说它一般的下载是最近的，还是历史的，还是怎么样的，这样还有一些资源方面的偏好，比如下载方式，这个人是喜欢整段下载还是喜欢分段下载等等，就是这么样一些维度。刚才说到的是VCA的在资源库当中的应用。最后简单介绍一下VCR这一块，前面技术方面百度同事已经讲的比较好了，这个在现在很多业务场景下面也是用得非常多，因为我们现在也是处在很多人落马这样的事件，我们可以紧急的做一些处理，把他的东西屏蔽掉，包括新华社也有这样的需求，因为现在人太多了，有的人都不认识，都不知道这些人是出了问题的人，所以这个功能也是像敏感人物识别，在出库的时候或者再利用的时候有一个识别和提醒，就能够让大家的工作能够做得更好。好，我今天分享的内容就是这些，谢谢大家。主持人：感谢杜总，大家看到百度云的VCA服务在传统广电行业的应用大大提高了视频内容标签效率，让我们想象一下，未来我们在海量的视频资源中，可以通过一个画面、一个人物，一句话，就能快递定位到具体的视频以及该内容的截取内容，这将为视频行业提供多么便捷和强大的搜索服务。以上是VCA产品服务传统广电行业，接下来我们介绍一个百度云VCR在新媒体行业的应用，我们请到了央广视讯创新项目总监张海敏张总，为大家带来新媒体移动直播的融合发展模式的分享。有请张总。张海敏央广视讯创新项目总监张海敏：感谢大家今天来到百度ABC的视频论坛，我是央广视讯的张海敏。我今天给大家来分享的主题是新媒体移动直播的融合发展模式。众所周知，2016年是网络直播的元年，在短短的一年之内我们在移动直播端的用户规模迅速赶超了PC端多年来的用户规模的积累，我们的直播平台的一些业务模式也从最早的一个传统秀场的业务模式，转变到现在的一个泛生活、泛娱乐的一个直播时代。更多的一些技术类的，包括VR直播，包括视频直播，音频直播被更多的移动互联网的企业所去采用，然后通过直播的方式能够给这些平台带来更多的一个用户流量和用户的交互。我们其实从这个图表上可以看到，我们在2016年一个泛娱乐直播市场的规模同比2015年是达到了162%的一个增长率，我们在2017年整体直播市场的一个规模是在340个亿，在2020年我们预测能达到600个亿或者更多，整体的直播在线用户从2015年1.93个亿到现在2017年预计到3.94个亿，整体是做了一个翻番。2018年可能整个数字想象空间会更大。目前的移动直播主要分为五大块的一个商业模式。第一个部分，就是我们的广告付费模式，这部分其实我们就会在直播的一个业务形态当中加上了我们一个贴片广告的一个形态，可以是视频的，可以是图片的。通过相应的广告的部分向相应的平台带来相应的收益。第二部分就是我们的情感付费，其实在我们现在的秀场类直播，包括泛娱乐直播平台上普遍的被采用，这种模式通常的形态就是为主播来打赏，用甚至购买礼物、点，甚至点赞的方式，也是现在在整体的移动视频直播这个行业带来最大收益的一个业务形态。第三个就是营销付费。越来越多的B端的企业用户也会通过线上和线下联动模式为更多他的潜在一些客户提供他的一些企业营销。在这里面比如说我们做一些新闻发布会，比如说做一些更多的行业论坛交流。有很多人是不能到现场来参加活动，我们就可以通过线上的方式为更多一些意向用户来提供一个相应的传播。在这里面就是像这些B端的一些客户就会希望直播平台或者是一些新闻平台给他们更多的一些曝光量，在一些直播平台上有首页或者优势资源位的推荐，这也是一种付费的形态，向这些企业提供一个相应的收费模式。第四个，就是我们直播的内容付费。众所周知像音视频的一些平台现在的内容付费已经被越来越多的用户所接受。像爱奇艺，包括腾讯、优酷、土豆的一些VIP的付费。我们现在在直播这个行业可能越来越多的包括体育类的直播，包括演唱会的直播，包括知识分享类的直播都可以开始尝试做付费类的一个直播间的方式，这部分其实是用户为优质的PCC的内容提供方来进行买单。第五个，就是我们的电商直播，这个过程当中实际上现在在淘宝包括京东他们已经都在开始做一些业务类的尝试，主播可以在直播过程当中向用户他的粉丝推荐更多的商品，促进这些商品一个快速成效，缩短我们的一个用户决策的时间。所有的一个业务形态其中最终还会落到我们一些直播平台的一个流量的情况当中去，我们从这个图表可以看到其中70%的一个业务收入都是汇聚到前十大的直播平台，这部分的流量，包括它的业务收益都是普遍会集中在这些平台上，一些比较中小的一些直播平台，它的日活本身就不够高，所以用户在他的平台上带来的收益也比较少，所以这种情况下这些直播平台普遍在内容，包括博取眼球方面都提出了更多的一些创新的想法，当然有些想法确实是很正面的，但是更多的一些情况可能是我们都会走一些擦边，或者是走一些非违规的一些操作，在这个过程当中，其实我们就发现了广电总局、包括网信办，文化部，从去年2016年4月份开始集中对整个直播平台，包括音视频平台去做一些内容方面的一些监管要求。大家可以看到，这是一个相应的时间轴，从去年4月份到今年6月份各个部委都普遍发布了一些对直播平台，包括音视频平台的一些安全播出，包括健康播出的一些要求。普遍的一个主题其实向大家来揭示的就是要求直播平台能够持证上岗，就是必须持有广电这边颁发的信息网络传播视听许可证，像网信办发布的互联网的直播的服务管理办法当中也明确的要求，如果我们的直播内容是做新闻类的直播，或者时政类的直播必须也是持证上岗的，这部分要求我们的主持人或者是记者是持证的，要求我们平台也是持证的，这个平台你是做新闻的，你就是要去广电或者是网信办去做一个相应的报备，他们审批通过了之后你们才能做相应的直播。其实大家也会通过更多的一些社交平台了解到，近期网信办、广电，包括文化部都在约谈一些现在比较大的一些媒体平台，我说的是新媒体平台，这些新媒体平台，包括新浪、腾讯、腾讯的微信公众号、包括百度的百家号（音）的体系，包括现在我们的一个凤凰网的一些新闻的那个视频直播，包括A站和B站视频内容的一些正确的发布，这些已经越来越多的信号传递出我们的政策导向是会对这些内容要求更多的一些严管。我们其实更多关注在四个方面的一个内容审核的要求。第一，政治敏感。其实大家前面也都说到了，包括在整个视频或者是内容过程当中的一些国家领导人，包括一些政治敏感人物他的文本、图像、语音这些内容能不能在平台上做安全的播出。第二，广告的审核。其实国家对整体的广告这部分也做了很多要求，这个广告属于过程当中什么样的类别？能不能播放？，什么样的类别在这个平台上是定义为违规的内容发布？，我们都可以通过广告审核模块来解决。在色情审核这部分，在更多直播平台所关注的一个点，这里面就包括它对于声音的管控，包括对图片的管控，包括对文字的管控，其实我们都可以有相应的一个AI的技术来管理。第三，就是暴恐审核。就是海外音视频内容里面会有涉及到恐怖分子的头像投降，包括一些血腥画面，我们做一些内容审核和监察查。说了那么多，其实我想向像大家来介绍一下央广视讯是怎么样的一个公司呢？央广视讯是中央人民广播电台旗下的新媒体公司，独家授权运营中央人民广播电台的信息网络视听许可证，这个视听许可证当中有两张牌照，一个是自办服务牌照，一个是集成播控牌照，这两个牌照是我们拿来可以去做相应的音视频内容的一个审核。大家可以看一下，这两张牌照一个具体的区别。我的右手边这张牌照是移动互联网视听节目服务牌照，大家可以看到在整个牌照当中，央广视讯拿到的牌照是第一类的时政和新闻的首发和转载。第二类的一些文艺、娱乐、科技、体育、财政等方面的一些内容的评论和转载。包括像电影、电视剧，包括一些动画类的视听节目的转载服务。这张证实际上广电总局目前为止发了500多张，大多都是国内一些新闻媒体机构获得了这张牌照。越来越多的直播企业进入到整个这个市场，包括音视频的企业进入到这个市场，他其实是想要做一些合规的运营，怎么能够合规的运营呢？在广电的体系下就必须要持这张证才能进行一个合规的运营和管理。我的左手边还有一张证，是我们的手机电视集成播控服务的牌照，这张牌照广电总局就发了6张，央广是其中一张，这张牌照的作用是我们可以汇集大量的各种类别的精品的内容，包括音视频的内容，包括点播和直播类的内容，我们通过集成播控平台把内容汇聚了以后进行播控审核，然后再做二次分发，分发到相应的平台当中去以后，这个内容就是一个安全的没有问题的内容，帮这个平台获得了更多的一个政策，包括安全播出的一个输出。我们其实跟百度云在2017年3月份双方签订了战略合作协议共同打造视频云+播控审核这样的解决方案，我们通过百度云ABC智能审核的技术，加上央广视讯的集成播控牌照，包括匹配我们专业的具有丰富经验的人工审核团队，共同的为音视频的点播和直播平台提供相应的审核服务。我们使用的技术包括物体识别、语音识别、文字识别和人脸识别，包括场景识别，汇聚在黄反、资质、广告、暴恐等梁应领域，我们为这些平台做相应的保驾护航的工作。这个PPT我们汇聚了两方面一个能力的输出，一部分是我们的直播能力的输出，因为更多的直播平台它其实内容都是通过流的方式，通过接口方式传到我们视频内容审核服务平台当中来，我们去做相应同步的一个审核，审核过以后我们就时时的会把审核结果输出给到平台，如果这个内容是违规的，我们直接就做下线处理，如果这个内容是存疑的，由人工团队来做判断，是否在这个平台上继续去播出。音视频点播VOD的系统也是同样存在这样一个服务功能，我们通过接口方式把更多媒资库内容进行相应审核，同步以接口的方式返回结果。这是我们一个播控流程，前端通过接口方式传到集成播控中心，第二段由我们审核人员做审核，最终我们会把审核结果做一个相应的输出和备案，同时把审核过的内容在内容媒资库里面去做留档。大家看到这张图，这是我们最后做内容审核过程当中，我们右手边是播控中心，就是我们会把整体的视频直播和音频点播的内容会在我们的平台上给展示出来，央视出来了以后如果是说有存疑让人工进行复审，最后通过播控的一些音视频的内容就会由我们的播控平台直接添加我们的水印，CNR集成播控的水印，这样我们在最终播出的时候就知道，哪些内容是经过我们的审核的，是它是安全的一个内容。我们其实自身也在积极地探索更多的一些商业化的合作模式。本身我们也会整合更多的一些优质的PCC和直播资源方的内容到我们手上，然后我们通过集成播控中心审核过了以后，为更多的直播平台输出内容，因为现在直播平台普遍存在的一个问题就是，他们缺乏优质的内容，缺乏好的安全的内容。我们本身就在做播控审核的部分，我们就可以把这个内容审核过以后，并且经过版权方的一个同意，为更多的直播平台去提供这块的输出。这是我们AI机器学习的模型，包括在图像技术，语音技术，自然语言技术和用户画像技术上做了探索，包括我们说的人脸识别，OCR识别，色情识别，暴恐识别和一些语音识别模块的输出。我们其实在人脸识别的准确率已经可以做到99%以上，包括字幕的识别、二维码的识别和水印识别也做的非常棒了。百度在国内这块的技术已经是可以做到NO.1了，谢谢大家今天下午抽时间来跟我一起探讨我们在音视频直播方面的一些探索，希望有机会跟在座的各位可以有更多的机会去合作，谢谢大家！主持人：感谢张总，让大家了解到百度云VCR的黄反审核、暴恐审核、广告审核、政治敏感审核、资质审核、文字流审核，都能够大大降低视频审核的难度以及人力的投入。有了百度VCR妈妈再也不用担心我看到不该看的视频了，儿童的健康发展不仅在视频审核方面需要下功夫，还需要一起用AI，用爱与责任来守护儿童的成长。我们有幸请到了中国最大的幼儿园管理集团，威创集团董事、副总经理何一名给大家带来视频AI在幼教方面的分享。有请。何一名威创集团董事、副总经理何一名：各位好，各位百度的合作伙伴，百度的朋友大家下午好，首先非常感谢今天有机会受百度云的邀请来到这里跟大家分享关于儿童成长方面威创在做的一些事情，以及威创和百度牵手在这个行业做的事情和尝试。首先我想问一下在场有没有年轻孩子的父母，为数不少。我想做一个市场调研，说到儿童成长，我想大家对这个概念可能比较新，大家对幼儿的成长在传统中可能是理解为幼教，或者是幼儿园教育，但是今天其实主观和客观上大家对于学龄前小孩的成长关注度和重要性已经发生了本质的变化，我打个比方，从以前的托儿所到后来的幼儿园，到今天我们内部命名为儿童成长基地，代表了大家对儿童成长的认知的关注度的理解的需求已经发生了本质的变化，所以今天来到这个大会上我非常兴奋。有两个地方，一个是听到了很多关键词，尤其是今天早上引尹总给我们提到的，是我们思考了那么久觉得最能够总结幼儿成长的本质（英文），幼儿成长不是一个知识教育，不是一个技能教育，我们在行内有一句玩笑话，我们在用20年前的方法培养20年后的人，现在的小孩20年后社会的主人。，我们能不能做一些探索，在智慧的时代我们能不能结合智能科技更好的赋能他们的成长，这所以今天是我今天分享的一个主题。首先我简单介绍一下威创，大家如果有关注儿童成长产业也会留意到威创，威创目前是一家以赋能或者是服务于儿童成长的综合型集团，我们现在的主要业务是帮助幼儿园的教学和管理的提升，目前威创旗下有5个，我们控股的幼儿园的加盟品牌以及围绕着儿童成长相关的服务和产品的战略合作伙伴。我们目前在全国不同城市、不同区域，服务超过4500家幼儿园，影响超过百万个儿童和儿童背后的家庭。对于儿童成长我想给大家分享几个核心的概念。第一，大家从这个产业地图可以看得到，今天的儿童成长其实跟我们以往的理解幼儿园教育已经有本质的变化了，在整个教育链条中我们客户是最年轻的，我们的间接客户家长也是最年轻的，现在基本上我们的家长都是80后，90后慢慢也会加入成为主流，所以今天主观来说这些家长对于儿童成长，或者幼儿教育大家的需求已经发生了本质上的变化，变得更多元，更丰富，有幼儿园内的，有幼儿园外的，有产品，有内容，有线上的有线下的，这是今天的儿童成长背后的一个特点。另外，我想接下来分享我们和百度的合作和在这个产业的探索很重要的背景，就是儿童成长一个非常关键的特点，我们总结叫不可逆和关键期，大家可能都有听过中国有一句古语说三岁看大，七岁看老，本质上是说这两个东西，大家在图上可以看得到，在一个人的人生发展中有很多核心的品质和能力，其实是在7岁以前，也就是在0到6这个阶段已经定型了，在我们行内一个专业术语我们叫“敏感期”，大家可能体会比较深的时候是我们小时候学语言特别简单，三门四门都不是问题，可能我们有的时候总结的时候发现，是不是那个时候不害羞，特别敢说，敢听。，现在科学已经证明，在一个人的发展过程当中他语言敏感期就是在0到6岁，如果错过了，尤其是在发音上面，再去重新培养，重新帮助，效率会大大减低，也是为什么我们今天再去学一门外语口音会很重，已经很难回到我们小时候学语言的从容感了，这是大家比较直观能够感受到的。所以，我们总结儿童成长的本质，就像零售的本质是便捷，餐饮的本质是好吃安全，儿童成长的本质是安全、健康、有效、及时的成长服务。所以我们跟百度的合作是围绕着儿童成长的有效及时性来开展的。这里我给大家分享一个场景，可能大家如果做过家长的话会关注到，幼儿园除了是线下最专业的一个儿童成长的服务的据点，其实我们更定位为是儿童成长的终端和关键的数据入口，从一个小孩子每周一到五，每天有超过三分之一的时间，扣除休息，有超过一半的时间是在幼儿园里面度过的，当中存在大量的一个小孩子关键的成长数据。刚才说了，今天在互联网年代已经从产品为中心变为到以用户为中心，其实在儿童成长更为重要，因为就像刚才说的，每个小孩都是不一样的个体，3岁的小孩子每一个的差异性比30岁的一个人会差别很大，所以他们更需要个性化及时性的成长服务。回到今天，以用户为中心的很大的一个支撑，就是我们对一个小孩，对一个儿童他的了解，他的信息，他数据的及时性，但是回到今天，如果大家当过家长的话，一个小孩放学最经典的问题是今天开心吗？吃了什么？学了什么？老师教了什么？小孩很简单，开心，吃饱了，今天学了英文，明天学的中文，这些大量的核心的儿童成长相关的数据其实是被封闭屏蔽掉，甚至消失掉的，而且是日益累积的消失掉。所以我们内部用一句话来总结就是，今天的儿童成长环境是封闭的、是割裂的，大大减低了我们作为儿童成长的从业者和参与者帮助儿童成长的效率的及时性和有效性。在传统的方式和资源下大家试想一下，一个老师每天对着三十甚至四十时个小孩子，他真的能够关注你的小孩子吗？能够个性化教好你的小孩子吗？不可能的，我们总结的大量特定场景下要么是无法实现，或者是十倍以上成本才能实现的需求，但回到今天智能的时代，科技和智能科技给到我们这个产业一个升级的机会，这也是我们和百度牵手的一个大背景。所以回到今天的主题百度云，或者是今天这个分会场的主题，视频AI怎么赋能儿童成长？核心点是回到刚才的痛点，第一步的核心是重新打开这些黑匣子，将不同的割裂的儿童成长环境重新用智能的方式聚合起来，激活起来。所以第一步，我们跟百度云的合作是从感知的层面，重新将这些结合我们对场景的理解，我个人非常认可李彦宏先生的一句话，在AI时代的核心是将数据的整合利用科技的手段，以及对场景的理解，要吃透一个场景，帮助整个产业来升级，所以今天也是我们和百度和百度云合作的一个非常大的背景。第一步是围绕着我们的主题，以儿童成长为中心来打开这些传统场景下的一个一个黑匣子，把它们重新激活，重新聚合。在介绍我们具体产品之前，我想从三个方面威创现在和百度云在做的事情。第一，是利用最基础的，现在非常成熟的人脸识别技术和视频的搜索技术，我们重新把视频内容，因为视频内容我们认为是潜在价值最大的数据媒体之一，当中蕴含着大量我们非常有价值的潜在数据，但这些数据是需要结合合适有效的手段将它重新激活，有效科学的挖掘出来，所以第一步我们是用人脸识别技术以及视频的搜索技术，将我们的小孩子真正地做到以小孩子或者儿童为中心，将这些视频内容重新组合和整合。第二，我们需要进一步去训练，用今天早上的关键词来说，或者是要加强的是，我们将专业资源，包括威创体系内的专家和体系外的专家整合回来后，对于儿童成长在视频中关键的数据重新的抽取和将它结构化，让它变成真正成为可用的，可以赋能给我们的参与者做决策做服务的数据。包括我这里以幼儿园这个场景为例，我们第一步把儿童的个体切开了，但每个儿童他个性化的行为我们是不是又能够利用智能的科技有效的做成一个我们互联网年代的用户画像，是绝对有可能的。包括音频，因为在儿童成长有一句话叫环境即教育，在视频里面除了图像，声音是非常非常关键的一个数据来源，一个小孩子哭没哭，他的情绪是怎么样，很多时候是可以用音频判断出来的。所以接下来我会分享两款威创近期会推出的我们关于AI赋能儿童成长的落地产品以及与百度的探索，也是最后我想做一个市场调研，看在场如果是有儿童的父母，大家有多少动力来用这款产品。第一，我们叫今日宝宝，核心要解决的问题是高效及时的将园内和园外精准信息互通起来，因为今天儿童成长的环境除了幼儿园，家庭以及家庭外的社会是三位一体，是不可或缺的。所以像幼儿园的儿童行为我们分类，将它总结为五大场景，像家长非常关注的，以及他在家里面怎么配合幼儿园对于儿童成长的，怎么联动起来和幼儿园的老师和园长，一个很重要的基础他需要知道，我的小孩今天在幼儿园到底学了什么？这个时间点老师给他的关键发展是什么？他的健康情况怎么样？他安不安全？就像我说今天在幼儿园的场景里面都是消失掉的。但如果只是简单的视频，简单的摄像，大家会看到这样的情况，我们无所适从，我们不知道怎么利用好视频里面大量蕴含的数据，但如果结合视频AI，我们第一步可以把你的孩子，你关注的东西，你关注的主体重新组合，以及根据威创和威创体系内的专业资源，按照一个在幼儿园的场景它有一个关键词叫一日流程，所有小孩他的发展情况，他在幼儿园的流程其实是系统化整理好的，结合我们个性化抽取出来的，围绕着特定儿童的视频和图片家长呈现到的，或者接受到的是从入园，从早餐，从早上的早神操，从他上的美术课，音乐课，他睡觉睡了多少，他吃饭的时候你的宝宝有没有吃饱，他喜欢吃什么，他对什么颜色有兴趣，这些都是能非常简单的实现的，结合今天的以及非常成熟的手段有效的传递到我们的家庭客户。再往下延伸，其实学前教育有一个非常大的特点，不知道大家有没有感知得，像K12或者是高等教育，成人教育他的结果是有标准的，就是我们传统意义上所说的“分”，像大家上小学要考初中高中，考高中初中，高中初中毕业要考大学，其实都是围绕着一个我们潜意识中存在的标准结果，但是其实在儿童成长，大家心里面是没有一个特定的标准。今天在威创体系内我们有超过百万的儿童，有超过上亿级别的数据点，其实在这样的数据规模下，我们有了一个能够及时干预非常好的基础，比如像现在显示的自闭症的倾向，注意力的不集中，注意力的广度问题等等，其实在具备数据规模的情况下给到我们的核心价值是围绕着这些关键指标，我们有了一个参考值，所以回到我们儿童成长的本质上，如果这个参考值它不是一个绝对参加值，是一个相对参考值，它是根据数据的规模以及背后的科学理论来产生的，但是一旦有了这个参考值以后，我们对儿童成长的及时性就有了极大的干预能力。比如说，今天我用一个最直观的例子，今天您的小孩47个月，47个月的其他小孩在中国同等环境下，他的身高是怎么样呢？你的孩子到底算是高，还是矮，你有概念吗？那我们有了这个参考值之后，我们是不是可以给背后的家长，背后的参与者做一些精准的推送，这个是绝对可以的，而且产生的价值是巨大的，因为儿童成长0到6这个阶段是不可逆，是关键期。每个家长认识之后，其实他的精准个性化的教育需求是非常迫切的。所以最后的总结，有了规模用户，加上规模的数据，以及有效获取数据的手段，再结合科学以数据支撑的指数，我们就能够打通园语言、家、+社会的儿童成长环境，真正的做到有效及时的儿童成长服务。所以威创与百度牵手的背景用一句话总结，我们希望能够以数据驱动，以AI赋能儿童成长，让家长能够更了解他的孩子，让老师能够因材施教，让儿童成长这个产业里面的合作伙伴能够精准的接触到服务到他们的目标客户，以及精准的把握到商业价值，这就是我今天的分享，谢谢。主持人：感谢何总，用科技让复杂的世界更简单！用AI守护儿童成长。百度云也非常有幸能够跟威创企业一起为我们的下一代付出我们自己的一份力量。以上是ABCinspire媒体行业中A的实际应用介绍，接下来我们开启B，bigdata视频大数据应用的演讲，有请百度云大数据产品经理张爽为大家带来视频大数据应用-视频推荐与检索的分享。有请张爽。张爽百度云大数据产品经理张爽：谢谢康盛，各位来宾下午好！我今天要分享的是百度云视频推荐与搜索解决方案。我也提到一个概念叫2016年，2016年其实至今乃至以后大家都会发现这样一个问题，就是抢占互联网用户的流量而获取红利的这个时代结束了，随之而来就是抢占用户的时间成为了新的战场，而我们每一个用户来讲，其实每一天我们都只有有限的那么一点点时间，通过手机其他的上网设备去获取一些信息。我们希望在有限的时间里面去获得更有价值的信息。对于一个企业来讲，他它最希望的就是能够快速抓到用户眼球，用有价值信息去换取用户的时间，从而在同质化产品当中脱颖而出。如何才能够抓到用户的眼球和时间呢，我认为有以下三点。第一，深知用户。第二是认知产品。第三就是价值的一个转化。首先深知用户就是要有一个全方位的对于用户的行为、特征，以及他的意图能做一个深度的洞察。认知产品，我想不仅仅是从我们企业所生产的产品定位的一个认知，更重要的是你能不能对于产品所承载的内容或者资源的一个认知。比如说我们拿一个视频的APP做一个例子，视频APP所承载的内容就是视频，对于视频解析我们可以从人工标注标签，或者从视频一段描述当中去理解它，更重要的就是能不能通过解析视频的内容，更多维化的更全面的去理解视频的特征，从而对这个产品有一个更立体的认知。第三，是价值转化。这里面就会有各种各样的手段，比如说有的通过学习的算法，有的通过各种方式，把用户与产品建立一个价值的联系，然后促进沉默用户到活跃用户的一个转化。我们百度云视频推荐的方案就是一站式帮大家解决掉了深知用户，认知产品到价值转化这样一个过程。有四大核心优势。第一，叫做百度画像，深知用户。百度画像的数据可以通过多唯维的ID方式与企业数据打通，对于用户行为做一个深刻的认知。第二，就是领先技术，尽在其中，以机器为核心，我们还融入了对于视频内容的分析，自然语言的处理，还有一个点击率的预估技术，我们都会放到我们推荐的解决方案当中，而这些技术都是在百度风潮凤巢广告搜索等多个产品线当中多年的沉淀积累多年所验证的技术。第三个优势叫做算法策略，专属定制，其实推荐系统大家都知道发展了好多年，这个过程其实沉淀了很多这样的策略，比如说协同过滤，比如说基于内容的推荐等等。而我们的推荐方案，把这些主流的算法都会融入进来。但是同时有一个问题也诞生了，什么问题？就是通用这样一些算法其实并不能够满足很多行业的它的一些诉求。所以我们会支持对于算法，包括它参数的调优及定制。还有另外一个问题，找到了这个对应的推荐内容，其实对于推荐结果要有一个排序过程，这个排序过程中可能有很多的策略，还有就是比如说我们把一些召回当中的新热的没听懂，还有就是冷启动的策略算法当中都会纳入进来。所以我们对于这些策略也是支持专属定制的，为了达到更好的一个推进的效果。没听懂第四个，叫做SAAS服务，简单接入，我们推荐结果以服务的形式接入的，我们客户只需要完成两步。第一把数据接入进来。第二调用服务，整个过程就可以了，我们不用去关心所谓的运维相关的问题。下面我们先来看一下刚才所提到的百度画像，百度画像其实是打通了百度内部有大约40多款以上的产品，比如大家熟知的百度地图、手机百度等等。而这些产品当中，大约会有至少十多款以上的产品其实都是用户过亿的，我们获取到的这些数据当中包含了用户浏览、点击、购买、搜索、评论等各个方面的维度的数据。对这些数据我们通过深度学习的方式把它形成了一个百度画像，然后可以通多种维度的方式基于与企业的数据打通，我们助力企业能够对于他的用户有很好的认知与增强。另外一个方面大家可以看到，其实百度画像有很多的维度，至少有五千多个标签，我们会把它放到个性化的推荐当中，由于对于用户用度识别的更加地丰富，更加地广，所以在最后的个性化推荐中它的一个精准度和多样性，自然就会有大幅度的提升，借助百度画像还可以解决什么问题呢？就是冷启动的问题，比如一个新的用户来了，我不知道他的画像特征，好，百度画像帮助你去识别，对于这一类特征的用户我该推荐一些什么呢？百度画像能够找到相似用户推荐的一些产品，把这些产品推荐给这个新用户。同样我们可以反过来想一下，如果一个新的视频来了，我也可以找到相应视频感兴趣的用户的视频，这是百度画像带给大家巨大的作用。我们再来看一下核心的一些技术，其中有一个重点的技术就今天多次强调的叫做视频内容一个解析技术，我们叫VCA，通过视频解析我们可以通过人工标注的方式，也可以从当中提取特征，但是都不会有很多方面对它进行一个立体化的描述，而视频内容一个解析却能够从更多维度去解析视频的内容，比如说人物、文字、物体、地标、场景、语音等，还有我们对于视频的特征能够解析到4096个维度，可以想象一下如果我把这4096个维度用于对比两个事情的一个相关性，这种一个对比概念是一个多么丰富的一个对比，也之所以能够这样如此丰富的去对比，才能够使相关推荐当中的视频的数量会有所提升，相关视频产生的推荐效果会更加新颖和多样。还有推荐结果排序上，我们也可以从人物、文字、位置等多个维度去对结果进行排序。第二个技术，刚才也提了一点，叫做点击率预估技术，我们叫做CTR，这个技术就是对于用户历史的点击行为，通过分析去预估他未来的一个点击行为，有一个核心的模块，我们把它叫做特征增量，我们在分析历史点击行为当中，去考虑某一条点击记录当中用户的特征，它的标签是什么样的，它的偏好是什么样的，同样也会考虑这条点击记录中被点击的那个物品的特征是一个什么样的维度，另外点击的时间、点击时手机的一个情况，位置的一个情况，我们把这些叫做一个环境的特征，会放入到这个特征工程当中，综合上面的各类特征，我们通过训练来预估未来的点击情况，这个点击技术是凤巢广告十年总结下来的，我们去计算一下用户对某一个视频的一个点击得分，把得分高的排在前面，就会有效的去提升一个用户的点击转化率。再来看一下除了视频推荐方案之后，我们其实还有其他的一些推荐方案，比如说新闻资讯类的推荐，还有电商类的，这个是即将上线的，视频推荐这一块我们今天也请来了重要的客户人人视频，新闻资讯类这个我们有很多的央视类的各种新闻媒体的一些客户，在这儿就不和大家介绍了。然后我们来看一下视频搜索方案，我们的视频搜索目标就是让一切可以被索引，其实大家可以了解到，随着技术的发展，人们对于视频搜索的需求也更加垂直化，更加的立体化，所以就要求我们对于搜索引擎的能力会有全面的提升，具体体现，比如说第一，我们要对信息的收录更加广。第二，我们对内容的搜索更加地立体。第三，其实就对于搜索结果的一个精准定位。分别来看一下，搜索的一个全面收录。十年以前做搜索的时候，其实我们只是基于文本的内容去做搜索，后来的时候我们可以对于文本附件中的内容去做搜索，随着人工智能技术的发展，我们其实已经做到了在图片中进行搜索以及对于视频内容的一个搜索。首先我们会把视频中的内容、场景、声音、字幕等这样的信息全部收录下来，正是因为收录的信息更加地广和全面，才能够让搜索引擎读懂视频的内容，这样也才会为后面立体化的搜索以及精准定位去奠定一个基础。立体的搜索。其实对于一个视频大家也看得到，它有很多的维度，比如说声音是它的维度，字幕是它的维度，图像也是它的维度，定位到视频当中的某一帧，都会从这三个层面上去体现，那么就会出现一个问题，在同一时刻不同的维度，不同的层面，其实暴露的信息是不一样的，所以我们的搜索一定是从一个立体方面的搜索，并且是基于用户意图的一个立体化的搜索。我们来举一个例子，比如说我们要搜索吴亦凡说freestyle，首先我们要来解析一下这个的意图，比如说他的意图可能会定义在几个维度上。比如说我们把这个搜索意图定位到图像、声音和字幕这三个维度上，有可能是说在图像中出现吴亦凡这个人物，而在声音或者字幕中出现freestyle，我们搜索了之后，定义到了不同维度上，推动对不同维度的打分进行计算，最后能够将搜索的结果定位到视频的某一些帧的上面。这个例子体现了我们通过多维度方式进行搜索。可以再看下一个例子，精准的定位，比如说有一些学习类的，视频类的学习网站，其实它的主要的用户角色可能两类，第一就是初学者。第二是进阶者。初学者更关注来到这个视频网站上我能够系统的学习，所以他会看到整个的视频。而进阶者是对于视频中的某一些概念做一些重复的温故知新，所以对于这两者的一个定位，我们的搜索反馈的结果肯定是不同的。好，对于初学者来说我们会给他返回所有视频的内容，他针对视频内容去看就好了，而针对进阶者来说，我们就会帮助他去搜索视频中内容的某一些概念，比如说我们搜索核心概念，我们不能仅仅地去搜索核心概念，因为这个返回的结果一定就是一个视频，对于进阶者来说不需要从头到尾再看一遍视频，所以我们会通过对内容的解析搜索核心概念，这一个概念定位到视频当中的某一帧，这样把这个结果去返回给进阶者，才是他想要的内容，这个例子体现了我们对于搜索一个定位的准确。以上就是我本次分享内容，谢谢大家！主持人：感谢张爽对百度视频大数据的介绍，以及给大家分享了一些技术干货和最佳实践。接下来让我们通过一个实际案例来了解下，视频大数据一些应用，在视频大数据这一块百度云是如何结合人人视频，给人人视频提升了日均播放量以及如何优化人力成本，我们有幸请到了人人视频CTO叶懋为大家介绍一下好风凭借力，送我上度云。叶懋人人视频CTO叶懋：大家下午好，我是来自人人视频的叶懋，非常荣幸在百度云峰会看

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

视频智能技术与平台论坛

文档简介

温馨提示

最新文档

评论

相关文档