2023年【视频后台专题】算法与后台的完美结合-视频内容理解_第1页
2023年【视频后台专题】算法与后台的完美结合-视频内容理解_第2页
2023年【视频后台专题】算法与后台的完美结合-视频内容理解_第3页
2023年【视频后台专题】算法与后台的完美结合-视频内容理解_第4页
2023年【视频后台专题】算法与后台的完美结合-视频内容理解_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【视频后台专题】算法与后台的完美结合——视频内容理解视频行业从曾经基本以专业剧组制作内容为主到现在个人博主+小型工作室+专业剧组的多元内容制作,现在越来越多人开头尝试通过以视频的形式承载自己想要表达的内容。

这样的环境下,视频生产者逐月递增,伴随着视频生产者人数的增多,视频的供应量便消失了指数级的增长曲线。在浩大有简单的视频内容的海洋中,筛选出来优质视频,淘汰劣质视频在当下仅通过人工的方式已经无法掩盖行业的素材,因此内容理解便成为了帮助业务对视频进行优劣鉴定的重要引擎。

一、什么是视频内容理解

视频内容理解,主要是针对视频进行从码流质量到内容表现及含义的分析。视频行业中,会针对于视频内容生产源对视频内容进行区分,主要是分为PPC(专业版权选购或自制内容)、PGC(专业分账内容)、UGC(用户原创内容)这三类视频内容。

内容理解的目的是通过AI的方式将视频内容(包括视频、音频、字幕)和视频互动互动内容(评论、保藏、点赞、评分、弹幕、屏蔽、不推举等)等多维度内容进行表征和语意的具体分析,并将分析的结果推动给前端如推举、搜寻等业务。

1.行业进展

内容行业进展至今主要存在三个时代:

门户时代搜寻/社交时代智能时代(1)门户时代

1995~2022年主要是门户网站主导下的互联网内容服务,国内代表公司是四大门户网站,新浪、网易、搜狐、腾讯。在互联网的初期,由于用户的消费信息数量基本只能从纸媒和电视中获得,又由于纸媒版面限制和电视广告的按时间线型排布的特点,导致报纸+电视+广播这三种传统方式内容数据较少且不具备长时间储存的特性。

因此在那个时代用户亟需一个内容聚合平台,因此门户网站变成为了人们够快速的查找信息的基础设施。门户网站主要运营的方式是通过人工对内容进行整理,然后以频道页形式满意用户需求。

前期主要是以人工对信息的推断进行运营,伴随着数据量级的的增多,仅依靠人工运营的方式会消失成本急剧攀升,人员没有更多精力处理海量内容,因此各大企业纷纷引入自动化内容分类等技术,此后,内容分类技术伴随着数据增多而进展快速。

(2)搜寻/社交时代

2022年~至今,国内及海外互联网都在搜寻社交的时代中。主要代表公司:腾讯、Google、Facebook、百度、爱奇艺(爱奇艺做了力量最强的全站视频搜寻引擎)。

随着家用电脑及智能手机的不断普及,内容数量和类型不断丰富,门户网站已经很难担当多类型海量内容的分发任务,用户面对爆炸内容时,传统门户网站对于用户选择呈现了低效的现象。

于是,一种新的信息分发技术诞生——搜寻。搜寻主要解决的问题是依据用户搜寻的内容找到相关内容,并依据将内容有序的呈现在用户面前。搜寻初期关键词技术很好的解决了这个需求,于是也成为那个时期的讨论热点。

但是关键词技术同样存在实体歧义的局限性,比如搜寻亚瑟王,关键词很难区分出来是亚瑟玩传奇的亚瑟王,还是Type-moon的Saber。在2022年Google提出学问图谱概念,主要就是用于解决上述的实体歧义问题,实体链指的问题也有了比较大的进展。

(3)智能时代

自2022年~至今,伴随着内容爆炸式的增长,用户消费模式更进一步融合了门户网站的海量内容呈现+搜寻时代的精准化内容检索,推举及共性化推举应运而生。2022年则是作为智能时代的开端,虽然共性化推举技术早有讨论,但是对于信息分发这个任务有不行或缺的推动作用。

①图文时代

共性化推举其实经受了两个时代,其一是图文时代,其二是视频时代。图文时代在国内则是以今日头条和一点资讯为代表的共性化图文分发引擎,初期内容基本上是通过爬去各个传统门户网站的内容经过自己的内容理解做好基础分类的标签归属,然后在通过共性化分发引擎做到你关怀的就是头条。

②视频时代

自2022年开头,伴随4G普及及终端设备的急剧降低,用户消费场景正式步入移动时代。在内容消费中也逐步变成从传统图文消费转变为了视频、音频消费的模式。这个时候,由于音视频本身的识别难度远大于图文内容,在优劣内容判别时,传统的学问图谱、关键词、人工运营已经无法掩盖生动的视频内容,这个时候内容理解便得到了重要进展。

2.内容理解的重要性

内部因素来看:伴随内容爆炸式增长,UGC创创作水平、创作目的各不相同;PPCPGC内容则面临着视频二次创作,选择优质经典内容成本极高的问题;消费者存在内容理解偏差,平台需要保证基础内容质量将优质内容呈现在消费者面前。

平台面临运营人力成本掌握及优质内容选择,优秀创筛选,版权选购及运营工业化等各方面问题。

外部因素来看:自2022年开头,食品消费增速不断扩大,视频消费已经占据用户在内容领域消费的肯定大头,并且在2022年及之后的一段时间内依旧是保持增长赛道。

外部需求有,内容供应足,运营成本高,三者结合,视频内容理解则成为了平台重要扶持对象。

二、视频内容理解产品架构

产品力量上来讲,内容理解主要分为三个部分:视频信息归类、视频特征整理、优劣内容识别。

视频信息归类:通常状况下内容理解算法经过深度学习以后,可以对视频内容进行内容分类及标签定义,用于给视频内容自动化定义基础的分类和相近的标签。

视频特征整理:视频特征主要针对于视频内容本身和视频评论进行特征标识的。通常状况下会视频本身的特征主要是对画面和音频两个方面进行特征整理。画面方面主要是强调的是视频主题(视频带货、才艺表演、古装电视、综艺真人秀)、类型(穿搭博主、颜艺博主)、创力量及爱好(资讯版本、历史板块、泛学问类板块)、OCR识别(主要识别视频画面中的文字关键信息)。

对于音频则主要是识别音频中的音乐(消失位置、BGM名称等)、ASR识别(语音转文字、音色、音调等)。针对于视频评论主要是整理评论估量推举度、评论关键词等信息作为帮助本身本身特征及归类的描述。

优劣内容识别:一般状况下内容理解后台会对线上视频内容做组合式内容优劣识别,组合式包括了内容本身及内容评论两个部分。这之中主要是会对内容本身、内容评论做独立优劣识别,同时会依据内容评论的分析结果作为内容本身优劣的一个评判维度。

针对于内容本身一般会分为优质内容、次优质内容、一般内容、劣质内容四项,评论通常状况下会分为神评论、一般评论、争议评论、劣质评论、抑制创作评论这五种类型。整体对于内容优劣的推断通常如下图所示:

1.内容理解流程

为了快速对视频内容形成信息归类、特征理解与优劣判定,当视频入库的时候,内容理解后台会监听视频内容入库的消息,视频入库完成后通常会到存储将视频内容下载到内容理解后台中,在内容理解后台对视频绽开画面及音频的内容分析,确定视频的基本归类、特征、优劣推断。

在视频上线一段时候以后,绽开周期性的依据视频互动数据对视频内容理解进行多次优化,不断深化内容画像。

目前线上视频业务中,用户视频通常状况下不会给用户对线上已发布时候进行视频调整的机会,因此内容理解中不太需要推断视频是否存在修改而进行相应的画像调整;版权视频由于成本问题,通常收到监管要求以后会对视频进行再加工处理,因此线上视频会进行剪辑渲染等调整,所以当内容理解后台监听到视频调整以后,需要对视频进行重新内容分析。

对于一些重点内容,需要内容理解后台将分析的结果呈现在运营面前,运营可以对分析结果进行调校。通过以上的行为,便可以对视频内容做相对具体的分析,结合上述内容,内容理解的流程如下图所示:

2.内容理解业务掩盖

如前文内容理解的介绍,内容理解后台主要的作用是在于视频信息归类、视频特征整理与应用、优劣内容识别三个部分,包含了对视频、音频、字幕、评论为主的多维度内容分析。

由于在PPC、PGC、UGC内容中业务对于视频内容的运营策略与人力资源的不同,因此内容理解对于不同生产形势的视频内容会进行区分化分析。

我们通常状况下将版权选购和平台自制时长高于20分钟的视频称之为版权长视频,把用户上传的称作用户视频,目前新兴的如《生活对我下手了》系列版权选购单集5分钟以内的视频可以称之为微剧。由于微剧整体从内容供应和消费而言与PPC、PGC长视频相像,因此可以并入到版权或自制视频中进行分析。

(1)信息归类

分类:版权内容一般会对自己的视频做200-300个分类,包括一级分类(如电影、电视剧、综艺、动漫、纪录片等)、二级分类(华语、港台、日韩、欧美等)、三级分类(喜剧、爱情、动作、青春、奇幻等)。由于版权视频在内容购买时存在投资与购买片库的两种规律,因此新热大火的内容通常是人工运营选择分类,其它片库内容可以通过内容理解后台对分类进行建立。

用户内容通常状况下会做相对于版权视频相对多一些但是层级少一些的分类,一般状况下用户视频分类的个数约500-800个,包括一级分类(嬉戏、舞蹈、鬼畜、美食等)、二级分类(美食制作、美食侦探、美食测评等),这部分内容一般都是由内容理解后台或用户选择进行自动归类(由后台归类节省用户上传视频步骤简单提升产量,因此由后台归类逐步变得更广泛的应用),头部大号一般会有相应的大V运营同学对分类进行调整。

标签:一般状况下,内容理解后台会依据视频画面内容、音频、字幕内容进行初步的标签核对,后续会通过离线加载视频评论的方式,将视频评论的标签和视频内容的标签全部打入视频,后续经过搜寻等、推举等行为,不断确定标签的优先级,将标签打在视频内容、专辑、播单等主体上面。与分类相同,头部大V的内容会由公司运营对标签进行调整。

(2)特征整理

特征理解主要分为视频表征理解(如视频主题、创爱好特长等)、优质音视频内容识别(精彩片段分析、BGM分析等)这两部分。

视频表征理解:表征理解顾名思义是对视频表达的内容主题、创长短板、消费匹配等进行分析,通过对画面、字幕、音频的分析,确定视频的表达主题、出镜人员识别(演员、网红之类的)等信息,将信息存放在内容理解库中,并广泛应用于视频的编目信息。

优质音视频识别:优质音视频识别的主要的应用场景是在于长视频消费和生产,同样也可以适用于直播领域的点播内容制作,特别场景下的内容呈现(如足球竞赛的关键进球、红黄牌等信息)。

由于版权视频业务中,在消费和生产端存在优质音乐回放、优质视频拆条等素材,因此在整体的制作消费环节中,内容理解后台可以通过算法分析并识别出优质的音视频内容给到生产、消费端进行使用。

音视频特征识别除了本身作为音视频内容外,同时存在着从视频中提取并分析相应音视频内容,并依据内容识别专场、优质帧位等信息,从而找到并广告位精彩点位等关键位置;进一步生产共性化封面图、共性化标题等信息用于后续的推举、搜寻、播放等业务场景中。

(3)优劣分析

一般状况下内容理解后台会从三个方面对视频进行优劣推断,分别是音视频质量、视频内容质量、视频互动。会对以上三个方面各处每个方面的基础分数,同时会将三者的分数在消费端的综合表现及权重做多次加权给出总体分数。

①音视频质量

通常状况下,音视频质量是视频优劣的一个重要指导指标。。一般状况下评价音视频质量主要有以下3大方面:

画面问题音频问题音画问题画面问题:画面问题主要是涵盖了花屏、拉丝、灰屏;辨别率;帧率;横竖屏;画面细节呈现;模糊、马赛克;黑屏等问题。

音频问题:爆音;噪音多;卡顿等问题。

音画问题:主要面临的问题的是音画不同步。

依据以上三类问题,通常状况下会将对音视频质量分析的步骤称之为质量检测。质量检测一般是会依据已经上线的视频,根据视频内容的重要程度进行自动检测及人工检测,一般状况下为了保证人工检测的置信性会进行两轮的人工检测,视频行业的说法是一检和二检。

自动检测:

视频进入到平台通过平安审核上线后,会优先利用算法对视频进行质量检测,质量审核是面对全部平台已上线视频做的。

一般状况下对视频质量进行画面、音频、字幕等单方面检测,同时会利用平台用户消费状况赐予视频一个综合分数。在自动检测时,为了更加清楚地了解到是平台对视频二次编码的消失的质量问题还是视频原始介质的问题,一般都会对原视频介质和线上码流都进行自动检测。

现在常用的综合分数主要主要是分为两种,一种是平台自行开发的,另外一种是基于开源工具进行检测。

VMAF是一款Netflix开发的一款基于视频画面进行综合打分算法的工具,视频画面经过工具后会得到PSNR的分数,通常状况下PSNR分数相差3以上基本就是肉眼可见的质量差异。下图上面两张图片PSNR分数为31分,下面两张个图片是34分。

虽然目前市面上各家公司都习惯于对外宣扬使用自研视频质量分数,假如盼望做跨平台对比视频内容一般还是使用第三方数据牢靠性比较高。

人工检测:

对于平台内部的重点视频在自动检测消失消失比较有争议的分数时,便需要人工检测进行校验。一般人工检测的视频包括平台版权选购内容、平台自制内容、头部创视频、近期播放指数陡增的视频这四类。

人工检测一般的检测项和自动检测保持全都,需要经过二次人工检验对视频进行最终定性,并给出视频调整的综合性建议(如对原视频介质进行优化、重新对运营流进行编码等操作)。

②视频内容质量

视频内容质量主要指的是视频内容本身(不计算编码后音视频码流质量)对于用户价值平台价值的综合得分。由于这部分视频计算得分需要仿照用户心理状态,因此在视频内容质量的计算过程中需要主要考虑的是基于平台消费状况视频的客观事实和符合平台及用户消费导向的优质视频筛选这两个部分进行视频内容质量打分和推举。

对于视频内容消费而言,人们对于优质的理解总是各不相同的,此时优质内容的识别就需要赐予平台调性和主推以及用户消费进行综合性筛选;劣质内容的认定基本上用户会形成相应的共识,因此内容理解后台对于劣质内容识别可以通过规章及算法精准找到。

劣质视频识别:

劣质的视频内容一般可以通过标题与内容的联系、视频内容画面、音频等元素是可以通过系统识别出来的。详细的表现有标题党、视频时间过短、营销导流(贴二维码、硬广)、有明显的台标、作品重复、诱导互动、性示意、非原创投自制等。通过这样通用性的劣质视频规章和算法的识别可以第一时间内识别出来平台内的劣质视频并加以标识。

优质视频探究:优质视频需要满意的条件是热门、多样、经典、符合平台价值观这三方面的需求。

热门多样经典符合平台价值观视频的热门推断:

热门内容一般分为总体热门内容和地方性热门内容,总体热门内容主要是需要具备的条件是实效性、权威性、广泛性这三大特点。

实效性内容主要是基于热点大事,网络用户查阅量较高的话题做成的内容,笔者当年做了一个监控微博热搜+自动图文转视频的工具,对实效性内容制作和分发起到了还不错的收益;

权威性主要指的是账号,对于热门内容而言,最简洁的推断方法是看账号的属性;

广泛性指的是需要筛选出来的内容具备规模效应,至少平台中60%以上的用户会喜爱这样的内容,产生的长播放掩盖占比需要超过当日活跃用户数的30%以上,比如B站在热门内容的选择中对于二次元宅舞动漫混剪会有相应加权。

地方性热门内容需要赐予LBS进行推举,作为一手分析优质内容的视频理解后台,需要对地方性优质内容做好相应的地域标记,比如某些地区其次天强暴雨预警就是地方性很强的热门内容。

视频多样性选择:

平台在推断优质内容的时候,会依据内容分类在每个分类下都找到一些评分较高的视频,在整体的视频内容召回时,不在单纯进行整体的评分排序,而是根据平台视频消费的内容频道、视频归类等因素,根据频道或者归类(在统计频道或者归类时需要猎取不同类目下内容和实际产生vv占比及BI猜测占比)进行按比例召回,依据频道归类的消费指数*视频分数进行统一排序后再通过算法模型做肯定的挨次打乱,通过这样的方式召回的视频用以构成了平台的优质内容多样性,让用户在消费中可以感受到平台内容多且种类多。

经典视频的筛选:

在视频平台中都存在着一些能够长期稳定猎取vv及长播放的视频内容,长视频平台中可以发觉如优酷的《甄嬛传》、爱奇艺的《请回答1988.》、B站的《半泽直树》这样的内容,短视频平台中如讲解古生物的《鬼谷说》系列、讲解人物历史的《东梦人物志》系列;美食作家王刚、厨师长农国栋、觅大叔这类有用型教授做菜、选东西的内容等。

那么这部门视频内容的猎取便需要内容理解后台借助于消费数据不断刷新猎取具有长效不断vv,且长播放相对较高的视频内容,将这些视频填充进入优质内容池中作为平台经典内容呈现。

平台价值观的嵌套:

平台需要有自己的价值观,内容理解后台在猎取优质视频内容时需要和平台价值观做充分绑定的。有些时候用户喜爱喜爱看的未必是在社会上平台中需要努力宣扬的视频,这个时候平台需要依据自己推崇的标签分类或是学问图谱中对上述三者选出的内容进行权重的二次安排,从而形成最终的优质内容。

③视频互动

视频互动主要作用于优劣视频筛选和优劣互动内容识别,主要的原则有三点:

通过互动数据调教原视频的特征利用互动数据帮助推断视频优劣互动数据分析并赋能给消费及生产互动数据调教原视频的特征:视频互动数据包括基础的赞、踩、举报,也包括主管评论、标签添加等信息。在内容理解中,可以通过用户的互动数据进行学问图谱、关键词等信息,对原视频特征做二次校正,补充仅通过内容角度分析缺失的数据同时对特征权重根据用户的消费进行重新调整。

利用互动数据帮助推断视频优劣:通过对用户互动内容,可以最直接的得到视频在消费端消费好坏的状况,基于视频消费状况对视频优劣进行二次校正,可以最大限度让优质小众视频不收到埋没,让广泛消费的视频得到更加公众的判罚。

互动数据分析并赋能给消费及生产:一般状况下内容理解后台对于主管评价内容会会进行两个方面的展露,其一是对生产者,其二是对消费者。

生产者盼望猎取的评论内容是专业、轻松好玩的、负面较少的评论内容,只有这样的内容更多才能促进平台内容生产,创内容更加精进。

对于消费者而言,用户喜爱和视频主题相关的,好玩,符合大多评论氛围的评价。

因此内容理解后台在推断优质内容上面需要依据视频内容、评论内容及心情表达选出好玩、有用、符合平台调性、相关性强、负面少的内容作为视频的优质评论。

劣质评论内容相对于优质评论内容则更简单识别,由于人们往往对优质的定义许多,但是对劣质的定义却是有很强的统一性。因此在劣质内容识别上,内容理解后台可以结合反垃圾的做法快速筛选出来劣质内容。

3.内容理解后台产品架构

内容理解定义:对接平台线上视频及互动数据,对介入的视频多业务级多维度归类分析,同时进行标签、学问图谱对齐,利用线上数据及算法模型对视频整体内容进行归类、特征梳理、优劣辨析;对视频二创进行制作指导;对视频消费进行业务化处理。

因此在整体内容理解后台的产品架构中,需要先做数据输入与输出的处理,依据所需要的数据找到对应数据平台从而完成整体架构设计。

(1)内容理解后台数据交互

我们将内容理解定义为两部分:通过内容本身理解内容、通过用户行为理解内容。前者主要是针对内容抽取归类于标签。后者通过累计的用户数据,经过统计、建模、平台倾向、产品规章等方面对内容进行分析。

(2)内容理解后台产品架构

通过上述数据交互,可以清楚的了解到内容理解后台外在数据猎取及数据处理中需要对接的系统,主要包括了素材库、生产制作系统、运营系统、BI、视频互动数据库、OCR等。

由于内容理解后台的使用特性,故而继承了工具+服务两部分的属性。服务则存在于工程和算法两个方面,工程上主要是数据读写和接口服务,算法上则是内容分析、互动分析等算法。结合数据流转可以得到如下简要内容理解后台架构图:

三、视频内容理解产品设计

在整理完成内容理解后台的业务掩盖,梳理数据流转、业务流程和产品架构以后,下一步就是内容理解后台的产品设计阶段。

由于内容理解后台相对于基础后台比较偏重于算法,因此产品经理在整体的产品阶段需要负责模块不仅仅存在于功能方面,还有肯定的算法需求。产品经理在这种类型的产品价值则主要体现在了业务发掘、产品设计、跨部门沟通。

1.业务发掘

对于视频理解这种新型后台产品,不像传统后台有着自然 的使用方,为了能够让产品逐步做起来,最重要的事情是在业务中找到业务痛点,在产品上线初期可以让更多的用户来使用后台(包括后台的数据)从而不断得到优化迭代的机会,让产品能够存续下来。

完成了生存挑战,后续就是让产品掩盖更多的业务,存在更多的力量,整合更多的系统,让产品成为基础建设。最终一步就是让产品变现,将整体的力量变成对外服务,做基础建设的力量输出获利。

产品经理在整体的流程中,很重要的一点就是业务发掘力量,在整体业务发掘中主要是对需求的发觉与收集力量,这之中主要是通过对B端的实地观看访谈和对消费端的实际使用。

对B端用户的发掘主要是通过观看法和访谈法进行,主要的目的是通过观看和访谈找到业务操作上的痛点和实际业务流程。业务痛点主要是核心是老生常谈的效率问题,如海量视频归类,优质片段的查找,优质视频的查找,高优评论的识别,劣质内容的提示等。

在消费的时候,其实可以发觉如视频冷启动内容不够精准,视频评论将更好的评论放在了更靠后的地方等等。通过这些在消费端发觉的问题,可以找到内容理解后台可以增加的业务范围或优化的方向。

2.跨部门沟通

前文说了,对于内容理解这样的后台产品而言,需要许多数据和服务,因此在需求明确之后,产品设计之前,需要排列出来可能要合作的部门,需要不断开会拉起各个部门的实际负责人和相关产品研发人员,确定哪些力量是当下支持的,哪些力量需要开发,各自负责的边界范围是什么,然后依据现有力量组装内容理解后台的力量掩盖。

后期则是对于功能的研发及为了业务进展更好,对整体数据指标的建立与拉齐。

(1)业务打通

业务初期阶段,产品经理需要在依据架构梳理出来需要对接的外部团队,找到做内容理解后台对于每个业务的收益从而获得其他业务的支持。

之后便是依据数据流转和各服务之间的架构做好相应的业务流程和产品流程。由于现在中台化服务已经在各大公司普及开来,因此串联业务的工作必定是内容理解后台需要做的工作,产品经理在这里最重要的事情便是梳理大体的业务流程。

(2)指标建立与拉齐

在上线以后,为了能够获得系统间更快的响应,让用户及服务前端的数据获得更加灵敏的响应,产品经理需要为内容理解后台做以下3件事情:

找到长期支持内容理解后台的合作伙伴建立各项指标让全部服务方对齐建设长效的问题反馈收集反馈机制,促进产品迭代。3.产品设计

在对业务发掘以后,下一步就是依据发觉的问题,找到功能或者策略可以解决的方式供应服务。由于内容理解后台是集成多种服务的算法+工具+服务形式后台产品,因此产品经理在产品设计中的核心力量是打通系统之间的数据、供应工具给用户使用、优化模型建立评价体系。

(1)流程设计

对于内容理解后台这种需要多服务支持的后台产品,系统间的产品流程是特别重要的。在流程设计中,由于需要进行系统串联,所以需要主要考虑的地方在于分析的灵敏性、精准性。

灵敏性:流程设计主要是盼望整体的分析速度能够更快,因此需要在设计中做尽量多的并行大事。需要了解系统间对于数据分析的前后关系,合理支配数据入库的挨次并完成分析。

精准性:需要对输出的数据进行负责,因此在整体设计中需要尽量规避可能消失数据消失问题的流程设计,做到不漏、不偏。

(2)工具设计

内容理解工具主要的目的是有两点:

帮助运营推断内容展现流程提升问题排查效率①内容推断

工具设计中主要需要展现原本内容和分析结果,需要将整体视频展现做到全面和精确     ,在分布上需要做到模块挨次可以调整,默认状态下让依据最大原则定好模块排布挨次。因此从工具上需要为用户展现内容池、内容详细信息两个模块。

内容池:主要是根据业务需求以肯定的规章算法选出一些类型的内容池,如热门内容池、新用户冷启动内容池、优质内容池、点赞飙升内容池等等,用户可以设置一些条件和维度进行内容筛查。

内容信息:内容信息一般展现用户查询内容的基本信息及内容理解后台给出的分析信息,功能上需要支持基本的查看和修改力量。同时用户修改的操作的正负向信息需要传递给算法,从而优化算法模型。

②流程排查

主要用于视频内容分析故障的时候,确定故障缘由,找到第一责任人进行故障排查,让业务顺当进行下去。

③小结

内容理解工具端的设计组要服务于两大方面,其一是内容推断,其二是流程排查。内容推断主要是内容池展现和内容展现,流程排查需要将分析流程明盒化,供应给研发排查问题,产品也可以依据流程做效率上的进一步优化,

(3)建立评判体系

基于内容理解的算法,产品经理需要建立指标体系不断提升算法力量,提升分析模型。指标体系主要需要应对两个方面的的挑战,企业内部需要查看业务掩盖量,面对用户需要查看推举数据的详细指标完成状况。产品经理需要和算法工程师一起制定指标,让分析力量增加,推举数据更优,掩盖业务更广。

企业内考量:

产品经理需要在企业内容查找到可掩盖的业务,了解清晰业务注意的供应数据和核心看重的规章和数据指标,产品经理需要分业务和算法工程师对齐内容筛选指标,让更多业务用起来。

对于企业内考量则是掩盖有效业务范围是一个考量指标,上限是100%;新业务接入速度也是一个考量指标,服务足够完备的状况下,新业务接入可以根据天来计算。

分析精确     性也是一个重要指标,一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论