视频内容理解的技术与应用课件_第1页
视频内容理解的技术与应用课件_第2页
视频内容理解的技术与应用课件_第3页
视频内容理解的技术与应用课件_第4页
视频内容理解的技术与应用课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、视频内容理解的技术与应用课件视频内容理解的技术与应用课件视频大脑概述视频内容的理解与应用移动端视频特效互联网视频分析智能生活心口视频大脑概述PART 1视频大脑概述PART 1视频时代的来临视频时代 的来临信息传播高效化智能设备的普及,使得人们以 更为高效的I式传递信息,视 频成为记录生T的主流模式。社会智能化人工智能和IoT促进了社会的发 展和变革,人们的生T正朝着 智能化和自动化的I向发展。人工智能发展大数据的兴起为人工智能的发展奠 定了基础。人工智能与视频紧密结 合,贯穿了视频生命周期的各个阶 段。视频时代的来临视频时代 的来临信息传播高效化社会智能化人工智1亿90%1.5亿5.2亿互联

2、网流量70%3上来自视 频,P来这个数据将超过%0%2017年移动网络的视频用 I规模高达5.2521,占 总用I量的72.%亿2017年.国智能可穿戴设备的 市场规模达926021民币, 预计92022年,智能设备的市 场总0值将突破60026360视频7A数据达912安防监控每日1脸比对API调用数量1.52360智能摄5机8货量突破800 万800万360视 频 规 模行 业 市 场 规 模视频行业的市场规模1亿90%1.5亿5.2亿互联网流量70%3上来自视 频,P视频 大脑文 本声 音视 觉视频大脑的主要场景边 缘 计 算端计算云 平 台移动特效人脸识别人体属性分析 绿幕特效 智能感

3、知家庭安防 智能出行 视频内容理解智能选品视频内容指纹 智能审核 视频 大脑文 本声 音视 觉视频大脑的主要场景边 缘 计 算视频大脑的技术图谱智能选品视频指纹智能标签图像打分主体检测视觉内容语音语义行为分析短视频 家庭安防智能出行深度模型NIN、DPN、MFN入侵检测环境感知智能预警 物体检测前景识别云端边部署平台Std-CNN、模型加速云训练平台HBox、Online Learning根据场景需求 整合技 术能力 推出各行各业 的产品解决方案 带动 行业的智能变革。视频大脑的技术图谱智能选品视频指纹智能标签图像打分主体检测视HTTP服务(任务接收、查询结果)解码接 口视频云子模块(Qbus

4、-下载-处理-Qbus )短视频分析调度器(串行流式)推送结果用户任务接收HTTP服务配置中心日志收集监控报警短视频审核基础服务智 能 封 面鉴暴广黄恐告标 签人 物 识别特去质征重量任务跟踪缓存指标报表用户平台视频大脑的平台设计S3存储计算资bQ需弹性调度、-务异步流H理、全量增量优先级可S、用户级3资b隔离HTTP服务(任务接收、查询结果)子模块(Qbus-下载-PART 2视频内容的理解与 应用PART 2视频信息流的主要场景视频信息流的主要场景人脸分析视频防抖实时特效视频特效的技术展示人脸分析视频防抖实时特效视频特效的技术展示人脸检测定位人脸检测定位视频内容理解的技术与应用课件精度:R

5、esNet to DenseNet精度:ResNet to DenseNet精度:ResNet + DenseNetExplore New FeaturesFeature Refinement (Reuse Features)精度:ResNet + DenseNetExplore NeDual-Path NetworkModel SizeResNeXt-101 (64x4d)DPN-98236 MB320 MB20.4 / 5.320.2 / 5.2- 26%15.5GFLOPs11.7- 25%12.1 GBGPU Memory11.1 GB- 8%ResNeXt-101 (64x4d)DP

6、N-98Single model, Single center-crop, Top-5 val error rate on x2994.25%4.16%DPN-98 is Fast!Training = 86 img/sec (per node, 4 x K80 cards)Top 1 / Top 5 Error on x224 PN速度评估Very Deep PolyNet PN性-评估error rateDual-Path NetworkModel SizeRes经典应用:分类/回归经典应用:分类/回归经典应用:分类/回归TCDCN:Tasks-Constrained Deep Convo

7、lutional Network经典应用:分类/回归TCDCN:Tasks-Constrai视频分析的主要内容智能封面人脸检测、主体识 别、精选清晰画面、 智能裁切分R标签基于对视频语音及图 像的综合分析,对视 频内容理解后形成分 类标签。视频OCR针对视频场C识别语 音内容。识别视频画 面中字幕、标题、弹 幕等关键内容。视频指纹特征视频去重、以影搜 影、相似视频、原创 保护视频分析的主要内容智能封面分R标签视频OCR视频指纹特征智能封面关键帧抽取智能截图,抽取关键帧 获取视频关键信息精选封面人脸及物体检测、图片质 量分析,精选清晰画面智能裁切主体识别、裁切为指 定尺寸123智能封面关键帧抽取

8、精选封面智能裁切123文本检测与识别文本检测与识别速度:Multi-path v s Multi-fiberBlo1k-lBlo1k-2(a Conv2ntional Multi-,ath D2sign( AlexNet,googleNet. ResNeXt, DPN, etc ,athl,ath2,ath3,athl,ath2,ath3Chann2lsBlo1k-lBlo1k-2(b Multi-3ib2r Design ,ath2,ath3,ath2,ath3C-m.lexi1y /educed 1- 1/3,athl,athl速度:Multi-path v s Multi-fiberB视

9、频内容理解的技术与应用课件Multi-fiberNetworks (lmageNet-1K) Multi-fiberNetworks (lmageNetMulti-fiberNetworks(on video) Multi-fiberNetworks(on video)Multi-fiberNetworks (Kinetics video cls) Multi-fiberNetworks (Kinetics智能生活智能移动机器人智能摄像头高级埔助驾驶系统ADAS智能生活智能移动机器人智能摄像头高级埔助驾驶系统360后视镜+ADAS360后视镜+ADASADAS - 检测模型基础模型特征编码候选

10、区域-位优化候选框修正物体分类输入图片ADAS - 检测模型基础模型特征编码候选区域-位优化候选框定位优化Con6olut+on+ Pool+ngC x W x H feature map x k boxes w+th conf+denceFully ConnectedC x w x h feature map迭代优化定位优化Con6olut+onC x W x H featNMSv.s. ox VotingNMS ox VotingNMSv.s. ox VotingNMS ox Votin检测模型 在线学习在线负样本挖掘Focal oss检测模型 在线学习在线负样本挖掘Focal oss检测模型 设计与细节数据分析物体尺寸类别分布图片尺寸设定检测时间物体尺寸分布描点设定描点个数描点尺寸全卷积网络设计降采样次数卷积核数目及

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论