版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于视觉推理的视频理解方案技术创新 变革未来视频理解典型应用机器人城市管理元人驾驶安防监控视频理解研究目标视频描述的场景?视频里面的物体?视频中物体位置?物体间什么关系?物体与场景关系?视频会发生什么?视频理解研究代表性任务Video aptionVideo Question AnsweringMoment RetrievalVideo Relation ReasoningVideo GenerationVideo Grounding视频理解的挑战:复杂场景Kenneth Marino, Ruslan Salakhutdinov, Abhinav Gupta: The More You Kno
2、w: Using Knowledge Graphs for Image Classification. CVPR 2017: 20-28视频理解的挑战:小样本Junyu Gao, Tianzhu Zhang, Changsheng Xu: I Know the Relationships: Zero-Shot Action Recognition via Two-Stream Graph Convolutional Networks and Knowledge Graphs. AAAI 2019: 8303-8311视频理解的挑战:可解释性Will Norcliffe-Brown, Stath
3、is Vafeias, Sarah Parisot: Learning Conditioned Graph Structures for Interpretable Visual Question Answering. NeurIPS 2018: 8344-8353视频理解的挑战:Medhini Narasimhan, Svetlana Lazebnik, Alexander G. Schwing: Out of the Box: Reasoning with Graph Convolution Nets for Factual Visual Question Answering. NeurI
4、PS 2018: 2659-2670深度推理学习图神经网络基本模型Zonghan Wu, Shirui Pan, Fengwen Chen, Guodong Long, Chengqi Zhang, Philip S. Yu: A Comprehensive Survey on Graph Neural Networks. CoRR abs/1901.00596 (2019)ConvGNN for ClassificationGAE for EmbeddingSTGNN for Spatio-temporal LearningConvGNN with Gconvs图神经网络应用Jie Zhou
5、, Ganqu Cui, Zhengyan Zhang, Cheng Yang, Zhiyuan Liu, Maosong Sun: Graph Neural Networks: A Review of Methods and Applications.CoRR abs/1812.08434 (2018)深度图推理学习:基本要素(a)图类型(c)训练方(b)传)方(深度图推理学习到视觉内容理解Xinlei Chen, Li-Jia Li, Li Fei-Fei, Abhinav Gupta: Iterative Visual Reasoning Beyond Convolutions. CVP
6、R 2018: 7239-7248复杂视觉场景Learning+Reasoning基于图推理学习视觉内容描述Ting Yao, Yingwei Pan, Yehao Li, Tao Mei: Exploring Visual Relationship for Image Captioning. ECCV (14) 2018: 711-727基于图推理学习视觉内容描述Ting Yao, Yingwei Pan, Yehao Li, Tao Mei: Exploring Visual Relationship for Image Captioning. ECCV (14) 2018: 711-72
7、7基于深度推理学习的视觉问答Medhini Narasimhan, Svetlana Lazebnik, Alexander G. Schwing: Out of the Box: Reasoning with Graph Convolution Nets for Factual VisualQuestion Answering. NeurIPS 2018: 2659-2670基于深度推理学习的视觉问答Medhini Narasimhan, Svetlana Lazebnik, Alexander G. Schwing: Out of the Box: Reasoning with Graph
8、 Convolution Nets for Factual VisualQuestion Answering. NeurIPS 2018: 2659-2670基于深度推理学习的视频动作识别基于卷积的关系推理Yunpeng Chen, Marcus Rohrbach, Zhicheng Yan, Shuicheng Yan, Jiashi Feng, Yannis Kalantidis: Graph-Based Global ReasoningNetworks, CVPR 2019基于深度推理学习的视频动作识别图推理单元表示Yunpeng Chen, Marcus Rohrbach, Zhich
9、eng Yan, Shuicheng Yan, Jiashi Feng, Yannis Kalantidis: Graph-Based Global ReasoningNetworks, CVPR 2019图推理单元可视化结果基于深度推理学习的视觉关系识别Zhouxia Wang, Tianshui Chen, Jimmy S. J. Ren, Weihao Yu, Hui Cheng, Liang Lin: Deep Reasoning with Knowledge Graph for SocialRelationship Understanding. IJCAI 2018: 1021-10
10、28基于深度推理学习的视觉关系识别Zhouxia Wang, Tianshui Chen, Jimmy S. J. Ren, Weihao Yu, Hui Cheng, Liang Lin: Deep Reasoning with Knowledge Graph for SocialRelationship Understanding. IJCAI 2018: 1021-1028基于深度推理学习的组行为识别Jianchao Wu, Limin Wang, Li Wang, Jie Guo, Gangshan Wu: Learning Actor Relation Graphs for Group Activity Recognitio
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年增资协议合同签订流程
- 2025年仓储货物出借协议
- 2025年圣诞节装饰协议
- 2025年商业责任不足额保险条款设定
- 二零二五版木屑生物质颗粒燃料研发与推广合同4篇
- 二零二五年度木工行业技术标准制定合作协议3篇
- 二零二五年度汽车抵押贷款购车二手车过户合同
- 二零二五年度科技创业项目股权众筹委托投资合同
- 二零二五年度车辆绿色出行补贴购买合同
- 二零二五年度经典实习合同(法律事务实习)
- 机电安装工程安全培训
- 洗浴部前台收银员岗位职责
- 2024年辅警考试公基常识300题(附解析)
- GB/T 43650-2024野生动物及其制品DNA物种鉴定技术规程
- 暴发性心肌炎查房
- 工程质保金返还审批单
- 【可行性报告】2023年电动自行车项目可行性研究分析报告
- 五月天歌词全集
- 商品退换货申请表模板
- 实习单位鉴定表(模板)
- 数字媒体应用技术专业调研方案
评论
0/150
提交评论