版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
图像的智能理解与交互〔申请南开大学教职工作汇报〕汇报人:程明明1汇报内容根本情况简介自我介绍、研究背景主要研究工作介绍显著性检测、图像分割、交互编辑、图像检索、图像合成阶段性成果论文发表、工程经验、成果转化工作设想21.1自我介绍根本情况程明明,男,1985年出生于陕西教育与工作经历2003-2007:西安电子科技大学,学士2007-2021:清华大学,博士(导师胡事民教授)计算机系2021界博士毕业生学术排名第一2021-2021:ResearchFellow,OxfordWorkingwithProf.PhilipTorr2021.9-2021.1:微软剑桥研究院(MSRC)访问研究31.2研究背景图像改变人类生活方式!表达、记录、以及分享信息的重要媒介优点:内容直观、信息丰富、获取容易41.2研究背景图像的分析、编辑和利用所面临的挑战5像素颜色值区块……场景物体空间关系…1.2研究背景直观、方便的分析手段快速、智能的图像处理技术自然、方便的图像检索方法直观、高效的图像编辑体验6汇报内容根本情况简介自我介绍、研究背景主要研究工作介绍显著性检测、图像分割、交互编辑、图像检索、图像合成阶段性成果论文发表、工程经验、成果转化工作设想72主要研究内容8图像智能处理图像语义理解图像交互编辑2.1图像视觉显著性区域检测9图像视觉显著性区域检测MMCheng,etc.,GlobalContrastbasedSalientRegionDetection,IEEECVPR,p.409-416,2021.2.1图像视觉显著性区域检测研究意义计算机视觉的一个根本问题在计算机视觉和图形学中有着广泛的应用例如:物体识别、自适应图像压缩、感兴趣物体分割、内容敏感的图像缩放、图像检索等。主要奉献提出了基于全局比照度的图像视觉显著性区域检测算法。在国际上现有最大的公开测试集上,该方法的正确率明显优于已有方法。102.1图像视觉显著性区域检测
112.1图像视觉显著性区域检测显著性检测结果的视觉效果比较122.1图像视觉显著性区域检测在现有最大公开测试集[Achanta09]上13受到了国内外研究者的广泛关注。2021年6月发表至今,已有1000多位研究者索要源代码〔源代码共享,登记即可获得〕,它引310屡次。2.1图像视觉显著性区域检测(2)14MMCheng,etc.,Efficientsalientregiondetectionwithsoftimageabstraction.IEEEICCV,2021.2.1图像视觉显著性区域检测(2)主要奉献:提出一种softimageabstraction表达,能更加方便的描述大尺度的表观相似区域,提高全局视觉显著性特征估计的鲁棒性和效率.152.1图像视觉显著性区域检测(2)结果例如162.1图像视觉显著性区域检测(2)结果例如定量评价172.2视觉显著性区域分割18MMCheng,etc.Salientobjectdetectionandsegmentation.SubmittedtoIEEETPAMI.图像视觉显著性区域分割2.2视觉显著性区域分割基于迭代的GrabCut的显著性区域分割特点:迭代更新+自适应拟合优势:更鲁棒、使得无监督的分割成为可能192.2视觉显著性区域分割在现有最大公开测试集[Achanta09]上著性区域分割实验之前的最好结果:精度=75%,召回率83%本文算法的结果:精度=90%,召回率90%202.2随机游走图像分割的连通性理论21MMCheng,GXZhang,ConnectednessofRandomWalkSegmentation.IEEETPAMI,2021.33(1):p.200-202.2.2随机游走图像分割的连通性理论经典理论[Grady06]分割结果中每个区域至少包含一个同Label的Seed点(随机游走的结果不会产生额外碎片)。新的理论发现经典理论[Grady06]中的结论和证明是错误的给出了关于结果连通性的五个新的定理及证明(详见论文)222.3基于相似结构分析的图像编辑图像中相似语义单元分析与编辑:流程23MMCheng,etc.,RepFinder:FindingApproximatelyRepeatedSceneElementsforImageEditing,ACMTOG(SIGGRAPH).29,4,83:1-8,2021.2.3基于相似结构分析的图像编辑研究动机相似物体在自然和人造场景中广泛存在相似物体的图像获得粗略的场景信息场景几何信息自然、直观的图像编辑主要奉献基于简单交互的相似物体快速检测方法遮挡物体补全、稠密对应关系计算、层次关系估计等方法。一系列场景物体级别图像编辑应用242.3基于相似结构分析的图像编辑系统流程252.3基于相似结构分析的图像编辑遮挡物体补全、稠密对应关系计算、层次关估计等步骤之后的分析结果262.3基于相似结构分析的图像编辑图像重排应用27原始输入图像2.3基于相似结构分析的图像编辑编辑传播应用282.3基于相似结构分析的图像编辑同步变形应用292.3语音驱动的图像理解与编辑30MMCheng,etc.,ImageSpirit:VerbalGuidedImageParsing,SubmittedtoACMTOG.2.3语音驱动的图像理解与编辑研究意义自然直观的交互方式是机器智能的重要表达憧憬:图灵测试、科幻电影现实:智能设备(iPhoneSiri),GoogleGlasses主要奉献国际上首次提出并实现了基于自然语言的交互式图像分析工具提出了Multi-LabelFactorialCRF算法,可以快速有效的集成多源信息312.3语音驱动的图像理解与编辑32Make
the
wood
cabinet
in
bottom-middle
lower名词形容词动词/副词MultilabelCRF物体选择属性选择编辑操作2.3语音驱动的图像理解与编辑Multi-LabelFactorialCRF33
Objectclassifiers:table,chair,etc.Attributesclassifiers:wood,plastic,red,etc.Correlationbetweenattributes.Objectandattributescorrelation.2.3语音驱动的图像理解与编辑Multi-LabelFactorialCRF在一个统一的算法框架下实现逐像素的物体类别及语义属性的推断利用基于快速滤波的均值场推断技术(meanfieldinference)进行快速交互34
2.3语音驱动的图像理解与编辑系统演示352.3基于长方体结构的智能编辑
36YZheng,XChen,MMCheng,KZhou,SMHu,NJMitra.InteractiveImages:Cuboid-proxiesforSmartImageManipulation.ACMTOG(SIGGRAPH).31,4,1-10,2021.2.3基于长方体结构的智能编辑
研究意义3D逼真的图像编辑困难普通图像精确几何信息方案长方体近似主要奉献提出了一种场景物体级别图像编辑算法框架,能够逼真地实现三维世界中的物体编辑372.3基于长方体结构的智能编辑
图像编辑例如382.3基于长方体结构的智能编辑392.4基于重要物体形状的图像检索40MMCheng,NJMitra,XHuang,SMHu,SalientShape:GroupSaliencyinImageCollections,TheVisualComputer,2021.2.4基于重要物体形状的图像检索研究意义图像数量迅速增长方便的获取想要的内容关键字(网络元数据)+形状是或否具体的物体区域主要奉献提出了一种群组显著性(groupsaliency)的方法来自动的从一组相关但是组成多样的网络图像中提取感兴趣物体区域,其正确率明显高于单张图像的显著性区域检测结果。412.4基于重要物体形状的图像检索从网络数据中学到的表观信息422.4基于重要物体形状的图像检索对群组图像中重要性物体检测的改善43利用自动学习到的表观模型对输入图像(a)进行分析(d),本方法可以有效的改进单张图像的视觉显著性物体区域检测(b)与分割(c)结果。2.4基于重要物体形状的图像检索对群组图像中重要性物体检测的改善442.4基于重要物体形状的图像检索图像检索应用452.4基于重要物体形状的图像检索462.5基于网络图片的图像合成47TChen,MMCheng,PTan,AShamir,SMHu,Sketch2photo:internetimagemontage,ACMTOG.(SIGGRAPHAsia),vol.28,no.5,124:1-10,2021.2.5基于网络图片的图像合成系统流程482.5基于网络图片的图像合成更多合成结果例如492.5基于网络图片的图像序列合成50TChen,PTan,LQMa,MMCheng,AShamir,SMHu.PoseShop:HumanImageDatabaseConstructionandPersonalizedContentSynthesis.IEEETVCG.汇报内容根本情况简介自我介绍、研究背景主要研究工作介绍显著性检测、图像分割、交互编辑、图像检索、图像合成阶段性成果论文发表、工程经验、成果转化工作设想513.1论文发表(1)M.M.Cheng,J.Warrell,S.Zheng,V.Vineet,andW.Y.Lin.Efficientsalientregiondetectionwithsoftimageabstraction.InIEEEICCV,2021.M.MCheng,S.Zheng,W.Y.Lin,J.Warrell,V.Vineet,P.Sturgess,N.J.Mitra,N.CrookandP.Torr,ImageSpirit:VerbalGuidedImageParsing,SubmittedtoACMTOG.M.M.Cheng,N.J.Mitra,X.Huang,P.Torr,andS.M.Hu.Salientobjectdetectionandsegmentation.SubmittedtoIEEETPAMI.M.M.Cheng,G.X.Zhang,N.J.Mitra,X.Huang,andS.M.Hu.Globalcontrastbasedsalientregiondetection.InIEEECVPR,2021.(2ndmostcitedpaperinallCVPR2021papers).M.M.ChengandG.X.Zhang.Connectednessofrandomwalksegmentation.IEEETPAMI,33(1),2021.M.M.Cheng,F.L.Zhang,N.J.Mitra,X.Huang,andS.M.Hu.RepFinder:Findingapproximatelyrepeatedsceneelementsforimageediting.ACMTOG(SIGGRAPH),29(4):83:1–8,2021.T.Chen,M.M.Cheng,P.Tan,A.Shamir,andS.M.Hu.Sketch2photo:Internetimagemontage.ACMTOG(SIGGRAPHAsia),28(5):124:1–10,2021.52TPAMIisthe#1IEEEpublication.SIGGRAPH,ICCV,CVPRaretopcomputergraphicsandcomputervisionconference,eachhasCiteSeerimpactfactorrankingtop0.7%,5%,and5%ofallcomputersciencejournalsandconferences.3.1论文发表(续)W.Y.Lin,M.M.Cheng,S.Zheng,J.Lu,andN.Crook.Robustnon-parametriccorrespondencefitting.InIEEEICCV,2021.M.M.Cheng,N.J.Mitra,X.Huang,andS.M.Hu.SalientShape:Groupsaliencyinimagecollections.TheVisualComputer,pages1–10,2021.S.M.Hu,T.Chen,K.Xu,M.M.Cheng,andR.R.Martin.Internetvisualmediaprocessing:asurveywithgraphicsandvisionapplications.TheVisualComputer,2021.T.Chen,P.Tan,L.Q.Ma,M.M.Cheng,A.Shamir,andS.M.Hu.PoseShop:Humanimagedatabaseconstructionandpersonalizedcontentsynthesis.IEEETVCG,2021.Y.Zheng,X.Chen,M.M.Cheng,K.Zhou,S.M.Hu,andN.J.Mitra.Interactiveimages:Cuboid-basedsceneunderstandingforsmartmanipulation.ACMTrans.Graph.(SIGGRAPH),31(4),2021.F.L.Zhang,M.M.Cheng,J.Jia,andS.M.Hu.ImageAdmixture:Puttingtogetherdissimilarobjectsfromgroups.IEEETVCG,2021.G.X.Zhang,M.M.Cheng,S.M.Hu,andR.R.Martin.Ashape-preservingapproachtoimageresizing.ComputerGraphicsForum,28(7):1897–1906,2021.533.2参与科研工程SceneUnderstandingusingNewGlobalEnergyModels,EPSRC新一代搜索引擎关键技术研究,国家科技重大专项网络可视媒体的交互与合成,国家973方案可视媒体的交互与融合处理,国家973方案基于认知模型的图像不变性特征理论及其应用研究,科学基金重点工程基于结构分析的视频卡通风格绘制技术研究,科学基金面上工程543.3成果转化创造专利一种基于轮廓带图的相似单元检测方法,专利号:ZL101833668A.一种基于共形能量的内容敏感图像缩放方法,专利号:ZL101650824.一种基于草图的网络图元自动提取方法和系统,专利号:ZL101526955.基于卡通片的高质量线结构提取方法,专利号:ZL101276477.…55已获国家创造专利授权11项,申请PCT国际创造专利三项。多项专利已被商业应用。3.3成果转化源码下载1000+次,被广泛应用论文GoogleScholar被引用640余次WebofScience它引220余次(更新较慢)563.3成果转化源码下载1000+次,被广泛应用论文GoogleScholar被引用640余次WebofScience它引220余次(更新较慢)成果主页已有大约20万个独立IP访问量573.3成果转化源码下载1000+次,被广泛应用论文GoogleScholar被引用640余次WebofScience它引220余次(更新较慢)成果主页已有大约20万个独立IP访问量研究成果被著名国际媒体撰文报道英国?每日邮报?德国?明镜周刊?成果介绍视频网上点击率百万次以上作品应邀参加十一五重大科技成果展583.3成果转化主要获奖情况北京市优秀博士论文,2021(清华共7名)ShortlistedasNewtonInternationalFellowship,2021英国皇家学会每年面向全世界在自然科学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论