特征判别增强的高效图像语义分割方法_第1页
特征判别增强的高效图像语义分割方法_第2页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

特征判别增强的高效图像语义分割方法高常鑫华中科技大学图像语义分割对图像中每个像素进行分类,是图像深度理解的基础,方法应用于自动驾驶、无人智能系统等领域。现有图像语义分割方法还面临两个问题:1)准确的语义分割即需要高层语义特征和低层细节特征,也需要同类特征和异类特征,但是他们两两之间都存在一定程度的冲突,但是现有方法忽略了这种耦合,导致特征判别性有限;2)语义分割很大程度上依赖于上下文信息,但是现有方法通常倾向于采用所有的上下文信息,一方面部分上下文信息对语义分割没有帮助甚至导致特征区分能力下降,另一方面还增加了运算量。如何解决耦合特征之间的冲突和选择有效的上下文信息对语义理解至关重要,因此特征判别增强的高效图像理解框架是图像语义理解的关键科学问题。针对高层-低层、同类-异类特征耦合问题,研究特征解耦的语义理解框架,实现了准确高效的语义分割。主要工作如下:(1)提出了双通路的场景图像的实时像素级语义分割方法,为高精度的实时语义分割提供了基准算法基于深度学习的图像语义分割方法已经取得了不错的效果,但是受限于网络的规模,其速度远不能达到实时的要求。同时,语义分割需要定位精度和语义两个方面的信息,网络越深提取语义越准确,但定位精度越差。因此,在目前的深度网络模型中定位精度和语义对于网络的需求是有冲突的。针对上述难点,深入研究了不同网络深度对于定位精度和分类两个方面的影响,提出一种双通路的场景图像语义分割方法。通过网络结构设计为双通路,将定位和分类两个任务解耦,分别解决定位精度和分类的问题,利用一个较浅且通道数多的通路来获取高精度的定位信息,并利用一个较深且通道数少的通路来获取准确的语义信息,有效解决了两者之间的矛盾,并大幅提高运算速度,实现了实时语义分割。在单张NVIDIAGeForceGTX1080Ti的GPU卡上,速度达到了156FPS,提升了算法适应性,成为了不同领域的基准算法。图8双通路的场景图像的实时像素级语义分割方法及性能(2)提出了基于自主特征选择的图像分割方法,提升算法性能的同时大幅减少了计算量目前主流的图像语义分割方法依赖于大范围的上下文关系建模,有利于推理分割场景要素,当前场景分割方法往往利用自注意力机制建模远距离关系。但是自注意力机制中存在大量冗余计算,导致复杂度较高,限制了它的应用;同时,大量冗余信息也降低了特征的判别性。针对上述难点,通过学习的方式选择少量“重要”上下文信息,提出基于自主特征选择的图像分割方法。采用基于相似性关系引导特征选择的思路,提出了代表图分割算法,通过学习特征相似性关系,引导特征选择过程,使其选择有代表性的特征,进而有效建模远距离关系,提高特征判别性。该方法提出了一种高效的上下文建模策略,大幅减少自注意力机制的冗余计算,提升分割性能与效率。实验表明,性能提高的同时,该方法GLOPS和推理速度约分别为自注意力机制的1/17和1/6。在“特征判别增强的高效图像理解框架”方面取得了一些理论成果,论文发表于计算机视觉顶级期刊IJCV、顶级会议CVPR、ECCV等。成果取得了广泛的关注。提出的BiSeNet入选ECCV2018最具影响力20篇论文,入选ESI热点论文、ESI高被引论文,谷歌学术引用1200余次。BiSeNet已经被集成到百度paddlepaddle、商汤mmseg等知名深度学习平台,广泛应用于人脸属性编辑、3D人脸合成、非接触心率估计等领域。发布的图像语义理解工具torchseg在Github点赞1400余次。该成果发表学术论文5篇、授权发明专利2项:[1]ChangqianYu,ChangxinGao*,JingboWang,GangYu,ChunhuaShen,NongSang,"BiSeNetV2:BilateralNetworkwithGuidedAggregationforReal-timeSemanticSegmentation,"InternationalJournalofComputerVision(IJCV),vol.129,pp.3051-3068,2021.[2]BeibeiYang,ChangqianYu,Jin-GangYu,ChangxinGao*,NongSang,"Pose-GuidedHierarchicalSemanticDecompositionandCompositionforHumanParsing,"IEEETransactionsonCybernetics(TCYB),2021.[3]ChangqianYu,JingboWang,ChangxinGao*,GangYu,ChunhuaShen,NongSang,"ContextPriorforSceneSegmentation,"CVPR,2020.[4]ChangqianYu,JingboWang,ChaoPeng,ChangxinGao*,GangYu,NongSang,"LearningaDiscriminativeFeatureNetworkforSemanticSegmentation,"CVPR,2018.[5]ChangqianYu#,JingboWang#,ChaoPeng,ChangxinGao*,GangYu,NongSang,"BiSeNet:BilateralSegmentationNetworkforReal-timeSemanticSegmentation,"ECCV,2018.[6]高常鑫,何兆华,余昌黔,桑农。一种基于双边分割网络的车载图像语义分割系统,发明专利,专利号:ZL2018108496573,授权公告日:2020-10-30[7]刘佳惠,高常鑫,桑农。一种弱监督语义分割方法及其应用,发明专利,专利号:ZL2020100046015,专利授权日:2022-10-14[8]余昌黔,高常鑫,桑农。一种基于上下文先验的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论