




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
千里之行,始于足下让知识带有温度。第第2页/共2页精品文档推荐数字图像处理读书报告Efficientobjectdetectionandsegmentationforfine-grainedrecognition细粒度识别的有效目标检测与分割
李其信202220952信号与信息处理
1
我们的办法是在检测的时候基于感爱好类的识别。在这里,为对象的超类,如鸟类,这个主意是建立基于特征的初步检测。这些检测器是对象的指示器,可以协助指出对象可能的位置。我们进一步应用基于拉普拉斯操作数的传扬办法,这种办法可以在低级别的线索中分割完整的对象。这里的关键是,这个传输过程是由最初检测到区域来引导,但在同一时光能够保存对象的边界,从而有效地分割完整对象。此外,所得到的分割是用来定位对象,折扣的背景的影响。我们的试验显示,这对于终于的识别是相当有益的。
3过程
论文第3节介绍如何在一个图像中检测和分割对象。第一步,3.1节中完成一系列基本的基于区域的部分对象检测。然后,在3.2节中提出,使用这些区域作为初始化条件,利用拉普拉斯传扬办法。最后,第4节中,将分割后的图像(它包含检测到的和分段对象,可能被裁剪或者大小已被调节)和输入图像,通过该功能特征提取和分类管道(第4节),终于得到分类的结果。3.1对象的特定区域检测
我们的办法是首先初始搜寻可能属于超类的对象区域。为容易,我们使用超像素分割办法把图像分割成相干的小块区域。每个超级像素区域利用文献[3]中提到的一组特征描述符描述。利用上述特点,在脱机条件下训练一个分类模型去打算一个区域是属于超类(如全部花)还是属于背景。该模型的一个优点就是其通用性,可以再不同类别的数据集上举行训练,不是针对一个超类别的特征。对于花鸟猫狗的检测和模型的训练,使用的是同一样的算法。
3.2全对象分割
3.2.1用
jI表示图像第j个像素,jf表示它的特征表示。分割任务的目标是找到每个像素点
jI的标签jX,当像素属于分割的对象时,1jX=,否则0jX=。利用每个像素点的特征if组成相像矩阵W。
惟独相邻的像素点之间的关系矩阵ijW是非零的,出于计算的速度或者其它的可能挑选,我们将iiW设为0,if为像素的色彩值。
目标是最小化成本函数C(X)
(1)
,Y是对于一些或者所有像素点,期望的标签时
这些卷标约束对于强加什么是对象什么是背景这种先验学问是十分实用的。这是一种标准的拉普拉斯标签传扬的制定,上面的公式通常写成一种更便利的等价公式:
其中,S定义:
3.2.2优化.方程式1的优化问题是可以用文献[28]的迭代来解决。另外,它可以作为一个线性的系统方程来解决,我们挑选这种办法,对方程1求导后,我们得到一个最优解X。
在我们的实现中,我们使用共轭梯度办法举行预处理,实现了十分迅速的收敛性。因为前景的蔓延特性和不同的图像的背景(和数据)可能会有所不同,我们分离单独考虑惟独前景或者惟独背景的检测。这是因为对其中一个举行的分割可能是好的但是相对于其它结合结果的前景和背景的分割产生更全都的分割和利用功能的互补性。表示钇铁石榴石=Y的时候y>0和0,否则,?YBG=Y初乳<0和0,否则,我们解决了:
定义Yfg=Y当Y>0时,否则Yfg=-Y
在实践中,这两个分割通过应用下列规范标签同时举行
由于它避开了单独优化,这使得算法更快。同时,对个人的前景背景分割办法也给出了相同的结果,这也更稳定。为了获得终于的分割,Xsegm的阈值为0。
图3显示的卷标传扬算法和终于的分割的结果。右上方的图像显示每个超级像素区域的得分(在这里我们用分类间隔)。右下方的图像显示拉普拉斯操作数的扩展的解决计划,给出了初步的地区(即方程2的解)。注重不是全部的目标区域的最初都能获得高得分。这也是真切的背景区域。拉普拉斯扩展后,前景和背景之间的分割通过强分别获得。图4显示了示例分割图像。请注重,并非全部的细分都是胜利的,特殊是鸟类。然而,在试验后见,即使是局部的分割是实用的,我们的办法提供了性能的改善。
3.3细粒度的识别与分割
本节介绍了在最后的细粒度的识别任务中如何使用分割图像。为容易起见,我们首先描述基线算法。我们应用特征提取和分类管道,首先提取4个不同尺度的HOG特征,这些特征利用文献25中提到的LLC办法举行8K维的全局编码。我们的分类管道使用线性SVM分类器的1-vs-all策略,使用线性SVM的变形。对于578类花这种十分大的数据集,我们使用一个随机的梯度下降算法,由于线性的无法加载囫囵数据到内存。分割后的图像是通过相同的特征加工提取管道再作为原始图像,然后我们通过衔接来结合两组提取的特征。这种办法分割时光较其他算法快无数。
4结果
试验过程中在不同的标准数据集上举行,与其他的算法举行比较。除此之外,还在含有578类的花的大型数据集上举行试验。
4.1牛津花卉102种数据集
在这个数据集上,本文的办法对象检测率为80.66%,比其他文献中提到的算法优越4%到8%,在我们的基线算法是约4%,两者之间的唯一区分是增强了分割算法和从分割图像举行特征提取。
4.2加州理工学院分校的200种鸟类的数据集
在相同的设置下,我们的算法相对于文献27实现了30.17%的分类性能提升。即使不适用基线算法,我们的算法也实现27.60%的性能提升。
4.3牛津猫狗数据集
我们的办法优于普通或一些特定的算法。同时,我们在分割中,没有像其他算法一样使用某些特定的对象解释货特征。
4.4包含578类花的大规模特别数据集
我们测试我们的基线算法与基于分割的算法举行对照,我们的算法改进了4.4%。这里自动分割算法在提高性能上的优势是很重要的。假如针对不同的数据集,对分割算法举行调节,就可以进一步提升分割性能。
本文件提出了一种结合基于感爱好对象区域检测和传扬全局检测的算法。在面向具有挑战性的数据集时,此算法的分割时光得到改善,性能得到3-4%的改善。。
5启发
5.1本文在基线方面的改进促使在分割对象中体现出很好的价值。然而,我们试验的数据集可能不具有普遍代表性,这要求我们在今后的工作中去讨论
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏省启东市2025年高三下北师大版英语试题期末考试试题含解析
- 四川省宜宾市兴文县高级中学2025届高三下第二次月考试题含解析
- 南通市崇川区启秀中学2024-2025学年初三第三次联考(四川版)英语试题试卷含答案
- 内蒙古鄂尔多斯一中2024-2025学年高三年级下学期第一次诊断考试语文试题含解析
- 长沙二手房交易合同示范文本
- 业绩合作协议范本
- 花园洋房买卖合同书
- 变电站防雷接地安装工程合同
- 山东省聊城市2024-2025学年高一下学期期中考试历史试题(含答案)
- 广东省中山市小榄镇2024-2025学年七年级下学期期中地理试题(含答案)
- 2024年10月1日新中国成立75周年主题班会课件
- 咖啡店店长招聘协议样本
- 2024年医院重点岗位人员定期轮岗制度
- TCI 324-2024 冠心病患者防治精准护理技术规范
- 港航实务 皮丹丹 教材精讲班课件 51-第2章-2.5.2-铺面基层施工
- 桥门式起重机拆卸、搬迁、安装施工方案
- Unit 3 Sports and Fitness Reading for Writing 词汇与写作 教学设计-2023-2024学年高一上学期英语人教版(2019)必修第一册
- 灌注桩后注浆施工技术规程1
- 《大数据导论(第2版)》全套教学课件
- 职业病防护设施与个体防护用品的使用和维护
- 新疆能源(集团)有限责任公司招聘笔试题库2024
评论
0/150
提交评论