弹性跨模态特征学习在图像识别中的应用分析_第1页
弹性跨模态特征学习在图像识别中的应用分析_第2页
弹性跨模态特征学习在图像识别中的应用分析_第3页
弹性跨模态特征学习在图像识别中的应用分析_第4页
弹性跨模态特征学习在图像识别中的应用分析_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、    弹性跨模态特征学习在图像识别中的应用分析    摘 要 典型相关分析(cca)是一种经典的特征学习方法,广泛应用于图像识别、信息融合、情感计算等领域。然而cca难以发现隐藏在原始样本空间中的非线性局部子流形结构。为了解决该问题,本文在典型相关分析基础上提出了一种弹性跨模态特征学习方法,该方法同时保留了隐藏在原始样本空间中的局部几何结构和全局欧几里得结构。实验结果显示了该方法在图像识别方面的有效性。关键词 典型相关分析;流形结构;弹性;局部几何;全局欧几里得引言最近几年,模态学习广泛应用于图像识别1、图像分割2、姿态估计3、基因分析4等领域。尤其在

2、图像识别领域,如何从高维的模态数据中学习具有强鉴别力的低维特征已经成为一项挑战性的课题。cca5旨在寻找一对投影方向,用以最大化两模态数据之间的相关性。然而,cca本质上是一种线性维数约简技术,因此它只能全局地揭示两组特征之间的线性相关关系,这种线性模型不足以评估特征之间的非线性相关关系。为此孙权森6提出了局部保持cca(locality preserving cca)方法,该方法将局部结构信息嵌入到cca中,在局部邻域中利用线性cca来处理问题,从而解决全局问题。lpcca既保留了局部几何结构又获得了两模态数据集之间的典型相关性。受弹性保持投影(epp)7方法的启发,本文提出了一种弹性跨模态

3、特征学习方法,即弹性典型相关分析方法(elastic cca),该方法不仅保留了原始样本集的局部几何结构同时也考虑到了全局欧几里得结构,保持了局部和全局的弹性关系,获得了最大相关性的典型相关特征。文章其余部分安排如下,第二节简要介绍了cca方法,第三节详细介绍和分析了ecca方法并在第四节中给出了该方法在一些数据集上的识别性能,第五节给出了本文的结论。1弹性相关分析方法假设和为两个模态样本集,其中和分别为样本维度,为样本总数,样本均以均值归一化。具体的优化模型为:(1)其中,(or )是一个对角矩阵,对角线上的元素为(or)矩阵每一行或列累加后的结果。中:(2)中:(3)其中,是类内局部相似矩

4、阵中第个元素,是一个核参数,表示的前k个最近邻样本集合。为了进一步求解优化模型,利用拉格朗日乘子法可以将上式等价地转化为以下的广义特征值问题:(4)其中是特征值,通过求解公式(4)可以分别获得样本集x和样本集y的前个最大特征值对应的特征向量和。通过构建投影矩阵和进一步得到样本集x和样本集y的低维相关特征和。2实验结果分析在本节中,我们分别在gt图像数据集和orl图像数据集上设计了一些实验来说明ecca方法的识别性能。2.1 在gt图像数据集上的实验a±b:a表示平均識别率(%),b表示相应的识别率标准差gt图像数据集共有50个对象分别对应15副彩色背景的面部图像,共750副面部图像,

5、每幅图像具有不同的表情,照明和倾斜比例变化。在实验部分,分别从每类对象中选取q(q=5,6,7,8)个样本作为训练样本,其余样本作为测试样本,权重 统一为0.05,近邻参数k为2。cca仅保证了两模态数据集之间的最大相关性而忽略了模态内的非线性子流形结构和全局欧几里得结构结构,在表1中也表现出了较差的识别性能。lpcca在cca的基础上保留了模态内的局部子流形结构,但在高维的数据中,大量的噪声和冗余信息会导致lpcca难以真实的反映局部子流形结构,这仍然会影响它的识别性能。ecca在lpcca的基础上通过保留全局欧几里得结构获得了更具鲁棒性的弹性结构,学习到更具有鉴别力的相关特征,因此在表1中

6、展现了较为优秀的识别性能。3结束语特征学习的核心任务是从高维的模态数据中学习到能够保存原始模态数据中有效信息的低维特征。基于这种思想,本文提出了一种ecca方法,在cca中嵌入局部几何结构信息和全局欧几里得结构信息来达到保留弹性结构的目的。相比于lpcca,ecca利用了全局信息来发现原始模态数据中的欧几里得结构,更全面地保留了原始模态数据的结构信息。在两个真实的图像数据集上,实验结果揭示了ecca方法在图像识别中的良好性能。参考文献1 han d,nie h,chen j,et al. multi-modal haptic image recognition based on deep le

7、arningj. sensor review,2018,38(4):486-493.2 dolz j,gopinath k,yuan j,et al. hyperdense-net: a hyper-densely connected cnn for multi-modal image segmentationj. ieee transactions on medical imaging,2018,38(5):1116-1126.3 hong c,yu j,zhang j,et al. multi-modal face pose estimation with multi-task manif

8、old deep learningj. ieee transactions on industrial informatics,2018,15(7):3952-3961.4 chaudhary k,poirion o b,lu l,et al. multimodal meta-analysis of 1,494 hepatocellular carcinoma samples reveals significant impact of consensus driver genes on phenotypesj. clinical cancer research,2019,25(2):463-4

9、72.5 sun q s,zeng s g,liu y,et al. a new method of feature fusion and its application in image recognitionj. pattern recognition,2005,38(12):2437-2448.6 sun t,chen s. locality preserving cca with applications to data visualization and pose estimationj. image and vision computing,2007,25(5):531-543.7 zang f,zhang j,pan j. fac

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论