人脸识别的鲁棒因素_第1页
人脸识别的鲁棒因素_第2页
人脸识别的鲁棒因素_第3页
人脸识别的鲁棒因素_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人脸识别的鲁棒因素

1小波变换的图像去噪人脸识别技术是生物特征识别领域的一个前沿问题。它包括图像分析和理解、模式识别、机械视觉、人工智能和其他相关学科。广泛应用于国家公共安全、视频监控、机械设备等领域。因此,人脸识别研究具有重要的理论价值和应用前景。目前,人脸识别技术在理想环境下已经取得令人满意的效果。但是,人脸图像受光照、表情和遮挡等因素影响较大,在这些非理想情况下的识别性能依然不能令人满意。为了提高人脸识别的鲁棒性,研究人员进行了大量的探索,其中小波变换是使用较多的方法之一。EkenelHK和SankerB使用小波变换对人脸图像进行分析,提取对表情和光照变化不敏感的子带进行识别,提高了光照、表情变化条件下的识别率。LiuCC和DaiDQ等提出了一种新的膨胀不变熵和最大后验概率模型,赋予不同小波子带一定的权值,也改善了人脸识别效果。ZhangT把小波变换的去噪模型引入人脸识别,将光照变化建模,在一定条件下增强了人脸识别的光照鲁棒性。虽然小波变换能有效地压缩图像数据,且对光照、表情变化不敏感,但基于小波变换的方法并不能很好地改善遮挡因素对识别的不利影响,寻求鲁棒的人脸识别算法仍然是个亟待解决的问题。近年来,图像的稀疏表示引起越来越多的关注。SerreT在其博士毕业论文中指出,人类的视觉系统具有对图像的稀疏表示特性,视觉神经元对于图像的部分特征有着强烈的响应,这部分特征就是视觉系统的稀疏成分,只需感知这些稀疏成分就能准确辨别不同的图像。Wright和Yang将稀疏表示理论应用于人脸识别,提出一种稀疏表征分类算法(SparseRepresentation-basedClassification,简称SRC),取得了在遮挡条件下较好的识别性能。基于以上研究,本文提出了一种结合小波变换和稀疏表征的人脸识别方法,充分挖掘小波变换和稀疏表征各自的优势,有效地提高了人脸识别方法的鲁棒性。2类型化后的src数学模型图像稀疏表征是建立在压缩感知理论基础之上的,其过程就是要从图像的空间域或者变换域表示中选择某些特征作为基函数,在这些基函数的张空间中把图像线性展开,利用很少一部分特征系数即稀疏成分来表示图像,其中基函数也称为原子,基函数的集合称为字典。所以,稀疏表征的本质就是在字典中选取部分原子来表示图像。其原理描述如下:将训练样本第k类的人脸样本列矢量化,构成样本矩阵:Ak=[φk,1φk,2φk,3⋯φk,m](1)其中,Ak∈Rn×m,n为特征维数,m为样本数目。由于同类样本的相关度非常大,所以同属于第k类的测试样本y可以表示为:y=Ak*xk=Ak*[αk1αk2αk3⋯αkm]Τ=αk1*φk,1+αk2*φk,2+αk3*φk,3+⋯+αkm*φk,m(2)其中,xk=[αk1αk2αk3⋯αkm]Τ,φk,i∈R(3)若由全部c个类别的训练样本矩阵构成字典:A=[A1A2A3⋯Ac](4)则属于第k类的测试样本y可以表示为:y=A*x=A*[x1x2x3⋯xc]Τ=A*[000αk1αk2αk3⋯αkm000]Τ=αk1*φk,1+αk2*φk,2+αk3*φk,3+⋯+αkm*φk,m(5)其中,x=[000αk1αk2αk3…αkm000]T是稀疏的,除了与第k类样本有关的系数不为0外,其余的系数都为0。在理想情况下,所有非零系数均来自于同类样本,它能准确地识别测试样本的类别。因此,SRC数学模型可以描述为如下优化问题:∧x=argmin∥x∥0,s.t.Ax=y(6)其中‖x‖0表示x中的0范数,即非0元素的个数。但是,上式实际上是个NP难解问题,Donoho等人研究表明,在满足一定条件下可以将上式求解0范数转换为求解1范数,即等价为下式:∧x=argmin∥x∥1,s.t.Ax=y(7)3本文件的方法本文提出的结合小波变换和稀疏表征的人脸识别方法如图1所示。3.1维小波变换的二维图像小波变换本质上是对信号用一组不同尺度的带通滤波器进行滤波,将信号分解到不同的频带上,然后分析处理这些子带。对于二维图像信号,可以用分别在水平方向和垂直方向进行一维小波变换的方法实现二维小波变换,对一幅图像进行一次二维小波变换后将得到4个子频区域:LL、LH、HL和HH,如图2所示。其中,LL保持了原图像的低频分量,HL保持了原图像的水平边缘细节,LH保持了原图像的垂直边缘细节,HH保持了原图像的斜边缘细节,小波变换的下一级分解只在低频分量上进行。研究表明,原始图像经过小波预处理后,能量绝大部分都集中在LL子带上,包含了大部分的分类信息,而其他子带包含的有用分类信息很少。3.2构成汉字的原子数目字典在很大程度上决定了分解系数的稀疏程度,是影响人脸识别正确率的关键因素之一。Wright指出,构成字典的原子的数目远远比其类别重要,本文算法选择训练样本进行小波分解后的4个子带共同构成字典,这样构成字典的原子数目就是样本数目的4倍,因此测试样本可以更灵活地选择原子,达到最优的稀疏表示。3.3正交匹配追踪算法常用的稀疏分解算法有基追踪(BasisPursuit,简称BP)算法、匹配追踪(MatchingPursuit,简称MP)算法、正交匹配追踪(OrthogonalMatchingPursuit,简称OMP)等。本文选择经典的OMP算法进行稀疏分解,在每一次迭代的过程中寻找与当前迭代残差最相关的原子,在选定之后,把信号正交投影到这些归一化的原子所张成的线性空间中,然后计算残差,循环进行上述操作直至满足给定的约束条件为止。3.4分类识别阶段的残差i由于实际情况中稀疏分解的非零元素也可能会发生在其他类别的位置,在分类识别阶段构造每一类别的重构残差εi,判决残差最小的类别为测试样本的类别。即测试样本y的分类问题可以转化为:class(y)=argimin(εi)(8)4人脸图像的变化为了验证本文算法的性能,本文选择Yale人脸数据库进行相关实验。Yale人脸库由每人11幅共15人的图像组成,每个人脸图像有较大的表情变化和光照条件变化。每幅图像大小为195×231,实验中每幅图像被裁剪到96×96。实验的硬件平台:处理器E2210,内存3GB。软件环境为WindowsXP操作系统,MATLAB7.6仿真平台。4.1小波分解级数对人脸识别率的影响随机选择Yale人脸库每人6幅图像构成训练图像集,另外5幅作为测试图像。这样训练图像集共由90幅图像组成,进行小波分解后形成360个子带数据作为基函数构成字典。实验中选择db2小波测试识别性能,首先对训练图像分别进行二级、三级、四级和五级分解,将分解的4个子带的图像(LL、LH、HL、HH)按公式(4)构成字典;再将测试图像进行同样级别的小波分解;然后分别将4个子带图像信号进行稀疏分解;最后根据公式(8)进行分类识别。实验结果如表1所示。从表1中可以看出,随着小波分解级数的增加,识别率并不是单调增加的,说明过多的小波分解削弱了人脸样本的本质特征,影响了人脸识别的正确率,同时也增加了小波分解的时间。综合考虑算法的实用性,进行四级小波分解较为合适,此时特征维数为144维(12×12)。从表1也可以看出,参加测试的4个子带中,LL子带的识别率最高,说明测试样本进行小波分解后的低频分量LL保留了原样本的主要特征,所以本文算法只选择测试图像的LL分量参与稀疏分解。4.2实验4不同小波变换方法的识别效果为了检验本文方法对光照、表情的鲁棒性,将本文方法与传统的小波方法在Yale库上进行了对比实验(传统方法采用的是最近邻分类器)。实验中采用了db2小波,均进行四级分解,而且只选择低频分量LL参与分类识别,实验结果如表2所示。由表2可以看出,两种方法的识别率都是随着样本数目的增加而增加,但是本文方法的识别率更高,说明本文方法对光照、表情变化的鲁棒性要好于传统的小波变换方法。这是因为稀疏分解削弱了光照、姿态的影响,而且提取了有利于分类的最本质特征。4.3测试结果与分析为了验证本文方法对遮挡的鲁棒性,首先将Yale库中每一人的5幅图像进行人为遮挡,遮挡的方式是将对应部分的灰度值调整为最大值,遮挡的比例分别是30%、40%和50%。实验中随机选择每人6幅图像构成训练图像集,其余5幅图像构成测试集,实验中其它条件与前述实验一致,结果如表3所示。从表3中可以看出,本文方法在有遮挡条件下识别性能要好于传统的小波方法,而且在有小面积遮挡的时候(30%),能达到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论