基于稀疏表示的人脸识别算法_第1页
基于稀疏表示的人脸识别算法_第2页
基于稀疏表示的人脸识别算法_第3页
基于稀疏表示的人脸识别算法_第4页
基于稀疏表示的人脸识别算法_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于摘要稀疏表示的数学实质就是在超完备字典下对给定信号的线性分解。本文研究了一种基于稀疏表示的正交匹配追踪(orthogonalmarchingpursuit,简称OMP)算法,递归的对所选原子集合进行正交化,并且利用矩阵cholesky分解简化迭代过程中矩阵求逆的计算。在人脸识别的实际应用中,利用实验样本构建冗余字典,将待检测样本表示成试验样本的线性组合。通过在不同人脸库上的实验证明了该算法的有效性。关键字稀疏表示稀疏编码人脸识别正交匹配追踪1绪论1.1背景及意义随着科技的迅猛发展,人类社会已经进入信息时代,信息安全问题日益得到高度重视。钥匙、密码、证件等传统形式的身份认证技术已经远远不能完

2、全满足现代社会中对信息安全有高质量要求的部门的需要。因此,新一代的身份认证技术应运而生。人的生物特征具有唯一性、稳定性等多种优点,已逐渐成为新一代的身份认证技术的主要依据。在众多的基于生物特征的身份识别技术中,人脸识别技术因其自然性、友好性等显著优势而受到广泛关注,目前已经被应用到模式识别、人工智能、计算机视觉、认知科学等多个领域中。然而,由于人脸图像易受到光照、姿态、遮挡和表情等多种因素的影响,识别效果也易受图像数据库大小的干扰1-2,计算机智能识别课题的研究仍然具有较高的挑战性。1.2发展状况1888年,Nature上发表了第一篇利用人脸进行身份识别的文章,由此开启了近代对人脸识别技术的研

3、究。1965年,Chan和Bledsoe共同创建了世界上第一个自动人脸识别系统3-4。随着计算机技术的迅猛发展和相关理论的日益成熟,人脸识别技术的到了快速的发展与广泛的应用,其发展过程大致可以划分为以下三个阶段:起步阶段早期人脸识别技术主要利用人脸的几何结构特性(GeometricFeatureBased)以及它们之间的角度、距离和区域形状等参数作为识别依据。在这一阶段,很多参数的测定需要人工标定,因此只能称之为半自动人脸识别系统,但是这种方法的提出为后续其他方法的提出提供了理论参考。发展阶段90年代初,研究人员发现人脸图像之间存在很强的相关性,人脸图像本身只是高维图像空间中的一个子空间,若直

4、接使用,会因维数过高而产生“维数灾难”等问题。因此,各种降维方法陆续产生。本阶段主要产生了线性判别分析(LinearDisriminantAnalysis,简称LDA)算法、主成分分析(principalcomponentanalysis,简称PCA)算法以及统计模式识别方法等多种算法。攻坚阶段进入二十一世纪,人脸识别技术进入攻坚阶段。在前两个阶段的发展过程中,人脸识别技术已经积累了丰富的理论和大量的算法,基本能够解决可控条件下的身份识别问题。但是,非理想条件、大规模人脸数据库等问题下的人脸识别仍有待解决。针对这些问题,产生了等距离映射(IsometricalMapping,简称ISOMAP)

5、、局部线性嵌入(LocallyLinearEmbedding,简称LLE)、最大方差展开(MaximumVarianeeUnfolding,简称MVU)等多种方法,基于稀疏表示的人脸识别方法也生在这一阶段脱颖而出。2人脸识别2.1人脸识别概念人脸识别就是利用人脸的生物特征对身份进行判别,这些生物特征可分为眼、鼻、嘴的几何形状或关系等外部特征以及人脸的结构关系等内部特征两个方面。2.2影响因素及相应解决方法2.2.1光照问题人脸识别系统的性能与人脸识别算法的设计以及人脸图像的质量等有密切的关系。在影响人脸图像质量的众多因素之中,光照问题不容忽视。一般将人脸识别中处理光照问题的方法分为三类:基于图

6、像处理技术的方法;基于子空间的方法;基于光照不变特征提取算法。基于图像处理技术的方法主要从图像本身出发,利用对光照变化不敏感或无变化的特征进行图像处理。基于子空间的方法原理是同一物体在不同光照下的图像属于一个低维度的线性子空间,通过寻求与输入图像最为接近的子空间进行识别。基于光照不变特征提取方法的算法可以分为传统光照不变特征提取和基于人脸反射系数的光照不变特征提取两大类。2.2.2姿态问题姿态问题同样也是人脸识别中亟待解决的一个难点。目前多数的人脸识别算法仅适用于正面或准正面的人脸图像条件下的人脸识别,对于其他姿态下的人脸图像,识别率相对较低。针对这一问题,目前已经提出了局部线性回归(Loca

7、llyLinearRegression,简称LLR)算法、基于神经网络的方法和光度立体分析等方法。2.2.3数据库大小问题在人脸识别技术中,人脸图像数据库的大小存在两种极端情况:人脸图像数据库过大;单样本或少样本人脸数据库。如果人脸图像数据库过大,则对相关算法的运算速度要求较高,如果人脸图像数据库样本过少,则会影响人脸识别的正确率。针对数据库过大问题,目前主要提出了主成分分析、线性辨别分析和隐马尔可夫模型等方法来提高效率56。针对单样本问题,主要的解决方法有样本扩张法、图像增强法和特征子空间扩张法等。2.2.4遮挡、年龄、表情等问题喜怒哀乐,生老病死是所有人类都不可避免的人生成长经历。然而,伴

8、随而来的表情表情年龄、遮挡等问题给自动人脸识别系统的设计增加了很大的难度。目前,针对表情及年龄问题,已提出了基于多分类融合的3D算法、利用(2)三维数据对图像进行重构等方法7-8;针对遮挡问题,也已提出了带遮挡人脸的支持向量机、尺度不变特征变换(ScaleInvariantFeatureTransform,简称SIFT)、随机非均匀局部Gabor二值模式(RandomNonuniformLocalGaborBinaryPattern,简称RNLGBP)等算法。3稀疏表示3.1稀疏表示的意义香农定理表明,模拟信号可以用一定采样频率的周期函数来表示。然而,这种表示方法对信号的分析带来了一些不便。对

9、于压缩问题,希望用较少的系数表示较多的信息;对于识别问题,希望信号的主要特征突出;对于去噪问题,希望将有用信号与噪声进行有效分离。这些应用都有一个共同的特点,就是简化信号的表示(稀疏化)。3.2稀疏表示的概念研究人员发现,通过使用原子库(过完备冗余函数体系)取代传统完备正交函数集,可有效从原子库中找到具有最佳线性组合的n项原子信号来表示一个给定信号,而这些组合的系数大部分为0或接近于0,即稀疏表示。稀疏表示主要采用稀疏逼近原理即高度非线性逼近原理。对于一个给定集合S=u;ii=1,2,I,其元素u是张成整个Hilert空间H=rm的单位矢量,IM。集合iS称为原子库,元素u称为原子。对于任意给

10、定的信号feH,预想在S中自适i应的选取n个原子对信号做n项逼近:f=工cunrrreKn(1)其中K是u的下标集,card(K)=n,则B=span(u,reK)就是由nnrnrn个原子在原子库S中张成的最佳子集。我们定义逼近误差为:(f,S)=intf-f由于n远小于空间的维数M,所以这种逼近也被称作稀疏逼近。由于原子库存在定的冗余性,知上式存在多组解。稀疏表示的目的就是从中选取解的系数最为稀疏的或使n取值最小的解。这个问题等同于下述问题:Minimize口csubjecttof=cu0kki=0(3)稀疏表示的最初目的是为了以低于香农定理的采样频率表示和压缩信号2,事上,在去噪方面,小波

11、变换和平以不变小波也开发出许多有效算法4;稀疏表示已成功应用与图像动态范围的压缩9,图像卡通和纹理成分的分离10等。在这些应用中,算法的性能取决于表示的稀疏性是否忠实于原始信号。3基于稀疏表示的人脸识别3.1基于稀疏表示的人脸识别原理训练集图像图像预处理=特征提取稀疏表示分类图1基于稀疏表示的人脸识别框图设给定的训练集A中有i类已标记好的样本,其中第k类中含有n个样本。k则属于第k类的样本集合可以用矩阵A=a,aaeRmxnk来表示,且每kk1k2k“k个样本对应于矩阵的一个列向量,m为人脸图像的维数。为了提高效率,现假定每个类别的矩阵对应于用于稀疏表示的训练字典。对于任意给定的测试样本y,若

12、其属于某一训练集所包含的类别a,那么便可以用a的线性组合来表Z示o为便于理解,现假设第k类中有足够多的训练样本构成矩阵A,且待测试样k本y属于第k类,则可以用具有相同类别属性的第k类训练样本的线性组合近1似表示待测试样本y,即1y=xa+xa+.+xa其中xgR,j=1,2,jn1k1k1k2k2knkknkkjk(4)然而,一般情况下的待测试样本所属类别并不知晓,因此用于实验的样本字典是由i类训练样本集的所有样本共同构成的,即:A=A,A,.,A=a,aaaa12i1112lni1in.因此,任意待测试样本y就可以用字典线的性表示,即:Y=Ax(6)其中x=0,0,,0,x,xx,0,0,.

13、,0TGRm是-个很稀疏的系数矢k1k2knk量。由x就可以获得关于y的类别信息。显然,若mn,易知方程组(6)为过定的,解向量x唯一。但是对于人脸识别问题,经降维处理后的样本构成的方程组是典型欠定的,故解向量x并不唯一。由压缩感知理论和稀疏表示可知,如果向量x足够稀疏,那么稀疏解的个数L范数问题可以转化为L范数问题,即02X=argmin口xsubjecttoy=Ax223.2基于稀疏表示的人脸识别算法3.2.1正交匹配追踪算法正交匹配追踪算法是稀疏表示的经典算法之一,为求得式(7)提出的问题的最佳逼近解正交匹配追踪算法在每一步的迭代过程中选择和当前迭代残差最相关的原子,将信号正交投影到这些

14、原子张成的空间中,循环计算残差直到满足约束条件(详细步骤见算法一)。注意第5行是贪婪算法选择原子的步骤,第7行是正交投影的步骤。算法1正交匹配追踪Input:dietionaryA,targetsparsityKOutput:sparserepresentationxInit:SetI=,r=y,x=0while(stoppingcriterionnotmet)dok=argmaxIdTrlk1kI=(I,k)7-x=(A)+yIIr=y-axIIendwhile3.2.2快速正交匹配追踪快速正交匹配追踪算法通过在基本的正交匹配追踪算法中对冗余字典采用Cholesky分解,提高了算法的整体效率

15、。算法2快速正交匹配追踪Input:dietionaryA,targetsparsityKOutput:sparserepresentationxInit:SetI=,L=1,r=y,x=0,a(o)=aty,m=1while(stoppingcriterionnotmet)dok=argmax|dTr|kkifm1thenw=solveforwLw=atakL0L=WTJl-WTWendifI=(I,k)x=solveforcLLtc=aIIr=y-axIIn=n+1endwhile4实验结果与分析我们运用本文所述算法主要在ORL和扩展的YaleB两个人脸数据库进行识别精度与时间的测试。我们

16、主要关心在不同的光照和不同的表情两种主要因素下的测试结果。ORL人脸数据库含有40个不同人的脸,每个人脸有10张不同表情的图像,总共400张图像。扩展的YaleB是一个比较大的人脸数据库,含有16128张人脸图像,包含了38个不同人脸的64种光照条件下的不同图像。本实验仅从中选取了一个小的子集,但已足够测试本文算法对光照条件的敏感性。4.1有表情变化的实验本算法随机从ORL人脸库每个人脸的图像中选取不同比重的图像作为训练集,余下的图像做为测试样本,稀疏阈值设置为训练样本数目。表1显示的是随着训练样本比重增大识别率的变化情况。总之,在训练样本足够多的情况下测试样本都可以用字典中所属类别的原子的线

17、性组合来表示。图2ORL数据库不同表情变化表1正交匹配追踪算法应用于ORL数据库训练图像测试图像稀疏阈值识别率(%)5556467378284.2不同光照条件的实验本算法随机从扩展的YaleB数据库的一个子集下每个人脸的图像中选取不同比例的图像作为训练集,余下的图像作为测试样本,稀疏阈值设置为训练样本数目。表2显示的是随着训练样本比重变大识别率的变化情况。从中可以看出,本算法在不同光照条件下表现出较高的识别率。图2YaleB数据库种不同光照条件表2正交匹配追踪算法应用于YaleB数据库训练图像测试图像稀疏阈值识别率()164816323232481648结束语本文研究了稀疏表示理论并且应用矩阵

18、Cholesky分解实现正交匹配追踪快速算法,该算法简化了迭代过程中逆矩阵的计算,提高了识别的速度,并在具有表情变化和光照变化的条件下取得了很好的识别率。人脸识别的困难主要在于遮挡、单样本、鲁棒性等的问题。稀疏表示在这些限制下的识别中仍具有很大的发展潜力,有待于进一步研究,这也是目前一个比较热门的研究方向。参考文献P.JonathonPhillips,W.ToddScruggs,PatrickJ.Flynn,KevinW.Bowyer,etal.FRVT2006andICE2006Large-ScaleExperimentResultsJ.IEEETransactionsonPatternAn

19、alysisandMachineIntelligenee,2010,35(5):830-852.JitaoSang,ZhenLei,andStanZ.LiFaceImageQualityEvaluationforISO/IECStandards19794-5and29794-5C.InThirdInternationalConferencesICB2009,2009:225-340.SubhransuMaji,AlexanderC.Berg,JitendraMalik.Classificationusingintersectionkernelsupportvectormachinesiseff

20、icientC.2008IEEEConfereneeonComputerVisionandPatternRecognition,pp.1-12,2008.Stan乙LiandAnilK.Jain,HandbookofFaceRecognitionM,2011.Z.Stone,T.Zickler,T.Darrell.TowardLarge-ScaleFaceRecognitionUsingSocialNetworkContext卩.ProceedingsoftheIEEE,2010,98(8):10461417.ZhenLei,ShengcaiLiao,M.Pietikainen,S.Z.Li;FaceRecognitionbyExploringInformationJointlyinSpace,ScaleandOrientationJ.IEEETransactionsonImageProcessing,2011,20(1):244-261.H.H.K.Tin,M.M.Sein.RobustMethodofAgeDependentFaceRecognitionC.Intell

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论