人脸识别综述(DOC)_第1页
人脸识别综述(DOC)_第2页
人脸识别综述(DOC)_第3页
人脸识别综述(DOC)_第4页
人脸识别综述(DOC)_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人脸识别综述1引言人脸识别技术的研究始于0纪50年代,当时的研究人员主要涉及的是社会心理学领域;最早AFR(AutoFaceRecognition)的研究论文见于1965年陈(Chan)和布莱索(Bledsoe)在PanoramicResearchInc.发表的技术报告。近年来,人脸识别研究得到了诸多研究人员的青睐,涌现出了诸多技术方法。尤其是1990年以来,人脸识别更得到了长足的发展。几乎所有知名的理工科大学和主要IT产业公司都有研究组在从事相关研究。人脸识别研究的发展可分为以下三个阶段:第一阶段(1964年~1990年)。这一阶段人脸识别通常只是作为一个一般性的模式识别问题来研究,所采用的主要技术方案是基于人脸几何结构特征(Geometricfeaturebased)的方法。第二阶段(1991年~1997年)。这一阶段尽管时间相对短暂,但却是人脸识别研究的高潮期,可谓硕果累累:不但诞生了若干代表性的人脸识别算法,美国军方还组织了著名的FERET人脸识别算法测试并出现了若干商业化运作的人脸识别系统比如最为著名的Visionics(现为Identix)的FaceIt系统。美国麻省理工学院(MIT)媒体实验室的特克(Turk)和潘特(Pentland)提出的“特征脸”方法无疑是这一时期内最负盛名的人脸识别方法。第三阶段(1998年~现在)。FERET'96人脸识别算法评估表明:主流的人脸识别技术对光照、姿态等由于非理想采集条件或者对象不配合造成的变化鲁棒性比较差。因此,光照、姿态、表情、遮挡问题逐渐成为研究热点。人脸识别是一项既有科学研究价值,又有广泛应用前景的研究课题。国际上大量研究人员几十年的研究取得了丰硕的研究成果,自动人脸识别技术已经在某些限定条件下得到了成功应用,人脸识别技术的研究对模式识别,人工智能,计算机视觉,图像处理等领域的发展有巨大的推动作用。人脸识别问题可以定义成:输入(查询)场景中的静止图像或者视频,使用人脸数据库识别或验证场景中的一个人或者多个人。基于静止图像的人脸识别通常是指输入(查询)一幅静止的图像,使用人脸数据库进行识别或验证图像中的人脸。而基于视频的人脸识别是指输入(查询)一段视频,使用人脸数据库进行识别或验证视频中的人脸。如不考虑视频的时间连续信息,问题也可以变成采用多幅图像(时间上不一定连续)作为输入(查)进行识别或验证。人脸自动识别系统包括三个主要模块[1]:首先是图像预处理模块,由于实际成像系统多少存在不完善的地方以及外界光照条件等因素的影响,在一定程度上增加了图像的噪声,使图像变得模糊、对比度低、区域灰度不平衡等。为了提高图像的质量,保证提取特征的有有效性,进而提高识别系统的识别率,在提取特征之前,有必要对图像进行预处理操作;其次人脸的检测和定位模块,即从预处理的图像中,利用人类检测器(目前人脸检测方法主要以Adaboost算法为主,OPENCV在这方面做的比较好)找出人脸及人脸所在的位置,并将人脸从背景中像大小和各器官的位置归一化;

分割出来,对库中所有的人脸图最后是对归一化的人脸图像进行特征提取(提取局部特征已逐渐成为主流),建立特征描述子,将图像之间的特征进行匹配进而完成识别。2概述人脸识别方法大致分为以下几种:基于几何特征、基于代数特征[2]、基于神经网络模型以及基于三维模型。(1)基于几何特征基于几何特征的人脸识别方法是在抽取人脸图像上显著特征的相对位置及其参数的基础上进行识别。最早的人脸识别是用手工的方法确定人脸特征点的位置并将其输入计算机中。识别工作的流程大体如下:首先检测出面部特征点,通过测量这些关键点之间的相对距离(欧式距离、马氏距离等) ,得到描述每个脸的特征矢量,比如眼睛、鼻子和嘴的位置和宽度,眉毛的厚度和弯曲程度等,以及这些特征之间的关,用这些征来表人脸。比未知脸和中已知脸中的这些特征矢量,来决定最佳匹配[3]。基于小模板匹配的方法属于几何特征识别,是已知一个小模板,在人脸的大图像中进行匹配,如果匹配成功,就可以确定其坐标位置[4]。基于几何特征的缺点显而易见,对获得的图像要求很高,特征点的定位非常重要,通常人脸特征点的定位会存在误差,这种方法对正面人脸可以取得一定识别效果,如果人脸姿态存在一定的偏转或有遮挡都会很大程度上影响识别的准确性。(2)基于代数特征基于代数特征的人脸识别方法具有代表性的是PC(主元分析法[5K-L(卡胡南—列夫[6]变换和SVD(奇异值分解)[7]等方法。其主要思想:对于一副由N个象素组成的图像,可以看作是一个N维矢量空间,采用不同的变换方法,能够有效的提取主分量,通过对人脸样本集的自相关矩阵的特征矢量的选取,构成一个正交的低维人脸空间,从而达到降低冗余、提高识别率的目的。利用主元分析法(PrincipleComponentAnalysis简称PCA进行识别是由Anderson和Kohonen提出的。PCA方法最早由Sirovitch和Kir[8,9]引入人脸识别领域,并因为它的有效很快流行起来。简单地说,它的原理就是将一高维的向量,通过一个特殊的特征向量矩阵,投影到一个低维的向量空间中,表征为一个低维向量,并不会损失任何有用信息。也就是说,通过低维表征的向量和这个特征向量矩阵,可以完全重构出所对应的原来的高维向量。K-L变换与SVC分解的思想同PCA都差不多,降维到低维向量空间后要运算的分量大大地减少了。采用代数特征识别人脸具有以下的特征:良好的稳定性;位移不变性;特征向量与图像的高度成比例变化;转置不变性等。但是代数特征对表情不能很好地描述,难以用于表情分析和表情识别。(3)基于神经网络模型神经网络由许多并行运算的功能简单的单元组成,是一个非线性动力学系统,其特色在于信息的分布式存储的并行协同处理, 具有良好的容错能力。神经网络主要的应用是对已经提取主特征的特征值进行分类。比较成熟的是PCA+ANF主元分析+人工神经网络),用K丄+ANN(K-L变换+人工神经网络)[10]、SDNN奇异值解+人工神经网络),也直用NN+NN神经网络+神经网络)进行人脸识别的,不过这样所要计算的分量太大了,训练与工作的时间要长很多。有代表性的神经网络模型有BP网络、RBF网络、Hopfield模型等。如图所示的是PCAbBP神经网络的例子,其中输入层结点的个数与主元分析后低维向量 的个数等输到BP神经网的输层点中隐结点个数构造BP网络时就已定义了,出层点个数样本数量关要能到分的的。于神网络方法结上类于人,但于始灰图像据十分庞大,经元目通很多训时间长,基于诺曼结也受了制。)于三模型维人识别最初是从几何方法发展来的,出发点是希望利用三维的人脸识别处理技术,解决传统二维照片识别中因为人脸的姿态、光照等对识别造成的干扰问题,在三维的基础上进行特征的提取和识别将有更为丰富灵活详尽的信息可以利用。三维数据获取已经成为可能(如三维激光扫描技术、CT成像术、结构光方法等),使得图形技术得到了应用的可能,可以完成人头三维面貌数据获取。在合成特定人的头部模型时,需要一个基本头部模型,该模型是一个通用的模型,特定人的模型都可以通过对该模型的修改得到。人类面部特征的位置、分布基本上是一样的,因而特定人脸的模型可以通过对一个原始模型中的特征和其它一些网络点位置进行自动或交互调整而得到。系统的内部有一个原始的人头模型,以后所有特定模型的建立都是基于这个原始模型。基于三维模型的识别方法是未来的对人进行识别的方向,因为在三维模型中,可以对人的头部从任意角度获得信息,具有良好的抗干扰能力,该方法的重点和难点是如何建立人脸三维模型以及如何在模型之间实现匹配。基于三维的人脸识别还需要做很多的工作,目前还没有什么实质性的研究应用成果。由文献看出早期的图像目标识别技术采用基于模型的方法,这种方法需要以目标的三维模型作为系统的输入,由于图像中通常存在遮挡、背景干扰以及光照等成像条件变化,建立目标的三维模型往往比较困难,因此基于模型的方法通常在图像背景较简单的情况下可以取得较好的效果。文献看出人们逐渐将研究的重点转向了基于目标表象的识别方法。其中文献是基于全局特征的方法,根据图像整体的信息建立模型,因此这类方法对于图像中的背景干扰和遮挡比较敏感,当待识别图像中背景干扰和遮挡影响较小,或者待识别目标可以较好地从待识别图像中分割出来时,这类方法可以取得理想的识别效果。文献是基于局部特征的方法。其中[17][18][22][23][24][25][26] 是基于局部不变特征的方法,此方法利用从图像中提取的局部不变特征来对图像目标建模,可以有效克服背景杂波以及遮挡等的影响,综合近年文献资料及VOC(VisualObjectClassChallenge )竞赛报告不难看出,基于外观表象的局部不变特征方法已经取代全局特征方法成为了主流方法。文献[27][28][29][30][31] 介绍了在图像局部不变特征提取的基础上,基于词汇包(Bow)的图像表征和目标建模方法是目前的典型方法。文献[32]利用奇异值提取人脸的全局特征和6个关部的局特进行权融得特融合阵效决了VD识别率不高和LDA样本间问。文献[33,34]采用的人脸识别方法都是以提取SIFT(ScaleInvariantFeatureTransform)特征为基础。其中文献[33]基于SIFT算子识别方法,结合K-means聚类的模式匹配策略采用局部相似性和全局相似性的计算方法对人脸图像进行相似度匹配,并在匹配过程中使用基于概率统计的权值赋予方案和相似度的平方来提高识别的准确性。文献[34]提出一种基于尺度不变特征变换(SIFT)和增强Hough变换的人脸识别方法。利用SIFT的位置、尺度、方向和描述符4个信息,过强Hough变换消除错配,将候选匹配点和离散点距离进行加权累计获得高辨别力的匹配分。文献[35]中介绍了在随着目标数目及特征样本数量的增加,关键特征词类属概率倾向性逐渐减弱的情况下,采用基于 SOMW经网络的聚类树方法对近00类目标5万多图提的2万个SIT特征描述子进行聚类,得到了25300多个特征词汇。文[35]提出了一种基于RSOM(recursivesel-fmapping,RSOM树)、利用SIFT(scaleinvariantfeaturetrans-form) 特征为索引的海量图像集中K近邻的求解方案。对图像编号并提取SIFT特征,依据SIFT特征将图像的编号存储至RSOM树的叶节点中;搜索时用匹配的SIFT特征个数作为指标获得K集,用迭代Pro-crustes方法几何约束得到精确求解结果。文献[37]介绍了属性图理论,他为将一幅图像的局部特征及其空间布局关系作为一个整体这种结构化数据的表示和分析提供了理论基础。由于现有的大部分人脸数据库都是静止图像人脸数据库,如何充分利用视频中的人脸信息更好地进行人脸识别是现阶段迫切需要解决的问题。解决这类问题的传统做法[38-0]可以分成两大类:一类方法对输入视频中的人脸进行跟踪,寻找满足一定规则(如大小、姿态、清晰度)的人脸图像,然后利用基于静止图像的人脸识别方法;另一类方法利用视频中的空间信息进行人脸识别,通过对输入视频中每一幅人脸或者若干幅人脸采用基于静止图像的人脸识别方法[41-43]。近年来,一些研究者开始利用视频中人脸的时间和空间连续信息进行识别。文献[44]讨论了在贝叶斯理论的框架下统一解决人脸识别和跟踪问题。 采用时间序列模型刻画人脸的动态变化,把身份变量和运动矢量作为状态变量从而引进时间和空间的信息。文献[45]进一步提出了自适应外观变化模型并且采用自适应运动模型更准确地处理姿态的变化。并且对运动模型中噪声的方差和采样算法中的粒子数根据计算得到外观模型的误差进行更新。文献[46][47]通过对输入视频中人脸的脸部特征或外观的跟踪进行人脸验证。文献[48]对数据库中的每类人脸建立一个 PCA子空间利用与各个人脸子空间的距离对输入视频中的所有人脸进行标注。文[49,50提出的特征脸(Eigenfaces)方法是PCA方法中最具代表性的方法,并成为应用于人脸识别问题的最流行的算法之一。特征脸方法与经典的模板匹配算法一起成为测试人脸识别系统性能的基准算法。文献[51]提出了Fisherfaces方法。Fisherfaces由Fisher线性判别式(Fisher'slineardiscriminant, FLD思想派生而同时考虑类间离散度和类内离散度,使这两者的比率达到最大。Belhumeur的实验证明,Fisherfaces的性能优于Eigen-faces。但即便如此,s还是存在两个明显的问题,即小样本问题(样本数目小于样本维数),以及多数实际问题属于非线性可分,传统的Fisher线性分析在这此,一系列Fisherfaces[52]提出了KFDA方法,将核技术引入Fisher判别分析中;文献[53]提出了利用核的广义的判别分析法;文献[54]提出了KDDA方法。近期,文献[55]提出了一种改进的核直接Fisher描述分析方法;文献[56]的直接LDA方法也是为了解决这两个问题而提出的; 文献[57]基于此法并引入加权函数提出了一种改进的线性判别分析方法。由于人脸在姿态、光照、表情变化时呈现非线性分布,文献[58]在线性空间中通过核的方法映射到高维的非线性空间(核Hilbert空间),在高维空间中的夹角(核主成分夹角)作为矩阵的相似性度量,并且利用正定的核函数就可以和SVM(supportvectormachine)结合起来提高分类的性能。 文献[59,60]首先通过LDA进行线性维,然后对个人人脸频过矢量化术者K均值聚形成K个类别,每个类别用聚类中心和聚类的权重来表示,最后采用EMD(earthmovr'sdistanc)距离作为相似性度量进行人脸识别。文献[61]介绍了一种基于视频的人脸验证方法,采用形状和归一化纹理的联合外观模型(ActiveAppearaneeModel,AAM来表示人脸,通过加入类别信息的改进线性鉴别分析(LinearDiscriminantAnalysis,LDA)分离出身份变量(identity)和其他变化因素(姿态、光照和表情)。文献[62]采用基核函数方把维间射到高维间,这样就可以在高维空间中利用低维空间中的线性方法 (如PCA)来解决一般的复杂的非线性问题,采用RAD(resistor-averagedistance)作为人脸相似性度量。为了解决配准误差所带来的识别率下降的问题,利用了多幅图像和RANSAC(randomsampleconsensus)算法来解决。另外文献[63]利用了核方法,把原来的矢量空间映射到高维非线性空间中RKHS(reproducingkernelHilbertspace)中计算概率分布之间的距离。3总结本文简单介绍了人脸识别的发展历程、应用背景和意义、人脸识别的定义以及人脸识别的主要组成模块,对人脸识别的四大主流方法进行了概述并指出了各方法的优点和缺点,对人脸识别技术发展过程中各专家或学者提出的人脸识别或目标识别处理方法做了总结。近年来人脸识别成为了最热研究课题之一,各国科技巨头和IT巨头对人脸识别,机器视觉领域的涉入更是推动了人脸识别技术的迅发展,近几年不少人脸识别产品和系统进入了市场,比较有代表性的有GoogleFace++,Luxand,汉王人脸识别考勤系统等等。人脸识别技术虽然走向了应用并取得不错的成果,但是限制其应用主要难题依然存在:人脸姿态、光照变化和表情变化对人脸识别效果会产生很大的影响。人脸识别技术需要攻克的问题有:复杂背景和大姿态变化下的人脸目标检测。当前人脸检测算法适应于小范围的姿态变化和简单的背景,成像背景变得复杂时虚警率会变得很高,同时当姿态变化稍大时,人脸漏检率也会提升,这对后续的识别会造成一定的影响。动态人脸识别。现有的人脸识别技术适合于静态人脸识别,无法满足安防监控视频中人脸动态跟踪和识别的需求,主要体现在两方面:一方面是处理速度跟不上,另一方面是动态过程中识别率低所以动态人脸识别技术研究具有很好的应用价值和前景。多种特征融合。从本文的概述中可知每一种人脸识别方法都有一定的缺陷性,基于单一特征(几何特征、局部特征等)的人脸识别方法显然无法很好的满足人脸识别技术的应用需求将不同的人脸识别技术和特征有效地融合是未来人脸识别发展的方向之一。三维人脸识别研究。人脸识别技术发展至今,许多成果仍然是在二维人脸信息基础上取得的,而现实世界中的人脸是三维的,三维信息特别是三维图像较二维图像更能提供完整而真实的内容,如何有效地利用人脸的三维信息进行识别,将是一个具有挑战性的研究课题。4参考文献[1] 王昆翔,李衍达,周2001()] .计算机辅助设计与图形学学报 1999(3[3] ,人脸识别常用方法及其发展现状[J]自动检测技术,2002).[4] [J]199(2).] ,].).] ,琴,.的K—L变换与人脸识别[J].青岛化工学院学报,23(6).[7] 周德龙,高文,赵德斌.基于奇异值分解和判别式K-L别[.软件学报,2003(14).[8] SIROVITCHL,KIRBYM.Low-dimensionalprocedurefortheofhumanface[J].JournaloftheOpticalofAmerica,1987,4(3):519-524.[9] KIRBYM,SIROVITCHL.ApplicationofKarhunen-Loeveprocedurefortheofhumanfaces[J].IEEETransonPatternandMachineIntelligence,1990,12(1):103-108.[10] BP神经网络的人脸识别方法[J].计算机研究与发展,1999(3).[11] 基模[J](),2001(10)[12] BebisG,GeorMadLoboNV.learnigGeomricHingFuncionsforModel-edObjectRogniton[C.IernatonalCerenceonCputrVion,1543-548.[13] CandKimiaB.3DObjectRecogniionUsigAsptGraph[C.InterionalCfereneonComViion,2001:254-.[14] MuraseHandS.VisualLearnigandRecogniionof3DObjecsfrmAppeare[J].IernatonalJouralofComputerVsi,1995,14(1).[15] SwainMJandBalBH.Color[J].InernatonalJalofComterVsion,1991,7.[16] SelngerAandNelsonRC.APercGrfrAppearbased3dObjtRecogniti[J].ComVisionadImageUnderst176([17] LeD.DstnctiveImageFeatesfomScale-nvariant[].InterilJourlofComputerVsi,2004,60(2)[18] KandSchmidC.AnAffneInIntPntDettor[C].EurCerenceonComViion,2002:128-.[19] s.nlends,[20] Ce.DgglswlCo [J]. International JouralofComputerVision,2006,66(3):231-259.[21] dloa.B.[22] KandSchmidC.BasedonScIntPnts[C.InterionalConfonComputerVisi2001,1:525-.[23] BaumbergA.RelieFeateMatchigAcrossSeparedViews[C.InterionalConfonComputerVisi2000:[24] MatsJ,O,UrMandPajdlaT.RobtWdeBaselneSteofromSableRegiBMV,2002:[25] FandZisnA.AutSMinMovies[C].InWorkshoponCont-BasedImandVideoRri,2186-197.[26] T,Van-oolLandKochR.MgInvatitRegiforVsualSvoing[C].InInt.CerenceonRicsandAutomati,1999:1-1606.[27] LiFFadPonaP.AHimodelforLNSeCategor[C].InternaCerenceonComVionandPRton,2,2(2)[28] SiJ,RussellBC,EAA,ZimAandFranWT.DicoveriOandTheirLioninImages[C.InterConfereonComVsion,2005,1877.[29] ToralbaA,FergusRadWssY.SCodesadLargeImDabasesfrRecogniion[C.InternaCerenceonComVi28.[30] ErcNowaket.al.SampligStregiesforBag--FeatesImageCl[C].EuropeanConfonComputerVisi2006,3954:490-.[31] PhibinJ,SiJandZimA.GeometricLattDirAllocatin(gLDA)ModelforUnsupersedParObjtinUImClions[C].BVC,2.[32] .基于奇异值与特征融合矩阵的自适应人脸识别[J].计算机工程与应用,20146(7):162-174.[33] .基于ST.计算机工程,2010,36(13)1000—28(010)3—01702.[34] .基于ST和和Hough变换的人脸识别.计机工程,2012,38(1)38(20)—4—3.[35] 式 [J].200,35(91.[36] 郑君君等于R像K法报学版)第412期1672-3961(2011)02-0080-05.[37] ChungF.SpectrlGraph[C].CBMSRCerenceSeresinMConfBoardoftheAcanMatSence,Wasngton,D.1997,9.[38] WechslH,KakdV,HuangJ,GuttaS,ChenV.AicVdeoBasedPeronAuthentcatUsigtheRBFNetoftheIntilConfereonAudi-andViBasedPernAuthentcation.Crana,1997:85-92.[39]StefJ,85-92.detection,al516-521.

EaginE,NH. Pfastandtrackingand recognition//ProceedingsConferenceonAutomaticFaceandGesture

robustmoftheRecognition.

for3rdNara,

humanIEEE1998:[40]MckennaSJ,GongS.Non-intrusivepersonauthenticationforaccesscontrolvisualtrackingandfacerecognition//ProceedingsoftheInternationalConferenceonAudio-andVideo-BasedPersonAuthentication.Crans--Montana,1997:177-183.[41],,.ffe,.],sP.:n,]i,n.f,,.],,.cnfsmr,,.],,.gdnsne.n,:]i,a.enhgl.lfelfa,:.]i,a.chonne]s,.cnn,.]TRDrnnee,:71-86.[50]TURKM,PENTLANDA.Facerecognitionusingeigenfaces[C].ProcofIEEEConferenceonComputerVisionandPatternRecognition.1991:586-590.[51]BELHUMEURPN,HESPANHAJP,KRIEGMANDJ.Eigenfacesvs.Fisherface:rocognitionusingclassspecificlinearprojection[J].IEEETransonPatternandMachineIntelligence,1997,19(7):711-720.[52]MIKAS,RATSCHG,WESTONJ,etal.kernels[C]//ProcofIEEEInternationalWorkshoponNeuralNetworksforSignalProcessing.1999:41-48.[53]GAUDATG,ANOUARF.discriminateusingakernelapproach[J].NeuralComputation,2000,12(10):2385-2404.[54]LUJu-we,iPLATANIOTISKN,VEN

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论