(信号与信息处理专业论文)基于pca和ica特征的人脸识别.pdf_第1页
(信号与信息处理专业论文)基于pca和ica特征的人脸识别.pdf_第2页
(信号与信息处理专业论文)基于pca和ica特征的人脸识别.pdf_第3页
(信号与信息处理专业论文)基于pca和ica特征的人脸识别.pdf_第4页
(信号与信息处理专业论文)基于pca和ica特征的人脸识别.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要摘要人脸自动识别技术作为生物特征识别技术的重要组成部分,在近三十年里得到了广泛的关注和研究,已经成为计算机视觉、模式识别领域的研究热点。人脸识别问题涵盖了图像处理、模式识别和计算机视觉等多个领域,它主要有特征提取和模式识别两个部分。特征提取是从人脸图像中提取可以用来分类的信息:而模式识别则是利用提取的特征进行模式分类。本文以此为重点进行了相关的研究,主要内容如下:在特征提取环节,本文用主成份分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a )和独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 用于人脸特征的提取,并比较了这两类特征在用于人脸识别中的差异。在人脸识别中,不经预处理的人脸图像的维数非常高,高维图像的识别不仅增加了识别系统的复杂度和成本,而且增加了计算的复杂度,可能导致无法满足实时性的要求;同时不经处理的人脸图像中含有很多冗余的信息,影响了正确分类结果。针对传统的i c a 算法存在迭代次数多,收敛难的不足,本文采用f a s t l c a 作为i c a 的快速算法。在分类判别中,分别用最近邻( n e a r e s tn e i g h b o r ,n n ) 法、最近邻特征线法( n e a r e s tf e a t u r el i n e ,n f l ) 法与本文提出的改进的基于n n 和n f l 联合的分类器,对o r l 人脸库提取的p c a 和i c a 特征进行了识别,并与b p 神经网络进行了比较。本文还将一个自适应b p 神经网络用于人脸识别。自适应的b p神经网络,能够自动删减输入层,选择合适的特征,避免了n n 和n f l 分类器那样重复选择特征寻找最优特征个数的过程。实验结果表明,i c a 特征优于p c a 特征,改进的基于n n 和n f l 的分类器分类效果优于n n 和n f l 分类器,识别率略逊于自适应的b p 神经网络分类器,但是训练速度比b p 神经网络快。关键词:人脸识别,主分量分析,独立分量分析,最近邻分类器,最近邻特征线分类器,自适应b p 神经网络a b s t r a c ta b s t r a c ti na l lk i n d so fm e t h o d f a c er e c o g n i t i o ni so n eo ft h em o s ta c t i v ea n dc h a l l e n g i n gt a s k sf o rc o m p u t e rv i s i o na n dp a r e r nr e c o g n i t i o ni nr e c e n t3 0y e a r s m n a ys u b j e c t ss u c ha si m g a ep r o c e s s i n g ,p a t t e r nr e c o g n i t i o na n dc o m p u t e rv i s i o na l ei n c l u d e di nt h ep r o b l e m so fp a t t e r nr e c o g n i t i o n t h e r ea l et w op a r t so ft h ef a c er e c o g n i t i o ns y s t 锄:f e a t i l r ee x t r a c t i o na n dp a t t e r nr e c o g o i t i o n f e a t u r ee x t r a c t i o ni st oe x t r a c tu s e u f li n f o r m a t i o nf o rc l a s s i f i c a t i o nf o r mf a c ei m a g e s ;w h i l ep a t t e r nr e c o g n i t i o ni st oc l a s s i f yt h ef e a t u r e st h a te x t r a c t e d t h i sd i s s e r t a t i o nm a i n l ys t u d i e st h em e t h o d so fe x t r a c t i n gf e a t u r e sa n dt h ec l a s s i f i e r , w h i c hc a nb ef o rt h ef a c er e c o g n i t i o n ,t h ed i m e n s i o n so ft h eh u m a nf a c ei m a g e sw h i c ha r en o tp r e p r o c e s s i n ga r ev e r yh i g h t h er e c o g n i z i n gt h eh i g hd i m e n s i o n si m a g e sn o to n l ym a k e st h es y s t e mm o r ec o m p l e xb u ta l s oi n c r e a s e st h ec o s to ft h es y s t e m t h ew o r s et h i n gi st h a tt h es y s t e mc o u l dn o tb es a t i s f i e dt h er e q u e s to fr e a l t i m e a tt h es a m et i m e ,t h ei m a g e sw h i c hw e r en o tp r e - p r o c e s s i n gi n c l u d em u c hr e d u n d a n c yi n f o r m a t i o nw h i c hm a yb er e s u l ti nt h el o w e rc o r r e c tr e c o g n i t i o nr a t e t h i sd i s s e r t a t i o na d o p t e dt h ep r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) a n di n d e p e n d e n tc o m p o n e n ta n a l y s i s ( i c a ) a st h ef a c ef e a t u r ee x t r a c t i o nm e t h o d s t h ed i f f e r e n c eb e t w e e nt h e s et w ok i n d so ff e a t u r ee x t r a c t i n gi nf a c er e c o g n i t i o ni sa n a l y z e d t h ep c ac a ne x t r a c tt h ef e a t u r e sa n dc o m p r e s st h ed a t aa c c o r d i n gt ot h ed i r e c t i o ni nw h i c ht h ec o v a r i a n c eo ft h es a m p l e si st h el a r g e s ti nt h es p a c e t h ei c af a s ta l g o r i t h m( f a s t l c a ) i se m p l o y e dt or e d u c et h ei t e r a t i o n sa n ds p e e du pt h ec o n v e r g e n c eo ft h es y s t e mw h i l et h ef e a t u r e sa r ee x t r a c t e dw i t h o u tc h a n g e f o rt h ec l a s s i f y , t h i sd i s s e r t a t i o na d o p t e dn nc l a s s i f i e r , n f lc l a s s i f i e ra n dan e wc l a s s i f i e rb a s e do nn nc l a s s i f i e ra n dn f lc l a s s i f i e rt or e c o g n i z eh u m a nf a c eb yp c aa n di c af e a t u r e so fo r lh u m a nf a c ed a t a b a s e a l s o ,w eu s e da na d a p t i v eb pn e u r a ln e t w o r ka n dt or e c o g n i z eh u m a nf a c e t h i sa d a p t i v eb p n nc a na u t op r u n et h en e u r o n si nt h ei n p u tl a y e r , c h o o s ea p p r o p r i a t ef e a t u r e sa n da v o i dc h o o s ef e a t u r e so n eb yo n ea sn na n dn f lc l a s s i f i e r i ia b s t r a c tt h er e s u l t si n d i c a t et h a tt h er a t eo fr e c o g n i t i o no ft h en e wc l a s s i f i e ri sb e t t e rt h a nt h en na n dn f lc l a s s i f i e r s ,l e s st h a nt h ea d a p t i v eb pn e u r a ln e t w o r k ,b u tt h et r a i n i n gt i m ei sm u c h1 e s st h a nt h eb pn e u r a ln e t w o r k k e yw o r d s :f a c er e c o g n i t i o n ,p c a ,i c a ,n n ,n f l ,a d a p t i v eb pn e u r a ln e t w o r ki i i原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。学位论文作者:日期:2 0 0 9 年月日学位论文使用授权声明本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关数据库进行检索,可以采用影印、缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。学位论文作者:n日期:2 0 0 9 年月日第一章绪论1 1 研究背景和意义第一章绪论当今社会,随着科学技术的突飞猛进,计算机及网络的高速发展,信息的安全性、隐蔽性越来越重要,如何有效、方便地进行身份验证和识别,己经成为人们同益关心的问题。特别是美国9 1 1 事件之后进一步强化了人们对于国家安全所面临的严峻挑战的认识。因此,生物特征识别技术受到了各国政府和科技界的普遍关注。所谓生物特征识别技术是指通过对人体特征如指纹、掌纹、人脸、虹膜、签名、步态等的数字化测量来进行身份鉴别技术。与其它生物特征识别系统相比,人脸识别系统更加直接、友好,使用者无任何心理障碍,在用户中的接受程度也较高,因而人脸识别技术的应用前景十分广阔。可用于公安部门刑侦破案的罪犯识别、安全验证系统、信用卡验证、档案管理、银行海关的监控系统等方面,因此成为当前模式识别和人工智能领域的一个研究热点【卜4 】。相对于其他生物特征识别技术,人脸识别技术具有特征录入较为方便、信息丰富、适用范围广等优点。另外,人脸识别的研究还涉及图像分析与处理、模式识别、人工智能、计算机视觉、心理学、生理学等多个学科领域,更是模式识别、人工智能和计算机视觉的典型案例之一。对这一问题的研究和解决,有助于对其他对象识别问题的研究分析和解决,人脸识别也因此成为这些基础研究领域的重要课题之一,具有重要的理论研究价值和广阔的应用前景。1 2 人脸识别研究内容人脸识别可分为两个方面:一是给定一幅待识别人脸图像,判别它是否是某人,就是通常所说的身份验证,这是个“一对一 的两分类问题;另一个则是给定一幅待识别人脸图像,判断它是谁,即通常所说的身份识秀 ( r e e o g n i t i o n ) ,这是一个“一对多”的多类分类问题。通常所说的人脸识别是个“一对多”的多类分类问题。从广义上讲,其研究内容主要包括以下五个方面【5 】:第一章绪论( 1 ) 人脸检n i j ( f a c e d e t e c t i o n ) :即从各种不同的场景中检测出人脸的存在并确定位置。脸部毛发、化妆、光照、噪声、面部倾斜和人脸大小变化以及各种各样遮挡等因素会使人脸检测问题变得更为复杂。近年来,人脸检测已经成为独立的研究课题得到研究者的关注。( 2 ) 人脸表征( f a c er e p r e s e n t a t i o n ) ( 也称人脸特征抽取) :即确定表示检测出的人脸和数据库中的已知人脸的描述方式。通常的表示方法包括几何特征( 如欧氏距离、曲率、角度等) 、代数特征( 如矩阵特征矢量) 、固定特征模板、特征脸等。( 3 ) 人脸识别( f a c e i d e n t i f i c a t i o n ) :就是将待识别的人脸与数据库中的已知人脸比较,得出相关信息。这一过程的核心是选择适当的人脸表示方式与匹配策略。( 4 ) 表情姿态分析( f a c i a l e x p r e s s i o n g e s t u r e a n a l y s i s ) :即对待识别人脸的表情进行分析,并对其加以分类。( 5 ) 生理分类( p h y s i c a l c l a s s i f i c a t i o n ) - 即对待识别人脸的物理特征进行分类得出其年龄、性别、种族等相关信息,或者从几幅相关的图像推导出希望得到的人脸图像,如从父母图像推导出孩子的脸部图像、基于年龄增长的人脸图像估算等。本课题的研究内容属于狭义的人脸识别方法,不涉及表情分析和物理分类方面。一个典型的人脸识别系统的流程图如图1 1 所示。首先对已有的人脸图像库中的图像进行检测与定位,找出其中是否有人脸,如果有,找出人脸位置并标出来;得到的人脸图像可能不清楚,存在倾斜,光照不好等情况,所以要对人图像进行预处理,如人脸校正,光照补偿等;然后对处理过的人脸图像利用一些特征提取方法,进行特征提取和选择,得到人脸特征;最后把得到的特征送入分类器里进行训练。对于一幅未知的图像,也要经过人脸的检测与定位检测出图像中是否有人脸,如果有标出其位置,然后进行人脸图像的预处理、特征提取与选择得到特征,最后利用分类器进行分类,判别出该幅人脸图像是谁。本文中,主要用标准人脸库人脸图像,故没有对人脸进行检测与定位、图像预处理,本文主要工作是特征提取和识别两个阶段。2第帝绪论图1 1 人脸识别系统的框图1 3 影响人脸识别精度的因素与其他生物特征识别相比较,人脸识别受到内在生理变化和外界环境变化的影响较大,因而识别精度也相当不稳定,使用安全性低。具体来说,人脸识别的精度主要受以下几方面因素的影响:1 ) 光照( i l l u m i n a t i o n ) :光照的方向及强度变化会严重影响人脸图像的灰度分布,因而影响大多数基于灰度统计特性的识别方法的效果;对基于几何特征的识别方法,光照也会严重影响几何特征的准确提取;2 ) 姿态( p o s e ) :姿态的变化又分为二维平面上的姿态变化( 平移、旋转) 和三维空间上的姿态变化,其中后者对人脸识别的效果影响尤为严重;3 ) 表情( e x p r e s s i o n ) :人脸识别相对于其他物体识别( o b j e c tr e c o g n it i o n )问题的一个困难就是人脸的非刚体性,主要体现为人脸的外观会受到人的心理和表情的影响;4 ) 遮挡( 0 c c l u s i o n d i s g u i s e ) :人脸在某些情况下会被遮挡,而使脸部特征缺损或丢失,例如头发、胡须、眼镜、帽子等:5 ) 尺度( s c a l e s i z e ) :指的是图像中人脸的尺寸大小变化,也即二维平面上的放缩变化;6 ) 其他:年龄的增长或脸部创伤所造成的脸部细节的变化等。3第一章绪论1 4 人脸识别三个阶段及国内外现状国内外对于人脸识别的研究发展,技术趋势分别经历了三个阶段:机械式的识别阶段、机器自动识别初级阶段、机器自动识别高级阶段。第一阶段为机械式的识别阶段,是以b e r t i l l o n ,a 1 l e n 和p a r k e 为代表,主要研究人脸识别所需要的面部特征。该阶段的识别依赖于人的操作,需要利用操作员的某些先验知识来进行。在b e r t i l l o n 的系统中,用一个简单的语句与数据库中某一张脸相联系,同时与指纹分析相结合,提供了一个较强的识别系统:为了提高识别率,a l l n e 为待识别脸设计了一种有效和逼真的摹写:p a r k e 则用计算机实现了这一想法,并产生了较高质量的人脸灰度图模型。这一阶段工作的特点是识别过程全部依赖于操作人员,显然这不是一种可以完成自动识别的系统。第二阶段为人机交互式初级阶段,主要是采用机器自动识别的手段进行识别。代表性工作有:g o l d s t i n o ,h a n n o n 和l e k s 用几何特征参数来表示人脸正面图像,他们采用2 1 维特征向量表示人脸面部特征,并设计了基于这一特征表示法的识别系统:k a y a 和k o b a y a s h i 则采用了统计识别方法,用欧氏距离来表征人脸特征,如嘴唇与鼻之间的距离,嘴唇的高度等:更进一步地,t k a n a d ( m n a g a o )设计了一个高速且有一定知识导引的半自动回溯识别系统,创造性地运用积分投影法从单幅图像上计算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配,k a n a d 的系统实现了快速、实时的处理,是一个很大的进步。这个阶段需要利用操作员的某些先验知识,仍然摆脱不了人的干预。第三阶段为机器自动识别高级阶段,是真正向实用化发展的机器识别阶段,这阶段识别率和自动化程度得到了提高。随着计算机的大型化、高速化和人脸识别的方法的发展,人们已提出了许多成熟、高效的方法,很多产品已用于实际应用。目前世界上的商用识别系统主要有i d e n t i x ( 原v i s i o n i c s ) 公司的“f a e c i t ”系统,v i i a s g e 公司的“f a c e i d ”系统,c o g n i t e c 公司的“f a c e v a c s 系统以及h u m a n s c a n 公司的“b i o i d 系统等。1 9 世纪9 0 年代中后期以来,国内的众多研究机构在自然科学基金、8 6 3计划、攀登计划的资助下,也开始了对人脸识别的研究。其中包括清华大学计算机系、自动化系、电子系以及哈尔滨工业大学、南京理工大学信息学院、中科院自动化所、上海交通大学图像处理与模式识别研究所、中山大学数学系等,他们4第一章绪论在人脸识别研究领域都进行了许多很有意义的尝试,同时也积累了宝贵的经验。1 5 本文内容安排本文基于p c a 特征和i c a 特征,根据最近邻分类器和最近邻特征线分类器,提出了一个新的分类准则;另外用级联b p 神经网络分类器实现了人脸的识别。实验结果表明,本文提出的这分类准则提高了识别率,达到了最优的识别效果。本文中,第一章绪论,主要介绍了人脸识别产生的背景知识。第二章主要介绍了常用的人脸识别方法及常用的人脸识别实验数据库。接下来的第三章提取p c a 和i c a 特征,第四章介绍了最近邻分类器,最近邻特征线分类器以及本文对他们的改进,和一个自适应的b p 神经网络,并用第三章提取的特征用这些分类器进行了实验。最后一章是总结与展望。5第二帝常用的人脸识别方泫o j 人脸库第二章常用的人脸识别方法与人脸库本文所研究的内容主要是特征提取和识别的两部分内容,人脸的特征提取和识别关系密切,很多的场合认为属于同一阶段。由于人脸变化的复杂性,人脸的表述和人脸特征的提取十分困难。在对人脸的特征提取和识别之前一般还需要对在输入图像中检测和定位后的人脸图像进行几何归一化和光照归一化。其中几何归一化是为了获得人脸在图像中位置、旋转、尺寸的几何不变性,而光照归一化是指对人脸图像进行光照补偿等处理,使人脸图像在一定程度上克服光照变化的影响。人脸识别中,输入图像中的人脸通常有正面、倾斜、侧面3 种情况。由于实际应用情况的要求,对人脸正面模式的研究最多。因此,国际上很多人脸识别小组都收集制定了自己的人脸图像数据成库,比如f e r e t 人脸库、a r ( t h ea rf a c ed a t a b a s e ) 人脸库、y a l e ( t h ey a l ef a c ed a t a b a s e ) 人脸库、o r l ( t h eo l i v e t t ia n do r a c l er e s e a r c hl 曲sf a c ei m a g ed a t a b a s e ) 人脸库等。由于这些人脸库规模各异,而且各具特色,因此就成为众多研究者进行算法性能比较的标准图像库。它们中的多数可以从因特网上免费下载用于学术研究。本章就是对常用的人脸识别方法及常用人脸库他们进行简要的介绍。2 1 基于几何特征的人脸识别方法基于几何特征的人脸识别通常抽取人脸器官如眼睛、眉毛、鼻子和嘴巴等器官的位置、尺度以及彼此间的比率作为特征,进一步地可以用几何形状拟合人脸器官,从而以几何参数作为描述人脸的特征。如图2 1 所示,典型的几何特征包括:眉毛厚度及其对应于眼睛中心位置处的垂直距离;对眉毛弧度的描述;鼻子的垂直位置和宽度;嘴的垂直位置、宽度、高度、上下嘴唇厚度;描述下巴形状的多个数据;鼻子处的宽度;半脸宽( 鼻子与眼睛中间位置处的脸宽) 。为了使测量结果不受方位、缩放和面部旋转的影响,测量前,必须对待测特征进行标准化。测量结果以向量的形式存储。一旦得到了输入图像的几何特征向量,就可以把它与数据库中已有的向量比较,寻找最佳向量作为识别结果。早期的基于几何特征的人脸识别包括b l e d s o e 嘲、g o l d s t e i n 口1 、k a y a t s j 等人的工作。6镕一 常用的 n 识自沾i 卑图2 1 人脸儿何特征示意豳基于几何特征的识别方法具有如下优点:符合人类识别人脸的机理,易于理解; 对每幅图像只需存储一个特征矢量,存储量小; 对光照变化不太敏感。但是此类方法通常要精确地抽取出位置,尺度、比率和几何参数作为描述人脸的特征,因此对人脸图像的表情变化比较敏感,同时,人脸器官分割的精确度也对人脸特征的提取有一定的影响。另外,该类方法并没有充分利用到人脸图像本身具有的扶度信息,因此这种方法己经不是人脸识别技术发展的主流方向。研究表明,基于几何特征的识别方法更适台于粗分类。2 2 基于统计特征的人脸识别方法2 2 1 模板匹配方法模板匹配法就是计算出固定目标模板和候选图像区域之间的相关性或差异性,作为匹配准则来搜索人脸,这种方法具有简单、直观的特点。当人脸的模式过于复杂而不能用单一模扳建模时,可以使用几个相关模扳检测那些相对稳定的人脸局部特征。最简单的例子就是直接计算两幅人脸图像之间的匹配程度。由于这种方法要求两幅图像上的目标要有相同的尺度、取向和光照条件,所以在进行匹配之前,预处理要做尺度归一化和敏度归一化的工作。最简单的人脸模板是将人脸看成一个椭圆,检测人脸也就是检测图像中的椭圆l 叫“。另一种方法是将人第一二章常用的人脸识别方法j 人脸库脸用一组独立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板、眉毛模板和下巴模板等。但这些模板的获得必须利用各个特征的轮廓,而传统的基于边缘提取的方法很难获得较高的连续边缘。即使获得了可靠度高的边缘,也很难从中自动提取所需的特征量。为此,用弹性模板方法提取特征显示出其独到的优越性【1 1j 。弹性模板由一组根据特征形状的先验知识设计的可调参数所定义。为了求出这组参数,需要利用图像的边缘、峰值、谷值和强度信息及特征形状的先验知识设汁合适的能量函数。参数向能量减小方向调整,当能量达到最小时,这组参数对应的模板形状最符合特征形状。而在人脸识别问题中,模版既可以是整个人脸图像构成的单一模版,也可以是不同局部特征子图构成的多个模版的组合。分类时将待识别的图像与已知的图像进行匹配,与每幅已知的图像匹配可以获得一个或一组匹配得分,这取决于每幅图像的模版个数。如果是一组得分,则最终得分可以由这一组得分按照某种方式决定,例如取加权平均或只是简单取最高分。根据最终匹配得分对待识别图像进行分类。有关专家p o g 西o 【1 2 】和b r u n e l l i 比较了上述基于几何特征的人脸识别方法和基于模板匹配的人脸识别方法,得出结论:基于几何特征的人脸识别方法具有识别速度快和内存要求小的优点,但在识别率上模板匹配要优于基于几何特征的识别方法。增大被测量的几何特征数目也无法显著改善前者的性能,因为要提高几何特征的提取质量本身就十分困难,而且随着图像质量的下降和人脸遮挡的引入,基于几何特征的匹配性能会急剧下降。总之,认为模板匹配法要优于几何特征法。2 2 2 弹性图匹配方法这里讲的弹性图匹配方法【1 3 】是一种基于动态链接结构( d y n a m i cl i n ka r c h i t e c t u r e ,d l a ) 在人脸识别领域的直接应用【l4 1 ,实际上是基于局部统计特征的,采用属性拓扑图来代表人脸,结合人脸的结构和灰度特性信息,可以精确定位人连面部特征点。该方法在三维空间中定义了一种对于通常的人脸变形具有一定的不变性的距离,并采用属性拓扑图来代表人脸,拓扑图的任一顶点均包含一特征向量,用来记录人脸在该顶点位置附近的信息( 如图2 2 所示) 【l5 1 。拓扑图的顶点采用了小波变换特征,它对于光纤、尺寸、角度具有定的不变性。它第= 章常用的 脸识别女瞎o i 库将人脸用格状的稀疏图表示,图中的节点用图像位置的g a b o r 小波分解得到的特征向量标记,图的边用连接节点的距离向量标记。匹配时,首先寻找与输入图像最相似的模型图,再对图中的每个节点位置进行晟佳匹配,这样产生一个变形图,其节点逼近模型图的对应点的位置。该方法的优点是:在比对时允许图像存在弹性形变,减少了表情变化对识别效果的影响,在某种程度上还能够容忍视角的变化,从而具有良好的识别效果。w i s k o t t 等人使用弹性图匹配方法,以f e r e t 图像库做实验,准确率达到9 7 3 “”。主要缺点是对每个存储的人脸需计算其模型图计算量大,存储量大。为了解决此问题w i s k o t t 在原有方法的基础上提出聚柬图匹配,部分克服了这些缺点。在聚束图中,所有节点都已经定位在相应目标上。对于大量数据库,这样可以大大减少识别时间。另外,利用聚柬图还能够匹配不同人的最相似特征,因此可以获得关于未知人的性别、胡须和眼镜等相关信息。l e e 等1 提出了一种基于弹性图动态链接模型的方法,既取得较快的识别速度,也获得了较理想的识别率在一定程度上克服了以往方法总是在速度与汉别率之州进行折中的缺点。幽2 2 定义在人脸上的二维拓扑翻2 2 3 隐马尔科夫模型方法酶马尔科夫模型( h i d d e nm a r k o vm o d e l ,删) “”是一种重要的统计模型,广泛应用于语音识别中。隐马尔科夫模型用于人脸识别的基础在于人脸的主要特征的位置顺序固定,因此可以表示为隐马尔科夫模型中的一系列状态。h 删使用马尔科夫链来模拟信号统计特性的变化而这种变化又是间接地通过观察序列来第二章常用的人脸识别方法o j 人脸库描述的,因此,隐马尔科夫过程是一个双重的随机过程。在h m m 中,节点表示状态,有向边表示状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一特征,不同状态表现出这一特征的概率不同。由于h m m 是一个统计模型,对于同一特征序列,可能会对应于许多状态序列,特征序列与状态序列之间的对应关系是非确定的。这种模型对于状态序列来说是隐的,故称为隐马尔科夫模型。h 删有三个主要问题:评估、估计及解码。我们关心的是前两个问题。评估用于解决识别问题,一般采取比较有效的“向前一向后法;估计用来产生用于识别的各个单元的h 咖,采取b a u m - w e l c h 方法。隐马尔科夫模型,能够很好地处理概率转移。故该模型被广泛地使用处理对离散事件处理,常见的应用有语音识别、金融预测、生物医学、d n a 字列预测等方面。因此在动态人脸识别中也可以使用隐马尔科夫模型作为人脸类别的分类器。由于人脸可被分为额头、眼睛、鼻子等水平区域,因此人脸可被建模成5个状态的线性h m m 模型,这5 个状态为额头、眼睛、鼻子、嘴巴和下巴,而完整的h 删识别系统包括构件代码本、向量量化、训练和识别4 个步骤n9 。与一般的神经网络相比较,隐马尔科夫模型的离散特性更突出,因此隐马尔科夫模型更能体现出动态人脸图象序列中图象帧转移和帧之间的相关性。另外隐马尔科夫模型的学习算法简单,学习时间短,能够满足动态人脸识别的实时特性。2 2 4 子空间方法子空间分析的思想就是根据一定的性能目标来寻找一线性或非线性的空间变换,把原始信号数据压缩到一个低维子空间,使数据在子空间中的分布更加紧凑,为数据的更好描述提供了手段,另外计算的复杂度也得到了大大的降低。我们知道,人脸的识别过程就是把待识别人脸映射到由特征脸张成的子空间中,与库中人脸的子空间位置进行比较,人脸的重建就是根据待识别人脸在子空间的位置,还原到人脸空间中。由于人脸图像的维数都是非常高的,而且人脸图像在这样高维空间中的分布很不紧凑,因而不利于分类,并且在计算上的复杂度也非常大。为了得到人脸图像的较紧凑的分布,k i r b y 等啪1 和t u r k 乜首次把主元分析的子空间思想引入到人脸识别中,并获得了较大的成功乜刳,从而将人脸识别的研究热点从基于局部几何特征的几何特征方法引到基于全局统计特征的统计方法上1 0第一口m 的 脸m 女法+ 4 八睦昨来。随后子空问分析方法就引起了人们的广泛注意,从而成为当前人脸识别的主流方法之一。目前在人脸识别中得到成功应用的线性子空间方法有:主成分分析( p c a ) 、独立成分分析( i c a ) 、线性判决分析( l d ) 等:基于核技术的非线性子空间方法有核主元分析( k p c a ) 和核f i s h e r 判决分析( k f d a ) 。2 3 人脸库介绍任何人脸识别系统的开发都需要建立一个包含各种各样人脸的数据库。人脸数据库的设计对系统的识别率影响是至关重要的,数据库中不同光照、表情和姿态变化甚至背景的变化都会极大的影响识别的结果,所以有必要建立适应不同需要的人脸数据库。下面介绍三个典型的也是常用的数据库。2 3 1 英国o r l 人脸库o r l “”库中原始人脸图像为扶度图,尺寸为9 2 1 1 2 像素。该人脸库共包括从1 9 9 2 年4 月到1 9 9 4 年4 月拍摄的一系列人脸图像,由4 0 个人的4 0 0 幅灰度图像组成,图像尺寸为,图像背景为黑色。这些人脸图像分别在不同的时间、不同的光照、不同头部角度、不同人脸表情( 睁闭眼,关严肃) 和不同的人脸细节( 有无眼镜) 条件下摄制得到。如图2 3 所示是其中一些人脸图像示例,同一行的人脸图像属于同一个人。这是目前使用最广泛的人脸数据库,本文所做实验都是基于此人脸库。蚶2 3o r l 原始人脸幽像示例菲一十常月的 臆识刺方法。 库2 3 2 美国a r 人脸图像库由美国普度大学( p u r d u eu n i v e r s i t y ) 计算机视觉中行的am a r t i n e z 和rb e n a e n t e 于1 9 9 8 年创建的a r 。”人脸库,包括1 2 6 个人( 7 0 男,5 6 女) 的4 0 0 0多幅彩色图像,每个人包含了相隔1 4 天拍摄的两组图像。每一组中包肯了每人在不| 司表情( 中性表情、微笑、生气、尖叫) 、不同光照( 左侧光、右侧光,多光) 、戴太阳镜加不同光照( 戴太阳镜加自然光、戴太阳镜加左倒光、戴太阳镜加右侧光) 以及戴围巾加不同光照( 戴围巾加自然光、戴围巾加左侧光、戴围巾加右侧光)等条件和配置下的1 3 张图像。图像是在严格的外部条件控制下拍摄的,但对参与者头发、穿戴等没有任何限制。所有图像保存在八张c d 上,前四张保存第一组图像,后四张保存第二组图像。图像采用单一白色背景图像大小为7 6 8 * 5 7 6 。该人脸库一个显著的特点是绝大多数图像中其双眼的虹膜上都有非常明显的反射光点。qi b 盟幽2 4 a r 原始人脸图像示例2 3 3 美国f e r e t 人脸图像库该库是为了配合人脸识别技末计划( f e r e t ,t h ef a c er e c o g n i t i o nt e c h n o l o g yp r o g r a m ) 由hw e c h s l e r 和pjp h i l l i p s 博士于1 9 9 3 年至1 9 9 6年期间创建的一个大型人脸图像库,包含了1 1 9 9 人共1 4 1 2 6 幅图像。是目前犀大的人脸数据库,由美国军方研究实验室提供,其中每人8 张照片,两张正脸,3 张从右到左的不同侧面角度的照片,有些人还提供了更多不同视点和不同表情叠c ) !血盆盆盆怠“n ,a nj盆9国岔a 2国窖第一常霈甩的 脸;g 肘方法, 脸库的照片。碳数据库中不包含戴眼镜的照片,拍摄条件也有一定的限制,人脸大小约束在规定范围内。但到目前为止 = j 数据库井未提供运动图像系列或包含语音信息。f e r e t 数据库的照大缺点是非美研究机构的获取不便。图25 是其中一些人脸图像示例,同一行的人脸图像属于同一个人。4 二02 4 小结嗤2 5b e r e t 原始人脸圉像示例本章主要简单介绍了基于几何特征和基于统计特征韵人脸识别常用的方法以及o r l 、 r 、f e r e t 等常用的人脸库。本论文中我们采用的是基于统计特征中基于子空白】的人脸识别方法与o r l 人脸库。具体有关子空间方法在下一章中将详细介绍。隅墨焉第三章幕于了卒问的人脸特征提取第三章基于子空间的人脸特征提取本章介绍本文所要用到的基于子空间人脸特征提取算法,包括主成份分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 和独立分量分析( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 两种方法。3 1 基于p c a 子空间的特征提取主成分分析( p c a ) 方法是麻省理工学院m t u r k 和a p e n u a n d 于1 9 9 1 年提出的,直到现在,它仍然是最广泛应用的人脸识别算法。主成分分析法( p c a ) 是模式识别判别分析中最常用的一种线性映射方法,该方法是根据样本点在多维模式空间的位置分布,以样本点在空间中变化最大方向,即方差最大的方向,作为判别矢量来实现数据的特征提取与数据压缩。从概率统计观点可知,一个随机变量的方差越大,该随机变量所包含的信息就越多,如当一个变量的方差为零时,该变量为一常数,不含任何信息。所谓主成分就是原始数据的历个变量经线性组合( 或映射) 后得到的变量,该变化使得其变换后的变量方差为最大( 第一主成分)的部分。各个主成分之间是相互线性无关的( 正交的) ,从第一主成分往后,丰成分按方差大小的顺序排列( 对应特征值按大小顺序排列) 。对于特征值为元的主成分,允也是该主成分的方差,该值表示样本点在该主成分方向上的离散程度,主成分的贡献率仇可用下式表示仍= i ( 4 + 五+ + 屯)主成分中方差较小或( 元) 较小的主成分被认为包含的是噪声,在分析时不使这些变量引入模型,这样使分析的主成分减少,以达到降维的目的。主成分中任两个,可构成判别分析平面,因此可实现高维空间向两维平面及其他维平面映射的目的。一般取方差较大的几个主成分构成判别分析平面。1 4第三章皋干予窄问的人脸特征提取3 1 1 数据分解和重建首先考虑把仂维的向量j 转换为j 维且仇最简单的降维方法是直接把向量截断为r ,即:x = ( 五,) 一x = ( 五,_ ,0 0 ) ,聊 ,( 3 1 1 )但降维导致均方误差很大:( 3 1 2 )正确的降维方法是寻找一个合适的变换使上述均方误差最小。主成份分析正是此准则为出发点的。假设随机向量x 的期望为0 ,即e ( x ) = 0 。如果它的均值不为零,则需要对它做预处理,从x 中减去它的均值。另g 为单位向量,则向量x 到向量g 的投影为:a = x r q ,i l q l :l( 3 1 3 )投影a 的均值e ( a ) 和方差口2 分别为:e ( 爿) = e ( q7 x ) = q t e ( x ) = 0( 3 1 4 )盯2 = e ( a 2 ) 一 e ( 彳2 ) 】2= e ( 么2 ) = e ( g r 肠r g )( 3 1 5 )= q t e ( x x7 ) g= q r r q( 3 1 5 ) 中刀是随机向量j 的协方差矩阵,它的大小是m * m ,r = e ( x x r )且月是对称矩阵。若a ,b 是m 木l 维的行向量,则有口7 r b = b r r a ,由上述仃2 的定义已知投影变量彳的方差是单位向量q 的函数,即仃2 = ( 鸟) = q r r q 。既然投影方差是单位向量口的函数,就可寻找一个最佳的单位向量使函数( g ) 最大。假设单位向量q 使矽( g ) 取得最大值,则若有一个小扰动却,有( g + 6 q ) = ( g ) 。下面寻找满足上式的单位向量q ,( g ) = q r r q ,第三章摹于予窄问的人脸特征提取矽( g + 万垡) = ( g + 艿g ) r r ( q + 8 q )2 q r r q + q7 尺万g + ( 万g ) 2 尺g + ( 万g ) 7r 万q( 3 1 6 )= g7 r q + 2 ( g q ) 7r q + ( 8 q ) 7r g q= ( g ) + 2 ( g q ) 7 r q为满足矽( g + 却) = f k ( q ) ,需要矽( g + 6 q ) = 矽( g ) + 2 ( 却) r r q = ( g ) ,即要求:2 ( g q ) r r q = 0( 3 1 7 )假设扰动向量国不是随意的,而是满足这样的约束:对g 增加扰动后的向量仍是单位向量,即两满足:怕+ 曲0 = 1 于是:( g + 却) r ( q + g q ) = ljq r q + ( 6 q ) r q + q r 8 q + ( s q ) 7 ( 却) = lj2 ( 6 9 ) r + ( 万g ) 7 ( 万g ) = oj ( 却) r q = o联立( 3 i 7 ) ( 3 1 8 ) 得到如下的式子:( ) 7 r q = 0( 曲) 7 g = o得到下式:( 曲) 7 r q - 2 ( g q ) 2g = 0即:( 曲) r ( r q - 2 q ) = o ,可得:r q - 2 q = 0所以,满足脚一幻= 0 的单位向量q 可使矽( g ) 达到最大值。( 3 1 8 )( 3 1 9 ),( 3 1 1 0 )( 3 1 1 1 )由于r 是实对称的,所以它有非负特征值。在式两边同时左乘g r ,则有:g r r q = 2 q r g = 允= ( g )( 3 1 1 2 )通过上述推导,可得如下结论:( 1 ) 零均值随机向量x 的相关矩阵r 的特征向量g ,就是使( g ) 达到极值的主方向( 2 ) 矩阵尺的特征值就等于矽( g ) 的极值。1 6第三章幕f 了窄问的人脸特行提取因为求解公式尺g = a q 可以得到m 个单位向量g 。因此向量x 有m 个投影乃= q r s x ,_ ,= 1 删( 3 1 1 3 ) 中a i 是x 在方向以为主方向,a j 为x 的主成份。把( 3 1 1 3 ) 写成矩阵形式:a = q 7 x其中口= ( 口。,口29 9 ) 丁,q = ( g 。,g :,q ,) 。因为q 是正交矩阵,所以上式两端同乘以q 得到:( 3 1 1 3 )( 3 1 1 4 )q a = q q r xx = q a = 口,q ,( 3 1 1 5 )上式是一个数据重建的过程。可得:3 1 2 数据降维和误差分析( 3 1 1 6 )正交矩阵9 把数据空间的一点j 变换到特征空间中对应的点a 。两个空间的维数相等,均为风为了得到降维的特征,主成份分析丢弃了石= 跏= 口,q 中变化较小的项,而把那些变换较大的保留下来。设矩阵厅的前j 个最大的特征值为:a ,如,乃,与之对应的特征向量q l q :,研。向量j 可以表示为:x = 口j q s = ( 西,西小而,) ,把向量j 的分量截断到,得到近似的表达:,j = 以q ,= i( 3 1 1 7 )下面分析截断误差:原始数据向量j 和它近似向量的误差的定义为:p :x 一岩,可以证明误差向量e 和近似向量j 正交。第三章皋于予窄问的人脸特

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论