(计算机应用技术专业论文)基于fkpca双子空间和信息属性knn的小样本人脸识别研究.pdf_第1页
(计算机应用技术专业论文)基于fkpca双子空间和信息属性knn的小样本人脸识别研究.pdf_第2页
(计算机应用技术专业论文)基于fkpca双子空间和信息属性knn的小样本人脸识别研究.pdf_第3页
(计算机应用技术专业论文)基于fkpca双子空间和信息属性knn的小样本人脸识别研究.pdf_第4页
(计算机应用技术专业论文)基于fkpca双子空间和信息属性knn的小样本人脸识别研究.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(计算机应用技术专业论文)基于fkpca双子空间和信息属性knn的小样本人脸识别研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

江苏大学硕士研究生毕业论文 摘要 人脸识别技术因其具有重要的科学意义和实用价值,在近几年得到了研究者 的高度重视,成为当前模式识别和人工智能领域的一个研究热点。人脸识别主要 分为人脸检测、特征提取和模式分类三个步骤。人脸识别过程中会遇到各种问题, 其中样本维数过高、类别数大、单人训练样本少以及识别的实时性都是亟待解决 的难题。 本文在综合分析了以往的人脸识别方法的基础上,着重从特征提取速度、特 征信息的完备性和识别率三个方面考虑,提出基于f k p c a + 双子空间和信息属性 k n n 分类器的小样本人脸识别算法,并设计实现相应的原型系统。本文的工作 主要包括: ( 1 ) 提出一种f k p c a + 双子空间人脸特征信息提取新方法。该方法首先通 过快速核主元分析( f k p c a ) 将低维空间线性不可分的人脸样本隐性映射到线 性可分的高维空间,并在该空间中实现降维;然后,在f k p c a 降维后的数据上, 利用f i s h e r 准则从值域空间中提取常规特征信息,利用类问散度准则从零空问提 取非常规特征信息。该方法可提取到更加完备的特征信息,对提升识别率有很大 的帮助。 ( 2 ) 提出信息属性k 一近邻分类器算法。在深入研究传统的k 一近邻分类器算 法的基础上,针对k 近邻分类器中欧式距离不能很好的表示样本间相似度问题, 采用以信息属性为权值对欧式距离进行加权的策略,有效地改进欧式距离;把加 权后的欧式距离作为k 近邻分器度量样本间相似度的测度。该方法能够有效地 弥补传统欧氏距离仅仅表示m 维空间中两个点之间真实距离而不能很好地表示 对象间相似程度的不足。 ( 3 ) 提出一种小样本人脸识别算法。首先使用f k p c a 对样本进行线性降 维;然后提取降维后数据的常规特征信息和非常规特征信息;接着利用改进后的 欧式距离对常规特征信息和非常规特征信息分别计算测试样本到各训练样本的 相似度,并把计算结果进行融合;最后利用k 近邻分类器使用融合结果进行分 类。 ( 4 ) 人脸识别原型系统的实现。采用面向对象思想设计并开发了小样本人 脸识别原型系统。该系统由图像预处理、f k p c a 特征提取、双子空间两类信息 提取和分类识别四个功能模块组成,实现了当训练样本较少时,系统仍能保持较 高的正确识别率和较好的实时性。 关键词:人脸识别,快速核主元分析,双子空间,信息属性k n n 分类器 江苏大学硕士研究生毕业论文 a b s t r a c t f a c e r e c o g n i t i o nt e c h n o l o g yh a sb e e na t t a c h e dg r e a ti m p o r t a n c et ot h e r e s e a r c h e r sf o ri t ss c i e n t i f i cs i g n i f i c a n c ea n dp r a c t i c a lv a l u ei nt h ep a s tf e wy e a r s a n d b e c o m et h eh o t s p o to fc u r r e n tp a t t e mr e c o g n i t i o na n da r t i f i c i a li n t e l l i g e n c e f a c e r e c o g n i t i o nn o r m a l l yb er e g a r d e da sh a v et h r e ep r o c e s s e st h a ta r ef a c ed e t e c t i o n , f e a t u r e se x t r a c t i o na n dp a t t e r nc l a s s i f i c a t i o n f a c er e c o g n i t i o n0 f i e nm e e tt h e s e p r o b l e m s ,t h ed i m e n s i o no fs a m p l et o oh i g h ,t h ec l a s s e so fp a t t e mt o om a c ha n de a c h p e r s o nc o u l do n l yp r o v i d eas m a l la m o u n tt r a i n i n gs a m p l e i n t h i sp a p e r , b ys y s t e m a t i c a l l ya n a l y z i n go fr e l e v a n ta l g o r i t h m s ,w ep r e s e n t s o m en o v e la l g o r i t h m sf o rf a c er e c o g n i t i o nw i t hs m a l ls a m p l eb a s e do n f k p c a + d o u b l es u b s p a c ea n di n f o r m a t i o na t t r i b u t ek n nc l a s s i f i e r , f r o mt h r e e a s p e c t so ft h es p e e do fe x t r a c t i n gf e a t u r e s i n f o r m a t i o nc o m p l e t e n e s sa n df a c e r e c o g n i t i o n i na d d i t i o n ap r o t o t y p es y s t e mo ff a c er e c o g n i t i o ni sd e s i g n e da n d i m p l e m e n t e d t h eh i g h l i g h t sa n dm a i nc o n t r i b u t i o n so ft h ed i s s e r t a t i o ni n c l u d e : ( 1 ) an o v e lm e t h o db a s e do nf k p c a + d o u b l es u b s p a c ef o rf e a t u r e se x t r a c t i o n i sp r e s e n t e d f i r s t l y , f k p c ai su s e dt om a pi n p u ts p a c e i n f o r m a t i o nt o h i 曲d i m e n s i o n a ls p a c et or e d u c et h ed i m e n s i o no fo r i g i n a ls a m p l e si n h ig h d i m e n s i o n a ls p a c e :s e c o n d l y , g e tt h er e g u l a ri n f o r n l a t i o nu s i n gf i s h e rc f i t e r i o n i nr a n gs p a c ea n dg a i nt h ei r r e g u l a ri n f o r m a t i o ne m p l o y i n gb e t w e e n c l a s ss c a t t e r c r i t e r i o ni nn u l ls p a c e t h i sm e t h o dc a ne x t r a c tm o r ec o m p l e t eo p t i m a ld i s c r i m i n a n t f e a t u r e s a n db ea l s oo fg r e a th e l pt ot h ef e a t u r ee x t r a c t i o np r o b l e mi ns m a l ls a m p l e c a s e ( 2 ) t h ei n f o r m a t i o na t t r i b u t ek n e a r e s tn e i g h b o rc l a s s i f i e ri ss t u d i e d o nt h e b a s eo ft h o r o u g hs t u d yo ft r a d i t i o n a lk n e a r e s tn e i g h b o rc l a s s i f i e r , a g a i n s tt h e p r o b l e mo fe u c l i d e a nd i s t a n c eo fk n nc a nn o te x p t r e s ss a m p l es e m b l a b l ed e g r e e w e l l t h es t r a t e g yo fu s i n gi n f o r m a t i o na t t r i b u t ea sw e i g h t si sa d o p t e dt oi m p r o v e e u c l i d e a nd i s t a n c e ;t h e nt h ei m p o v e de u c l i d e a nd i s t a n c ei su s e da sk n e a r e s t n e i g h b o rc l a s s i f i e rm e a s u r e t h ei n f o r m a t i o na t t r i b u t ek n e a r e s tn e i g h b o rc l a s s i f i e r c a ne f f e c t i v e l ym a k eu pt h ef a u l tt h a te u c l i d e a nd i s t a n c er e n d e ro n l yt h et r u l y d i s t a n c eo ft w op o i n t si nmd i m e n s i o ns p a c e ( 3 ) a na l g o r i t h mo nf a c er e c o g n i t i o nw i t hs i n a i ls a m p l ei sg i v e n f i r s t l y f k p c :ai su s e dt oi m p l e m e n tl i n e a r l yd i m e n s i o nr e d u c t i o n ;s e c o n g l y e x t r a c tr e g u l a ri n f o r m a t i o na n di r r e g u l a ri n f o r m a t i o n ;t h r i d l y , i n f o r m a t i o na t t r i b u t e e u c l i d e a nd i s t a n c ei su s e dt oc a r r yo u to fc a l c u l a t i n gt h es a m p l es e m b l a b l ed e g r e e w i t hr e g u l a ri n f o r m a t i o na n di r r e g u l a ri n f o r m a t i o na l o n e t h e n t h ec a l c u l a t i o n sh a v e w o r k e do u ta r ef u s e d a tl a s t k n e a r e s tn e i g h b o rc l a s s i f i e rt h et a s ko f c l a s s i f i c a t i o nw i m t h ef u s e dr e s u l t ( 4 1b a s e do nt h ei d e ao fo b j e c t o r i e n t e d ,w ed e s i g na n dd e v e l o p m e n tap r o t o t y p e s y s t e mo ff a c er e c o g n i t i o nw i t hs m a l ls a m p l e w h i c hi sd i v i d e di n t of o u rm o d u l e s w h i c ha r ei m a g ep r e p r o c e s s ,f k p c ap r o c e s s ,d o u b l es u b s p a c ef e a t u r ee x t r a c t i o na n d i n f o r m a t i o na t t r i b u t ek n nf a c er e c o g n i t i o n a n dm a k e st h es y s t e mr e c o g n i z ep e o p l e a c c o r d i n gt of a c ei m a g ew i t ho n l yal i t t l et r a i n i n gs a m p l e s s y s t e mh a sm a n a g e dt o m a i n t a i nah i g h e rc o r r e c tr e c o g n i t i o nr a t e k e yw o r d s :f a c er e c o g n i t i o n ,f a s tk e r n e lp r i n c i p a lc o m p o n e n ta n a l y s i s ( f k p c a ) , d o u b l es u b s p a c e i n f o r m a t i o na t t r i b u t ek n n 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文 的规定,同意学校保留并向国家有关部门或机构送交论文的 复印件和电子版,允许论文被查阅和借阅。本人授权江苏大 学可以将本学位论文的全部内容或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和 汇编本学位论文。 保密口,在年解密后适用本授权书。 本学位论文属于 不保密口。 学位论文作者签名: 琦指导刻醛名 砂彩辞多月胗日 弘l ,年易月f 日 独创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的 指导下,独立进行研究工作所取得的成果。除文中已注明引 用的内容以外,本论文不包含任何其他个人或集体已经发表 或撰写过的作品成果。对本文的研究做出重要贡献的个人和 集体,均已在文中以明确方式标明。本人完全意识到本声明 的法律结果由本人承担。 学位论文作者签名: 柳啼 日期:矽年6 月2 ,日 江苏大学硕士研究生毕业论文 第一章绪论 1 1 人脸识别的研究背景与意义 人脸识别是计算机视觉和模式识别的交叉领域。人脸识别将计算机视觉和模 式识别结合在一起,广泛地应用在机器人等学科中l i j 。随着社会的发展,各方面 对自动身份验证的要求日益提高。生物特征作为人的内在属性,具有很强的自身 稳定性和个体差异性,是身份验证的最理想依据。作为人类几个重要的生物鉴别 特征之一,人脸识别对自动鉴别和人类自动分辨有着重要的意义1 2 i 。在广域样本 范围内,指纹识别和虹膜识别的取样样本都具有唯一性,即对于任何两个样本, 他们的指纹或虹膜不会是完全相同的,另外指纹和虹膜的成像不会在不同时刻得 到不同的效果,这就决定了待识别图像和样本本身一样是具有唯一性的p j 。但是 人脸图像受其成象角度、光照条件、面部表情等因素的影响较大,即使是相同的 人脸图像成像后也可能有较大的差别,另外不同人脸在一定角度下,有时也有较 大的相似度,这两个因素导致了人脸识别复杂性比较高、识别难度比较大,这些 都是人脸识别研究中遇到的实际困难1 4 j 。但是与指纹识别和虹膜识别相比,人脸 识别又有其自身的优势。指纹或虹膜的获取都要求待识别对象与成像设备具有较 近的空间距离,而人脸图像的获取突破了接触式的方式,在一般可视情况下,人 脸图像都能够正常被捕捉,这一因素决定了人脸识别比指纹识别和虹膜识别有更 广的应用范引引,诸如远程安全、检疫、图像传送等。并且它具有不易遗忘和丢 失、不被盗用和仿制、随身携带、终身不变等诸多优点,乐于为人们所接受。九 十年代英特网的蓬勃发展对于网络安全和网络鉴别的需求,也导致了人脸识别越 来越具有实用性。 人脸识别的研究最早开始于7 0 年代,当时的研究主要是基于人脸的外部轮 廓方法。由于人脸外部轮廓的提取比较困难,在随后的一段时问中,人脸识别的 研究相对比较停滞,后来由于主成分分析法( p c a ) 的提出,人脸识别方法有了新 的突破,人脸识别的研究在8 0 年代后期又重新活跃起来。9 0 年代后,由于高速 度高性能的计算机的出现,人脸识别的方法有了重大突破,进入了真正的机器自 动识别阶段,人脸识别研究得到了前所未有的重视,国际上发表有关人脸识别等 方面的论文数量大幅度增加,仅从1 9 9 0 年到2 0 0 0 年之间,e i 可检索到的相关 文献多达数千篇1 6 j 。随着信息安全的重要性日益突出,人脸识别技术在应用方面 的研究逐渐成为热门课题。美国遭遇恐怖袭击后,人脸识别技术引起了广泛关注。 作为最容易隐蔽使用的识别技术,人脸识别成为当今国际反恐和安全防范最重要 的手段之一。人脸识别的研究涉及到计算机科学、人工智能、模式识别、认知学、 江苏大学硕士研究生毕业论文 视觉心理学和生理学等众多领域【7 1 。它一方面充分利用这些领域的成果束发展自 己的理论和方法,同时反过来也推动这些领域的发展。因此,人脸识别技术的研 究不仅具有广泛的实用意义,而且还具有重要的理论价值。 人脸识别技术研究的意义主要体现在以下几个方面: 首先,人脸识别研究成果能成为公安、银行、海关等机要部门在鉴别人的身 份时提供新的、方便的检测手段,从而大大提高安全部门的工作效率和方便性。 例如人脸识别储蓄卡持有者如果不慎将卡丢失,就不必担心卡中资金被人盗取造 成财产损失。 其次,人脸识别作为一种典型的对于自然物体的识别,具有重要的理论价值, 它的研究思想和实现方法可为其它动态自然物体识别提供重要理论和参考借鉴。 最后,人脸识别研究的一个主要内容是如何描述与表示人脸,这对于图像压 缩及信息传输也具有重要应用价值。 由于人脸识别技术比其他的人体生物特征识别技术的性能要优越,它不需要 人的行为的配合能方便有效地核查人的身份,只需通用的p c 硬件及相关软件, 因而经济、性价比高。由于其直观、准确,且应用更为广泛,所以在诸如证件检 验、银行系统、军队安全、安全检查方面都具有相当大的应用前景。如: 1 在银行金融系统中的应用。银行金融系统对安全防范控制系统有着极高 的要求,人脸识别技术直观、准确、可靠,具有良好的可跟踪性,解除用户忘记 密码的苦恼,防止冒领、盗取的事件发生。 2 在政法系统中的应用。一方面,在获得罪犯照片后,可以通过人脸识别 技术,在存储的罪犯照片数据库中找出最为相象的几个人列为嫌疑犯,缩短破案 时间,另一方面设在重要交通要道的摄像头可在无人职守的情况下自动捕捉头 像,通过网络将头像面貌特征数据传送到计算机中心数据库去,与逃犯的头像进 行比较,一旦发现是吻合的头像,即自动记录并报警。 3 入口控制:用于设计新颖的住宅门锁,人脸是最为安全可靠的“钥匙”。 4 视频监视:在许多公司、银行、公共场所都设有2 4 小时的视频监视。 5 证件验证:身份证、驾驶执照以及其他证件上都有照片,采用人脸识别 技术,证件的验证工作就可交给机器完成,从而实现自动化智能管理。 6 电信会议、机器人智能化等领域。 1 2 人脸识别的国内外研究现状 人脸识别的研究已有很长的历史,早在1 9 世纪后期,f r a n c i sg a l t o n 8 1 就曾 对此问题进行了研究,他用一组数字代表不同的人脸侧面特征来实现对人脸侧面 图像的识别。到2 0 世纪9 0 年代以前,典型的人脸识别技术始终是用人脸正面或 2 江苏大学硕士研究生毕业论文 侧面的特征点之间的距离量度,而且早期的人脸识别多集中于对侧影图像的研 究。h a r m o n 等人利用与g a l t o n 类似的方法识别人脸,他采用9 个基准点表征侧 影,在此基准点上导出一组特征,如基准点之间的距离和角度、由基准点形成的 三角形区域的面积等,然后利用特征之问的归一化欧氏距离进行识别1 9 】。其后期 的工作又增加了两个基准点和一些新的特征,而且人脸侧影轮廓曲线叮从侧影图 像中自动抽取得到。k a u f m a n 和b r e e d i n g 也设计了一个对人脸侧影进行识别的 系统,他们采用基于特征的方法,其中特征为极坐标形式的自相关函数的系数, 他们同时对动量不变性特征进行了实验1 3 l 。b a y l o u 等人选择1 0 个特征点对人脸 侧影进行识别1 1 0 1 ,w u 和h u a n g 采用三次b 样条函数抽取6 个侧影基准点,利 用从中导出的2 4 个特征对东方人的侧影人脸图像进行匹配识别【l l l 。l a p r e s t e 等 人利用距离探测器来获得人脸侧影图像并从中抽取特征点,然后用欧氏距离对人 脸进行匹配l l 引。l e e 和m i l i o s 同样利用距离图像来匹配两幅人脸侧影的相似特征 1 1 3 。由于侧影识别对获取图像的约束较多,人们逐渐转向对正面人脸的识别研究。 最早的半自动正面人脸识别系统由b l e d s o e 于2 0 世纪6 0 年代提出,在该人脸识 别系统中,首先由操作员定出面部特征点并将其位置输入计算机,给定这些特征 点之问的距离,采用最近邻原则或其他分类规则即可识别出待测试的人脸。 k a n a d e 设计了一个高速的且有一定知识引导的识别系统,他创造性地运用积分 投影法从单幅图像上计算出一组人脸几何特征参数,再利用模式匹配技术与标准 人脸相比较。b a r o n 先将图像灰度归一化,再利用四个掩膜( 眼、鼻、嘴及眉毛以 下的整个脸部) 表示人脸,然后分别计算这四个掩膜与数据库中的每幅标准图像 的相应掩膜之间的互相关函数,以此作为判别依据1 1 3 j 。 总的来说,早期的人脸识别方法都需要利用操作员的某些先验知识,仍然摆 脱不了人的干预。2 0 世纪9 0 年代以来,随着高速度高性能计算机的出现,人脸 识别方法有了重大突破,进入了真正的机器自动识别阶段,人脸识别研究也得到 了前所未有的重视。2 0 世纪9 0 年代后期以来,一些商业性的人脸识别系统逐渐 进入市场。 国内人脸检测与识别的研究自2 0 世纪8 0 年代起步后,大都集中在基于几何 特征、代数特征、神经网络和模板匹配的检测和识别这几个方面,特别是有关神 经网络的研究比重较大。近几年引入三维特征后,利用三维与二维信息的融合进 行人脸检测与识别成为另一个亮点。中国科学院计算所的“面像检测与识别核心 技术”这一国家8 6 3 项目取得了重大突破,达到了国际先进水平。由清华大学电 子系人脸识别课题组负责人苏光大教授主持承担的国家”十五 攻关项目人脸 识别系统2 0 0 5 年通过了由公安部主持的专家鉴定。中科院计算所一银晨科技 面像识别联合实验室的“人脸识别出入控制系统”还获得了2 0 0 5 年上海工业博 3 江苏大学硕士研究生毕业论文 览会银奖和第七届中国国际高交会优秀新产品奖。为了防止恐怖事件的发生, 2 0 0 8 年北京奥运会也启用了人脸识别智能监控报警系统,有效解决参会人员的 身份管理。该系统通过建立自动人脸识别报警服务网,对于运动员、教练、场馆 工作人员以及后勤、食品运送人员采用摄像机自动识别,对未经过登记授权进入 场馆的可疑人员,系统则向网络报警中心报警。奥运会安保人员可以迅速将可疑 人员图像传至各个安全中心,多个安全中心及时联动处理。这表明我国的人脸识 别研究已达到国际先进水平,标志着我国在人脸识别这个当今热点科研领域掌握 了一定的核心技术。 1 3 人脸识别的研究内容及主要方法 人脸识别的研究涉及到计算机图形学、数字图像处理学、计算机视觉、模式 识别、机器学习、感知科学、人工智能、计算智能等技术,人脸识别技术在近年 来获得大量的研究成果,而且证在逐步成熟。一个人脸识别系统设计的主要流程 如图1 1 所示: 人 输人 脸 入脸特 人输 图 卜 检 卜 征 八 脸 卜 像一测一提 _ j 出 或 与取 _ 识 _ 弋。 结 yy 视分与 别果 频析 选 择 图1 1 人脸识别流程图 人脸识别主要分为人脸检测与分割,特征提取与选择和分类识别三个过程: 1 、人脸检测与分害u ( f a c ed e t e c t i o na n ds e g m e n t a t i o n ) 所谓人脸检测与分割,就是给定任意图像或视频,确定其中是否存在人脸, 如果有,给出人脸的大概位置、大小等状态信息,然后将包含该人脸的更确切的 图像分割出来1 4 j 。在某些情况下由于图像的获取环境是可以人为控制的( 如身份证 照片等) ,因而人脸的定位可以轻易地做到。但在大多数场合中由于场景较复杂, 人脸的位置预先是不知道的,必须首先确定场景中是否存在人脸,如果存在人脸, 再确定图像中人脸的位置。人脸检测的主要目的是在输入的整幅图像上寻找人脸 区域,人脸分割的主要目的是把图像分成两个部分一人脸区域和非人脸区域,从 而为后续的应用作准备,它的结果直接关系到后面两个过程的准确性【4 j 。近年来, 人脸检测与分割已成为独立的研究课题受到研究者的关注。目前人脸检测有三种 类型:肤色区域分割、基于启发式模型和基于统计模型的方法。肤色分割的局限 4 江苏大学硕士研究生毕业论文 性在于受复杂背景和光照的影响较大。基于启发式模型的方法首先抽取特征,然 后检验是否符合人脸的先验知识。统计模型是把人脸看作一类模式构造分类器, 通过判别图像中区域可能属于哪类模式的方法实现人脸的检测f 9 j 。 2 、人脸特征提取与选择( f a c ef e a t u r ee x t r a c t i o na n ds e l e c t i o n ) 人脸特征提取足从人脸图像中提取出表征该人脸信息的特征,是将现实空问 的图像映射到机器空间的过程1 1 5 j 。人脸的特征具有多样性和唯一性,只有保持这 种多样性和唯一性,才能保证人脸图像的准确描述和谚 别。人脸图像信息数据量 巨大,为了提高检测和识别的运算速度,提高图像传输和匹配检索速度,必须对 图像进行数据压缩,降低向量维数,即用尽可能少的数据表示尽可能多的信息。 人脸特征提取与选择即:在提取人脸特征的同时,也实现了对原始图像的数据降 维。 3 、人脸识另u ( f a c er e c o g n i t i o n ) 人脸识别就是将待识别的人脸与己知人脸进行比较,得出相似程度的相关信 息l l 。这里所指的人脸识别是狭义的识别,是统称的广义人脸识别的一个子过程。 人脸识别又分为两类:一类是人脸确认( f a c ev e r i f i c a t i o n ) ,它是一对一进行图像 比较( i m a g ec o m p a r i s o n ) 的过程,回答“你是不是你本人? ”的问题( a r ey o uw h o y o us a yy o ua r e ? ) 。另一类是人脸辨认( f a c ei d e n t i f i c a t i o n ) ,它是一对多进行图像 匹配比对( m a t c h i n g ) 的过程,回答“你是谁? ”的问题( w h oa r ey o u ? ) 。人脸确认 是人脸辨认的简单化,人脸辨认比人脸确认要复杂困难得多,因为人脸辨认系统 涉及到大批量数据的比对。在海量数据的检索比对中,识别率和检索时间是至关 重要的指标,因而这一过程的核,i i , 是选择适当的人脸特征表示方式和匹配策略。 人类具有很强的人脸识别能力。研究发现,婴儿己经可以很快学会辨认其父 母的脸。但对计算机来说,进行人脸识别则困难地多。这种困难一方面源于计算 机本身学习能力的局限性,另一方面是源于人脸识别技术所具有的复杂性。人脸 具有相对稳定的特征和结构,这为人脸识别技术带来了实现的可能1 1 7 】。但人脸具 体形态的多样性和所处坏境的复杂性又造成了识别的巨大困难。具体困难表现 在: 1 人脸的相似性 所有的人脸都具有相似的结构,在纹理上也比较接近,因而构成了一种在空 间上极为接近的类别。人脸识别系统只能利用不同人脸之间的细微差别来实现正 确识别的任务。 2 人脸的刚体性 ( 1 ) 姿势:在人脸图像摄取中,由于照相器材、人的主观因素或实际条件限 制,很容易造成人的姿势变化,进而造成人脸的姿势差异。( 2 ) 脸部结构成分缺 5 江苏大学硕士研究生毕业论文 损:鉴于各种实际需要,人脸可能佩戴眼镜、蓄留胡须、化妆等,而人脸的这些 外部结构成分是不固定的、随意的,对人脸识别造成很大的困难。比如识别留有 胡须的拉登与剃光胡须的拉登是有困难的。( 3 ) 面部表情:人体喜、怒、哀、乐 等面部表情的变化会造成人脸特征的显著变化,对识别算法提出了更高的要求。 3 图像获取的不确定性 图像的畸变:由于光照、视角、摄取角度不同,可能会造成图像的灰度畸变、 角度旋转等。降低了图像的质量,增大了识别难度。 4 年龄变化 老化是一个不可避免的过程,随着年龄的增长,人脸的外貌会产生很大的变 化,老化的原因是多方面的,有些方面是不可控制的,主要来自于遗传因素的影 响,而另一些方面是可以控制的,主要来自于社会的因素,比如说抽烟、压力以 及生活方式。在多种因素的综合影响下,不同人的老化程度也呈现不同的效果。 这就要求人脸识别不仅要解决同一个人同一时期、在不同环境下摄取的存在噪 音、旋转、畸变等的人脸图像的识别问题,还要解决同一个人在不同时期( 跨度 时间长达l o 年) 、不同环境下摄取的人脸图像的识别问题。 5 小样本问题 人脸识别中一个突出的问题是人数会非常多而每个人能提供的训练样本又 很少。这将会带来一系列的问题:( 1 ) 本身每个人只有少数的训练图像,特征提 取算法所获得的信息将十分有限,这样系统的识别率将很难提高;( 2 ) 由于每个 人只有少数训练图像,很多现存优秀的特征提取算法如l d a ,将无法使用;( 3 ) 当类的数量达到一定程度,系统将很难获得高的识别率。近几年来,小样本问题 也逐渐引起了研究者的兴趣,研究者提出了他们各自的解决方案l 盼1 2 l 。但是当 类的数量达到一定程度的时候,这些方法的效率往往就会受到限制。- 此外,人脸识别技术的研究同时涉及到计算机视觉、模式识别、人工智能、 生理学、心理学等诸多学科。这些使得人脸识别技术成为一项极富挑战性的研究 课题。 近几年来,关于人脸识别方法的研究取得了很大的进展,各种新方法新思路 层出不穷。但由于人脸图像获取过程中的不确定性和人脸模式的多样性,目前人 脸识别的效果与实际应用的要求仍然有较大的差距。应当指出所有的算法都是在 一定的假设和条件下取得的,不可能有在所有的情况下都有很高识别率的算法。 例如有些算法对光照变化鲁棒,可能在姿态变化时识别率低。如果将人脸检测独 立出去,人脸识别方法包括特征抽取方法及其相应的分类器设计。这二者中特征 抽取的研究又是人脸识别研究的重点。下面介绍几类常用的人脸识别的方法。 1 基于线性投影的方法 6 江苏大学硕士研究生毕业论文 线性投影的方法目前依然是人脸识别中最具影响力的主流方法。这类方法是 将一幅人脸图像看成一个矩阵,通过矩阵变换或线性投影,来抽取人脸的代数特 征,并以此来进行识别。其中最重要的方法是特征脸方法和f i s h e r 脸方法【1 3 1 。 f i s h e r 准则在线性投影分析中起着极其重要的作用。线性鉴别分析的基本思 想最早是由f i s h e r 在1 9 3 6 年提出削m l ,其目的是选择使得f i s h e r 准则函数达到 极大值的向量作为最佳投影方向,从而使得样本在该方向上投影后,达到最大的 类间离散度和最小的类内离散度。在f i s h e r 思想的基础上,w i l k s 和d u d a 分别 提出了鉴别矢量集的概念,即寻找一组鉴别矢量构成子空间,以原始样本在该子 空间内的投影矢量作为鉴别特征用于识别。该方法被称为经典的f i s h e r 线性鉴别 分析方法。目前该方法仍然广泛应用于人脸识别等领域。除了经典的f i s h e r 线性 鉴别分析方法外,在1 9 7 5 ,f o l e ya n ds a m m o n0 5 1 6 1 提出了另一种基于f i s h e r 准 则的线性鉴别法( 简称为f s l d ao 该方法旨在找到一组满足正交条件的最佳鉴 别矢量集用于特征抽取。f s l d a 用迭代的方法寻找最佳鉴别矢量集,每次要重 新计算散布矩阵,算法复杂速度较慢,并且抽取的特征之间是统计相关的。 最近,金忠和杨静字等人【1 7 叫9 1 从统计不相关的角度,提出了具有统计不相 关性的线性鉴别分析方法( u l d a ) 。与f o l e y s a m m o n 鉴别矢量集不同的是,具有 统计不相关性的最优鉴别矢量集是满足共轭正交条件的。但u l d a 在初期给出 的求解最佳鉴别矢量集的算法也较为复杂,后来杨健等人证明在f i s h e r 准则函数 所对应的广义特征方程的特征值互不相等的条件下,u l d a 与经典的l d a 是等 价的。j y a n g 和j yy a n g l l 9 j 的相关研究指出,f i s h e r 准则函数对应的广义特征方 程一定存在一组“不相关”的特征向量,使用这组特征向量抽取出的特征分量间 自然是不相关的。换句话说,直接从一个广义特征方程出发,就可以得出整个不 相关鉴别矢量集,这样的处理不仅计算高效,而且也不用考虑是否存在特征值相 等的情况。 人脸识别在训练样本数较少时,是一个高维小样本问题,类内总体散度矩阵 是奇异的,不能直接使用l d a 求解。大量的研究解决这一棘手的奇异性问题, 其中最具影响的方法是p e t e rn b e l h u m e u r 等等提出的f i s h e r f a c e s l l 3 j 方法。 f i s h e r f a c e s 方法为了避免奇异性问题,将特征抽取分为两个阶段进行,即 p c a + l d a ,线性鉴别分析在p c a 变换后的空间内进行。b e l h u m e u r 在h a r v a r d 大学和y a l e 大学的人脸数据库上的测试结果表明,f i s h e r f a c e s 方法优于 e i g e n f a c e s 方法。后来,c h e n gj u n l i u l 2 0 1 等人改进了b e l h u m e u r 的方法,提出了 增强的线性鉴别模型( e f m ) 。c h e n gj u nl i u l 2 0 】认为,k l 展开后过小的特征信 含有较多的干扰信息,不利于随后的鉴别处理,建议在p c a 阶段只保留少量的 较大特征值对应的主分量信息,舍弃大部分的次分量信息。 7 江苏大学硕士研究生毕业论文 总之,基于主分量分析的特征脸方法、f i s h e r 准则下的各种鉴别分析方法在 人脸识别领域有着广泛而深远的影响,至今仍有不少自动人脸识别系统直接或间 接地使用这些方法。 2 基于核的非线性投影鉴别分析方法 “核技巧”( k e r n e lt r i c k ) 最早是在支持向量机( s u p p o r tv e c t o rm a c h i n e s ,s v m ) 的研究中提出的1 2 1 o 基于s v m 的理论和方法已经用于人脸检测和人脸识别领域。 g u 0 1 2 2 1 运用支持向量机进行人脸识别,在o r l 人脸图像库上取得了较好的效果。 基于核的主分量分析( k p c a ) 方法和基于核的f i s h e r 鉴别分析方法( k f d a ) 是p c a 和l d a 的核推广,b a u d a t 与a n o u a r 提出了针对多类分类问题的k f d 方法1 2 3 j , m i n gh u a n gy a n g t m 讨论比较了基于核技巧的特征脸方法和f i s h e r 脸方法。j i a n y a n g 等人提出了k p c a + k f d 的应用框架【2 5 1 ,在该框架下的核鉴别分析可利用 两类鉴别信息,一类在类内散布矩阵( 指实施k p c a 变换后的类内散布矩阵) 的零 空间上得到,另一类在类内散布矩阵非零空间中得到。高秀梅提出了核 f o l e y s a m m o n 鉴别分析( k f s d a ) 方法【2 6 l ,徐勇1 2 7 】等人从所有训练样本中选取少 量的“显著 训练样本集,对核方法的特征抽取效率有较大提高。 核方法的基本思想是将原特征空间中的样本通过某种形式的非线性映射,变 换到一个高维甚至无穷维空间,并借助于“核技巧”在新的空间中应用线性的分 析方法求解。由于新空间中的线性方向对应于原特征空间的非线性方向,所以基 于核的鉴别分析得出的鉴别方向也对应原特征空间的非线性方向,基于核的鉴别 分析是一种原始空间的非线性鉴别分析方法。相对于其它非线性方法,这种方法 的独特和关键之处在于它巧妙地借助“核函数” 2 1 1 进行样本间的内积运算,随后 对生成的核样本向量进行相应的线性运算求取鉴别矢量集,而不需要求出原始特 征空间样本进行非线性映射后的形式,使褥它优于普通的非线性鉴别分析方法。 非线性的核方法也有一些弱点。首先是几何意义不明确,经过核变换以后我 们无法知道样本变成了什么,核参数选取没有相应选择标准,大多数时候只能采 取试算和经验选取参数,不适合大训练样本的情况,经过核变换以后,样本的维 数等于训练样本的个数,如果训练样本数很大,核样本向量维数很高,将遇到计 算量上的难题。 3 其他的人脸识别方法 基于弹性模型的方法:b u h m a n n 【2 8 j ,l a d e s l 2 9 1 等针对畸变不变性的物体识别提 出了动态连接结构模型( d y n a m i cl i n ka r c h i t e c t u r e ,d l a ) ,将物体的图像用稀疏 网格图形来表达,通过局部能量谱的多分辨率描述来标注图形上的一些端点,用 几何距离向量来标注连线。目标识别就是测试样本与训练样本的弹性匹配的过 8 江苏大学硕士研究生毕业论文 程,即通过匹配代价函数的随机优化来完成。d l a 方法对于8 7 个人的样本集, 获得了9 0 以上的识别率,这些样本包含多种变形,如表情变化、旋转等。虽然 d l a 方法具有较好的识别效果,但是代价函数最优化的计算量较大。 基于神经网络的方法:人工神经网络由于其固有的并行运算机制以及对模式 的分布式全局存储,故可用于模式识别,而且不受模式形变影响。用于人脸识别 的神经网络方法可训练有较强噪声和部分缺损的图像,这种非线性方法有时比线 性方法更有效。最早应用神经网络进行人脸识别工作的是k o h o n e n l 3 0 l ,利用网络 的联想能力回忆人脸,当输入图像噪音很多或部分图像丢失时,也能回忆出准确 的人脸。r a n g a n a t h 和a r u n 提出了用于人脸识别的径向基函数网络,l i n 等提出 了用于人脸检测、眼睛定位与人脸识别的基于概率决策的神经网络,l e e 等提出 了用于人脸识别的模糊b p 网络,l a w r e n c e 提出了用于人脸识别的卷积神经网络。 基于隐马尔可夫模型的方法:隐马尔可夫模型( h i d d e nm a r k o vm o d e l ,h m m ) 在语音识别等方面取得了很好的效果。近年来,研究工作者将这种方法运用到人 脸识别和人脸检测当中。用隐马尔可夫模型对人脸进行描述和识别,不是孤立地 利用各个器官的数值特征,而是把这些特征和一个状态转移模型联系起来。 s 锄撕a 1 3 l j 最早提出了关于人脸的隐马尔可夫模型,他用一个矩形窗从上到下采 样人脸图像,将窗内的像素点排成列向量,用灰度值作为观察值。近年来,s a m a f i a 的方法进一步得到改进,提出了基于2 d d c t 的特征抽取方法,用3 9 个2 d d c t 系数作为观察序列,代替灰度观察序列。这在一定程度上解决了s a m a x i a 方法要 求大存储空间的不足。刘小军1 3 2 j 等人提出了将奇异值分解与隐马尔可夫模型相结 合的人脸识别算法。 独立成分分析( ( i c a ) :i c a 方法假设数据由若干独立源信号融合而成,并力 求分析出这些独立源信号,i c a 在盲信号分离方面得到了成功的应用【”】。独立分 量分析用了数据的二阶和高阶统计信息,还能消除高阶相关性。b a r t l e t t 等【3 4 ,3 5 】 采用i c a 方法识别人脸,获得了比p c a 方法更好的识别效果。i c a 与p c a 相 比,有两个优势:一是相比p c a 只能提取人脸图像中二阶统计特征,i c a 获得 的独立分量能够更有效地提取人脸图像中的高阶统计信息;二是i c a 获得的一 组矢量比本征矢量更具空i 、日j 局部描述性,能抽取人脸的局部特征。但i c a 的缺 点是速度很慢,不能满足实时性要求。 多种特征的融合及多分类器组合的方法:人数众多、人脸结构的相似性以及 人脸图像变化的多样性,决定了用一组特征一种分类器不能取得满意的识别率, 人们试图将多种方法取长补短

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论