(信号与信息处理专业论文)基于主元分析和神经网络的人脸识别方法研究.pdf_第1页
(信号与信息处理专业论文)基于主元分析和神经网络的人脸识别方法研究.pdf_第2页
(信号与信息处理专业论文)基于主元分析和神经网络的人脸识别方法研究.pdf_第3页
(信号与信息处理专业论文)基于主元分析和神经网络的人脸识别方法研究.pdf_第4页
(信号与信息处理专业论文)基于主元分析和神经网络的人脸识别方法研究.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(信号与信息处理专业论文)基于主元分析和神经网络的人脸识别方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 入黢垂动识瘸楚嚣蘸搂式谈羯领域擎其寄广蠲盛耀蘩豢巍实 际应用价值的热门研究课题。人脸的自动识别就是用计算机对人脸 鞫像迸杼分祈,笄跌久脸图像串提取有效的识剿信惠,用班进行人 脸鉴别的一门技术。 本文提出了一种主元分析和神经弼络相结宙的人脸识别方法。 其中主元分援方法照予提取久验躅像款特征,藤棒经燧终震予慰提 取的人脸特 芷谶行识别。 蓄先,采惩主元分舞法提取大验嚣豫静有效特征。圭元分掇法 怒模式识别中的一种行之有效的特征提取方法。其基本思想是:高 壤静入脸图像空闻缎过k l 交换爝得虱一缀新静正交蒺,由这些正 交基可以组成低维线性空闻。本文以训练样本集的总体散布缒阵作 为产生矩阵,以总体散布矩阵的特征向鬣作为人脸空瀚,由予对应 予梅缝傻越大瓣特摄彝量瓣入验黧像弱嚣献率凝越大,为了瓷效地 压缩人脸特征冉勺维数,本文去掉了较小特征值对应的特征向殿,然 器,凳簿一辐久验强豫投影到鑫较大特髹蓬慰巍懿特,媛彝耋掰强残 的空间中其投影系数向量即为所提取的人脸特征。 然稽,分鄹采溺b p 神经弼络和径囱基函数( r b f ) 神经网络 进行人脸识别。神经网络作为一种新的方法体系,具露较强的自适 应性,这使得它的_ | 菠用极为广泛,特别慰它的朗适应学习能力在模 式识别方匿表现褥梵为突嫩。 传统的b p 神经网络惑一种基于误麓反向传播算法的多层前馈 耱经瓣终,象已或为器蔫纛霜最建广泛瓣秘经阏终。挺弱辩传统懿 b p 神缎网络也存在赣一些缺陷,例如由于采用梯度算法,b p 神经 网络韵调练速度校侵,蔼越容荔麓入弱都援,j 、点等。为魏,本文撼 燃了种改进的b p 棒经嘲络并把它甩予人脸识别,并与传统的b p 神经嘲络进行了入脸识别的比较。实验证明,改迸磁的b p 网络有 效蟪克服了传统b p 神缀网络的一些缺陷。男终,本文用径向基函 数神经网络作为分类器进行人脸识别,并与b p 神经网络进行了比 较。露对,为说绢本文掰提密瓣方法戆优越往,本文分瘸把b p 糖 经网络和径向基函数神疑网络的识别结果与最近邻距离分类器的 谖掰绪莱送行了辩晓。 本文提出和采用的所有算法,都在f d b 6 0 3 人脸图像库上进行 了赏验。f d b 6 0 3 是南京理工犬学模式识剐与人工智能实验室的一 个较大规模的人黢匿像麾。f d b 6 0 3 鞠像库中一共9 6 人,每人1 0 幅阕像,总图像数为9 6 0 幅。本文从人脸图像库中随机抽取3 0 个 入筵3 0 0 辆入验濒像,其孛每令久帮舂1 0 糨夔部强像,对于每一 个人的这1 0 幅圈像,选取其中的7 幅图像作为训练样本,另外3 福瀚豫终为谈嗣祥率,舞在爨谖羁样零豹蒸礁主翻入离颓噪声,构 成新的识别样本。在特征提取之前,本文对这3 0 0 幅人黢图像进行 了i 翩一化预处理,部分琏消除入脸图像因必寸大小、角魔旋转、光 照强弱带来的不剩影响。 实验结果表明,本文提出的主元分析和神经删络相结合的方法 进褥人黪谖裂取褥了藏好懿效莱。戴方法嶷鸯较溅楚壹逶瘦毽、较 快的识别速度、较高的识别率以及时噪声的鲁棒性。 关键词:人脸识剐,神经两络,主冠分析,模式识别 u a b s t r a c t a u t o m a t i ch u m a nf a e r e c o g n i t i o n ,w h i c hh a saw i d er a n g eo f p o t e n t i a la p p l i c a t i o n s ,i sa na c t i v er e s e a r c ha r e ao f 口a t t e r n r e c o g n i t i o n i t i st h e t e c h n o l o g y o fp a t t e r n r e c o g n i t i o n ,w h i c h i s c o n c e r n e dw i t h a n a l y z i n g f a c i a l i m a g e s ,e x t r a c t i n gu s e f u l i n f o r m a t i o nf o rr e c o g n i t i o na n d a u t h e n t i c a t i n gh u m a n s i nt h i s t h e s i s ,a na p p r o a c ht h a tc o n n e c t sp r i n c i p a lc o m p o n e n t a n a l y s i s ( p c a ) w i t hn e u r a l n e t w o r k si s p r o p o s e d a n di su s e di n h u m a nf a c er e c o g n i t i o n ,p c ai su s e di n e x t r a c t i n gt h ef e a t u r e so f f a c i a l i m a g e s ,a n dan e u r a ln e t w o r ki su s e df o rt h ec l a s s i f i c a t i o no f t h ef a c i a li m a g ef e a t u r e s f i r s t ,t h ee f f e c t i v ef e a t u r e sa r ee x t r a c t e db yp c a p c ai sav e r y e f f e c t i v ef e a t u r ee x t r a c t i n gm e t h o di np a t t e r nr e c o g n i t i o n t h eb a s i c i d e ao ft h em e t h o di st h a th i g hd i m e n s i o n a ls p a c eo ff a c i a li m a g e si s t r a n s f o r m e dt oag r o u po fn e wo r t h o n o r m a lb a s e sb yk a r h u n e n l o e v e 装l ) t r a n s f o r m ,o fw h i c hl o wd i m e n s i o n a la n dl i n e a rs p a c ei sm a d e u p i n t h i st h e s i s ,t h et o t a l s c a t t e r i n gm a t r i xo ft h es e t o ft r a i n i n g s a m p l e si su s e dt of o r mt h ep r o d u c t i o nm a t r i xa n di t sf e a t u r ev e c t o r s a r eu s e da sf a c i a ls p a c e + b e c a u s et h eb i g g e re i g e n v a l u er e l a t e dt ot h e e i g e n v e c t o r ,t h eg r e a t e ri t sc o n t r i b u t i o nr a t et ot h ef a c i a li m a g e s ,t h e e i g e n v e c t o r sr e l a t e dt os m a l le i g e n v a l u e sa r ed i s c a r d e di nt h i st h e s i s i no r d e rt oc o m p r e s st h ed i m e n s i o no ff a c i a lf e a t u r e sm o r ee f f e c t i v e l y c o n s e 鞋e 矗l y ,e v e r y f a c i a l i m a g ei sp r o j e c t e dt o t h es p a c et h a ti s e x t e n d e db yt h ee i g e n v e c t o r sr e l a t e dt ob i g g e re i g e n v a l u e s ,a n dt h e v e c t o r so f p r o j e c t e dc o e f f i c i e n t sa r ej u s tt h ee x t r a c t e df a c i a lf e a t u r e s t h e n ,b a c k - p r o p a g a t i o n ( b p ) n e u r a l n e t w o r ka n dr a d i a lb a s i s f u n c t i o n ( r b f ) n e u r a ln e t w o r ka r e u s e dt o r e c o g n i z ef a c i a li m a g e s m r e s p e c t i v e l y a san e wm e t h o d o l o g ys y s t e m ,n e u r a ln e t w o r kh a sv e r y s t r o n gs e l f - a d a p t a b i l i t y t h e r e f o r e ,i th a sb e e nu s e dw i d e l yi nm a n y f i e l d s ,e s p e c i a l l yi np a t t e r nr e c o g n i t i o n t r a d i t i o n a lb pn e u r a ln e t w o r ki sa m u l t i l a y e r f e e d - f o r w a r d n e t w o r kt h a ti sb a s e do ne r r o rb a c k p r o p a g a t i o na l g o r i t h ma n dh a s t h ew i d e s t a p p l i c a t i o n a l t h o u g ht r a d i t i o n a l b pn e u r a ln e t w o r ki s s u c c e s s f u l , i th a ss o m e d i s a d v a n t a g e s f o r e x a m p l e , i t s l e a r n i n g c o n v e r g e n tv e l o c i t y i s s l o w ,p o s s i b i l i t y o f c o n v e r g i n g t oal o c a l m i n i m u mi s h i g h a n ds oo n t h e r e f o r e ,a n i m p r o v e d b pn e u r a l n e t w o r ki s p r o p o s e di n t h i st h e s i sa n di su s e di nf a c i a l r e c o g n i t i o n a n di ti sa l s o c o m p a r e dw i t h t r a d i t i o n a lb pn e u r a ln e t w o r ki nt h e a s p e c t o ff a c i a l r e c o g n i t i o n e x p e r i m e n t a l r e s u l t ss h o wt h a tt h e i m p r o v e db pn e u r a l n e t w o r ko v e r c o m e ss o m ed i s a d v a n t a g e so ft h e t r a d i t i o n a lb pn e u r a ln e t w o r ke f f e c t i v e l y m o r e o v e r ,i nt h i st h e s i s , r b fn e u r a ln e t w o r ki su s e da st h ec l a s s i f i e ri nf a c i a lr e c o g n i t i o na s a na l t e r n a t i v e ,a n dt h ee x p e r i m e n tr e s u l t sa r ec o m p a r e dw i t ht h a to f b pn e u r a ln e t w o r k a tt h es a m et i m e ,i no r d e rt os h o wt h ea d v a n t a g e o ft h ep r o p o s e da p p r o a c h ,e x p e r i m e n tr e s u l t so ff a c i a lr e c o g n i t i o nb y b pn e u r a ln e t w o r ka n dr b fn e u r a ln e t w o r ki sc o m p a r e dw i t ht h a to f t h en e a r e s t d i s t a n c ec l a s s i f i e r a l lp r o p o s e da p p r o a c h e si nt h i st h e s isa r ee x p e r i m e n t e do nt h e f d b 6 0 3f a c i a li m a g ed a t a b a s e f d b 6 0 3i sal a r g e r s c a l ef a c i a li m a g e d a t a b a s et h a ti s p r o v i d e db yt h el a b o r a t o r yo fp a t t e r nr e c o g n i t i o n a n da r t i f i c i a l i n t e l l i g e n c e ,n a n j i n gu n i v e r s i t y o fs c i e n c ea n d t e c h n o l o g y t h ed a t a b a s ei n c l u d e sf a c i a li m a g e so f9 6p e r s o n s ,e a c h p e r s o n h a s1 0 i m a g e s ,a m o u n t i n g t o9 6 0o n e s i nt h i st h e s i s ,3 0 p e r s o n ss u m m i n g t o3 0 0i m a g e sa r et a k e no u tr a n d o m l y 7i m a g e so f e a c hp e r s o na r ec h o s e na st r a i n i n gs a m p l e s ,a n dt h er e m a i n d e r sa r e u s e da sr e c o g n i t i o ns a m p l e s g a u s s i o nn o i s ei sa d d e dt ot h eor i g i n a l i v r e c o g n i t i o ns a m p l e st o b eu s e da sn e wr e c o g n i t i o ns a m p l e s b e f o r e f e a t u r ee x t r a c t i o n ,3 0 0f a c i a li m a g e sa r en o r m a l i z e d ,w h i c hp a r t i a l l y r e d u c e st h e d i s 8 d v 鑫羲t 韪g e o u s e f f e c tc a u s e db ys i z e ,a n g l e a n d i l l u m i n a t i o nr o t a t i o n so ft h ef a c i a li m a g e s e x p e r i m e n t a l r e s u l t ss h o wt h a t t h e p r o p o s e da p p r o a c h e o m b i n i n gp c a a n dn e u r a ln e t w o r k sp e r f o r m sb e t t e ri nr e c o g n i t i o no f f a c i a l i m a g e s t h ep r o p o s e d m e t h o dh a ss t r o n g e rs e l f 。a d a p t a b i l i t y , g r e a t e rs p e a d a n dh i g h e rr e c o g n i t i o nr a t e s t r o n g e r r e s i s t a n c et o n o is e k e y w o r d s : f a c e r e c o g n i t i o n , c o m p o n e n ta n a l y s i s , n e u r a ln e t w o r k s ,p r i n c i p a l p a t t e r nr e c o g n i t i o n v 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进 行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何 其他个人或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡 献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人 承担。 论文作者签名:至壹查亟 日 z 牛每 氇j g b 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学校保 留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅 和借阅;本人授权山东大学可以将本学位论文的全部或部分内容编入有关 数据库进行检索,可以采用影印、缩印或其他复制手段保存论文和汇编本 学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:整堑 导师签名:;:l 王4 臣么 期:三翌丝坠业四 第1 章引言 1 1 人脸识别技术的意义和原理 随着社会经济的发展,社会各个方面对快速有效的自动身份验 证的要求日益迫切。由于生物特征是人的内在属性,具有较强的自 身稳定性和个体差异性,因此是身份验证的最理想依据。这其中, 利用人脸特征进行身份识别又是最自然直接的手段,与指纹、虹膜、 d n a 等其它人体生物特征识别系统相比人脸识别系统具有直接、 友好和方便的特点,用户无任何的心理障碍,并且通过表情分析, 还能获得其它识别系统难以获得的一些信息人脸识别技术应用前 景广泛,可用于公安系统的罪犯身份识别、驾驶执照及护照等与实 际持证人的核对、银行及海关的监控系统及保密部门的自动门卫系 统等。 人脸自动识别技术是利用计算机分析人脸图像,并从人脸图像 中提取有效的识别信息,用来“辨认”身份的一门技术。人脸自动 识别技术涉及模式识别、图像处理、计算机视觉、神经网络、生理 学以及心理学等诸多学科,是一个典型的多学科交叉的边缘应用。 人脸识别系统应该能够处理脸部图像的变化,但是人脸图像会受到 年龄、心情、拍摄角度、光照条件、发型等诸多因素的影响,因此, 人脸的自动识别也是极具挑战性的工作。 图i 1人脸识别系统原理图 通常人脸识别系统主要由五个功能模块组成:人脸图像训练 模块、人脸定位模块、预处理模块、特征提取模块和识别模块。人 脸识别系统的原理框图如图1 1 所示。人脸图像训练模块完成对已 有人脸图像库的训练,得到参数以供识别模块使用。它是人脸识别 研究的核心,与所采用的算法有极大的相关性。人脸定位模块完成 从原始图像中确定出人脸的位置,得到人脸图像以便后续处理。在 具体摄像条件可控制时。这一步还可以省略。预处理模块完成对人 脸图像的大小归一化、灰度归一化、消除噪声等,可视具体的应用 情况而选用,以便在同一条件下完成训练和识别。特征提取模块完 成提取人脸特征,如何提取稳定和有效的特征是人脸识别系统成败 的关键。识别模块根据所得到的参数完成对人脸的最后判别工作。 人脸自动识别的研究范围从广义上讲大致包括以下五个方面 的内容【2 】: ( 1 ) 人脸的检测与规范化【3 ,4 5 ,6 7 】:郎从各种不同的场景中检 测出人脸的存在并确定其位置,提取出人脸图像,并校正人脸在尺 度、光照和旋转等方面的变化。这一任务主要受光照、噪声、面部 倾斜度以及各种各样遮挡的影响。 ( 2 ) 人脸表征:即采用某种表示方式表示检测出的人脸和数 据库中的已知人脸。通常的表示方法有几何特征( 如欧氏距离、曲 率、角度) 、代数特征( 如矩阵特征向量) 、固定特征模板等。 ( 3 ) 人脸鉴别( 通常所说的“人脸识别”) ;即将待识别的人 脸与数据库中的已知人脸比较,得出相关信息这一过程的核心是 选择适当的人脸的表征方式与匹配策略,系统的构造与人脸的表征 方式密切相关。 ( 4 ) 表情姿态分析:即对待识别人脸的表情或姿态信息进行 分析,并对其加以归类。 ( 5 ) 生理分类:即对待识别人脸的生理特征进行分析,得出 其年龄、性别等相关信息。 1 2 人脸识别的发展及现状 人脸识别的研究已有很长的历史【,甚至可以追溯到1 9 世纪, g a l t o n 就曾经用一组数字代表不同的人脸侧面特征。人脸识别的输 入图像通常有三种情况:正面、倾斜、侧面。根据实际情况的要求, 对人脸正面模式的研究最多,它的发展大致可分为以下三个阶段。 第一阶段以b e r t i l l o n 、a l l e n 和p a r k e 为代表,主要研究人脸 识别所需要的面部特征。在b e r t i l l o n 的系统中,用一个简单的语 句与数据库中的某一张脸相联系,同时与指纹分析相结合,提供了 一个较强的识别系统。为了提高脸部识别率,a l l e n 为待识别脸设 计了一种有效和逼真的摹写,p a r k e 则用计算机实现了这一想法, 并产生了较高质量的人脸灰度图模型。这一阶段工作的特点是识别 过程全部依赖于操作人员,显然这不是一种可以完成自动识别的系 统。 第二阶段是人机交互式识别阶段。这一阶段的代表性工作有: g o l d s t i o n 、h a r m o n 和l e s k 用几何特征参数来表示人脸的正面图像 一l 。他们采用2 l 维特征向量表示人脸面部特征,并设计了基于这 一特征表示法的识别系统。k a y a 和k o b a y a s h i 则采用了统计识别方 法,用欧氏距离来表征人脸特征,如嘴唇与鼻之间的距离,嘴唇的 高度等。更进一步地,t k a n a d 设计了一个高速且有一定知识导引 的半自动回溯识别系统,创造性地运用积分投影法从单幅图像上计 算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配。 k a n a d 的系统实现了快速、实时的处理,这是一个很大的进步。总 的来说,这些方法需要利用操作员的某些先验知识,仍然摆脱不了 人的干预。 第三阶段是真正的机器自动识别阶段。近十余年来,随着高速 度高性能计算机的发展,人脸模式识别方法有了较大的突破,提出 了多种机器全自动识别系统【10 , 1 。根据人脸表征方式的不同,我 们通常将人脸正面自动模式识别技术分为三大类:基于几何特征的 识爨方法、蒸手代数特缝懿谖裂方法禳基予逐接凝铡靛谖嬲方法。 ( 1 ) 熬于几何特征的人脸难面自动识别方法。这类识别法将 入验蠲一个凡篱特征蠢爨表示,翔模式识爨审痿次蘩类弱蒜怒设诗 分类器达到识别目的。这就要求选取的几何特征向爨具有一定的独 特性。能够反映不同入脸之间鹩差嗣,同时叉具有定的弹牲,以 消除时阀跨度、光照等的影响。几俺特征向蟹是以入脸器富的形状 和几何关系为基础的特征向量,其分塞通常包括人脸指定两点间的 欧氏凝褰、馥奉、燕疫等。壤麴,p o g g i o 帮b r u n e l l i 曩改遴鳇积分 投影法提取出用欧氏距离表征的35 维人脸特征向量用于模式分类 n l 。p o g g i o 帮b r u n e l l i 酌系统获褥了9 0 滚上熬谈爨率。 | 羹稻遥 将b a r o n 的模板隧配法加以改进。设计了一种自动横板匹羁已识别系 统,并与基于几何特征酌识别系统做了性能比较。h u a n g c h u n g l i n 和c h e nc h i n g w e n 使用了另一种凡懈特征掇取枫翩。即采用动态 模板与活动轮廓模型提取出入脸器官的轮廓。动态横板是参数化的 蕊攀霪元楱墼,横擐先骚知识寇义均熬耋丞数及穰廒夔鹜像约束条 件指导其收敛过稷,主簧用于掇取跟踏和嘴融轮廓。而活幼轮廓则 是簸量囊夸纯钓灏线,巍髓耋滋数捂羚其浚簸裂嚣郏逶赛,主要羽 于提取属龟和下巴轮廓。在此_ 之前,y u i l l e 茵先利用动态模板进行 特镊提取,h u a n g cl 翼| j 进一疹提出了用动态模板舄活动轮廓避行 人脸几傍特征细提取的冀法。用动态模板与滔动轮廓提取出的人脸 器官轮廓,对入脸具有较为精确的橘述能力,为几何特,证向量的生 残耔下7 爨实静纂疆。隽癸,g l o r i ac h o w 采用7 自适应鬟夫交抉 与动态模檄相结含的方i 去。同h u a n gc l 类似,动态模板的作用是 撵壤疆瑭麓嘴巴耱薅,褥霍夫变袭裂主要躅予疆患疆球、下巴戆轮 廓。 ( 2 ) 基于代数特铤豹入濂正萄爨动谖剐方法。这类识羽法仍 然怒将人脸用特征向量袭示,只不过用的趋代数特征向蠢;即人脸 图像的表示是在幽“特蜒脸”张成的降维子空间上的投影。s i r o v i c h 窝k i l b y 营先将k l 变换用予入黢圈像懿最饯袭示 t 3 l 。t u r k 和 p e n t l a n d 进步提出了“特征脸”方法【】,该方法以 j l i 缘样本集的 总体散布矩阵为产生矩阵,经k l 变换后得到鞠应的一组特征向 量,称作“特征脸”。这榉,就产生了一个由“特援脸”向量张成 的予空间,每一幅入脸图像向其投影都可以获得一组坐标系数,这 鳃熊标系数表甓了人黢在子空翊孛熟位曩,实验表明这秘方法粪蠢 较强的稳定性,可以作为人脸识别的依据。m a s s i m ot i s t a r e l l i 和 e n r i c og r o s s o 潮谈兔“特征验”法肖一令弱限l 邵l :都虽然验都不 同区域对识别的影响不同,但“特征脸”法却对糕个图像区域( 甚 至臀景) 采用统一的裔分辨率。m a s s i m ot i s t a r e l l i 和e n r i c og r o s s o 采用了以下方法解决这个问题: ( a ) 对数据库中每个人采用个不同的视角,每个视角由p 幅 苓囿夔嚣跨缀成,分剃瓣应不同的脸罄重要特援( 翔骣睛、囔篷黪) ; 这与人脸视觉系统的功能类似:人脸视觉系统就怒通过巍接把观察 赢定整刭验舔繁要特缀豹方式降低绥号的带宽,跌磊减少了楚疆时 间。由每一个视角图片集( j p 幅不同的图片) 产生一个维特征向 璧。计算其与所有对象向量平均值之差:k = 吭一甲,r = 古旷。 其中,m 。n 不同人股类别数目。 9 ) 鼹m 个岛量致俦列,产生铤阵鸯a 。人黢空阉则由蛰方差 矩阵c = a a 7 的特征向量所张成。为了减少运算量,m a s s i m o t i s t a r e l l i 器e n r i c og r o s s o 莰采躅芰分耋黪,珏u ,( 帮去簿小饕缝蓬 对应的特征向擞) 定义人脸空间。然后,计算人腧图像向人脸空间 韵投影,并班魏作为不嗣入验图像静编码:m = u f y ,j = l ,2 ,m 。 由同一个人训练集中的不同规角图盼得到的投影向量取平均,得到 向量q = ( w l ,w :,) 。,将此向登存储在数据霹中,作为此入的 验部标攥特鬣。分类器采用最小( 歉氏) 鼷离分类器,帮蜷德识别 人脸图像的代数特征与数据库中的标准特,征比较,距离最近者即为 掰衷。戴露器簧黯耀蔫蓬设是令上限,著掰褒躐离均太予踅上溪, 则拒识表明该人脸不在数据库中。 ( 3 ) 基于连接机制的人脸正面自动识别方法1 16 t ,1 8 i 。这类识 别法将人脸直接用灰度图( 二维矩阵) 表征,利用了神经网络的学 习能力及分类能力。这种方法的优势在于保存了人脸图像中的材质 信息及细微的形状信息,同时避免了较为复杂的特征提取工作。而 且,由于图像被整体输入,符合格氏塔( g e s t a l t ) 心理学中对人类 识别能力的解释。与前两种识别方法相比,基于连接机制的识别方 法具有两个明显的不同:一是信息处理方式是并行而非串行:二是 编码存储方式是分布式。k o h o n e n 率先运用自相关记忆( 全互联神 经网络) 存储和重建人脸图像。利用简单h e b b 学习律人脸图像 的自相关记忆将被创建并存储在全互联神经网络的权值中。实验表 明。在噪声存在甚至人脸图像被部分遮挡的情况下,该网络能有 效地重建人脸图像。这表明了自相关神经元具有识别能力。 m i l l o w a r d 和o t o o l e 利用的则是w i d r o w h o f f 学习律,同样证明 了自相关神经元具有识别能力。c o t t r e l l 和f 1 e m i n g 采用了不同的 网络拓扑结构一一非线性前馈神经网络。该网络经b p 算法训练后 用于人脸灰度图像的识别。他们采用的前馈式神经网络具有4 0 9 6 个输入神经元,8 0 个隐层神经元,4 0 9 6 个输出神经元。神经元的 激活函数为s i g m o i d 函数。该网络实际上实现了对多幅人脸图像的 压缩编码( 编码信息同样储存在权值中) ,对人脸识别与生理分类 均具有较高的准确率。 基于几何特征的识别法、基于代数特征的识别法和基于连接机 制的识别法在最近十几年中均对“人脸识别”这一研究领域做出了 很大的贡献,同时深化了我们对人类复杂视觉机制的了解,取得了 一定的成功。但是也各有其优缺点。基于几何特征的识别法困难在 于没有形成一个统一、优秀的特征提取标准。由于成人的面部模式 千变万化,即使是同一个人的面部图像,由于时间、光照、摄像机 角度等不同,也很难用一个统一的模式来表达,造成了特征提取的 困难。不过,由于现在各种优秀特征提取算法( 如动态模板、活动 轮廓等) 的提出,使得人脸的几何特征描述越来越充分。而且在表 6 蠢努凝方溅,入黢的足镑穗锺扔然燕簸毒老豹判攒;基予筏羧黪薤 的识别法在实际应用中取得了一定的成功。由于代数特征向量( 即 入黢圈豫肉久验窆阗稳投影) 曩畜一定鹣稳定性,谖巍系统对攀同 的倾斜角度,乃诞不同的表情均有一定的鲁棒性。但是。这也说明 了这种方法对表情豹描述不够充分,难渡搠子表情分析。基予涟接 机制的识嬲法采用了神经网络,结构上更类似于人脑,程编码联缩 与信息处理方式等方面具有一定的优势。但由于潦始灰度图像数据 耋卡分痣犬,噻裁褪经元鼗联逶豢缀多,键练时瓣缀长。男终,宠 全基于神经网络的识别法在现有的计算机系统( 冯诺伊曼结构) 上瞧畜箕内在鹣羁疆卷。劳嚣捧经瓣绣虽然畜较谶约癌缝蘸力,毽 当样本数大量增加时,萁性能有可能会严重下降。总之,人脸识别 困其表征对象的年龄、表情、禳辩等因素鹃哥交髓丽使蒺特征袈述 比较里难,因此,它的识别效果离寅甩还肖较大的距离。今后,人 们将越来越多的借鉴生物生溅模型和生物心理模溅的研究成粜t 班 攒提蹇特薤表达麴鲁壤毪帮蔼持续拣,进嚣提裹识别率。 1 3 本文的主要工作 目前人脸识别的研究可分为几何特征识别的研究方法和企局 特缝谖象兹研巍方法。凡 霉赞薤识粼静方法圭要寿:透器鼹爨、模 板匹配、人脸侧面的特征提取等;黛局特镊识别的主要方法有:自 缎织特镊提取法、等获度线法、神经网络方法等。这鳖方法辩予热 傀提取人脸特祗及提取哪些特征傲了许多的掇索。但在解决自适应 性和特征提取之间韵矛盾上静无长足的进展。为此,本文摄磁了主 嚣分援熬糖经瓣络据缱会魄方法,该方法攘提取人脸特征匏尉畦还 傺持了良好的囱适应性。 弱糙主元分辑方法来撬取入戆靛特鬣,这耱方法蠡麸上令壤纪 九十年代以来一直受到很大的重视,也取得了较好的效果尽管它 本身还存在着一些缺陷,但是由于其简单、快速、易行的特点,并 且从整体上反映了人脸图像的灰度相关性因此,围绕主元分析的 改进方法也不断出现。由于主元分析方法存在易受光照强度影响的 缺点,利用主元分析方法进行特征提取之前,本文用直方图均衡技 术对人脸图像进行了预处理,使人脸图像具有了统一的均值和方 差,部分地消除了光照的影响,修正了图像的灰度直方图。然后就 可以使用主元分析方法对人脸图像进行特征提取了。 人工神经网络是一种非线性动力学系统,它具有良好的自学 习、自组织和自适应能力。因此,人工神经网络被应用到众多的研 究和应用领域之中。特别是它的自适应能力在模式识别方面表现得 尤为突出。为了提高人脸识别系统的自适应性,本文分别采用b p 神经网络和径向基函数神经网络作为分类器进行人脸识别,为了说 明神经网络在人脸识别中的优越性,本文对神经网络和最近邻距离 分类器的识别结果进行了比较。实验结果表明,使用主元分析和神 经网络相结合的方法具有较强的自适应性、较高的识别率和较强的 抗噪声能力。 b p 神经网络是目前应用最为广泛的一种人工神经网络。b p 神 经网络是一种多层的前馈型神经网络,它可以实现任意的线性或非 线性的函数映射,具有较强的自适应性。然而,由于b p 神经网络 是基于梯度下降的误差反向传播算法进行学习的,所以b p 神经网 络也存在着一些缺陷,例如其网络的训练速度通常很慢,而且很容 易陷入局部极小点等。本文针对b p 神经网络存在的一些缺陷,提 出了一些改进的方法,使b p 神经网络的学习步长能够在网络的训 练过程中自适应地调整其大小,从而大大地加快了b p 神经网络的 训练速度。而且还可以使网络在训练过程中跳出局部极小点,到达 全局最小点。另外,本文还对隐层神经元个数的选取以及神经元激 活函数的改进都做了一些探索性的工作。本文提出的这些方法也在 一定程度上加快了网络的收敛速度,同时对b p 神经网络的自适应 性也有一定程度的提高。 1 4 本文的安排 从文章的内容看,论文分为五个部分。首先是论文的引言部分。 主要介绍了课题的研究意义和研究内容,以及人脸识别的发展过程 和本文的主要工作。其次介绍了人脸图像的预处理,并介绍了k - l 变换以及它的一些性质,并用k l 变换进行人脸图像的特征提取。 然后介绍了传统b p 神经网络和它的一些特点以及存在的缺陷,在 此基础上介绍了改进的b p 神经网络,并用改进的b p 神经网络作 为分类器进行人脸识别,并与最近邻距离分类器的识别结果进行了 比较。接着介绍了常用的另一种神经网络一一径向基函数神经网 络,包括它的结构、特点及算法并把它也作为分类器进行人脸识 别,同时也与最近邻距离分类器的识别结果进行了比较。最后对这 两种神经网络的识别结果进行了比较,并对实验结果进行了分析。 第2 章人瞳图像的预处理和特征攫取 2 。 入羧图像鑫每预链理 2 。 。 搬述 瓣辕入围像憋预处壤是人黢识鬟系统中鬃关耋簧的一疹,采怒 基于生元分析的人脸识别方法魑一种纂于图像整体的识别方法,熟 搴蒺 芨赣予鹜豫豹秘关毪,差嚣努毒蓐燕一静溪像统诗方法,入脸瀚 像中所有的像素被赋予了同等的地位,因此同一人脸在不同的尺寸 大小、旋转麓度、光照强发下静差异葳殃到特征空间中裁会存在较 大的差异。为了使识别过程满足主元分柝算法的基本要求,提高人 脸识别系统的识别率,在对人脸图像谶行主冠分析芝前,需要对入 验匿像进学人眼定位、旋转、剪裁、足寸虹一化、灰度癌一化等壤 处理。使所有图像在位鬣上标准化,以达到能置校准、灰发校正的 器豹,鞋酒豫夫羧嚣像鼗足专太小、角度旋转、竞熊强弱带来夔不 利影响。 2 1 2 人脸图像的几何归一化 蜜2 - l爨像羹载毙铡示意匿 人脸豳像的几何归一化可以消除由于尺度放绻、角度旋转造成 的影晌,_ 舀丁以在一定程度上使入脸翻像具裔几何不变往1 朝。假设 人舱圈像豹左右薅眼中心的位爨已经确定,并分别记为笠,和目,如 图2 l 所示。则可以通过以下步骤达到几何归一化的目的: ( 1 ) 进行图像旋转,以使e ,和e l 的连线面万保持水平。这保 证了人脸方向的一致性消除了旋转角度的影响,实现了人脸图像 在图像平面内的旋转不变性。 ( 2 ) 根据图2 - 1 所示的比例关系,进行图像剪裁。如图2 1 所示,设0 点为e ,e l 的中点,且令d = i ,蜀1 。经过剪裁,在2 d 2 d 的 图像内,可保证0 点固定于( o 5 d ,d ) 处。这保证了人脸位置的一致 性,实现了人脸图像在图像平面内的平移不变性。 ( 3 ) 进行图像缩小和放大的变换,得到同一大小的校准图像。 假定校准图像的大小为6 4 6 4 像素点则缩放倍数为口= 2 d “。这 使得d = e ,e l 为定长( 32 个像素点) 。这保证了人脸大小的一致性, 实现了人脸图像在图像平面内的尺度不变性。 经过图像校准,不仅在一定程度上获得了人脸表示的几f - 7 不变 性,而且还基本上消除了头发和背景的干扰。 2 1 3 人脸图像的灰度归一化 在完成人脸图像的几何归一化后,需要对校准图像做灰度拉 伸,以改善图像的对比度,采用直方图修正技术可以使图像具有统 一的均值和方差,以部分地消除光照强度的影响。 灰度直方图是反映一幅图像中的灰度级与出现这种灰度的概 率之间的关系的图形【2 0 1 。灰度直方图是灰度值的函数,它描述了 图像中具有该灰度值的像素的个数,灰度直方图的横坐标表示像素 的灰度级别,纵坐标表示该灰度出现的频率。任何一幅图像的直方 图都包含了可观的信息,某些类型的图像还可以由其直方图完全描 述。因此通过对图像的直方图的修正就可以重新分配各个灰度级的 像素在整个图像中所占的比例。两幅光照强度不同的人脸图像的直 方图如图2 2 所示。 由图2 2 可以看出,图像的直方图清楚地描述了各个荻度级像 素的分布情况。图像的直方图与图像的均值和方差密切相关。图像 的均值和方差分别定义为: 2 志善善刖 ( 2 - 1 ) 盯2 = 击阻( f ,) 一】2 (2-w2)h 鲁鲁。”1 、 一 圈2 2 修正前的直方图图2 - 3 修正后的直方闰 其中,4 ( f ,) 表示图像在像素点( f ) 上的灰度值,矽表示图像的 宽度,日表示图像的高度。图像的均值是反映图像平均亮度的物理 量,而图像的方差则是反映图像亮度变化大小的物理量。如图2 - 2 所示,第一个人脸原始图像的均值为8 9 ,方差为2 0 :第二个人脸 原始图像的均值为l5 9 ,方差为2 0 。如果真接对其进行主元分析 则反映到特征空间中就会存在较大的差异。所以必须进行直方图的 修正。为此本文采用了直方图均衡技术,使人脸图像的灰度值范围 扩展到【0 ,2 5 5 ,则会明显地增强人脸图像的对比度,如图2 3 所 示,并且使图像具有了统一的均值和方差( 修正后的人脸图像均值 为1 2 7 ,方差为7 5 ) ,部分地消除了光照强度的影响。 2 2k - l 变换 k l 变换是k a r h u n e n - l o e v e 变换的简称,这是一种常用的正 交变换2 。对于给定的信号向量工= b ( 1 ) ,善( 2 ) ,x ( ) r ,经过k l 变 换后变为点向量y ,y 的各个分量之间完全消除了相关性,并且y 对x 近似的均方误差为最小。因此,k l 变换被称为最佳变换。它 主要用于一维和二维信号的数据压缩。它可以用较少数量的特征对 样本进行描述以达到降低特征空间维数的目的。 对给定的信号x ( 疗) ,若它是正弦信号,那么不管它有多长,我 们仅需要三个参数,即幅度、频率和相位,即可完全描述它。当我 们需要对x ( n ) 进行传输或存储时,仅需要传输或存储这三个参数。 在接收端,由这三个参数就可完整无误地恢复出原始信号,因此达 到了数据最大限度的压缩。对大量的非正弦信号,如果它的各个分 量之间完全不相关,那么则表示该数据中没有冗余,需要全部传输 或存储;如果x ( n ) 中有相关成分,那么通过去除相关性可以达到数 据压缩的目的。 一个宽平稳的实随机向量工,j = b ( 1 ) ,x ( 2 ) ,x f n ) y ,则它的协 方差矩阵c ,定义为 c ,= e ( ( x 一;) ( x j ) r = lc ,c ? c i lc 1 2 l c 。c ,:刭 , ( 2 - 3 )

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论