




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 基于核fis h e r 判别的人脸识别方法研究 杜世强 摘要人脸识别是生物信息特征识别技术的一个主要方向,与其它生物特征相 比,人脸识别具有主动性、非侵犯性和用户友好等许多优点,在过去的2 0 年中已 经成为计算机视觉、模式识别和人工智能领域的一个研究热点。从最初的基于几 何的方法到基于统计等复杂特征的方法,人脸识别已经发展了很多算法。目前基 于统计特征的线性方法在人脸识别中发展的比较成熟,但是由于人脸识别涉及光 照、表情、姿态等问题,线性方法在实际应用中表现的远远不够。因此,将线性 方法拓展到非线性领域以提高识别率是一个亟待解决的问题。本论文主要研究了 核f i s h e r 判别分析方法( k f d a , k e r n e lf i s h e rd i s c r i m i n a n ta n a l y s i s ) ,重点是线性 f i s h e r 判别算法到非线性方法的拓展。在此基础上,针对某些环节提出了改进算法, 主要工作总结如下: 1 由于线性子空间方法不足以描述实际人脸图像中的表情、光照、姿态等复杂的 非线性变化。核f i s h e r 判别分析既具有核技巧的非线性描述能力,又继承了 f i s h e r 线性判别分析的优点。本文在总结基于核f i s h e r 判别分析人脸识别方法 的基础上,提出引入了核样本集( k e r n e ls a m p l es e t ) 的概念。将k f d a 算法等 价于对核样本集做f i s h e r 线性判别( f d 舢。这样非线性的算法又转化到了线性 算法。实验结果表明它能比线性子空间分析和核主分量分析取得更好的识别 性能。 2 基于对核f i s h e r 判别方法的分析,提出两种增强型核f i s h e r 判别分析模型 ( e k d a - 1 和e k d a 2 ) 。该算法将两种增强型f d a 模型( e f m 1 和e f m 2 ) 引入 到非线性算法中。e k d a 模型在对核样本集进行f d a 处理的过程中,考虑了 过拟合问题,并将f d a 过程等效为对类内和类间散度矩阵的同时对角化。实 验结果表明,增强型核f i s h e r 判别分析模型提高了传统k f d a 算法的识别率, 达到了提取分类信息和压缩特征空间维数的效果。 关键词:线性判别分析,核fis h e r 判别分析方法,核方法, 增强型核f i s h e r 判别分析 a b s t r a c t r e s e a r c ho l lf a c er e c o g n i t i o nt e c h n i q u eb a s e d o nk e r n e lf i s h e rd i s c r i m i n a n t d u s h i q i a n g a b s t r a c tf a c er e c o g n i t i o ni sa ni m p o r t a n tb r a n c ho fb i o l o g i cf e a t u r ei d e n t i f i c a t i o n b e c a u s eo fi t sa d v a n t a g e sc o m p a r i n gt oo t h e rb i o l o g i cf e a t u r e s ,c o n s i d e r a b l ea t t e n t i o n h a sb e e np a i dt of a c er e c o g n i t i o n d u et ot h ei m p o r t a n c eo fh u m a nb e i n gi nt h e m u l t i m e d i ai n f o r m a t i o n ,t h er e c o g n i t i o nb a s e do nm a n sb i o m e t r i c si n f o r m a t i o ni so n e o ft h ei m p o r t a n tt o p i c si nc o m p u t e rv i s i o na n dp a t t e r nr e c o g n i t i o ni n p a s t2 0y e a r s m a n ya p p r o a c h e st o f a c er e c o g n i t i o np r o b l e mh a v eb e e nd e v i s e d ,f r o mt h e e a r l y g e o m e t r yb a s e dm e t h o d st os t a t i s t i c sb a s e dm e t h o d s a l t h o u g hl i n e a rt e c h n i q u e sh a v e b e e nf u l l yd e v e l o p e d ,t h e ya r es t i l li n a d e q u a t et od e s c r i b et h ec o m p l e x i t yo fr e a lf a c e i m a g e sb e c a u s eo ft h ei l l u m i n a t i o n ,f a c i a le x p r e s s i o na n dp o s ev a r i a t i o n h e n c ei t s n e c e s s a r yt oe x t e n dt h el i n e a rt e c h n i q u e st ot h en o n l i n e a ro n e s i nt h i sd i s s e r t a t i o n ,t h e r e s e a r c ht of o c u s e so nk e r n e lf i s h e rd i s c r i m i n a n ta n a l y s i s 1 1 l ee m p h a s i si so nt h e e x t e n s i o n t h ep r i m a r yc o n t r i b u t i o n sa n do r i l g i n a li d e a si n c l u d e di nt h i sd i s s e r t a t i o na r e s u m m a r i z e db e l o w : 1 b e c a u s ei ti s i n a d e q u a t ef o rl i n e a rs u b s p a c ea n a l y s i sm e t h o d st od e s c r i b et h e c o m p l e xr e l a t i o n so fr e a lf a c ei m a g e s ,s u c ha sp o s e ,i l l u m i n a n t ,e x p r e s s i o n v a r i a t i o n s k e r n e lb a s e df i s h e rd i s c r i m i n a n ta n a l y s i s ( 豳删i sp r o p o s e df o r f a c er e c o g n i t i o n 。w h i c hc o m b i n e st h en o n l i n e a rk e r n e lt r i c ka n df i s h e rl i n e a r d i s e r i m i n a n ta n a l y s i s ( f d a ) a c c o r d i n gt ot h ea l g o r i t h mo fk e r n e lf i s h e r d i s c r i m i n a n ta n a l y s i s ( g r d a ) ,ac o n c e p t ,n a m e dk e r n e ls a m p l es e t , i si n t r o d u c e d b a s e do i lt h i sc o n c e p t ,k f d ai se q u i v a l e n tt op e r f o r m i n gf d a o nk e r n e ls a m p l es e t t h e nt h en o n l i n e a ra l g o r i t h mi sc o n v e r t e dt oal i n e a ro n e ag r e a td e a lo fr e s e a r c h h a sb e e no nl i n e a ra p p r o a c h e s a n dt h ek e r n e ls a m p l es e te x t e n d st h el i n e a rm e t h o d s t on o n l i n e a ro n e st h a tc a ni m p r o v et h er e s u l t e x p e r i m e n t a lr e s u l t ss h o wt h a ti tc a n g i v eh i g h e ra c c u r a t er e c o g n i t i o nr a t et h a nl i n e a rs u b s p a c ea n a ly s i s m e t h o da n dk p c 九 2 t w oe n h a n c e dk e m e lf i s h e rd i s c r i m i n a n tm o d e l s ( e k d a - 1a n de k d a 2 1a r e p r o p o s e dw h i c hu s eas t r o n gc o m b i n a t i o no fe n h a n c e df d aa n dk e r n e lt r i c k s i t 1 1 1 a b s t r a c t t a k e st h eo v e r - f i t t i n gd i l e m m ai n t oa c c o u n t ,a n dd i a g o n a l i z e st h ew h t h i nc l a s sa n d b e t w e e nc l a s ss c a t t e rm a t r i xs i m u l t a n e o u s l y e x p e r i m e n t a lr e s u l t ss h o wt h a tt h e p r o p o s e dm e t h o dh a sa ne n c o u r a g i n gp e r f o r m a n c ec o m p a r e dw i t hf d a a n de f m k e y w o r d s :l i n e a rd i s c r i m i n a n ta n a l y s i s ,k e r n e lf i s h e rd i s c r i m i n a n ta n a l y s i s ,k e r n e l m e t h o d ,e n h a n c e dk e r n e lf i s h e rd i s c r i m i n a n ta n a l y s i s i v 学位论文独创性声明 本人声明所呈交的学位论文是我在导师的指导下进行的研究工作及取得的 研究成果。尽我所知,除文中已经注明引用的内容外,论文中不包含其他个人 已经发表或撰写过的研究成果,也不包含为获得陕西师范大学或其它教育机构 的学位或证书而使用过的材料。对本文的研究做出重要贡献的个人和集体,均 已在文中作了明确说明并表示谢意。 作者签名:日期:出丑虚= 学位论文使用授权声明 本人同意研究生在校攻读学位期间论文工作的知识产权单位属陕西师范大 学。本人保证毕业离校后,发表本论文或使用本论文成果时署名单位仍为陕西 师范大学。学校有权保留学位论文并向国家主管部门或其它指定机构送交论文 的电子版和纸质版;有权将学位论文用于非赢利目的的少量复制并允许论文进 入学校图书馆、院系资料室被查阅;有权将学位论文的内容编入有关数据库进 行检索;有权将学位论文的标题和摘要汇编出版。 作者签名:当竺至! 兰望锣日期驴咝:垒: 第一章绪论 第一章绪论 计算机人脸识别技术是一个牵涉到模式识别、图像处理、计算机视觉、心理 学以及认识科学等诸多方面的课题,并与基于其他生物特征的身份鉴别方法以及 计算机人机感知交互领域都有密切联系。在过去的2 0 年内,众多的研究者提出 了很多人脸识别的方法,并在不同的人脸数据库上进行了测试。 与指纹、视网膜、虹膜等其他的人体生物特征识别系统相比,人脸识别系统 更加直接、友好。2 0 世纪9 0 年代以来,因为其在安全验证系统、视频会议、人机 交互等方面有巨大的应用前景,人脸识别正越来越成为当f 订模式识别与和人工智 能领域的一个研究热点。尽管在理论研究方面已经取得很多的成果,但是在实际 应用中还是面临很多问题。如人脸表情丰富;人脸随年龄增长而变化;人脸所成 图像的光照、成像角度及成像距离都给正确识别带来了困难。另外,人脸识别还 涉及到图像处理、人体科学、计算机视觉、模式识别和神经网络等学科,也和人 的大脑对事物的认识程度紧密相关。这诸多因素使得人脸识别仍是一个极富挑战 性的课题。 1 1 人脸识别技术的历史发展 人脸识别的研究已经有很长的历史,早在1 9 世纪后期法国人f r a n c i sc a l t o n 就曾对此问题进行了研究,他用一组数字代表不同的人脸侧面特征来实现对人脸 侧面图像( p r o f i l e ) 的识别。一直到2 0 世纪9 0 年代以前,典型的人脸识别技术始 终是用人脸正面( f r o n t a ls i d e ) 或者侧面的特征点之间距离度量,而且早期的人脸识 别多集中在对侧影图像的研究。 计算机人脸识别技术是近2 0 年才逐渐发展起来的。9 0 年代更成为科研热 点。仅1 9 9 0 年到1 9 9 8 年之间,e i 可检索的相关文献就多达数千篇。 h a r m o n 等人利用与g a l t o n 类似的方法识别人脸,他采用9 个基准点表征 侧影在此基准点上导出一组特征,如基准点之间的距离和角度,由基准点形成的 三角区域的面积等,然后利用特征之间的归一化欧式距离进行识别。其后期的工 作又增加了两个基准点和一些新的特征,而且人脸侧影轮廓曲线可从侧影图像中 的自动抽取得到。k a u f m a n 和b r e e d i n g 也设计了一个对人脸侧影进行识别的系 统,他们采用基于特征的方法,其中特征为极坐标形式的自然相关函数的系数。 同时对动量不变性特征也进行了实验。b a y l o u 等人选择了1 0 个特征点对人脸侧 影进行识别。w u 和h u a n g 则采用三次b 样条函数抽取进行匹配识别。 第一章绪论 l a p r e s t e 等人利用距离探测器来获得人脸侧影图像并从中抽取特征点,然后 用欧式距离对人脸进行匹配。l e e 和m i l i o s 同样利用距离图像来匹配两幅人脸侧 影的相似特征。 由于侧影识别对获取图像的约束较多,人们逐渐转向对正面人脸的识别研究。 最早的半自动正面人脸识别系统由b l e d s o e 于2 0 世纪6 0 年代提出。在该 人脸识别系统中,首先由操作员定出面部特征点并将其位置输入计算机,给定 这些特征点之间的距离,采用最近邻原则或者其他分类规则即可识别出待识别 的人脸。由于特征提取是由人来完成的,该系统对人脸的旋转,倾斜等变化不 太敏感。k e l l y 对b l e d s o e 的系统进行了改进。他采用了一种从上到下的分析方 法从图像中自动抽取头部和身体的轮廓,然后应用一些启发式的方法搜索眼睛、 鼻子和嘴的位置。在这个人脸识别系统中主要用到的距离测度包括:头的宽度, 两眼之间,头顶和眼睛之间,眼睛和鼻子之间,鼻子与嘴之间的距离。k a y a 和 k o b a y a s h i 采用统计的识别方法,用欧式距离来表征人脸特征,用人脸的9 个显 著特征组成特征向量,包括内眼宽度,外眼宽度,鼻子宽度,嘴的宽度,鼻尖 处脸的宽度,鼻子与眼睛中间处脸的宽度,下唇与下巴之间的距离,上唇与鼻 子的距离以及嘴唇的高度,然后根据这些特征值及其估计建立分类器,对每个 特征根据其统计行为确定一个变化阈值,根据图像特征向量之间的绝对范数进 行分类。b u h r 采用3 2 个原始特征和1 2 个辅助特征进行识别,其中原始特征2 1 个距离特征4 个坐标差分特征,4 个三角形面积特征,2 个距离比例特征以及2 个特殊特征( 两眼的面积) ,然后利用线性判决树决定最佳匹配。其他采用非欧式距 离表征人脸特征的还有:c a m p b e l l 用最小二乘法实现最佳匹配,r i c c a 用聚类技 术进行最佳匹配等。 k a n a d e 设计了一个高速的且有一定知识引导的识别系统”1 ,他创造性地运用 积分投影法从单幅图像上计算出一组人脸几何特征参数,再利用模式匹配技术 与标准人脸相比较。k a n a d e 的特征点定位工作有两个阶段,首先利用粗分辨率 差分图像的积分投影确定眼睛鼻子和嘴的大致位置,然后再高分辨率图像上将 人脸分为左眼,右眼,鼻子和嘴四个区域,从中抽取1 6 个脸部特征组成特征向 量。为消除尺度变化的影响,在识别前还对得到的特征向量进行了归一化处理。 相比之下,b a r o n 所做的工作较少为人知道,他先将图像灰度归一化,再利用 四个掩模( 眼,鼻子,嘴以及眉毛以下的整个脸部) 表示人脸,然后分别计算出这四个 掩模与数据库中的每幅标准图像的相应掩模之间的互相关系函数,以此作为判别 依据。 总的来说,早期的人脸识别方法都需要某些先验知识,仍然摆脱不了人的 第一章绪论 干预。本世纪7 0 年代中期,经典的模式分类方法都是采用正面图像或者侧脸图 像中那些可计算的,比较精确的属性来识别人脸。8 0 年代,人脸识别的研究基 本上处于休眠状态。2 0 世纪9 0 年代以来随着高速度高性能的计算机的出现, 人脸识别方法有了重大突破,进入了真正的计算机自动识别阶段,人脸识别的 研究也得到了前所未有的重视。国外有很多大学在此方面取得了很大进展,研 究设计的领域很广,其中有从感知和心里学角度探索人类识别人脸机理的,如 美国t e x a sa td a l l a s 大学的a b d i 和t o o l e 小组,主要研究人类感知人脸的规 律,如漫画效应,性别识别和人脸识别的关系,种族效应等。由s t i f l i n g 大学的 b r u c e 教授和g l a s g o w 大学的b u r t o n 教授合作领导的小组,主要研究人类大脑 在人脸认识中的作用,并在此基础上建立了人脸认识的两个功能模型,他们对熟 悉和陌生的人脸的识别规律以及图像序列的人脸识别规律也进行了研究。也有从 视觉机理的角度进行研究的,如英国a b e r d e e n 大学的c r a w 小组,主要研究人 脸视觉表征方法,他们对空间频率在人脸识别中的作用也进行了分析,荷兰 g r o n i n g e n 大学的p e t k o v 小组,主要研究人类视觉系统的神经生理学机理并在 此基础上发展了并行模式识别方法。更多的学者则从事利用输入图像进行计算 机人脸识别的研究工作。 1 2 人脸识别的研究内容 简单地说,人脸识别就是给定一个静止的或者动态图像,利用已有的人脸 数据库来确认图像中的一个或者多个人。它主要的研究内容包括一下5 个方面: 1 人脸检$ f f f a c ed e t e c t i o n ) 如何从各种不同的背景中检测出人脸的存在并确定其位置。这一部分主要 受到光照、噪声、头部倾斜度以及各种遮挡的影响。 2 人脸表征( f a c er e p r e s e n t a t i o n ) 确定表示检测出的人脸和数据库中的已知人脸的描述方式。通常的表示方 法包括几何特征( 如:欧式距离,曲率,角度等) ,代数特征( 如矩阵特征矢量) 固定特征模板,特征脸等。 3 人脸鉴另j j ( f a c ei d e n t i f i c a t i o n ) 这一部分也就是通常所说的人脸识别,将待识别的人脸和数据库中的已知 人脸相比较,得出相关信息,最终确定待识别的人脸是数据库中的哪个人。这 里最主要的是选择合适的人脸表示方式和匹配策略。 4 表情分析( f a c i a le x p r e s s i o na n a l y s i s ) 对待识别的人脸的表情进行分析,并对其加以分类。 第一章绪论 5 物理分类( p h y s i c a lc l a s s i f i c a t i o n ) 对待识别人脸的物理特征进行分类,得出其年龄、性别、种族等相关信息。 到目前为止,大部分的研究工作主要集中在人脸检测与定位、特征提取以及分类 识别这几部分,而且很多问题尚待解决,表情分析和物理分类的研究现在还处在 初步阶段,相对比较少。因此,通常所说的人脸识别系统,包括人脸检测与定位、 特征提取、分类识别这几个部分,不包括表情分析和物理分类这两部分,如图1 - 1 所示。值得一提的是近年来表情分析和物理分类越来越受到研究人员的重视。 图1 - 1 人脸自动识别系统框图 首先是人脸的检测与定位,即检测图像中有没有人脸,若有,将其从背景 中分割出来,并确定其在图像中的位置。在某些场合,拍摄图像的条件可以控 制,比如警察拍罪犯照片时要他们将脸的某一部分靠近标尺,这时人脸的定位 很简单。但是在另一些情况下,人脸在图像中的位置预先是未知的。如在一些 复杂背景中拍摄的照片,这时人脸的检测与定位将受以下因素的影响: ( 1 ) 人脸在图像中的位置,人脸的旋转角度和尺度: ( 2 ) 发型和化妆会遮盖某些特征; ( 3 ) 图像中出现的噪声; 因此人脸的检测和定位也是人脸识别中一个比较突出的问题。问题的重点 在于如何从简单或者复杂的背景中将单个人脸分割出来。分割的主要方法有:使 用人脸模板,基于皮肤颜色的分割方法,基于神经网络方法,基于人脸的对称的 方法等。 其次是特征提取,一般在特征提取之前还要将图像归一化。根据人脸定位 的结果将图像中的人脸变化成同一大小和位置,并进行光照补偿,以减小光照 变化的影响。特征提取的方式主要是根据识别方法的不同而不同。在基于几何 特征的识别方法中,直接提取几何特征点,如眼睛、嘴角、鼻尖等部位构成二 维拓扑结构,然后构造特征矢量;而在统计识别方法中,特征脸方法是利用图 像相关矩阵的特征矢量构造特征脸。”( e n g i n f a c e ) ;模板匹配方法“阁则是用模板和 图像灰度的自相关性形成特征矢量。对于人脸识别来说,特征提取是个非常关键 的部分。 最后是人脸识别。识别的任务是选取合适的分类器,将待识别的图像与人 第一章绪论 脸数据库进行匹配。识别的主要任务有两个:一是人脸的辨认,即确定输入图像 为数据库中的那个,是个一对多的匹配过程;另一个是人脸的验证,即验证某个 人的身份是否属实,是一对一的匹配过程。 1 3 人脸识别的应用 人脸识别技术具有广泛的应用前景,在国家安全、军事安全和公共安全领 域,智能门禁、智能视频监控、公安布控、海关身份验证、司机驾驶执照验证 等有典型的应用;在民事和经济领域,各类银行卡、金融卡、信用卡、储蓄卡 的持卡人的身份验证,社会保险人的身份验证等具有重要的应用价值;在家庭 娱乐领域,人脸识别也具有一些有趣的应用,比如能够识别主人身份的智能玩 具、家政机器人,具有真实面像的虚拟游戏玩家等等。主要有一下几类应用: ( 1 ) 刑侦破案。当公安部门获得案犯的照片之后,可以利用人脸识别技术,在 存储罪犯照片的数据库里找出最相像的人为嫌疑犯。还有一种应用就是根据 目击证人的描述,画出草图,然后用这种图到库里去找嫌疑犯,罪犯数据库 往往很大,由几千幅图像组成。如果这项搜索工作由人工完成,不仅效率低, 而且容易出错,因为人在看了上百幅人脸图像后,记忆力会下降,而由计算 机来完成则不会出现此问题。 ( 2 ) 证件验证。身份证,驾驶执照以及其他很多证件上都有照片,现在这些证 件多是人工验证的,如果用人脸识别技术,这项任务就可以交给机器完成, 从而实现自动化智能管理。当前普遍使用的另一项证件是用符号或者条形码 标记的,比如信用卡,自动取款机等。这类卡的安全系数比较低,因为卡可 能丢失,密码也可能被遗忘或者窃取。如果在这类卡上加上人脸的特征信息, 则可大大改善其安全性能。 ( 3 ) 入1 3 控制。入口控制的范围很广,它可以是设在楼宇单位或私人住宅入口 的安全检查,也可以是计算机系统或者情报系统等的入口检查。在楼字或某 些安全部门的入口处,比较常用的检查手段是核查证件。当人员出入频繁时, 要求保安人员再三检查证件是很麻烦的,而且安全系数也不高。在一些保密 要求非常严格的部门,除了用证件,还要用一些另外的识别手段,如指纹识 别,手掌识别,视网膜识别和语音识别等。人脸识别与之相比,具有直接、 方便和友好的特点。当前计算机系统的安全管理也倍受重视,通常使用由字 符和数字组成的口令可能会被遗忘或者破解,但是如果把人脸当作口令则既 方便又安全。 ( 4 ) 视频监控。在许多银行,公司,公共场合等处都设有2 4 小时的视频监控, 第一章绪论 另外侦察员在破案时也要用摄像机对人进行跟踪。在对图像进行集体分析 时,也要用到人脸的检测、跟踪和识别技术。 除了这几部分的应用外,人脸识别技术还可以用于视频会议,机器人的智能化 研究以及医学等方面。 1 4 本文的主要研究内容和安排 特征提取是人脸识别中一个至关重要的环节,一个人脸识别系统的识别准确 率在很大程度上取决于特征提取部分,本文对人脸识别中的特征提取进行研究, 内容主要包括如下几个方面: ( 1 ) 综述人脸识别技术,指出人脸识别技术的应用前景。 ( 对当前人脸识别中存在的各种主要子空间特征提取算法进行了较为系统 的介绍,并对各种算法的变种和发展做了总结。 ( 3 ) f i s h e r 准则是线性判别分析中常用的准则函数,此准则函数已被证明在 低维模式识别中非常有效。但是,这种方法存在自身的局限性:基于线 性提取特征。而人脸本身具有复杂的非线性特征。对此,我们介绍了核 函数的基本理论,引入核f i s h e r 判别分析方法。在分析核f i s h e r 判别分析 的基础上,提出了两种增强型核f i s h e r 笋4 j 别分析算法并将其应用于人脸识 别。 本论文主要围绕基于统计特征的非线性f i s h e r 判别方法及其在人脸中的应用 展开研究。论文组织如下: 第一章主要介绍了人脸识别的发展概况,研究内容和实际应用。 第二章介绍了几种线性子空间人脸识别方法,指出了各种方法的优缺点。 第三章介绍了f i s h e r 线性判别分析方法的基本理论及其在人脸识别中的应用, 并对各种改进算法作了详细的分析。 第四章介绍了核f i s h e r 判别分析和核函数的基本理论,通过实验比较了各种基 于核的f i s h e r 判别方法。 第五章结合增强型f l d 及核f i s h e r 判别分析的特点,提出了两种增强型核f i s h e r 判别分析算法并将其应用于人脸识别。 第六章对本文提出的两种方法作了总结,并提出了下一步的研究方向。 第二章线性子窄问分析 2 1 主分量分析 第二章线性子空间分析 主分量分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 的思想来源于k - l 废换,目的 是通过线性变换找一组最优的单位正交向量基( 即主分量) ,用它们的线性组合来重 建原样本,并使重建后的样本和原样本在均方意义下的误差最小。k - l 变换的生成 矩阵一般是训练样本集的协方差矩阵。在数学上,主分量分析就是通过解特征值 问题来对角化协方差矩阵s 。 设一组裁剪好的人脸训练样本图像经过狄度直方图均衡化后,对每个图像按 照逐行( 或逐列) 的顺序排列所有象素,构成的一组列向量集为: x 。,x :,x 。) ,n 为图像样本的个数。所有图像样本的均值为j , 协方差矩阵s 为: s 一三( 置一y x x , 一霄) 7 ( 2 1 ) n 胃 其中 对应的本征值求解问题为: j 。三专j n 鲁 a w s w ( 2 2 ) ( 2 3 ) 将特征向量排序,即 z + 1 ,选择对应的前m 个最大非零特征值对应的特征向量 作为主分量,因此原空间的样本就可以用在低维主分量子空间上的投影系数儡来 描述。 y - q 嵋 ( 2 4 ) 这组坐标系数( q ,) 表明了人脸在子空间中的位置。 在人脸识别上的应用最早是由l ( i r b y 等提出来的,t u r k 等“脚后来把它成功 地发展为特征脸( e i g c n f a c e ) 方法,用于正面的人脸识别。特征脸的的思想就是从 训练图像中,通过主分量分析得到一组特征脸图像( e p 对应的主分量、,那么任意给 定的人脸图像都可以近似为这组特征脸图像的线性组合,用组合的系数作为人脸 第二章线性子空间分析 的特征向量。经典的特征脸方法是采用基于e u c l i d e a n 距离的最近中心分类器, 后来比较常用的是基于e u c l i d e a n 距离的最近邻,也有采用基于m a h a l a n o b i s 距离 和余弦角的”。 随着特征脸方法的成功之后,随后出现了许多种基于主分量分析的人脸识别 方法。p e n t l a n d 等利用对每个视角都作局部主分量分析“”,来实现多视角人脸识。 m o g h a d d a m 等根据主分量分解后的两个正交的子空间的特性,提出基于主分量分 析的贝叶斯框架“”。文中讨论了在简单情况下可用单高斯函数来描述样本在主分 量子空间的分布,在存在光照、姿态等变化的复杂情况下,应选择混合高斯形式, 混合高斯的参数可通过e m 算法来估计。不过对人脸识别而言,用混合高斯来描 述有些不切实际,因为它通常需要一定量的训练样本才能得到可靠的结果。i j u 等 提出结合主分量分析的概率推理模型“2 ”1 ,假设在主分量子空间中每类的类条件概 率服从一正态分布。基于分层的主分量概率子空间方法的思想是分别用主分量分 析去提取与描述人脸的类内变化和类间变化的特征,然后再结合文献“”中的思想, 用贝叶斯决策规则来分类。实验的结果表明结合贝叶斯分类框架和主分量分析的 人脸识别方法比经典特征脸方法要优越些,这说明了贝叶斯决策的优越性。文献“” 中提出t e i g e n h i l l 的方法实际上是先对原始图像采用边缘滤波和局部平滑的预处 理,再利用主分量分析提取特征,实验表明可以更有效地处理人脸图像中的丰富 表情变化。 主分量分析中主分量选取的优先级通常是按对应的特征值大小来确定的。特 征值越大,其优先级就越高。但是就人脸识别而言,应该选择多少个主分量是最 佳的,目前常用的标准有两种: 1 1 当对应的特征值和最大的特征值相比小于一定值时就不要了; 2 1 选择的特征值之和与总的特征值之和的比值要大于等于0 9 。 尽管主分量分析在人脸识别中取得了不错的效果,但是由于它是以所有样本 的最优重建为目的,因此对于描述不同类样本之间的差异而言,它不一定是最优 的描述。从这个意义上说,用它来描述人脸识别的特征是不充分的。 2 2 线性判别分析 线性判别分析“”( l i n e a rd i s c r i m i n a n ta n a l y s i s ,t d a ) 也是一个用于特征提取的 统计方法。于p c a 思想不同的是,u ) a 通过找到最优的投影方向,使得所有样本 在其上的投影的类间离散度和类内离散度之比最大,从而达到最好的区分不同类 样本的目的。因此,从理论上说l d a = t p c a 更适合于模式识别问题。经典的线性 判别分析中使用的是f i s h e r 准则函数,所以线性判别分析又称为f i s h e r 线性判别分 第二章线性子空问分析 析( f i s h e rl d a ) ,f i s h c r 准则函数定义为 ,( w ) = a r g m 。a x 其中s b ,s w 分别是训练样本的总的类间散度矩阵和总的类内散度矩阵。 下一章中我们将详细讨论在f i s h e r 线性判别分析中,各种已有的解决策略以及 各种策略的优缺点。 2 3 奇异1 苴分解 奇异值分解”( s i n g u l a rv a l u ed e c o m p o s i t i o n ,简称s v d ) 是一种有效的代数特征 提取方法。由于奇异值特征在描述图像时是稳定的,且具有转置不变性、旋转不 变性、位移不变性、镜像不变性等重要性质,因此奇异值特征可以作为图像的一 种有效的代数特征描述“”。奇异值分解技术已经在图像数据压缩、信号处理和模 式识别分析中得到了广泛应用。 根据线性代数原理,若4 。是实矩阵( 不失一般性,设坍z 胛) ,j j r a n k ( a ) 一k , 则存在两个正交矩阵【,卅。和k 。及对角阵哦。使下式成立: a = u d v 7 ( 2 6 ) 其中: ;( 0 ”旷蚓川, 。一( “。,心,。,“。) ,k 。- ( h ,u ,心。,匕) , 式中r 表示转置,q - 石“2 ,k ,一) 称为矩阵4 的奇异值, 乏九苫乏九,o 是a a 7 并且也是a r a 的非零特征值的全体,而 。- + 2 一丸一0 为a 7 a 的 n k 个零特征值。蚝,u ( i - 1 , 2 ,七) 分别是儿r 和a r a 对应于非零特征值 的特 征向量。吨( f - k + 1 ,朋) 是为了表达上的方便而引入的( m 一七) 个向量,可以设想 它是a a 7 对应于 一0 的特征向量。同理,q ( i - k + 1 ,刀) 为爿对应于 一0 的 1 1 & 一& 矿一旷 第二章线性子空间分析 特征向量。将式( 2 6 ) 写成乘积的形式: i a = q 氓v i 7 ( 2 7 ) 衙 如果矩阵a 代表一幅人脸图像,式( 2 7 ) 就是对该人脸图像进行了正交分解,将 矩阵z 中主对角线上的奇异值元素q 连同吨。中剩余的( n - k ) 个。构成一个n 维 列向量: 。一见。e 一( q9 - * 9 吼,0 ,o ) j( 2 8 ) 其中,见。为de e l 懈l + n 阶子式,列向量p - “1 ,1 z 。,称矗,d 为彳的奇异值 特征向量。对于任何实矩阵a ,在 苫九苫丸的限制下,奇异值的对角矩阵 是唯一的,因此,原人脸图像a 对应于唯一的奇异值特征向量。 2 4 独立分量分析 独立分量分析“( i n d e p e n d e n tc o m p o n e n ta n a l y s i s ,i c a ) 的思想就是通过线性 变换,从样本中找到一组互相独立的基( 独立分量) 并用来描述样本数据。它不但考 虑了二阶以上的统计特征,而且分解出的基向量比p c a 分解结果在空间分布上更 为局部化;而局部化的特征对人脸识别更为有利因为人体是非刚体,局部特征 受面部表情变化、姿态变化及局部遮拦( 如眼镜等) 的影响较小。目前比较流行的 求解方法有三种: 1 ) 基于信息论的方法; 2 1 固定点算法9 3 ) 联合近似对角化特征矩阵的方法。 其中固定的算法最为简单和快捷,他把独立分量m ,的求解过程简化为如下简 单的迭代过程: w ) 一c - 1 e 硌( w 仲一i ) t 工) ) 一e gy w ( 七一1 ) 7 工) 似一1 )( 2 9 ) 。 w ( k ) 一w + ( t ) w + 0 ) 1 c w + ( 七)( 2 1 0 ) 其中c 是协方差矩阵,g 是一阶非线性函数,g 是g 的导数形式。 主分量分析实际上是在二阶统计意义下去相关,而独立分量分析是要在所有 阶的统计意义下的去相关,从而使信号的二阶统计和高阶统计信息都得到了有效 利用,因此主分量分析可被认为是独立分量分析的推广。两者的区别在于主分量 的目标是最小化重建误差,而独立分量分析的目标是最小化子空间的基向量( 也就 第二章线性子空间分析 是所谓的独立分量1 之间的统计相关性:主分量分析中的主分量相互正交,而独立 分量分析中的独立分量相互独立。图2 1 就是主分量分析和独立分量分析直观示 意图。 独立分量分析是信号处理领域在2 0 世纪9 0 年代后期发展起来的一项新处理方 法。顾名思义,它的含义是把信号分解成若干个互相独立的成分。主要用在盲 信号分离上,在人脸识别上应用是i = h b a r t l e t t 等”第一次提出的,把人脸图像看作 为多个互相独立的基图像的线性叠加。文献”是先用独立分量分析提取特征,然 后结合支持向量机来提高分类结果。文献”对独立分量分析作了较详细的评价 p c ai c a 图2 1 主分量分析和独立分量分析 分析,并与e i g e n f a c e 和f i s h e r f a c e 进行了实验比较,结果显示独立分量分析略好于 后两者。但是文献o “中的比较结果是独立分量分析和主分量分析的识别率近似相 同,文献o ”中指出在选择各自最佳的距离度量后,独立分量明显不如主分量分析。 在主分量分析中通常是根据特征值的大小来选取主分量的,但是对于如何有效地, 自动地选取对分类有用的独立分量,目前还没有一个很好的标准,通常都是根据 经验来选取的。另外独立分量分析的计算复杂度要明显高于主分量分析。 2 5 距离度量和分类器 把样本看成空间中的点,点与点之间的距离就成为最直接的分类依据,因此 子空间方法中最常用的就是距离分类器。而采用距离分类器的首要条件是对距离 的度量。 2 5 1 距离度量 第二章线性子空间分析 假设两个n 维向量x 一“,x n ) 7 和_ ) ,一( y l ,y 。厂之间的距离为d ( z ,y ) ,常用 的距离度量有以下几种: 1 1 l 1 距离( c i t y b l o c kd i s t a n c e ) d ( x ,y ) - i x y l = 卜y i i ( 2 1 1 ) l 2 距离( e u c l i d e a nd i s t a n c e ) r 一 d ( 训) ;y i i i :j 荟( - y i ) 2 ( 2 1 2 ) 3 1 马氏距离( m a h a l a n o b i sd i s t a n c e ) 岫) 一骞差 ( 2 1 3 ) 其中 是第i 个特征值,对应第i 个特征向量。 4 ) 向量夹角( a n g l e ) d ( 训) _ 一x 。y i 一 ( 2 1 4 ) 2 5 2 分类器 常用的分类器有以下几种: 1 ) 最近邻分类器 最近邻( n e a r e s tn e i g h b o r ) 分类器把待识别的样本归为与之空间距离最近的已 知样本所在的类。 2 ) k 近邻分类器 k 近邻f k n e a r e s t n e i g h b o r ) 分类器取待识别样本的k 个近邻,这k 个近邻中 属于那一类的己知样本多,则把待识别样本归为那一类。 3 、最近中心分类器 最近中- t l , ( n e a r e s tc e n t e r ) 分类器首先要求已知样本的类中心( 类平均) ,把待识 别样本归为与之距离最近的类中心所在的类。 4 ) 最近特征线分类器 最近特征线( n e a r e s tf e a t u r el i n e ) 分类器定义已知样本中任意同类的两样本点 决定的直线为特征线,把待识别样本归为与之距离最近的特征线所在的类。 2 6 小结 第二章线性子空间分析 线性子空间方法由于其具有计算代价小、描述能力强、可分性好等特点,已 成为了人脸识别中的主流方向之一,通过对人脸识别研究中的各种子空间法的计 较得出如下结论: 1 1 每种子空间都有优缺点,已成功应用于人脸识别中: 2 1 从理论上及大多数的试验结果来看,基于可分性考虑的判别分析方法在人 脸识别的应用中有一定的优越性。 第三章f i s h e r 线性判别分析 第三章f is h e r 线性判别分析 3 1 引言 在基于统计特征的方法中,主分量分析和f i s h e r 线性判别分析是研究最多的。 p c a 能够提取均方误差最小意义下最佳表达数据的特征,然而该特征并不是最有利 于分类的特征。而判别分析的目的可以总结为:找到一个能够返回某种度量值的 函数,而且该度量值能够成为区分样本不同类别的依据。这些依据可以用来训练 分类器,或者提取特征。因此,判别分析可以理解为一种监督学习或者特征提取 方式。 3 2 线性判别 判别分析的目的是找到一个函数映射f :k 班。,类别之间的相似性通常由欧 氏距离等方法度量。而在线性判别分析的情况下,需要的是一个线性函数,即一 组投影 f ( x ) 一,z ,w 吼” ( 3 1 ) 且矩阵w 能够在约束条件s 下,最优化准则g ,如下 m a x g ( w ) s u b j e c t t ow e s ( 3 2 ) 以两类情况为例,给出其线性判别函数的一般表达式 1 ( x ) - w 7 x + w , ( 3 - 3 ) 式中x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024华润集团|总部办公室/人力资源部/财务部岗位公开招聘若干人笔试参考题库附带答案详解
- 2024中国能源传媒集团有限公司社会招聘19人笔试参考题库附带答案详解
- 妇科三维超声操作规范
- 临床疾病概要(康复)练习卷附答案(一)
- 大气环境化学实验设备认证重点基础知识点
- 可控核聚变行业深度报告-商业化渐行渐近产业链有望充分受益
- 湖北省六校(宜城一中、枣阳一中、曾都一中、襄阳六中、南漳一中、老河口一中)2024-2025学年高一下学期期中考试数学试题 含解析
- 生物伴性遗传课件-2024-2025学年高一下学期生物人教版必修2
- 绿色耕耘智慧农业
- 律所半年工作回顾与展望
- 预应力混凝土结构设计原理.pptx
- 钻井防卡手册
- 来料检验指导书铝型材
- 《中国当代文学专题》期末复习题及答案
- MDK5软件入门
- GB∕T 9441-2021 球墨铸铁金相检验
- 工程项目监理常用台账记录表格(最新整理)
- 质量保证体系调查表
- 双胎妊娠指南ppt课件
- Unit 4 Globalization(课堂PPT)
- SMC压力开关-ISE30中文说明书
评论
0/150
提交评论