基于模糊线性判别分析的人脸识别算法设计_毕业设计.doc_第1页
基于模糊线性判别分析的人脸识别算法设计_毕业设计.doc_第2页
基于模糊线性判别分析的人脸识别算法设计_毕业设计.doc_第3页
基于模糊线性判别分析的人脸识别算法设计_毕业设计.doc_第4页
基于模糊线性判别分析的人脸识别算法设计_毕业设计.doc_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

沈阳航空航天大学毕业设计(论文)基于模糊线性判别分析的人脸识别算法设计学 院专 业班 级学 号姓 名指导教师负责教师摘 要人脸识别技术是生物识别技术的一种,以其直接性,唯一性,方便性等特点,在公安,海关,交通,金融,视频会议,机器人的智能化研究等方面得到了越来越广泛的应用。人脸识别技术是模式识别领域中的一个前沿课题。在过去的几十年里,研究者尝试利用计算机来模仿人类识别人脸的能力,并提出了很多人脸识别的有效算法,利用不同技术提高了人脸识别算法的平均识别率。本文着重讨论一种把特征脸和模糊线性判别分析(flda)算法结合起来进行人脸识别的方法。该方法利用主成分分析(pca)方法求得训练样本的特征空间,然后在此基础上计算flda算法的特征子空间,进一步对特征脸空间降维。经过flda降维后的子空间中,同一类别的样本尽可能靠近,不同类别的样本尽可能分散(即降维后同一个人的人脸图像尽可能的靠近,不同人的人脸图像尽可能的分散开)。模糊lda方法引入了模糊技术来优化特征提取,利用隶属度信息来描述样本的分布信息,能得到一个更好的类中心位置估计。应用于yale及orl人脸库的实验结果表明,该算法具有较高的识别率。关键词:人脸识别;主成分分析;模糊线性判别分析;特征脸face recognition algorithm based on fuzzy linear discriminant analysisabstractface recognition technology is a kind of biological recognition technology. with its immediacy, uniqueness and convenience, etc. it gets more and more widely used in terms of public security, customhouse, traffic, finance, video conference, the study on robots intelligence. face recognition technology is a frontier topic in the field of pattern recognition. in the past few decades, the researchers tried to use a computer to imitate humans ability to recognize faces, and a lot of effective algorithm of face recognition was proposed, and they used different technology increased the average recognition rate of face recognition algorithm. this paper focuses on a face recognition method which combining with the principal component analysis and fuzzy linear discriminant analysis (flda) algorithm.this method obtains the characteristics space of the training sample with the principal component analysis(pca) algorithm, then on the basis of this calculation, get another fldas feature subspace which has lower dimensions. in this fldas feature subspace, samples of the same category are as near as possible, different types of sample are as disperse as possible (in other words, after the dimension reduction, the same person face image are as near as possible, the different human face image are as far as possible). the fuzzy technology is used in fuzzy lda to optimize feature extraction, it can get a better class center position estimate with using membership information to describe the distribution information of the sample. the experimental results on yale and orl face database show that this algorithm has high recognition rate.keywords: face recognition; principal component analysis; fuzzy linear discriminate analysis; eigenface目 录1 绪 论11.1 人脸识别的研究背景和意义21.2 人脸识别的发展史和应用31.2.1 发展历史及发展现状31.2.2 应用和分类41.3 本文的主要内容与安排52 人脸识别基础72.1 人脸库72.1.1 yale人脸库72.1.2 orl人脸库82.2 特征提取82.2.1 主成分分析92.2.2 线性辨别分析102.3 分类器设计133 基于子空间分析的人脸识别方法153.1 基于pca的特征脸算法153.2 基于lda的fisher脸算法173.3 基于flda的模糊线性判别分析算法184 基于pca和flda的人脸识别204.1 基于pca+flda的人脸识别算法204.2 实验仿真214.2.1 yale人脸库214.2.2 orl人脸库244.3 小结27结 论28参考文献30致 谢32附录 源程序清单33v沈阳航空航天大学毕业设计(论文)1 绪 论人脸在日常生活中发挥着重要作用,人类根据人脸进行身份识别和表情判断,完成日常的交际,人脸因此成为最重要和最自然的身份识别对象。人类有着与生俱来的自动识别人脸的能力,能在剧烈变化不确定因素影响下快速且准确的识别人脸,同时进行身份匹配和表情判断。身份识别与验证是人类日常活动中的基本活动之一。在目前的技术水平下,几乎全部的身份验证还依靠传统的物理验证方式来完成,主要包括身份证件、钥匙、密码等,但这些验证方式存在方便性、可靠性和安全性等问题,因而不能适应社会的发展和需求。因此我们需要更加方便、可靠、安全的身份验证方式。而生物特征识别技术的出现很好的解决了这一问题,近年来已经逐步成为重要场所必备的安检手段。与传统的身份验证方法相比,生物特征识别技术的优势在于生物特征是人类固有的特性,可以从根本上杜绝伪造和窃取的现象,从而满足了人类对于验证方式可靠性和安全性方面的需求。由于人脸识别对识别对象没有侵犯性,所以到目前为止是一种最有好的生物特征识别技术。人脸识别系统通过视频或静态图像来自动捕获和识别人脸,在生物特征认证、监控、安检、人机交互和多媒体监督等领域有着广泛的应用前景。人脸识别技术就是通过图像采集设备捕捉人类的脸部区域,然后把捕捉到的人脸图像和人脸数据库中的图像进行匹配分析,进而完成身份识别的任务。然而,开发一个能完全自动识别人脸的系统是十分困难的,实际环境中,采集人脸图像的过程会受到人脸姿态、光照条件、面部表情和脸部饰物等诸多不确定因素的影响。过去的几十年里,研究者尝试利用计算机模仿人类识别人脸能力,提出了许多人脸识别的有效算法。尽管已经取得很多进展,但到目前为止人脸识别仍然是一个难度很大的课题,识别算法只能在用户配合、条件理想、小规模的人脸库上取得较好的识别效果。人脸识别的评估报告表明多数人脸识别方法的最佳性能在人脸姿态,光照,表情和部分遮挡等因素变化时都会发生很大的退化,人脸识别因此成为图像处理,模式识别,人工智能和计算视觉等领域最活跃的研究课题之一,也是本文的主要研究探讨对象。1.1 人脸识别的研究背景和意义人脸识别(face recognition)是一种很重要的生物特征识别技术。所谓的生物特征识别技术是指通过对人类固有的特征进行自动的身份鉴别甄选技术。现阶段技术水平可依据的生理特征一般为:手型、掌纹指纹、人脸、虹膜、耳廓、dna等;可依据的行为特征如:字迹、步态、语音等。目前,基于这些人类特征,已有相对应的生物识别技术,比如指纹识别、人脸识别、语音识别、虹膜识别、签名识别、步态识别等。在科技、人文高速发展的现今社会中,基于传统的物理性的身份标识方法如:证件、钥匙、用户名、密码等,由于其易丢失、易遗忘、易造假、易冒充等问题,已经远不能满足人类的需求,现今的人类迫切需要一种快捷、有效并且安全的身份识别、标识方法。而基于生物特征识别的身份鉴定系统与传统的物理性身份鉴定手段相比,具有唯一性、安全性、可靠性、不易丢失、不易伪造等优点,因此正在逐步取代传统的身份鉴别方法,在信息安全、金融、交通、公共安全等领域得到了广泛的应用,并且对其识别技术、识别率等要求越来越高。在各种生物特征识别技术中,人脸识别技术更具有其独特的优势,主要有以下几个方面:(1)隐蔽性强,可在一定距离之外,识别对象不知情的情况下完成识别过程,特别适用于安全监控系统。(2)非接触式操作,对识别对象没有侵犯性,可被大多数人接受,理论上来说是最友好的生物特征识别技术。(3)图像采集数据存储,成本低廉。(4)用户界面简单直接,相比较于文字等信息,图片信息更容易被人理解,交互性较强。(5)通过对人脸的表情,姿态,口型等分析,能获得较其他识别技术更多更难以获得的信息。由此可见,人脸识别技术已经逐渐成为最有发展潜力的生物特征识别技术,是当前的热门研究课题之一。并已在反恐,人事档案管理,视频监控,通行识别管理,人机交互等领域得到广泛应用,成为自动身份认证领域的主要研究方向。另外,对于人脸识别技术的研究也带动了多门相关学科的相互促进和相互发展。人脸识别作为典型的图像模式分析、理解与分类计算问题,其研究面跨越了模式识别、图像处理分析与理解、计算机视觉、人工智能、认知科学、人工神经网络、神经生理学、心理学等众多的学科领域,并为这些学科领域创造新方法、验证新理论和解释新现象提供了良好的应用平台。人脸识别技术的相关研究可以极大地促进这些相关学科领域的发展、创新和成熟,同时这些学科领域的成熟也反过来促进人脸识别技术中问题的解决和技术的革新。1.2 人脸识别的发展史和应用1.2.1 发展历史及发展现状人们从事人脸识别技术的研究历史比较悠久。最早在1888年,calton在nature上发表了一篇关于利用人脸进行身份鉴别的文章,对人类自身对面孔的识别能力进行了分析。人脸识别技术的研究从最开始需要人工干预、识别方法匮乏、识别率低下逐步发展到现在的自动化识别程度较高、识别方法算法丰富、识别率较高阶段,大致经过了三个发展阶段:第一阶段为非自动识别阶段,以bertillon,allen和parke为代表,主要研究如何提取人脸特征。1893年,bertillon用一个简单的语句与数据库中的某张人脸相连接,同时结合指纹分析,提供了一个完整的身份识别系统。allen为待识别人脸提供了一种逼真的摹写方法。parke则用计算机实现了这一方法,生成出质量较高的人脸灰度图模型。这一阶段的工作模式特点是需要人工干预,识别过程完全依赖操作人员。第二阶段为人机交互阶段。1972年,goldstion,harmon等尝试利用几何特征表示人脸图像,他们用21维特征向量表征人脸的面部特征,并设计出基于这种表征方法的识别系统。kaya和kobaysshi则采用统计学方法,利用欧氏距离来表示人脸的面部特征,如嘴唇和鼻子间距,鼻子高度,两眼间距离等。t.kanad(m.nagao)设计了一个有一定知识导引的半自动回溯识别系统,利用积分投影法从单张图像上提取计算出一组人脸特征参数,然后利用模式分类技术与标准人脸图像相匹配,相较于之前的识别系统,kanad的系统实现了快速、实时地处理,这是一个很大的进步。baron将人脸图像灰度归一化,再用四个掩模表示人脸,然后分别计算这四个掩模与数据库中每幅标准图像相互掩模之间的相互关系数,以此作为判别依据。这一阶段工作模式的特点是需要利用操作员的先验知识,仍然不能算作是一种完全自动的识别系统。第三阶段是真正的自动识别阶段。上个世纪90年代起,计算机、数字图象处理、模式识别等技术的发展和人类社会对人脸图像自动识别系统的迫切需求推动了人脸识别技术的突破,多种基于计算机的全自动人脸识别系统开始问世。1996年,美国军方组织了一个人脸自动识别系统大赛,勒克菲勒大学的faceit系统获得冠军。在这之后,美国lau公司研制出一个人脸图像自动识别系统,这个系统是一个以正常人眼辨别其他人脸的原理,基于生物测量学、人像复原技术而开发的装置,利用人脸的12-42个特征点,对人群中待寻找的人进行定量定性的识别,并已应用在机场、车站等公共场所和重点控制地区。现今,随着社会需求的提高,人脸识别引起了各个科研机构的重点关注,并将研究成果转化为实用产品。比如vision nics公司的face it人脸识别系统,microsoft公司的trueface系统,和zn boc hum gmbh公司的zn-face系统等。国际上很多公司和研究机构如德国cognitec s ystem gmbh、美国identix inc、viisage及neven vision、韩国三星、日本东芝、麻省理工学院、密西根州立大学、卡耐基梅隆大学、耶鲁大学、新泽西理工学院、休斯敦大学等正在对人脸自动识别技术做更加深入的研究。国内对人脸自动识别技术的研究起始于上世纪80年代,相对起步较晚,但清华大学、北京大学、复旦大学、哈尔滨工业大学、北京科技大学、中科院自动化所、中科院计算所等研究单位的研究已经取得了可喜成果,以清华大学智能图文信息处理研究室研制的th-id人脸识别系统为代表,该系统的测试结果位于国际领先水平。1.2.2 应用和分类随着人脸识别技术的不断发展和应用领域的拓宽,人脸识别技术在多个领域的发展前景已经逐渐越来越广泛。反过来也正是越来越多领域对人脸识别技术的应用和需求愈加增长,大力推动了人脸识别技术的发展速度。归纳起来,人脸识别技术的应用主要分为以下几类:人脸验证:人脸验证是一种身份验证手段,指利用人脸识别技术来验证某个人是否确实是他(她)所声称的那个人。具体来说大多应用在机场、海关或一些保密部门及出入口控制等场所用以替代或辅助证件验证来甄别出入人员的身份、证件等的真实性。人脸辨别:人脸辨别主要是应用人脸识别技术来辨别未知身份人员的真实身份。大多应用在公共安全领域:如公安系统中对嫌疑犯、被害人等的身份进行鉴定;银行、公司等公共场合发生非法分子闯入或异常状况时先通过视频监控采集人脸图像,再利用人脸识别技术与数据库进行对比,确定闯入者身份。视频监视:在视频监视系统中,人脸识别系统的任务目标是在人群中筛选出特定目标并实行跟踪监控,这是一个典型的动态匹配过程。主要应用于国家安全、公安布防以及机场、海关等反恐监控系统中。视频监视系统采集的人脸经过相关处理后与数据库对比,若发现目标人物或危险个体则发出警报,这与人脸辨别有些类似,都是先采集人脸图像,然后与数据库中人脸图像进行一对多的对比匹配,最终确定待测人脸的身份归属。随着人脸识别技术的不断发展和创新,人脸识别的应用领域将会更加的广阔。民用市场有很大的可能成为人脸识别技术发展的最有力的支持。如果防盗门采用人脸识别系统来验证户主身份,人们将告别钥匙;签证、身份证等如果采用电子证件,人脸识别将会是必不可少的应用之一;我国每年仅高考考生就近千万,如果考生验证系统采用人脸识别而不是传统的纸张验证,无论从安全、快捷、环保等任何一个角度来看都是一个极大的进步,届时这个巨大的市场也将大大促进人脸识别技术的发展。1.3 本文的主要内容与安排人脸识别技术的算法多种多样,足够高的识别率是最重要的指标。本文中,主要采用主成分分析(即pca)和模糊线性判别分析(即flda)两种算法结合设计一个人脸识别算法。先使用特征脸方法(pca)将人脸图像的原始数据投影到特征脸空间进行降维,接下来使用fisher脸方法(lda),从特征空间里提取最具判别能力的低维特征,达到进一步降维的作用,最后引入模糊技术改进原始的线性判别分析方法,能更有效的提取判别能力高的、对识别过程有正面效果的信息,尽量消除因训练图像中由于光照、姿势等变化引起的识别性能退化。本文主要内容如下:第一章,绪论。主要介绍了本设计的研究背景和立题意义,人脸识别技术在国内外的发展史、发展现状,人脸识别技术主要的应用领域及应用分类。第二章,人脸识别基础知识。由于人脸识别算法的测试都是在公开的基准数据库上进行,所以在前面首先介绍了有关人脸库的基础知识,并介绍了几个目前学术界较流行的测试用人脸基准数据库。然后介绍了人脸图像的特征提取方法的基础知识以及分类器的设计理念和选用的分类方法。第三章,人脸识别算法介绍及比较。本章介绍了基于主成分分析(pca)的特征脸算法、基于线性判别分析(lda)的fisher脸算法和基于模糊线性判别分析(flda)的算法。第四章,人脸识别算法设计及仿真。本章主要介绍pca+flda算法,并与pca+lda算法进行比较。应用maltab软件编写程序进行人脸识别算法设计的实现,并在yale人脸库和orl人脸库中进行实验仿真,求出识别率,绘制识别率曲线。总结此算法的特点。最后是对全文工作的总结。2 人脸识别基础2.1 人脸库在人脸识别技术的研究中,必不可少的资源之一是人脸数据库。任何一个人脸识别系统的设计成形都需要经过测试、仿真或实验过程,在这个测试的过程中就需要用到包含一定数量人脸图像的数据库来生成人脸识别系统的训练集和测试集。所以人脸数据库的存在对人脸识别算法的设计、测试、识别率求取和系统性能评估有重大的意义。按照目前人脸识别技术的水平来看,一个可以应用在任何环境、在任何可能出现的非正常情况下都能准确无误进行识别的人脸识别系统是不可能存在的,由此,所有的人脸数据库都会附加一些约束条件,比如光照强度、光照方向、表情变化、姿态变化、脸部饰品、人脸尺寸等都受到一定的限制,这些人脸数据库复杂度的高低又影响了对算法性能的评估结果。所以人脸数据库的选择至关重要。下面将介绍几个目前人脸识别实验测试中常用的典型人脸库。2.1.1 yale人脸库yale人脸库是人脸识别中很流行的测试数据库,由美国耶鲁大学计算视觉与控制中心创建,包含15位志愿者的165张脸部灰度图像,每人11张图像,包含各种表情、光照下的图像,并且包含眼镜等遮挡正面人脸图像。所有的图像都在不同的光照和表情下正面拍摄的,主要包括:正面光照,左侧光照,右侧光照,戴眼镜,不戴眼镜,高兴,面无表情,悲伤,困倦,吃惊,和眨眼等变化。yale人脸库的主要特点就是光照变化很明显,且有面部眼镜遮掩,主要用来测试当前光照和表情变化时,识别算法的性能。图2.1 yale人脸库中的光照变化图2.1给出了yale人脸库最大的特点,光照变化的示例,这是yale人脸数据库中一位志愿者的部分人脸图像,这三张图像分别是在正面光照、左侧光照和右侧光照三种约束条件下拍摄的,代表了数据库中人脸图像的光照变化情况。2.1.2 orl人脸库orl人脸库又被称为at&t人脸库,是人脸识别领域最流行的测试数据库之一。由英国剑桥大学at&t实验室创建,包含40个不同年龄、不同性别和不同种族的人。每个人有10幅脸部图像共计400幅灰度图像,图像背景为黑色。其中人脸部分表情和细节均有变化,例如笑与不笑,眼睛睁着或闭着,戴或不戴眼镜等;人脸姿态也有变化,其深度旋转和平面旋转可达20度,人脸的尺寸也有最多10%的变化。该库是目前使用最广泛的标准数据库。图2.2 orl人脸库中的图像变化图2.2是orl人脸库中一个志愿者的全部十张图像。通过观察这十张图像不难发现,人脸图像的旋转变化、姿态变化、表情变化、人脸尺寸变化和眼镜遮掩脸部等人脸数据库的约束条件均有涉及到。2.2 特征提取特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。特征提取是一种数据预处理方法,是指对某一模式的一组测量值进行变换以突出该模式具有代表性特征的方法。是一种提取有效信息的方法。主要针对高维数据的降维处理,通过提取出一部分特征值较高,最具代表性的优秀特征,删除不相关特征以达到降维的目的,最终目的是减少需要处理的数据量,简化分类器计算,提高算法的识别准确率。日常生活中我们所见到的图像都是采用像素空间来表征,这种表征方法使图像看起来精准易懂,但是这种图像的维度是很高的,如果把这样的图像不经处理直接拿来计算,工作量是非常大的。几乎全部的识别算法都需要先将图像降维处理,提取出对识别有用的高特征值信息投影到低维子空间中,但一定要保证低维子空间包含了图像中绝大部分的基本特征信息,且易于分类。人脸识别系统的第一步工作就是特征提取,也是关键性的一步,特征提取的好坏将直接影响测试结果。下面,本文将介绍一种典型的特征提取方法,该方法是目前人脸识别算法中最常见,同时具有最重要地位的特征提取方法,并得到了广泛的应用和发展。2.2.1 主成分分析主成分分析(principal component analysis,pca)是一种统计方法,它对多变量表示的数据集合寻找尽可能少的正交矢量来表征数据信息特征。作为应用十分广泛的特征提取方法之一,已在模式识别、信号处理、数字图像处理等领域得到了广泛的应用,主成分分析法的基本思想是设法将原来众多(比如p个)具有一定相关性指标,重新组合成一组新的互不相关的指标来代替原来的指标。主成分分析,是考察多个变量间相关性的一种多元统计方法,研究如何通过少数主成分来揭示多变量间的内部结构,即从原始变量中提取出少数几个主成分,使它们尽可能多的保留原始变量信息,且彼此间互不相关。通常数学上的处理方法就是将原来p个指标作线性组合,作为新的综合指标。最经典的做法是用f1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即var(f1)越大,表示f1包含的信息越多。因此在所有线性组合中选取的f1应该是方差最大的一个,称f1为第一主成分。如果第一主成分还不足以代表原来p个指标的信息,再考虑选取f2即选第二个线性组合,为了有效反映原始信息,f1中已有的信息就不再出现在f2中,即f1和f2的协方差为零,称f2为第二主成分,以此类推可以构造出第三、第四,第p个主成分。设矩阵表示一个由p个记录组成的数据集合,每个记录有n个属性,即矩阵的元素表示第i条记录在第j个属性上的取值,则x的协方差矩阵为。记, ,。可定义如下的线性组合: (2.1) 其中是的矩阵,且,就是主成分。这样的协方差,使用lagrange方法求解等式下的极大值,即 (2.2)其中是lagrange乘子,使用一般求解方法,可求出最优解,显然,最优解就是原始数据协方差矩阵的特征向量,是与相对应的特征值。这样可以利用矩阵的奇异值分解(singular value decomposition, svd)求出s的特征值和特征向量。2.2.2 线性辨别分析关于线性鉴别分析(lda)的研究可追溯到fisher在1936年发表的经典论文(fisher r a. the use of multiple measurements in taxonomic problems),其基本思想是选择使得fisher准则函数达到极值的向量作为最佳投影方向,从而使样本在该方向上投影后,达到最大类间离散度和最小类内离散度。在fisher思想的基础上,wilks和duda分别提出了鉴别矢量集概念,即寻找一组鉴别矢量构造子空间,以原始样本在该子空间的投影矢量作为鉴别特征来用于识别。lda采用fisher线性判别函数而得以实现,最初被用于解决两类的分类问题。我们一般直接利用样本集设计分类器,来把两类分开。具体点说,就是先给定某个判别函数,然后利用样本集确定判别函数中的未知参数。线性判别函数是一种较简单的判别函数。它首先假定判定函数g(x)是x的线性函数,即: (2.3)需用样本去估计w和,并把未知样本x归类到具有最大判别函数值的类别中去。本文主要研究fisher线性判别函数如何确定。为了把两个类分开,我们可以尝试把d维空间的样本直接投影到一条直线上,形成一维空间,即把维数压缩到一维。当把d维空间里的若干紧凑的集群投影到一条任意的直线上,结果可能是几类样本混在一起而变得无法识别。但一般情况下,总可以找到某个方向,使得在这个方向的直线上,样本的投影能分得最开。现在的问题是如何找到这条最优的、最易于分类的投影线。假设有n个样本,其中前个样本属于类,后个样本属于类,把样本往方向为w的直线上投影,就可以得到: (2.4)从几何方面看,要得到在方向w的直线上的投影,需要有,而实际上w的长度并无实际意义,只是对改变比例而已,重要的是w的方向。我们希望落在直线上的类的样本和类的样本投影能很好的分开而不是混在一起。可用样本均值差来度量投影之间的可分性,设是每类的个d维样本的均值: (2.5)投影之后各类样本均值: (2.6)可以得到投影后的均值差: (2.7)只要对w给予适当的值就可以使差值变得任意大。事实上,为使投影数据获得较好的分离,只要求这两个均值差比每类的标准差较大即可,即: (2.8)其中,对于属于一类的投影样本的类内离散度: (2.9)把作为所有样本的方差估计。称为投影样本总的类内离散度。而fisher线性判别函数被定义为这样的一个函数,它能使判决函数: (2.10)达到最大。显然,为了使j最大,应使两类均值差越大越好(各类样本分布尽量分离开),而各类类内离散度越小越好(各类样本内布尽量密集)。为把j表示为w的显函数形式,定义样本类内离散度矩阵和总类内离散度矩阵如下: (2.11) (2.12)由于: (2.13) (2.14)因此: (2.15)由此: (2.16)矩阵称为总类内离散度矩阵,是对称的半正定的,当nd时它通常是非奇异的。引入,可以将fisher线性判别函数写成: (2.17)则基于fisher线性判别函数的fisher准则即为: (2.18)这个公式是数学物理中的广义rayleigh商。为求得最优鉴别向量,将j对w微分即得: (2.19)需: (2.20)设,不难看出,使j达到极大的向量w必须满足: (2.21)很显然这是一个求解广义特征值的问题,若非奇异,则可得到一个一般特征值问题: (2.22)我们把的特征向量称为fisher鉴别向量。fisher鉴别向量使类间离散度与类内离散度比值达到最大,这样就把高维样本(n维问题)转化为一维样本(1维问题)并在一维空间上保持最优的鉴别力,也就是说fisher鉴别向量能将高维模式以最优的可分性指标转换成一维模式。2.3 分类器设计分类器的设计是人脸识别系统设计过程中的一个重要环节。将待测图像的特征提取出来之后,接下来就需要利用已经提取出来的特征向量来计算辨析图像间的相似程度,确定图像中人脸的身份归属。一般情况下最常用的辨析与分类方法都是借助于模式识别和机器学习。如最近邻方法、贝叶斯决策、人工神经网络和支持向量机等。本文的工作重心是图像的特征提取算法,因此分类方法选用了最基础最常用的距离分类法。所谓距离分类法,是一种简单且直观易懂的分类方法,它直接使用各类训练样本点的特征集合所构成的区域来表示各个决策域,以样本点间距离作为度量样本间相似程度的主要标量,即定义空间中两点间距离越近,则代表两个样本间相似度越高。样本间距离有多种计算方法,在各种计算方法中,欧氏距离是最常见的距离分类方法:欧氏距离又被称为范式,广泛应用于向量间距离度量,定义如下: (2.23)式(2.32)中,表示输入特征矢量x的第i个分量,表示参考特征矢量r的第i个分量,k表示特征矢量维数。则相应的点和类间最小欧氏距离定义如下: (2.24)式(2.33)中,表示参考类的第c个特征矢量的第i个元素,表示熟人特征矢量和参考类全部c个参考特征矢量间欧氏距离的最小值。本文在欧氏距离分类的基础上,应用最近邻分类器对人脸特征矢量进行分类识别,即定义待测样本与距离其最近的训练样本是属于同一类别的。3 基于子空间分析的人脸识别方法人脸识别技术经过多年的发展,取得了很大的进步,涌现出大量的识别算法。这些算法涉及到的学科领域非常广泛,包括模式识别、图像处理、计算机视觉、人工智能、统计学习、神经网络、小波分析、子空间理论和流形学习等众多学科。所以很难用一个统一的标准对这些算法进行分类。本文中提到的主成分分析、线性判别分析和模糊线性判别分析算法主要应用的是子空间分析方法,子空间分析方法的思想是以一定的特征提取的性能目标为准则,将人脸图像从原始的图像空间投影到一个低维的子空间中,不但降低了算法的计算量,而且保持了人脸图像在低维空间中的可分性和独立性。该类方法由于其计算量小、可分性好和描述能力强等优点已成为人脸识别的主流方法之一。基于子空间分析方法的人脸识别算法主要有主成分分析,线性辨别分析,独立成分分析和非负矩阵因子等,其中基于pca的特征脸法在对高维图像进行降维处理方面取得了很大的成效,并在特征提取的过程中依然保持了数据原有的可分性,是子空间分析方法中的首选算法。基于lda的fisher脸法利用原始数据中的类标信息进行数据降维,能更有效地提取对分类有用的特征,显著的提高了人脸识别算法的性能。3.1 基于pca的特征脸算法主成份分析(pca)方法是模式识别领域里一种占有非常重要地位的特征提取方法。该方法通过k-l变换展开式来提取样本的主要特征。由于它保留了原向量在其协方差矩阵最大特征值对应的特征向量方向上的投影主分量,所以被称为主成分分析。在人脸识别领域中pca方法又被成为特征脸方法。这是因为通过pca方法对原始人脸数据提取出来的特征向量投影到新的低维子空间后仍然是人脸的形状,因此它被称为“特征脸”,它保留了人脸图像的基本信息而去除了无用信息,简化了计算。在人脸识别中,记训练集合包含了c个人的n幅脸部图像。如果每幅图像的大小为,pca方法首先将其按列方式拉伸为一个维的列向量来表示。例如,yale数据库中的图像大小为,就可以用一个45045维的列向量来表示。设m幅图像构成训练集,记为,则训练数据的协方差矩阵为: (3.1)其中为均值向量: (3.2)令: (3.3)则: (3.4)显然,c的维数为。如果直接计算c的特征值和特征向量,那么计算代价非常高。为了解决这个问题,下面给出一种更加有效的计算方法。构造矩阵,矩阵b的维数为。根据奇异值分解原理,矩阵b和c的特征值是相等的,通过求解b的特征值和特征向量来获得c的特征向量。对矩阵b使用pca算法,求出m个单位正交特征向量和对应的特征值,并将特征向量按照其对应特征值大小降序排列。特征脸定义如下: (3.5)其中是第特征向量。求得特征脸后,利用特征值选择合适数量的特征向量,也就是选取合适的特征脸个数,一般选择个特征脸,以这些特征脸作为基础,足以表示和区分所有人脸。通过(3.6)式即可将训练集中的图像投影到特征空间中: (3.6)一幅图像投影完,可形成一个向量,其中,这个向量就是原始图像在特征空间中的表示,每个分量都代表对应的特征脸在表征这幅图像中的重要度。识别过程中,遇到的新图像,按(3.7)式投影到特征空间: (3.7)投影完后形成向量即是该图像在特征空间中的表示。按照式(3.8)计算新图像和训练集中图像的距离: (3.8)其中。如果特别小,说明新图像和训练集中图像最相似,即可认为图像和是同属于一个人的图像。给训练集设定一个阈值,若存在使得成立,则可以继续判断图像隶属于训练集中哪个人,若所有的都大于,则判定图像不属于人脸库中任何一人。3.2 基于lda的fisher脸算法fisher脸算法目的是寻求一个线性变换w,使图像在该变换作用下投影到特征子空间,同一个人的所有图像尽可能的聚集在一起,不同人的图像尽可能分开。换言之,就是寻找一个投影空间,使得训练图像投影到该空间后类间散度和类内散度比值最大。记训练集合包含了c个人脸n张脸部图像,则其类间散度矩阵和类内散度矩阵如下: (3.9) (3.10)式中, 为第i类训练样本总个数,是第i类均值,m是所有样本均值。如果是非奇异的,那么lda算法准则函数为: (3.11)其中是与和的前p个最大广义特征值对应的广义特征向量,即有: (3.12)广义特征值个数最多c-1个,其中c是训练集中类别数。识别阶段,将测试集中的图像x按式(3.13)投影到特征空间: (3.13)按照式(3.14)计算新图像和训练集中图像的距离: (3.14)其中。如果最小,说明测试图像x和训练图像最相近,可认为图像x和同属一人。3.3 基于flda的模糊线性判别分析算法在图像处理领域,大多问题都存在着固有的不确定性,基于这一问题,很多的课题研究都利用模糊技术来尽量消除这些不确定因素。尤其人脸图像由于受到环境条件的影响较大,其表观都会发生不同程度的变化。如果在最开始的特征提取过程中就考虑到这些不确定因素并加以量化,那么算法的性能就会有一定的提高。keun-chang kwak等提出模糊线性判别(flda)方法,引入模糊技术改进了原始的lda线性判别分析方法,flda方法能更加有效的提取对识别有用的信息。训练样本的隶属度信息描述了样本的分布信息,较好的反应训练图像中由于光照、姿态等不确定因素引起的变化。记训练集,共包含c个人的n幅脸部图像。应用k近邻方法计算训练集中所有样本的隶属度矩阵,其中表示第j幅图像属于第i个人的隶属度。根据模糊集约束,隶属度要满足如下两个条件: (3.15)k近邻方法计算隶属度过程如下:首先计算训练集中任意两个样本间距离,然后记录每个样本附近与该样本最邻近的k个样本的类别信息,最后可根据式(3.16)计算第j个样本属于第i类的隶属度: (3.16)其中,是第j个样本k个最邻近点中属于第i类的样本个数。不难验证,如此计算得到的满足式(3.15)中两个约束条件。得到样本隶属度后,就可以计算模糊线性判别分析的投影矩阵了,利用最优投影矩阵将训练样本投影至子空间中,可以得到人脸在fisher准则下的最优表示。首先计算所有训练样本的均值m: (3.17)再利用得到的隶属度重新计算每个人人脸向量的均值,即每一类的中心: (3.18)接下来计算模糊类间散度矩阵和模糊类内散度矩阵: (3.19) (3.20)则根据fisher准则可以得到最优投影矩阵: (3.21)其中,是与矩阵和的广义特征值相对应的广义特征向量。4 基于pca和flda的人脸识别4.1 基于pca+flda的人脸识别算法综合第三章提到的三种人脸识别算法,不难发现,flda算法具有最好的分类效果,但flda算法存在两个不可避免的问题:第一是由于人脸图像的高维数产生的计算复杂问题;第二是奇异。针对这两个问题,本文采用先使用pca方法对人脸空间进行降维的方法来解决。具体步骤如下:1) 应用主成分分析(pca)方法对人脸空间进行特征提取(同时降维)后投影到特征脸空间。2) 应用模糊线性判别分析(flda)方法在特征脸空间中线性分类,计算出最优投影矩阵。需要注意的是,第一步pca对人脸空间降维过程中,特征脸空间的维数要谨慎选择,维数选择得当则可以解决奇异的问题,同时保证降维后的特征脸空间尽可能保留了原始图像空间的线性可分性。本文在pca降维处理后的特征脸空间中选取flda作为分类算法而不是lda,其主要原因是flda方法引入了模糊技术,利用样本隶属度信息对类中心重新计算,能得到较lda方法更好的类中心估计,反映在图像上就是能更好的描述训练图像由于光照等不确定因素引起的变化,提高了整体算法的识别率。由此可见,pca+flda的人脸识别算法是一种比较优秀的算法,它既包含了pca算法能在均方误差最小情况下对原始图像进行降维重构的优点,又包含了flda算法优秀的分类识别能力。显著的提高了识别算法的识别准确率和计算效率。整体算法结构图如下图所示:显示识别结果训练图像测试图像随机读取图像pca特征提取flda线性分类欧氏距离分类图4.1 pca+flda算法结构图4.2 实验仿真由于图像的本质就是由若干像素点排列成点阵,因此图像处理可以等同于矩阵计算。而matlab众所周知拥有强大的矩阵计算能力,所以本设计实验平台选用了matlab,人脸数据库则选用yale和orl两个常用人脸库。实验时在人脸数据库中随机抽取训练集样本与测试集样本,并在同等条件下进行多次重复实验,最后计算识别率并绘制曲线图。4.2.1 yale人脸库yale人脸库包含15位志愿者共165张人脸图像,每人11张灰度图像,包含各种表情、光照下的图像,并且包含眼镜等遮挡正面人脸图像。yale人脸库主要特点是光照的变化明显。测试过程如下:(1)按人脸库路径读取全部人脸图像,并用矩阵形式存储在数据库中;(2)从全部人脸图像中随机抽取每人6张,共计90张图像作为训练集。剩下的每人5张,共计75张图像为测试样本; (3)利用主成分分析方法(pca)对人脸图像进行降维处理,提取特征信息,投影到子空间生成特征脸空间,如图4.2所示:图4.2 特征值2.78e+07的特征脸(4)在经过pca方法降维处理后的特征脸空间上应用奇异值分解(svd)和flda算法计算出新的最优投影矩阵。(5)将全部图像向最优投影矩阵上投影,得到识别特征,然后利用最近邻准则判别分析完成人脸识别过程。随机抽取测试集待测人脸图像如下图所示:图4.3 测试集第7张人脸图像程序运行结果显示训练集中与图4.3最相似人脸图像如下图:图4.4 训练集中与图4.3最相似人脸图像(6)相同条件下重复实验50次,求出pca+flda算法下的平均识别率和方差,绘制识别率曲线图。平均识别率:mean(precisionflda) =96.9600%方差:std(precisionflda) =1.5437识别曲线如图4.5所示:图4.5 yale上识别率曲线图图4.5中,横坐标表示实验次数,纵坐标表示识别率百分比。4.2.2 orl人脸库orl人脸库又被称为at&t人脸库,由英国剑桥大学at&t实验室创建,包含40个不同年龄、不同性别和不同种族的人。每个人有10幅脸部图像共计400幅灰度图像,图像背景为黑色。其中人脸部分表情和细节均有变化,人脸姿态也有变化,人脸的尺寸也有最多10%的变化。每幅图像大小为112*92.实验过程如下:(1)按人脸库路径读取全部人脸图像,并用矩阵形式存储在数据库中。(2)从全部人脸图像中随机抽取每人6张,共计240张图像作为训练集。剩下的每人4张,共计160张图像为测试样本。 (3)利用主成分分析方法(pca)对人脸图像进行降维处理,提取特征信息,投影到子空间生成特征脸空间,如图4.6所示:图4.6 特征值0.18e+06的特征脸(4) 在经过pca方法降维处理后的特征脸空间上应用奇异值分解(svd)和fld

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论