版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 本科毕业设计说明书(论文) 第 29 页 共 29 页1 引言1.1 研究背景和意义随着社会的进步,对身份识别技术的需求越来越大。尤其在安全、经济以及商贸等领域,这种识别技术的需求更是无处不在。即使在生活中,我们也要经常验证或被验证他人或自己的身份来保证我们的人身、财产以及信息的安全。如今,社会在不断的进步,社会的生产、生活等方面也有了很大的提高,这就使得对人们身份的认证有了更高的要求。传统的个人身份识别主要是通过其本身的标识物品等方式来实现的,如证件、口令或钥匙等。这些传统识别方法很容易被忘记或者被伪造,而且它们更无法区别所有人与冒充者,他人获得后也可以拥有相同的权利,从而使得真正的持有者
2、蒙受巨大的损失。例如,当他人获得自己的银行卡和密码后就可以通过自动取款机来盗取金钱。基于这些原因,使得传统识别方法已经跟不上时代的脚步,满足不了当代人们的安全需求。而人们本身拥有的面部特征、指纹、虹膜等都能够唯一的标识个人的身份。这些属性具有固定不变性和个体差异,利用这一属性可以有效的、可靠的、稳定的对个人身份进行识别,而基于面部特征的识别相对于基于其它特征的识别更容易实现,也更容易被接受,从而被广泛的研究与应用。该技术在现代社会具有非常重大的研究意义,例如,通过人脸识别确认犯罪分子。另外采用人脸识别设计的自动取款机,通过人脸识别来判断用户是否为本人。人脸识别的出现使得人们的信息和财产的安全有
3、了很大的提高。人脸识别涵盖了图像处理、模式识别、神经网络、计算机视觉、生理学以及数学等诸多学科,是一项非常综合的技术,它的应用正随着社会的进步与日俱增。1.2 人脸识别技术的应用人脸识别的出现在一定程度上缓解了人们对于身份识别的巨大需求。以下的几个领域是人脸识别研究方向的重点:(1)在公安方面,人脸识别可以帮助公安干警刑侦破案。公安部门根据获得的疑犯照片与档案库里的疑犯照片进行比对,可以迅速的确定疑犯身份,从而提高破案的效率。(2)在物业管理方面,主要是用来保护物主的财产安全。如需要验证某人的身份,以防止非法分子进入小区、办公楼等地方盗取物主财产,但使用人工识别,其识别速度慢而且容易发生遗漏,
4、而人脸识别技术可以由机器完成这种反复而简单的验证工作,从而实现自动化智能管理。(3)在考勤方面,由于人脸的无法替代性,可以提供准确的考勤记录,杜绝了打卡考勤机的代打卡现象,具有可远程管理,识别速度快等优点,并且不论识别是否成功,被识别人的图像都会被记录下来,方便以后查验。(4)在网络安全方面,当使用信用卡进行网络支付时,人脸识别系统可以有效的防止他人冒用信用卡。(5)在金融方面,由于人脸的唯一性,同时又由于金融业务涉及客户的经济机密,故采用人脸识别能够很好的保护这些机密。而人脸识别在金融业的应用的不断增长也证明了它的安全性。1.3 人脸识别技术的主要问题人脸识别虽然有着巨大的应用价值,但也存在
5、一些问题需要解决。在日常生活中,人们可以毫不费力的识别人脸,但是对于计算机来说,却存在着巨大的困难。这种困难主要是人脸形态的多样性和环境的复杂性造成的,同时也有计算机本身的学习能力的问题,这些问题主要体现在以下几个方面:(1)人脸特征稳定性较差由于人脸是一个可塑的、三维的可变形体,用数学模型很难描述,且当受到年龄、化妆、表情以及意外伤害等因素的影响后,会使采集到的人脸图像发生较大的变化。(2)人脸受外界因素影响大人脸图像采集时会受到不同的光照条件、面部方向、采集视角等因素的影响,使得同一个人的人脸图像在不同的条件下产生很大的差异,这些因素提高了人脸识别算法的要求。(3)人脸图像的质量问题人脸图
6、像的来源很多,但最普通的来源是摄像头,由于摄像设备的不同,得到的人脸图像质量也不相同。现在的人脸识别主要是针对高质量的图像。(4)人脸图像受相似问题的影响众所周知,人类的面孔虽然各不相同,但是由于人口基数大,导致经常出现相似面孔,即二者之间的差距非常小,这使得利用机器来识别这种差距非常小的人脸具有相当大的难度。上述问题表明,所采集到的人脸图像具有复杂性和多变性,这就提高了人脸识别的难度,而如何消除这些影响以及如何提高识别精度成为了现在和未来的研究主题。1.4 论文结构安排本文分为五个章节,每章具体情况如下:第一章简要叙述了人脸识别的研究背景及其应用,概要分析了人脸识别面临的问题。第二章介绍了在
7、进行人脸识别前的图像处理。第三章简要介绍了关于人脸识别的一些基础理论。第四章首先分别介绍了PCA算法和LDA算法,然后分析了两种算法融合的意义,并提出了PCA+LDA的融合算法。第五章采用PCA+LDA融合算法在人脸库ORL和YALE上进行人脸识别,并分析了实验结果。2 人脸图像的预处理2.1 人脸图像的灰度化处理日常所采集到的人脸图像通常为彩色图像,而彩色图像是由红(R)、绿(G)、蓝(B)三种基本颜色构成的,使得识别计算复杂,不利于识别的进行,所以要进行灰度化处理。灰度化就是使得红、绿、蓝三色取相同值,此时的像素值就是灰度值。由于像素的灰度值存放在一个字节中,因此变化范围只有0-255。由
8、于点与点之间的灰度程度不同,因此使得图像表现出颜色深度。对彩色图像的灰度处理,一般采用下列方法:(1)分量法将彩色图像的R、G、B中某一个的值作为灰度值,公式如下: (2.1) (2.2) (2.3)(2)最大值法将彩色图像三种基本颜色红、绿、蓝中亮度最大的值作为灰度值,公式如下: (2.4)(3)平均值法将彩色图像三种基本颜色红、绿、蓝的平均值作为灰度值,公式如下: (2.5)(4)加权平均法根据三种基本色在人眼中的敏感性,以不同的权值进行加权平均。由于人眼对绿色的敏感最高故权值最大,对蓝色敏感最低故权值最小,故其公式如下: (2.6)灰度图的出现降低了计算的繁琐程度,使得计算速度与最终的图
9、像识别的准确度有了很大的提高。2.2 人脸图像的平滑去噪人脸图像的采集和传输过程中,图像信号不可避免的会受到噪声的影响,这将影响到系统对图像信息的分析和理解。一般来说,出现位置随机,幅值基本相同的噪声为椒盐噪声,而位置一定的,幅值是随机的噪声为高斯噪声。由于噪声对图像的采集和处理有着一定的影响,使得图像的识别准确度降低,因此对图像进行去噪的处理就显得非常必要了。图像平滑去噪的理想状态是保持图像的边界和细节的同时,去除图像噪声,也是现在去噪研究的重点。图像的成像模型可描述为: (2.7)其中是理想图像,是实际图像,为噪声。图像的去噪问题就是找到一个算子,使得: (2.8)图像去噪的主流方法有三种
10、:均值滤波、中值滤波、维纳滤波。2.2.1 均值滤波(1)均值滤波原理均值滤波的基本思想是用目标像素周围的八个像素的平均值来取代目标像素的值,其主要方法是领域平均法。假定图像有个像素,则平滑处理后的为: (2.9)式中,,是点周围点的坐标的集合,但其中不包括本身,是集合内的坐标点的总数。由上式可知,图像中每个像素的值都是由这个点周围的几个像素值的平均值决定的。(2)均值滤波的改进算法虽然均值滤波对噪声有一定的抑制作用,但是效果仍然不理想,其最主要的问题是:由于它对所有的点都是同等对待,所以它将噪声点分摊的同时,也将图像的边界分摊了,这就使得图像变的模糊,且模糊程度与领域半径成正比。加权平均法是
11、改进后的典型算法,该算法可如下表示: (2.10)式中,是权值,表示该点所起作用的大小。不论是均值滤波还是加权平均法,它们都丢失了图像的边界信息。为了改善这一状况,提出了中值滤波。2.2.2 中值滤波中值滤波法是以选定的像素为中心,对该像素周围的像素按值进行排序,排序后取中间的像素值为选定的像素的值。表示如下: (2.11)式中,是领域中各点的灰度值,所以中值滤波后的是以为中心的领域的各像素的中间值,因此能够在消除噪声的同时,较好的保存边界信息。对于椒盐噪声,由于其幅值是基本相同的,但分布是随机的,即图像中有干净点也有污染点,而中值滤波的方法就是选择合适的点代替污染点的值,故去噪效果好。而均值
12、滤波则由于噪声的均值不为0,故不能很好的除去噪声。对于高斯噪声,由于其幅值近似正态分布,但分布点是一定的,即图像中的每点都是污染点,所以中值滤波的方法对于高斯噪声来说是无法选择到干净点来代替污染点的,故去噪效果差。而因为正态分布的均值为0,故均值滤波的去噪效果好。2.2.3 维纳滤波最早最经典的图像修复方法是维纳滤波法。首先计算图像像素的均值和方差,公式如下: (2.12) (2.13)式中,表示噪声,和分别为图像的行数和列数,为噪声的均值表示图像中噪声的总体强度,则根据维纳滤波器估计出的图像灰度值为: (2.14)其中,是图像的总方差,是局部方差。越大,去除噪声的效果就越好,反之噪声的去除效
13、果就越差。适应面广是维纳滤波器的优点,但是其缺点也很明显,就是使用维纳滤波器要先得到半无限时间区内的全部数据,这点以现在的技术很难做到。所以实际中维纳滤波器并不常用。2.3 人脸图像的归一化处理图像的归一化就是将图像转化成统一的标准形式的过程。通过对图像进行标准化处理,以此消除其它因素对图像识别的影响。人脸图像在经过灰度化、平滑去噪后仍然存在着一些问题,如:头部的倾斜、偏转、光照、距离以及表情等,这些因素都会使得识别率下降。而人脸图像的归一化目的就是使人脸图像经过处理后取得同样大小的尺寸,且灰度范围取值也相同的标准化图像,即使得受不良因素影响的同一个人的不同照片具有同一个标准,从而消除不良影响
14、,提高识别率。人脸图像的归一化主要对图像几何和灰度进行修正。2.3.1 几何归一化几何归一化是为了消除人脸位置、大小和角度的不同所造成的影响,使人脸图像具有一定程度上的几何不变性。因此,几何归一化又称为位置校正。因为瞳孔间的距离受不良因素的影响较小,所以通常被作为几何归一化的标准。一般来说,几何归一化主要经过以下两个步骤,如图2.1、2.2所示。(1)图像旋转由于人脸图像在采集时多少会出现一定的倾斜,因此要将图像进行旋转,使得两眼之间的连线保持水平。具体做法是,确定两眼之间的连线,然后计算出连线与水平线之间的角度,再根据角度将图像在平面内进行旋转。(2)尺度归一化计算出每幅图像人脸两眼的距离,
15、再根据求得的数据计算人脸两眼距离的平均值,按照平均值对图像进行适当的缩放,从而使得每幅图像的尺度基本相同。图2.1 处理前的原图图2.2 处理后的图像2.3.2 灰度归一化经过几何归一化后的人脸图像尚未消除不同光照所造成的影响,故需要经过进一步的处理,即灰度归一化。其原理是调整人脸图像的灰度,使得图像的对比加深,从而使得人脸图像的特征更加明显。灰度归一化的经典方法是直方图均衡化。通过对图像的处理,使得灰度级增加,从而提高对比度,使得图像更加清晰。所以本质上来说,灰度归一化就是增加灰度级。设为总像素数,为第灰度级的像素数,表示第个灰度级,表示灰度级总数,则该灰度级出现的概率的计算式为: (2.1
16、5)直方图均衡化处理公式为: (2.16)原第K灰度级的像素经过直方图变换后的灰度级为: (2.17)由于图像的均值和方差与其直方图密切相关,图像的均值反映了图像的平均亮度,而方差则反映了亮度的变化,所以通过计算图像的均值和方差来验证和比较处理前和处理后的效果。图像的均值为: (2.18)图像的方差为: (2.19)如下图2.3、2.4所示,为直方图均衡化前后的图像与直方图的比较。 图2.3 处理前的原始图像和其直方图 图2.4 处理后的图像和其直方图3 人脸识别的相关理论3.1 人脸识别的基本原理识别技术分为广义的和狭义的。广义的是指人脸图像的采集、人脸识别预处理、人脸定位、身份确认以及身份
17、查找等。狭义的是指仅对个人的身份进行识别的人脸识别。而特征的提取是识别技术的核心。上文介绍的人脸图像的处理就是为了使计算机能够更好的提取人脸特征而作准备,而人脸识别也是根据特征来进行的。3.1.1 人脸特征提取人脸在计算机中能够表现为不同的灰度值矩阵,人脸识别就是通过比较不同图像的矩阵来进行图像的识别,因此,如何很好的描述人脸成为了关键的问题。但是人脸的数据量十分庞大,如果尽数提取就会使得计算的代价非常高,如何降低数据量,提高识别效率成为了研究的重点,对此研究人员提出了人脸特征提取。人脸特征包括鼻梁、眉骨、下巴、眼睛、鼻子、耳朵等,对这些特征进行提取的同时,也达到了对人脸矩阵的降维,保证了识别
18、率的同时,提高了识别效率。所以,识别算法的好坏要根据特征脸的提取来判断。人脸特征的提取可以看作一种变换,设表示原始数据的高维空间,是特征空间,则提取的过程为如下映射: (3.1)理论上,训练样本(人脸图像)的数目越多,特征提取的效果就越好。代数方法的特征提取是人脸特征提取方法中较为常用的,其中最常用的方法是特征脸方法。设为图像的特征向量,为图像维数,则的协方差矩阵为: (3.2)式中,图像的特征平均值为。通过这种变换后,原始图像的矩阵就会转换成一个矩阵维数较低,但仍然能够代表原始图像的新矩阵。利用这种方法,避过了面部器官等特征,从而避免了表情的影响,但样本数目是制约该方法优劣的一个重要因素。3
19、.1.2 特征的匹配与分类在提取完特征后,通过何种方法比较人脸图像,并通过何种方法对人脸特征进行判别和分类也是一个非常重要的方面。(1)相似性度量常用的相似性度量准则有:(a)欧氏距离 (3.3)(b)马氏距离 (3.4)其中,是第个特征值,对应第个特征向量。(c)绝对值距离 (3.5)(d)余弦距离 (3.6)除以上几个常用的方法外,还有明式准则、欧氏距离平方、均方误差以及相关系数法。(2)常用分类器常用的分类器分为距离分类器和统计学习分类器。按照距离的分类器有如下几种:(a)最小距离分类器:使用最小距离分类器需要知道训练样本的类的平均点,将测试样本(待识别样本)归为与其距离最近的点所在的类
20、。(b)最近邻分类器:该分类器需要预先将训练样本分类,然后计算测试样本与训练样本的距离,则测试样本就属于与其距离最近的训练样本所在的类。(c)K-近邻分类器:K近邻分类器是典型的非参数分类器,不需要学习或训练,也不需要确定参数,只需确定测试样本与训练样本的K个近邻中的哪个近邻相似度最高,就可将测试样本划分为该近邻所在的类。3.2 人脸识别的常用训练与测试模式3.2.1 训练模式在人脸识别的训练阶段,一般需要以下几个数据集合:(1)训练集已经确定身份的图像所组成的集合就是训练集。利用该训练集合对人脸识别的算法进行测试,从而改正和改进人脸识别的算法,调整算法中的参数,以达到最佳识别的效果。(2)参
21、照集参照集是人脸原型的集合。主要通过其与测试样本的比较来完成测试。实验数据较少时,将训练集作为参照集。(3)测试集测试集是原集外或者原集中除参照集以外的人脸图片。用来测试识别系统的正确性。3.2.2 测试模式(1)开集测试:主要判断输入的图像在原集中是否存在,若存在,则给出结果。大规模的人脸库一般采用该方法。(2)闭集测试:这种测试不用判断输入的图像在原集中是否存在,只需给出最后的识别结果即可。小规模的人脸库多采用该方法。(3)单样本测试:这种测试指的是训练集中每类的样本图片数目只有1幅。在样本数量有限或难以获得的情况下,这种方法比较常用。(4)多样本测试:该测试指的是训练集中每类的样本图片数
22、目至少有2幅。所以样本充足时,采用该方法效果较好。3.3 人脸识别的主流数据库人脸识别同样受到人脸库的影响,优秀的人脸库不仅能提高识别率,同时使得识别结果具有说服力。对此,研究人员不停的更新和建立人脸库。目前主流数据库有FERET人脸库、ORL人脸库、YALE人脸库、XM2VTS人脸库、CAS-PEAL人脸库和MIT人脸库等。其中,FERET人脸库是由美国军方制作的,是目前世界上最权威的人脸库,而ORL人脸库是由英国剑桥大学研究设计的,是目前使用最多的人脸库。3.4 人脸识别的评价标准人脸识别最终要应用到现实生活中,所以对于一个识别算法的优劣,主要考虑算法的识别率和识别时间两方面。而算法的优劣
23、由识别率决定,算法的实用性则由识别时间来衡量。3.4.1 识别准确率通常采用下列几个指标对人脸识别系统的精度进行评价:(1)拒识率(FRR):指系统将正确图像当成错误图像的概率,其公式如下: (3.7)(2)误识率(FAR):指系统将错误图像当成正确图像的概率,其公式如下: (3.8)(3)总体正确识别率:正确识别的图像数目在总图像数目中的比例,其公式如下: (3.9)3.4.2 识别时间众所周知,人脸识别算法的研究最终要回归到实际的应用中,因此,一个识别算法的运行时间的长短也影响着其能否真正的运用到现实中。人脸识别的时间由两部分组成:一是人脸识别系统对训练集进行处理,产生判别向量所需要的时间
24、;二是人脸识别系统将测试样本向由判别向量组成的低维子空间投影,形成投影系数,并最终得出结果所需要的时间。其中,第二方面是识别算法能否在现实中使用的决定因素。4 基于PCA和LDA融合的人脸识别算法4.1 基于PCA的人脸识别方法4.1.1 概述主成分分析(PCA)又称K-L变换。通过线性变换,从众多数据中选出能够代表整体的少数数据的一种统计分析方法,是特征提取的一个经典算法。其目的在于,从人脸图像的数据组成的矩阵中提取出最能代表该矩阵,且含有数据较少的新矩阵,以达到缩小庞大的原矩阵的目的。4.1.2 特征脸算法(1)特征脸的原理特征脸算法是来自PCA算法的经典识别算法。特征脸算法的识别过程是先
25、将训练样本中的图像投影到特征脸子空间上,然后将测试样本的人脸图像也投影到特征脸子空间上,最后对所得的数据进行对比,具体步骤如下:(a)获得训练集,并计算图像集的特征脸,存储到模板库中;(b)输入另外的人脸图像,保存其到特征脸上的投影数据;(c)利用相似度准则判断输入的图像是否属于人脸;(d)若为人脸,再次利用分类器准则判断该人脸属于哪个人。(2)特征脸的计算设有大小为的维列向量的人脸图像,则图集为,其中,为图像总数,则其平均向量为: (4.1)则人脸与平均人脸之间的差为: (4.2)训练样本的协方差矩阵为: (4.3)式中,。由上述公式可知,由协方差矩阵的求解特征值和特征向量。特征脸向量为,在
26、对其进行归一化处理后即可获得特征脸,下式为归一化公式: (4.4)此时,所获得的特征向量组成的特征脸空间非常大,需要缩小其数据量。首先降序排列特征值,则特征脸子空间由前个特征值所对应的特征向量组成。特征值为,特征向量,则: , (4.5)将训练集中的人脸图像投影到特征脸子空间上,该投影为: (4.6)常用的5种特征值提取法有:(1)标准空间投影法;(2)保留前面的90%的特征向量法;(3)能量维数法;(4)扩展维数法;(5)去掉最大特征值法。其中,最常用的是能量维数法,即选取的特征值数目应满足下式: (4.7)该方法的思想是,不停的计算前个特征值之和与总特征值之和的比值,当这个比值大于某个阈值
27、时,就认为此时的特征值数目是所需要的能够代表整体的最少的特征值数目。(3)特征脸的识别过程训练和识别两个阶段组成了特征脸算法的识别过程。在训练阶段,将每个训练集中的人脸图像投影到特征脸子空间上,得到降维后的特征脸的维数为,其计算公式如下: (4.8)式中,第个人脸测试的结果就是。而在识别阶段,主要完成训练集中的人脸图像到特征脸子空间的投影,同样得到维向量: (4.9)由于已知图像组成了训练样本,故人脸识别实际是求解测试样本中人脸图像的分类问题。通常,都是选择一种合适的分类器准则来判断测试样本的归类,该准则应使得识别率最高。每个人脸图像在空间中都是一个点,则同一个人的图像点就集中在一个有限的区域
28、里,而不同的人的图像点在不同的区域里。所以,通过计算两点之间距离的远近就可以知道人脸样本属于哪一个人。式(3.3)中的为特征空间的维数,由该式可知,若它们属于同一个人的不同人脸图像,则应是比较小的,反之应该比较大。先求解训练样本中的各个人脸图像的距离,采用欧氏距离算法: (4.10)则待测的图像与已知的人脸集的距离为: (4.11)最后,只要判断是否小于计算得到的,就可以判断该图像属于哪个人。4.2 基于LDA的人脸识别方法4.2.1 概述线性判别分析(LDA)又称为Fisherface线性判别分析,其目的是提取低维的特征空间来代表原高维的特征空间。通过这种方法使得同类内的样本尽可能的集中在一
29、起,不同类内的样本尽可能的远离。4.2.2 传统LDA算法(1)算法原理设集合内的样本有个,且每个样本为维,样本共分为类,其中类有个样本,类有个样本,则该样本的类内散布矩阵、类间散布矩阵和总体散布矩阵为分别为: (4.12) (4.13) (4.14)式中,第类样本的第个样本为,第类样本的平均值为,为总体样本均值,为第类样本的先验概率,一般取。线性判别准则函数定义为: (4.15)投影后,为了达到同类内的样本聚集,而不同类内的样本分开的要求,就要使类内离散度尽量的小,而类间离散度尽量的大,即式(4.15)取得最大值的时候的向量就是所求的最佳投影方向,且满足如下等式的解。 (4.16)(2)同时
30、对角化求一个矩阵,使得和同时对角化,公式为: (4.17)式中,为对角线上的元素降序排列的对角矩阵。4.2.3 基于核的LDA算法核LDA算法是研究人员在LDA的基础上,提出的对人脸识别等非线性分类问题有良好解决能力的改进算法。设样本特征空间的维数为,样本分类数为,为第类样本数,则每个样本表示为,训练样本总数为。定义非线性映射,其中为映射特征空间,维数为,则第映射类为: (4.18)则,映射类的均值和总体均值分别为: (4.19) (4.20)则矩阵、矩阵和矩阵的求解公式分别为: (4.21) (4.22)式中: (4.23) (4.24) (4.25) (4.26)则,核Fisher准则为:
31、 (4.27)使式(4.27)取得最大值的向量,即为所求的最佳投影空间,而该向量的列向量形成的图像成为“Fisherfaces”。4.2.4 直接LDA算法前文提到的同时对角化是直接LDA算法的核心。算法的关键是保存特征空间中的有用信息,同时去掉无用信息。即保留中的零特征值,同时,去掉矩阵中的零特征值。具体的步骤如下:(1)求使得对角化的矩阵: (4.28)其中,为对角线上的元素降序排列的对角矩阵。故一个特征向量表示为矩阵中的一列,且所有的特征值都在中。(2)定义为的前列,即矩阵是维,其特征空间的维数为,则的维主子矩阵为: (4.29)(3)定义,则: (4.30)(4)根据特征分析方法求的对
32、角化,得: (4.31)式中,对角线上的元素可能包含0,所以需要保存这些0的元素,故要舍弃元素排序较靠前的特征值所对应的特征向量。(5)定义矩阵为: (4.32)此时,所得的矩阵可以同时对角化和。(6)最终的样本矩阵为: (4.33)4.3 基于PCA和LDA融合的人脸识别4.3.1 PCA算法和LDA算法之间的区别和联系LDA算法的核心思想是找到一个投影方向,这个投影方向可以让同一个人的图像在平面内的点尽量的集中在一起,而不同人的图像的点尽量的分散开。而PCA算法则是直接分析整个人脸库,即将人脸库看做一个个体。特征脸方法由于求解的是图像变化最大的部分,则其受光照等不良因素的影响较大。而LDA
33、算法由前文的分析可知,其忽略了光照等因素,而关注不同人脸之间的差异度。因此,当图像的影响因素主要为光照等因素时,LDA算法的效果要更好,而提供的训练集不充足时,PCA算法的效果要好于LDA算法。但这两种方法都有一个共同的缺陷,即变化图像的尺寸对识别的效果影响较大。由前文可知,常用的降维方法就是PCA算法和LDA算法。在人脸识别中,PCA算法基于图像的整体灰度值进行操作,关注于主要特征信息的提取,忽略了图像的分类问题。LDA算法则是基于图像的分类,更多的考虑了不同类别间的特征问题。因此,将两种算法的优点进行结合,在人脸识别的研究领域中有着很高的研究价值。4.3.2 PCA算法和LDA算法的融合不
34、论是PCA算法还是LDA算法,它们的缺陷都非常明显。PCA算法由于特征脸对于光照等因素较为敏感,所以光照、表情等因素会导致识别率下降,且PCA算法是把图像看作一个整体,即图像中的像素都拥有相同的地位,在特征空间里就表现为没有差异性。LDA算法的特征空间虽然具有差异性,但其计算过程要反复的进行矩阵操作,当矩阵过大的时候,就会使得计算产生的误差较大,最终影响到识别精度,所以,直接使用LDA对人脸图像进行识别,会使得矩阵为奇异的,最终导致投影方向无法求解,这就是通常所说的“小样本”问题。因此,提出了PCA与LDA相融合的算法,即PCA+LDA算法,该算法先通过PCA和LDA的两次降维处理,产生理想状
35、态的最优投影子空间。具体的计算过程如下:(1)根据PCA算法求解特征脸子空间,记为;(2)根据LDA算法求解特征子空间,记为;(3)利用式(4.16)求解特征值和特征向量,组成最佳分类空间;(4)融合根据PCA算法和LDA算法求得的两个特征子空间,得到最优特征子空间,公式如下: (4.34)(5)将训练样本和测试样本分别投影到最优特征子空间上,得到各自的识别特征,再利用最近邻准则进行人脸分类。5 人脸识别系统的实现5.1 人脸识别流程人脸识别的流程图如下:人脸库图像预处理训练样本测试样本特征提取特征比对结束输出结果图5.1 人脸识别流程图本次实验,分别采用人脸库ORL和YALE。实验一的人脸测
36、试是在ORL人脸库上进行,当人数分别为15、25、35、40人时,训练样本数分别取2、3、4、5、6、7、8、9幅,测试样本为其余的图像。实验二是在YALE人脸库上进行的,当人数分别取5、10、15人时,训练样本数分别取2、3、4、5、6、7、8、9幅。流程为先输入训练样本,通过PCA算法和LDA算法,求出最优投影子空间,将训练样本投影到最优投影子空间,然后输入测试样本,同样投影到最优投影子空间,利用最近邻准则比较二者,最后统计正确识别率。5.2 实验步骤与结果及其图像曲线5.2.1 ORL人脸库的实验(1)实验步骤(a)读入ORL图像库的训练图像,先选取15人,选取每个人的人脸图像数分别为2
37、、3、4、5、6、7、8、9幅图像,图像大小为11292。(b)根据读入的训练样本图像生成图像矩阵,根据PCA算法生成特征脸子空间。(c)对于特征脸子空间,利用LDA算法求解基于LDA算法的特征子空间。(d)根据和,求得最优投影子空间。(e)训练样本投影到最优投影子空间,获得数据。(f)读入测试样本,将测试样本的图像矩阵投影到最优投影子空间,获得数据。(g)利用最近邻准则比较和,并根据比较结果计算最终的识别率。(f)依次更改测试人数为25、35、40人,重复上述操作。(2)实验结果表5.1 基于ORL人脸库的测试结果脸人数识率别数人23456789150.94170.95240.97780.9
38、6000.98331.00000.96670.9333250.81000.88000.92670.91200.96000.97330.98000.9600350.80360.82860.89520.93710.96430.96190.97140.9714400.76560.84290.85830.88000.93750.95830.97500.9750如图5.2所示:图5.2 ORL人脸库的识别结果曲线图5.2.2 YALE人脸库的实验(1)实验步骤(a)读入YALE图像库的训练图像,先选取5人,取每个人的人脸图像数分别为2、3、4、5、6、7、8、9幅图像,图像大小为100100。(b)根据
39、读入的训练样本图像生成图像矩阵,根据PCA算法生成特征脸子空间。(c)对于特征脸子空间,利用LDA算法求解基于LDA算法的特征子空间。(d)根据和,求得最优投影子空间。(e)训练样本投影到最优投影子空间,获得数据。(f)读入测试样本,将测试样本的图像矩阵投影到最优投影子空间,获得数据。(g)利用最近邻准则比较和,并根据比较结果计算最终的识别率。(f)依次更改测试人数为10、15人,重复上述操作。(2)实验结果表5.2 基于YALE人脸库的测试结果脸人数识率别数人2345678950.91110.92501.00001.00001.00001.00001.00001.0000100.81110.
40、83750.97140.95000.92001.00001.00001.0000150.82220.84170.91430.93330.93330.98331.00001.0000如图5.3所示:图5.3 YALE人脸库的识别结果曲线图5.3 实验结果分析由实验结果可以知道如下几点:(1)在相同的阈值下,不论是基于ORL人脸库的测试,还是基于YALE人脸库的测试,其识别率总体上都是随着训练样本数的增加而增加。这是因为随着训练样本数的增加,经过降维所得的特征子空间含有足够的信息,从而使得识别率提升。(2)在相同的阈值与相同的训练样本数下,参与测试的人数越少,识别率越高。这是因为人数的减少使得类间
41、离散度变大,从而使得识别率提升。(3)在条件完全相同的情况下,YALE人脸库比ORL人脸库的识别率高。这是因为ORL人脸库的人脸图像受不利因素的影响较大。(4)通过结果曲线图可以发现,不论是ORL人脸库的识别率,还是YALE人脸库的识别率都出现了所谓的“拐点”。这是因为,此时的训练样本数使得类内离散度大于类间离散度,造成误识别,所以识别率反而下降。综上所述,随着训练样本数的增加,图像的识别率也增加。结束语人脸识别已经成为计算机领域的一个重要的研究方向,其包含了图像处理、人工智能、神经网络以及模式识别等领域的知识,是一门非常综合的学科。到目前为止,虽然人脸识别的研究经过30多年的发展,并取得了巨
42、大成果,但是仍然有许多问题需要解决。特征脸的提取是人脸识别的核心。优秀的特征脸提取算法可以使得人脸图像的维数在尽可能低的同时,最大限度的反映了原图像的特征。本文主要探讨了基于PCA与LDA融合算法的人脸识别,在MATLAB平台上开发应用了基于此算法的人脸识别系统,其用到了包括特征脸的提取、相似性度量等方面的知识。由于PCA算法所得的特征脸子空间,每个像素的点都具有同等地位,即没有明确的差异性,同时,利用LDA算法进行人脸识别会产生“小样本”问题,因此对二者进行融合,利用PCA先对人脸图像进行降维,使得类内散布矩阵为非奇异矩阵,从而消除了“小样本”问题,而LDA在进行处理后又可使得最终获得的特征
43、子空间具有差异性,从而提高了人脸识别率。通过本次实验得知如下几点:(1)识别率受到特征值数目的影响。实验中,利用能量维数法来选择特征值数目,分别尝试了阈值为70%到96%值间的各个数值,经过测试,最终分别选取85%和94%在ORL人脸库和YALE人脸库上的进行实验。(2)不同的人脸库有着不同的识别率。(3)相同的特征值数目下,理论上,训练样本数的增加有助于识别率的提高。虽然融合后的算法解决了单个算法的主要缺点,但是仍然有着一些缺陷尚未完善。比如,过往的研究表明,PCA算法在降维的时候不可避免的丢失了一些数据,这些数据可能含有重要的信息,而这些信息的丢失导致了识别率的下降。由于每种识别算法都或多或少的存在着缺点,且人脸图像受不良因素的影响较大,因此,更新或创造出新的算法,或者更新图像的采集方法都会消耗大量的人力、物力和财力,故将两种或两种以上的识别算法进行融合得到新的算法,将成为一个新的研究方向,PCA与LDA融合的算法也将更加完善。致 谢论文的最后,我要首先
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 炎症性肠病指南共识
- 2023年云南省武汉大学选调和招聘“企业引培生”考试真题
- 江口县城市社区工作者招聘真题
- 《路由器工作过程》课件
- 起重机操作手培训
- 如何写服务员心得(10篇)
- 高一家长会家长演讲稿10篇
- 销售员工在岗工作小结范文
- 转正总结报告个人范文
- 建筑泥浆处理项目可行性研究报告
- 回收PET塑料资源化利用及产业化进展研究
- 《住院患者身体约束的护理》团体标准解读课件
- 英语-浙江省湖州、衢州、丽水2024年11月三地市高三教学质量检测试卷试题和答案
- 劳动技术教案
- 广东省深圳市2023-2024学年高一上学期生物期中试卷(含答案)
- 第七章 立体几何与空间向量综合测试卷(新高考专用)(学生版) 2025年高考数学一轮复习专练(新高考专用)
- 2024年浙江省衢州市营商环境建设办公室招聘政府雇员17人高频难、易错点500题模拟试题附带答案详解
- 中国急性缺血性卒中诊治指南(2023版)
- 福建省残疾人岗位精英职业技能竞赛(美甲师)参考试题及答案
- 在线学习新变革课件 2024-2025学年人教版(2024)初中信息技术七年级全一册
- 航空器系统与动力装置学习通超星期末考试答案章节答案2024年
评论
0/150
提交评论