【毕业学位论文】(Word原稿)基于主成分分析人脸识别算法的研究Matlab仿真分析-软件工程_第1页
【毕业学位论文】(Word原稿)基于主成分分析人脸识别算法的研究Matlab仿真分析-软件工程_第2页
【毕业学位论文】(Word原稿)基于主成分分析人脸识别算法的研究Matlab仿真分析-软件工程_第3页
【毕业学位论文】(Word原稿)基于主成分分析人脸识别算法的研究Matlab仿真分析-软件工程_第4页
【毕业学位论文】(Word原稿)基于主成分分析人脸识别算法的研究Matlab仿真分析-软件工程_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中北大学 2009 届毕业设计说明书 第 1 页 共 35 页 1 引言 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄 等诸多额外的丰富信息,扩展了人脸识别的应用前景。 虽然人类可以毫不困难地根据人脸来辨别一个人 ,但利用计算机进行完全自动的人脸识别仍存在许多困难, 这主要表现在:人脸存在表情变化,人脸随岁月增长而变化,发型 、眼镜等装饰对人脸造成遮挡,人脸所成图像受光照 、成像角度 、成像距离等影响 ,此外人脸识别技术研究与相关学科的发展及人脑的认识程度紧密相关, 当这些因素叠加到一起的时候,情况就变得更加复杂,也 使人脸识别研究成为一项极富挑战性的课题。 脸识别的目的和意义 传统的人身辨别方法主要是通过人身标识物品和人 身标识知识两种方式来实现的。常见的人身标示物品有钥匙、证件等各种标识,人身标示知识有用户名、密码等。众周知,像钥匙、证件标识等人身标识物品很容易丢失或被伪造,而标识知识容易遗忘或记错,更为严重的是传统身份识别系统往往无法区分标识物品真正的拥有者和取得标识物品的冒充者,一旦他人获得标识物品,也可以拥有相同的权力。即便是将两种方式结合起来使用,此类问题仍然会出现,比如自动取款机虽然用到银行卡和用户密码,但还是有卡里的钱被盗的现象,所以传统的人身辨别方法已不能满足社会的需要。而生物特征识别技术为人身辨别提供了一个 很重要的保障。它包括身体特征和行为特征两个部分。其中身体特征包括面部特征、指纹、手形、基因,身体气味等,而人脸就是主要的面部特征,与用其他身体特征鉴别身份相比,人脸不容易被遗忘、丢失和盗取,而且人脸图像采集具有非接触性、非侵犯性、非强制性特点,容易被人们中北大学 2009 届毕业设计说明书 第 2 页 共 35 页 所接受。 人脸识别系统具有广泛的应用 ,可以归纳为以下四个方面: 安全领域: 公安刑侦破案 , 门禁系统 , 摄像监视系统 是其典型应用。 经济领域: 辅助信用卡网络支付,以防止非信用卡的拥有者使用信用卡。 证件验证:由机器完成验证识别工作,从而实现自动化智能化管理。 娱乐领域:能够识别主人身份的智能玩具、机器人,虚拟游戏玩家等。 内外研究现状 人类最早的研究工作至少可追朔到二十世纪五十年代在心理学方面的研究和六十年代在工程学方面的研究。其中有从感知和心理学角度探索人类识别人脸机理的,也有从视觉机理角度进行研究的。到二十世纪七十年代开始机器识别的研究,这一阶段工作的特点是识别过程全部依赖于操作人员,不是一种可以完成自动识别的系统。到了近代由于计算机技术、矩阵理论、多元分析的发展,主成分分析的人脸识别开始登上历史舞台。 国内关于人脸自动识别的研究始于二十世 纪 80 年代,主要的研究单位有清华大学,哈尔滨工业大学,中科院,复旦大学,北京科技大学等,并都取得了一定的成果。国内的研究工作主要是集中在三大类方法的研究:基于几何特征的、基于代数特征 1的和基于连接机制的人脸正面自动识别方法。周激流实现了具有反馈机制的人脸正面识别系统,运用积分投影法提取面部特征的关键点并用于识别,获得了比较满意的效果。他同时也尝试了“稳定视点”特征提取方法,即为使实现了正、侧面互相参照的识别系统。彭辉、张长水等对“特征脸”的方法 2做了进一步的发展,提出采用类间散布矩阵作为产生矩阵,进 一步降低了产生矩阵的维数,在保持识别率的情况下,大大降低了运算量。程永清,庄永明等对同类图像的平均灰度图进行 解得到特征脸空间,每一幅图像在特征脸空间上的投影作为其代数特征,然后利用层次判别进行分类。张辉,周洪祥,何振亚采用对称主元分析神经网络,用去冗余和权值正交相结合的方法对人脸进行特征提取和识别。该方法所用特征数据量小,特征提取运算量也较小,比较好地实现了大量人脸样本的存储和人脸的快速识别。 于主成分分析人脸识别算法的研究难点 1. 人脸的丰富表情,人脸随着年龄的变化而变化。 2. 人脸所 成图像受光照的影响比较大,成像角度和成像距离对人脸识别的影响也比较大。 中北大学 2009 届毕业设计说明书 第 3 页 共 35 页 针对以上三点,在进行人脸识别时首先要对得到的人脸图像进行图像预处理,减少光线的影响。至于认得年龄和表情的变化问题,我们就要采集足够的图像样本进行训练,这样可以提高正确的识别率。在阈值确定中,本设计采用了三阶临近法,这样识别的效率和质量也都有保证了。 文结构安排 第一章提出问题,介绍研究的现状。第二章简单介绍几种人脸识别的方法。第三章和第四章是重点,分别介绍了主成分分析的数学基础和 其在人脸识别方面的应用。第五章是真的实验结果及结果分析。 中北大学 2009 届毕业设计说明书 第 4 页 共 35 页 2 人脸识别经典方法简介 于几何特征的人脸识别方法 基于几何特征的方法是早期的人脸识别方法之一。常采用的几何特征有人脸的五官如眼睛、鼻子、嘴巴等的局部形状特征。脸型特征以及五官在脸上分布的几何特征。提取特征时往往要用到人脸结构的一些先验知识。识别所采用的几何特征是以人脸器官的形状和几何关系为基础的特征矢量,本质上是特征矢量之间的匹配,其分量通常包括人脸指定两点间的欧式距离、曲率、角度等 。 基于几何特征的识别方法比较简单、容易理解,但没有形成统一的特征提取标准;从图像中抽取稳定的特征较困难,特别是特征受到遮挡时; 对较大的表情变化或姿态变化的鲁棒性较差。 于相关匹配的方法 基于相关匹配的方法包括模板匹配法和等强度线方法。 模板匹配法: 3,6,并得出结论:基于几何特征的人脸识别方法具有识别速度快和内存要求小的优点,但在识别率上模板匹配要优于基于几何特征的识别方法。 等强度线法 :等强度线利用灰度图像的多级灰度值的等强度线作为特征进行两幅人脸图像的匹配识别。等强度曲线反映了人脸的凸凹信息。这些等强度线法必须在背景与头发均为黑色,表面光照均匀的前提下才能求出符合人脸真实形状的等强度线。 于子空间方法 常用的线性子空间方法有:本征子空间、区别子空间、独立分量子空间等。此外,还有局部特征分析法、因子分析法等。这些方法也分别被扩展到混合线性子空间和非线性子空间。 法实现人脸识别。由于每个本征矢量的图像形式类似于人脸,所以称本征脸。 对原始图像和重构图像的差分图像再次进行 到二阶本征空间,又称二阶本征脸。 和嘴等特征分别建立一个本征子空间,并联合本征脸子空间的方法获得了好的识别结果。 法,识别率有所提高。 的识别效果好于本征脸方法。当每个人有多个样本图像时,本征空间法没有考虑样本类别间的 信息,因此,基于线性区别分析 (, 得了较好的识别结果。 北大学 2009 届毕业设计说明书 第 5 页 共 35 页 的方法识别人脸,获得了比 于统计的识别方法 该类方法包括有: 法、奇异值分解 (隐马尔可夫 (。 换:将人脸图像按行 (列 )展开所形成的一个高维向量看作是一种随机 向量,因此采用 换获得其正交 底,对应其中较大特征值基底具有与人脸相似的形状。国外,在用静态图像或视频图像做人脸识别的领域中,比较有影响的有 验室的 组,他们主要是用基于 换的本征空间的特征提取法,名为 “本征脸( 隐马尔可夫模型:剑桥大学的 多个样本图像的空间序列训练出一个 型,它的参数就是特征值;基于人脸从上到下、从左到右的结构特征; 2于人脸识别。 采用低频 数作为观察矢量获得了好的识别效果。 采用 2别 缩的 采用嵌入式 别人脸。后来集成 基于 人脸识别方法具有以下优点:第一,能够允许人脸有表情变化,较大的头部转动;第二,扩容性好 三,较高的识别率。 于神经网络的方法 提出了混合神经网络、 通过一个多级的 现样本的聚类,将卷积神经网络 于人脸识别、 采用基于概率决策的神经网络方法、 提出采用主元神经网络方法提取人脸图像特征,用自相关神经网络进一步压缩特征,最后采用一个 实现人脸识别。 采用 行维数压缩,再用 取特征,然后基于 行人脸识别。 基于 征,并采用混合学习算法的 经网络进行人脸识别。神经网络的优势是通过学习的过程获得对这些规律和规则的隐性表达,它的适应性较强 。 性图匹配方法 提出采用动态链接结构 (方法识别人脸。它将人脸用格状的稀疏图。 人使用弹性图匹配方法,准确率达到 成弹性图。采用每个基准点存储一串具有代表性的特征矢量,减少了系统的存储量。 只使用人脸 的特征,进一步消除了结中北大学 2009 届毕业设计说明书 第 6 页 共 35 页 构中的冗余信息和背景信息,并使用一个多层的分级结构。 也采用分级结构的弹性图,通过去除了一些冗余节 点,形成稀疏的人脸描述结构。另一种方法是, 提出将人脸图像表示为可变形的 3D 网格表将人脸匹配问题转换为曲面匹配问题,利用有限分析的方法进行曲面变形,根据两幅图像之间变形匹配的程度识别人脸。 种混合方法 (1)影和奇异值分解 (融合的分类判别方法。 换的核心过程是计算特征值和特征向量。而图像的奇异值具有良好的稳定性,当图像有小的扰动时,奇异值的变化不大。奇异值表示了图像的代数特征,在某种程度上, 征同时拥有代数与几何两方面的不变性。利用 影后的主分量特征向 量与 征向量对人脸进行识别,提高识别的准确性。 (2)奇异值分解相融合的分类判别方法。 采用奇异值分解方法进行特征提取,一般是把一幅图像 (长为 H)看成一个 NM 的矩阵,求取其奇异值作为人脸识别的特征。在这里我们采用采样窗对同一幅图片进行重叠采样,对采样所得到的矩阵分别求其对应的前k 个最大的奇异值,分别对每一组奇异值进行矢量标准化和矢量重新排序,把这些处理后的奇异值按采样顺序组成一组向量,这组向量是惟一的。 于三维模型的方法 该类方法一般先在图像上检测出与通用模型顶点对应的特征点,然后根 据特征点调节通用模型,最后通过纹理映射得到特定人脸的 3D 模型 7,9。 于结构光源和立体视觉理论,通过摄像机获取立体图像,根据图像特征点之间匹配构造人脸的三维表面, 出了一个新的 论来处理像人脸这类对称对象的识别问题,基于 论和一个一般的三维人脸模型来解决光照变化问题,通过基于视图合成技术解决人脸姿态问题,针对不同姿态和光照条件合成的三维人脸模型。 三维图像有三种建模方法:基于图像特征的方法、基于 几何、基于模型可变参数的方法。其中,基于模型可变参数的方法与基于图像特征的方法的最大区别在于:后者在人脸姿态每变化一次后,需要重新搜索特征点的坐标,而前者只需调整 3D 变形模型的参数。随着采用三维图像识别人脸技术的发展,利用直线的三维图像信息进行人脸识别已经成为人们研究的重心。 中北大学 2009 届毕业设计说明书 第 7 页 共 35 页 3 主成分分析理论基础 成分分析的概念及基本思想 主成分分析 10,17(最为常用的特征提取方法,被广泛应用到各领域,如图像处理、综合评价、语音识 别、故障诊断等。它通过对原始数据的加工处理,简化问题处理的难度并提高数据信息的信噪比,以改善抗干扰能力。主成分概念首先由 1901 年引进,不过当时只是对非随机变量进行讨论,1933 年 这个概念推广到随机向量。 在实际问题中,研究多指标 (变量 )问题是经常遇到的,然而在多数情况下,不同指标之间是有一定相关性。由于指标较多并且指标之间有一定的相关性,势必增加了分析问题的复杂性。 主成分分析就是设法将原来众多具有一定相关性的指标 (比如 P 个指标 ), 重新组合成一组新的相互无关的综合指标来代替原来指标 。 通常数学上的处理就是将原来 P 个指标作线性组合,作为新的综合指标,但是这种线性组合,如果不加限制,则可以有很多,我们应该如何去选取呢?如果将选取的第一个线性组合即第一个综合指标记为1F,自然希望118,20,这里的“信息”用什么来表达?最经典的方法就是用1 )( 1大,表示1此在所有的线性组合中所选取的1称1果第一主成分不足以代表原来 P 个指标的信息,再考虑选取2了有效地反映原来信息,1出现在2数学语言表达就是要求 0),( 21 称2 此类推可以构造出第三,四, ,第 P 个主成分。不难想象这些主成分之间不仅不相关,而且它们的方差依次递减。因此在实际工作中,就挑选前几个最大主成分,虽然这样做会损失一部分信息,但是由于它使我们抓住了主要矛盾,并从原始数据中进一步提取了某些新的信息。因而在某些实际问题的研究中得益比 损失大,这种既减少了变量的数目又抓住了主要矛盾的做法有利于问题的分析和处理。 成分分析的数学模型及几何意义 学模型 中北大学 2009 届毕业设计说明书 第 8 页 共 35 页 设有 n 个样品,每个样品观测 P 项指标 (变量 ): ,., 21 到原始 数据资料阵: 1 1 1 2 12 1 2 2 21212( , , , )n n px x xx x X Xx x x( 其中 12= = 1 , 2 , ,i ( 用数据矩阵 X 的 P 个向量 (即 P 个指标向量 ) ,., 21 p 作线性组合 (即 综合指标向量 )为: 1 1 1 1 2 1 2 12 1 2 1 2 2 2 21 1 2 2p p p p pF a X a X a XF a X a X a XF a X a X a X ( 简写成 1 2 2 1 , 2 , ,i i i i p i pF a X a X a X i p ( 其中,n 维向量,所以n 维向量。上述方程组要求: 2 2 212 1 1, 2 , ,i i p ia a a i p ( 且系数 (1) ,.( 不相关; (2) 1,., 21 一切线性组合 (系数满足上述方程组 )中方差最大的,2009 届毕业设计说明书 第 9 页 共 35 页 不相关的 ,., 21 切线性组合中方差最大的, ., ., 21 一切线性组合中方差最大的。如何求满足上述要求的方程组的系数 一节将会看到每个方程式中的系数向量 .),.,( 21 不是别的而恰好是 X 的协差阵的特征值所对应的特征向量,也就是说,数学上可以证明使 )( 1到最大,这个最大值是在协方差阵 的第一个特征值所对应特征向量处达到。依此类推使 )( 到最大值是在协方差阵 的第 P 个特征值所对应特征向量处达到。 成分的几何意义 从代数学观点看主成分就是 P 个变量 ,., 21 一些特殊的线性组合,而在几何上这些线性组合正是把 ,., 21 成的坐标系旋转产生的新坐标系,新坐标轴使之通过样品变差最大的方向 (或说具有最大 的样品方差 )。下面以最简单的二元正态变量来说明主成分的几何意义。 设有 n 个样品,每个样品有 P 个变量记为 ,., 21 们的综合变量记为., 21。当 2P 时,原变量是 21,们有下图的相关关系: 图 主成分的意义 对于二元正态分布变量, n 个分散的点大致形成为一个椭圆,若在椭圆长轴方向取坐标轴1F,在短轴方向聚2F,这相当于在平面上作一个坐标变换,即按逆时针方向旋转 角度,根据旋转轴变换公式新老坐标之间有关系: 1 1 22 1 2c o s s i ns i n c o X ( 矩阵表示为: 中北大学 2009 届毕业设计说明书 第 10 页 共 35 页 1122c o s s i ns i n c o X ( 显然 1 且是正交矩阵,即 。 从上图还容易看出二维平面上的 n 个点的波动 (可用方差表示 )大部分可以归结为在1在2果上图的椭圆是相当扁平的,那么我们可以只考虑1的波动,忽略2样一来,二维可以降为一维了,只取第一个综合变量11般情况 , P 个变量组成 P 维空间,n 个样品就是 P 维空间的 n 个点,对 P 元正态分布变量来说,找主成分的问题就是找 成分分析的推导 在下面推导过程中,要用到线性代数中的两个定理: 定理一 若 A 是 阶实对称阵,则一定可以找到正交阵 U 使 121 00 00 0 U A U , 其中P ,., 21是 A 的特征根。 定理二 若上述矩阵 A 的特征根所对应的单位特征向量为., 21令 1 1 1 2 1 2 2 2 p 2 p u( , , , )u u u ( 则实对称 A 属于不同特征根所对应的特征向量是正交的,即 0 u U U U U I ( 设1 1 2 2 a X a X a X a X ,其中 ,.,( 21 , ),.,( 21 主成分就是寻找 X 的线性函数 相应得方差尽可能地大,即使 ( ) ( )a r F V a r a X a a ( 中北大学 2009 届毕业设计说明书 第 11 页 共 35 页 达到最大值,且 1 设 协方差矩阵 的特征根为P ,., 21,不妨假设 0. P ,相应的单位特征向量为., 21。令 1 1 1 2 1 2 2 2 2 2 2 u( , , , )u u u ( 由前面线性代数定理可知: T ,且 121 00 00 0 u u ( 因此 21 1 1( ) ( ) ( )p p T T T T Ti i i i i i i ii i ia a a u u a a u a u a u ( 所以 21 1 1 1 11( ) ( ) ( ) T T T T T a a u a U a U a U U a a a ( 而且,当 1时有 21 1 1 1 1 1 1 1 1 111( ) ( ) T T T Ti i i i u u u u u u u u u u u ( 因此, 1使 a r )( 达到最大值,且 1 1 1 1()a r u X u u ( 同理 ()a r u X ( 而且 中北大学 2009 届毕业设计说明书 第 12 页 共 35 页 11c o v ( , ) ( ) ( ) ( ) 0 , T T T T Ti j i j i a a a j a i a a u u u u u u u u u u u i j ( 上述推导表明: ,., 21 主成分就是以 E 的特征向量为系数的线性组合,它们互不相关,其方差为的特征根。 由于的特征根 0. P ,所以有 0. PV V V 。了解这一点也就可以明白为什么主成分的名次是按特征根取值大小的顺序排列的。 在解决实际问题时,一般不是取 p 个主成分,而是根据累计贡献率的大小取前 k 个。称 第 一 主 成 分 的 贡 献 率 为1/ ,由于有11() ,所以111/ ( ) / ( )i a r F V a r F。因此第一主成分的贡献率就是第一主成分的方差在全部方差1中的比值。这个值越大,表明第一主成分综 合 ,., 21 息的力越强。 前两个主成分的累计贡献率定义为12 1( ) / , 前 k 个主成分的累计贡献率定义为11/ pk 。如果前 k 个主成分的贡献率达到 85%,表明取前 k 个主成分包含了全部测量指标所具有的信息,这样既减少了变量的个数又便于对实际问题进行分析和研究。 成分分析的计算步骤 设 ,.,( 21 为 n 维随机矢量 ,则 体计算步骤如下: (1) 将原始观察数据组成样本矩阵 X ,每一列为一个观察样本 x ,每一行代表一维数据。 (2) 计算样本的协方差矩阵: ( (3) 计算协方差矩阵相应特征向量中 .,2,1 。 (4) 将特征值按由大到小顺序排列 ,并按照下式计算前 m 个主元的累积贡献率: 中北大学 2009 届毕业设计说明书 第 13 页 共 35 页 11( ) / ( 累积贡献率用于衡量新生成分量对原始数据的信息保存程度 ,通常要求其大于 85%即可。 (5) 取前 m 个较大特征值 对应的特征向量构成变换矩阵 ( , m 0) ,i) = i)() * * ,i); %由前几个主要特征值对应的特征向量所组成的线性变换矩阵 i = i + 1; 显示特征脸 i=1:) aa=,i),112,92); aa=55); ); 特征脸 ); 将训练样本对坐标系上进行投影 ,得到一个 M*p 阶矩阵 %每幅训练样本图像向量进行线性变换后得到的前p 个主成分 0; % 测试过程 i=1:j=():10 %读入测试图像 a=D:,i),j),); 中北大学 2009 届毕业设计说明书 第 32 页 共 35 页 b=a(1:10304); b=b); b * %计算每幅测试图像的主成分 ,即计算它们在变换后坐标系上的投影,是 1p 阶矩阵 k=1:(k)=k,:);%测试图像的主成分和每幅训练图像的主成分求距离 %近邻法则进行分类 %求出最近距离的图像 ()1; )1; )1; if & if i ; %输出识别率 中北大学 2009 届毕业设计说明书 第 33 页 共 35 页 10) 参考文献 1)编著 洪毅 ,马东魁 ,郭国雄 ,刘永平译 M2张媛,张燕平 法及其应用 J2005 年第二期 3, 1998. 4赵静,夏良正,舒志强不同光照条件下特征脸方法的改进研究 J计算机应用研究 2 5向东进 M国地质大学出版社 316 999 7 王耀南 ,李树涛 M高等教育出版社, 2001 8 马燕 ,李顺宝 M上海百家出版社 ,2007 9 夏良正 M东南大学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论