版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录TOC\o"1-3"\u1绪论 21.1背景及意义 21.2发展状况 22人脸识别 32.1人脸识别概念 32.2影响因素及相应解决方法 42.2.1光照问题 42.2.2姿态问题 42.2.3数据库大小问题 42.2.4遮挡、年龄、表情等问题 43稀疏表示 53.1稀疏表示的意义 53.2稀疏表示的概念 54基于稀疏表示的人脸识别 64.1基于稀疏表示的人脸识别原理 64.2基于稀疏表示的人脸识别算法 84.2.1正交匹配追踪算法 83.2.2快速正交匹配追踪 85实验结果与分析 95.1有表情变化的实验 105.2不同光照条件的实验 106结束语 11
基于稀疏表示的人脸识别算法研究摘要:稀疏表示的数学实质就是在超完备字典下对给定信号的线性分解。本文研究了一种基于稀疏表示的正交匹配追踪(orthogonalmarchingpursuit,简称OMP)算法,递归的对所选原子集合进行正交化,并且利用矩阵cholesky分解简化迭代过程中矩阵求逆的计算。在人脸识别的实际应用中,利用实验样本构建冗余字典,将待检测样本表示成试验样本的线性组合。通过在不同人脸库上的实验证明了该算法的有效性。关键字:稀疏表示;稀疏编码;人脸识别;正交匹配追踪ABSTRACT1绪论1.1背景及意义随着科技的迅猛发展,人类社会已经进入信息时代,信息安全问题日益得到高度重视。钥匙、密码、证件等传统形式的身份认证技术已经远远不能完全满足现代社会中对信息安全有高质量要求的部门的需要。因此,新一代的身份认证技术应运而生。人的生物特征具有唯一性、稳定性等多种优点,已逐渐成为新一代的身份认证技术的主要依据。在众多的基于生物特征的身份识别技术中,人脸识别技术因其自然性、友好性等显著优势而受到广泛关注,目前已经被应用到模式识别、人工智能、计算机视觉、认知科学等多个领域中。然而,由于人脸图像易受到光照、姿态、遮挡和表情等多种因素的影响,识别效果也易受图像数据库大小的干扰,计算机智能识别课题的研究仍然具有较高的挑战性。目前一些学者将稀疏表示用于人脸识别,得到了国内外学者的广泛关注,其基本思想是将待分类图像表示为以训练图像本身作为基原子的字典的稀疏线性组合。1.2发展状况1888年,《Nature》上发表了第一篇利用人脸进行身份识别的文章,由此开启了近代对人脸识别技术的研究。1965年,Chan和Bledsoe共同创建了世界上第一个自动人脸识别系统。随着计算机技术的迅猛发展和相关理论的日益成熟,人脸识别技术的到了快速的发展与广泛的应用,其发展过程大致可以划分为以下三个阶段:起步阶段早期人脸识别技术主要利用人脸的几何结构特性(GeometricFeatureBased)以及它们之间的角度、距离和区域形状等参数作为识别依据。在这一阶段,很多参数的测定需要人工标定,因此只能称之为半自动人脸识别系统,但是这种方法的提出为后续其他方法的提出提供了理论参考。发展阶段90年代初,研究人员发现人脸图像之间存在很强的相关性,人脸图像本身只是高维图像空间中的一个子空间,若直接使用,会因维数过高而产生“维数灾难”等问题。因此,各种降维方法陆续产生。本阶段主要产生了线性判别分析(LinearDisriminantAnalysis,简称LDA)算法、主成分分析(principalcomponentanalysis,简称PCA)算法以及统计模式识别方法等多种算法。攻坚阶段进入二十一世纪,人脸识别技术进入攻坚阶段。在前两个阶段的发展过程中,人脸识别技术已经积累了丰富的理论和大量的算法,基本能够解决可控条件下的身份识别问题。但是,非理想条件、大规模人脸数据库等问题下的人脸识别仍有待解决。针对这些问题,产生了等距离映射(IsometricalMapping,简称ISOMAP)、局部线性嵌入(LocallyLinearEmbedding,简称LLE)、最大方差展开(MaximumVarianceUnfolding,简称MUV)等多种方法,基于稀疏表示的人脸识别方法也生在这一阶段脱颖而出。2人脸识别2.1人脸识别概念人脸识别就是利用人脸的生物特征对身份进行判别,这些生物特征可分为眼、鼻、嘴的几何形状或关系等外部特征以及人脸的结构关系等内部特征两个方面。2.2影响因素及相应解决方法2.2.1光照问题人脸识别系统的性能与人脸识别算法的设计以及人脸图像的质量等有密切的关系。在影响人脸图像质量的众多因素之中,光照问题不容忽视。一般将人脸识别中处理光照问题的方法分为三类:基于图像处理技术的方法;基于子空间的方法;基于光照不变特征提取算法。基于图像处理技术的方法主要从图像本身出发,利用对光照变化不敏感或无变化的特征进行图像处理。基于子空间的方法原理是同一物体在不同光照下的图像属于一个低维度的线性子空间,通过寻求与输入图像最为接近的子空间进行识别。基于光照不变特征提取方法的算法可以分为传统光照不变特征提取和基于人脸反射系数的光照不变特征提取两大类。2.2.2姿态问题姿态问题同样也是人脸识别中亟待解决的一个难点。目前多数的人脸识别算法仅适用于正面或准正面的人脸图像条件下的人脸识别,对于其他姿态下的人脸图像,识别率相对较低。针对这一问题,目前已经提出了局部线性回归(LocallyLinearRegression,简称LLR)算法、基于神经网络的方法和光度立体分析等方法。2.2.3数据库大小问题在人脸识别技术中,人脸图像数据库的大小存在两种极端情况:①人脸图像数据库过大;②单样本或少样本人脸数据库。如果人脸图像数据库过大,则对相关算法的运算速度要求较高,如果人脸图像数据库样本过少,则会影响人脸识别的正确率。针对数据库过大问题,目前主要提出了主成分分析、线性辨别分析和隐马尔可夫模型等方法来提高效率。针对单样本问题,主要的解决方法有样本扩张法、图像增强法和特征子空间扩张法等。2.2.4遮挡、年龄、表情等问题喜怒哀乐,生老病死是所有人类都不可避免的人生成长经历。然而,伴随而来的表情表情年龄、遮挡等问题给自动人脸识别系统的设计增加了很大的难度。目前,针对表情及年龄问题,已提出了基于多分类融合的3D算法、利用三维数据对图像进行重构等方法;针对遮挡问题,也已提出了带遮挡人脸的支持向量机、尺度不变特征变换(ScaleInvariantFeatureTransform,简称SIFT)、随机非均匀局部Gabor二值模式(RandomNonuniformLocalGaborBinaryPattern,简称RNLGBP)等算法。3稀疏表示3.1稀疏表示的意义香农定理表明,模拟信号可以用一定采样频率的周期函数来表示。然而,这种表示方法对信号的分析带来了一些不便。对于压缩问题,希望用较少的系数表示较多的信息;对于识别问题,希望信号的主要特征突出;对于去噪问题,希望将有用信号与噪声进行有效分离。这些应用都有一个共同的特点,就是简化信号的表示(稀疏化)。稀疏表示是压缩感知中的关键理论,数据的稀疏表示,可以从本质上降低数据处理的所需成本,有效提高压缩效率。目前,稀疏表示已经被广泛地用于人脸识别算法中。与传统的算法相比较,基于稀疏表示的人脸识别算法具有识别率高、鲁棒性强的突出特点。3.2稀疏表示的概念研究人员发现,通过使用原子库(过完备冗余函数体系)取代传统完备正交函数集,可有效从原子库中找到具有最佳线性组合的n项原子信号来表示一个给定信号,而这些组合的系数大部分为0或接近于0,即稀疏表示。稀疏表示主要采用稀疏逼近原理即高度非线性逼近原理。对于一个给定集合S={;i=1,2,…,I},其元素是张成整个Hilert空间H=的单位矢量,I≥M。集合S称为原子库,元素称为原子。对于任意给定的信号fH,预想在S中自适应的选取n个原子对信号做n项逼近:=(1)其中是的下标集,card()=n,则B=span(,r)就是由n个原子在原子库S中张成的最佳子集。我们定义逼近误差为:(f,S)=(2)由于n远小于空间的维数M,所以这种逼近也被称作稀疏逼近。由于原子库存在定的冗余性,知上式存在多组解。稀疏表示的目的就是从中选取解的系数最为稀疏的或使n取值最小的解。这个问题等同于下述问题:Minimizesubjecttof=(3)稀疏表示的最初目的是为了以低于香农定理的采样频率表示和压缩信号,事上,在去噪方面,小波变换和平以不变小波也开发出许多有效算法;稀疏表示已成功应用与图像动态范围的压缩,图像卡通和纹理成分的分离等。在这些应用中,算法的性能取决于表示的稀疏性是否忠实于原始信号。4基于稀疏表示的人脸识别4.1基于稀疏表示的人脸识别原理图像预处理训练集图像图像预处理识别结束稀疏表示分类特征提取识别结束稀疏表示分类特征提取图像预处理图像预处理特征提取特征提取图1基于稀疏表示的人脸识别框图稀疏表示人脸识别算法主要建立在压缩感知理论的基础之上。假设每个用户的注册图像都可以在图像空间中划分出一个相对独立的子空间,且任意一张人脸图像都可以由同一用户自身的注册图像集的线性组合来表示,通过计算计算待检测图像相对于所有注册图像集的稀疏表示系数来揭示该待测试图像所属的用户类别。设给定的注册图像集A中有i类已标记好的注册用户,其中第k类中含有个样本。则属于第k类的图像集合可以用矩阵=[,,...,]来表示,且每个图像对应于矩阵的一个列向量,m为人脸图像的维数。为了提高效率,现假定每个注册用户的矩阵对应于用于稀疏表示的训练字典。对于任意给定的测试图像y,若其属于某一注册图像集所包含的类别,那么便可以用的线性组合来表示。为便于理解,现假设第k类中有足够多的训练图像构成矩阵,且待测试图像属于第k类,则可以用具有相同类别属性的第k类训练图像的线性组合近似表示待测试图像,即=++...+其中R,j=1,2,…,(4)然而,一般情况下的待测试图像所属类别并不知晓,因此用于实验的图像字典是由i类训练图像集的所有样本共同构成的,即:A=[,,...,]=[,,...,,...,,...,](5)因此,任意待测试图像y就可以用字典线的性表示,即:Y=Ax(6)其中x=[0,0,…,0,,...,,0,0,...,0]R是一个很稀疏的系数矢量。由x就可以获得关于y的类别信息。显然,若m>n,易知方程组(6)为过定的,解向量x唯一。但是对于人脸识别问题,经降维处理后的样本构成的方程组是典型欠定的,故解向量x并不唯一。由压缩感知理论和稀疏表示可知,如果向量x足够稀疏,那么稀疏解的个数范数问题可以转化为范数问题,即=argminsubjecttoy=Ax(7)4.2基于稀疏表示的人脸识别算法4.2.1正交匹配追踪算法正交匹配追踪算法是稀疏表示的经典算法之一,为求得式(7)提出的问题的最佳逼近解正交匹配追踪算法在每一步的迭代过程中选择和当前迭代残差最相关的原子,将信号正交投影到这些原子张成的空间中,循环计算残差直到满足约束条件(详细步骤见算法一)。注意第5行是贪婪算法选择原子的步骤,第7行是正交投影的步骤。算法1正交匹配追踪Input:dictionaryA,targetsparsityKOutput:sparserepresentationxInit:SetI=[],r=y,x=0while(stoppingcriterionnotmet)do5.=arg6.I=(I,)7.8.r=y-9.endwhile3.2.2快速正交匹配追踪快速正交匹配追踪算法通过在基本的正交匹配追踪算法中对冗余字典采用Cholesky分解,提高了算法的整体效率。算法2快速正交匹配追踪1.Input:dictionaryA,targetsparsityK2.Output:sparserepresentationx3.Init:SetI=[],L=[1],r=y,x=0,=y,m=14.while(stoppingcriterionnotmet)do5.=arg6.ifm>1then7.w=solveforw{Lw=a}8.L=9.endif10.I=(I,)11.=solveforc{LLc=}12.r=y-13.n=n+114.endwhile5实验结果与分析为了验证本文所提算法的有效性,本文选择目前比较常用的扩展的YaleB人脸数据库ORL人脸数据库作为实验数据集分别进行识别精度与时间的测试。我们主要关心在不同的光照和不同的表情两种主要因素下的测试结果。ORL人脸数据库含有40个不同人的脸,每个人脸有10张不同表情的图像,总共400张图像。扩展的YaleB是一个比较大的人脸数据库,含有16128张人脸图像,包含了38个不同人脸的64种光照条件下的不同图像。本实验仅从中选取了一个小的子集,但已足够测试本文算法对光照条件的敏感性。5.1有表情变化的实验本算法随机从ORL人脸库每个人脸的图像中选取不同比重的图像作为训练集,余下的图像做为测试样本,稀疏阈值设置为训练样本数目。表1显示的是随着训练样本比重增大识别率的变化情况。总之,在训练样本足够多的情况下测试样本都可以用字典中所属类别的原子的线性组合来表示。图2ORL数据库不同表情变化表1正交匹配追踪算法应用于ORL数据库训练图像测试图像稀疏阈值识别率(%)用时(s)5556467378285.2不同光照条件的实验本算法随机从扩展的YaleB数据库的一个子集下每个人脸的图像中选取不同比例的图像作为训练集,余下的图像作为测试样本,稀疏阈值设置为训练样本数目。表2显示的是随着训练样本比重变大识别率的变化情况。从中可以看出,本算法在不同光照条件下表现出较高的识别率。图2YaleB数据库种不同光照条件表2正交匹配追踪算法应用于YaleB数据库训练图像测试图像稀疏阈值识别率(%)用时(s)55564673
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 假期读一本好书读后感900字(12篇)
- 2024全新能源开发项目投资与合作合同
- 中式快餐创业计划书
- 2024年工业设备维修协议
- 2024年度4S店租赁期内公共区域维护与管理协议
- 2024年建筑工程消防设计与施工合同
- 2024年企业广告发布与媒体投放合同
- 2024年大数据分析与应用服务协议
- 2024年度「惠州技术开发」合同标的:技术研发与成果共享
- 2024年工程项目混凝土供应合同
- 临床微生物学检验-实验系列肠杆菌科的微生物检验
- GB/T 22844-2009配套床上用品
- GB/T 14683-2017硅酮和改性硅酮建筑密封胶
- 无人机校企合作协议
- 工程设备进场进场开箱验收单
- 中国互联网发展概述XXXX
- GB 16809-2008防火窗
- 2018年木地板公司组织架构及部门职能
- 《百团大战》历史课件
- 银行涉农贷款专项统计制度讲解
- DB31-T 540-2022 重点单位消防安全管理要求
评论
0/150
提交评论