人脸识别研究的背景意义现状及特征提取方法研究_第1页
人脸识别研究的背景意义现状及特征提取方法研究_第2页
人脸识别研究的背景意义现状及特征提取方法研究_第3页
人脸识别研究的背景意义现状及特征提取方法研究_第4页
人脸识别研究的背景意义现状及特征提取方法研究_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人脸辨认研究的背景意义现状及特性提取方法研究1研究背景与意义 12国内外研究现状 22.1人脸辨认的研究现状 22.2人脸辨认中稀疏编码的研究现状 33人脸的特性提取方法概述 53.1基于局部特性的方法 53.2基于整体特性的方法 5基于特性脸方法 6基于弹性匹配的方法 6基于神经网络的方法 6基于不变性的方法 6基于Fisher线性判别方法 71研究背景与意义人脸辨认技术具有广泛的应用前景,在国家安全、军事安全和公共安全领域,智能门禁、智能视频监控、公安布控、海关身份验证、司机驾照验证等都是典型的应用;在民事和经济领域,各类银行卡、金融卡、信用卡、储蓄卡的持卡人的身份验证,社会保险人的身份验证等具有重要的应用价值;在家庭娱乐等领域,人脸辨认也具有一些有趣有益的应用,比如可以辨认主人身份的智能玩具、家政机器人,具有真实面像的虚拟游戏玩家等等。近年来许多神经生理学家在视觉系统上已展开了全面进一步的研究,并且取得了一些有重要意义的研究成果。这就使得在工程上运用计算机来模拟视觉系统成为也许。基于这一结识,运用已有的生物学科研成果,联系信号解决、计算理论以及信息论知识,通过对视觉系统进行计算机建模,使计算机能在一定限度上模拟人的视觉系统,以解决人工智能在图像解决领域中碰到的难题。神经稀疏编码算法正是这样一种建模视觉系统的人工神经网络方法。这种算法编码方式的实现仅依靠自然环境的记录特性,并不依赖于输入数据的性质,因而是一种自适应的图像记录方法。传统的人脸辨认系统中,不管是基于整体的或者局部特性的人脸辨认方法,都需要建立很好的模型来提取特性,而稀疏编码理论对特性的选取方面规定相对较低,所以结合特性提取方法再对稀疏编码算法进行进一步研究,并应用到人脸辨认中,扩展了人脸辨认的方法理论,将会对该领域的研究起到一定的促进作用,因此具有很重要的学术意义。目前,稀疏编码SC方法在盲源信号分离、语音信号解决、自然图像特性提取、自然图像去噪以及模式辨认等方面已经取得许多研究成果,具有重要的实用价值,是当前学术界的一个研究热点。进一步研究稀疏编码技术,不仅会积极地促进图像信号解决、神经网络等技术的研究,并且也将会对相关领域新技术的发展起到一定的促进作用。2国内外研究现状2.1人脸辨认的研究现状人脸辨认的研究历史比较悠久,Galton早在1888年和192023就分别在《Nature》杂志发表了两篇关于运用人脸进行身份辨认的文章,对人类自身的人脸辨认能力进行了分析,但当时还不也许涉及到人脸的自动辨认问题。最早的关于人脸辨认问题的研究论文见于1964年Bertillon在PanoramicResearchInc.发表的技术报告,和1965年Chan在PanoramicResearchInc.发表的技术报告,到现在已有四十余年的历史。近年来,人脸辨认研究得到了诸多研究人员的青睐,涌现出了诸多技术方法。特别是1990年以来,人脸辨认更得到了长足的发展,每年都有大量的学术论文发表。现在,几乎所有知名的理工科大学和IT产业的重要公司都有研究组在从事人脸辨认的研究。人脸辨认的研究大体可分为四个阶段。第一个阶段以Bertillon,Allen和Parke为代表,重要研究人脸辨认所需要的面部特性。该阶段是人脸辨认研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。第二个阶段是人机交互辨认阶段。该阶段代表性工作是Goldstion,Harmon和Lesk等用几何特性参数来表达人脸正面图像。他们用21维特性矢量表达人脸面部特性,并设计了基于这一特性表达的辨认系统。在这个阶段,Kanade博士于1973年在京都大学完毕了第一篇人脸辨认方面的博士论文。该阶段的方法仍摆脱不了操作员的干涉。第三个阶段是真正的机器自动辨认阶段。这一阶段时间相对短暂,但却是人脸辨认研究的高潮期,不仅诞生了主成分分析、线性判别分析、弹性图匹配、局部特性分析、独立分量分析、支持向量机、神经网络、隐马尔可夫模型、柔性模型(FlexibleModels)(涉及积极形状模型(ASMs)和积极表观模型(AAMs))等若干代表性的人脸辨认算法,美国军方还组织了著名的FERET人脸辨认算法测试,并出现了若干商业化运作的人脸辨认系统,最为著名的是Visionics(现为Idenfx)的Facelt系统。这一阶段的人脸辨认技术发展非常迅速,所提出的算法在较抱负图像采集条件、用户配合、中小规模正面人脸数据库上达成了非常好的性能。从技术方案上看,2D人脸图像线性子空间判别分析、登记表观模型、记录模式辨认方法是这一阶段的主流技术。第四个阶段是鲁棒的人脸辨认技术的研究阶段。近几年来,研究人员针对影响人脸辨认的一些重要因素,例如光照、姿态、表情、年龄、遮挡、低分辨率等变化因素,提出了很多解决方法。如对于光照变化的解决方法重要有熵图像法、光照锥法、球谐波函数法、九点光源法等。对于姿态变化的解决方法重要有多视角法、局部到整体几何特性变换匹配法、通用3D模型法、3D形变模型法、光流场法[7]等。总体而言,目前非抱负成像条件下(特别是光照和姿态)、用户不配合、大规模人脸数据库上的人脸辨认问题逐渐成为研究的热点。解决这类问题的方法的特点是通过描述和补偿变化因素,从而提高算法的性能。非线性建模方法、基于Boosting的学习技术、基于3D模型的人脸建模与辨认方法等逐渐成为备受重视的技术发展趋势。目前,国外对人脸辨认问题的研究很多,比较著名的有CMU(卡耐基·梅隆大学)、MIT(麻省理工学院)、YALE(耶鲁大学)等机构;国内的清华大学、中国科学院自动化研究所、上海交通大学、南京理工大学、哈尔滨工业大学等单位都有人员从事人脸辨认相关工作的研究。关于人脸辨认研究的重要国际会议有IEEE的FG(IEEEInternationalConferenceAutomaticFaceandGestureRecognition)、ICIP(InternationalConferenceonImageProcessing)、CVPR(ConferenceonComputerVisionandPatternRecognition)等。2.2人脸辨认中稀疏编码的研究现状假设条件稀疏编码模型可以表达初级视觉皮层简朴细胞编码外界视觉刺激图像的过程和特性,这种动态映射和表达层细胞的发放特性导致了细胞发放的稀疏分布。由于哺乳动物的视觉生理过程是很复杂的,在用稀疏编码模型模拟初级视觉系统神经元的感受野特性时,通常需要设立以下的假设:输入数据具有稀疏性(或超高斯性)结构;各个稀疏系数之间是记录独立的;稀疏变换是一种线性变换;基函数非奇异,即特性矩阵的行列式;有噪声时,稀疏分量和噪声信号是互相独立的。稀疏编码模型基于上述假设的稀疏编码模型的研究重要内容有:Olshausen等人把超完备基(基函数A的维数大于输出神经元的个数)引入到稀疏编码模型中,运用概率密度估计模型建模V1区感受野,并应用于时变的(time-varying)自然图像数据;此模型比静止自然图像的稀疏编码模型计算复杂,训练时间也较长;Tenenbaum等人提出了双线性稀疏编码模型,对稀疏系数和基函数进行两次稀疏变换,可以更好地体现自然图像的内容和类型,但训练速度较慢;Olshausen和Simocelli从小波变换的角度对自然数据进行神经表达和有效编码,这是一种完备基(基函数A的维数等于输出神经元的个数)的稀疏编码模型,此模型对图像数据的类型具有依赖性;Oja和Hyvärinen等人围绕ICA模型和不变特性子空间展开进一步研究,由于ICA方法规定的假设条件太强,其应用范围受到限制;Hoyer在Olshausen和Field提出的标准稀疏编码模型的基础上,提出一种非负稀疏编码(NNSC)模型。NNSC模型考虑了人眼以不同的通道(ON-channel和OFF-channel)接受非负数据,符合人眼的生理特性和主视皮层V1区简朴细胞神经元的电生理特性,但由于模型过于简化,易受噪声的干扰;Donoho等人提出的通过L1范数最小化的通用字典的最佳稀疏表达方法。该方法的困难在于如何选择恰当的“字典”,以获得最大的稀疏性;我国的杨谦[9]等运用二维Gabor小波函数建立的一个基于超定完备基的简朴细胞群稀疏编码的计算模型,并实现了自然图像的编码;我国的孙玉宝等提出的基于Gabor感知多成份字典的图像稀疏表达算法,根据图像的几何结构特性建立匹配各层面图像结构的Gabor感知多成分字典,该字典具有对图像中平滑、边沿与纹理结构的自适应性。稀疏编码存在的问题目前,由于人们对主视皮层V1区如何对复杂的自然环境进行有效编码的过程仍然知之甚少,所以上述的稀疏编码模型只是一种启发式的学习方法。重要存在的问题[10]是:理论依据不完善。主视皮层V1区的稀疏编码的研究一方面必须借助感知神经科学的研究成果,必须结合计算技术、记录学理论、估计理论、人工神经网络等基础理论。这些理论的发展和完善有助于稀疏编码理论的发展;神经元估计模型不精确。稀疏编码算法必须依靠一个好的神经元的计算模型,这个计算模型必须建立在神经生理科学研究的成果上。目前科学家们对V1区神经细胞复杂的响应特性的研究仍处在探索阶段,故对V1区的神经元建模问题仍处在不断发展和完善的状态。3人脸的特性提取方法概述人脸特性重要可分为几何特性和代数特性两大类:几何特性也称为直观特性,它是以人脸器官的形状和几何关系为基础的特性矢量,其分量通常涉及人脸指定两点间的欧氏距离、曲率、角度等;代数特性即人脸图像在本征空间形成的降维投影。人脸的几何特性比较稳定,受人脸的姿态变化与光照条件等因素的影响小,但是不容易抽取,并且测量精度也较差;人脸的代数特性容易得到,但是稳定性较差,容易受到外界因素的影响。目前国内外研究人脸辨认的方法层出不穷,人脸特性提取的方法可分为基于局部特性的辨认和基于整体特性的辨认。下面对这些方法进行分别介绍。3.1基于局部特性的方法基于局部特性的方法是从脸部器官的形状及其互相位置关系为出发点,提取与辨认人脸特性。尽管各个人的脸部器官在形状、大小上存在一定的差异,但其互相位置关系及特性点形状等特性方面均有一定的规律,这为人脸特性提取与辨认提供了也许。局部模板匹配是一种较为常用的方法。文献[11]采用可变形模板技术建立眼睛模型,根据能量函数调整模板参数达成最佳匹配,以实现人脸辨认目的。受人脸侧面轮廓的启发,使用一种简朴而有效的灰度投影方法进行人脸特性提取与辨认,并运用于三维人脸辨认。由于灰度投影法的特性,可将其与模板匹配方法结合,提高辨认的效果。3.2基于整体特性的方法基于整体特性的方法从整体上对人脸进行特性提取,进而辨认人脸。单个器官的某些变化不会对整个人脸辨认导致多大影响。此类方法较多,它是目前人脸辨认领域的一种主流方法。基于特性脸方法特性脸方法是从主分量分析法导出的一种人脸辨认方法。K-L变换是种常用的正交变换,将其用于人脸辨认取得了较好的效果。它根据一组人脸图像构造主分量子空间,由于主元具有人脸的形状,也称特性脸。将测试图像投影到主分量子空间上,得到了一组投影系数,与各个已知的人脸图像进行比较辨认,取得了较好的辨认效果。特性脸方法原理简朴、易于实现,实质上是一种记录性的模板匹配方法。特性脸方法把人脸作为一个整体来解决,大大减少了辨认复杂度。但是,由于忽视了人脸的个性差异,该方法有一定的理论缺陷。研究表白,随着光照条件、人脸角度及人脸相对尺寸的变化,辨认率将急剧下降。实验证明,特性脸方法的辨认率随训练图像数目的增大而增大,当然,计算复杂限度也相应增长了。基于弹性匹配的方法该方法采用网格作为模板,将图像间的比较变为网格间的比较。使用一种基于动态链接结构的弹性匹配法来定位人脸,并根据人脸数据库进行匹配辨认。将物体用稀疏图形描述,其顶点用局部能量谱的多尺度描述来标记,边则表达拓扑连接关系,并用几何距离标记,再应用弹性图形匹配技术来寻找最近的已知图形。弹性匹配方法整体辨认性能优于特性脸方法,但计算量大、辨认速度慢。基于神经网络的方法人工神经网络目前正越来越被频繁地应用于人脸辨认,大部分的人脸辨认神经网络都采用多层感知器和BP(Backpropagation)学习算法。实验表白该法具有较强的适应能力和鲁棒性,可以有效地运用与多人脸、不同尺寸、不同姿态、不同肤色、不同光照条件和复杂背景的情况,是一种有效的人脸辨认方法。并且通过适当增长训练样本的数量和类型,可以进一步提高辨认性能。由于神经网络方法具有良好的学习特性,且不受模式形变的影响,所以使用神经网络的方法辨认效果较好,其发展趋势是使用混合神经网络或神经网络群来达成更好的辨认效果。基于不变性的方法运用人脸的某种稳定的不变性特性也可进行人脸辨认。奇异值具有稳定性、不变性(旋转、平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论