版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、摘要人脸识别技术是一种新型的身份识别技术,它是生物识别技术的一种,人脸识别技术也是一个非常活跃的研究领域,它覆盖了数字图像处理等诸多领域。随着人们应用需求的不断深入,人脸识别技术将呈现出主流化、芯片化、标准化发展趋势。人脸识别系统主要由检测与定位、特征提取与识别两部分组成,在这两部分的基础上还包括预处理等步骤,对于一个全自动的人脸识别系统,整个的识别过程可归纳为人脸检测与定位、特征提取和识别。实现流程如下:首先是预处理,对图像进行光照处理等以改善图像质量;检测与定位,从不同场景中检测出人脸并将其从背景中分割出来;对人脸库中所有图像大小和各器官位置归一化;最后对归一化的人脸图像进行特征提取与识别
2、。由于动态识别研究处于起步阶段,该技术相对较欠缺,因此本文只研究基于静态人脸图像的识别方法。关键词:人脸识别;数字图像处理;检测方法AbstractFace recognition technology is a new identity, it is a kind of biometric technology, face recognition technology is also a very active research area, which covers digital image processing and many other fields. With the deepen
3、ing of peoples application requirements, the face recognition technology will appear in the mainstream, chip, standardization, development trends. Face recognition system mainly by the detection and location, feature extraction and recognition of two parts, including the pretreatment steps in these
4、two parts on the basis of a fully automatic face recognition system, the whole recognition process can be summarized as the human face detection and location, feature extraction and recognition. The process is as follows: First, pretreatment, light processing to improve image quality; detection and
5、location on the image to detect a persons face from different scenes and split out from the background; face database image size and each organ location normalization; Finally, the normalized face image feature extraction and recognition. Dynamic discrimination in its infancy, the technology is rela
6、tively lacking This article only study identification method based on the static face images.Key Words:face recognition; digital image processing; detection method- 2 -目录摘要1Abstract21 绪论11.1 课题背景11.1.1 课题来源11.1.2 生物特征识别的意义11.1.3 生物特征识别分类21.1.4 人脸识别技术51.1.5 人脸识别技术的研究意义61.2 人脸识别发展历史与概况71.3 人脸识别的难点82 人
7、脸识别的相关理论92.1 人脸特征92.1.1 肤色特征92.1.2 灰度特征92.2 PCA的基本概念92.2.1 PCA算法的原理102.2.2 PCA算法113 人脸识别算法设计133.1 人脸检测与定位133.2 基于PCA的人脸特征提取143.3 人脸识别方法153.3.1 几何特征法153.3.2 特征脸法163.3.3 弹性图匹配法173.3.4 神经网络法184 基于PCA的人脸识别系统设计194.1 算法流程194.2 人脸识别系统实现195 总结及展望225.1 总结225.2 展望22致谢语23参考文献24附录25241 绪论1.1 课题背景1.1.1 课题来源随着安全入
8、口控制和金融贸易方面应用需要的快速增长,生物统计识别技术得到了新的重视。目前,微电子和视觉系统的新进展使得高性能自动识别技术在成本领域的实施降到可接受的水平。而脸识别是所有的生物识别方法,人脸识别技术中应用最广泛的技术之一是近年来的一种新的识别技术,它是一种生物识别技术。随着应用需求的不断深入,人脸识别技术将呈现主流,芯片,标准化发展趋势。近年来受到各国研究人员的广泛关注,主要用于安全等领域。人们更多的是在电影中看到这项技术的魔力:警察拍摄嫌疑人的面部图像,输入电脑,将数据库中的数据与警方进行比较,并找出嫌疑犯和犯罪记录的细节。这不是虚构的情节。在国外,国家和军警等安全部门,很多重要部门长期以
9、来一直使用面部识别技术。在家中,面部识别技术研究始于20世纪90年代,主要用于公安,金融,网络安全,物业管理和考勤等。根据信息来源的人脸识别可分为两类:基于静态基于动态信息的面部图像识别和识别。由于其初期的动态识别研究,技术相对较短,因此本文仅针对静态面部图像识别方法进行研究。1.1.2 生物特征识别的意义生物识别技术(Biometric Identification Technology)是利用人体生物特征进行身份认证的一种技术1。生物特征是唯一的(与他人不同)、可以测量或可以自动识别和验证的生理特性或行为方式,分为生理特征和行为特征。生物识别系统对生物特性进行取样,提取其唯一特征并进行身份
10、认证。典型的生物识别系统的系统结构如图1.1:图1.1 生物识别系统结构框图目前的许多计算机系统,包括许多敏感系统,都是使用“用户ID +密码”方式对用户的身份认证和访问控制。事实上,这种方法意味着一些问题。密码,比如说容易忘记,也容易被盗。而且,如果用户忘了他的密码,他无法进入系统,当然可以由系统管理员重设你的密码再次启动工作,但一旦系统管理员忘记了我的密码,只有重新安装整个系统才能工作。相关机构调查,由于忘记密码和IT厂商售后服务造成的问题已成为最常见的问题之一2。除了计算机网络和应用系统,一些传统的需求认证,还有类似的安全问题。如伪造和盗窃证书,不当等级等。一些犯罪通过伪造文件进入秘密地
11、点窃取机密信息,移民或一些非法犯罪伪造签证和护照,这是因为传统文件使用易于伪造,未加密的纸质文件。为了防止这种事件的发生,人们需要直接的身份认证手段,这就是“人体生物识别技术”。他根据每个人都有自己的生物特征来识别每个人的身份。这些特点大多具有“个性”,“终身”和“携带”特征,以确保认证的准确性和可靠性。1.1.3 生物特征识别分类到目前为止,通过现代科技手段,人人同时发现,每个人都有自己的视野,主要生物特征的三个特点有指纹,虹膜,人类细胞的遗传遗传等。虽然还有一些不能完全满足上述三个特点,但在一段时间内,“每个人都有自己的视野”是生物特征的特征,如面部,掌纹识别,言语,行为等已成为专业生物检
12、测的热点研究与开发,学习相关技术,也被称为“生物识别技术”。(1)虹膜识别虹膜识别技术是使用终身不变性的虹膜识别和差异。虹膜识别技术结合相应的算法,可以实现非常高的精度。彩虹模具是眼睛包含颜料环形薄膜,由结缔组织细胞和纤维组成,中间部分是眼睛。因为眼睛的颜色是由虹膜色素所决定的,所谓的虹膜,老叫彩虹。虹膜的结构被确定为人们诞生。虹膜识别是将虹膜的视觉特征转换为512字节代码的虹膜,代码模板存储以供以后使用识别。由于虹膜代码是通过计算的复杂度获得的,并且可以提供更多的特征点,因此虹膜识别具有最高的准确性。整个识别过程非常简单,虹膜的位置可以在一秒钟内完成。虹膜识别技术的缺点,虹膜识别系统只是使用
13、统计原理,小规模实验还没有做过全球认证测试。此外,图像采集设备昂贵,难以实现小型化。(2)视网膜识别视网膜识别技术使用激光来照射眼球的背面,以获得具有唯一性的视网膜特征。视网膜是非常小的神经背后的一些眼睛(1/50英寸),它是人的感觉光,并将是通过视神经到大脑的信息的重要器官,它有一些相似之处膜的功能,用于神经视网膜周围的生物识别血管分布,即视网膜的四层细胞的距离。视网膜扫描设备为视网膜图像,用户的眼睛和输入设备的距离应在半英寸内,并且要读取图像输入设备,眼睛必须处于静止状态,用户的眼睛看着旋转的绿色,输入设备400特征点可以从视网膜获取,与输入指纹相比,指纹只能提供30到40个特征点用于输入
14、,创建模板并完成确认。像虹膜识别技术一样,视网膜扫描可能是最可靠和最可靠的生物识别技术,但没有任何测试,技术将会损害用户的眼球,但仍有待进一步研究。 (3)面部识别基于面部特征的面部识别技术及其相互之间的关系,识别基于这些独特特征的识别技术非常复杂,需要人工智能和机器学习系统的知识,用于捕获两种技术的面部图像的标准视频和热成像技术。标准视频技术通过标准摄像头吸收面部图像或一系列图像,抓住脸部,经过一些重点记录,面部识别技术通常基于以下几种方式:A.分析面部外观特征。B.全球面部图像分析。C.分析了图像中的面部温谱图和面部特征。虽然已经有一些实用的面部识别技术产品,但目前面部识别系统收集的面部图
15、像仍然有一定的局限性,如背景,光,表达,其广泛的最高识别精度范围只有99左右。因此,脸部识别技术主要适用于某些应用中,用户可以抵制类型而完全无需人为干预,其使用效果仍不能令人满意。 (4)签名识别签名作为认证手段成千上万年,我们熟悉银行形式在签名中作为我们身份的象征。数字签名是否是这样一个过程,测量图像本身的运动和每个字母与字母,顺序和压力之间不同速度的签名,签名识别和语音识别,学习的确定是一种行为。使用签名识别更有可能是可以接受的,它是一种公认的识别技术。但随着经验的增长,生活方式随着气质的变化而变化,签名也随之而变,为了处理不可避免的自然变化的签名,我们必须在安全方面妥协;用于签名复杂而昂
16、贵的平板电脑,因为笔记本电脑触控板的分辨率有很大的差异,我们在技术上难以组合这两者,它的尺寸很小型化。(5)语音识别语音识别是一种行为识别,语音识别设备不断测量,记录语音波形和变异特征,然后到现场进行语音和注册语音模板比较,最终判断。语音识别是基于生理特征的声音,它与语言识别的区别不是说自己被识别,而是通过分析语音的独特特征(例如,发音的频率)到识别扬声器。属于非接触识别技术,用户可以自然接受。 和其他的行为识别技术一样,语音因为变化的范围太大,故而很难进行一些精确的匹配;语音会随着音量、速度和音质的变化(例如当你感冒时)而影响到采集与比对的结果。(6)基因识别DNA基因鉴定是迄今为止最准确的
17、生物测定方法之一。但实施技术所需的设备非常复杂和昂贵,还需要专业技术人员的专门培训来操作和使用这些设备,识别时间更长,因此DNA基因鉴定不广泛用于各种日常生活领域。(7)指纹识别指纹识别现在是生物检测研究中最深入的研究,应用最广泛,发展最成熟的技术。指纹识别已经是数百年历史的识别技术。基于指纹识别技术的指纹识别技术,可以从指纹特征值中得出的指纹特征点和指纹特征点等指纹特征点以及完成,分叉点或分支的全局特征指纹和局部特征进行分析,以便可靠地通过指纹确认一个人的身份。平均每个指纹有几个独特的特征点可以测量,每个特征点都有七个特点,大约我们的10个手指具有最低的4900个独立特征可以测量。足以识别指
18、纹识别是一种更可靠的识别方式。指纹识别技术长期以来,已经在司法和刑事调查领域得到应用,使人们经常把指纹识别技术与犯罪调查有关,具有一定的心理阻力,影响了指纹识别系统的可接受性。另外有些人或某些指纹由于指纹特征很少,所以很难形象化,也影响了指纹识别的准确性。指纹识别技术有很多优点:指纹是人体的独特特征,其准确性和复杂性足以提供足够的特征用于识别;如果要增加可靠性,只需注册更多的指纹,识别更多的手指,最多可达十个,每个指纹都是独一无二的;扫描指纹快,使用起来很方便;读取指纹,用户必须手指和指纹采集相互接触,是与指纹采集头直接接触读取人体的生物学特性是最可靠的方法。指纹采集头可以更小型化,价格会更便
19、宜。可以看出,指纹识别技术是最方便,可靠,非侵入和廉价的生物识别技术解决方案,对于广大的市场应用潜力巨大。每种生物识别技术均有各自的优点和缺点,其实用性也与应用的领域密切相关。没有一种技术在任何工作环境下都优于其他技术。常用的各种生物特征识别技术的技术性能比较如表1.1所示:表1.1 常用生物识别技术比较类型鉴别可靠度可否运用1对1比照可否运用1对多比照传感器价格尺寸虹膜很好是是高较大视网膜很好是是高较大面部一般是否低中等签名一般是否低较小语音一般是否极低非常小基因最好是否极高很大指纹很好是是较低非常小1.1.4 人脸识别技术所谓的脸部识别,面部图像或视频是指输入,确定是否有脸,如果有脸,进一
20、步给出每个脸部的位置,大小和各种面部主要器官的位置,并基于此信息,每个面都进一步提取身份,并与图书馆面对的已知脸部进行比较,以便识别每张脸的身份。其研究内容包括以下五个方面:(1)从不同面部检测的背景中检测是否有脸部,并确定其位置,尺寸,形状和过程等信息。与后续认可有关,可以正常工作,并保证最终识别结果的可靠性。(2)面部表示确定说,检测人脸和已知面孔的数据库的描述方式。通常意味着包括几何特征(如欧氏距离和曲率,角度等),代数特征(如矩阵的特征向量)和固定特征模板等。(3)面部识别在狭义上面对认知,往往是指在面对已知面孔的数据库中识别脸部,获取相关信息。这个过程的核心是选择适当的人脸表现和匹配
21、策略,系统结构与人脸表现密切相关。(4)表达/姿势分析即识别表情或手势的面部,并进行分类。(5)物理分类识别面对分类的物理特征,得出的结论是,有些信息如年龄,性别,种族或衍生自少数人的图像,如面部的图像来源于他们的父母孩子的脸像等本文的人脸识别主要是指在狭义上进行人脸识别,是指采用数据库识别已知脸部识别之间的匹配。面部识别是为了具有面部特征的计算机的目的来识别功能的身份。基于人脸识别特征的主要设计到面部检测和识别技术的复杂场景,是一种基于图像理解,模式识别和计算机视觉,如统计和人工智能技术研究方向。1.1.5 人脸识别技术的研究意义(1)富有挑战性的课题人脸识别是机器视觉和模式识别的领域,同时
22、也是最具挑战性的问题之一也有更广泛的应用。人脸识别技术是一个非常活跃的研究领域,涵盖数字图像处理,模式识别,计算机视觉,神经网络,心理学,生理学,数学等学科的内容。如今,虽然在这方面的研究取得了一些令人鼓舞的成果,但FRT在实际应用中仍然面临着一个非常严重的问题,因为面部特征的分布非常相似,而脸本身就是一个灵活的对象,表达,姿势或发型,化妆万花筒正确识别带来了相当大的麻烦。如何正确识别很多人并满足实时性要求是迫切需要解决的问题。(2)面部感知系统的重要内容基于视觉信息的面部感知系统,包括面部检测和跟踪,面部特征位置和面部识别,面部分类(如年龄,种族,性别歧视),面部表情识别,唇读三分系统,如图
23、1所示,你可以看到,面部检测和追逐后,面部特征位置通常是面对感知的一个基本环节,是后续工作的基础,具有重要的意义。虽然脸部识别不能说其他面部感知模块是一个必要的功能,但可以肯定的是,使用已知信息的身份,结合人的先前知识,可以改善表情分析,唇读和言语识别,手势识别和手写识别可靠性。而计算机对用户身份的最直接应用是基于特定的用户环境设置:如用户的个性化工作环境,信息共享和隐私保护等。(3)实际应用广泛人脸识别研究已经有40多年的历史,作为生物识别的一种,广泛应用在身份识别,海关监控等领域。目前,人脸识别技术也逐渐走向了商用,如Eyematic公司研发的人脸识别系统等。目前研究较多的是静态人脸识别技
24、术,计算机静态人脸识别是一个经典的模式识别问题。人脸识别的传统方法主要分为:整体匹配方法,其中最具代表性的是主元分析法,其他混合型的算法。这些人脸识别系统多数都要依赖于面部特征(比如眼睛中心位置)的严格特征匹配来归一化人脸以便提取人脸描述特征静态人脸识别系统主要由检测与定位,特征提取与识别两部分组成,在这两部分的基础上海包括预处理等步骤。常用的人脸识别试验库以美国军方的FERET库最为权威,它包括多人种,多年龄段,各种表情变化,光照变化,姿态变化的图象,图像的数量和实验的人数也非常多,可以充分地验证人脸识别算法。目前尚没有专门测试人脸检测和定位算法的图像库。如图1.2所示是面部感知系统结构图。
25、图1.2 面部感知系统结构图1.2 人脸识别发展历史与概况在1960年代末到70年代初,脸上的研究刚刚开始。是Bledsoe最早的研究人员之一,他建立了半自动人脸识别系统,主要参数如跨度,面部特征点比例。自20世纪90年代以来,要快速提高计算机硬件和软件的性能,以及对面部识别能力的高需求,是开发更健壮的面部识别方法,称为时代2是不可避免的。所以基于整体运算的识别方法,很快成为研究重点,如面法和弹性图匹配法。自90年代中期以来,考虑到人脸识别方法的整体识别和分量分析,结合发展趋势。研究人员开始认识到人脸识别算法必须能够充分利用人脸各种特征信息,整合形状的脸部拓扑结构特征,局部灰度特征和全局灰度分
26、布特征等特点。因此,出现了许多新算法,这些算法是原始的单一算法在一起,常见于完成人脸识别。可变形模型方法的灰度和形状分离是其中之一。90年代末,一些商业面部识别系统开始逐渐进入市场,面部识别技术是当今国际上最重要的手段之一。然而,这些技术和系统与实际应用,性能和准确性有一定距离。自2000年以来,面部识别方法的表现虽然有一定的提高,但仍然存在与人们要求的差距,现有的照明方法,年龄,条件变化等表情,姿势距离更敏感,当某些条件发生变化时,识别效果不是很理想。目前,人脸识别技术仍然只能用于某些要求的精度不高。1.3 人脸识别的难点目前人脸识别的难点主要存在于以下几个方面:(1)光照变化是影响人脸识别
27、性能的最关键因素,对这个问题的解决程度关系着人脸识别实用化进程的成败,在人脸图像预处理或者归一化阶段,尽可能地补偿乃至至消除其对识别性能的影响。(2)成像角度及成像距离等因素的影响,即人脸的姿态的变化,会垂直于图像平面的两个方向的深度旋转,会造成面部信息的部分缺失。(3)不同年龄的人脸有着较大的差别。身份证是以前照的,在逃犯的照片也是以前的,因此在公安部门的实际应用中,年龄问题是一个最突出的问题。(4)采集图像的设备较多,主要有扫描仪,数码相机,摄像机等。由于成像的机理不同,形成了同类人脸图像的识别率较高,而不同类间人脸图像识别率较低的情况。随着人脸识别技术的发展,这一问题也将逐步得到解决。(
28、5)人脸图像的数据量巨大。目前由于计算量的考虑,人脸定位和识别算法研究大多使用尺寸很小的灰度图像。一张64 * 64像素的256级灰度图像就有4096个数据,每个数据有256种可能的取值。定位和识别算法一般都很复杂,在人脸库较大的情况下,计算量十分大,很多情况下速度令人难以忍受。而灰度数据事实上是丧失了色彩,运动等有用信息的。如果使用全部的有用信息,计算量就更了了。2 人脸识别的相关理论特征提取是人脸识别中的核心步骤,直接影响识别精度。由于人脸是多维弹性体,易受表情、光照等因素影响,提取特征的困难较大。特征提取的任务就是针对这些干扰因素,提取出具有稳定性、有效性的信息用于识别。2.1 人脸特征
29、人脸特征3是识别的重要依据之一,检测定位过程中也会用到人脸特征,其中肤色特征和灰度特征是两类常用特征。2.1.1 肤色特征由肤色模型描绘的皮肤特征的颜色,其使用统计方法对目标对象建模的颜色。 基于颜色特征的识别方法简单,可以快速定位脸部。 脸部肤色不依赖于细节,大部分背景颜色差异,但方法对光和图像采集装置的特性敏感。 肤色在颜色空间聚合,肤色复杂,造成统一造型的一定难度。 该方法通常用作统计模型的辅助辅助方法,适用于粗略位置或对运行时间要求较高。2.1.2 灰度特征灰度特征包括轮廓特征,灰度分布特征(直方图特征,镶嵌图特征等),结构特征,模板特征等。由于人脸五官位置相对固定,灰度分布呈一定规律
30、性,因此,可利用灰 度特征来进行人脸识别。通常采用统一的方法或特征空间变换的方法进行灰度特征的提取,如利用K-L变换法4(由卡尔胡宁(Karhumen)与勒夫(Loeve )分别提出的一种图像变换方法)得到的特征脸,利用小波变换得到的小波特征等。2.2 PCA的基本概念主成分分析(PCA)是广泛使用的特征提取方法之一,最早提出了Ttirk和Pentland。基本思想是将面部变成矢量矩阵,然后提取特征向量。 PCA方法是模式识别领域的有效方法近年来也得到了一定的发展。与传统PCA方法相比,2004年提出的ZDPCA方法是处理lh-zd矩阵更有效的方法之一,不需要将图像转换为向量,而是将原始图像矩
31、阵直接用于协方差矩阵的重建图像,与协方差矩阵的PCA方法相比,协方差矩阵的大小的ZDPCA图像较小,如:假设图像的大小为128128,ZDPCA协方差矩阵大小为128128,因此,ZDPCA具有显着的优越性计算。最近很多研究表明,ZDPCA方法在模式识别方面,特别是在面部识别领域是非常受欢迎的,是基于子模式二维二维主成分分析的人脸识别,通过阻挡原始图像,该方法可以有效提取原始图像的局部特征,同时通过直接在子图像矩阵中使用双向二维主成分的方法进行特征提取,避免矩阵向量变换,可以精确计算特征向量的协方差矩阵并能有效降低特征尺寸,方法在姿势条件下,面部表情和光照条件发生变化,具有良好的识别性能;模块
32、ZDPCA文章7提出改进面部识别方法,每个子块的训练样本中每个训练样本的类别和类中的自适应加权平均值的方法,以及训练样本类中的自适应加权平均值对相应子块的类进行归一化处理,然后由归一化子块组成的通用离散度矩阵,得到最优投影矩阵;通过将训练样本和测试样本的子块子块的训练集合的加权平均值,将子块的投影矩阵标准化为最佳投影矩阵,并获得识别特征,该方法可以更好地反映局部特征图像差异,提高识别率;文章8提出了一种模块化ZDPCA和CSPCA面部验证算法,该方法从原始数据,二维数据块中使用ZDPCA进行特征提取,可以有效提取局部特征的图像,而不是新的原始图像的低维模式,则CSPCA的新模式(基于客户相关的
33、子空间线性判别分析方法),不仅在类中,类差异,构成了PCA的缺陷。和客户相关的子空间可以更好地描述不同个体之间的差异,比传统判别能力的个体特征更好。这种方法可以更好地描述脸部特征,缩小尺寸,计算简单。由于协方差矩阵的维数,将图像矩阵转换为高维向量的PCA方法是高且较少的训练样本,导致计算复杂度和难度增加。 ZDPCA方法直接通过使用二维图像来计算协方差矩阵,由于其协方差矩阵和相对足够的训练样本,ZDPCA方法计算特征向量的协方差更准确,更快。虽然在文章中已经表明ZDPCA方法比传统的PCA方法有很多优点,但也有缺点:首先,需要更多的系数来表示图像,是基于双向ZDPCA投影提出的,首先在同一个时
34、间为lh-zd矩阵空间的行和列方向为最佳投影,然后lh-zd面向行向量和列的矩阵投影到两个不同的子空间,两边的投影方法是最大的优点是与最小量的面部图像系数,从而达到最高的压缩率;二,笔者在文章中已经失去了一些ZDPCA协方差信息的方法,这个信息包括一些重要的面对局部几何结构变化信息,但PCA方法可以保留信息。如果ZDPCA方法可以用于协方差的更多信息,则可以提高该方法的识别率。因此,本节ZDPCA方法研究如何使用协方差更多的信息。2.2.1 PCA算法的原理令为表示环境的维随机变量。假设均值为零,即:令w表示维单位向量,在其上投影。这个投影被定义为向量和w的内积,表示为:满足约束而主成分分析的
35、目的就是寻找一个权值向量w使得表达式Ey2的值最大化:根据线性代数的理论,可以知道满足式子值最大化的w应该满足下、式:即使得上述式子最大化的w是矩阵Cx的最大特征值所对应的特征向量。2.2.2 PCA算法从本质上来说,主成分分析法是一种线性映射算法,它的算法步骤如下:设原始观测数据样本集合为一组(个)零均值(如果不是的话,则先做去均值预处理,相当于对全体向量作一次平移变换)的n维随机向量:,以样本集合的协方差矩阵(总体散度矩阵)为产生矩阵。即, 或 其中为观测样本的均值向量,由于是零值向量,所以为零值向量。显然,是一个对称、半正定的nn矩阵,对它进行特征值分解得到: 其中U是正交矩阵,是的特征
36、值,且,各特征值对应的特征向量就是矩阵U的各列(从左到右),它是一组正交基。作线性变换y =UTx,原始的各观测数据向量变换成一组特征向量,其协方差矩阵为: 新特征向量组的称为第个主成分。显然,的第个特征值等于的方差,第个主成分的方差贡献率为: 那么前m个主成分的累计方差贡献率为: 当前m个主成分的累计方差贡献率足够大时,就可以只取前m个主成分作为新特征,而将其余的n-m个新的特征舍去,从而实现了观测数据样本集合的特征提取。此时重构误差的极小值为: 重构误差的极小值为: 3 人脸识别算法设计当人脸图象的来源是一幅静态图象时进行的人脸识别属于静态人脸识别。人脸识别算法包含2部分:人脸定位和归一化
37、(如图3.1),对于一个全自动的人脸识别系统,整个的识别过程可归纳为人脸检测与定位、特征提取和识别,这两个环节独立性很强,而在许多特定情况下,人脸检测与定位工作比较简单,而“特征提取与识别”环节得到了更为广泛和深入研究。图3.1 人脸定位3.1 人脸检测与定位目前人脸检测还是一个相当困难的工作,其中所面临的问题可以归结如下:图像中是否存在人脸:这是人脸检测不同于其它有关人脸研究工作的地方,即如何判断图像中是否存在人脸,如何区别人脸和类似人脸的非人脸图像。检测不同表现形式的人脸:人脸可能以不同视角出现在图像中,也可能被某些物体遮挡,造成某些用于检测而需提取的人脸特征不可见。图像中存在着噪声:由于
38、成像时亮度、对比度等因素的影响使图像不清晰,人脸与背景区别不大,给检测带来一定的难度。人脸自身的因素:由于人脸结构复杂,某些局部特征具有随机性(如眼镜、胡须、发型等),而且还存在着不同表情的人脸,这些都给人脸检测带来难度。由此可见,人脸检测是一个复杂而具有挑战性的问题。任意给定一个图像或者一组图像序列,人脸检测的目的就在于判定该图像或图像序列中是否存在人脸。如果存在,则返回其位置和空间分布,将所有人脸从背景图象 中分割出来,并确定每个人脸在图象中的大小和位置,人脸检测系统的输入是可能包含人脸的图象,输出是关于图象中是否存在人脸以及人脸的数目,位置 ,尺度等信息的参数化描述。根据这个定义可知,人
39、脸检测可分为两类:第一类是在静止图像中判断是否存在人脸,若存在,则定位人脸的位置;第二类 是在视频图像序列中判断是否存在人脸,若存在,则动态地跟踪人脸。显然,后一种所采用的人脸检测方法要比前一种困难。人脸检测的基本思想是用知识或统计的方法对人脸建模,比较所有可能的待检测区域与人脸模型的匹配度,从而得到可能存在人脸的区域。3.2 基于PCA的人脸特征提取通常得到的数据量直接由图像很大,为了有效地分类识别,是转换原始数据,最能反映分类性质的特征,这是特征提取和选择的过程。 我们称之为由原始数据测量空间组成的空间,称为特征空间分类的空间取决于。 通过转换,我们可以将所述模型的高维空间的测量值放在下模
40、型的特征空间的维度上。 特征空间模型中的表示也称为样本,它通常表示为向量,即特征空间中的单个点。人脸图像可以看作是一个矢量(如图3.2所示),如果图像的高度和宽度分别为h和w,则对应的矢量维数为w*h,人脸矢量属于一个空间,称为是图像空间。图3.2 人脸矢量示意图7由于每个人脸都非常类似,在相同的位置都有两只眼睛,一个嘴巴,一个鼻子等等,所以在图像空间里所有的人脸矢量都聚集在一个狭窄的区域内(如图3.3所示),所以整个图像空间不是人脸描述的一个优化空间,PCA主元分析法的任务就是构造一个能更好描述人脸的人脸空间,降低空间维数,使新的人脸空间的基向量(又叫主元)能更好地描述典型的人脸模式。图3.
41、3 人脸空间示意图8PCA主元分析法又称Karhunen-Loece(KL)变换,它的目的是降维,人脸空间是典型的高维空间,一个128*128像素的人脸若视为向量,就有16384维,运算极不方便。若将人脸看作是平稳的高斯过程,就可以利用KL变换提取主元,达到降维的目的。KL变换是图像压缩的一种最优化变换,高维的图像空间经过KL变换后得到一组新的正交基(主元),保留其中最重要的正交基,由这些正交基可以组成低维线性空间。如果假设人脸在这些低维线性空间的投影具有可分性,那么就可以把这些投影用作识别的特征向量。这就是PCA的主要思想。PCA最早是由统计学发展过来的,然后就被用在人工神经网络理论中,所以
42、对PCA的理论描述可以从两方面进行,一种是从人工神经网络理论这个角度来理解,这样相对来讲比较直观。另一种就是从统计学角度来理解,这就比较严格,比较难懂,因为这是严格的按照数学的理论来推导出来的。3.3 人脸识别方法高水平的识别工作一般需要复杂的处理过程,如将图象映射到表面,恢复为三维模型,进行模型匹配等,但基于二维的图象处理也可进行人脸识别,下面介绍常用的几种方法。3.3.1 几何特征法很多人也将使用面部识别中的几何特征方法。例如,常用的几何特征具有面部特征如眼睛,鼻子,嘴巴,脸部特征的局部形状特征和面部特征分布在脸部上的几何特征。通过拓扑先验知识的面部几何关系来提取特征。在这种基于几何特征的
43、识别中,将其识别为特征向量的匹配,基于欧几里德距离的决策是最常用的识别方法。面对眼睛,鼻子,嘴巴,下巴等部位,由于这些部件的形状,尺寸和结构各不相同,使得世界各个面孔在千差万别,所以对于这些部分的形状和结构几何描述之间的关系,可以作为面部识别中最重要的特征。使用几何特征进行正面识别通常通过提取人眼,嘴,鼻等重要特征点位置和重要器官如眼几何作为分类特征。基于几何特征识别方法具有较少的记忆,对光不敏感,其优点简单易懂。这种方法也有一些问题:提取图像的稳定性特征很困难;(2)强烈的表情变化和姿势变化不好的鲁棒性;(3)由于某些信息丢失,适用于粗略分类。可变形模板法可以被认为是改进的几何特征,它是一种
44、经典的模式识别方法,这种方法主要是使用归一化互相关,直接计算两个图像之间的匹配度。最简单的面部模板将面向椭圆形,椭圆形在检测面是图像。另一种方式是面对一组独立的小模板,例如眼睛,鼻子,嘴巴模板模板模板,眉模板和下巴模板等。这些模板必须利用每个功能的轮廓,而传统的方法边缘检测非常难以获得高连续边缘。即使具有高可靠性的边缘,也难以自动提取所需的特性。因此,使用弹性模板法提取特征表现出其独特优势。具有一套弹性模板根据形状的特点,先验知识设计的可调参数被定义。为了找出这组参数,有必要使用图像的边缘,峰谷值和强度信息以及先验知识的形状特征来设计适当的能量函数。参数调整时,能量方向能量在能量达到最大时间时
45、,相应模板的这组参数最符合形状特征。其基本思想是:设计模型参数可调节器官(可变形模板,如图3.4所示),并定义能量函数,并通过调整模型参数来最小化能量函数,将模型参数作为几何特征器官。图3.4可变形模板方法的眼模型93.3.2 特征脸法这种方法的原理是PCA(Principal Component Analysis 主分量分析法)PCA用于特征选择和降低图象维数的一种通用方法,因此可以用K-L变换获取其正交K-L基底,对应其中较大特征值的基底具有与人脸相似的形状,因此,又称之为特征脸,得到人脸重要特征之后,要对其进行主成份分析(PCA),其具体的算法思想如下: 若抽样参加训练的人脸图像有M张,
46、每张图像的维数是N*N,则可以分别表示为:x1、x2、x3、x M ,那么平均脸可以表示为:每张人脸和平均人脸的距离可以表示为:假设矩阵A=d1,d2,d2,d M,特征脸需要做的就是找出矩阵 AAT的前Z个较大特征值的特征向量,但AAT是一个N2*N2维的大矩阵,求这样一个矩阵的特征值计算量是非常大的。为此我们可以先求出 AAT的特征值与特征向量,然后求出uiuj表示AAT的特征向量,uj表示ATA的特征向量,ni是ATA的特征值,uj就是所指的特征脸。求出特征脸以后,所剩下的工作就是要对库中的人脸进行降维,由uj可以组成一个投影矩阵,表示为W=u1u2,,u Z-1,并进行降维:由上式得出
47、所有人脸向量的降维向量。基于特征脸的识别方法优点:它大大降低了原始空间的维数,在这个低维空间中可进行人脸检测和识别。Pentland等人在人脸检测中使用了特征脸方法,得到的特征脸如图3.5所示:图3.5特征脸10缺点:这种方法对照明条件的变化更为敏感。如果您在光线条件下提供面部图像更改,则投影矩阵保留主要元素,并由于光线而发生变化。因此,点投影矩阵不是很好的分类,甚至变得模糊的轮廓。作为面部技术改进,Fisher线性判断标准可以应用于面部识别(Fisher Linear Discriminant,简写为FLD)。并比较PCA和FLD,结论是面对不在区域分类和类别之间不同角色之间的变化,但它们是
48、平等的; FLD的一个缺点是克服了PCA;它可以在类之间的区域分类和散射矩阵内。线性判断标准分析并不总是比PCA好。当每种样本较小时,PCA的效果优于FLD。在许多领域,特别是在面部识别领域,人们不了解不同分类的基本分布。因此,实际上很难找出现有的培训数据(如适用)。他们的研究结果表明,这一考虑是正确的,在一些实验中,PCA的效果优于FLD,而在其他试验中,FLD的作用优于PCA。3.3.3 弹性图匹配法弹性图匹配法11(Elastic Graph Matching)是一种基于动态链接结构(Dynamic Link Architecture,DLA)的方法。该方法在二维空间中为人脸建立属性拓扑
49、图,把拓扑图放置在人脸上,每一节点包含一特征向量,它记录了人脸在该顶点附近的分布信息,节点间的拓扑连接关系用几何距离来标记,从而构成基于二维拓扑图的人脸描述。利用该方法进行人脸识别时,可同时考虑节点特征向量匹配和相对几何位置匹配。在待识别人脸图像上扫描拓扑图结构并提取相应节点特征向量,把不同位置的拓扑图和库中人脸模式的拓扑图之间的距离作为相似性度量。此外,可用一个能量函数来评价待识别人脸图像向量场和库中已知人脸向量场间的匹配度,即最小能量函数时的匹配。该方法使得几何特征描述越来越充分,保留了人脸的拓扑结构和局部特征,通过局部节点调节和弹性图变形,以及局部特征的多级Gabor变换描述,使得该方法
50、对光照,姿态变化等具有较好的适应性。该方法的主要缺点是计算量较大,必须对每个存储的人脸计算其模型图,占用很大存储空间。3.3.4 神经网络法基于神经网络的人脸识别方法是近几年比较活跃的一个研究方向,已被应用于人脸检测、人脸识别、表情分析等问题,并取得了较好的效果。该类方法将人脸用灰度图表征,利用神经网络的学习和分类能力进行识别。通常需考虑两方面的因素:选择图像哪些参数作为输入;选择何种神经网络。目前主要有两种输入策略,第一种是将提取的特征向量作为输入向量;第二种是将图像像素直接输入神经网络。第一种输入策略可有效控制神经网络规模,但对提取特征的要求较高;第二种对于提取要求降低,并可根据样本集自身
51、的方差特征来进行特征选择,但网络规模扩大而造成收敛缓慢。用于人脸识别的神经网络有很多,如基于反向传播(Back Propogation,BP)算法的BP神经网络,该方法基本理论简单且有很强的学习能力,运算量较小;Cottrell等人提出使用级联BP神经网络进行识别,对受损人脸的识别能力较好;LinSH等人提出基于概率决策的神经网络(Probabilistic Decision-Based Neural Network,PDBNN)方法,采用虚拟样本进行强化和反强化学习,从而得到较理想的概率估计结果,并采用模块化网络结构加快学习。径向基函数神经网络(Radial Basis Function N
52、etwork,RBFN)因具有逼近性好、空间描述紧凑、训练速度快等特点也被用于人脸识别。神经网络用以解决复杂模式识别与行为控制问题,其特色在于信息分布式存储,具有良好的容错性、联想记忆功能以及通过学习获取知识并解决问题的能力。但该类方法要求训练集中包含较多的人脸图像,只能适合于小型人脸库。由于原始灰度图像数据量庞大,神经元数目多,该方法运算量较大。4 基于PCA的人脸识别系统设计4.1 算法流程根据前面第二,三章所述,我们知道经过Gabor小波变换后,维数将会变得很高,不利于人脸识别。很多研究成果表明,PCA在多数人脸识别方法中都起到重要的作用,因此降维选择了这种方法。但是,子空间的维数要慎重
53、考虑,通过降维并慎重选择降维后的维数,可以解决人脸识别中的学习问题。图4.1描述了这个人脸识别系统的构成。图4.1 人脸识别系统总体结构具体的训练和识别过程如下:将c个人脸图像通过gabor小波变换后组成训练样本集,其中那么全部人脸图像均值为:对每幅人脸图像求与均值的差值,其协方差矩阵为 根据第三章所提到的计算方法,求出协方差矩阵的特征值和特征向量,从而获得映射矩阵其中,m是与前m个最大特征值对应的特征向量,选择,将训练样本集全部投影到m维特征空间。同样,建立测试人脸库,经过gabor小波变换后,再投影到m维特征空间中,然后根据欧氏距离,通过求出训练图像与测试图像特征点的距离来分类。最后确定类
54、别。4.2 人脸识别系统实现通过GUI架构的支持下,设计了基于图像不均匀分割的人脸识别系统。系统的主界面如图4.2所示:图4.2 系统主界面图像识别结果界面如图4.3所示。图4.3 图像识别结果界面5 总结及展望5.1 总结人脸识别技术(Face Recognition Technology)就是利用计算机分析人脸图像,从中提取有用的识别信息,用来辨认身份的一门技术。由于人的行动和人脸的装饰表情都具有复杂的模式变化,加之存在人脸的图像背景的复杂性,使得人脸的检测成为一个极具挑战的课题,具有很高的学术价值和应用前景。本文主要介绍了静态人脸识别的技术,对其进行了分类总结,同时,详细介绍了其中的关键
55、技术和研究成果。本文综述了静态人脸识别技术国内外研究的现状、以及发展趋势,分析了存在的问题,提出了一些研究思路和技术方案。5.2 展望人类对人脸识别的研究已经有40多年的时间,并取得了相当的成就,但距离实际可用行还有一定的距离,存在的问题也不少。从目前的研究成果来看,成功的人脸识别至少需要考虑以下几个方面:(1)人脸是具有一定可变形部分的三维固体的表面,目前仍存在争议的是在选用人脸模型时,是用二维表面还是三维模型基哪一个更好点。 (2)由于外部干扰不可避免,预处理的效果将会影响到识别结果,好的人脸模型应能够在识别的同时,抑制分离外在干扰的影响。 (3)对于表达人脸的各种特征需要进行比较和选择,
56、以找出人脸最活跃的特征。这可以通过如下两种途径:一是比较同一个人的多张图片,以得到稳定的特征;另一种方法就是比较不同人的图片,以得出该人最“与众不同”之处。 (4)人脸识别是人类视觉的独特过程,因此人脸识别必须结合生理学和心理学的研究成果。致谢语在论文完成之际,我的心情无法平静,从选题、资料收集到论文的撰写整个过程中,老师、同学、朋友给了我热情的帮助,在这里请接受我诚挚的谢意!我首先要感谢xxx老师,在选题以及实验过程中给予我指导。毕老师多次询问实验进程,并为我指点迷津,帮助我开拓思路。毕老师花费很多的精力一遍又一遍指出每稿中的具体问题,严格把关,在此我表示衷心的感谢。同时,我还要感谢在我大学四年悉心教导我,给予我极大关心和支持的各位电信学院领导与老师,是你们教会了我很多有用的知识,特别是教会了我思考问题、解决问题的方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度山砂项目砂石资源采购合同6篇
- 2025年房产买卖居间服务合同规范样本
- 动漫教育发展:2025年《动漫欣赏课》课件展示2篇
- 2025年度个人汽车交易合同范本2篇
- 2025年度纳税担保期限与税务合规合同
- 2025年度个人与公司间的借款逾期罚息合同3篇
- 二零二五年度生态餐饮原物料绿色配送服务合同3篇
- 2025年度个人房屋租赁合同范本(含租金支付方式)2篇
- 2025年度新型电梯销售及居间服务合同协议书范本3篇
- 2025年度门面租赁合同租赁双方权利义务协议4篇
- 冷库制冷负荷计算表
- 肩袖损伤护理查房
- 设备运维管理安全规范标准
- 办文办会办事实务课件
- 大学宿舍人际关系
- 2023光明小升初(语文)试卷
- GB/T 14600-2009电子工业用气体氧化亚氮
- GB/T 13234-2018用能单位节能量计算方法
- 申请使用物业专项维修资金征求业主意见表
- 房屋买卖合同简单范本 房屋买卖合同简易范本
- 无抽搐电休克治疗规范
评论
0/150
提交评论