通过基于GaborEye模型的人眼定位方法实现人脸定位与识别-毕业论文_第1页
通过基于GaborEye模型的人眼定位方法实现人脸定位与识别-毕业论文_第2页
通过基于GaborEye模型的人眼定位方法实现人脸定位与识别-毕业论文_第3页
通过基于GaborEye模型的人眼定位方法实现人脸定位与识别-毕业论文_第4页
通过基于GaborEye模型的人眼定位方法实现人脸定位与识别-毕业论文_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

厦门大学本科毕业论文本科毕业论文(科研训练、毕业设计)题 目:通过基于GaborEye模型的人眼定位方法实现人脸定位与识别姓 名:学 院:软件学院系:软件工程专 业:软件工程年 级: 学 号:指导教师(校内): 职称: 年 月通过基于GaborEye模型的人眼定位方法实现人脸定位与识别 摘要 目前在人脸定位领域,基于GaborEye模型的人眼定位法得到了长足的发展。眼睛是人脸上最重要的面部标志,一张精确标准的人脸是鉴定和执行面部分解关键,它取决于两只眼睛的位置以及两眼间的距离。一种新型的GaborEye模型瞳孔定位方法:基于在眼睛与眉毛间区域的特殊灰度分布,一个适当的Gabor内核可以围绕脸突出眼睛与眉毛之间的区域有效的用于分割两个瞳孔间的区域。在取得瞳孔区域后,使用一个高速辐射对称算子来寻找瞳孔的中心。经过广泛的实验证明这种方法可以精确的定位瞳孔位置,即使在变化的面部姿态、表情、附属物以及不同的光照情况下。瞳孔定位的方法可以有效的实现人脸的检测与定位,从而进一步的实现人脸的识别。关键词 瞳孔定位,GaborEye模型,人面识别,辐射对称算子Pupil Localization Method Based On GaborEye Model And Radial Symmetry Operator Realization Face Localization And RecognitionAbstract In the area of human face locating, methods using a GaborEye model has been developed very soon。The eyes are the most important facial landmarks on the human face. The accuracy of face normalization, which is critical to the performance of the following face analysis steps, depends on the locations of the two eyes, as well as their relatively constant interocular distance. A novel GaborEye model for eye localization. Based on the special gray distribution in the eye-and-brow region, a proper Gabor kernel is adaptively chosen to convolute with the face image to highlight the eye-and-brow region, which can be exploited to segment the two pupil regions efficiently. After getting the region of the pupil, a fast radial symmetry operator is used to locate the center of the pupil. Extensive experiments show that the method can accurately locate the pupils, and it is robust to the variations of face poses, expressions, accessories and illuminations.The pupil localization method can efficiently realization the face inspection and localization, Accordingly realization face recognition.Key words pupil localization, GaborEye Model, face recognition, radial symmetry operator目 录第一章 引言71.1人脸定位概述及其与人脸识别的关系71.2人脸定位算法81.3人眼分割和基于GaborEye模型的人眼定位算法91.4人面身份识别系统设计目标9第二章 选题背景102.1人脸识别技术综述102.2人面身份识别系统的开发工具和开发流程11第三章 GaborEye简介153.1GaborEye基本理论153.2GaborEye简介163.3GaborEye的测试17第四章 基于GaborEye的人眼定位方法214.1概述214.2眼睛与眉毛区域的分割214.3瞳孔区域的分割234.4精确定位瞳孔中心24第五章 人脸特征提取与识别255.1概述255.2基于特征脸的方法简介255.3基于特征脸方法的发展情况255.4基于特征脸方法的优劣26第六章人脸识别系统的整体框架276.1人脸识别系统整体结构框架综述276.2人脸检测模块276.3照片处理模块276.4自动识别模块276.5检测结果输出模块28第七章 结束语29致谢30参考文献31ContenceFirst chapter Introduction81.1The relationship between face localization conspectus and face recognition.81.2The algorithms of face localization.81.3Segmentation the eye and pupil localization method based on gaboreye model.81.4Design object of face recognition system.9Second chapter Backdrop of subject chosen112.1 Face localization technic conspectus.112.2 Exploitation tool and flow in face recognition system12Third chapter GaborEye163.1GaborEye theoretics163.2GaborEye brief introduction173.3GaborEye test.18Fouth chapter Roubust gaboreye-based pupil localization method214.1Summarize214.2Segmentation of the eye-and-brow region.214.3Segmentation of the pupil region.234.4Accurate localization of the center pupils.24Fifth chapter Pick up character of the face and recognition255.1Summarize255.2Characteristic face-based metthod.255.3The development of characteristic face-based metthod255.4The excellent and inferior of characteristic face-based metthod.26Sixth chapter Configuration of face recognition system276.1Summarize276.2Module of face back-check.276.3Module of photo disposal.276.4Module of recognition.276.5Module of result disposal28Seventh chapter Unquote29Express teachers and students thanks to30Referrnce31第一章 引言1.1人脸定位概述及其与人脸识别的关系这个毕设所涉及到的是人脸的定位和识别。简单来说,所谓人脸的定位,就是在照片(静态图像)或视频(动态图像)中标出人脸所在的位置,把人脸选取出来。而人脸的识别就是把选取出来的人脸与数据库中已有的人脸进行比较,找出匹配的档案来。有的文献把人脸的定位和识别统称为人脸识别,定位和识别则是两个主要的步骤。完整的人脸识别系统涉及到决定照片或视频中有无人脸,并计数,定位,定出大小,然后根据数据库识别出个人,可能的话还要识别表情,以及根据脸的图像做出描述(瓜子脸,丹凤眼等等就是日常生活中“描述”的例子),或者反过来根据描述挑选匹配的人脸图像。在日常生活中,我们主要根据脸来识别一个人。交谈中,我们往往看着对方的脸,尤其是眼睛。脸上的表情也是进行交谈的一个重要部分。所以,人脸在人与人的交流过程中起着极其重要的作用。这就决定了在现代社会中,使用计算机自动进行人脸的定位和识别工作有着重要的意义。其应用领域包括很多方面,比如身份鉴别,保安系统,人机交互界面等等。人脸识别系统虽然有诱人的应用前景,但是在现实中却还没有开始大规模的使用。其主要原因之一就是用计算机自动进行人脸的定位和识别十分困难,目前的识别效果(正确率,速度)不如其他的生物识别技术,如指纹识别,视网膜识别等等。人们在日常生活中就进行了大量的人脸定位和识别工作,当然全部是由人的视觉系统和大脑“自动”进行的。目前还不清楚人的视觉系统和大脑的工作原理,因此这项人可以轻而易举完成的任务,对于目前还只会死板地执行程序指令的计算机来说却是极端困难。困难主要存在于两个方面:1. 人脸的图像数据具有高度的随机性。光照条件,脸的偏向,表情,发型,胡子,化妆, 衣饰(眼镜,帽子)等等略有变化,就可以给识别系统带来巨大的困难。2. 人脸的图像数据量巨大。目前出于计算量的考虑,人脸定位和识别算法研究大多使用尺寸很小的灰度图像。一张6464像素的256级灰度图像就有4096个数据,每个数据有256种可能的取值。定位和识别算法一般都很复杂,在人脸库较大的情况下,计算量十分大,很多情况下速度令人难以忍受。而灰度数据事实上是丧失了象色彩,运动等等的有用信息的。如果要使用全部的有用信息,计算量就更大了。因此,研究人脸的定位和识别不仅仅有实用上的考虑,而且对人们理解人脑的工作方式、研究人工智能和数字图像处理有重要的意义。1.2人脸定位算法从模型匹配的方法来看,目前的人脸定位算法可以粗略地分为两大类:第一类是利用人脸各器官之间的几何关系的方法;第二类是利用标准人脸图像或者其变换结果直接或者经特征提取后进行匹配的方法。第一类方法利用了明显的先验知识,因而方法简单明了,执行速度较快,对人脸的方向和表情有一定的适应性(在一定的变化范围内面部特征的相对几何关系变化很小), 但是准确率往往不高(漏判和误判),而且对预处理要求高,依赖于所有面部特征都完整地被提取,所以对转角较大的侧脸, 光照极度不均匀, 部分脸被遮蔽(眼镜, 围巾等)适应性不好。第二类方法利用了更多的图像信息, 准确率高,不易受欺骗;缺点是计算量大,而且使用的人脸模板受人脸库中已有资料的影响,可能会有通用性不好的问题(比如不同人种的人脸模板不能通用)。利用人脸各器官之间的几何关系的方法的典型例子可以参见Shi-Hong Jeng, Hong Yuan Mark Liao等人的文章。而利用标准人脸图像或者其变换结果直接或者经特征提取后进行匹配的方法的典型例子可以参见Toshiaki Kondo和Hong Yan的工作。利用人脸各器官之间的几何关系的方法可以作为完整的人脸定位算法的一个基础, 就是说利用几何匹配先大致找到图像中的人脸(可能含有很多错误),然后使用利用标准人脸图像或者其变换结果直接或者经特征提取后进行匹配的方法来确证,剔除实际不是人脸的区域。这样既可以利用第一类方法的速度优势,又可以利用第二类方法的准确度优势。1.3人眼分割和基于GaborEye模型的人眼定位算法基于GaborEye模型的人眼定位方法,包括以下步骤:第一步,通过人脸检测方法采集人脸图像,根据人脸检测模块获取到的人脸图像的大小,采用适当的Gabor核对人脸图像进行卷积,定义这个卷积后的人眼所在区域为GaborEye;第二步,基于GaborEye模型进行眼部区域分割,对分割后的结果进行合理性判定,确定两眼各自所在的区域;第三步,在确定的区域中采用积分投影的方法精确确定人眼的中心位置;第四步,完成对整个人脸图像中人眼的定位并将定位结果输出,结束。1.4人面身份识别系统设计目标本课题的目标时完成一个独立且完整的人脸身份自动识别系统,主要包括一下3个功能:(1) 人脸的检测于自动人脸跟踪;(2) 人脸的特征点定位与人脸的对齐;(3) 特征提取和分类;该系统具有用户注册(Enroll)、系统更新和维护、识别身份几个主要功能,可对视频流中的人脸进行实时的检测,追踪和识别。第二章 选题背景2.1人脸识别技术综述人脸识别技术包含人脸检测,人脸追踪与人脸对比等课题。人脸检测是指在动态的场景与复杂的背景中,判断是否存在人脸并分离出人脸;人脸追踪是指对被检测到的人脸进行动态目标跟踪,人脸对比是指对检测到的人脸进行身份确认或者在人脸数据库中进行目标搜索。人脸检测分为参考模版、人脸规则、样本学习、肤色模型与特征子脸等方法。参考模版方法首先设计一个或数个标准人脸模版,然后计算测试样本与标准模版之间的匹配程度,通过计算机对比来判断是否存在人脸;人脸具有一定的结构分布特征,人脸规则即提取这些特征生成相应的规则,以判断是否测试样本中包含人脸;样本学习则采用模式识别中人工神经网络方法,通过对人脸样本集和非人脸样本集的学习产生分类器;肤色模型依据人脸肤色在色彩空间中分布相对集中的规律来进行检测;特征子脸将所有人脸集合视为一个人脸子空间,基于检测样本与其在子空间的投影之间的距离判断是否存在人脸。上述方法在实际系统中也可综合采用。人脸跟踪一般采用基于模型的方法或者基于运动与模型相结合的方法,此外,肤色模型跟踪也不失为一种简单而有效的手段。人脸对比从本质上讲是采样人脸与库存人脸的依次对比并找出最佳匹配对象。因此,人脸的描述决定了人脸识别的具体方法与性能。目前主要有特征向量与面纹模板两种描述方法。特征向量法是先确定眼虹膜,鼻翼,嘴角等人脸五官轮廓的大小,位置,距离,角度等等属性,然后计算出它们的几何特征量,这些特征量形成一个描述改人脸的特征向量;面纹模板法则在库中存储若干标准人脸模板或者人脸器官模板,在对比时采用人脸所有象素与库中所有模板相关量度量进行匹配。人脸识别系统则采用“局部特征分析”(Local Feature Analysis,LFA)算法,该算法速度快,误认率低,无需学习,利用人脸各器官及特征部位的方位,比例,对应几何关系等数据形成识别参数即可与数据库中所有原始参数比较,判断,确认。与其他生物识别技术,诸如指纹识别,掌形识别,眼虹膜识别和声音识别相比较,人脸识别具有以下两点特征:(1) 其他每种生物识别方法都需要被识别者配合动作,而人脸识别可以自动用于隐蔽的场合进行,不需要被动配合,如公安部门的监控行动。(2) 当记录一个企图登录者的生物记录时,只有人脸识别能更直观,更方便的核查该人的身份。由于与传统的生物识别技术相比,人脸识别具有更为简便,准确,经济及可扩展性良好等众多优势,可广泛的应用于安全验证,监控,控制等多个方面。2.2人面身份识别系统的开发工具和开发流程2.2.1系统开发过程C+ 的动态库源程序;在VC + 下进行修改并编译成动态库,在VC + 的数据库应用系统中就可以调用动态库函数对照片进行训练和识别了。面像识别部分主要流程如图21 所示图21 人面识别方法流程2.2.2数据库系统的建立 在VC + 下利用MFC的记录集类或ADO 等方法建立数据库系统。数据库使用SQL,ACCESS或DBF等均可,都有相应的字段可保存照片。考虑到节省存储空间,照片图像,采用JPG 格式。在VC+下,显示JPG 格式图像要麻烦一些。为了简单起见,使用Richard C. Image Object 类库,可以很容易在对话框上显示JPG 等格式的图像。2.2.3照片预处理为了对照片进行训练,要将所有的照片放大或缩小到统一的尺寸。为了节省空间,将所有照片缩至128128 像素,用MATLAB 的函数很容易实现。还需用后面所述的方式将对照片预处理的MATLAB 程序编译成动态库,然后在VC+的函数中调用。如果照片中含有噪声,需要将其滤除。如果照片的光线不足或过强,还需要调整灰度,使其达到最佳效果。2.2.4照片训练采用DCT 变换方法进行训练。每个人用5 张128128像素的照片,读入后分别进行DCT 变换, 得到128128 系数矩阵。图像的能量主要集中在低频部分,一般情况下,只要取矩阵中系数较大的低频分量作为图像的特征进行训练就可以了。这里使用的JPG图像为有损压缩图像,而且照片又曾被缩小,为了保证识别率,可以多取一些DCT系数进行训练。将训练用的5张照片的DCT系数矩阵相加,求出平均值作为训练数据保存在文件中,供以后识别用。由于照片有彩色和黑白之分,使读入的照片矩阵的维数不同,因而,照片读入后要统一转化为2维矩阵再进行DCT变换。作为识别的特征,如果都是彩色照片,则分别对每一个2维矩阵进行DCT变换即可。训练时,为区分不同的照片,须先建立照片的文件名和人员编号对照表文件。在VC+下,由用户将照片文件名和人员编号输入到数据库中,然后由程序将数据取出,写入到文本文件“train name. txt”中。训练程序用MATLAB 编写.MATLAB 程序文件名为mtrains. m , 其中的函数名为function train ()。训练程序设计的要点如下:从文本文件“train name. txt”中读出照片文件名和人员编号;将照片文件读到矩阵中;转化为2维矩阵并对2维矩阵进行DCT变换;将具有相同人员编号的DCT 矩阵相加并求平均值;将该人员的平均矩阵写入文件“TainData”;将该人员编号写入文件;计算出每个人的训练数据并写入文件。2.2.5照片识别将要识别的照片读入矩阵后,对其2维矩阵进行DCT变换。取出DCT系数,从保存训练数据的文件“TainData”中依次取出每人的训练数据,求出其与要识别的照片DCT系数矩阵的距离,并给出距离最小的前三名。距离最小者为识别出的照片,其余供参考。根据识别出的人员编号,从数据库中可查出该人员的有关情况. 照片识别的MATLAB 程序建立在文件mfind. m中,其函数名为function mfind (fname) ,形参fname 为要识别的照片的文件名. 主要识别步骤如下:将要识别的照片文件fname 读为矩阵;将该矩阵转化为2维矩阵;对2维矩阵进行DCT 变换;从文件“TainData”中读出训练数据并计算出与被识别照片DCT 矩阵的距离;将距离最小的前三名训练数据对应的编号保存到文件sbh. txt 中。距离最小者即为识别出的照片,其他供参考。2.2.6用MATCOM编译成C+动态库源程序为了能够在VC+下调用训练和识别程序,需要对MATLAB程序进行编译。用MATLAB 的mcc是不行的,只有用MATCOM。这里使用MACOM4.5.MATCOM可以将MATLAB 程序编译成动态库,也可以编译成可执行文件。我们将MATLAB 程序编译成动态库。由于需要对生成的代码进行修改,使用生成的C+动态库源代码而不使用编译成的动态库。把生成的C+动态库源代码加入到VC+中进行修改,然后再编译成动态库。2.2.7用VC+修改动态库源代码用VC+6.0新建一个Win32 Dynamic-Link Library项目ctrain ,将MATCOM编译成的C+头文件和源文件复制到新建项目的ctrain 文件夹下,将MTCOM 4. 5 的lib下的matlib. h 和v4500 v. lib两文件也复制到ctrain文件夹下。用UltraEdit 或其它词处理程序建立一个扩展名为.def 的文件,将动态库的入口函数名写入, 然后添加到ctrain 项目中。ctrain. def 文件内容如下:;ctrain. def: Declares the module parameters for the DLL.LIBRARY“ctrain”DESCRIPTION ctrain Windows Dynamic Link LibraryEXPORTS Mycall; Explicit exports can go here其中,Mycall是在mtrains. cpp中新添加的入口函数名,在Mycall中调用训练用的函数mtrains () ,然后进行编译,生成动态库ctrain. Dll。用同样方法将识别用的MATLAB 程序mfind。m编译成动态库cfind. dll , 但在入口函数Mycall 中需要将形参由char ,类型转换为类Mm 类型.。2.3.8在VC上调用动态库进行训练和识别为“照片训练”和“照片识别”菜单项分别加入消息映射函数,在消息映射函数中调用动态库进行训练或识别. 可用如下方法调用动态库. 将ctrain. dll ,cfind. dll ,ctrain. lib 和cfind. lib 复制到当前文件夹下,并将ctrain. lib 和cfind. lib 加入项目,在用于照片训练的菜单项的消息映射函数中添加代码:void Mycall () ;Mycall () ;这里的动态库是无需改变的,因此,采用隐式调用方式. 用同样的方法为“照片识别”菜单项的消息映射函数添加如下代码:If (dg. Domodal()=IDOK) void Mycall(char*); UpdateData(ture); Char*fname=dg.m_fname.GetBuffer(10); Mycall(fname); else MessageBox (“退出检索”)其中,dg 是对话框类对象。在对话框的编辑框中输入要检索照片的文件名,取出后由Cstring 类转换为char 类型,然后作为实参调用动态库进行识别。上述函数执行后,识别出来的人员编号已经保存在文本文件sbh. txt 中。从sbh. txt 取出人员编号,根据编号,从数据库中查出相关人员的资料,将结果在显示屏幕上显示出来。第三章 GaborEye简介3.1GaborEye基本理论该方法涉及模式识别与人工智能技术,特别是一种自动定位人脸图像中人眼中心位置的方法。采用人脸检测算法通过摄像头采集人脸图像,对获取的初始人脸图像,根据人脸图像的大小,选择合适Gabor内核函数对人脸图像进行卷积,再进行形态学上的膨胀处理,得到的GaborEye模型;基于GaborEye模型,分割出人脸图像中两眼所在的区域;针对分割出来的结果进行合理性分析,如果不符合,重新进行分割;如果分割合理,则利用积分投影的方法精确定位人眼中心的准确位置。本发明方法可以满足多数人脸识别系统的需要,定位特征点后,可获取高可信度的归一化图像,提高识别算法的性能,使人脸识别实际应用能力得到提高。3.2GaborEye简介两只眼睛是人脸上最突出的部分,在一个人脸上,眼睛也有特殊的特征-两个由于瞳孔的灰度而丰富的优势,通过光线强弱的突然改变来分割眼睛和眉毛之间的区域。因此,眼和眉间区域,一个2D信号具有特定的频率特性, 这将大大不同于脸部的其它位置。 因此,为了分割眼睛和眉毛之间的区域,一个很自然的想法是选择一个适当的带通滤波器的来提高眼睛和眉毛 区域的信号,而减少其它区域的信号。此外,信号在眼睛和眉毛区域包含更多的变化,与人脸的其他区域相比方向是眼睛与眉毛的显着特点,眼睛和眉毛的方向都是水平方向,而不是垂直方向,在面对考虑频率和定位特色的眼睛和眉地区,Gabor滤波器将是一个自然的选择, 因为它已表明它能够捕捉鲜明的视觉特性,例如空间定位,方向选择性,时空频率特性。常用的Gabor内核公式如下列所示:其中,表示频率,f 是一个常数空间因子,然而是一个震动波函数,他的实部和虚部由余弦函数和正弦函数来区别。它已经表明在Gabor内核中值得注意的是带通滤波器的Gaussian window有别于其他带通滤波器的矩形窗口。确定和,在频率域上,envelop curve的Gabor内核位于高斯函数的中心 ( u , v ) , 以及相应的中心频率随窗口移动。因此,千伏完全确定位置的Gabor kernel在频域,如果FU管制取向Gabor 内核是永恒的。换言之,美国的参数equation.1管制取向的过滤器,即品种参数定频中心(规模)的过滤器。从我们可以看出我们可以看到较大v意味着较小的U , V ,即当v变大, 该中心频率的Gabor内核会接近原点(图31所示)图31 Gabor 内核在1D中的空间域(a)和频域(b)3.3GaborEye的测试为了验证Gabor滤波器在眼睛与眉毛区域的效果,进行了实验,5级v 0 ,., 4 )和五个方向u ( 0,1,2,6,7 )所选择的Gabor小波. 图32显示了真实的一部分,这些Gabor内核的参数如下:和。图32中不同频率(级)和方向的内核,可以清晰地观察到Gabor内核的变化。图32 Gabor内核的实部当一个人脸图像通过这些滤波器组件具体的长度和方向来打压人脸的各个部分图33和图34显示了两个例子, 以突出两个重点区域眼睛和眉毛区域原貌的形象是其最显着的特点,这表明一些适当的Gabor 内核也有出色的眼睛和眉毛区域的选择性。因此,可以得出这样的结论:convoluting脸的Gabor内核能妥善的提取不同频率的特征眼睛区域达到分割的目的。我们把具有代表性的眼睛和眉头区域命名为GaborEye。当频率和方向土石内核媲美的眼科地区 眼睛的地区可大大增强。我们注意到由于高频率的变化也可能对眉毛区域有一定的影响,因此该中心的重点区域并不一定适合中心的比较大的眼睛来定位眼睛和眉毛之间的区域。图33 眼睛与眉毛区域的Gabor内核.左上角:原来的脸 右:各种不同大小方向的滤波器图像左下角:经过各种滤波器整合的图像图34 不同姿态的人脸的Gabor内核.(a) 标准的人脸(b) 量级的图像(c) a与b的混合(d) 使用Gabor变换的图像 很明显,重要的是要选择正确的Gabor内核。幸运的是,通过分析人脸图像的特征,我们可以选择适当的Gabor内核。一般来说,一个人脸检测模块提供尺寸粗糙的脸,可用于范围挑选。我们使用sh来挑选Gabor内核的尺寸,其中s为Gabor内核的尺寸,h是人脸检测的高度,而是一个常数图35的结果展示了围绕标准的Gabor内核来制定我们的策略。 (a) (b) (c)图35 自适性Gabor变换(a) 原始图像(b) 量级Gabor变换:眼睛与眉毛间的区域重点选择(c) b重叠在a上后的合成图像第四章 基于GaborEye的人眼定位方法4.1概述我们使用一个由坏到好的瞳孔分割策略。在分割的第一步,我们使用的Gabor内核规模,提高了相对低频区使眼睛与眉毛区域而显得更加的突出。然后,我们采取了Gabor内核的小波变换提取相对高频的瞳孔区域。与传统的按部就班的方式,这种策略能在一个较小尺度的范围类防止假警报。一种基于GaborEye模型的人眼定位方法,包括以下步骤:第一步,通过人脸检测方法采集人脸图像,根据人脸检测模块获取到的人脸图像的大小,采用适当的Gabor核对人脸图像进行卷积,定义这个卷积后的人眼所在区域为GaborEye;第二步,基于GaborEye模型进行眼部区域分割,对分割后的结果进行合理性判定,确定两眼各自所在的区域;第三步,在确定的区域中采用积分投影的方法精确确定人眼的中心位置;第四步,结束,完成对整个人脸图像中人眼的定位,将定位结果输出。4.2眼睛与眉毛区域的分割基于GaborEye ,我们采用了以下步骤来分割的眼睛和眉地区:1. 形态预处理;扩张。为了复盖眼部及眉毛区域,我们采取的形态算子扩张,扩大GaborEye区域。2. 完整的GaborEye区域设计;在分析人脸的知识结构之前,我们假定眼睛位置的矩形面积,其顶部是h / 4从顶部的形象和底部 为2h / 3从它( H是人脸的高度),在完整的长方形做垂直方向的投影的话,那么得到的投影图像如图41所示。3. 分析投影曲线;分开左眼的区域和右眼的区域,找到两个最大值,然后在这两点间找到最小值Gmin,用于分割两眼的区域,标记两只眼睛为El和Er。4. 在El和Er之间搜索最大灰度值;标记两个最大灰度值为Glmax和Grmax,在初始图像中添加参数Tl和Tr分别对应El和Er。其中Tla*Glmax,Tra*Grmax。a为一个经验系数其值为0.85。图42(a)是经过初始处理后的典型图像。5. 分割眼睛与眉毛之间的区域;搜索连接El和Er区域的最大值,其外矩形区域标记为Rl和Rr,如图42(b)所示的结果。Hl,Hr分别是两个矩形的高度。综上所述,两个矩形的中心并不是两只眼睛的中心,他们被标记在眉毛和上眼皮之间的区域,这个实验充分的证明这两个矩形不能充分的覆盖两只眼睛的区域,特别是当特征脸的眉毛是黑色的时候。因此,为了确保我们分割出来的眼睛与眉毛之间区域中包含眼睛,我们将使用以下的策略:我们扩张Rl再其底部加上长度Hl,Rr的底部加上长度Hr(Hl是Rl的高,Hr是Rr的高)。然后选择Rl和Rr中底部最大的矩形,如图42(c)所示。我们不对Rl及Rr进行水平方向的扩张是因为GaborEye是水平方向的。图41 完整垂直投影分割的两眼区域图42 标记眼睛的区域(a) 覆盖两眼的区域(b) 再两眼外加矩形(c) 分割眼睛和眉毛的区域4.3瞳孔区域的分割把Gabor小波变换应用到Rl和Rr的选定区域,首先从矩形区域中分离眼睛,从而将瞳孔区域分离出来。围绕Gabor内核应用于Rl和Rr的显示如下:4个量度:0,.,3,定位为0度,u=0时总有=2,kmax=1.5。较大kmax ,是因为有更多的高频率信息,在该地区是在上眼睑和下眼睑。小波变换gabor内核是方程. 图4-3为例convoluting与选定地区,我们可以得到两个积分投影曲线在X和Y方向. max_x是最高的价值积分投影曲线在X方向的相对位置,是pos_x ; *是最高的价值积分投影曲线在Y方向的相对位置,是pos_y . 我们用Tx ( Tx = 0.3 * max_x )门槛搜索积分投影曲线由两端向中间 确定的边缘学生的地区,而预测值大于Tx , 相应的地位,被视为边缘地区的学生. 同样的手术是在积分投影曲线在Y方向门槛Ty。图4-3积分投影曲线在X和Y方向后Gabor变换的Rl ,Rr(Ty=0.3*Max_Y)Rsl和Rsr是被重新分割的矩形,如图4-4所示,大的矩形是第一次分割的结果,而小的矩形是重新分割后的结果。图4-4 瞳孔区域的定位(小的矩形方框)4.4精确定位瞳孔中心使用瞳孔周围的灰度来定位眼睛是最简单的方法。但是,在周围照明不够或者被检测者的皮肤颜色比较深的话,这种方法的效果就比较差了。我们考虑到瞳孔的一个特性,即辐射对称,因此,可以使用这种辐射对称的方法来定位瞳孔的中心。辐射对称算法是一种利用快速辐射对称变换标准地定位双眼瞳孔的新方法。首先估计眉毛的大体位置,根据眉毛定位的结果,在可能存在双眼的一定区域,利用快速辐射对称变换找到黑色的特征点,用眼珠模板对检测到的特征点进行纠偏后,根据几何特征确定双眼的候选对,再次利用眼珠模板精确定位瞳孔的位置。对ORL和SJTU-IPPR数据库的实验表明,该算法可以实时的定位双眼,实验证明准确率达到90以上。第五章 人脸特征提取与识别5.1概述人脸识别本质上是三维塑性物体二维投影图像的匹配问题,它的困难体现在:(1)人脸塑性变形(如表情等)的不确定性;(2)人脸模式的多样性(如胡须!发型!眼镜!化妆等);(3)图像获取过程中的不确定性(如光照的强度!光源方向等).识别人脸主要依据人脸上的特征,也就是说依据那些在不同个体之间存在较大差异而对于同一个人则比较稳定的度量.由于人脸变化复杂,因此特征表述和特征提取十分困难。在对人脸图像进行特征提取和分类之前一般需要做几何归一化和灰度归一化.几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大小,灰度归一化是指对图像进行光照补偿等处理,光照补偿能够一定程度地克服光照变化的影响而提高识别率。人脸特征提取与识别的方法有很多种,包括:1.基于几何特征的方法;2.基于特征脸的方法;3.局部特征方法;4.基于弹性模型的方法;5.神经网络方法;6.其它方法。我们主要使用基于特征脸的方法来进行人脸的特征提取及识别。5.2基于特征脸的方法简介基于特征脸的方法是根据一组人脸训练图像构造主元子空间,由于主元具有脸的形状,也称为特征脸。识别时将测试图像投影到主元子空间上,得到一组投影系数,和各个已知人的人脸图像比较进行识别。这种方法的效果是很好的,在经过反复实验的得到的误差大约在1/150左右。但系统在进行特征脸方法之前需要作大量预处理工作如归一化等,这需要一定的准备时间。5.3基于特征脸方法的发展情况在传统特征脸的基础上,研究者注意到特征值大的特征向量(即特征脸)并不一定是分类性能好的方向,据此发展了多种特征(子空间)选择方法: 双子空间方法,线性歧义分析方法,FisherFace方法等。事实上,特征脸方法是一种显式主元分析人脸建模,一些线性自联想!线性压缩型BP网则为隐式的主元分析方法,它们都是把人脸表示为一些向量的加权和,这些向量是训练集叉积阵的主特征向量。5.4基于特征脸方法的优劣综上所述,特征脸方法是一种简单,快速,实用的基于变换系数特征的算法,但由于它在本质上依赖于训练集。和测试集图像的灰度相关性,而且要求测试图像与训练集比较像,所以它有着很大的局限性。因此在我们的系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论