基于adaboost的人脸检测及识别_第1页
基于adaboost的人脸检测及识别_第2页
基于adaboost的人脸检测及识别_第3页
基于adaboost的人脸检测及识别_第4页
基于adaboost的人脸检测及识别_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 宁夏大学 毕业论文 AdaBoost人脸检测及识别 姓名:罗慧彪 专业:电子信息工程 指导教师:孟一飞 20140423基于AdaBoost 人脸检测及识别摘 要人脸检测是在指给定的一幅图片或连续视频中确定是否有人脸的存在,如果有人脸,则标出人脸的位置和大小。人脸检测是计算机模式识别最热门的研究课题之一,在视频会议,远程监控,远程治疗中都有应用。许多学者,和专家对此做了许多大量的工作,取得了优秀成果并提出了大量的有效算法。本文主要工作如下:1、人脸检测算法居多,在了解相关的人脸检测算法后,进行最后的比较,选定适应能力强、错误率小的Adaboost 人脸检测算法。基于Haar 特征的级联分类器

2、算法,在训练样本足够多足够好时,在理论上可以将错误率降到任意小,可以适应许多复杂的环境中。2、本文对Adaboost 人脸检测算法实现MATLAB 的仿真,可以首先不去研究算法是如何实现的,着重关注算法本身的性能。关键词:人脸检测 Adaboost 人脸识别 图像预处理 特征提取AbstractFace detection is to determine whether there exists in a picture or continuous video ,if have, marked the size and location of the face.It is one of the

3、 most popular computer pattern recognition research topics,is applied in video conference, remote monitoring, remote treatment. Many scholars,and experts have done a lot a lot of work and achieved outstanding results and give a lot of effective algorithms.The main work of this paper is as follow:1.

4、Face detection algorithms are mostly, after understanding the relevant algorithms and compared their ,I chose Adaboost face detection algorithm and Its features is adaptable, small error rate. If the training samples is too good enough,cascade classifier based haar can make the error rate reduce to

5、arbitrarily small, can be adapted to many complex environments.2. The paper use MATLAB to achieve Adaboost face detection algorithm,we can focus on the performance of algorithm,but not study how to achieve on their own.Key words :Face detection,Face recognition,Image preprocessing , Feature extracti

6、on , 目录基于AdaBoost 人脸检测及识别I摘 要IAbstractI第 1 章 绪 论11.1 背景前提11.2 人脸检测算法研究历史11.2.1 基于肤色的人脸检测21.2.2 基于形状的人脸检测21.2.3 基于特征的人脸检测31.2.4基于特征不变量的方法41.2.5基于模板的方法41.2.6基于表象的方法5第 2 章 Adaboost 算法62.1 boosting 方法62.2 Adaboost 算法62.2.1 Adaboost 算法的概述62.2.2 Haar 特征及其计算72.2.3 条件矩形及其数量92.2.4特征值102.2.5 弱分类器132.2.6 Adabo

7、ost 算法训练过程132.2.7 级联强分类器142.3 Adaboost 人脸检测过程152.5 本章小结16第3章 人脸识别的主要流程及困难163.1人脸识别的困难163.1.1复杂条件下人脸的检测和关键点定位163.1.2光照问题163.1.3资态问题163.1.4表情问题173.1.5遮挡问题173.2 人脸识别流程173.2.1人脸图像采集173.2.2预处理183.2.3特征提取183.2.4特征形成183.2.5特征提取183.2.6特征选择183.2.7特征匹配193.3 本章小结19第4 章基于直方图的人脸识别实现194.1识别理论194.2直方图均衡化204.2.1概述2

8、04.2.2基本思想204.2.3优缺点214.3直方图规定化214.3.1概述214.3.2方法推导224.3.3算法描述224.4方案确定224.5人脸识别的matlab实现23参考文献25致 谢27第 1 章 绪 论1.1 背景前提人脸检测是在给定的一幅图片或连续视频中确定是否有人脸的存在,如果有,则标出人脸的位置和大小。人脸检测是一个复杂的过程,它要受到肤色,外貌,拍摄的角度的影响,另外一个人的胡须,帽子,长发,口罩等也会干涉它的精度,还有不可避免的光照,阴影等影响。下文会介绍历年来对人脸检测的方法和他们的特点。人脸是人类情感表达和交流的最重要,最直接的信息载体。通过人脸可以判断一个人

9、的历史记录,地理地域,身份,地位等。在如今的信息网络化时代对人脸的研究具有及强的意义和市场前景。自19 世纪80 年代以来人们就开始了对人类人脸的研究,长期以来,科学界从计算机图形学,视觉,人类学,图像处理学等多个学科对人脸进行了研究。在这些领域,人脸的检测,识别,获取,模拟,判断一直是难点和热点,他们共同组成了人脸工程学研究的重要组成部分。特别是国外现在存在的越来越多的恐怖袭击事件后,世界正在加速对人类工程学的研究,发表关于它的文章在各大杂志上也日益增多。人脸检测是其中一个主要分支,它是实时的人脸识别和情感识别系统实现的前提和基础。进行人脸检测技术的研究有着重要的意义,因为随着信息时代的到来

10、,网络,无线通信已经成为人们生活中不可缺少的一部分。由此而产生的视频会议,可视电话,高速网络技术等所利用的图像处理技术都具有极大的应用前景。例如人们已经不能满足只是坐在电脑前面进行交流,需要采用人机交互式方式,远程操作,甚至用意念来控制机器。随之而来的是关系到模式识别技术,图形图像技术,虚拟三维技术难题的攻克和革新,人脸检测技术是他们重要的组成部分,人们对于人脸检测方面的知识也正在热烈的研究中。人脸检测技术由图像采集技术,图像显示技术和图像处理技术三部分组成。其中图像采集的传感器由有线阵和面阵之分的电荷耦合器件(CCD)、能存储少量载流子的像感元件的电荷注入器件(CID)、发展到自扫描光敏二级

11、管阵列的MOS 图像传感器,从技术发展的趋势来看,无论是CCD 还是MOS,其图像产品的分辨率越高,清晰度越好,体积越小、性价比越高。图像显示部分的发展经历了CRT、液晶及等离子三个阶段,由于这三者显示方式各有各的特点,所以很难断定哪个有绝对的优势。图像处理的实现目前主要是在PC 机上,使用的软件也许多,各有特色,经典的有MATLAB,C+,但PC 机上的功耗、体积、携带方便等性能在很多场合都不能满足人们的要求。如在火车上进行罪犯的抓捕,不可能把PC 机搬到旅客面前进行一一的身份鉴定。迫切需要在小型嵌入式系统中进行图像处理的开发,本论文是在这种前提下提出的人脸检测算法的DSP 实现,具有很大的

12、价值。1.2 人脸检测算法研究历史人脸检测涉及的内容非常丰富,根据不同的特性具有不同的分类方法,但总体的来说可以分为基于肤色的人脸检测、基于形状的人脸检测、基于特征的人脸检测三类。1.2.1 基于肤色的人脸检测基于肤色进行人脸检测的方法是最常用的方法之一,也比较容易理解。在外界图像模拟信号进入计算机后有不同的表达方式,这就有了不同的彩色空间,主要的彩色空间有1:RGB 格式(红、绿、蓝三基色)2:HIS 格式(色度、饱和度、亮度)3:YcbCr(YUV)格式,并且它们之间可以互相转换,在许多图像书籍中都有介绍,基于肤色的人脸检测是利用了人脸肤色和周围环境颜色的差异,通过这种肤色差异将人脸和背景

13、环境区分开来,以上提出的三种颜色模型各有特点,所以一般是综合各种肤色模型来达到好的检测效果。具体来说选择什么样的肤色模型对人脸检测的有效性和准确性至关重要。前人已经研究出了比较有效的彩色模型:HSI 彩色空间的模型如公式1-1, (11) RGB 彩色空间的模型如公式1-2, (12)其中: (13)公式13 中指出b=1-g-r,所以彩色空间由g,和b 决定。通过转化可以变成不同的彩色空间,应用公式11 和12 可以将图像变成二值图像进行检测1.2.2 基于形状的人脸检测这种检测方法是利用了人脸的五官形状信息,用这些信息来匹配人脸,比如用椭圆形形状来表示人脸,在图像中搜索椭圆形的位置来粗略检

14、测人脸。或者将人脸分为多个区域,利用这些区域的特征关系来检测人脸。模板匹配方法是基于形状的人脸检测的特例,事先根据人脸的特征制定出人脸检测模板,对给定的输入图像计算出它与模板的相关程度,如果大于一定的阈值则证明人脸的存在。这种方法计算简单,但已证明它的有效性不是很高,很难满足由于姿态、图像尺寸,光线的变化和干扰,为此需要设计出自适应能力强的人脸检测模板。典型的模板分块策略是基于马赛克的人脸模型,这种基于人类器官的分块方法,充分利用了人脸的自然规则,对先验知识的利用更加的直接,并使该人脸模型的自适应能力强,能够提高检测的鲁棒性和效率,但对于变化的人脸,检测的正确率不是很高。马赛克的人脸模型如表1

15、-1 所示: 表1-1 马赛克人脸模型0 1 23 4 56 7 8块0 对应于左眼,块2 对应于右眼,块4 对应于鼻子,块7 对应于嘴巴,块(0,3,6)和块(2,5,8)具有大致一样的宽度,块(1,4,7)宽度大致相同,同一行三个块高度相同,同一列三个块宽度相同。考虑到多数情况下人脸的变化情况,人脸可能的行列比在0.81.3 之间。另一种是基于人脸几何规则的方法,虽然人脸各有差异,但是人脸的几何形状大致一样的,基于这种检测方法是首先建立一些人脸的某些器官模板,如眼睛、鼻子和下巴模板等,对输入人脸图像的检测就是先对可能存在人脸的位置进行规则检测,看是否符合这些规则,进而确定是否有人脸的存在。

16、1.2.3 基于特征的人脸检测基于特征的人脸检测方法是对给定的图像计算其特征值,再根据特征值来确定人脸是否存在,常见的人脸检测特征是Haar 特征,如图1-1 所示: 图1-1 基本的Haar 特征基于 Haar 特征的人脸检测算法的基本思想是:利用样本集图像的Harr 特征,进行分类器训练。得到最优的简单分类器,组合这些简单分类器得到强分类器。分类器训练完之后,就可以对输入图像进行检测。为了检测整幅图像,可以在图像中移动搜索窗口,检测每一个位置来确定可能的目标。为了搜索不同大小的目标物体,分类器被设计成可以进行尺度改变的,这样比改变待检测图像的尺寸大小更快速,因此,为了在图像中检测各种大小的

17、目标物体,扫描程序通常需要将不同大小比例的搜索窗口对图像进行多次扫描,并对相同的目标的多次检测结果进行合并。在图像检测中,被检测图像窗口依次通过每一级分类器,在前面几级的检测中,大部分的候选区域被排除了,全部通过每一级分类器检测的区域即为目标区域。1.2.4基于特征不变量的方法基于知识的方法在很大程度上限定了计算机识别人脸的前提条件,例如合适的光线、姿势、完整的血官。但实际生活中,这些条件都是在时刻变化的,为了能满足现实的需要,人们期望能够寻找那些即使当姿势、视角和光线条件变化时仍然存在的结构特征,并利用这些特征来定位人脸。闲此研究人员认为有一个潜在的假设:存在一砦关于人脸的不依赖于外在条件的

18、属性或者特征。人们通过给计算机进行大量的样本学习,然后寻找到可以检测人脸的这些特征,这就是基于特征不变量方法的基本思想。例如人脸的肤色一般可概括的分为黑、白、黄这三种颜色,并且肤色是集中在一定的范围之内(人脸范围内),具有一定的集中性。这样,研究人员可以将这一特征作为人脸检测的一个粗定位环节,利用这一粗定位的特性可以加快人脸检测的速度,使刚丌始的检测定位变得更加简单、快捷。颜色特征中用的非常多的是肤色,其优点是:不受姿态、表情的影响,检测速度快.特征不变量的方法因为需要处理的数据量相对较小,并且计算简单,所以优点是检测速度快;缺点是:(1)检测率低,特别是当人脸的某些特征不可见(比如人脸有小角

19、度偏转,或有遮挡等)时,很有可能这种方法失效(2)制定规则的困难,如果规则制定的太严格,人脸很有可能都通不过,如果规则制定的太宽泛,又检测不出人脸。鉴于此,这类方法主要用于人脸的粗检测或和其它检测方法组合使用。1.2.5基于模板的方法目前,基于模板的方法以其简单、方便、成熟的优势已经占有一席之地,但是,在人脸识别方面,对于J下确人脸的识别效率还不是很理想。这类方法的速度要慢于基于特征的方法,但精度要稍高于它。其特点是:简单、直观。固定模板匹配中常用的模板主要有人脸轮廓模板(不同长宽比的人脸模板)、双眼模板、嘴唇模板、眉毛模板、鼻子模板、下巴模板等。一般都是采用这些模板的部分组合,再融合其它检测

20、方法共同进行人脸检测。基于模极的方法的主要过程如下:首先要对图像进行尺度归一化以及狄度归一化的预处理操作,再通过相应的操作得到一个参数化或者标准化的人脸图案,这个标准化的图案可以简单的看作是一个椭圆形或者是一个复杂的模板"如图25所示。 图25 复杂人脸模板根据图2 5所示的模板可以独立计算脸部轮廓、眼镜、鼻子和嘴各自的匹配程度后得到一个可以描述综合信息的相关值。根据相关值和预先设定的阈值来确定图像中是否有人脸存在。1.2.6基于表象的方法基于表象的方法是指先对计算机进行一系列具有代表性的人脸图像学习以及训练,由此而得到一个模板,然后再用这个学习后得到的摸板进行人脸检测。即人脸的模板

21、是通过反复训练而得到的,而不是有专家或者研究人员预先设置好的,这就是同模板匹配的区别之处。基于表象的方法首先是使计算机通过统计分析和机器学习的方法得到人脸和非人脸的相关特性。学习而来的特性总结成分布模型或者判别函数,再利用这些分布模型或者判别函数来检测人脸。般为了计算的效率和检测的效益,都会先降低图像的维数。许多基于表象的方法都可以在概率论的框架中理解。特征向量可以看成是随机变量J,这个随机变量被分类条件密度m数p(x| faces)和p(x | rtorlfaces)分别描述成人脸和非人脸。图像中各选的人脸或者非人腧何置可以用贝叶斯判决规则或者晟大概似法来判别“1。不幸地,简单地应用贝叶斯判

22、决是不可行的,这是因为:(1)x是高维的。(2)p(x| races)和p(x| nonfaces)是多态的。(3)p(x |faces)和p(x| nonfaces)的自然参数化形式还没有弄清楚。因此,基于表象的方法中的许多工作都涉及到用经验来验证p(x | faces)和p(x | nonfaces)参数和非参数的近似的问题。另一种方法利用了人脸和非人脸类的7'JN函数(比如决策而、分离超平面、阈函数等):图像图案先被投射到低维或者高维空,之后使用判别函数来进行分类。第 2 章 Adaboost 算法Adaboost 检测算法是一个非常经典的人脸检测算法,它自2001 年Viola

23、 等人提出后,对人脸检测的意义可谓重大,使这一技术能够实现转折性的变化,许多学者在研究它,并做了大量的改进。Adaboost 是一个学习的算法,即Adaptive Boosting . 给定一系列正负样本,训练成一个弱分类器。此训练过程中,每个样本拥有一个初始权重,表示该样本被某个分类器选中的概率。如果某个样本被正确分类了,则构造下一个训练集时,降低其权重,否则加重其权重,通过此算法,每一轮都会增强那些分类错误的困难样本,每一轮选出一个最优的弱分类器,这些弱分类器以一定权重组合起来成强分类器。2.1 boosting 方法Boosting 学习方法是PCA 学习模型上提出的,它是Adaboos

24、t 算法的基础。Adaboost 算法是在PCA 学习模型提出后发展起来的,PCA 模型提出了弱学习及强学习的思路,后来证明通过某种方法(Boosting)可以把弱学习加强为强学习,它最初是Schapire(1990)把任一弱学习算法通过提升来达到一个任意正确率的的强学习算法,并通过一种多项式级的算法来实现这一过程。PAC(Probably Approximately Correct 概率近似正确)中提到的可学习理论可以划分为统计学习理论和计算学习理论两大部分,统计学习理论与以前的经验有关,而计算学习理论是概率理论中发展比较成熟的重要的一个分支,主要讨论如何构成有效的学习算法以及学习算法的复杂

25、性。PAC 模型是计算学习理论中经常用到的模型,在PAC 模型中,如果一个多项式的学习算法来识别一组概念,且正确识别概率很高,那么可知那个概念是能够学习的;如果正确率仅比随机猜测的好一点,则这组概念是可弱学习的。如果学习器在只需要多项式个样本以及多项式时间内能够获得一个成功假设的结果,则称该学习器是可PAC 学习的。由于PAC 模型不需要学习器输出零错误率的假设结果,只需在一个范围之内;同时也不需要对抽取的样本集合都成功,也只需要限定在某种范围即可,所以学习器将学习提到一个可能近似的正确的假设结果。之后在1990 年,Schapire 最早提出了Boosting 算法。Boosting 方法在

26、训练过程中产生了一系列的学习机,各个学习机所使用的训练集合是总的样本空间中的子集,各个样本是否出现在下一个训练子集中取决于当前的在学习机中的表现,如果在当前的学习机中判断出错的样本则在下一次的学习机中出现的概率就会高,相反如果判断正确则它在下一个学习机中出现的概率就会低,这样可以让学习机更专注于难判断的样本。2.2 Adaboost 算法2.2.1 Adaboost 算法的概述Adaboost 算法是在一些人脸和非人脸的样本中训练出弱分类器,然后把弱分类器级联成强分类器。它是一种自适应增强算法,理论上错误率能够达到无限低。自1988 年,Kearns 等人提出Boosting 理论基本思想以来

27、,人脸检测算法得到了很大的进步,相关学者,专家做了大量相关的研究,并取得了可观的成绩。分类器就是对特定的事物进行分类,Adaboost 就是一个分类器,它是由简单的弱分类器训练得来的。在Adaboost 算法中进行人脸检测主要利用的是人脸图像的灰度分布不一样这一特性,主要对灰度图像进行检测,采用积分图计算的Haar 特征,Haar 特征计算简单,检测速度快。Adaboost 算法检测过程首先计算图像的Haar 特征并且在算法训练过程中提出错误率最小的Haar 特征,转换为弱分类器,再把弱分类器组合成强分类器进行人脸检测。其流程图如图3-1 所示:图3-1 Adaboost 算法流程图2.2.2

28、 Haar 特征及其计算Adaboost 算法的基础是Haar 特征,Haar 特征也称矩形特征,可以有效的检测非人脸和人脸。矩形特征值是指待测图像中形状相同的两个或多个矩形内灰度像素的差值。如图3-2 中的矩形特征值是指白色图像内的像素与黑色图像内的像素之差。如图3-3 中的矩形特征值是指白色图像内的像素与黑色图像内的像素的2 倍之差。 图3-2 矩形特征一 图3-3 矩形特征二后来的研究人员对矩形特征做了改进,能够更加快速的检测人脸,大量的矩形特征可以分为三类,一类是用于边缘检测,如图3-2.一类是检测图像的线性方向如图3-3,最后一类是检测中心像素和周围像素的区别,如图3-4. 图3-4

29、 矩形特征三一幅M×M 像素分辨率的检测器,其内部包含满足条件的矩形数是非常多的,如果一个一个计算起来计算量是相当复杂的,计算量也是很大的。为此设计了一种快速方便的算法,它对不同尺寸矩形的特征值计算量是相同的。它就是积分图的计算。积分图计算公式可以表示为原图像的像素值,iiA为积分图像的值,即是如图 3-5 中 A 点的左上方所有像素的和。 图3-5 积分图的计算也可以通过公式3-1 求得: (3-1) 其中s(x,y)为图像中(x,y)点不超过列元素的像素之和。利用积分图可以快速计算矩形特征值,如图3-6 中矩形特征特征值的计算为1 中内像素的值减去2 中内像素的值。图像 1 的矩

30、形特征值为:iiF + iiA iiE iiC图像 2 的矩形特征值为:iiD + iiE iiB iiF 图3-6 矩形特征值的计算则矩形特征值为:iiF + iiA iiE iiC(iiD + iiE iiB iiF )单矩形的特征值可以用其四个顶点确定,双矩形的特征值需要如图3-6 中的六点,三矩形则需八个点来计算,如果要计算矩形特征值,只需对输入图像进行积分图的计算,然后利用所需矩形顶点的积分值进行简单的加减运算即可,对于任意尺寸的矩形特征的特征值,因为所需的矩形顶点数是一样的,所以计算量是一样的,并且计算的复杂度不高。2.2.3 条件矩形及其数量在人脸检测过程中如果使用特定条件的矩形

31、特征能够加快检测速度。我们将特定条件的矩形称为条件矩形,即其必须满足以下3点内容:(1)在M×M的子窗口内确定一个矩形的方法是:确定左上顶点么(五,Y一)以及右下顶点B(而,Y:)如图42所示。 图42 在检测器内确定矩形(2)满足(s,f)条件:x方向边长必须能被自然数S整除,即可以将X轴方向上的边长均等的分成S段。y方向边长必须能被自然数t整除,即可以将Y轴方向上的边长均等的分成t段。由以上这两条可以看出,在检测器子窗口内的矩形尺寸大小为:最小尺寸为蹦t。最大尺寸为M/ss×Mt.t。其中为取整运算。了解了条件矩形的定义后,我们就可以根据该定义在子窗口内寻找满足条件的矩

32、形。具体方法如下:(1) 确定左上顶点A(x1,Y1)的值:X11,2,M-s,M-s+1 (4-1) Y1l,2,Mt,Mt+1(2)确定右下顶点B(x2,y2)的值: (再确定完A点后,B点的取值只能在图65的阴影部分内选择)x2X=x1+s-1,x2+2·s-1,x1+(p一1)·sl,x1+p·s一1y2Y=y1+t-1,y1+2.t-1,y1+q.t-1 (4-2) 其中, (4-3)且|X|=p,|Y|=q。当知道如何确定A,B两顶点的位置后,我们就可以在M X M的满足子窗口内找到满足(s,f)条件的矩形数量为: (4-4)在前面的章节中给出了5种简

33、单的矩形特征模板,那么这些特征所对应的(s,f)条件又是如何昵?如表41所示 表4-1 符合(S,t)条什的特征模板因此,在M×M的检查器的子窗口内,所包含的满足(s,f)条件的所有的5个简单特征模板的特征总数量为:2.2.4特征值本文使用将积分图应用到特征值的计算之中。积分图的引用,可以只对图像进行一次遍历计算,就能够在用常量时间完成每个特征值的计算,这使得训练和检测的速度大大提升。微积分是研究函数的微分、积分以及有关概念和应用的数学分支。它是数学的一个基础学科。内容主要包括极限、微分学、积分学及其应用。微分学包括求导数的运算,是一套关于变化率的理论。它使得函数、速度、加速度和曲线

34、的斜率等均可用一套通用的符号进行讨论。根据微秋分的特征,我们只需要对每个像素进行少量的计算工作,就能得到一幅图像的“积分图”。“积分图”能够在多种尺度F,使用相同的时间来计算不同的特征,因此大大提高了检测速度。例如计算微积分点计算该式的方法为:(1)先计算 F(x)=f(x)dx (4-6) (2)再计算 (4-7)假设定义图像内一点 A(x,y)的积分图ii(x,y)为点A(x,y)的积分图表示其左E角矩形所有像素值和,如图4-3所示。 图4-3 坐标A点的积分图对于i(x,y)是原始图像(x,y)在此点的颜色值,该值分为以下两种情况:(1)对于灰度图像,该值为0255之间的值。(2)对于彩

35、色图像,应先按照人脸色踩空阳j将其转换为灰度后再取值。利用积分图可以方便快捷的计算出矩形特征值,例如计算图4-4中D区域里的特征值。 图4-4 区域D的像素假设各区域的像素值为:(1)ii1=区域A的像素值 (2)ii2=区域B的像素值+区域A的像素值(3)ii3=区域A的像素值+区域C的像素值(4)ii4=区域A的像素值+区域B的像素值+区域C的像素值由此可以看出通过上述的四个方程,可以得到区域D的像素值: 区域D的像素值=ii4+ii1一(ii2+ii3)根据以上式子我们可以轻松的计算出模板的特征值,例如要求图4-5中的特征值。 图4-5 特征值的计算在前面的章节中已经介绍过,特征模板的特

36、征值等于灰色像素值减去白色像素值的结果。因此可知:(1)区域A的像素值=ii5+ii1一(ii2+ii4) (4-8)(2)区域B的像素值=(ii6+ii2)一(ii3+ii5) (4-9)(3)区域C的像素值=ii8+ii4一(ii5+ii7) (4-10)(4)区域D的像素值=ii9+ii5一(ii8+ii6) (4-1 1)该特征模板的特征值:特征值=区域B的像素值+区域c的像素值一(区域A的像素值+区域D的像素值)=2(ii6+ii2+ii8+ii4)一(ii3+ii7+ii1+ii9+4 ii5) (4-12)由此可见,矩形特征的特征值计算,只与此特征端点的积分图有关,而与图像坐标值

37、无关。因此,不管此矩形特征的尺度如何,特征值的计算所耗费的时间都是常量,而且都只是简单的加减运算。正因如此,积分图的引入大大地提高了检测的速度。2.2.5 弱分类器Adaboost 算法是由Haar 特征形成的弱分类器通过多项式组合而成的,其中,每一个弱分类器对应于一个矩形特征,这个矩形特征对正例和反例图像的检测达到最优。对于每个特征,弱分类器使得分类函数的阈值达到最优,这里的分类器由Haar 特征直接构成的,它的表达式为公式3-2: (3-2) 其他p j 为± 1 控制不等式方向,f j (x)为第j 个特征在x 图像上的特征值,j 表示阈值,j 可以用公式3-3 计算 (3-3

38、)N1 , N2 为人脸和非人脸数目,m2,m1 为当前特征在所有人脸和非人脸的平均特征值当m1<j时, p j = 1,如果待测图像的特征值小于j,则判为人脸,否则为非人脸。当m1 >j时, p j = +1,如果待测图像的特征值大于j,则判为人脸,否则为非人脸。2.2.6 Adaboost 算法训练过程Adaboost 即Adaptive Boosting,因为它能够自适应地调整取样的样本,降低检测的错误率,在每次Adaboost 训练过程中,计算样本空间的特征值时,更新样本的权重,把容易分类的样本权重减弱,提高错误分类样本的权重,通过此算法,每一轮都会增强那些分类错误的困难样

39、本,每一轮选出一个最优的弱分类器,这些弱分类器以一定权重组合起来成强分类器,具体算法流程为:(T 为特征个数)(1)取样本(x1 , y1 )( x n , y n ) yi =1 表示图像是正比例, y i =0 表示图像是反比例。(2)初始化权值W1,i(3) t=1(4)将权值归一化 t 为某一个特征,j 为样本总数(5)对每个特征j,训练一个只使用某一个单一特征的分类器hj ,然后得到本次分类器的误差j e 为(6) 选择误差e j最小的分类器hj,更新权值: 当x i分类正确时,v t=0; 当xi 分类错误时,v t=1,t = e t /(1- e t)。 (7)t=t+1(8)

40、t<T 转向4(9)得到最后的强分类器为公式3-4。 (3-4)式中,i 表示第 i 次代时h i (x)的权值。流程图如图3-7 所示 图3-7 训练强分类器流程图AdaBoost 算法构造的特征大概为200 多个,对于人脸检测,AdaBoost 选择权重最高的几个矩形的特征为:第一个特征关注的是眼睛区域,眼睛比鼻子和面颊的区域要暗,第二个特征是眼睛所在区域比鼻梁所在区域要暗。2.2.7 级联强分类器一个包含 200 个Haar 特征,由Adaboost 算法训练得到的强分类器,对图像进行人脸检测,由于检测窗口很多,对每个窗口计算这200 个Haar 特征的特征值,计算量是相当大的,为

41、了进一步提高运算速度,可以采用级联分类器,即先用较简单的特征组成的强分类器去排除显然不是人脸的区域,然后把剩余的较难检测的区域送到下一个强分类器进行处理,这样一级一级地进行排除,最终排除了所有的非人脸区域,如果有剩余区域,则表示为人脸,否则没有人脸,对于有K个强分类器构成的级联分类器,其检测率F 和误检测率D 为: (3-5) (3-6)由公式3-5,3-6 我们可以得出两点结论:一、为保证最后的高检测率,每个强分类器要求有高检测率,假设最后的检测率是90%,则每个强分类器的必须高于90%,如K=10,每个强分类器的检测率都应该在99%以上,这是因为0.99100.9。高检测率只能保证有人脸能

42、够检测出来,但不能保证误检率会很高。二、为了降低误检率,不必过分强求每个强分类器有很低的误检率,假设每个误检率为0.5.对于K=10,最终的级联分类器的误检率为: 。级联分类器由多个强分类器级联而成,一级比一级复杂,一级比一级严格,开始几级只有几个分类很强的特征,越到后面分类器数目越多,非人脸部分被前面几级迅速过滤掉,能够通过所有分类器的图像即为人脸。流程图如图3-8 所示: 图3-8 级联分类器2.3 Adaboost 人脸检测过程利用 Adaboost 算法训练得到的强分类器,可以对图像进行人脸检测。但是由于待检测图像和由Harr 特征训练得到的分类器的尺寸往往是不一样的,这就要求在检测过

43、程中需要改变图像尺寸大小,具体使用Adaboost 进行人脸检测的方法有两种:一种是把待检测人脸图像按比例缩小而保持特征检测窗口不变,用Haar 特征窗口扫描待检测图像,检测出人脸子窗口。这样的检测由于要改变图像尺寸,而Haar 特征值的计算是根据积分图的,所以计算量会很大,检测速度会加慢。如对36×36 的图像用18×18 的检测窗口进行检测,需要对图像抽样成分别率为18×18 的图像进行检测。另一种是把Haar 特征窗口按比例放大,而待检测图像保持不变。由上讨论知道Haar 特征的改变不会增加计算量。所以此种方法的检测速度会很高,本文就是采用的这种方法,按比例

44、放大检测窗口时,比例系数不能过大也不能过小,过大容易漏检,过小容易增加运算量。在检测整幅图像时,可以在图像中移动搜索窗口,检测每一个位置来确定人脸,为了搜索不同大小的人脸,分类器被设计为可以进行尺寸改变的,这比改变输入图像更有效,所以,为了在图像中检测不同大小的人脸,扫描程序需要用不同比例的搜索窗口对图像进行几次扫描,并且需要对同一张人脸的多次重复结果进行合并。在图像检测中,被检测窗口依次通过每一级分类器,在最前面的几层,大部分候选窗口被排除,全部通过每一级分类器的区域即为人脸。2.5 本章小结本章较详细地讲述了 Adaboost 算法和MATLAB 的仿真实现。首先概述了算法的历史和它的实现

45、步骤,然后介绍了Haar 特征及其能够快速实现其特征值的快速方法积分图的计算,如何生成弱分类器,弱分类器经过Adaboost 训练,训练成强分类器,强分类器级联成级联分类器和Adaboost 算法对人脸进行检测的过程。最后用MATLAB 对算法进行仿真实现,并给出了测试结果第3章 人脸识别的主要流程及困难 目前的人脸识别技术在人员配合,较理想采集条件下可以取得比较满意的结果。但在人员不配合,采集条件不理想下,系统的性能陡然下降。目前的主要的难点为:3.1人脸识别的困难3.1.1复杂条件下人脸的检测和关键点定位 人脸检测和关键点定位为实际人脸识别系统的前端处理模块,此模块直接影响着人脸识别系统的

46、性能。目前大多数特征定位算法的精度都会随着光照,姿态等变化而快速下降。复杂条件下的人脸检测与关键点定位是目前人脸识别急需解决的问题之一。3.1.2光照问题关照问题是计算机视觉存在已久的问题,尤其在人脸识别中表现得更加明显。但目前为止光照处理技术远未达到实用的程度,还需要深入的研究。3.1.3资态问题对于姿态的研究相对不多,现在人脸识别算法主要以正面或准正面姿态。当人脸姿态俯仰或左右比较大时,人脸识别的识别率骤降。如何提高人脸识别系统对姿态的鲁棒性是人脸识别中一个具有挑战性的任务。3.1.4表情问题表情识别是生物特征识别的中的一种,是人机交互不可或缺的部分。表情是复杂的面部肌肉运动,每个表情都是

47、几十块面部肌肉共同运动的结果,很难用精确的数学模型来表示这些肌肉的运动。面部表情的变化为面部特征点的运动。由于目前的计算机技术的限制,计算机还不能准确的定位这些面部特征点,也无法辨别面部肌肉的运动。而且,同一种表情在不同的人上也会有不同的表现形式。并且同一个人的不同表情之间也没有明确的界限。以上这些决定计算机很难用统一的标准来识别人的面部表情。3.1.5遮挡问题对于非配合情况下,采集到的人脸图像一般都不是完整的,这会影响人脸特征提取与识别,可能还会导致人脸检测算法的失效。如何有效地排除遮挡物的影响有着非常重要的意义,如在监控环境下。以上列举了部分主要的技术难点,其他难点由于本文的讨论不会涉及,

48、所以不会再一一列举。本文的实验是在人脸图像正面姿态,光照正常,表情正常,部分面部图像有小范围遮挡的情况下进行的。这样做的目的只是让我们的工作重心集中在分析PCA 人脸识别算法性能上。3.2 人脸识别流程图1-1 人脸识别系统处理流程3.2.1人脸图像采集采集人脸图像是通过传感器采集人脸图像,并将其转换为计算机可以处理的数字信号。这是人脸识别的第一步。在采集人脸图像时,要注意用户人脸姿态,脸部有无遮挡,周围光照是否满足要求及设备采集图像的质量是否能满足要求。3.2.2预处理预处理是为了除去噪声和对测量仪器或其他因素对人脸图像造成退化现象进行复原。从传感器采集到图像除了包含人脸特征信息,还包含背景

49、信息,所以必须从原始人脸图像分割出我们要处理的部分。如何分割就需要定位和分割算法。他们一般以人脸图像在图像结构和人脸信号分布的先验知识为依据。常用的人脸预处理有人脸图像灰度化,人脸图像二值化,人脸图像归一化,直方图修正,图像滤波和图像锐化。3.2.3特征提取特征提取就是计算机通过提取人脸图像中能够凸显个性化差异的的本质特征,进而来实现身份识别。本文讲解如何使用PCA算法提取人脸特征,进而实现人脸识别。特征主要包括三种类型:物理特征,结构特征和数学特征。由于物理特征和结构特征容易被察觉,触觉以及其他感觉器官所感知,所以人类常常是利用这些特征来对对象进行识别。对于计算机而言,模拟人类的感觉器官是很

50、难实现的,但计算机在处理数学特征的能力上要比人类强得多,因此我们通过诸如协方差矩阵,统计平均值和相关系数等数学特征来构建人脸识别系统。特征提取和选择的根本任务就是从许多特征中找出那些最有效的特征。在样本数不是很多的情况下,可以利用这些特征进行分类器的设计,但是在大多数情况下,由于测量空间的维数很高,不能直接进行分类器的设计。因此,如何把高维测量空间压缩到低维特征空间,以便有效的设计分类器,便成为了一个值得思考的问题。为了获得有效的特征,一般需要经过特征形成,特征提取和特征选择等步骤。3.2.4特征形成特征形成是根据被识别对象产生出一组基本特征的过程,当被识别的对象是波形或数字图像时,这些特征可

51、以通过计算得来;当被识别对象是实物或某种过程时,这些特征可以用仪表或传感器测量来得到。通过上面方法获得特征被称为原始特征。3.2.5特征提取原始数据组成的空间被称为测量空间。由于测量空间的维数一般都很高,不易设计分类器,所以在分类器设计之前,需要从测量空间变换到维数很少的特征空间,由特征向量表示。通过映射或变换方法用低纬空间来表示样本的过程被称为特征提取。映射后的特征称为二次特征,它们是原始特征的某种组合,通常是线性组合。3.2.6特征选择从一组特征中挑出一些最有效的特征从而达到降低特征空间维数目的的过程称为特征选择。由于在许多实际问题中常常不容易找到那些最重要的特征,或者由于条件限制而不能对

52、这些重要特征进行测量。从而使得特征选择和特征提取的任务复杂化。特征提取和特征选择在有些情况下并不是截然分开的,因为从一定意义上来讲,二者都是要达到对数据进行降维的目的,只是实现的途径不同。特征提取是通过某种变换的方法组合原有的高维特征,从而得到一组低维的特征。而特征选择是根据专家的检验知识或评价准则来挑选对分类最有影响的特征。比如可以先将原始特征空间映射到维数较低的空间,在这个空间中在进一步选择特征来进一步降低维度;也可以先去除那些明显不含有分类信息的特征,而后再进行映射以降低维度。3.2.7特征匹配特征匹配是计算两个人脸图像特征样本的特征模块间的相似度即将采集到的人脸图像的特征模版与系统中已存储的特征模版进行比对,并输出最佳匹配对象。在本文主要讲解使用最近邻法分类器欧几里得距离来判别人脸图像,在实际广泛使用的还有基于SVM即支持向量机,基于神经网络和图匹配的方法。3.3 本章小结本章由人脸识别的研究背景,人脸识别技术的主要难

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论