基于AdaBoost算法的人脸检测_第1页
基于AdaBoost算法的人脸检测_第2页
基于AdaBoost算法的人脸检测_第3页
基于AdaBoost算法的人脸检测_第4页
基于AdaBoost算法的人脸检测_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于AdaBoost算法的人脸检测姓名:董银学号:2111305003内容摘要

人脸检测是指对待检测图像,采用一定的方法对其进行搜索来确定其中是否存在人脸,如果存在,则返回人脸的位置、姿态和大小。人脸检测源自人脸识别,是人脸识别系统中一个关键环节。随着近年来电子商务应用的发展,人脸检测开始作为一个独立的课题,受到研究者的重视。人脸检测作为人脸信息处理中的一项关键技术,在身份验证、基于内容的图像检索、自动监控、人机交互等方面有着重要的应用价值。本文详细分析了Viola等人提出的Adaboost级联人脸检测算法,主要任务在于:1、详细得介绍了Adaboost算法的Haar特征、积分图像、弱分类器、强分类器的概念,在深入研究基于Adaboost算法的人脸检测方法的同时,构建了一个人脸实时检测系统。2、最后针对传统Adaboost算法在训练过程中出现的退化问题、目标非对称问题和分类器相关性问题,都进行了相应的改进,实验结果表明,改进后的方法在一定程度上避免了退化现象,且在检测率和检测速度方面都有一定的提高本文详细分析了Viola等人提出的Adaboost级联人脸检测算法。目录矩形特征和积分图2AdaBoost学习算法3AdaBoost的改进4简介1人脸检测系统的实现5第一章简介

Adaboost人脸检测方法是一种基于积分图、Adaboost算法和级联检测器的方法,具有鲁棒性强、检测率高等特点。Viola于2001年提出了基于Adaboost算法的人脸检测方法。这种方法首先采用一种被称为“积分图”的方法快速地计算出大量的简单特征,再用Adaboost学习算法从一个较大的特征集中选出少量关键的分类能力较强的特征构造出一系列弱分类器,而后通过线性组合将这些弱分类器组合构成一个强分类器,最后通过Cascade级联算法将单个分类器合成为一个更加复杂的人脸检测器。这种方法有以下三个特点:

1.使用一种叫做积分图的方法来计算特征值。

2.Adaboost算法从大量的特征中选出少量关键特征构成一个强分类器。

3.将强分类器串联成级联分类器。第二章矩形特征和积分图2.1矩形特征1、定义矩形特征也叫类Haar特征,能有效地区别人脸与非人脸。最初的类Haar特征是由Papageorgiiou提出的。矩形特征值是指图像中两个或多个形状大小相同的矩形内所有像素的灰度值之和的差值。图2一1中包括三种特征,a和b为双矩形特征,将其特征值定义为白色矩形像素和减去黑色矩形像素和。c、d为三矩形特征,其特征值定义为两边的两个白色矩形的像素和减去中间的黑色矩形的像素和。e为四矩形特征,其特征值为对角线上矩形内像素和之差。图2-1

矩形特征2.1矩形特征Haar特征,也叫矩形特征,它对一些简单的图形结构,比如边缘、线段,比较敏感,但是其只能描述特定走向(水平、垂直、中心)的结构,因此比较粗略。如图2-2,脸部一些特征能够由矩形特征简单地描绘,上行是子窗口内选出的矩形特征,下行是子窗口检测到的与矩形特征的匹配。例如,通常,眼睛要比脸颊颜色更深;鼻梁两侧要比鼻梁颜色要深;嘴巴要比周围颜色更深。对于一24×24检测器,其内的矩形特征数量超过150,000个,必须通过特定算法甄选合适的矩形特征,并将其组合成强分类器才能检测人脸。图2-2矩形特征在人脸上的矩形匹配2.1矩形特征2、扩展的矩形特征Viola提出的这些矩形特征对于正面人脸具有较好的描述特性,但是当人脸发生倾斜时,这些垂直特征性能就大大下降。许多研究人员对Haar-like特征进行了扩展,其中最具代表性的是Lienhart等人提出的带有45度方向的旋转Haar-like特征,这些特征可以解决一定倾斜角度的人脸检测问题。可以将这些Haar特征三大类分为三大类:边缘特征、线特征和中心环绕特征,如图2-3所示:图2-3扩展的矩形特征2.1矩形特征特征模板可以在检测窗口的任意尺度、任意位置处进行放置,不同的位置、不同的尺度对应一个特征。从这些矩形特征原型派生其他特征的方法是:对没有旋转的矩形特征原型来说,可以垂直或水平方向上改变矩形边长,对于旋转45度的特征,可以沿正(负)45度方向改变矩形的边长。一个检测窗口中的特征是非常巨大的,计算其个数是进行后续训练工作的基础。以W×H分辨率的检测窗口为例,在此窗口中,假设矩形特征原型的大小为w×h,系数X=W/w,Y=H/h,若其为未旋转特征原型,则由此特征原型可以派生出的特征总数为:XY*(W-w(X+1)/2+1)(H-h(Y+1)/2)(2-1)若其为旋转特征原型,则可派生的特征总数为:XY*(W-z(X+1)/2+1)(H-z(Y+1)/2)(2-2)其中z=w+h3、特征值的计算

对于任意一个矩形特征,均可用一个五元组表示为r(x,y,w,h,α),其中x和y表示该矩形特征左上角的坐标值,w和h为该矩形的宽和高,α为该矩形特征旋转的角度。矩形内所有像素的灰度和可以用RectSum(r)来表示。Haar-like特征值为其白色区域灰度和与黑色区域灰度和之差,每个特征的特征值的计算公式为:2.1矩形特征(2-3)其中ωi表示矩形的权值,N为组成特征的矩形的个数。满足以上要求的矩形特征有无数个,在实际应用中必须对其进行限制,RainerLienhart对这些矩形特征的限制为:(1)N必须为2,即一个矩形特征由两个矩形组成;(2)构成矩形特征的两个矩形对应的权值必须异号,一正一负且权值应与矩形面积成反比。假设组成矩形特征的两个矩形r1和r2的权值分别为ω1和ω2,面积分别为Area(r1)和Area(r2),则必须满足ω1Area(r1)=—ω2Area(r2),一般令ω1

=-1,则ω2

=Area(r1)/Area(r2)。假设构成矩形特征的两个矩形分别为r1和r2,要么r1包含于r2中,要么r2包含于r1中。若r1包含于r2中,则Area(r2)=n×Area(r1),权值ω1=−n×ω2,其中,n为大于1的整数,反之亦然。2.2积分图

特征的数量很多,计算特征值看起来是一个很大的工作量。然而,积分图像可以帮助我们解决这个问题。积分图的思想是将图像从起点开始到各个点形成的矩形区域内的像素灰度值之和作为一个数组存储到内存中,当要计算某个矩形区域的像素灰度和时可以直接索引数组中的元素,利用这些元素直接进行加减,而不需要重新计算区域的像素灰度和,从而大大加快了计算速度;且积分图能够对于各种尺度、各种位置特征的特征值使用相同的时间进行求解,因此大大提高了训练和检测的速度。Haar-like特征分为倾斜和非倾斜两种,因此我们需要建立两种积分图来分别对这两类特征的特征值进行求解。(1)针对倾角为0的矩形特征,积分图SAT(x,y)定义为:(2-4)上式表示原始图像像素(x,y)处的积分图即为该像素左上方所有像素的灰度和,其中I(x',y')表示像素点(x',y')的灰度值,如图2-4(a)所示。2.2积分图在实际应用中,只需按行或按列遍历图像一次便可以得到一幅图像的积分图,计算公式如下:S(x,y)=S(x,y-1)+I(x,y)(2-5)SAT(x,y)=SAT(x-1,y)+S(x,y)(2-6)其中,S(x,y)表示点(x,y)所在位置的y方向上所有纵坐标小于等于y的像素灰度之和,且S(x,-1)=0,SAT(-1,y)=0。利用积分图可以我们可以快速的计算出图像中任意矩形区域内的像素灰度和,两矩形的Haar特征值可以通过积分图上的六个点计算得到,而三矩形的Haar特征值可以通过积分图上的八个点计算得到,从而使得Haar-like特征的计算变得非常简单。(2)针对倾角为45的矩形特征,如图2-4(b)所示,积分图TSAT(x,y)定义为:(2-7)2.2积分图上式计算的是从点(x,y)开始向上延伸出的一个倾角45度区域与原图像的相交区域内的所有像素点的灰度和。在实际应用时,也是通过增量方式计算得到的。TSAT(x,y)=TSAT(x-1,y-1)+TSAT(x+1,y-1)-TSAT(x,y−2)+I(x,y)+I(x,y-1)(2-8)其中:TSAT(-1,y)=TSAT(x,-1)==TSAT(x,-2)=TSAT(-2,y)=0在实现时只需按行或按列遍历图像一次,便可以得到原图像的积分图。图2-4积分图像示意图2.2积分图2.利用积分图计算矩形特征

积分图的提出使得矩形特征的计算变得简单易行,只需对每个像素点进行少量的计算,将积分图结果存储起来,当要计算某个区域的像素和时可以直接搜索出相关的顶点积分值进行简单的加减,从而大大减少了重复运算,提高了检测的速度,使得实时人脸检测系统变得可能。(1)对于倾角为0的矩形r=(x,y,w,h,0),如图2-5(a)所示,其矩形内像素灰度积分值可以由下式计算得到:RectSum(r)=SAT(x-1,y-1)+SAT(x+w-1,y+h-1)-SAT(x-1,y+h-1)-SAT(x+w-1,y-1)(2-9)(2)对于倾角45°的矩形r=(x,y,w,h,45°),如图2-5(b)所示,其矩形区域像素和可以计算如下:RectSum(r)=TSAT(x+w,y+w)+TSAT(x−h,y+h)-TSAT(x,y)−TSAT(x+w−h,y+w+h)(2-10) 2.2积分图由(2-9)、(2-10)可以看到,要得到一个矩形内的像素灰度积分,只需知道四个矩形顶点的积分值即可。因此,不管矩形特征的尺度如何,其计算所消耗的时间均相同。对于Voila的人脸检测系统,每个矩形特征的计算最多需要9个元素的加减,且在进行多尺度检测时,仍可以使用相同的积分图,从而使得检测过程只需扫描原图像一次,便可以在任何尺度进行搜索,从而使得检测过程非常快。图2-5矩形特征值的计算方法示意图第三章AdaBoost学习算法3.1概述

Freund于1995年提出了Adaboost算法,其基本思想是利用大量分类能力一般的弱分类器,通过一定方法叠加成一个分类能力很强的强分类器。它的前身是Boosting算法,Boosting算法提供一种提升学习算法精度的普遍方法,是组合学习中最具有代表性的一种方法,它的思想是每个弱分类器在学习过程中,对前一次迭代的错误样本给于更大的重视,通过更新错误样本的权值,得到新的弱分类器,通过不断地迭代形成多个弱分类器及相应的权值。Boosting算法法源于PAC((ProblyApproximateCorreet:概率近似正确)模型。PAC学习的实质就是在样本训练的基础上,使算法的输出以概率接近未知的目标概念。Boosting算法存在两个缺点:第一,该算法需要事先知道弱学习器学习正确率的下限,这在实验中是很难做到的。第二,该算法可能导致学习器在学习过程中过分集中于少数特别困难的样本,造成过学习现象。Freund改进了Boosting算法,提出了具有自适应的Boosting算法,也就是Adaboost算法。这种算法不需要事先知道弱学习器正确率的范围,而是根据弱学习器预测的正确率来设定相应的权值。Adaboost算法的原理是给定一组正负样本及特征,训练出这些特征各自的分类器,选择一些分类能力较强的特征,将这些单独特征的分类器组合成一个更加复杂,分类能力更强的强分类器。算法的关键是当分类器正确分类时,减少样本的权值,当错误分类时,增加样本的权值,让学习算法能够在后面的学3.1概述习中对比较困难的样本进行训练,最后得到一个检测率较高的强分类器。基Adaboost算法的人脸检测方法从由积分图计算出的大量特征中挑选一些重要的特征,构成一系列弱分类器,再把多个弱分类器合成一个强分类器,最后将几个强分类器串联成级联分类器。以下将分别讨论弱分类器,强分类器以及级联结构。3.2弱分类器

每个Haar特征都一一对应着一个弱分类器,弱分类器就是一些分类能力不强的分类器,只要其分类的精度大于50%就可以了,每个弱分类器都是根据它对应的Haar特征的参数来进行定义的。使用上述Haar特征的位置信息,对所有训练样本进行统计就可得到其对应的特征参数。下面是弱分类器的定义公式:(3-1)

其中x是待检测的图像窗口,fj(x)表示待检测图像的第j个特征值。pj=±1用来控制不等号的方向,θj是一个阀值。每个特征j对应的参数θj可以用下式表示:θj=(N1m1+N2m2)/(N1+N2) (3-2)

其中N1为人脸样本的数目,N2为非人脸样本的数目,m1为当前特征在所有人脸样本上的平均特征值,m2为当前特征在所有非人脸样本上的平均特征值。若m1<θj,则pj=一1;当测试图像的特征值小于θj时,弱分类器将该图像判断为人脸图像。否则判断为非人脸图像。3.2弱分类器由Adaboost算法流程可知,其每轮训练的目的是挑选此轮中的最优弱分类器,即分类错误率最小的弱分类器,并赋予其相应的权值,其算法的具体流程如下:For1…m(即对于每个特征,m表示特征总数)a、计算每个训练样本对应于当前特征j的特征值,对所有的特征值进行升序排序b、计算所有人脸样本的权重和T+以及所有非人脸样本的权重和T-c、fori=0…n(对于排序好的每个训练样本,n表示训练样本的总数)i)计算在此元素之前的所有人脸样本权重和Sij+,在此元素之前的所有非人脸样本权重和Tij-ii)计算并将其对应的样本特征值作为此弱分类器的阀值θ,确定出相应的不等式方向p;最后计算:3.2弱分类器即找到具有最小分类错误率的弱分类器,记录此时的不等式方向p和阀值θ以及相应的特征类型,由此便可找到一轮循环中的最佳弱分类器。由此我们可以看出,弱分类器的阀值必定是使得分类错误率最小的阀值,它在现有的训练样本基础上必定属于某个矩形特征,而这个特征矩形就是我们需要挑选出来的最佳分类器。此外,我们还可以看出,样本的权值对于弱分类器的构造起着重要的作用,它不仅左右着矩形特征的选择,同时也对阀值的确定起着重要的作用。计算出最小分类错误率ε,根据错误率最小原则来确定弱分类器的阈值θ及方向符号p以及分类器的矩形特征类别。图3.1给出了Ad

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论