![人脸检测的基本原理_第1页](http://file4.renrendoc.com/view/66f3725fa31b8ee9a017178ad9bfb184/66f3725fa31b8ee9a017178ad9bfb1841.gif)
![人脸检测的基本原理_第2页](http://file4.renrendoc.com/view/66f3725fa31b8ee9a017178ad9bfb184/66f3725fa31b8ee9a017178ad9bfb1842.gif)
![人脸检测的基本原理_第3页](http://file4.renrendoc.com/view/66f3725fa31b8ee9a017178ad9bfb184/66f3725fa31b8ee9a017178ad9bfb1843.gif)
![人脸检测的基本原理_第4页](http://file4.renrendoc.com/view/66f3725fa31b8ee9a017178ad9bfb184/66f3725fa31b8ee9a017178ad9bfb1844.gif)
![人脸检测的基本原理_第5页](http://file4.renrendoc.com/view/66f3725fa31b8ee9a017178ad9bfb184/66f3725fa31b8ee9a017178ad9bfb1845.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人脸检测的基本原理1引言2人脸检测的基本知识2.1人脸特征2.2预处理技术3图像处理的基本运算方法3.1数字图像的表示3.2区域分割与合并的原理3.3膨胀与腐蚀1引言人脸检测是指给定静止图像或视频序列,不管图像中人脸的位置、大小、方向、姿势、光照等如何变化,找到并定位所有人脸确切位置的技术。有很多与人脸相关的研究领域与人脸检测技术紧密相关,比如人脸定位(FaceLocalization),经过简化的、仅针对包含单个人脸图像的检测技术;人脸跟踪(FaceTracking),在连续的视频序列中实时定位并跟踪人脸的位置;面部特征检测(FacialFeatureDetection),准确定位人脸区域内的眼睛、眉毛、鼻子、嘴、嘴唇、耳朵等面部器官的位置;人脸识别(FaceRecognition),比较输入图像与已经建好的人脸数据库内各图像间的差异,找到差异最小的作为识别结果输出;面部表情识别(FacialExpressionRecognition),识别人脸面部的感情状态,比如高兴、沮丧、悲伤等等。上述这些人脸处理技术的第一步都是要求准确定位好图像中的人脸,因此一个鲁棒、高效的人脸检测算法对这些技术的发展起着关键的作用。2人脸检测的基本知识人脸检测从本质上讲是目标检测的一种,也就是将目标(人脸,Target)与干扰(背景,Clutter)区分开来的过程。2.1人脸特征人脸图像中包含的特征非常丰富。人脸检测利用的是人脸的共性特征,大致分为基本特征、肤色特征、变换域特征、统计特征等。基本特征1)灰度特征人脸区域内具有明显的灰度分布特征。眉、眼和嘴等区域的灰度值较低,前额、脸颊、鼻梁和下颌等区域的灰度值较高。利用这些信息,可以建立简单的人脸模板,用于粗检。例如,多个人脸图像的平均就是一个简单的人脸模板,类似的眼模板和嘴模板也常常使用。人脸具有明显的灰度梯度分布特征。在人脸区域进行水平和垂直方向的灰度投影,根据极小点的位置可以得到眉、眼、鼻和嘴等器官所处的大致区域。光照不均对灰度特征有很大的影响。但在偏光的情况下,眼和嘴、鼻和嘴、鼻和脸颊等区域灰度的比值会保持一定的比率。根据这个特点,可采用线性光照拟合和直方图均衡的方法来补偿光照的影响。Log、Exp和LogAbout等一些非线性变换也可用于光照补偿。2) 边缘和形状特征人脸及人脸器官具有典型的边缘和形状特征,如人脸轮廓、眼睑轮廓、虹膜轮廓、眉毛边缘、鼻侧线和嘴唇轮廓等均可近似视为椭圆、圆、弧线或线段等简单的几何单元。可采用Sobel、Laplacian和Canny等算子或小波变换提取这些边缘特征。噪声的存在会导致边缘的不连续,常采用边缘跟踪器把属于同一轮廓的各段边缘连接起来,并通过约束搜索范围防止边缘跟踪失败。数学形态学的腐蚀与膨胀运算与Hough变换也常用于提取人脸轮廓特征,并对噪声有较好的适应性。应用Snakes模型或主动形状模型(ASM,ActiveShapeModel)能够较好地抽取人脸的边缘特征,但这些模型需要一个较好的初始化位置。尽管在强光照变化下也会产生一些伪边缘,但相对于灰度特征,边缘特征对光照变化具有一定的鲁棒性。3) 结构特征结构特征主要表现在人脸的对称性和各个器官的空间位置分布。人脸在结构上的对称性是十分有用的特征。正面人脸左右对称,对应位置上的边缘和灰度特征基本一致;同时,各个器官也具有自身的对称性,比如双眼、鼻子、耳朵等。面部器官如眉毛、眼睛、鼻子、嘴等,是按一定位置关系组织在一起的。各器官按照从上而下的顺序排列,相对位置保持不变。各器官间还存在着一些几何关系,比如两眼和嘴中心构成一个三角形、鼻子的中心大致位于这个三角形的中心等。根据这些结构特征,配合前面介绍的灰度特征和边缘、形状特征,可以建立基本的规则,区分人脸区域与背景。纹理特征人脸具有特定的纹理分布特征,基于灰度共生(SGLD,SpaceGreyLevelDependency)矩阵建立人脸纹理特征模型,得到表征人脸的一系列纹理特征。肤色特征肤色特征按类别划分应属于人脸基本特征,但其在彩色图像人脸检测中所起到的作用非常重要。肤色是脸部区别于其他区域的重要特征,不依赖于面部细节特征,不受旋转、姿势、表情等变化的影响,具有相对稳定性并和大多数背景物体颜色相区别,已成为彩色图像人脸检测中的一个非常重要的特征。尽管不同种族、不同年龄、不同光照条件下,肤色区域呈现不同的颜色,但相关研究证明,不同类的肤色点间的差别更多的在于颜色中的亮度分量,而色度分量在各肤色点间变化不大。由此,可以在特定的色彩空间中建立肤色模型,描述人脸肤色的特征,有效去除图像中复杂背景的干扰、减小待搜索范围。常用的色彩空间有RGB、归一化RGB、HSV、YCbCr、YIQ、YES、CIEXYZ、CIELUV、CIELab、CIEDSH、TSL等,常用的肤色模型有直方图模型、高斯模型、混合高斯模型等。变换域特征基于FFT、DCT、小波、K-L等变换,根据能量规则选择一系列系数作为表征人脸图像的特征。人脸识别中广泛使用的本征脸(EigenFace)以及最近流行的类Haar特征(Haar-likefeature)均属于变换域特征。目前图像大多以压缩的格式存在,各个图像压缩标准广泛地应用了DCT和小波变换,因此,研究如何有效地提取这些变换域下的人脸特征,具有很强的实际意义,已成为目前一个很受重视的研究方向。统计特征由于人脸图像模式的复杂性,能够用来描述人脸共性特点的显式特征是有限的,而由此建立起的人脸规则的有效性也有很大的局限性。解决这个问题的办法就是更多地使用人脸图像的统计特征,也可称为隐式特征。统计特征是指通过统计的方法,从单个图像数据或大量图像数据中获得的特征,如自相关、高阶矩、不变矩、在子空间的投影、空间距离、隶属度、概率分布、熵、互信息,以及神经网络的抽象特征等。统计特征不如基本特征直观,但描述的往往都是人脸与非人脸的本质区别,在一个更高的层次上描述人脸特征。在大量统计特征基础上构建起来的基于统计学习的人脸检测算法,具有良好的适应性和鲁棒性,得到了广大研究人员的普遍重视,已成为目前研究的主流。运动特征对于视频序列,相邻帧间的运动信息是一个重要的特征。计算相邻帧图像的差分即可得到运动区域。为了提高算法对噪声的鲁棒性,可采用空间连通区域、多帧差分、差分图像光滑滤波、时空三维张量等方法。运动特征也常用于人脸跟踪的研究中,基本方法就是跟踪整个人脸或基于特征器官(如眼、嘴)的跟踪。2.2预处理技术为了提高检测算法的效率,需对输入图像进行一些预处理。通用的预处理手段主要包括:边缘提取,去除图像中低频的背景区域;直方图均衡,使图像中象素值分布均衡化;光照补偿,克服亮度不均对结果的干扰;肤色分割,将肤色区域与背景分离。背景去除人脸区域内灰度变化较大,在图像中属于高频信息,通过提取边缘、去除边缘很弱的图像区域,可以去除变化平坦的背景区域。除了这种简单的方法外,Shaick等提出了一种新的针对灰度图像的预处理方法,算法的框图如图1所示。图1Shaick算法框图首先对输入图像进行直方图均衡,然后利用2D-FFT将其变换到频域。在频域利用最佳自适应相关器(OptimalAdaptiveCorrelator,OAC)将输入图像与“平均脸”模板求相关,滤波器输出如式(1)H(f,f)=U*(f,f)/00]|V(f,f)2] (1)xy Xy xy其中U、V分别为“平均脸”模板和输入图像的傅立叶变换,“*”代表二维复共轭,f、f分别是二维频域内的索引,①为5X5大小的矩形窗口,®代表xy卷积算子。将滤波器的输出按照实验得到的阈值分为人脸区域、可能的人脸区域和背景区域三部分。实际使用中,首先通过训练的方法得到“平均脸”模板,然后在7X9的窗口内对待测图像进行局部灰度均衡(LocalHomogenization),最后使用OAC滤波器排除背景区域。经过这样的处理,在MITSetB测试集中可以排除图像中99%的待检测区域,而仅仅产生了1.3%(2/153)的漏检,同时其计算复杂度也相对较小,可以在不对算法精度产生太大影响的条件下提高算法的速度。肤色模型肤色是彩色图像中人脸部区别与其他区域的一个非常重要的特征。利用肤色分割算法不但可以减小待搜索图像的大小,而且还可以有效的控制误检。因此肤色模型在人脸检测的研究中一直受到很大的重视。1)彩色空间各种标准的彩色空间均可用于构建肤色模型,比如YCbCr、HSV、归一化rgb等。Hsu等考察了肤色点与背景点在各彩色空间中的实际分布情况,具体的统计结果如图2所示。图2不同颜色空间内肤色点的分布(a)YCbCr空间,(b)肤色点在CbCr平面内的投影,(c)rgb空间(d)HSV空间(红点表示肤色点,蓝点表示背景点)
由图2中可以明显看出,与其它空间相比,YCbCr空间中的肤色点具有更加集中的分布,最为适合肤色分割。因此目前很多研究工作都是基于YCbCr彩色空间进行的。在YCbCr彩色空间的基础上,进行更深一步的考虑。YCbCr三分量与视频中使用的YUV三分量具有相似的思路,即将原来的RGB三个色度分量通过一个线性变换,转化为一个亮度和两个色度分量,其中Y为亮度分量,CbCr分别为蓝色(Blue)和红色(Red)的色度分量。通过分析RGB三个分量在肤色区域的分布,Dios等提出与YCbCr空间类似的一个新的颜色空间YCgCr,使用Cg(代表绿色Green)分量来代替Cb分量。依据ITURec.BT.601规定的标准,Cg分量可以由式(2)所示的变换公式得到:Y1665.481128.55324.966RCg=128+丄-81.085 112 -30.915-G (2)256Cr128 112 -93.768-18.214B如图3所示,在YCgCr空间内,肤色点的分布更加集中,更加有利于排除那些近似肤色点的区域。相关的实验也证明了其可以获得更好的结果。<a)YCbCr(b)YCgCr<a)YCbCr(b)YCgCr图3两个颜色空间肤色分布比较进一步思考产生这个现象的原因。人脸的肤色区域接近于黄色,而黄色是由红色和绿色混合而成,因此在肤色区域内,红、绿分量的值更大且基本相同(有很大的相关性),而蓝色分量则明显偏小且与其它两个颜色的分布无关。这一点可以由图3明显看出,图3(a)的分布没有任何规律,而图3(b)则呈现线性分布。因此,YCgCr彩色空间可以更加有效地描述肤色点的分布情况。
2)肤色分布的描述常用的肤色分布描述方法有阈值法、高斯法、混合高斯法、直方图法等。阈值法最为简单,根据训练样本中各肤色点的色度分量出现的范围,确定一个阈值范围,如[Crl,Cr2]及[Cbl,Cb2]。若待测图像中某个象素点的色度分量(Cr,Cb),满足CrlWCrWCr2并且CblWCbWCb2,则该点就被认为是肤色点保留;否则认为该点是背景点去除。直方图法是比阈值法更为准确的一种模型描述方法,通过统计训练图像中各肤色点出现的概率,得到一个关于CrCb分量的二维统计直方图。直方图中,z方向的分量即表示该点(Cr,Cb)为肤色点概率的大小。通过一个合适的阈值,确定哪些区域的颜色点是肤色点,哪些不是。高斯以及混合高斯法均是用概率模型来描述各肤色点的分布。高斯法的思想是假设大量肤色点在彩色空间中的分布符合一个二维高斯分布,将肤色点的分布用一个高斯模型来表示,均值(也就是肤色点分布的中心)和协方差矩阵由统计的方法获得。通过这个高斯模型可以得到待测图像中各点属于肤色的概率,利用一个阈值作为判决条件,将概率大于这个阈值的点判断为肤色点,而小于这个阈值的点判为背景点。在实际应用中,人们发现肤色点在彩色空间的真实分布大多具有多峰的性质,单一的高斯模型不能充分地描述。因此,Yang等提出了使用高斯混合模型的方法来描述肤色点的分布,具体定义如下:彩色空间中各肤色点的分布可以看成是混合高斯分布模型G,由有限多个单一高斯模型G1,…,Gg以及相应的权重系数n1,…,ng混合而成,其中艺兀=1,并且工i>0 (3)ip(x,©)=p(x,©)=瓦兀ii=1-p(x,0)=乙兀-p(x|i,0)i ii=1i=11i=11(2兀)d/2-Xi1/2-exp一2(x一卩)i(Xi)-1(x一H)ii4)其中p(x;e)i为模型Gi的概率密度函数,Mi为Gi的均值向量,工i为Gi的协方差矩阵,具体的参数值,可通过EM算法估计得到。目前最为流行的肤色模型是使用YCbCr彩色空间并配合直方图描述构建的。这种模型构建简单,对于大多数图像均可以取得可以接受的结果。光照补偿光照对于检测算法的性能是一个非常大的干扰因素。特别是对肤色模型,在亮度分量不同的情况下,色度分量的分布是有较大区别的,如图2(a)。如果忽略光照的影响,则肤色模型的适用性将会受到很大限制,因此光照补偿常常伴随肤色模型一起研究。对于光照问题有一些通用的方法,比如直方图均衡、对数变换、同态滤波等。直方图均衡主要针对灰度分布不均的图像,可以增强图像的对比度,提高图像质量;对数变换主要针对偏光图像,使用如式(5)所示的变换公式:g(x,y)二a+叫¥)+1) (5)b-Inc其中f(x,y)、g(x,y)为变换前后的图像,a、b、c为控制参数。通过对待测图像灰度分布的分析,可以自适应地确定参数a、b、c,调整变换曲线使变换后的图像中,低灰度区域得到提升,高灰度区域得到抑制,从而实现光照补偿。除了上述这些通用的光照补偿方法,还有一些专门针对肤色模型的研究值得目前各种肤色模型都仅考虑了CbCr平面内肤色点的分布,但是通过图2(a)可以发现,在YCbCr空间内,对应不同的Y值,空间的横截面内Cb、Cr分量呈现不同的分布。如果仅使用CbCr平面内的投影而忽略亮度对色度的干扰,则无法得到理想的肤色模型。因此,Hsu等提出了一种颜色空间非线性变换的方法来解决光照不均的问题。在YCbCr空间内使用一个非线性变换,将其变换到YCb'Cr'空间。在变换后的YCb'Cr'空间内,肤色点的Cb'、Cr'分量在不同亮度Y的情况下,达到一种比较均匀的分布,即呈现一个近似柱体的分布,由此达到补偿光照影响的目的。除了针对输入图像进行被动的光照补偿处理之外,还可以建立一种主动的反射模型,对不同皮肤、不同光源下的图像进行主动的自适应处理。Storring等深入分析了不同种光源对于肤色的影响,综合利用皮肤反射、光源、镜头色温等建立起一个可以适合各种光源的肤色模型。肤色是由皮肤对不同波长光有不同的反射率而形成的,Storring等利用二分光反射模型建立起肤色反射模型。任何一个非光源物体的颜色L都是由面反射LSurf和体反射LBody两部分构成:L二L+L (6)SoftBody其中,面反射主要来自表皮(epidermis),而体反射主要来自真皮(dermis),不同肤色的人脸对各种波长的光线具有不同的反射率,从而形成不同的颜色。在这方面Anderson等做了很多深入的研究,得到了肤色区域内对不同光线的反射率曲线pBody。
有了这样的反射模型,配合光源的相关色温曲线(CorrelatedColorTemperature,CCT)和摄像镜头的敏感度曲线,利用整个光谱区域内的积分,就可以得到针对不同肤色、不同光源、不同镜头的肤色分布模型。JE(九)p& SkinfE(X)pJE(九)p& SkinfE(X)p、 SkinJE(X)pX SkinR7)(X)f(X)dX7)G(X)f(X)dXB其中E(久)是光源的色度谱,p(X)为肤色反射模型,f(X)f(X)f(X)为Skin RG B摄像镜头对于各种不同波长光的敏感度曲线。图4不同人种在不同光源色温下的肤色分布由此可以通过式(7)在归一化rgb空间内建立肤色模型,如图4图4不同人种在不同光源色温下的肤色分布图4中,各个符号代表有上述方法建立起的不同人种肤色分布模型的中心,而四边形的外框代表使用训练集得到的真实肤色分布模型,可以看到使用光谱积分可以有效地建立起针对各种不同情况下的肤色模型,具有较强的通用性。Sorianoa等延伸了Storring的工作,提出了一种自适应的肤色模型,在归一化的rgb空间内,将肤色点分为自然光反射、室内光反射和混合反射3种,在分割时,自适应地利用不同种模型得到有效的分割结果。
3图像处理的基本运算方法3.1数字图像的表示本设计中我的实验对象是数字图象。数字图象在计算机中可以被定义为一个二维的函数f(x,y),这里x和y是空间坐标,而任意坐标对(x,y)的幅度f被称为图象在该点的密度。术语“灰度级”被经常用来描述黑白图象的密度。而彩色图象由单独的2维图象组合而成。例如,在RGB彩色系统中,一幅彩色图象包括三个单独图象元素(红,绿,蓝)。出于这个原因,通过处理三个单独的分量,许多发源于黑白图象的技术能够被延伸到彩色图象的处理中去。一幅图象可能在x和y坐标以及幅度上都是连续的。将这样的一幅图象转化为数字图象需要将坐标和幅度都进行数字化。数字化坐标的过程叫做采样,而数字化幅度的过程叫做量化。当x,y和f都是有限的、离散的数量时,我们称其为数字图象。在Matlab中,一幅图象被存储为如下的矩阵:(8)f(M,1)f(M,2)…f(M,N)f(1,2)…f(1,(8)f(M,1)f(M,2)…f(M,N)3.2区域分割与合并的原理让R表示整个图象区域并选择谓词P。一种分割R的方法是将其不断
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 部编初中历史八下第12课民族大团结教案
- 年产50万套中医医疗器械生产线技术改造项目可行性研究报告模板-立项拿地
- 中药乌药课件
- 2025-2030全球数字道路行业调研及趋势分析报告
- 2025-2030全球SCR 尿素系统行业调研及趋势分析报告
- 2025年全球及中国铒镱共掺光纤行业头部企业市场占有率及排名调研报告
- 2025年全球及中国鱼塘净水器行业头部企业市场占有率及排名调研报告
- 2025-2030全球汽车出风口空气清新剂行业调研及趋势分析报告
- 2025年全球及中国IG100气体灭火系统行业头部企业市场占有率及排名调研报告
- 2025年全球及中国电子学习开发服务行业头部企业市场占有率及排名调研报告
- 2025年春节安全专题培训(附2024年10起重特大事故案例)
- 2025年江苏太仓水务集团招聘笔试参考题库含答案解析
- 辽宁省沈阳名校2025届高三第一次模拟考试英语试卷含解析
- 《中小学校园食品安全和膳食经费管理工作指引》专题知识培训
- 2024年新疆区公务员录用考试《行测》真题及答案解析
- 第三章-自然语言的处理(共152张课件)
- 行政事业单位国有资产管理办法
- 六年级口算训练每日100道
- 高一生物生物必修一全册考试题带答题纸答案
- 北师大版五年级上册四则混合运算100道及答案
- 人教部编版道德与法治八年级下册:6.3 《国家行政机关》说课稿1
评论
0/150
提交评论