(通信与信息系统专业论文)基于谱直方图和支持向量机的人脸检测.pdf_第1页
(通信与信息系统专业论文)基于谱直方图和支持向量机的人脸检测.pdf_第2页
(通信与信息系统专业论文)基于谱直方图和支持向量机的人脸检测.pdf_第3页
(通信与信息系统专业论文)基于谱直方图和支持向量机的人脸检测.pdf_第4页
(通信与信息系统专业论文)基于谱直方图和支持向量机的人脸检测.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理工大学硕士学位论文 摘要 人脸检测作为人脸信息处理中的一项关键技术,近年来在模式识别与计算机视觉领 域中,已经成为一个受到普遍重视、研究十分活跃的方向。随着智能化信息处理技术的 发展,人脸检测在身份识别、基于内容的检索、自动监控、人机交互等方面有着日益广 泛的应用。 本文给出了谱直方图描述的定义和特性,并研究了谱直方图和支持向量机( s ) 相结合的人脸检测算法,并对其进行了改进。 ( 1 ) 将谱直方图和支持向量机有效的结合起来,对复杂背景图像中的正面人脸检测 取得了比较好的结果。算法性能好归因于谱直方图的理想特性和支持向量机的泛化性较 好。算法具有较强的适应能力和鲁棒性。 ( 2 ) 本文在构造谱直方图所需的滤波器时进行了改进,采用局域二值模式( l b p ) 来 代替g a b o r 滤波器来构造滤波器组。l b p 算子是通过刻画图像像素点邻域内灰度的变化来 描述图像的纹理结构特征的,因此使得支持向量机的分类更准确,并大大减少了算法的 计算量。 ( 3 ) 为了检测不同大小的人脸,采用多分辨率的滑动窗口策略,实现人脸检测的位 置不变性与尺度不变性。 大量实验结果表明,本文算法对复杂背景图像中的正面人脸检测取得了比较好的结 果,具有较强的鲁棒性。 关键词。人脸检测;谱直方圈;局域二值模式;支持向量机 人连理l :人学硕十学位论文 f a c ed e t e c t i o nb a s e do ns p e c t r a lh i s t o g r a m sa n ds v m s a b s t r a c t a sac r i t i c a lt e c h n o l o g yo ff a c ei n f o r m a t i o np r o c e s s i n g , f a c ed e t e c t i o nh a sb e e np a i d m u c ha t t e n t i o na n db e c o m eav e r ya c t i v er e s e a r c hb r a n c hi np a t t e r nr e c o g n i t i o na n dc o m p u t e r v i s i o na p p l i c a t i o na r e 勰w i t ht h ed e v e l o p m e n to fi n t e l l i g e n ti n f o r m a t i o np r o c 郫s i n 舀f a c e d e t e c t i o nw i l lb eb r o a d l ya p p l i e di ni d e n t i t yr e c o g n i t i o n , c o n t e n t - b a s e dr e t r i e v a l ,s u r v e i l l a n c e a n dh u m a nc o m p u t e ri n t e r a c t i o n i nt h i st h e s i s ,t h ed e f i n i t i o na n dp r o p e r t i e so fs p t 删h i s t o g r a mr e p r e s e n t a t i o ni sg i v e n , a n daf a c ed e t e c t i o na l g o r i t h mb a s e do l ls p e c t r a lh i s t o g r a m sa n ds u p p o r tv e c t o rm a c h i n e s ( s v m ) h a sb e e ns t u d i e d m o r ei m p o r t a n t l y , t h ep e r f o r m a n c eo f a l g o r i t h mi si m p r o v e d ( 1 ) i nt h i st h e s i s ,s p e c t r a lh i s t o g r a m sa n ds v m sa r cc o m b i n e de f f e c t i v e l y , a n df a i r l y g o o dr e s u l t st od e t e c tf r o n t a lf a c e si nc o m p l e xi m a g e sa r ca c h i e v e d 1 1 地p e r f o r m a n c eo f t h e a l g o r i t h mc a nb ea t t r i b u t e dt ot h ed e s i r a b l ep r o p e r t i e so fs p e e t r a lh i s t o g r a mr e p r e s e n t a t i o n s m a dt h eg e n e r a l i z a t i o np r o p e r t yo fs v m s t l l ep r o p o s e da l g o r i t h mh a ss t r o n ga d a p t a t i o na n d r o b u s t n e s s ( 2 ) 1 1 ”p e r f o r m a n o fa l g o r i t h mi si m p r o v e d ,b yc o m p u t i n gs p e c t r a lh i s t o g r a m sw h i c h l b po p e r a t o ru s e dt or e p l a c eg a b o rf i l t e rt oc o n s t r u c tf i l t e r s l o c a lb i n a r yp a t t e r n s ( l b p ) d e s c r i b e st h es t r u c t u r eo f t h et e x t u r eb yc h a r a c t e r i n gc h a n g e so f g r a yo f t h en e i g h b o u r h o o do f e a c hp i x e l ;i ti se f f i c i e n tn o to n l yf o rm a k i n gs v m sc l a s s i f i c a t i o nm 哪a c c u r a t e l yb u ta l s of o r r e d u c i n gt h ec o m p u t a t i o n a lc o s t ( 3 ) t od e t e c tf a c e sw i t hd i f f e r e n ts i z e s ,as t r a t e g yo fm u l t i - r e s o l u t i o ns l i d i n gw i n d o wi s u s e dt oa c c o m p l i s hi n v a r i a n c 硷o f l o c a t i o na n ds c a l ei nf a c ed e t e c t i o m e x p e r i m e n tr e s u l t ss h o wt h a tt h ea l g o r i t h mc a l ld e t e c tf r o n t a lf a c e si nc o m p l e xi m a g e s ; t h e ni ti sar o b u s ta n de f f e c t i v ea l g o r i t h m k e yw o r d s :f a c ed e t e c t i o n ;s p e c t r a lh i s t o g r a m s ;l o c a lb i n a r yp a h e r n s ;s u p p o m v e c t o rm a c h i n 豁 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特n j n 以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 人连理工人学硕士研究生学1 1 7 = 论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用 规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名:壁垒篮 导师签名: 兰剑丝 大连理i :人学硕士学位论文 1 绪论 1 1 研究背景与意义 人脸检测是指在输入图像中确定所有人脸( 如果存在) 的位置、大小、位姿的过程。 人脸检测作为人脸信息处理中的一项关键技术,近年来成为模式识别与计算机视觉领域 内一项受到普遍重视、研究十分活跃的课题。 人脸检测问题最初来源于人脸识别。人脸识别的研究可以追溯到2 0 世纪6 0 一7 0 年 代,经过几十年的曲折发展已日趋成熟【”,人脸检测是自动人脸识别系统中的一个关键 环节,但是早期的人脸识别研究主要针对具有较强约束条件的人脸图像( 如无背景的图 像) ,往往假设人脸位置已知或很容易获得,因此人脸检测问题并未受到重视。近几年 随着电子商务等应用的发展,人脸识别成为最有潜力的生物身份验证手段,这种应用背 景要求自动人脸识别系统能够对一般环境图像具有一定的适应能力,由此所面临的一系 列问题使得人脸检测开始作为一个独立的课题受到研究者的重视。今天,人脸检测的应 用背景已经远远超出了人脸识别系统的范畴,在基于内容的检索、数字视频处理、视觉 监测等方面有着重要的应用价值。 人脸检测研究具有重要的学术价值。人脸是一类具有相当复杂的细节变化的自然结 构目标,此类目标的检测问题的挑战性在于:( 1 ) 人脸由于外貌、表情、肤色等不同, 具有模式的可变性;( 2 ) 一般意义下的人脸上,可能存在眼镜、胡须等附属物;( 3 ) 作 为三维物体的人脸的影像不可避免地受由光照产生的阴影的影响。因此,如果能够找到 解决这些问题的方法,成功构造出人脸检测与跟踪系统,将为解决其它类似的复杂模式 检测问题提供重要的启示。 对人脸检测的研究最初可以追溯到2 0 世纪7 0 年代,人脸检测早期的研究主要致力 于模板匹配、子空间方法,变形模板匹配等。早期人脸检测方法往往针对简单无变化背 景下的正面人脸检测,所以使这些方法在很大程度上显得很呆板。基于这些方法构建的 检测系统,任何图像条件的改变,即使不用完全重新设计整个系统,也要对系统的参数 进行精细的调整。那时人们更重视对人脸识别的研究,直到9 0 年代,随着实际的人脸 识别和视频编码系统开始成为现实,这种情况才有所改变。在过去的十多年里,对人脸 检测的极大兴趣开始从几个方面展开。研究者提出了多种分割方法,特别是那些利用运 动、肤色和一般信息的方法。统计和神经网络方法的使用也使在复杂背景和多分辨率的 人脸检测成为可能。另外,在能够精确定位的跟踪面部特征的特征提取方法的设计( 例 如弹性模板和活动轮廓) 方面也取得了很大的进展。近期人脸检测的研究主要集中在基 基于谱直方图和支持向量机的人脸检测 于数据驱动的学习方法,如统计模型方法,神经网络学习方法,统计知识理论和s w 方 法,基于马尔科夫随机域的方法,以及基于颜色的人脸检测。 1 2 国内外研究概况及发展趋势 目前,国外对人脸检测问题的研究很多,比较著名的有m i t 、c m u 等;国内的清华 大学、北京工业大学、中国科学院计算技术研究所和中国科学院自动化研究所等都有人 员从事人脸检测相关的研究。而且,m p e g 7 标准组织己经建立了人脸识别草案小组,人 脸检测算法也是一项征集的内容。随着人脸检测研究的深入,国际上发表的有关论文数 量也大幅度增长,如i e e e 的f g ( i e e ei n t e r n a t i o n a lc o n f e r e n c eo na u t o m a t i cf a c ea n d g e s t u r er e c o g n i t i o n ) ,i c l p ( i n t e r n a t i o n a lc o n f e r e n c eo ni m a g ep r o c e s s i n g ) , c v p r ( c o n f e r e n c eo nc o m p u t e rv i s i o na n dp a t t e r nr e c o g n i t i o n ) 等重要国际会议上 每年都有大量关于人脸检测的论文,占到有关人脸研究论文的近i 3 之多。然而,即便 如此,由于人脸这一特定模式本身具有复杂性,使得即使是建立一个公认的、权威的、 能够基本上涵盖可能人脸情形的评价人脸检测方法优劣的人脸检测测试图像库都是比 较困难的。 最近几年来,人脸检测研究吸引了众多研究人员的注意力,各种各样的检测方法也 层出不穷,大致可以分为以下几类p , 4 1 ( 如图1 1 所示) :基于知识的方法、基于特征的 方法、基于模板匹配的方法、基于图像块的方法。而事实上,对于一些人脸检测方法的 分类是比较困难的,因为研究者可能综合了多种方法的思想,形成一种新的人脸检测解 决方案,从而,如果想将它归纳到一种方法中显然是比较勉强的。另一方面,有些方法 从不同的角度分析它时,甚至可以将它归纳到不同类别。 1 3 人脸检测的各种方法 人脸检测的方法主要分为四种,其主要特点如下: 1 3 1 基于知识的人脸检测方法 该法采用符合人脸生理结构特征的人脸镶嵌图【5 】( m o s a i ci m a g e ) 模型,并在分析了 足够多的人脸图像样本的基础上,针对人脸的灰度、边缘、纹理等信息,建立种关于 人脸的知识库在检测中,首先抽取这些灰度、边缘等信息,然后检验它是否符合知识 库中关于人脸的先验知识。 该方法的优点:使用丰富的人脸特征,适用于复杂图像中的人脸检测;使用人脸特 征少时,可实现实时检测与跟踪。缺点:在很大程度上依赖于人脸的先验知识;基于知 识的多尺度空间遍历工作量大,运算时间长。 一2 一 人连理【:人学硕士学位论文 一_ 脂煳卜q 篡板 l基于图像块人脸检测,至兰三兰丢三问 邑 1 3 2 基于特征的人脸检测方法 这类方法基于这样一个视觉事实:人眼可以在不同的姿态、不同的光照条件下毫不 费力地将人脸与其它物体区分开来,这就意味人脸或人脸的部位可能具有在各种条件下 都不会改变的特征。于是许多研究者提出先在图像中检测是否有人脸部位( 如:眉毛、 眼睛、头发、嘴巴) ,然后确认是否存在人脸。在提取出来的特征的基础上,再使用统 计模型描绘候选图像块,确认是否是人脸图像。由于人脸部位的提取通常都借助于边缘 算子,因此,这类方法对图像质量要求较高,因为光照、噪音、阴影都极有可能破坏人 脸部位的边缘,从而影响算法的有效性。 基丁谱直方图和支持向量机的人脸检测 ( 1 ) 基于低级别特征分析 低级别特征包括人脸部位或脸型边缘、灰度信息、肤色、运动等。其中边缘特征【6 】 作为计算机视觉中的原始特征,在最早人脸检测研究中就得到了应用。目前大多的人脸 检测方法在使用边缘特征时仅仅是将它作为整个人脸检测工作的前期处理。 灰度信息特征指的是人脸或人脸部位在整幅图像中具有与其它物体不同的特征,我 们可以依据这类特征提取人脸或人脸部位。如眉毛、嘴唇、瞳孔的图像区域的灰度值与 人脸其它区域相比,通常来说要小,等等诸如此类的灰度特征。依据这些特征,我们可 以提取出人脸或人脸部位。 肤色特征指的是人脸皮肤具有的与周围环境不同的颜色特性。肤色特征的前提是待 测图像必须为彩色图像,这种方法的优点在于计算速度相当快,在周围环境较为单调或 者与肤色相差较为明显的情况下,这种方法是非常有效的;它的缺点在于高光或阴影的 影响会造成人脸区域被分割而被漏检;类肤色区域的存在提高了预警率;很难建立一个 较为准确的、能够将人脸在任何情况下都很好地区分人脸区域与环境的颜色模型。目前 用得较多的几个颜色模型包括有:y i q 、h s v 、y e s 、y c r c b ,y u 、,等等。对于复杂背景的 情形下,通常可以将颜色特征提取作为前期处理工作。 运动特征【7 】指的是在视频序列图像的条件下,序列图像中蕴涵的物体运动的信息。 通过运动特征( 简单地将前后几幅图像进行对比,找出差异) ,可以非常简单、直接地 找到人脸和人的身体其它部分。 总的来说,早前的完全基于低级别特征方法己经不能完全解决复杂的、不对环境进 行约束的人脸检测问题,目前,研究者通常将这些低级别特征的提取作为人脸检测系统 的前期处理部分。 ( 2 ) 基于中高级别特征分析 由于低级分析得到的低级特性和特征很可能是不明确的、不足以精确找到人脸或人 脸部位,例如,在用肤色模型定位面部区域时,相似颜色的背景目标也可能被检测到。 这就需要通过高级的特征分析来解决。这类人脸检测技术,通常利用人脸中固有的几何 特性来描绘和进一步校验各种特征。目前的研究成果中提到的入脸几何特征的应用有两 种方法:特征搜索与星座( c o n s t e l l a t i o n s ) 分析。 特征搜索【8 】指的是在检测到的显著的人脸特征的基础上,在其相关位置上进行连 续的特征搜索的策略。一个特征的存在可以通过检测到附近的特征而得到确认。 星座分析1 9 则是利用各种人脸模型把检测到的特征分成一些灵活的星座。 总之,在特征分析中,利用人脸的几何信息把视觉特征组织成人脸和面部特征的更 全局的概念。通过特征分析,降低了特征的不确定性,就可以确定人脸和面部特征的定 大连理 大学硕士学位论文 位。 活动轮廓模型描述了实际的物体和特征的高级外观。一旦在一个靠近一个特征的封 闭的范围内使用,活动轮廓将与局部图像特征( 边缘、亮度) 交互并逐渐变形到这个特 征的轮廓上。在目前的人脸特征提取研究中主要有三种类型的活动轮廓模型( a c t i v e c o n t o u rm o d e l ) 。 第一类使用普通的活动轮廓,称为s n a k e ,最早由k a s s 掣l o 】在1 9 8 7 年提出。s n a k e 是一条封闭或不封闭的弹性曲线,由若干个受控点组成的集合表示。一般用来定位头或 嘴唇的边界。第二类叫做变形模板,由y u i l l e 等】提出,是利用面部特征的先验知识 来改进s n a k e s 的性能。后来c o o t e s 等【1 2 】提出利用一种一般的弹性模型,叫做a s m ( a c t i v e s h a p em o d e l ) ,可以对人脸进行高效的判读( i n t e r p r e t a t i o n ) 。c o o t e s 等的模型是基 于一组加标记的点,这些点按照训练过程只允许变化到一个确定的轮廓。这些方法是针 对像眼球这样的复杂和非刚性的特征提取以及嘴唇跟踪等目的提出的。 很多方法依然限制于检测正面图像或准正面图像。 1 3 3 基于模板匹配的人脸检测方法 传统的模板匹配法通常需要手工制作标准模板或将模板先行参数化,然后在检测人 脸时,计算待测区域与标准模板之间的相关性。这种方法的优点在于简单易于实现,然 而,这种方法遇到了较大的障碍,是它对同幅图像中具有不同尺寸人脸、不同角度、不 同的姿态缺乏有效的解决办法。针对这一问题,研究者提出了序列模板、可变形模板等 方法。 该方法的优点:固定模板检测方法直观、鲁棒性好;可变形模板对非刚性模式具有 较好的适应性。缺点:固定模板对位姿、表情、尺度变化敏感;可变形模板的选择和参 数的确定非常困难。 1 3 4 基于图像块的人脸检测方法 基于模板的人脸检测方法使用的模板都是预先由手工制作或定义的,在基于图像块 的人脸检测方法中同样涉及类似于“模板”的图像块,不同的是图像块不是由手工制作 的,而是通过大量的学习得来的。因此,通常来说,基于图像块的人脸检测方法的效率 依赖于统计数据的分析以及机器学习,从而使得图像块能够很好地区分人脸和非人脸区 域。 基于图像块的人脸检测方法的另外一种思路就是建立一个判决函数,判定待测图像 是否是人脸,这种判决函数可以是决策面,也可以是分离超平面或是一个简单的阈值函 数。在运用判决函数之前,需要将待测图像映射到一个低维空间中,然后再使用判决函 基于谱直方图和支持向颦机的人脸检测 数确认待测图像区域是否是人脸。最近属于这类方法范畴的研究比较活跃,包括主成分 分析( p r i n c i p a lc o m p o n e n t sa n a l y s i s ,p c a ) 、支持向量机、神经网络方法等,其大体 思路是先利用主成分分析、支持向量机、神经网络方法将待测图像映射到低维空间,然 后通过决策面将人脸与非人脸分开。 ( 1 ) 本征脸( e i g e n f a c e ) t u r k 和p e n t l a n d ”】提出使用p c a 进行人脸检测和识别。其后有众多的研究者尝试 使用p c a 进行人脸识别和检测工作,并且提出了许多的改进方案。对于t u r k 和p e n t l a n d 提出的方法其基本思路如下:对训练集中的人脸图像进行主成分分析,转换成一个小的 特征向量集,叫“本征脸”,它们是最初训练图像集的基本组件。同样地处理非人脸训 练集。然后根据人脸图像在这一过程中改变较小而非人脸图像改变较大的特点,遍历测 试图像中所有候选人脸位置,计算候选位置对应的图像块与人脸空间之间的距离,其中, 距离最小的位置就认为是测试图像中的人脸所在位置。 该方法的优点:标准人脸模板能抽象人脸全局信息;运算不涉及迭代,耗费时间短。 缺点:单模板检测效率低,多模板提高了效率也增加了检测时间,模型的建立和参数初 值的确定依靠经验。 ( 2 ) 混合线性子空间( m i x t u r e so fl i n e a rs u b s p a c e s ) 将主成分分析应用到人脸检测中,对人脸训练样本集进行主分量分析得到特征脸子 空间,将图像区域投影到特征脸子空间,并计算到特征脸子空间的距离,以此作为标准 检测人脸。此类方法将人脸区域图像变换到某一特征空间,根据其在特征空间中的分布 规律划分“人脸”与“非人脸”两类模式。 该方法的优点:对于复杂背景、多姿态、多表情等等情形都有较好的适应性。缺点: 要求有较大的训练样本规模;训练过程计算量较大,而且复杂;检测性能对样本依赖性 较大。 ( 3 ) 人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k 。a n n ) 人工神经网络的方法是通过训练一个网络结构,把模式的统计特性隐含在神经网络 的结构和参数之中。基于人工神经网络的方法对于复杂的、难以显式描述的模式,具有 独特的优势。 该方法的优点:检测效率较高;错误报警数目不多;训练成熟的网络检测速度快。 缺点是多样本训练耗费时问多;单网络检测错误报警数耳多。 最早使用人工神经网络进行人脸检测的是p r o p p 和s a m a l 1 4 1 。 ( 4 ) 支持向量机( s u p p o r tv e c t o rm a c h i n e 。s v m ) s 、,l l 作为一种新的机器学习技术,最早是由o s u n a 1 5 】等人应用到人脸检测领域的, 一6 一 j j s j 里j :大学硕士学位论文 取得了较好的实验结果。 该方法的优点:比神经网络方法具有更好的泛化能力,能对未观测到的例子进行有 效分类。缺点:“非人脸”样本复杂多样,造成支持向量机数目多,运算复杂度大。 ( 5 ) 稀疏网络( s p a r s en e t w o r k ) 稀疏网络是一种新的人脸检测方法,在最近一些人脸检测综述性文献中均被评介为 最优人脸检测方法,稀疏网络最早的提出是在1 9 9 7 年,由d a nr o t h 给出的,最初是用 来解决自然语言识别的问题,得到较好的结果。2 0 0 0 年,d a nr o t h 与y a n g 1 6 1 合作,将 其应用到人脸检测的问题上,也得到了较好结果,这个人脸检测方法中,训练参数口、 对于检测器的性能起着至关重要的作用。 该方法的优点:对于复杂背景、多姿态、多表情等情形都有较好的适应性;结构简 单。缺点:要求有较大的训练样本规模。 ( 6 ) 积分图像 基于t t a r r 型特征的积分图像的快速人脸检测方法由v i o l a 等 1 7 - 1 9 1 于2 0 0 1 年提出。 该方法首先采用一种简单的矩形特征,或者称为h a r r 特征,来描述图像的灰度分布,为 了快速的提取这些特征,他们还提出了一种新的图像表示一积分图像。其次,采用 a d a b o o s t 算法从大量h a r r 特征中挑选出很少的一部分构造成所谓的强分类器。最后, 提出了一种瀑布型检测器结构,可以逐渐将非人脸区域剔除,而把注意力集中在那些更 像人脸的部分。 该方法的优点:检测速度快,基本满足实时检测要求;检测效率可以与神经网络方 法比较;它给出了一个稳定的、实时的目标检测框架,是第一个实时的人脸检测算法。 并由此激发了更多研究人员在基于局部特征和智能学习的实时人脸检测算法方面的研 究。缺点:错误报警数目少时,检测率不高。 1 4 人脸检测问题的评价标准 为了反映出入脸检测系统的性能,常用的统计指标包括:正确检测率、虚警率以及 处理速度等。 正确检测率是正确检测到的人脸数目除以测试集中包含的人脸总数目 正确检测率= 丽罢蓁等笔薹鉴燃- 0 0 c - , 虚警是指检测系统将非人脸的区域错误地输出为“人脸”,虚警率就是错误检测到 的人脸数目除以测试集中包含的人脸总数目。 基。n 普直方图和支持向量机的人脸检测 虚警率= 甭自;i i ;:i ;:燃t 。 c ,2 , 处理速度也是一个检测系统优劣的重要指标,但其与实验平台有关,很难客观的比 较,往往以给出典型图片的处理时问作为参考。 除此之外,其它评价标准还有:( 1 ) 训练样本数和训练速度,在不影响识别性能的 情况下,要求训练样本数尽可能少,训练速度尽可能快,训练时间尽可能短:( 2 ) 检测 响应速度,希望检测响应速度越短越好;( 3 ) 对人脸图像的约束,希望对人脸图像拍摄 条件以及人脸姿态、表情等约束越少越好;( 4 ) 系统可容纳的检测人脸数目,希望能正 确检测的人脸越多越好;( 5 ) 检测系统的硬件要求、系统的学习能力以及处理噪声的能 力等。 在人脸检测的研究中,至今尚无统一的评价标准。目前使用的较多的人脸测试集是 m t 1 9 1 ( m a s s a c h 蛐i n s t i t u t eo ft e c h n o l o g y ) 和c m u 2 0 ( c a r n e g i em e l l o nu i l i v 铘i 忉人脸测 试图像库,它们是灰度图像测试集,但是怎样的模式才算是人脸,以及怎样才算是真正 检测到了一个人脸,并无公认的判断依据。尽管许多文献给出了在c m u 和m i t 测试集上 的检测率和虚警率,但是直接用这些数字来比较各种算法的优劣是不太合理的。特别是 对于基于表象的算法,它们使用的训练集不同,在检测过程中用窗口遍历图像时的移动 间隔、采样图像的数量都不尽相同,合并检测结果的方法不同,这些因素对检测结果( 尤 其是虚警率) 都有很大的影响。对于彩色图像的人脸检测研究,至今尚无标准测试集可 供使用。 1 5 本文的研究内容与安排 论文全文共分五章,大体章节内容安排如下: 第一章是绪论,简单了介绍了人脸检测及国内外的研究情况,然后详细介绍了人脸 检测的各种方法,并对各种方法的优缺点进行了分析和比较。 第二章介绍了谱直方图的定义与特性,并详细介绍了用于计算谱直方图的一系列滤 波器。 第三章介绍了统计学习理论的基本内容,讨论了如何建立以统计学习理论为基础的 支持向量机的人脸检测方法。 第四章介绍了基于谱直方图和支持向量机的人脸检测方法,在构造滤波器组时进行 了改进,使用l b p 算子提高分类精度,降低了运算量,并给出了实验结果。 最后对全文算法进行了总结。 大连理工大学硕士学位论文 2 谱直方图 在本章中,将给出谱直方图的定义,并对所需的滤波器进行详细描述,并进行仿真 分析。 2 1 谱直方图的定义和特性 给定一幅输入图像,和一组滤波器,( ,口= l ,七,盯表示滤波器的个数,通过使 用线性卷积: ,4 ( u ) = f 4 ,( u ) = 。f 0 ) ,( u 一“) ( 2 1 ) 可以得到子带图像j 。每个子带图像,( 4 的频数直方图刖0 ) 可以通过下式给出: ,( z ) = 击。占( z 一一砷( u ) ) ( 2 2 ) 式( 2 2 ) 中l j i 为输入图像窗口所包含的像素值的个数,j 1 4 ( u ) 为滤波后的予带图像的像 素值,艿为冲激函数,z 为每个区间的中心值( 将滤波后的图像的像素值划分成若干个 小区间,每个小区间为一个b i n ) ,对于选定的滤波器组,图像,的谱直方图定义为日删 的集合,即: 珥= ( 乃i l ,一町) ( 2 3 ) 换句话说,每幅图像可以用所选定滤波器组的谱直方图或它的边缘分布的集合来描述。 由于每个直方图都是一个边缘分布,因此图像和厶在谱直方图描述中的距离度量 通常定义为它们的谱直方图之间的离散k u l l b a c k - l e i b l e r 散度,即: 豇( 吼,巩) = 耋;( 心卜心) ) l o g 瓮斋 ( z 4 ) 4 l lr、 j 1 4 l 、, 尽管k l 散度的量度相似,但由于它不满足三角不等式,因此不是一个严格的度量。对 于谱直方图来说,其度量由0 范数给出: 阮,乩l ,= 粪( 莓( _ “z ) 一如) ) 9 ) - ( z s ) 通过依赖局部结构的单个滤波器的响应可以捕获一幅图像的局部特征,将这些子带 图像进行串联可以获取图像的整体结构。从本质上讲谱直方图是非参数化的,所以它不 依赖于基本的参数分布,并且可以有效地刻画不同模式的特征。 基于谱直方图和支持向量机的人脸检溯 谱直方图描述的另一个优点是在两幅图像进行比较时不需要将其排列。从全局的角 度来看,所有的人脸都有两个眼睛、一个嘴巴和一个鼻子。所有这些特征的排列在某种 程度上约束着正面轮廓。由于谱直方图描述不会因为这些特征在排列中的轻微扰动而受 到严重干扰,因此可以减少所需的人脸与非人脸的训练图像数目。由于谱直方图描述独 立于所选择的分类器,因此它可以使用像s v i i i 、多层感知器,或k 最邻近规则等分类器。 使用谱直方图的前提是需要知道图像的边缘分布,首先得提取出图像的边缘信息, 因此就需要使用几种可以提取图像边缘的滤波器,在下面几节中分别进行介绍。 2 2 锐化滤波器 图像的锐化处理主要就是增强图像中轮廓边缘、细节以及灰度跳变部分,达到将物 体从图像中分离出来或将表示同一物体表面的区域检测出来的目的。图像的锐化可以在 空日j 域进行,也可以在频域进行。空间域常用的方法是微分法;在频域中,因为图像中 的边缘对应高频分量,因此可以采用各种形式的高通滤波器进行图像锐化。 2 2 1 微分法 图像模糊的实质是图像受到平均或积分运算,为实现图像的锐化,必须对它进行反 运算“微分”,微分运算是求信号的变化率,有加强高频分量的作用,从而使轮廓清晰。 为了把图像中间任何方向伸展的模糊边缘和轮廓变清晰,希望对图像的某种导数运算是 各向同性的。 ( 1 ) 梯度法 图像锐化中最常用的方法就是梯度法。对图像厂( x ,y ) ,在其点“) ,) 上的梯度可以 定义一个二维列向量: g m 明= 阱 彭 缸 钞 砂 ( 2 6 ) 在“y ) 点处的梯度,其方向是函数,“y ) 在这点变化率最大的方向,而其长度用 模值g o 厂( y ) 表示,并用下式计算,即: 吒 厂( 薯_ ) ) = 厄了可= ( 2 7 ) 对于数字图像来说,则用差分来近似微分,常用的差分方法有两种:一种是典型的 水平垂直差分算法,由于在计算机上运行时耗费时间很长,因此简化为: 一1 0 人连理工大学硕士学位论文 g ,( j ,j ,) = i 厂仁y ) 一f ( x + l ,y ) i + i 厂( x ,y ) 一,( j ,y + o i ( 2 8 ) 另一种梯度法,是一种交叉差分算法,近似表达式为: g ,( 工,y ) - - i s ( 工,y ) - f ( x + l ,y + 1 ) i + l ,( 工+ l ,y ) 一( j ,j ,+ 1 ) l ( 2 9 ) 梯度的计算表明,在图像中灰度变化较大的边缘区域其梯度值大,而灰度变化平缓 或微弱的区域其梯度值小。对于灰度值不变的区域,其梯度值为0 。由此可知,图像经 过梯度运算后,留下灰度值变化大的边缘,使其细节清晰,从而达到锐化的目的。 ( 2 ) 拉普拉斯算子法 对图像进行拉普拉斯运算也是偏导数运算的线性组合,且为旋转不变性即各向同性 的线性运算,设v 2 ,为拉普拉斯算予,则: v 2 ,:窑+ 窑 ( 2 1 0 ) g t x - - 缈 对数字图像来说,图像的二阶偏导可表示为: 因此拉酱拉斯算予v 2 为: v 2 鹏y ) = 笔笋+ 1 c 9 2 f ( 厂x , y ) 2 化+ 1 j ,) + 9 - 1 y ) + 他j ,+ 1 ) + 厂( 五y 一1 ) 一4 ,( 五y ) ( 2 1 2 ) t 一5 1 f ( x , y ) 一 厂( x + l ,y ) + 厂( 工一l ,j ,) + f ( x , y + 1 ) + f ( x , y 1 ) + b y ) 卫 可见,数字图像在( 五y ) 的拉普拉斯算子,可以由( y ) 点的灰度级值减去该点邻域 平均灰度级的值而求得。拉普拉斯算子比较适用于改善因光线的漫反射而造成的图像模 糊。 2 2 2 高通滤波 图像中的边缘或线条与图像频谱中的高频分量相对应,采用高通滤波器让高频分量 顺利通过,可以使图像的边缘或线条变得更清楚,从而实现图像的锐化。高通滤波可用 空间域或频域方法来实现。 咖 州 帅 洲 筮矿 基于谱直方图和支持向量机的人脸检测 ( 1 ) 空间域高通滤波 高通滤波在空白j 域是用卷积方法实现的。建立在离散卷积基础上的空日j 域高通滤波 关系式为: g ( 五y ) = ,( m ,厅) ( 工一埘+ l ,y - n + 1 ) ( 2 1 3 ) mn 式中,g ( x ,) ,) 为锐化图像,f ( m ,一) 为输入图像,h ( x - m + l ,y 一万+ 1 ) 为系统单位 冲激响应阵列。 ( 2 ) 频域高通滤波 频域高通滤波的方法在形式上与频域低通滤波的方法相似。常用的高通滤波器的传 递函数如表2 1 所示。 表2 1 几种高通滤波器的传递函数 t a b 2 1t r a n s f e rf u n c t i o no f h i g h - p a s sf i l t e r s 滤波器名称 传递函数日( 虬v ) 理想滤波器 巴特沃斯滤波器 指数滤波器 梯形滤波器h ( u ,订= 脚咖 o 嚣:;2 酬虬。2 丽1l d ( “,v ) j h ( u ,= e 4 d “。4 ) r f o d ( “,v ) d 0 瓦告【d ( , 0 - d o d o d ( d s d l 本文使用了4 个梯度算子的差分对图像进行滤波处理,得到的谱直方图如图2 i 所 示。图中横坐标为区间分段数,即b i n 的个数,纵坐标为归一化频数。可以看出,非人 脸图像的赢方图较人脸图像的直方图峰值高、谷值低、变化急剧。 人连理i :人学硕士学位论文 1 0 5 0 1 0 5 o 1 0 5 0 1 0 5 0 1 0 5 0 1 0 5 0 51 0 1 52 02 5加3 54 0 51 01 52 02 53 03 54 0 51 d1 52 02 53 03 5 4 0 ( a ) 人脸图像 卜 叭弓心士灭 l i 51 01 52 02 5 3 54 0 卜 疋舡 洲 叭湫 i 1 51 01 5 2 02 5 3 54 0 51 01 52 02 53 i d3 54 0 ( b ) 非人脸图像 图2 1 使用梯度算子的差分对图像滤波后的谱直方图 f i g 2 1s l x :c t r a lh i s t o g r a mo f i m a g e su s i n g 删i e n tf i l t e r s 2 3l o g 滤波器 l o g ( l a p l a c eo f6 a u s s ) 滤波器又称m a r r h i l d r e t h 模板或算子。m a r r - h i l d r e t h 边缘检测理论是从生物视觉理论导出的方法,其基本思想是:首先在一定范围内做平滑 滤波,然后利用差分算子检测在相应尺度上的边缘。滤波器的选择取决于两个因素,一 是要求滤波器在空间上平稳,即空间位置误差缸要小,二是要求平滑滤波器本身是带 通滤波器,在其有限带通内是平稳的,即要求频域误差脚要小。由信号处理测不准原 理可知,缸和国是矛盾的,达到测不准下限的滤波器是高斯滤波器。m a r r - h i l d r e t h 算子才有的差分算子是各向同性的拉普拉斯二阶差分算子。由此得到的差分算子即著名 的l o g 算子,其形式为: 基r 谱直方l 鳘i 和支持向鼙机的人脸检测 v 2 g ( 硼小害+ 雾= 专( 等一) 唧( _ 等 c z - 4 , 其中:g ( 五j ,) 是对图像进行处理时选用的平滑函数( g a u s s i a n 函数) ;工,y 为整数坐 标;盯为高斯分布的均方差。 上式也就是m a r r 和h i l d r e t h 提出的最佳边缘检测算子。图像中强度的一个变化在 强度函数的一阶导数中产生一个峰,等价于在二阶导数中产生一个零交叉( 二阶导数值 从正到负穿过零值的位置) ,并且强度变化是以不同尺度出现的。通常用来检测强度变 化的滤波器应具有两个特点:1 、它应当是一个能对图像作一阶或二阶导数运算的微分 算子;2 、它应是可调的,能在任何尺度上进行。这样,大尺度滤波器可用来检测模糊 边缘,而小尺度滤波器可用来检测聚集良好的图像细节。我们可以从上述的图像处理的 角度来理解l o g 滤波器的物理意义。因为f ( x ,y ) 是表示图像的灰度函数,v 2 g 中的变量 与灰度无关,所以有: 厂( 而y ) v 2 g ( x , y ,盯) = v 2 厂( x ,y ) g ( 工,y ,盯) ( 2 1 5 ) 图像函数的二阶导数出现零交叉的位置就是图像中的边缘或轮廓点,因此,边缘点 p ( x , y 1 的集合可以表示为: 尸( _ ,) = ( y ,盯) f v 2 厂( 薯y ) g ( x , y ,盯) = q ( 2 1 6 ) 高斯函数g ( x , y ,盯1 的傅立叶变换与原函数具有相同的曲线形式,因而,它可以看作是 一个低通滤波器,从式( 2 1 6 ) 可以看出l o g 滤波器是先用高斯函数对图像厂( 五y ) 进行 平滑滤波,然后使二阶微分为零,提取出图像边缘点。根据以上讨论可以看出l o g 滤波 器恰好是满足上述条件的最佳算子。所以,找出图像中以任一给定尺度发生的强度变化 的最佳方法是:先用算子v 2 g 对图像进行滤波,再确定滤波处理后的图像中零交叉点的 位置。 l o g 滤波器有以下特点: ( 1 ) 通过图像平滑,消除了一切尺度小于盯的图像强度变化; ( 2 ) 若用其它微分法,需要计算不同方向的微分,而它无方向性,因此可以节省计 算量: ( 3 ) 它定位精度高,边缘连续性好,可以提取对比度较弱的边缘点。 l o g 滤波器也有它的缺点:当边缘的宽度小于算子宽度时,由于过零点的斜坡融合 将会丢失细节。 大连理上人学硕十学位论文 l o g 滤波器有无限长的拖尾,若取得很大尺寸,将使得计算不堪重负。但随着 ,;,+ y 2 的增加,l o g 滤波器幅值迅速下降,当,大于一定程度时,可以忽略模板的 作用,这就为节省计算量创造了条件。实际计算时,常常取强撑大小的l o g 滤波器, 靠3 c r 。 l o g 滤波器方法通过检测二阶导数过零点来判断边缘点。l o g 滤波器中的盯正比于 低通滤波器的宽度,盯越大,平滑作用越显著,去除噪声越好,但图像的细节也损失越 大,边缘精度也就越低。所以在边缘定位精度和消除噪声级间存在着矛盾,应该根据具 体问题对噪声水平和边缘点定位精度要求适当选取盯。而且l o g 方法没有解决如何组织 不同尺度滤波器输出的边缘图为单一的、正确的边缘图的具体方法。 i :i ;:i;: 一i l l 一氏j 氏。一丙。二 弋一j j 5 1 01 5 2 02 5 3 03 s加4 5卯 51 01 52 02 53 03 5加4 5 卯 5 1 01 52 02 53 54 04 5 ( a ) 人脸图像 51 01 52 02 5 3 5 加4 55 0 5们1 52 02 5 3 0 3 5 4 04 55 0 51 01 5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论