已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要模式识别中的一个重要分支人脸识别是当今计算机视觉领域的非常要重的研究方向,同时人脸识别是应用于各个领域的用于身份识别的有效技术手段,在图片或者视频中对人脸的检测是人脸识别的基础,一种高精度的人脸识别技术必须先在图像或者视频中先将人脸定位而后才能够做到有效的人脸识别。所以说人脸检测在人脸识别领域是非常重要的基础研究领域。经过多年来,计算机相关领域的不断发展,人们已经掌握了不少的有关的比较成熟的理论和技术。在本文中,我们首先介绍有关模式识别的基础知识,模式识别是人脸识别的基础,对模式识别的理解和熟悉有助于我们对人脸识别更加深刻的认识。接着,我们开始回顾人脸识别技术起源、发展历程,这个过程我们可以把它归纳性的划分为三个阶段。再接着,我们开始介绍各种主要的人脸识别技术,人脸识别的技术主要包括:no.1 几何特征的人脸识别方法;no.2基于特征脸的人脸识别方法;no.3神经网络的人脸识别方法;no.4弹性图匹配的人脸识别方法;no.5线段距离的人脸识别方法;no.6支持向量机的人脸识别方法。 紧接着,我们我们介绍几种主要的人脸识别算法,主要分为:基于人脸特征点的识别算法、基于整幅人脸图像的识别算法、基于模板的识别算法、利用神经网络进行识别的算法。 然后,我们开始介绍本次设计主要使用的人脸检测算法adaboost算法,以及相关知识haar矩形特征和积分图。 最后,我们利用opencv对基于adaboost算法的人脸检测技术进行实现。关键词:人脸识别 人脸检测 adaboost haar特征abstract an important branch of pattern recognition - face recognition is today very weight of the field of computer vision research direction, at the same time face recognition is used in various fields of effective techniques for the identification, in pictures or videosface detection is the basis for face recognition, a high precision face recognition technology must be in the image or video first face location before we can achieve effective face recognition. so face detection is a very important field of basic research in the field of face recognition. after years, the continuous development of computer-related fields, people have mastered a lot of the more mature theory and technology. in this article, we first introduce the basics of pattern recognition, pattern recognition is the basis of face recognition to help our face recognition deeper understanding, pattern recognition, understanding and familiar. next, we began reviewing the origin of face recognition technology, the course of development, a process that we can put it inductive divided into three stages.next, we began to introduce a variety of face recognition technology, face recognition technologies include: no.1geometric features face recognition; no.2 face recognition method based on the characteristics of the face; no.3 neural network face recognition methods; the no.4 elastic graph matching face recognition method; no.5 line distance face recognition method; no.6 support vector machine face recognition method.then, we introduce several major face recognition algorithm is divided into: recognition algorithm based on facial feature points, based on a whole lot of face image recognition algorithm, template-based recognition algorithm using neural network identification algorithms.then, we begin with the design face detection algorithm - adaboost algorithm, as well as knowledge - haar rectangular features and integral image.finally, we use the opencv face detection technology based on adaboost algorithm implemented.keywords: face recognition; face detection; ada-boost; haar feature; 1模式识别基础1. 1模式识别的定义:通过对表征各种事物或者现象的各种主要的形式的信息进行分析和处理,以对这些事物或者现象进行符合需求精度的描述、辨认、分类以及解释的过程。1.2模式识别的应用领域:模式识别是信息科学与人工智能的一个交叉研究领域,主要应用在:数字图像分析处理、语音识别、语音通信、数据挖掘,cad(计算机辅助诊断)1.3模式识别的主要方法:1、决策理论方法(统计方法) 2、句法方法(结构方法)决策理论方法基本思想:首先对识别对象进行数值化,接着进行特征提取,把输入模式从对象空间射映到特征空间,这是特征空间中的一个点或一个特征矢量就可以表示一个模式。 句法方法基本思想:把一个模式描述为比较简单的子模式的组合,接着把简单的子模式描述为更简单的子模式,最终得到一个树形结构的描述,最简单的子模式称为模式基元。通过匹配是否符合一个特定的模式语法来识别一个模式。1.4模式识别的过程:可观察的客观世界,往往包含了非常大量的维数,这时候我们通过模式采集,提取出,我们主要关注的有限个数的维数,这时,这个客观对象,我们把它称为模式空间,再接着通过特征提取,把模式空间变换为特征空间,比如,颜色、重量、价格,这是特征空间中的一个点或者有限图形可以表示一个模式,比如颜色为红色,重量为30kg,价格为1000¥就可以表示一个特定对象。1.5模式识别中的三种主要的空间:模式空间、特征空间、类型空间;模式空间:一个可以观察的对象,所观察得到的数据;特征空间:从所观察得到的数据中提取出主要能反映这个对象的主要属性的主要特征,这个主要特征就叫做特征空间;类型空间:在特征空间中把一些样本区分为一个类型,这些类型的集合就叫做类型空间1.6模式识别pattern recongintion的系统构成:两种模式识别方法(统计方法、结构方法),模式识别系统的两个过程:设计与实现;所谓设计:即是选取一定量的样本,对分类器进行训练;所谓实现:就是用已经设计好的分类器对待识别的样本进行分类决策。我们主要讨论基于统计方法的模式识别的系统构成,其主要的组成为:信息获取、预处理、特征提取和选择、分类决策,其表示如下图: 此图演示了模式识别的过程1.7信息获取的概念:计算机通常使用一些可以进行运算的符合来表示所研究的对象,以便于使计算机能够处理各种模式识别的问题。对于一个特定的对象,计算机一般可以通过以下三种方式来描述: no.1物理参数或者逻辑值 no.2一维波形图,机械震荡波形,无线电波形等等 no.3二维图形,比如图片,照片,文字,几何图形等等通过一些特定的仪器对特定的观察对象进行测量,抽样,量化的过程,我们可以使用矩形或者向量等数学符号来表示物理参数、逻辑值、一维波形图、二维图形1.8预处理的概念:预处理能够滤除不需要的信息,如噪声,加强有用的信息,并且能够对由于使用测量仪器或者其他的外在客观因素所造成的退化现象进行复原处理。1.9特征提取和选择:一张未压缩的图片或者一维波形图一般包含了相当大量的数据信息。比如一张未经过压缩的高清照片,其所占用存储量高达几十mb,又比如卫星遥感图像,其所包含的数据更是非常的膨大,如此大量的数据要想进行有效的模式识别是很困难的,这个时候我们就应该对原始数据进行有效的变换,得到最能够反映这个对象的本质的特征,而这个变换的过程,我们称之为特征提取和选择。1.10分类决策:我们使用统计方法对特征空间中需要被识别的对象归纳为一个特定的类别,这个过程被称之为分类决策;分类决策的主要步骤是:首先在一个样本练训集上定确出一个判决则规,通过修改阈值的上下限,使得这种判决则规对被识别的对象进行分类所造成的误错识别率最小或引起的损失损最小。1.11模式识别中的图片识别问题:由于人类的视觉的物理基础尚且未被人类很好的认识,所以这也是图片识别中我们所必须正视的挑战;与此同时,视觉错觉也是我们必须面对的一个很复杂的高级的问题,除此以外视觉过程中还涉及一些精神过程,所以目前我们的图片识别的方法可能是非常不完善的。1.12模式识别中的图片识别的主要步骤:1.对图片进行采样量化,如将一张图片转换为一个数组。2.图片分割:按一个图片中的色彩、纹理是否一致来确定出一个对应的区域。3.物景分析处理:通过图片分割所产生的区域的修改或者合并等处理,可以对一个区域确定为一个对象物体。4.形状描述:一个被确定的物体通过编码后得到一个反映其形体状貌的定量得结构。5.物体描述:即对一个物体进行分类,有简单分类和用语言进行描述的分类,比如:一个物体可以把它归纳为girl类,又比如一个物体可以通过语言进行描述,把它归纳为有颜色为白色,形状为圆形的物体。此过程中步骤1为数字信号处理的范围;步骤2图片分割使用了图像处理和模式识别两者的技术来进行处理。1.13模式识别的总结:模式识别亦又人称为图形识别,我们通过计算机采用一些技术方法对所研究的对象进行自动处理和判断的过程;通常情况下,我们把客观环境中的一些物像统一的称之为“模式”。目前计算机技术正在不断发展,人类在不断的研究更加复杂的数字信息处理过程。而信息处理过程中的一个非常关键的方向就是模式识别,模式识别中又有两个方面,一个是光学信息的识别,即是图形识别,一个是对声音信息的识别,又被称为语音识别。采用计算机实现的模式识别的最为显著的特点是运算速度快,处理速度快,有较高的精确度,效率高。在未来,我们可以看到模式识别将应用的非常广泛,将代替很多现在的人工的操作。目前人类所研究的模式识别技术,和人类的学习过程有很大的相似性。以中文字符识别作为例子,一开始我们对中文字符的图象进行处理,提取其表达的主要特征然后将特征与汉字的代码储存于计算机存储器中;这个过程如同我们的语文老师教我们“这个字怎么读、怎样写”,然后经过练习,我们把这个中文字符记忆在大脑中。这个过程被称之为“训练”。而识别的过程,就是我们把需要识别的字符信息输入进计算机,这时,计算机对输入信息和已经进行处理过的已储存的汉字信息进行比较和配匹,经过分析和处理后,找出近似程度最高的字符,那么这个字符就是识别的结果。我们把这个过程称之为“匹配”。2人脸检测的概述2.1对人脸检测的基本描述在计算机技术的不断发展的过程中,人工智能的不断发展是必然的趋势,而做为人工智能的基础知识,基本的技术,模式识别技术以及更加基本的细分技术人脸识别技术,是人工智能的一个重要的分支,人工智能的发展,就必须要使计算机能够主动是的去获取周围的客观世界的各种数据信息,而模式识别技术就如同是计算机拥有了眼睛和鼻子乃至更多的感官能力,而人脸识别技术就就如同让计算机长上了眼睛,并且是一个可以用眼睛来识别人物的科学技术。相信在未来,顺着计算机人工智能的不断发展,以及其各种分支技术的不断发展和完善,我们将获得更加友好,温和,真实,智能的人机交互体验。在计算机视觉方面,经过研究者们的不断探索,不断努力的工作,我们已经有了很多的这方面的相关理论和技术,而且我们相信在未来,我们将有更加完善的理论,更有有效的算法和检测技术。在各种检测技术中,人脸检测技术是越来越受到人们所关注的研究技术方向,是当前计算机方面的研究热点,与此同时人脸检测相关的其他的一些图形识别技术也在不断的逐渐的成为研究的热点,在未来,顺着计算机视觉相关技术的不断发展,我们相信这些技术一定会极大的改变我们未来的生活体验,有更加美好的生活环境,更加安全的智能监控,更加完善,真实的人机交互体验。人脸检测,通过计算机的输入图像进行是否有人脸进行判断然后对图像中的人脸进行定位,并最终确定出图像中人脸的位置,人脸的大小,人脸的姿态,等等有关人脸的各种参数。同时,人脸检测也是一个基础技术,人脸检测是人脸识别,表情识别,性别识别等等各种检测技术的一项最关键最为基本的技术,人脸检测也是通用目标检测问题中的一个特例。目前,人脸检测技术在模式识别和计算机视觉领域中广泛被关注。2.2人脸检测技术的发展过程,人脸检测技术发展的三个主要阶段。人脸检测技术是计算机视觉领域的热点,目前已经有大量的于此相关的理论,论文,技术资料,并且新的资料,论文,理论,技术也在不断的出现。按照人脸检测技术的所研究的探索的内容,运用的算法,使用的技术方法等等方面,我们可以把人脸检测技术的发展主要的分为三个主要阶段。现在我们开始分别介绍这三个主要的阶段。首先是第一阶段:在这个段阶,人脸测检通常仅仅是作为一个一般性的普通性的模式识别问题来研究,即仅仅作为模式识别研究领域的一个细分分支来进行研究,这个时候人们所采用的主要识别技术是基于人脸的几何形状特征的技术方法,当时于此相关的研究集中体现在对于“剪影(profile)”的研究上,人们对于如何将人脸面部的剪影曲线的结构特征进行提取、处理以及分析等方面进行了非常多的研究。同时基于人工神经网络的研究方法也是当时人脸检测技术的研究热点。在这一阶段从事于人脸检测技术的主要的比较重要的研究人员有bledsoe、goldstein、harmon、kanade,就职于卡内基梅隆大学的kanade教授是人脸检测技术领域的活跃人物之一,他所领导的人脸检测技术小组是人脸检测领域的一支特别重要的力量。总而言之,第一阶段是人脸检测技术发展的最初阶段,也是比较初级的阶段,这个时间人脸检测领域的重要研究成果不多,多是理论方法,也没有得到广泛的运用。再接着是第二阶段:人脸检测技术发展的这个阶段相对来说时间比较短暂,但是于此同时也是人脸检测技术领域进行研究的高潮阶段,这个世界所当时的研究成果不可谓不多,这个时候生产了许多的人脸检测技术的比较有影响的算法。同时,美利坚军方还组织了当时很有影响的feret人脸识别算法测验,也出现了一些能够适用于商业化运营的人脸测验系统face detection system,比如非常有名的faceit系统。这个时期最为引人注目的研究成果是就职于麻省理工学院媒体实验室的turk与pentland所提出的“eigenface”检测算法,这个算法代表了当时人脸检测领域的最有影响力的成就,此后,新出现的很多人脸检测技术都在一定程度上的受到了eigenface算法的影响,目前eigenface检测方法和归一化协相关量检测方法(normalized correlation)是人脸检测的性能测试的基准算法。同时,就职于麻省理工学院ai实验室的brunelli和poggio做了一个对比实验,并得出了一个明确的结论:基于模板匹配的检测算法性能优于基于结构特征的检测算法。这个具有指导意义的结论和当时著名的eigenface算法共同推动了当时的人脸检测技术的发展,终止了人脸检测领域的纯粹基于结构特征的人脸检测方法的研究课题,推动了基于外观(appearance-based)的线性子空间建模算法和基于统计算法人脸检测技术的发展,后者在此后的技术发展更新中逐渐的成为了人脸检测技术的主流。另外其他的重要成果有:fisherface人脸检测算法(由belhumeur等提出),基于双子空间的贝叶斯概率估算的人脸检测算法,弹性图匹配检测算法(elastic graph matching)。同时,著名的feret项目的开展推动了在有光照、姿态等非理想采样条件下的人脸检测问题的研究。第三阶段(1998年-现在):feret项目所进行的人脸检测技术评估表明:主流的人脸检测算法在光照、姿态、表情、装饰等非理想的图像采集条件或者用户不配合等其他因素的鲁棒性比较差。因此,光照、姿态等问题在后来成为计算机视觉领域的研究热点。同时,统计学习理论中的支持向量机svm在这个阶段被广泛的应用到了人脸检测技术中来。blanz和vetter等提出的基于3d变形(3d morphable model)模型的多姿态、多光照条件下人脸的图像采集、分析与检测算法也是这个阶段的一项具有很大影响力的人脸检测算法。实验表明,该方法在多光照、多姿态的人脸库上得到了非常高的检测准确率。另外,basri和jacobs得出结论:由任意远点光源获得的所有朗博反射函数的集合形成一个线性子空间,这个结论对于光照问题的解决提供了有效的解决思路。同时,feret项目之后,更多的商业化运营的人脸检测系统开始出现。目前,非理想图像采集条件下的人脸检测问题成为计算机视觉领域的研究热点。现在,重要的人脸检测算法或理论包括:非线性建模方法、统计学习理论、基于boosting的学习技术、基于3d变形模型(3d morphable model)的人脸建模与检测方法。2.3人脸检测所面临的主要困难:人脸检测算法需要考虑的主要因素有两方面,一是要保障算法能够得到高检测率(high detection rate),二是要保障得到低误检率(low false positive rate)。目前人脸检测的所面临的主要难点为如下几点:(1)脸型的多样性,人脸中包含许多细微结构或特征,如,人的发型、头发的颜色、皮肤的大小、眼睛的大小和睁闭、面部动作,这些问题可能会给人脸识别带来一些困难。(2)脸部遮挡,如眼镜、额前的长发、头饰,另外还有外界环境引起的遮挡等。(3)拍摄的视角变化,人脸拍摄时的视角变化有两种情况:平面内旋转和平面外旋转,此两种情况对应的实际拍摄效果可能是侧面人脸图像或倾斜人脸图像。(4)拍摄背景复杂,比如拍摄照片是,由于背景颜色很人脸的肤色比较相近,人脸检测算法难以进行分离,因此,可能会出现误检的情况。(5)成像条件的变化。主要影响的因素:有光照、阴影、姿态、成像设备本身的限制等等方面的影响。2.4目前主要的两类人脸检测算法的概述:到目前为止,计算机视觉领域的人脸检测研究已经有20多年的发展,目前广泛使用的人脸检测算法大致可以分为两类,基于知识的方法(knowledge-based approach),基于学习的方法(learning-based approach)。基于知识的方法是利用特定的规则对人脸进行识别,而需要利用的规则来源于先前已有的关于人脸模式的先验知识。比如人的脸型的最基本的特征是对称的一双眼睛、一个鼻子、一张嘴,并且这些特征的位置是相对固定的,即一双眼睛位于鼻子的上端,鼻子竖直向下,嘴位于下端。基于知识的检测方法的基本检测过程是首先提取出这些面部基本特征,而后根据这些面部特征的相对位置关系进行重组。基于知识的面部检测方法在早期的人脸检测工作中应用较多,整个检测过程简单、易于应用、可行性高。但是该过程的主要缺点是难以将面部检测模式的所有知识转化为可以运用于计算机的规则表达式。其难点主要体现在如果规则表达式比较严格,那么就会产生较高的漏检率;如果规则表达式比较简单,那么比较容易出现相对较高的错检率。而且,人脸的面部特征有一定的复杂性,这种基于知识的方法难以枚举所有人脸的面部情况,使这种基于知识的人脸检测算法的应用范围受到了限制。基于学习的 人脸检测方法,通过收集大量的人脸面部、非人脸样本,而后基于学习的人脸检测算法结合机器学习算法,使计算机能够通过学习获得一个分类器,通过对分类器的不断训练,使得分类器能够有效地对人脸以及非人脸的图片样本进行有效的检测。基于学习的人脸面部检测算法的性能主要决定于机器学习算法生成的学习机器(learning machine)的学习能力以及用于训练分类器的人脸和非人脸的样本对实际目标模型的表达能力。相较于基于知识的人脸检测算法,基于学习的人脸检测算法具有更高的优越性,能够在非常复杂的客观背景下进行处理复杂的人脸检测问题,同时也是当前计算机视觉领域中的人脸检测与识别学科方面的主流研究方向。目前在基于学习的人脸检测算法研究方向上,比较重要的研究成果有4种,分别是基于人工神经元网络的方法,基于支持向量机的方法,基于贝叶斯准则的方法,基于adaboost的方法。在人脸检测方面,基于这4种的算法设计的检测器的检测精度差别没有本质性的不同,其检测精度都是很高的,但是不同检测算法的检测速度是有一定的差别的,其中检测效率最为高效的是结合了adaboost算法和haar矩形特征的级联检测器。目前这种adaboost算法获得了很大的成功,以至于在最近几年,人脸检测算法通常是adaboost算法的变形或者扩展,而且这种算法还被推广到更加广泛的应用上,比如行人目标的快速检测,同时adaboost算法也是本文的重要的阐述内容,和本文实验内容是实际实现方法。2.5本章小结:本章最初,我们进行了对人脸检测最基本的描述,对人脸检测在未来对人工智能的发展的推动作用寄予了厚望,和对未来人脸检测的广泛应用的展望;接着我们按人脸检测技术的生产,发展过程进行了必要的概述,并把人脸检测技术的发展过程大致的分化为三个主要的阶段;然后我们对人脸检测技术发展过程中我们所面临的各种困难进行了阐述;其难点大致可以分为以下几点,即面部特征的多样性,面部被遮挡,成像背景的复杂性,拍摄角度的多变性,成像设备条件的不一致性;再接着,我们目前人脸检测算法的两种主要类别,一是基于知识的人脸检测算法,一是基于学习的人脸检测算法,其中基于学习的人脸检测算法,有更高的检测效率,并且其中的一个分支基于adaboost由于其检测速度快,检测效率高更是得到了广泛的运用,目前的许多人脸检测算法都是adaboost算法的变形或者扩展;在接下来的章节我们也会在更多的章节对adaboost算法进行非常详细的描述。3人脸检测主要方法3.1本章概述: 目前广泛应用的人脸检测算法有比较多种的种类,根据检测算法的不同,人脸检测算法大致可以分为以下三大类:第一类 基于肤色的人脸检测算法基于肤色的检测方法是较为简单人脸检测算法,因此在检测精度要求不高的应用环境中其应用是最为广泛的,在一些场合或者一般情况下,由于人脸的肤色特征和背景颜色有较大的区别,所以我们可以通过这种基于肤色的人脸检测算法快速的粗略的将人脸和其背景环境中区分出来。第二类 基于形状的人脸检测算法基于形状的人脸检测算法的理论基点是人脸的面部特征具有普遍性,如面部有位置相对固定的一双眼睛,一个鼻子,一张嘴,我们可以利用人脸的面部特征,利用一些事先设计好的数学模型与我们需要检测的图像中进行匹配,如果图像中有符合匹配的条件,那么就能确定图片中人脸的位置,大小等信息。第三类 基于学习的人脸检测算法基于学习的检测方法是利用统计理论进行分析并且结合机器学习的计算机,通过先前准备好的大量的人脸和非人脸样本对利用某种基于学习的算法设计的分类器进行训练,设计好的分类器能够有效的对人脸和非人脸图像中所包含的特征信息进行有效的识别。3.2基于肤色的人脸检测算法基于肤色的人脸面部检测算法是应用的比较为广泛的以及和普遍的计算机人脸面部识别检测算法。这种人脸检测算法在设计之初,需要建立和人脸有相关性的人脸面部肤色色彩数据模型。当今的计算机科学界,计算机视觉研究领域的一个重要的分支即是数字图形学,其定义的色彩模型的意义是指,在图像中某种特定的上下文的数据环境中对于色彩的一些特性和行为特征模式进行有效地解释的一种模型方法。在这之中,的颜色色彩模型是通过基予三原色即红、绿、蓝三种颜色色彩混合而产生其他颜色的色彩生产机制,以便于使不同的颜色能够注入进入视频监视器或者打印机、投影仪等硬件设备上以用来表示颜色及色彩。在我们用计算机建立一个基于人脸肤色的色彩模型之前,我们有必要首先先简要地介绍一些有关各种颜色色彩空间的基础概念性知识。3.2.1色彩表示空间色彩表示空间即为各种颜色色彩的最为基本的色彩表示空间。中的r、g、b三个字母分别用来表示各种颜色中的红色-red、绿色-green、蓝色-blue这三种最基本的颜色,这三种颜色的亮度的程度可以使用数字0255来表示。通过对、这三种基本的颜色色彩的通道进行改变以及这三种颜色色彩互相之间叠加而产生新的颜色色彩,我们通过这样的方法,大概得到大约1670万种颜色丰富的各种颜色色彩。3.2.2色彩表示空间颜色色彩表示空间又被称之为色彩空间,为表示电视视频图像和计算机数字图像中最为常用的色彩颜色空间,目前,这种颜色色彩空间广泛地运用在有线数字电视系统中。其中yuv中的字母代表数字图像中亮度这种基本的元素,而字母则分别代表的是数字图像中的蓝色分量以及红色分量。颜色色彩空间模型中,数字图像的数据可以表示为双精度类型,但是,数字图像中的数据的存储空间是通过8位无符号整形数据储存空间表示。yuv色彩空间中的字母(即亮度)的取值范围为16235,另外的两个字符和(即蓝色分量以及红色分量)的取值范围皆为16240。yuv色彩空间在目前较为广泛使用的各种数字图像压缩算法中都有应用,比如jpeg算法,这种算法的第一个的步骤就是将图像的颜色色彩空间进行转换,使其表示为颜色色彩空间。在通过该算法(jpeg算法)将数字图像从色彩空间转换到颜色色彩空间的过程中,数字图像中的数据的输入、输出都是8位二进制格式。这种算法的转换公式如下: (1)上面所述的代数表达式中,、分别代表的是颜色空间中的红色分量、绿色分量、蓝色分量这三个颜色分量的取值。3.2.3色彩表示空间颜色色彩表示空间是一种广泛应用于电视图像的颜色色彩表示空间。在色彩表示空间中,我们采用的是色彩坐标系,在这种色彩表示坐标系中,yiq中的字母代表的是数字图像中色彩的光亮度,用于表示数字图像中的灰度信息;字母表示的是数字图像中的色调,字母代表的是数字图像的饱和度,这三个字母y、i、q中的i和q都是用于表示图像中的颜色信息。根据我们前面的表述,我们可以知道这种颜色表示空间的一个主要的有别于其他的色彩表示空间的优点就是通过这种色彩表示空间,我们可以把数字图像中的灰度信息和颜色信息分别表示。3.2.4色彩表示空间颜色色彩表示空间是一种面向使用者的色彩表示空间,这种色彩表示空间和人类视觉的主观感觉有一定的相似性。在hsv色彩表示空间中,字母、分别指代的是是数字图像中的色调(用字母h表示),数字图像中的颜色饱和度(用字母s表示,saturation)以及数字图像中的明度(用字母v表示,value)。在这种色彩表示空间中,图像中的一种颜色可以用一个h/s/v三元组来表示,h、s、v分别是一中颜色的三个参数。3.2.5人脸肤色模型人脸的肤色由于各种客观的环境因素、基因因素、生活条件因素、着装打扮的因素,导致了由于种族的差异,年龄的差别,性别的不同,而使人脸的面部肤色看起来存在各种差异,但是人脸肤色的主要差异体现在图像中的亮度上。当减少或者去除图像亮度的影响,人脸肤色就具有比较高的聚类性。在颜色表示空间中,我们为了有效地减少由于光照条件而产生的影响,有必要对人脸肤色进行亮度归一化处理。归一化后图像中的颜色分量分别用小写字母表示,亮度归一化处理由下列代数式表示: (2)代数中的小写字母分别来自于rgb颜色模型中的三个基本分量、,我们可以根据数学方法知道,。这种归一化处理去除了三个颜色分量、中的相对亮度信息(即),但是采用这种归一化处理方法后,新的颜色分量仍然存在细微的亮度信息,因此,采用这种基于rgb颜色表示的归一化处理方法,来进行肤色检测,其检测效果不理想。在色彩表示空间中,我们对图像进行归一化处理后,得到色度直方图,假定肤色模型满足二维高斯模型的条件,即,在这个代数表达式中,为色彩均值,即,;表示的是协方差矩阵,。我们可以使用这种基于色彩表示空间的肤色模型来检测图像中的任意一个像素是否符合人脸肤色,其概率由下列表达式计算得出。 (3)我们已经通过大量的实验,有效地证明了,这种基于颜色表示空间的人脸肤色模型可以非常高效率地区分图像中的像素是否符合人脸或者非人脸的条件。3.2.6图像亮度补偿我们知道在不同的光照条件下,我们通过图像采集设备得到图像的亮度是由明显的差别的,为了减少或者去除这种由于光照条件造成的影响,可以采用gray world算法来处理基于rgb色彩表示空间的图像,对这种图像进行对快速地色彩补偿的处理,其处理方式由下列公式表示: (4)在上列所述的公式中,表示的是标准亮度图像、的值;表示的是输入图像、的平均值;表示的是原图像的像素值,表示的是进行亮度补偿处理后的像素值。3.2基于形状的人脸检测算法 基于形状的检测算法是根据人脸的面部中器官的位置特征、几何特征等这些特征集,进行检测,其检测方法大致又可以分为三种,下面将一一列出。3.2.1基于先验知识的人脸检测算法基于先验知识得人脸检测算法是通过将人脸的面部器官之间的位置关系进行编码准则化的人脸面部检测算法。这种人脸面部检测算法是一种自顶向下的运算方法,其根据是人脸的面部器官的位置对称性、灰度的差异性等先验知识,据此制定出了一系列得检测的准则。当图象中得待测定区域符合设定的准则,那么根据此检测算法,此图片中的该区域被检测为人脸区域。这种自顶向下的检测方法可以比较好地把握图像中的全局信息,但是这种方法有一个缺点,其缺点在于在图像中待测区域对初始位置的定位有非常重要的作用,如果对初始位置的地位出现了偏差,这种情况将会导致图片中整体跟踪结果的偏移以及变形。目前,这种基于先验知识的检测算法中,比较好的检测算法有镶嵌图人脸分块检测算法、广义三分图检测算法、结合和的分块检测算法。分块的思想通过比较图像中每个分块地灰度值制定一系列的准则进行判定。比如,我们将系统分成三个等级,可以通过使用不同的精确度的平局和二二次采采样而产生的三个等级的不同的的分辨率的的图像。对于不同的分辨的图像象,我们可以使用不同的一系列的准则来进行判断,对于分辨率比较低的图像的我们制定的准则主要体现于人脸面部特征的大体轮廓,对于分辨率比较高的图像的我们制定的准则主要体现人脸面部的的细节特征。3.2.2基于特征不变性的人脸检测算法基于特征不变性的检测算法的概念,该算法主要是根据检测人脸面部存在一些不会发生变化的特征,比如眼睛、鼻子、嘴巴以及他们之间的位置关系。与基于先验知识的算法的不同之初在于,这种基于特征不变的检测算法是自底向上的,首先,我们利用各种手段各种方法寻找出上文表述的不会发生变化的一系列的面部特征,然后我们综合这些已经找到的不会发生变化的面部特征,并据此确定出一个需要进行检测的区域是否符合我们已经确定出的有关人脸的不变特征,如果符合,那么我们就可以认为该检测区域为面部区域。这种自底向上的检测算法与上一小节介绍的自顶向下的检测算法是互为相反的,我们考虑到人脸的面部的器官之间的位置是存在着空间约束的,通过对各局部信息,即脸部器官,的定位和跟踪,并结合器官之间的空间位置关系,完成对整体人脸的定位。在各种检测算法中,绝大多数的自底向上的检测算法都是把眼睛作为第一个重要的主要特征进行搜索以及定位,由于眼睛具有特殊的鲜明的外观特征以及相对稳定的明确的对称特征,所以我们使用眼睛作为最主要的面部特征进行检测,这样,我们就能够比较方便地采用基于自由伸缩模板的检测算法或基于特征空间的检测算法等。但是,这种基于特征不变性的人脸检测算法有一个重大的缺陷,其缺陷在于这种人脸检测算法都是在图像中的亮度空间内对符合眼睛的亮度特征的区域进行必要地搜索,但是,这种检测算法的检测效率很有可能会受到在我们通过摄像机、照相机等图像采集设备获取图像时其外部环境的影响,比如光照强度、姿态以及表情等。3.2.3基于模板的人脸检测算法基于模板的人脸检测算法的概念,我们可以把这种检测算法更加细致地分化为两张类别:一种是预定模板;另一种是变形模板。基于预定模板的检测算法第一步我们必须先制定出一个标准的模板,然后我们利用该检测算法来进行计算,得出需要检测的图像中的检测区域和模板之间的相关值,当我们用该检测算法得到的相关值符合我们事先制定的准则,那么我们就可以判断得出结论:该检测区域符合人脸的特征。基于变形模板的检测算法的第一步是我们必须在一开始就制定出一系列模板参数,接着我们利用该检测算法,根据图像中的待定的检测区域的数据对我们事先制定的模板参数做出修改,使得模式参数最终趋于稳定值,那么我们就达到了通过基于变形模板的检测算法以检测出该待测区域是否符合人脸面部特征的目的。现在,比较好的基于模板的人脸检测算法主要有4种,分别是:层次模板匹配算法、主动表观模型-aam算法、主动形状模型-asm算法、多模板匹配算法。3.3基于学习的人脸检测算法基于学习的人脸检测算法是通过利用数学统计分析并结合机器学习的方法来完成寻找出人脸样本或者非人脸样本。这种算法主要是基于数学统计特征,再使用其他的一些特征来完成分类器的构建然后使用这种我们构建出了的分类器来完成人脸面部识别。目前人们主要使用的基于学习的人脸面部特征检测算法包括:自空间方法、神经网络方法、支持向量机方法、隐马尔科夫模型方法以及adaboost算法,adaboost算法是应用最为广泛和成熟的基于学习的人脸检测算法。adaboost分类器是一般通过多个层次的弱分类器级联而组合而成,通过使用第一层分类其出来的正确检测结果来触发第二层分类器的检测,从第二层出来的正确结果触发第三层分类器的检测,以此类推。相反,从任何一个分类器输出的被否定的检测结果会终止后续的分类器对这个子窗口的检测。我们可以通过改变每个层次的分类器的阈值,使得绝大多数人脸图像都能通过检测,非人脸不能通过分类器的检测,这样在级联分类器的末端就可以拒绝大多数的非人脸。基于学习的人脸检测流程如下面图片2.1所表示,整个过程大致由两个部分组成:分别是离线学习(offline learning)、在线检测(online detection)。所谓离线学习是指通过收集一系列的训练样本且结合机器学习算法通过训练分类器,然后得到一个用于表示目标模型的分类器结构,所谓的在线检测是指通过使用学习和训练后获得的分类器结构来检测输入图片,然后可以得到人脸在图像中的位置,并把这个新的图像作为对此分类器的新的训练样本。下面我们开始分别介绍这两个检测过程,以及这两种检测过程的组成部分以及与之关联的性能评价方法。图2.1 基于学习的人脸检测的两个过程(图片左边用于表示离线学习,图片右边用于表示在线检测)3.3.1 分类器的离线学习如上图2.1所示,分类器其的离线学习过程包括了图像对其、预处理过程、特征提取过程和分类器训练过程,这四个基本过程,下我们面对这四个模块的具体操作做一下较为详细地讲解。3.3.1.1 图像对齐分类器离线学习过程的第一个步骤就是是采集用于训练分类器的样本,并且必须先将所有的人脸图像进行对齐(配准)。进行图像对齐的目的是降低这些训练样本集在尺度大小、形体样貌、旋转扭曲程度和平移等平面几何特征方面所产生模式变化。现在我们假定图形采集过程中获取图像的设备与人体的距离足够大,那么我们就可以将摄像设备所拍摄的人脸图像看作一个平面。用于训练分类器的图像中的人脸往往具有不同尺度、形状和倾斜角度的特征,但是这种图像可以被认为是一个经由“标准人脸”平移、旋转或缩放得到的。通过对齐过程,我们可以得到“标准人脸”图像,而且可以将各个不同的训练样本应射到“标准人脸”图像上。为了达到对齐人脸的目的,我们可以首先手工地标注各个图像上的人脸的一些比较显著的特征点的位置,比如眼角、嘴角等位置。现在我们假定坐标系中的一个点是“标准人脸”上的一个显著的特征点,而坐标点是任意一张训练图像上与之对应的特征点,这两个点的位置关系可以通过仿射变换代数式来表示,即 (2.1)在给定一组对应的点后,上面的代数式(2.1)可以变化成下式: (2.2)当两个图像有两个以尚的对映点时,上述的线型方程组可以通过所谓的“伪逆”方法求解。我们假定表达式(2.2)等号左边的矩阵被称为a,那么求解变量,等号右边的矢量表示为b,则有代数表达式如下: (2.3)通过式(2.1)的逆变换,任意一个训练图像上的特征点可以变换到“标准人脸”坐标。给定出一组标著了征特点的人脸图像,需要时同时求取“标准人脸”上特征点的置位与每个练训图相和“标准人脸”之间的变换数参。这个代迭过程包括下列的步奏:(1)初始化所有练训样本上的对应样本点的平均置位作为“标准人脸”上的征特点。(2)对任意一个练训人脸i,计算出该人脸的征特点置位和平均置位之间的应射关系,利用将应射到标准人脸坐标坐。(3)利用更新平均置位。(4)如果的变改较小则停止迭代过程,否则转向步奏(2)。获得标准的人脸的坐标位置position以及每一个训练图像的应射参数之后,我们就可以通过插值的方法进行剪裁,得到对齐的固定尺寸大小的人脸训练图像。而非人脸图像可以从大量的不包含人脸的各种图像中随机获取,也可以通过所谓的“自举(bootstrap)”方法,利用学习得到的分类器,在待测图图像中检测出得到的一些虚警目标获得非人脸训练样本。3.3.1.2 预处理预处理的目的是降抵光照条件不均匀所造成的影响。我们首要考虑的问题是对样本图像进行有效地光照梯度更正(illumination gradient correction),即使用图像的灰度值进行拟合,得出一个校正屏面,然后通过减去这个屏面。假定待处理的图象中包含有n个象素,每个图像的灰度由表示,需要进行拟合处理的平面为,此平面应该使得表示式与z之间的均方误差达到最小,即 (2.4)式(2.4)可以通过最小二乘法得出解集。求得拟合平面后,将图象中的各个象素与其上对应的置位的z值相减,即 (2.5)照度梯度更正消除了图象的一阶变化量,能很大程度上的减弱面部的阴影,但这种更正算法并不能完全消除面部的阴影。这种阴影可以把它看作是人脸检测过程中固有的干扰分量,需采用数理统计学习的方法使分类器适应这些干扰。为了进一步增强人脸模式识别的一致性,可以对样本图片的数理统计特性进行归一化(所谓标准化)。考虑最基本最主要的统计量灰度的均值和方差,将它们调整到给定的大小值。使得大小为像素的图像灰度矩阵表示为,那么这个图像的灰度均值和方差分别可以表示为 (2.6) (2.7)不失一般性,将图像的灰度均值和方差调整到给定的大小值0和1,则需要对每个象素点的灰度大小值进行如下代数变换: (2.8)变换后的图像可以部分地消除训练样本与测试样本光照变化。3.3.1.3 特征提取特征提取的目地是将训练图像的象素值应射到特征空间,以降低类内间距,提高类间间距,以便于分类器进行分类。常用的特征包括原始象素特征、haar特征和gabor征特等。特征提取要同时考虑到特征的别鉴能力和计算复杂程度。比如当我们直接采用图象灰度值作为征特时,虽然省略去了征特提取这一个计算过程,但是由于原始象素特征本身的别鉴性比较低,我们往往需要采用分类其将特征提取这一过程隐含在分类其结够中,使得分类其的结够变得非常复杂,分类速度效率下降,gabor征特对目标的述描比较有效,但基于该算法的计算复杂度比较高,不利于进行人脸检测的实时应用。haar征特的定义简单明了,于此同时,基于该算法的计算复杂度相对较低,是目前的人脸检测算法中应用较为广泛的特征表示形式,在后面的章节中我们将根据详细的介绍这种特征。3.3.1.4 分类器的学习分类器的学习是模式识别和机器学习研究的主要内容,现在比较常用的方法包括神经网络、svm和adaboost集成分类器等算法。神经网络主要应用在20世纪90年代早期;后来随着svm算法的发展,使得可以采用神经网络的地方已大多被svm算法替代。采用svm算法的优点是可以通过这种算法避免不必要地反复选取神经网络的隐藏节点,且推广性较好。adaboo
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 招标文件购买信用先行
- 旅店服务合同的性质分析
- 专业团队的笔译
- 短期借款人协议合同
- 房屋买卖合同标准模板
- 广场物业服务合同文本
- 面砖供应链合作协议
- 烟草制品保证
- 外加工与采购合同的更新
- 购房贷款合同范本模板示例
- 商场用电安全培训
- 《中小学教育惩戒规则(试行)》宣讲培训
- 结清货款合同范例
- 开题报告:职普融通与职业教育高质量发展:从国际经验到中国路径创新
- 变、配电站防火制度范文(2篇)
- 九年级上册人教版数学期末综合知识模拟试卷(含答案)
- 重大版小英小学六年级上期期末测试
- 微积分知到智慧树章节测试课后答案2024年秋铜陵学院
- 金融科技UI设计
- 中南运控课设-四辊可逆冷轧机的卷取机直流调速系统设计
- 江苏省苏州市2023-2024学年高二上学期1月期末物理试卷(解析版)
评论
0/150
提交评论