版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于肤色相似度的人脸检测与定位安徽工程科技学院毕业设计(论文)PAGE II PAGE - 62 - 毕业设计(论文)PAGE I 基于肤色相似(xin s)度的人脸检测与定位摘 要本课题致力于完成Visual C+ 6.0平台下的人脸检测与定位系统,人脸检测定位的算法限制于基于肤色相似(xin s)度算法。要完成的工作包括相似度的计算,图像的二值化,垂直直方图和水平直方图的获取,人脸特征(眼睛、嘴和鼻子)的提取。本课题着重于肤色模型相似度在人脸检测与定位中的应用,对增加人脸检测与定位的准确率的研究有一定的指导意义。提出一种(y zhn)基于肤色的人脸检测定位算法,设计了基于肤色的人脸检测和定
2、位系统。 采用了脸部皮肤之间相似度的方法以及二值化方法,使用了基于边界方法和基于区域方法相结合的算法, 提取了眼睛、嘴和鼻子等关键特征,最终较好地实现了人脸定位。 在Microsoft Windows平台上,利用Visual C+ + 6. 0 开发了软件。本课题的成果具有一定的应用价值。实验结果表明,该软件对于一定尺寸范围内清晰的正面人脸图能够正确检测定位并提取特征,并且在速度和准确性方面具有良好的性能。关键词:图像分割;人脸定位;肤色;人脸检测;特征提取Detection and Localization of Person Face Based on Skin Color Similar
3、ityAbstract This topic devotes to completing the detection and localization system of the person face under the Visual C+ 6.0 platforms, and the detection localization algorithm of the person face limit to basing on the skin color similarity algorithm. The topic must complete similarity computation,
4、 binary image processing, vertical histogram, horizontal histogram and extracting person face characteristic (eye, mouth and nose). This topic emphasize application of skin color model similarity in the detection and the localization of person face, and has a significant instruction for research of
5、increasing accuracy in detection and the localization of person face.In this paper, the authors have presented an algorithm and designed a system for face detection and location based on complexion. By strengthening the contrast between face features and by adopting binary image processing method, t
6、he system has improved the preprocessing effect; and by using boundary-based algorithm plus region-based algorithm , the system has realized face location through the extraction of the features of eyes, nose and mouth. Taking advantages of Visual C+ 6.0, the authors have also developed corresponding
7、 software based on Microsoft Windows. Production of this paper have definite application value.Experiment results prove that the system is valid in detecting, locating and extracting frontal view face features in a certain range.And it possess favorable performance in rapidity and accuracy.Key words
8、: image segmentation; face localization; complexion; face detection; feature ex- traction 目录(ml) TOC o 1-3 h z u HYPERLINK l _Toc169875503 引言(ynyn)1 HYPERLINK l _Toc169875504 第1章 人脸检测与定位(dngwi)概述2 HYPERLINK l _Toc169875505 1.1 人脸检测的定义、应用及难点2 HYPERLINK l _Toc169875506 1.2 人脸检测的研究背景及现状2 HYPERLINK l _T
9、oc169875507 1.3 本文研究的主要内容3 HYPERLINK l _Toc169875508 第2章 基于肤色模型的人脸检测4 HYPERLINK l _Toc169875509 2.1 人脸检测方法4 HYPERLINK l _Toc169875510 2.2 基于肤色的人脸检测4 HYPERLINK l _Toc169875511 2.2.1 色彩空间的选择4 HYPERLINK l _Toc169875512 2.2.2 肤色模型5 HYPERLINK l _Toc169875513 2.3 人脸肤色相似度的计算6 HYPERLINK l _Toc169875514 第3章
10、相似度基础上的人脸特征定位10 HYPERLINK l _Toc169875515 3.1 人脸检测与定位算法10 HYPERLINK l _Toc169875516 3.1.1 人脸区域分割算法10 HYPERLINK l _Toc169875517 3.1.2 人脸区域标记算法12 HYPERLINK l _Toc169875518 3.1.3 人脸检测流程12 HYPERLINK l _Toc169875519 3.2 人眼的检测算法及标定13 HYPERLINK l _Toc169875520 3.2.1 有背景灰度人脸图像中的人眼检测与定位14 HYPERLINK l _Toc169
11、875521 3.2.2 眼睛的标定15 HYPERLINK l _Toc169875522 3.3 鼻子的标定17 HYPERLINK l _Toc169875523 3.4 嘴的标定18 HYPERLINK l _Toc169875524 3.5 设计结果及分析19 HYPERLINK l _Toc169875525 结论与展望21 HYPERLINK l _Toc169875526 致谢22 HYPERLINK l _Toc169875527 参考文献23 HYPERLINK l _Toc169875528 附录A引用的外文文献及翻译24 HYPERLINK l _Toc16987552
12、9 附录B 参考文献题录及摘要27 HYPERLINK l _Toc169875530 附录C 主要源程序29插图(cht)清单图 2-1训练(xnlin)流程图6图 2-2 二值化流程图.7图 2-3 原图(yun t).7图 2-4 相似度图.8图 2-5 二值化图.8图 2-6 垂直直方图.8图 2-7 水平直方图.9图 3-1 人脸检测与定位的总体流程.10图 3-2 人脸区域分割系统.10图 3-3 区域分割算法流程.11图 3-4 标记人脸区域.12图 3-5人脸检测流程图.13图 3-6 LOG算子.15图 3-7 边缘提取流程.15图 3-8 边缘提取图.16图 3-9 眼睛的
13、定位.16图 3-10眼睛标记流程图17图 3-11眼睛标记17图 3-12鼻子的标记流程图18图 3-13鼻子标记18图 3-14嘴巴标记19图 3-15系统主界面19引言(ynyn)人脸检测和定位是人脸识别中一个重要的组成部分,其检测问题却是一个极赋挑战性的课题。人脸是一个包含五官、毛发等的极不规则的复杂待测目标,不同的人脸在形状、大小、颜色、质地等方面都有很大的变化;所考虑的检测对象大多是由图像捕捉设备所采集的数字图。所以采集条件特别是光照条件包括光源的方向、明暗、色彩等都会对图的效果产生很大的影响,进而(jn r)影响对人脸的检测;另外,人脸上还可能长有胡须、戴有眼镜等, 这些也同样是
14、人脸检测不可忽视的因素。人脸检测具有一定的难度和复杂性,对这一问题的深入研究必将推动模式识别等计算机科学的发展。人脸的检测问题在近10年中得到了广泛(gungfn)的关注,国内外很多研究人士提出了很多方法,在不同领域取得了一定进展。但是对于一种能够普遍适用于各种复杂情况的,准确率很高的检测算法,还有很大的探索空间。本文利用Visual C+ + 6. 0 开发了人脸定位和特征提取的软件,该软件对于一定尺寸范围内清晰的正面人脸图能够正确检测定位并提取特征。 第1章 人脸检测(jin c)与定位概述1.1 人脸检测的定义、应用(yngyng)及难点人脸检测(jin c)(face detectio
15、n)是指在输入图中确定所有人脸(如果存在)的位置与大小。人脸检测系统的输入是可能包含人脸的图,输出是关于图中是否存在人脸以及人脸的数目、位置、尺度、位姿等信息的参数化描述。人脸检测问题最初来源于人脸识别(face recogznition)。人脸识别的研究可以追溯到20 世纪6070 年代,经过几十年的曲折发展已日趋成熟。人脸检测是自动人脸识别系统中的一个关键环节,但是早期的人脸识别研究主要针对具有较强约束条件的人脸图(如无背景的图),往往假设人脸位置已知或很容易获得, 因此人脸检测问题并未受到重视。近几年随着电子商务等应用的发展,人脸识别成为最有潜力的生物身份验证手段, 这种应用背景要求自动
16、人脸识别系统能够对一般环境下的图像具有一定的适应能力,由此所面临的一系列问题使得人脸检测开始作为一个独立的课题受到研究者的重视。人脸检测研究的就是如何从静态图或者视频序列中找出人脸,如果存在人脸,则输出人脸数目、每个人脸的位置及大小。人脸检测是人脸身份识别的前期工作,同时人脸检测作为完整的单独功能模块,在智能视频监控、视频检索和视频内容组织等方面都有直接的应用。人脸检测的一个最重要的应用是人脸识别技术。人脸识别技术的研究是本世纪计算机视觉领域最具挑战性的研究课题之一,其应用领域十分广泛:可用于公安系统的罪犯身份识别、安全验证系统、信用卡验证、医学、档案管理、视频会议、人机交互系统、驾驶执照及护
17、照等与实际持证人的核对、银行及海关的监控系统及自动门卫系统等。今天,人脸检测的应用背景已经远远超出了人脸识别系统的范畴,在基于内容的检索、数字视频处理、视觉监测等方面有着重要的应用价值。人脸检测研究具有重要的学术价值,受到学者越来越多的关注。人脸检测虽然有诱人的应用前景,但是在现实中却还没有开始大规模的使用。其主要原因之一就是用计算机自动进行人脸的检测和识别十分困难,目前的检测效果(正确率、速度)不如其他的生物识别技术,如指纹识别,视网膜识别等等。人们在日常生活中就进行了大量的人脸检测和识别工作,对人脸检测与特征的定位取得了一定的成绩,但人脸检测仍然存在着许多难点。人脸是一类具有相当复杂的细节
18、变化的自然结构目标,此类目标的检测问题的挑战性在于:脸由于外貌、表情、肤色等不同,具有模式的可变性;一般意义上的人脸,可能存在眼镜、胡须等附属物;作为三维物体的人脸的影不可避免地受由光照产生的阴影的影响。因此,如果能够找到解决这些问题的方法,成功构造出人脸检测,将为解决其它类似的复杂模式检测问题提供重要的启示。1.2 人脸检测的研究(ynji)背景及现状人脸检测的研究历史比较(bjio)悠久。高尔顿(Galton)早在1888年和1910年就分别(fnbi)在Nature杂志发表了两篇关于利用人脸进行身份识别的文章,对人类自身的人脸识别能力进行了分析。最早的研究论文见于1965年陈(Chan)
19、和布莱索(Bledsoe)在Panoramic Research Inc.发表的技术报告,至今已有四十多年的历史。近年来,人脸检测研究得到了诸多研究人员的青睐,涌现出了诸多技术方法。尤其是1990年以来,人脸检测更得到了长足的发展。几乎所有知名的理工科大学和主要IT产业公司都有研究组在从事相关研究。人脸检测研究的发展主要分为以下几个阶段:第一阶段(1964年1990年)这一阶段人脸检测通常只是作为一个一般性的模式识别问题来研究,所采用的主要技术方案是基于人脸几何结构特征(Geometric feature based)的方法。人工神经网络也一度曾经被研究人员用于人脸识别问题中。这一阶段是人脸检
20、测识别研究的初级阶段,非常重要的成果不是很多,也基本没有获得实际应用。第二阶段(1991年1997年)这一阶段尽管时间相对短暂,但却是人脸识别研究的高潮期,可谓硕果累累:不但诞生了若干代表性的人脸识别算法,而且美国军方还组织了著名的FERET人脸识别算法测试,并出现了若干商业化运作的人脸识别系统,比如最为著名的Visionics(现为Identix)的FaceIt系统。这一阶段的人脸识别技术发展非常迅速,所提出的算法在较理想图采集条件、对象配合、中小规模正面人脸数据库上达到了非常好的性能,也因此出现了若干知名的人脸识别商业公司。第三阶段(1998年现在)FERET96人脸检测识别算法评估表明:
21、主流的人脸识别技术对光照、姿态等由于非理想采集条件或者对象不配合造成的变化鲁棒性比较差。因此,光照、姿态问题逐渐成为研究热点。与此同时,人脸识别的商业系统进一步发展。为此,美国军方在FERET测试的基础上分别于2000年和2002年组织了两次商业系统评测。目前非理想条件下(尤其是光照和姿态)、对象不配合、大规模人脸数据库上的人脸识别问题逐渐成为研究的热点问题。而非线性建模方法、统计学习理论、基于Boosting的学习技术、基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。目前国内的,国外的对人脸检测问题的研究很多,比较著名的有MIT,CMU等;清华大学、北京工业大学、中科院计算
22、所和自动化所等都有人员从事人脸检测相关的研究。而且,MPEG7标准组织已经建立了人脸识别草案小组,人脸检测算法也是一项征集的内容。随着人脸检测研究的深入,国际上发表的有关论文数量也大幅度增长,如IEEE的FG(IEEE International Conference on Automatic Face and Gesture Recognition)、ICIP(International Conference on Image Processing)、CVPR(Conference on Computer Vision and Pattern Recognition)等重要国际会议上每年都有
23、大量关于人脸检测的论文,占有关人脸研究论文的近1/3之多。1.3 本文研究(ynji)的主要内容 本课题致力于完成Visual C+ 6.0平台下的人脸检测与定位系统,人脸检测定位的算法限制于基于肤色相似度算法。要完成的工作包括相似度的计算,图像的二值化,垂直直方图和水平直方图的获取,人脸特征(眼睛、嘴和鼻子)的提取。本课题着重于肤色模型相似度在人脸检测与定位中的应用,对增加人脸检测与定位的准确率的研究(ynji)有一定的指导意义。第2章 基于肤色(f s)模型的人脸检测2.1 人脸检测方法人脸检测传统的方法多是在亮度空间进行,仅有灰度信息的变化,没有任何区域或比例的限制,所以必须做多尺度空间
24、的全搜索,计算量非常大,而利用色度信息则可大大降低搜索区域,其中肤色信息是最为直接有效的。而且在人脸区域中,肤色一定是占主导地位的像素色彩值。肤色虽然因人而异,但很多研究表明肤色在色彩空间中的一定范围内还是呈聚类特性的,特别是在排除了光照亮度和在经过变换的色彩空间中。所以利用肤色这一线索可以排除掉在灰度图像中很像人脸而对应到彩色图像中根本不是肤色的区域,这在人脸检测中会起到积极的作用。目前人脸检测方法主要可以分为以下4类:基于知识的方法:利用人脸的几何形状以及脸部器官的比例对称关系来定位人脸;基于特征的方法:直接利用人脸信息如肤色特征、轮廓特征、纹理特征等;基于模板的方法:使用模板在待测图像中
25、逐点扫描计算匹配度,根据匹配度来判断有无人脸;基于外观的方法:如神经网络法、支持向量机法、特征脸法等。上述的各种方法都存在自身的优缺点和适用领域,很多学者在各自所面临的问题范围内不断探索,也发明了许多卓有成效的检测算法。但各种检测算法都存在效率与性能上的矛盾,也即在正确率、鲁棒性能方面更好的算法往往会花费更多的时间及系统消耗。在本文的设计中提出了一种基于肤色相似度的人脸检测与定位的方法,采用了脸部皮肤之间相似度的方法以及二值化方法,使用了基于边界方法和基于区域方法相结合的算法,提取了眼睛、嘴和鼻子等关键特征,最终较好地实现了人脸的检测与定位。下面就介绍这种方法。2.2 基于(jy)肤色的人脸检
26、测2.2.1 色彩空间(kngjin)的选择根据计算机色彩理论,对一种颜色而言,在计算机中有不同(b tn)的表达式,这样就形成了各种不同的色彩空间,当然各种色彩空间只不过是颜色在计算机内的不同的表达形式而已,在具体的色彩空间中通过实践找到肤色区间,建立起可操作性的肤色模型,这样就让肤色信息成为了人脸检测的核心方法。不同肤色模型的建立基于不同的颜色空间,且为颜色空间的一个子空间。主要的彩色空间有以下几种:RGB格式(红、绿、蓝三基色模型)、HIS格式(色度、饱和度、亮度模型)和YCbCr(YUV)格式。 对于彩色空间来说,RGB是最常用的颜色表示系统,但是人脸肤色在这一系统中的分布非常广泛,因
27、此不适合表示人脸区域,往往需要转换到其他的彩色空间。在该文的设计中采用了YCbCr(YUV)格式。这种色彩空间是以演播室质量标准为目标的CCIR601编码方案中采用的彩色表示模型,被广泛地应用在电视的色彩显示等领域中。其优点将在下一节介绍。通过下面的转换公式,可以将像素由RGB空间转换到YCbCr空间。Y=0.299R+0.587G+0.114BCb=-0.1687R-0.3313G+0.5B+128 (2-1)Cr=0.5R-0.4187G-0.0813B+128 我们将统计采集到的多幅图像人脸区域像素RGB值,按上式进行转换,统计在CbCr空间的分布概率,保留概率大于0.1的像素点,得到肤
28、色分布区域。最终,我们得到的肤色范围是:Cb90,125,Cr135,165。将肤色范围内的像素置1,其余置0,得到分割后的二值图像,实现人脸的初步定位。2.2.2 肤色模型 肤色是人脸一个重要而明显的特征,利用肤色模型可以快速排除非肤色区域,大大减小搜索空间,提高人脸检测的效率。1.光线补偿处理考虑到肤色等色彩信息经常受到光源颜色、图像采集设备的色彩的偏差等因素的影响,而在整体上偏离本质色彩而向某一方向移动,即我们通常所说的色彩偏冷、偏暖,照片偏黄、偏蓝等等,这种现象在艺术照片中更为常见。 为了抵消这种整个图像中存在着的色彩偏差,我们将整个图像中所有像素的亮度(是经过了非线性Y-校正后的亮度
29、)从高到低进行排列,取前5的像素,如果这些像素的数目足够多(例如,大于100),我们就将它们的亮度作为“参考白”(Reference White),也即将它们的色彩的R、G、B分量值都调整为最大的255。整幅图像的其他像素点的色彩值也都按这一调整尺度进行变换。2.非线性分段色彩变换这是构成我们实际利用肤色模型的主要部分。这一非线性分段色彩(sci)变换得到的肤色模型属于色彩空间中的聚类模型,这一类肤色模型的建立首先要选取一种合适的色彩空间,我们注意到YCbCr色彩空间具有如下优点:YCbCr色彩格式具有人类视觉感知过程相类似的构成(guchng)原理;CbCr色彩格式被广泛的应用在电视(din
30、sh)显示等领域中,也是许多视频压缩解码,如MPEG,JPEG等标准中普遍采用的颜色表示格式;YCbCr色彩格式具有与HIS等其他一些颜色格式相类似的将色彩中的亮度分量分离出来的优点;相比HIS等其他一些色彩格式,YCbCr色彩格式的计算过程和空间坐标表示形式比较简单;实验结果表明在YCbCr色彩空间中肤色的聚类特性比较好。在YCbCr色彩空间中,肤色聚类事两头尖的纺锤形状,也就是在Y值较大和较小的部分,肤色聚类区域也随之缩减。由此可见,在值较大和较小的部分,肤色聚类区域也随之缩减。由此可见,在Y值不同的地方,我们对Cb-Cr子平面进行投影,得到的结果是不同的,由此得到结论,简单地排除Y分类,
31、按照传统地做法在三维的Cb-Cr子平面中寻求肤色的聚类区域是不可行的,我们必须考虑Y值不同造成的影响,从而对YCbCr色彩格式进行非线性分段色彩变换。首先应用肤色模型进行人脸的初定位,接着提出了一种基于肤色区域分割方法得到包含人脸区域在内的一系列矩形区域,从而进行了定位。2.3 人脸肤色相似度的计算该文设计的是基于人脸肤色模型, 利用相似度方法, 对人脸区域进行了检测和定位。我们定义r=R/(R+G+B),b=B/(R+G+B),这样把三维的RGB降为二维。而在这个二维平面上,肤色区域服从高斯分布。我们可以采用训练的方法来计算得到一个分布中心,此过程主要生成可用于识别的参数。通常,在已有的样本
32、训练集基础上确定某个判定规则,使得按此规则对被识别对象进行分类所造成的错误识别率最小或者结果期望最大。开始训练命令,打开bmp格式的图像后计算每幅图像的像素数CrList和CbList,然后查询总的图像数count用于将当前数据库内的所有用户图片进行训练,最后对每幅图像求训练平均,得到可供识别比对的训练基。训练的过程如图所示:训练开始读取用户数量以及对应的图像数读取下一个用户的信息读取下一幅图像转成灰阶形式全部图 N Y全部用户 N Y保存训练基对每个人求训练平均图 2-1 训练(xnlin)流程图这样(zhyng)训练以后,得到了Cb和Cr的均值(jn zh)为117.4361和156.55
33、99,落在肤色范围内,验证了理论的正确性。同样也得到了肤色信息的均值M和方差C,为下一步计算相似度做了准备。然后根据所考察的像素离中心远近得到肤色的相似度,得到与原图相似的分布图,均值M和方差C如下:M=E(x),C=E(x-M)(x-M)T),其中x=r,bT相似度计算公式为:P(r,b)=exp-0.5(x-m)TC-1(x-m) (2-2)关于相似度软件的实现纯粹是公式的实现,在这就不做说明了。再按照一定的规则对该图二值化,通过设置合适的阈值(关于最佳阈值的设置将在下一章中介绍),可将图像变成只有0和1的二值图像,这样做的目的是为了减小计算量,加快处理速度,同时,还可将目标从背景中分离出
34、来,有效的突出了目标。二值化流程如下: NNY找到第一个像素的位置其灰度值阈值灰度值灰度值查找下个像素结束 图 2-2 二值化流程图按这种方法就可以对输入的bmp图像2-3进行处理,图 2-3 原图(yun t)其相似(xin s)度计算结果如图2-4示: 图 2-4 相似(xin s)度图可以给出二值化图2-5示:图 2-5 二值化图以及垂直直方图2-6示: 图 2-6 垂直(chuzh)直方图水平(shupng)直方图2-7示:图 2-7 水平(shupng)直方图至此完成了相似度的计算和图像的二值化,以及两种直方图的提取,那么下一章节将在此基础之上进行人脸区域的标记和人脸特征(眼睛、鼻子
35、、嘴巴)的提取。第3章 相似(xin s)度基础上的人脸特征(tzhng)定位 在上一章(y zhn)得到的人脸区域基础上,对原图像进行灰度计算,将可能的眼睛区域分割成小图像块标定人眼中心,从而在眼睛确定的情况下把鼻子和嘴巴提取出来。总体流程如下:眼睛定位图像灰度化 打开位图计算相似度标记人脸图像二值化 图 3-1人脸检测与定位的总体流程下面将介绍人脸标记和眼睛、鼻子、嘴巴定位的算法及其流程。3.1 人脸检测与定位算法3.1.1 人脸区域分割算法人脸区域分割的系统结构如图3-2 所示:包含人脸区域在内的一系列矩形区图像中的肤色和非肤色象素点 人脸区域分割算法 图 3-2人脸区域分割系统(xtn
36、g)在图3-2 中, 输出的一系列矩形将取代原来的整幅图像作为人脸检测算法的输入。这些矩形应该满足(mnz)以下条件: 矩形系列(xli)中应该尽可能地包含待检测图像中的全部人脸对于距离较近或者是有接触的多个人脸,分割后得到的肤色区域自然距离较近或者是连在一起,这时可以用一个矩形区域覆盖它们。不漏检、不降低正确率是肤色分割处理的前提,也是人脸区域分割算法的首要前提。据前面对肤色模型的分析,无论什么样的肤色模型都存在判断失误,所以算法输出的一系列矩形应该尽量包含所有的人脸区域。矩形系列应该少包含非肤色区域相对整幅图像,经过肤色分割预处理后的这一系列矩形的大小要明显小于原来的整幅图像,这是肤色分割
37、预处理能够提高人脸检测算法时间效率的主要原因,也是肤色分割预处理能够降低误报率的关键。对于可能的人脸区域来说,其相对于水平方向的旋转角度在45到135之间,因此旋转角度小于45或大于135的区域为非人脸区域。图像分割的目的是把人脸的器官与脸的其他部分分离开来,并保证每个器官的完整性。在包含人脸的图像中,脸部比较明显而易辨别的特征主要是面部器官:眼睛、嘴、鼻子和眉毛。鼻子往往与脸的反差不大,因此通常用鼻孔代替。这几个面部特征在灰度图像中一般比周围区域暗。尤其是眼睛和嘴在绝大部分情况下都清晰可见。因此图像分割可以利用的特征是:灰度比周围区域暗的区域。在设计中,为了减少图像分割这一步的运算量,对图像
38、做了二值化处理。分割的对象是黑白图像,分割简化为找出所有黑色的连通区域,它们都成为人脸器官的候选者。从一幅图中,按一定规则划分出感兴趣的部分或区域称为分割。对于利用人脸各器官之间几何关系的人脸定位方法来说,分割算法是十分重要的。在这里,感兴趣的部分是人脸的器官(眼睛、嘴、眉毛、鼻子等等)。成功的分割算法能够有效地把人脸器官和脸的其他部分分离开来,并且保持器官的完整性。设计采用了基于边界的方法和基于区域的方法相结合的算法。基于边界方法是提取边缘,利用边缘进行分割,该方法处理的像素数量比较少,各像素点间的相邻关系比较简单,处理速度比较快,但是,基于边界的方法是从局部特性来求图像整体的分割,因此在全
39、局宏观性质上不如基于区域的方法。基于区域的方法则是寻找互相连接在一起、并有相同特征的像素所形成的区域,它是实现图像分割的一种重要方法。在本系统中, 基于边界的方法主要用于前期矩形序列的产生,快速地得到包含人脸区域的外接矩形; 然后用基于区域的方法,, 全局考虑,对初始矩形序列进行区域归并, 得到最终的输出矩形。算法的整体流程图如图3-4所示:输入的经过肤色分割的图像去噪声处理提取边界对边界的连通关系作处理由边界的连通性和闭合性得到初始的一系列矩形将初始的矩形序列进行归并处理输出最终的矩形图 3-3 区域分割算法(sun f)流程3.1.2 人脸区域(qy)标记算法在标记人脸之前,首先(shux
40、in)要对相似度图像进行二值化操作,这一部分已经在前面一章中介绍了。接下来就要对人脸区域进行检测,标记人脸的过程实际上是对得到的二值化图像进行人脸边界估计的过程。估计人边界脸算法利用了人脸的结构特征:人脸左右边界肤色点个数约为人脸垂直方向最多肤色点个数的0.2 0.3倍;人脸上边界肤色点个数应该约为人脸区域宽度的0.5倍; 人脸区域高度约为人脸区域宽度的1.5倍。首先估计人脸的左右边界,具体算法如下:搜索垂直方向具有最多灰度值为0 的点(白点,即可能的人脸) 的x 坐标pos,并将白点数目计为count; 从pos 开始往左边搜索得到垂直方向第一次具有小于0.2 count个白点的x 坐标作为
41、人脸区域的左边界left ; pos开始往右边搜索,得到垂直方向第一次具有小于0.3 count个白点的x 坐标作为人脸区域的右边界 right 。接着估计人脸的上下边界,具体算法如下: 从上往下搜索水平方向的白点数,得到第一次具有大于0.5 ( right -left)个白点的y 坐标作为人脸区域的上边界top;根据人脸结构特征,将top + 1.5 ( right -left) 作为人脸区域的下边界bottom 。从而,可以确定人脸区域为rect(left, top, right, bottom ) 。标定的人脸区域如图3-5所示。从图可以看出,经过相似度计算和二值化操作,然后对人脸进行边
42、界估计,最后进行标定,基本上做到了。图 3-4标记(bioj)人脸区域3.1.3 人脸检测(jin c)流程整个基于肤色模型的人脸检测的流程(lichng)如下:原始图像 肤色检测皮肤图像 滤波和填充 修正后的皮肤图像 检查每个皮肤区域皮肤像素与整个矩形面积的比找到该区域的外接矩形 非人脸 小于固定值 矩形面积 小于固定值 非人脸大于固定值标准候选人脸 在原始图像相同位置得到矩形,进行(jnxng)放缩、直方图均衡化等处理 候选人脸图 3-5人脸检测(jin c)流程图3.2 人眼的检测(jin c)算法及标定因为人脸的五官位于脸部顶点与下巴点之间,将搜索范围设为一矩形区域,矩形的长为脸部顶点
43、与下巴点的距离,矩形的宽即是脸宽。标记人脸区域以后, 就可以进行边缘提取,接着标记眼睛,由人脸各特征的位置关系,就可以从上到下区分出眼睛、鼻子、嘴等特征。假设人脸的姿势比较正,那么人脸上的特征是水平边缘集中的区域。我们可以在低分辨率下提取水平边缘,然后找到人脸区域内富含这些边缘的连通区,作为人脸特征的候选区域。这些区域的位置和大小并不准确,因为边缘检测本身容易出现位置偏移,连通区的大小也随着阈值而变化。所以还要进一步修正上面的结果。对正面的人脸来说,眼睛、鼻子等特征和整个人脸的尺寸大小之间存在先验的约束关系,这就是人脸结构的恒常性,因此我们利用这些约束关系来确定特征区域的大小。(因为先找眼睛,
44、我们就以眼睛的大小为准,最后在调整嘴巴的大小)。人脸是一种特殊的模式,而人的双眼与眉毛、鼻、口按一定的结构分布在灰度基本均匀的人脸平面上,人脸这种特殊模式与图像背景模式大相径庭,从而为判别人的双眼位置提供了依据。寻找最佳分割阈值使人眼从复杂图像背景和人脸中分离出来是人眼定位的第一步。所谓最佳分割阈值指的是能将眼睛虹膜、瞳孔、上眼框与眉毛以及其它人脸部位、背景物明显分离的灰度分割阈值。由于眼睛虹膜、瞳孔部位的灰度值明显比其邻近区域(眼部周围皮肤、眼白)灰度值要低,因此能够从适当光照条件下拍照的图像中分割眼睛虹膜、瞳孔部位的灰度值总是存在的,并且不是唯一的,而是有一定的小范围。然而寻找这样的最佳分
45、割阈值并不是一件容易的事,眼睛虹膜、瞳孔部位及其邻近区域的灰度值会因人而异,并随光照条件、带眼镜时镜片的反光而变化,加上复杂背景的变化,使得最佳分割阈值的估计十分困难,但通过图像灰度直方图分析和统计的方法,对最佳分割阈值可能所在的灰度区间进行粗估计还是可以做到的。经对多幅在复杂背景及不同光照条件下人脸图像的直方图分析与统计发现,只要脸部光照适中,双眼部位较清晰,绝大多数情况下最佳分割阈值位于归一化灰度值0.1 与0.6 之间。若选择固定的背景和光照条件,由统计的方法可估计出更小的最佳分割阈值可能所在的区间。另外,利用直方图均衡方法也可使输入图像的最佳分割阈值可能所在的区间缩小。3.2.1 有背
46、景灰度人脸图像中的人眼检测与定位首先用某一分割阈值Threshold将包含人脸的灰度图像二值化,去除二值化图像中小的黑斑点,再对二值化图像中黑色块进行标记、计算每块面积(像素数)、确定每块的外接矩形位置及宽高。人眼位置的判定是根据眼睛在二值化人脸图像中的几何位置确定的,主要有以下几条准则:双眼中心距应在某个范围内:考虑到人脸在图像(t xin)中大小的变化,双眼中心距变化大约在一定(ydng)像素(xin s)距离范围内;双眼下方一定距离内不能有其它黑块:双眼下方一定距离内没有其它器官,因此在二值化图像中不能有其它黑块,这一特点也是区分眉毛与眼睛的重要判据;双眼中心位置上下相差不超过一定距离:
47、由于人脸在图像中可能向两侧倾斜,双眼中心位置常常不在水平线上。作为判据,允许人脸在一定程度上向两侧倾斜,双眼中心位置在垂直方向相差不超过一定距离(如15个像素距离);眼睛黑块所包含的像素数应在某个范围内:二值化图像中眼块所包含的像素数应在某个范围内(如550个像素),太大的黑块不太可能是眼块;眼睛黑块的外接矩形应是一宽大于高的矩形或接近于正方形:由于眼睛的结构特点,二值化图像中眼块的外接矩形常常是一宽大于高的矩形或接近于正方形,眼块的几何中心位于圆形的眼睛虹膜(含瞳孔)位置,高远大于宽的外接矩形对应的黑块不可能是眼块;与图像四边接壤或非常接近的黑块不是眼块:由于拍摄人脸图像时,要求人脸在照片中
48、应完整,且较靠近图像中心,因此在二值化图像中与图像四边接壤或非常接近的黑块不是眼块。为了能从粗估计的分割阈值区间中找到最佳分割阈值,我们提出了结合找人眼位置过程的自动调整法。选择一适当的阈值,从初始阈值T0=0.1 递增(在T0到Tmax=0.6 区间搜索),以每一新的阈值Threshold 二值化人脸灰度图像,并按上述人眼位置判定准则检测人眼黑块是否出现。随着阈值的不断增加,可以看到二值化人脸图像中新黑块在不断地出现,已有的黑块面积在扩展并不断地与别的黑块相重合。一旦在某个阈值下检测到双眼黑块出现,此时的阈值即为最优分割阈值,检测到的人眼黑块的几何中心也应接近于虹膜(瞳孔)中心(这是因为分割
49、阈值越大,眼块可能由无到有,由小到大,此时最先出现的应是具有较低灰度值的瞳孔和虹膜所对应的黑块)。3.2.2 眼睛的标定由于眼睛和肤色的差异较大,在上一章人脸区域二值化的基础上,再进行边缘检测。所谓的边缘就是图像的最基本特征,是指图像周围象素灰度有阶跃变化和屋顶变化的像素的集合;是由灰度的不连续性反映的。边缘广泛存在于物体与背景之间、物体与物体之间、图像基元与基元之间。它是图像分割所依赖的重要特征。经典的边缘提取方法是考虑图像的每个像素在某个领域灰度的变化,利用边缘临近的一阶或二阶方向导数变化规律,进行局部梯度运算。求梯度根据滤波算子的不同可以分为好多种。通过对处理后的图像进行研究对比发现:拉
50、普拉斯高斯算子既具备了高斯算子的优点又具备了拉普拉斯算子的优点在边缘检测中不但对灰度渐变和噪声较多的图像处理最好,而且是各向同性的,得到的处理后的图像具有连贯性和高清晰度。常用的5X5LOG算子如下图:-2-4-4-4-2-4 0 8 0-4-4 824 8-4-4 0 8 0-4-2-4-4-4-2 图 3-6 LOG算子(sun z)LOG 算子首先用高斯函数对图像(t xin)进行低通滤波消除空间尺度远小于高斯空间常数的图像强度变化即去除噪声,然后用拉普拉斯算子(sun z)进行高通滤波提取线特征在一个灰度均匀区域的边缘处LOG算子有以下表现:边缘以外灰度均匀处取零,边缘较暗一侧取正,边
51、缘较亮一侧取负,边缘中某些点处取零。用LOG算子提取边缘流程为: 肤色区域用LOG算子进行边缘提取是否为边缘? N Y处理为白色处理为黑色图 3-7 边缘提取流程 这样就可以将人脸的整个边界的轮廓大致地提取出来了。其边缘提取结果如下: 图 3-8 边缘提取图然后对边缘检测的结果进行水平方向的投影,基本能确定眼睛的两个范围I和II。这里虽然有眉毛的影响,但是由于眉毛正好位于眼睛的上方,因此不影响水平区域的确定,如图示:A B I II右眼眉毛左眼眉毛左眼右眼图 3-9 眼睛(yn jing)的定位然后(rnhu)在I和II的上方区域的竖直(sh zh)方向投影,得到的第一个峰值附近的区域A、B。
52、然后在A与I以及B与II确定的两个矩形区域内,对黑点进行区域膨胀,可以得到的眼睛的大致轮廓和左右眼角,然后黑点的坐标的平均值作为瞳孔的位置。具体算法是:在确定的人脸区域,把人脸部分划分为左右、上下四等份,再把人脸宽度12等份,每一份为nSlidWinWidth和人脸高度30等份,每一份为nSlidWinHeight。由经验可知:人眼只可能位于人脸上半部分的下9/15区域内,在这个区域内找白色像素的个数当它大于nSlidWinWidth*nSlidWinHeight/3时,可把参考位图的像素变为红色。这样就把眼睛区域划分为很多的小区域,在把这些区域中宽度小于人脸宽度的1/20删除掉,然后在合并相
53、邻的闭合区域(小于人脸宽度的1/40),这样就可确定人眼的水平区域。以同样的方法:去除掉小于人脸高度的1/100的区域,然后在合并区域(小于人脸高度的1/100),这样就可以确定人眼的垂直区域。在确定的人眼范围内,标定出左右眼角和眼睛的位置。眼睛标定的流程为:确定人脸区域边缘检测确定人眼的水平区域确定人眼的垂直区域标记左右眼角和眼睛的位置图 3-10眼睛标记流程图标记效果如图:图 3-11眼睛(yn jing)标记3.3 鼻子(b zi)的标定在确定了眼睛的位置(wi zhi)以后,鼻子的位置也就相应地定位下来了。以两眼的瞳距为1来计算,鼻子到两眼中心的距离为0.7到1,在附近寻找颜色较深的区
54、域,基本得到鼻孔的位置。然后在鼻孔上方一定范围内(鼻孔距离的1/2左右)找到亮度最高的点作为鼻尖。 其算法流程为: 确定眼睛区域 可能的鼻子区域找出鼻尖确定鼻孔的位置标记鼻孔 图 3-12 鼻子标记流程图标记的结果如图示:图3-13 鼻子(b zi)标记3.4 嘴的标定嘴的确认考虑到唇色和位置两重信息。对于唇色,满足如下(rxi)限制条件的位于脸的下部区域可能是嘴: (3-1) 嘴到两眼中心的距离可能为1.0到1.3左右,在满足条件的区域采用类似找眼睛的方法,区域膨胀,确定(qudng)左右嘴角和嘴的中心。其结果如图3-14示:图3-14 嘴巴标记3.5 设计结果及分析设计程序的主界面如下:图
55、 3-15 系统(xtng)主界面 单击打开图像打开一幅人脸图像,然后用上述界面进行相似度计算,图像二值化、垂直直方图、水平直方图、标记人脸区域,接着可以(ky)依次标记眼睛的位置和鼻子的位置的特征标注。 在Microsoft Windows 平台(pngti)上,利用Visual C+ + 6. 0实现了以上算法。使用此算法对多幅人脸图像进行了处理,所采用的图像都是在正常光照以及室内条件下所摄取的正面人脸图片(其相对于水平方向的旋转角度在45到135之间) , 并具有各种背景,上面的算法能成功地检测定位多张人脸图, 本设计结果的正确检测率达到90%以上。然而由于人脸拍摄的环境不同, 也给系统
56、带来了一些问题。该软件与人脸的外界光照条件、人脸的拍摄角度以及是否带眼镜有关, 易受人脸模式的多样性(如胡须、眼镜等)、图像获取过程中的不确定性(如光照的强度、光源方向等) 等因素的影响。基于肤色的人脸检测和定位算法分析:统计出一般的人脸区域中肤色像素所应占的百分比, 然后具有较高的检测成功率;利用这一百分比作为阈值对检测算法得到的候选脸区域进行验证,从而排除了肤色像素数不满足这一阈值的候选脸;采用了增强人脸特征与脸部皮肤之间对比度的方法, 以及改进的对人脸图像进行二值化处理, 减少了运算量。结论(jiln)与展望(zhnwng)通过基于肤色的人脸检测、定位等操作,可以较好地定位人脸的识别区域
57、。 文中给出了人脸分割、检测算法、关键器官定位等主要算法。经过改进二值化处理,对于全局阈值(y zh)占有很大比重的情形,可以较好地解决图像的二值化,为进一步的人脸识别奠定了基础。本设计耗时数月,最后完成了所要求的功能。总结下来,主要优点如下:界面人性化,容易操作;对用户的添加、录入、删除十分方便;在光照适当、人脸位姿恰当时,识别率可以达到100%;模块化编程,可扩充性好,以后可以添加进一步的功能。当然,系统也有它的缺点,主要是下面的两点:训练时间过长,不能动态的添加用户;鲁棒性较差,环境光照的改变会影响识别率。基于这些优缺点,今后如果要进行改进,首先解决的问题必然是鲁棒性的问题。如何将光照对
58、识别的影响减小到最少,是一个很有难度(nd)的问题。目前的去光照处理的效果并不令人满意,白平衡处理则只能对总体进行小幅度的修正,不能解决光照造成的左右不平衡的问题。当然也可以从其它角度解决这个问题,例如将摄像头和灯光结合,使得每次识别的主光源都位于正前方。其次是增加对侧面脸进行识别的功能。我们知道人类对人脸的辨认能力远远超过正面,而是可以从正面到侧面的各种角度进行辨别。如何使得计算机也能对侧面脸进行检测识别也是目前研究的一个热点。可行的方法之一是使用三维的人脸模型,当模型足够(zgu)细腻的时候,就可以模拟出人脸各个角度的图像。致谢(zh xi) 大学四年的光阴如白驹过隙,转瞬即逝。想想自己即
59、将踏出宁静而优美的校园,也许这一生的学生生活就这样结束了。不禁生起一丝悲凉之意。在这四年中我基本完成当时还是在遥远的大一时定下的目标,可以这么说我能有今天的一切,跟母校-老师们是分离不开的!在这里我深深说一句:亲爱的老师们谢谢你! 尤其是在最后的半学期里,得到了老师的热情指导,对本文的算法、编撰和定稿不吝赐教,使我看到了一个搞科学研究的学者应有的作风,为以后的我真正的走上工作岗位搞研发时应怎样处理类似的工作奠定了基础。在这还要感谢那些曾做过和我一样课题的前辈们,正是看了关于你们人脸检测与定位的专著(zhunzh)和论文后才启发了我怎样进行人脸检测、怎么样的算法才是最合理的。可以说在拿到这个课题
60、时,我可是一脸的朦胧,正是你们的著作在我做毕业设计的过程中敲打着我,时刻启迪我。谢谢你们! 致谢(zh xi)人: 2007年6月17日参考文献1 王天学,刑桂芬,江波(jin b).基于区域分割的复杂背景中的人脸检测与定位J .计算机工程与设计,2004, 11(25):1-32 王学武, 石跃祥.基于眼睛特征的人脸检测方法J .计算机应用研究,2006年,1(1):1-33 王春红,杨伯原,张洛平,张波.B超图像边缘检测算法分析及C+实现J .河南科技大学学报(自然科学版),2006, 2(27):1-34 王郑耀.数字图像的边缘检测,西安交通大学本科毕业论文D,2003年6月5 朱文(z
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安装工程综合险种2024年保险协议
- 2024跨国劳务输出协议范例
- 2024食堂运营管理承包协议条款细则
- 2024年协议执行保证金协议格式指南
- 2024届THUSSAT北京市清华大学中学高三下学期领军考试数学试题
- 保姆服务协议:老年照护专项
- 2024年专业接驳车配件订购协议格式
- DB11∕T 1650-2019 工业开发区循环化技术规范
- 2024年工程现场工长职务聘用协议
- 2024年财务总监职业协议范本
- 经期延长1课件
- 生物医学传感-生物传感器课件
- 安全警示标示牌整方案
- 三年级数学单位换算练习题
- 同仁堂-老字号的营销典范案例分析课件
- 质量员培训教程(质量标准)课件
- 护理对讲系统施工技术方案
- STCW公约马尼拉修正案(中文译稿草稿)
- 园林空间设计课件
- 医院手术室进修汇报课件
- 提灌站施工组织设计方案word版
评论
0/150
提交评论