人眼识别系统_第1页
人眼识别系统_第2页
人眼识别系统_第3页
人眼识别系统_第4页
人眼识别系统_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人眼识别系统摘要眼睛是人们获取外界信息最主要的途径,同时眼睛在一定程度上反映了包括个人心理意识在内的丰富信息。现在,眼睛所包含的这些有价值的信息引起越来越多人的研究,人眼检测的成果在现实生活中也得到广泛应用。如何快速准确地定位眼睛是研究者关注的重点。由于在自然条件下获得的图像不可避免含有的噪声,再加上光线、遮盖物、拍摄角度等,这些为人眼检测增大了难度。目前,人们已经提出了多种人眼检测的方法,例如对称变换法、霍夫变换法、特殊光源法、基于统计的方法、灰度投影法和基于模板的方法等,但是每个算法在具有自己优点同时又都有一定的局限性。在人脸定位的基础上,本文使用模版匹配方法,利用模版和测试图像的相关性,判断测试图像中人眼的位置。为了验证算法的可靠性,本文才用多种图像数据库进行测试,测试结果表明,本文算法对上述数据库中的人眼均能够实现定位,且效果良好本文采用MATLAB语言进行仿真,实验结果达到了预定目标,证明了所研究算法的有效性。关键词:人眼,定位,模式识别HumanEyeRecognitionSystemAbstractTheeyesarethemainpaththatmostpeoplegetinformationfromoutside,meanwhiletherichinformationincludingthepersonalmentalconsciousnesstoacertainextentbereflectedbyeyes.Now,thesevaluableinformationcausemorepeople'sresearch,andtheeyedetectionresultsarealsousedwidelyinreallife.Howtolocateeyesfastandaccuratlyandextractcharacteristicsoftheeyesdiscriptionisthefocusoftheresearchers.Fortheimagethatobtainedundernaturalconditionscontainnoiseinevitably,andtheinfluenceofthelight,shelter,shootingangle,alldecreasethedifficultyofeyesdetection.Atthepresenttime,Peoplehaveputforwardavarietyoftheeyedetectionmethods,suchassymmetrytransformmethod,Houghtransformmethod,speciallightsourcemethod,methodbasedonstatistic,grayscaleprojectionmethodandthemethodbasedontemplateandsoon. Onthebasisofresearchonhumaneyerecognition,wepresentedtemplatematchingmethodtorecognizeandlocatehumaneyesbycalculatingcorrelationindexbetweentemplateandtestimages. Inordertoverifythereliabilityofalgorithm,thispaperusingavarietyofimagedatabasefortesting,testresultsshowthatthisalgorithmtothedatabaseareabletorealizelocalizationofhumaneyes,andtheeffectisgood.ThispaperadoptMATLABlanguagetosimulate,experimentalresultachieved.intendedtarget,theeffectivenessofarithmeticinvestigatingwastobeproved.KeyWords:Humaneye,Recognition,PatternRecognition. 目录一绪论 一绪论眼睛是生物体上十分神奇的器官,他可以感知光线,是人们获得外界信息最主要的途径;同时,眼睛包括含心理意识在内的丰富信息。人眼识别技术最初是随着上世纪六七十年代的模式识别技术发展起来的。如今,人眼识别已经成为计算机视觉领域和模式识别领域的研究热点。1.1选题目的和意义眼睛所蕴含的丰富信息得到了国内外研究者的高度重视和密切关注,人眼识别具有广阔的应用前景。人眼识别的重要应用领域之一是身份识别。所谓生物识别技术就是将计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性和行为特征进行个人身份的鉴定,常见的有指纹识别、掌纹识别、虹膜识别、声音识别等。但是伴随科技的发展,传统的生物测定系统经常会被蒙骗,人们通过高精度的复制(例如指纹或者视网膜)就能成功蒙混过关。经研究,每个人的眼球运动方式都具有独特的个人性质,可以利用它研究出一种难以造假、简单的身份鉴别系统。当人们观察计算机屏幕上移动的图像时,这种新系统可以跟踪观察者眼球的运动。虽然图像每次移动的方式不同,但是观察者的眼球运动包含了“运动特征”。它可以显示出运动轨迹的轻微差异,这种差异是这个人独有的特点,从而能够鉴别这个人的身份。 人眼识别还可以应用于检测驾驶员是否安全驾车。据我国公安部提供的一份资料显示,在2002年一月到2002年十一月这十个月中,全国共发生二十七起重大道路交通事故。其中十九起交通事故的诱发原因是驾驶员的疲劳驾驶。驾驶员大约90%的信息是通过“看”得到的,驾驶员如果疲劳,他的精神状态不好、注意力就会不集中、应变能力不强,容易引发交通事故。由于交通事故往往是司机驾驶疲劳一段时间后发生,中外研究人员一直在寻找一种恰当的检测驾驶员在驾车过程中疲劳情况的方法。这种方法通过软硬件的配合,实时采集驾驶员驾驶过程中的数据。它采用某一特征量作为衡量驾驶员精神状态的指标,如果驾驶员疲劳系数高于设定的阈值,系统就采取包括强行停车在内的措施以提高驾车安全系数。在研究由疲劳引发的交通事故时,人们发现驾驶员由于疲劳,其生理行为在事故发生前就有了变化,研究者们依此已提出了一些具有实际意义的方法,其中由美国公路交通安全管理局(NHTSA)和联邦公路管理局(FHWA)推荐的、依据眼睛闭合时间占某特定时间的百分率判断司机驾驶疲劳程度的方法得到大家的普遍认可。在人机交互领域,通过眼睛运动进行人机交互成为研究的新热点。我们可以用眨眼作为鼠标的单击与双击的响应动作,用视线方向的变化模仿鼠标的运动,也就是通过检测眼球的运动,人可以实现对计算机的控制;而且我们也可以进一步分析瞳孔的描述数据,得出人的注视点,这样做还可以使计算机了解到使用者所关注的信息,对使用者关注的目标进行特写,更智能地表现使用者喜好的目标。索尼计算机科学实验室与东京大学合作开发的“眼球跟踪”眼镜便是这类产品的有益尝试。由此推广,人眼也作为心理测试的重要参考依据被广泛使用,测谎仪并不是通过分析被试者所说语言的逻辑关系来判断被试者说的是真话还是假话,而是要检测一个人说话时的心理反应所引起的生理指标的变化。因此“测谎”可以说是一种“心理测试”。测谎一般是从脉搏、呼吸和皮肤电阻三个方面测定一个人的生理变化,其中,皮肤电阻最敏感,是测谎的主要根据,通常情况下就是它揭示了被试者心里的秘密。我国已有不少城市把测谎仪引入到公安、司法界。2011年美国犹他州大学的科学家研发出一款新型的眼球测谎仪,通过追踪眼球运动来判断被测试人有没有说谎。研究人员表示,撒谎比讲真话要劳神费力。如果受试者想说谎,他眼球的瞳孔可能会放大,而且人的主观意识无法控制它的大小变化。因此,可以通过检测人说话时眼球瞳孔大小的变化,判断此人是否说谎。从身份识别到辅助驾驶,从人机交互到心理测试,人眼识别的成果正逐渐从实验室不如人民的正常生活,具有十分突出的应用价值,因此,研究人眼具有非常大的意义。1.2眼睛识别的应用背景与发展现状计算机视觉是21世纪里面一个富有挑战的领域,它在军事,制造业,检验,文档分析,医疗诊断,交通安全等很多领域都是不可或缺的一部分,同时随着计算机性能的不断提高和电子产品的的普及,越来越多的研究人员致力于计算机视觉领域的探索和研究;近年来人机交互以及计算机视觉的研究领域中,眼睛是一种重要的信息,眼睛区域包含了丰富的信息,包括表情、身份、性别等多种信息,眼睛检测受到了广泛的关注,眼睛的定位可以作为定位人脸图像的位置、大小和角度的依据,也是视线跟踪、眼睛状态分析以及虹膜识别的首要工作。发展接近甚至超越人类视觉的感知系统是计算机视觉主要的挑战。目前的主要研究方法是把图像信号进行分析,建模,几何处理并做出决策。众多科学家对眼睛检测进行了深入的研究,随着科学技术的发展,眼睛检测在人脸分析、疲劳驾驶、人机交互等方面的作用越来越突出,研究眼睛的检测有着十分突出的应用价值。眼睛作为人脸的重要特征,在人脸检测和识别中发挥着重要作用。眼睛的定位也是视线跟踪、眼睛状态分析以及虹膜识别的首要工作。同时,眨眼的判定可以设计成某些用户接口,或者应用在疲劳检测,动画合成等领域。许多学者对人眼的跟踪和状态识别进行了探索,这个方向也是近来机器视觉的研究热点之一。一方面来自商业或政府的应用需要,另一方面也是长期相关技术的积累加上硬件技术的成熟,使得很多原来不能实现的技术得以大量推广,很多这方面的课题己经达到了一定的高度。随着计算机技术的进步,以及越来越多的人投入到这个领域的研究,这方面的研究必将得到一步的发展。眼睛检测算法的研究从很早就开始了,已经有了比较成形的想法,但是在算法的普遍性上还存在着不足需要进一步研究。视线跟踪虽然刚刚起步,但是由于它的应用前景很有吸引力,也有很多人开始在眼睛检测的基础上进一步的研究视线跟踪,并且取得了一定的成果,在研究者的共同努力下,正朝着更好的方向发展。到目前为止,人们已经提出了很多有效的人眼检测方法,包括对称变换法、霍夫变换法、特殊光源法、基于统计的方法、基于模板的方法和灰度投影法。杜干等在2005年提出将主分量分析的对称轴检测引入到眼睛定位中。可以检测二维图形的镜像对称轴方向,结合人脸重心确定人脸对称轴的位置;最后应用山谷法确定人眼位置。实验表明,在人脸倾斜时该方法也能取得良好的效果。高永萍等在2007年提出基于几何特征的人眼精确定位新方法。利用人脸对称特性,结合肤色匹配和线性变换定位人脸对称轴,实现人眼精确定位。张志刚等在2008年提出利用改进的对称变换进行人眼定位。该方法对传统的计算公式进行了改进,采用基于面积系数的圆环邻域模板,引入了更多边缘像素的梯度信息,有效地提高了眼睛定位的精度,具有一定的实用性。吴冰等在2008年提出基于Hough变换椭圆检测的人眼睛定位方法。该方法先通过Canny算法对人脸图像进行边缘提取,然后利用提取的眼睛边缘特征进行椭圆检测.该方法定位准确,能有效的抑制噪声,但是存在对人脸图像的要求较高,计算量较大的问题。在国内外的研究中,基于统计的人眼识别研究最为深入,基于统计理论的检测方法是利用统计分析完成目标定位监测,由于其具有较高精度,越来越多的学者选用此方法对人眼及相关领域进行研究。国内对于眼睛识别的研究起步较晚,但成果颇多。史慧荣等在2004年提出一种结合眼睛位置关系的模板匹配方法。该方法将左眼模板和右眼模板进行合成,用合成的眼睛模板对图像进行匹配,有效压缩了计算量;但是用来在图像中匹配后得到多个相似眼睛点,仍需要后续处理。KuoP.等在2005年提出一种基于变形模板的改进的眼睛特征提取算法。该方法引入眼角特征提高模板拟合速度和准确率,按照预先设定的顺序存放眼睛的特征值以减少更新过程的复杂度、提高灵活性。栾柱晓等在2009年提出一种改进的人眼模板匹配算法。该方法采用了分步长模板匹配的策略,在后续的处理中根据两眼的位置特征划分出准左眼区域和准右眼区域,因此大幅度压缩了人眼定位时的计算量。孙晓玲等在2008年提出一种改进的眼睛精确定位的方法。该方法主要利用积分投影和波峰波谷法对图像进行分析,进而找出一系列的候选眼睛点,眼睛点的验证采用人脸的几何分布特征来进行。胡步发等在2006年提出基于小波变换、对称变换和自评估规则的人眼定位新方法。该方法首先采用正交小波变换,因为人脸图像中存在大面积的灰度均匀区域,而人眼图像区域灰度变化很大,所以通过该变换去除不含有人眼的大面积区域,以提高程序运行速度;然后根据人眼区域灰度变化特点,建立更加合理的对称变换眼睛模型,增强了对称变换应用于一般人脸状态眼睛定位的稳健性;最后根据人类双眼相似性以及整个眼部梯度方向信息提出了快速自评估算法,由此实现二次定位,提高了人眼定位的准确性。朱夏君等在2007年提出人脸识别中的眼睛定位的新方法:该方法人脸区域划分为小块,计算每一小块的图像复杂度并排序;然后对复杂度最大的前16个小块的位置进行眼睛准确定位;算法只能针对于简单背景下的人脸图像才有效。许多经典的用于识别人眼的统计方法都是国外研究者们发明的。MarkEveringham等在2006年提出降低由于面部识别给人眼检测带来的负面影响的方法:一是回归的方法,以直接减少预测眼睛位置的错误;二是应用一个简单的Bayesian模型;三是通过AdaBoost算法训练人眼分类器。每个方法使用相同的数据测试,Bayesian模型方法执行效果最好。Celebi.M.等在2010年提出基于复杂小波变换和人工复值神经网络的人眼状态检测算法。首先选取红色信息作为彩色图像的强度,分别获得左眼和右眼的红色图像之后,通过复杂小波变换提取眼睛的特征值;之后从提取的特征值中可以得到四个特征值统计量(最大值,最小值,平均值和标准偏差)。这些统计值作为人工神经网络的输入。测试实验使用的是十个人不同眼睛状态的图片,CVANN眼睛状态检测有6.7%的试验误差,分类结果显示10%的图像没能被正确区分人眼状态。DavidMonzo等在2010年提出用方向梯度直方图精确定位眼睛的方法:首先用通过AdaBoost算法得到的分类器预选可能的人眼位置;然后使用通过方向梯度直方图数据得到的支持向量机分类选出所有可能组合中最佳的眼睛位置。用FERET和FRGCv1数据库中数据做测试,该方法准确率很高。ShuoChen等在2011年提出使用图像色彩空间变换的人眼检测算法:这个方法包括三个步骤。首先将彩色图像从RGB空间转换到YUV空间,提取图像U彩色图像分量,将获得的图像二值化并通过投影确定人眼边缘;然后通过两次色彩空间变换找到位于眼睛轮廓内的眼球中心;最后,为进一步改善人眼检测的准确性,应用先验知识对眼球中心进行调整。该方法检测速度快,准确率比较高。除了这些算法外还有很多各具特色的人眼识别算法,但是每个算法都有自己的优点同时又都有一定的局限性,例如运算量太大、程序执行效率低、检测准确率不高或在现有软硬件情况下算法不容易实现等。由于拍摄图像时光照、拍摄时摄像机与人的位置关系等因素的影响,采集到的图像具有多样性,一个算法很难面面俱到,现在国内外研究者得工作就是尽可能的提高算法的性能,在实际应用中,具体情况具体分析。1.3本论文的主要工作与文章结构本文基于前人的研究,实现一种基于模版匹配方法的人眼定位识别算法。本文的文章结构概括如下:第一章介绍本文的研究意义和背景。第二章主要阐述目前世界上流行的人眼识别算法。第三章人眼定位算法设计与实验。第四章实验结果分析。第五章分析了人眼识别的难点以及以后的研究重点。最后是本文的参考文献。二常光源下的人眼定位识别 常光源下的人眼定位识别主要是指在通常的光源下,如自然光、普通人早光源等,对人脸中的人眼进行定位检测。由于成本低,取材方便,常光源的人眼定位成为人眼研究的主要探索领域,同时也为特种光源下的人脸、人眼检测提供了基本的检测方法和数据参考。2.1基于统计的方法基于统计的方法一般是通过对大量目标样本和非目标样本进行训练学习得到一组模型参数,然后基于模型构建分类器或者滤波器来检测目标。在过去的一段时间中,基于统计的方法被广泛应用于人脸检测与识别技术中,通过训练大量的人脸和非人脸样本建立分类器,在输入图像中分类出人脸图像。实践表明这种方法具有较高的准确度,近年来随着人眼检测研究的不断发展,基于统计的方法也越来越多地得到了应用。神经网络在基于统计的研究方法中占有较大的比重,它也逐渐被应用于眼睛检测中。早期Reinders等人采用神经网络和眼睛的微特性来定位人脸部特征。该算法将搜索窗口的像素作为神经网络的输入,如果该窗口包含眼睛图像,则神经网络的输出较大。武妍等提出了一种基于灰度信息和瞳孔滤波器的方法。首先在图像中检测人脸区域从而得到人眼检测框;然后通过对投影直方图的分析进行人眼粗检测,找到人眼候选点后利用BP神经网构造的瞳孔滤波器进行精确的定位。文中指出人的眼睛大小各异,但是瞳孔的大小相差不是很大。文献通过Adaboost算法进行人脸检测。实验统计,Adaboost检测器输出的图像统一到80*80大小后,瞳孔基本上是5*5的大小,因此设定神经网络的结构为:输入层为25个节点,输入值与5*5输入图像的每个像素值一一对应;隐层取经验值9个节点;输出层为1个节点;输出值越接近1则表明与瞳孔越相近,反之越靠近0表明与瞳孔的差别越大。输入层与隐层全连接,隐层与输出层全连接。训练好的神经网络作为瞳孔滤波器来精确定位眼睛。石华伟提出了一种基于MeanShift算法和粒子滤波器的人眼跟踪算法。该算法中采用MeanShift搜索后,粒子被集中在测量模型中,只考虑权值较大的粒子,用少量样本就可以维持样本的多样性,节省了大量的计算时间。粒子滤波器来源于PerfectMonteCarlo(PMC)仿真,一般用于复杂环境下的目标跟踪等。通过MeanShift迭代运算,在当前帧中搜索与目标模板亮度分布最相近的潜在目标;在得到样本观测值后,将MeanShift分析用于每一个粒子。在通过MeanShift迭代之后,所有的粒子被集中到观测向量的局部区域内,粒子在集中的过程中会获得大的权值,这样就很好地克服了退化现象。该算法中不需要大量的样本来维持样本多样性,因为采用MeanShift分析之后,样本会自动集中于其邻近的局部最大值区域。支持向量机(SupportVectorMachines,SVM)在过去的眼睛检测研究中也占有重要的地位。SVM是由Vanpik领导的AT&TBell实验室研究小组在1963年提出的一种分类技术它是一种基于统计学习理论的模式识别方法,主要应用于模式识别领域。其核心思想是:对于输入空间中非线性可分的情形,选择一个适当的非线性映射,将输入空间中的样本点映射到一个高维的特征空间,使对应的样本点在该特征空间中是线性可分的。从一定程度来讲,它要优于神经网络。早期的研究中,Huang等人利用SVM的方法得到了人脸姿态和人眼位置。LiDiHua提出了一个二级的SVM系统,先用线性核心的SVM筛选出候选点,再用多项式核心的SVM作最终判定,实践证明他们的系统对眼睛、嘴巴等脸部特征的定位成功率达到96%以上。PANGang使用方形扫描窗口,将眉毛与眼睛作为一个整体定位对象,减少了眉毛对定位的干扰。WangQiong首先利用眼睛的结构在图像中寻找候选眼睛对,然后再利用支持向量机来定位眼睛对,最后利用方差滤波器在候选区域中检测眼睛。唐旭晟等人采用基于改进的Adaboost算法的级联式人脸和人眼分类器检测人脸和眼睛的候选位置,再用SVM分类器验证并确定人眼的最佳位置。由于人脸检测器采用包含灰度信息的类Harris小波作为分类特征,对像素变化较为敏感,常把眉毛、深色眼睛框等区域误判为眼睛。因此根据人脸几何特征模型,文中提出了13个用于区分人眼对的几何分类特征,训练SVM分类器作进一步的验证;两种不同类型分类器级联输出才作为最后的眼睛输出。实践证明,该算法检测精度较高,对于正面图像或者旋转较少的人脸图像有着较高的检测率。目前困扰SVM方法的主要问题是当计算复杂度高、训练样本个数较大时,会得到大量的支持向量,使分类器的计算量过大。基于统计的方法实施目标检测,在检测的精确度上无疑有着很大的提高,但是它需要采集大量的样本来训练分类器,过程比较复杂。这是制约此类方法的最大问题。2.2基于知识的方法基于知识的方法也被称之为基于规则的方法。其指导思想是确定图像的应用环境,总结特定条件下可用于人眼检测的知识(如轮廓信息、色彩信息、位置信息)等,把它们归纳成指导人眼检测的规则。ZhangLiMing先用直方图阈值法将图像二值化,根据其中黑色区域的面积、形状和相对位置等几何特征确定瞳孔位置;最后通过边缘跟踪依次找到上眼眶、眼角和下眼眶。范红深提出了一种类似的方法,它们将图像二值化后,计算出黑色区域的有效面积、质心、外接矩形、圆性质等几何特征,依据经验标准筛去一部分黑色区域,并将余下的区域作配对筛选,从而得到双眼位置。此算法简单易行,但容易受到光照和噪声的影响。Kumar等人在实施人眼检测的过程中首先利用了大量有关于肤色和眼睛区域亮度的先验知识,设定了多个阈值来分离皮肤及眼睛区域;然后再利用均值投影函数和方差投影函数来实施最后的定位。由于采用了大量的先验知识,使得该方法的通用性受到了限制,尤其对于脸部肤色较深的个体,准确率不高。此类方法与前述基于几何模板的方法有很大区别,虽然都利用到一些人眼的几何性质,但前者利用表现出来的几何性质建立了通用性更好的模板来实施匹配,而基于知识的方法则是直接利用这些几何性质实施检测,通用性要差一些。目前,由于先验知识有很大的局限性,单独用来进行人眼检测的研究已经不多,更多的是用来作为约束条件辅助检测。基于对称变换的人眼定位识别方法属于基于知识的人眼检测范畴。基于对称变换的人脸图像眼睛定位方法是一种利用图像灰度分布的特性,从计算对称值的角度出发,利用梯度对称变换,得到梯度图,最终实现自动定位人脸图像中眼睛的算法。对称变换是基于梯度图的局部算子,记,为图像上的任意两点,它的连线与水平线的逆时针夹角为,其取值范围为。以点为连线中心的对称点集合为:(1)和处在以为中心,为半径的一个圆形区域内,定义电的对称强度为:(2)其中距离因子,方向因子分别为:(3)(4)其中,为瞳孔半径。此方法是测试两瞳孔的对称强度,以对称强度大小来定位一对眼睛的位置,但眼球常因为转动可能被眼帘遮挡,所以此方法满足不了对多姿态的要求,而且在戴眼镜的情况下,因为两镜片不同程度的反光,效果也不尽如人意。2.3基于模版匹配的方法2.3.1模版匹配法原理 在机器识别过程中模板是为了检测某些区域特征而设计的数据阵列,模板匹配技术是利用某种算法将已知的模板和待识别图像进行匹配计算,获得图像中是否含有该模板的信息。模板匹配基本原理是在图像的搜索区内逐点平移参考模板图像,遍历搜索区内的每一个位置点,同时根据某个相似性原则,计算搜索区内该位置点的图像区域和参考模板的相关值,然后根据相关值的大小来判定匹配情况。基本算法:图像T(M×N个像素)为模板,图像S(W×H个像素)为待搜索图像。将模板T叠放在需要图像S上,模板覆盖的图像S的那块区域叫做子图。,为子图左上角在图像S上的坐标。搜索范围是:横坐标到原图像的宽度减去匹配图的宽度,纵坐标到原图像高度减去匹配图的高度。 图2.1被搜索图S(W×H)个像素图2.2模板T(M×N)个像素我们通常利用以下两种方式衡量模板和它覆盖区域的相似程度: (5)(6)将公式(1)展开,可得到: (7)公式(3)中第一项为被模板覆盖的子图的能量,第二项为模板T(m,n)的能量,这两项只与模板和图像本身有关。第三项是和模板覆盖下的子图像、模板都有关的函数,它随(i,j)变化而迅速改变。依据数学不等式原理(,当且仅当a=b时等号成立),模板和子图匹配时,该项有最大值。因此可以用下列相关函数来反应匹配程度:(8)经过归一化后可以得到:(9)模板在子图上平移,在移动的过程中,计算模板和子图的相关系数,如果模板和子图完全匹配则相关系数R(i,j)=1。我们可以用模板搜索全部图像S后,找出最大的相关系数R(i,j),最大相关系数对应的子图即为最佳匹配目标。显然,程序需要进行大量的循环计算,程序执行效率低。而且实验证明,被搜索的图像越大,匹配的速度越慢。应用模板匹配方法定位眼睛窗口首先要得到左眼模板和右眼模板,模板可以从人脸库中进行选取也可以依据眼睛参数自行构造,然后分别用两个眼睛模板在图像中动态搜索,得到两个匹配度最大的区域作为眼睛的位置。这种方法使用方便,但定位时需要对图像进行两次扫描,通过计算模板和检测区域的相似程度,以相似程度最接近的位置作为目标的位置来定位左眼与右眼,计算量较大,处理时间较长,不能同时定位两个眼睛,而且成功与否与初始模板的设定有很大关系;如果待检测人脸旋转了一定角度,使用常见的水平人眼模板去检测,就很可能会导致人眼模板匹配失败,得不到理想的定位结果。在经过几十年研究后,研究者们将模版匹配法大致分为灰度投影模版和几何特征模版两种定位方法,下面分别对两种方法进行介绍。2.3.2灰度投影模版 灰度投影法是指对人脸灰度图像进行水平和垂直方向的投影,分别统计出两个方向上的灰度值和或灰度函数值和,找出特定的变化点;然后根据先验知识将不同方向上的变化点位置相结合,即得到人眼的位置。也有人利用水平和竖直两个方向上的梯度信息来代替原始灰度值,以减小光照条件的影响。当前基于灰度投影算法来定位眼睛的方法已经得到了较为广泛的应用,且算法得到了很大改进和完善。最常用的投影函数是积分投影函数,可以通过对积分投影函数值的分析提取图像中的特征。K.Sobottka等人和Dieckmann等人在早期的研究中提出直接采用水平和垂直方向投影来定位眼睛。其研究表明单纯依据灰度投影来定位眼睛虽然定位速度快,但波峰波谷的分布对于不同人脸和姿态变化非常敏感;另外,投影图中干扰噪声太大、曲线不规则,很难在此基础上直接找到特征点,只能大致地找到眼睛区域,不能实现精确定位,很难满足研究需要。因此把灰度投影与其他算法结合起来进行眼睛检测成为新的研究选择。章玲采用了混合投影函数。耿新在积分投影函数(IntegraProjectionFunction,IPF)和方差投影函数(VarianceproJectionFunction,VPF)的基础上提出了一种混合投影函数(HybridProjectionFunction,HPF)。该函数综合考虑了图像中在某个方向上的均值和方差,既能反映不同的图像灰度,又能反映不同的灰度变化率。章玲则提出了一种微分与积分投影相结合的眼睛定位方法,在传统积分投影的基础上,提出了一种微分投影算法与之相结合。考虑到人脸水平方向上灰度变化较大,在灰度变化突变处进行微分,将产生高值,将其绝对值累加,则灰度变化越大的那一行,累积值越大。Thilakkr采用了类似的均值投影函数(MeanProjectionFunction,MPF)和方差投影函数相结合的方法。采用混合投影函数的方法受噪声的干扰较大,很难得到规整的曲线,并没有从根本上解决传统投影算法的弊端。Zhou等人对应用于人眼检测的IPF、VPF以及HPF进行了总结并做了大量的实验,发现三种函数都能够实现眼睛的检测,但是相比较而言,HPF要优于VPF,而VPF要优于IPF。张杰提出了一种利用积分投影和Hough变换的快速定位人眼的方法。对图像进行预处理后,首先在灰度图中对原始图像在水平和垂直方向上分别进行灰度积分投影,根据积分投影图的凹凸大致确定双眼的位置,即人眼粗定位;然后对图像进行边缘提取,并将边缘图像二值化,用Hough变换的圆检测方法对二值化图像进行圆检测,从而确定双眼的精确位置。类似的还有利用Hough变换在眼睛区域中实施半圆检测的方法。Resselm也提出了一种类似的方法。首先用小灰度值聚类法初步定位虹膜中心,并用Canny算子进行边缘提取;然后,基于Hough变换精确定位瞳孔中心。由于Hough变换对边界的要求较高,眼球受到眼睑以及眼睫毛等的干扰较大,眼睛较小的人脸很难在图像中清晰地进行边缘提取,另外Hough变换本身的算法也较复杂,因而这种方法很难得到广泛的应用。许慰玲等人对上述方法进行了改进。首先,利用一种改进的小灰度值聚类算法进行虹膜中心的初步定位;然后进行基于虹膜正圆几何特性的瞳孔中心定位,有效地克服了眼睑与眼白交界处小灰度值像素的干扰以及采用Hough变换所造成的检测不准确等问题。此外,针对灰度图像中边缘检测的不准确性,曹倩霞提出了一种新的虹膜检测算法。这种方法利用眼睛图像饱和度信息和亮度信息作为阈值分割判据来分割出虹膜区域,再用Hough变换进行虹膜检测。相比于灰度边缘检测,其检测率大大提高,且能适应一些人脸姿势的变化和眼睛凝视方向的变化。但是此法在非均匀光照情况下检测率不高。另外,Lin.K.H所提及的山谷法以及尹方平所提及的谷算子也是利用了灰度投影的方法。以上列举了一些比较典型的基于投影的检测眼睛的方法,对于背景较为简单、脸部特征比较规整的图像,能够有效地检测到眼睛。但是要准确定位眼睛位置,还要采取一定的辅助方法来去除干扰,如眉毛、睫毛、眼镜等。2.3.3几何特征模版 眼睛在人脸中具有较为明显的个体特征以及分布特征。对于大多数人来说,眼睛的位置以及两眼之间的距离相对于人脸而言是一个相关常数。另外,双眼的对称性、眼睛与其他脸部特征的相对位置以及眼球的形状等都可以作为依据用来实施人眼检测。A.L.Yuille等人在早期的研究中提出了一种二维可变形模板法,用两条抛物线和一个球形表示眼睛。该模板的初始位置对定位结果有很大影响,而且能量函数优化过程收敛缓慢、耗时长,能量函数中各种权值通过经验设定,难以保证最优。后来X.Xie等人又提出了改进的眼睛可变形模板。他们提出了一种新的边缘检测算法找到眼睛的四个边缘点(左右眼角及瞳孔与上下眼眶的交点),依此为依据确定模板的初始参数。实验表明,他们的模型在准确率上有了较大提高,但仍然难以克服算法复杂、检测速度慢的缺点;另外仅对正面或近似正面人脸图像中的眼睛和嘴巴等外形比较规则的器官特征提取效果较好。在此基础上,黄万军提出了一种基于三维可变形模板的眼睛特征提取算法,利用人脸姿态估计策略来估测人脸的垂直旋转方向,然后利用三维可变形模板匹配技术来提取眼睛的精确特征。此方法很好地照顾了非正面人脸图像的眼睛检测,且可运用于脸部其他器官的检测。但由于眼睛的个体差异性,所建立的模板很难满足不同人眼的需求。对称性分析是图像处理和计算机视觉的重要内容,其核心是检测目标的对称轴。正面人脸图像具有很强的轴对称性,因此可以利用对称性进行人脸人眼检测。卢春雨提出了利用主分量分析法进行对称性检测的新方法,将对称轴方向求解转换为协方差矩阵的特征值分解问题。实践证明该方法对轴对称的复杂图像效果较理想。杜干把这种对称轴检测方法引入到眼睛检测中,给出了人脸对称轴的确定方法,并基于此提出了一种人眼定位的快速算法。在检测到人脸对称轴的基础上再利用山谷法确定眼睛候选点,但这种方法局限于人脸正面图像,通用性不是很好。考虑到眼部区域的特殊性,宋加涛等人提出了一系列的约束机制来辅助进行眼睛的精确定位,所用的约束机制主要有:a)位置约束。两眼球不过于靠近图像边界。b)几何关系约束。两眼球中心之间的水平距离约占人脸宽度的四分之一到二分之一,人脸在平面内的旋转不超过正负30°。c)尺寸约束。眼球的面积界于一定范围之内,眼球的直径不大于某一值,如人脸图像宽度的1/15。d)形状约束。眼球的外接矩形尽可能接近正方形。e)饱和度约束。眼球的面积与其外接矩形的面积之比大于某一阈值。综上所述,基于几何特征来检测眼睛的方法利用了大量的先验知识,这通常会导致检测方法的通用性不是很三人眼定位识别算法设计与实验通过阅读大量文献并参考相关数据,本文采用模版匹配法中的几何特征模版实现人眼的定位识别。利用模板方法主要有传统模板和左右眼合成模板的方法。传统模板需要分别利用左眼模板和右眼模板,对搜索区域进行模板匹配,对匹配度大于阈值的块可以认为是眼睛。该方法需要确定眼睛初始位置,计算量较大。左右眼合成模板,首先将左眼模板和右眼模板求和平均得到合成的眼睛模板,这样可以提高眼睛模板的鲁棒性,降低它对左右眼的敏感性;利用合成模在图像中匹配,获得一个眼睛点的备选集合。此方法操作简便,计算量比传统模板匹配方法少一倍,能够获得较高的定位准确率和较快的定位速度,同时对于戴眼镜,头部姿态变化,光照变化以及焦距变化具有一定的鲁棒性。3.1算法流程设计本文采用模版匹配方法识别人眼,通过计算模版与测试图像的相关性,确定模版与测试中相匹配的位置。本算法主要通过四个步骤对人眼进行定位识别。首先同时读入模版图像和测试人脸图像,其中,测试图像为已经过图像矫正,ROI提取、灰度归一化、直方图均衡的人脸图像,该图像均来自自采人脸数据库。人眼模版从人脸数据库外的人脸图像中提取,目的在于测试算法的鲁棒性。在模版和测试图像均读取成功后,分别获取两张图像的参数,包括尺寸,灰度值,以及图像均值,作为下一步的计算参考。利用模版图像的灰度值和均值,对测试人脸图像的像素进行遍历,根据遍历中两者的相关系数判断测试图像中与模版灰度值相匹配的区域。根据已经获得的匹配区域,判断是否在测试图像中处于合理位置,即是否与人眼大致位置相符,如果相符,则在测试图像上将该区域用标识框绘出。算法具体流程如图3.1所示:图3.1算法流程设计框图3.2人眼模版的预处理由于受光照等客观条件的影响,实际应用中要面对的人眼图像是千差万别的。为了减少这种差别,使人眼的模式空间更加紧凑,需要对人眼样本适当的预处理。人眼的特征并不是很多,尤其在15x30这么小的图像上,不宜做太多的预处理,因为预处理太多会丢掉部分有用信息,所以本文对每一个人眼与非人眼样本只做了灰度化和直方图均衡,以克服部分光照带来的影响。直方图均衡化通过使用累积函数对灰度值进行调整,以实现对比度的增强。其中心思想是把原始图像的灰度直方图从比较集中的某个灰度区间,变成在全部灰度范围内均匀分布,也就是对图像进行非线性拉伸,重新分配图像的像元值,使一定灰度范围内的像元数量大致相同,即把给定图像的直方图分布改变成均匀分布直方图分布。因此这种方法对较亮和较暗环境下得到的眼睛都有一定的效果。图3.2显示了同一只眼睛在暗光和亮光条件下经过直方图均衡前后的比较结果:(a)强光下人眼(b)弱光下人眼(c)强光下直方图均衡结果(d)弱光下直方图均衡结果图3.2单只人眼进行直方图均衡前后比较3.3人脸数据库本文的算法使用三个人脸测试集作为测试图像。第一个人脸数据集为为网络开源人脸图像aberdeen中的100幅正面人脸图像,该数据集中图像属于无背景头肩部图像。图3.3所示:图3.3开源人脸图像数据集第二个人脸数据集为ORL人脸数据库。该数据库中有40人,每人10张人脸图像,共400个人脸图像。该数据库被广泛用于模式识别领域,包括人脸及面部器官的定位与检测。数据库中采集图像的角度以及人的表情各不相同,如图3.4,3.5所示:图3.4ORL数据库中男性人脸图像图3.5ORL数据库中女性人脸图像本文使用的第三个人脸数据集为北京航天航空大学IRIP实验室自采人脸图像。该数据集包含200人,每人30张人脸图像。由于采集设备及环境限制,该数据集图像包含一定冗余信息,对人眼的定位识别结果造成影响。为了最大限度避免采集图像的冗余干扰最终的识别结果,本文对该数据库中图像进行了几何归一化,灰度归一化,以及ROI提取,目的在于最大限度的反映出图像中的人脸信息,过滤掉原始图像的冗余,然后通过图像矫正、剪切和缩放操作,使得所有人脸图像的两眼连线水平,眼距固定,图像所放到标准大小。处理后的图像如图3.6,3.7所示:图3.6北京航天航空大学IRIP实验室人脸图像集——男性图3.7北京航天航空大学IRIP实验室人脸图像集——女性采集后的图像分为彩色图和灰度图,用于验证本文算法的可行性。3.4人眼定位与识别为了验证本文算法的鲁棒性,首先使用冗余信息较多的实验室自采图像进行测试。依据算法设计流程(见图3.1),本节分四个步骤对人眼的定位识别进行讲解,并附代码作为参考。3.4.1读取人眼模版和人脸测试图像本文从自采人脸数据库中随机选取一名男性和一名女性的人脸图像作为测试图,并从其余人脸图像中随机选取一人的眼睛部位图像作为匹配模版,如图3.8所示:(a)人眼模版图像(b)男性人脸图像 (c)女性人脸图像图3.8人眼模版与测试人脸图像参考代码如下:%读取模版图像im1=imread('template.jpg');%读取人脸测试图像im2=imread(TestImage.jpg');3.4.2获得图像相关参数(1)判断输入图像格式并进行转化由于模版图像和测试图像来自不同个体,且为了防止使用其他数据库时存在彩色人脸图像影响识别结果的情况,本文首先对读取的图像进行判断是否属于彩色图像,如果属于彩色图像,则转化为二维灰度图像。在本实验中,由于输入图像已经是二维灰度图像,因此此步骤不改变输入结果。参考代码如下:%如果输入图像是彩色图像,则转换为二维图像ifsize(im1,3)==3image1=rgb2gray(im1);endifsize(im2,3)==3image2=rgb2gray(im2);End(2)通过图像尺寸判断其类型由于模版和人脸图像的尺寸已经经过归一化,因此通过获得两张图片的尺寸可以判断出哪张图片可作为模版,哪张可作为人脸图像,由此可进一步获得模版的均值,作为下一步实验的参考。%通过图片的尺寸判断哪张是测试图片,哪张是模版图像ifsize(image1)>size(image2)Target=image1;Template=image2;elseTarget=image2;Template=image1;End(3)记录图像参数之后将两种图像的尺寸分别封装在两个变量中,与模版图像的灰度均值一起作为下一步定位的基础参数%获得两幅图片的尺寸[r1,c1]=size(Target);[r2,c2]=size(Template);%计算模版图像的均值image22=Template-mean(mean(Template));3.4.3计算两幅图像的相关性本算法利用模版的灰度值对测试图像进行遍历,对与模版大小相同的区域进行匹配,匹配依据建立在相关性基础之上,从而可以得出与模版相似的区域,参考代码如下:%计算两幅图像的相关性M=[];%相关系数矩阵fori=1:(r1-r2+1)%横向遍历forj=1:(c1-c2+1)%纵向遍历Nimage=Target(i:i+r2-1,j:j+c2-1);%选取匹配区域 Nimage=Nimage-mean(mean(Nimage)); corr=sum(sum(Nimage.*image22));%构造协方差矩阵 warningoffM(i,j)=corr/(sqrt(sum(sum(Nimage.^2)))*sqrt(sum(sum(image22.^2))));%计算均方差的积endend3.4.4标识出人眼定位区域在获得了人眼定位的区域后,在人脸测试图像上判断目标位置,将该区域用白色矩形框标识出来。参考代码如下:[r1,c1]=size(Target);[r2,c2]=size(Template);(1)提取匹配区域坐标首先,将存有相关系数的矩阵中每一列的最大值提取出来,构成一个一维矩阵,计算出每个值在测试图中所代表的坐标。[r,c]=max(M);%选取每一列的最大值,构造一维矩阵[r3,c3]=max(max(M));%选取矩阵中的最大值%确定最大值点的坐标i=c(c3);%确定行数j=c3;%确定列数result=Target;(2)绘制匹配区域在确定坐标之后,开始绘制匹配区域。%绘制矩形框上方的横线forx=i:i+r2-1fory=jresult(x,y)=255;%矩形框颜色设为白色endend%绘制矩形框下方的横线forx=i:i+r2-1fory=j+c2-1result(x,y)=255;endend%绘制矩形框左边的竖线forx=ifory=j:j+c2-1result(x,y)=255;endend%绘制矩形框右侧的竖线forx=i+r2-1fory=j:j+c2-1result(x,y)=255;endend%定位完毕四实验结果分析4.1定位结果比较(1)基于北京航天航空大学IRIP实验室自采图像的测试利用相同模版图像,对北京航天航空大学IRIP实验室自采图像中的女性的人脸图像进行测试。模版图像及测试人脸图像如图4.1(a),(b)所示:(a)(b)图4.1北京航天航空大学IRIP实验室自采图像算法测试——女性测试结果如图4.2所示:图4.2女性人脸眼睛定位结果选择数据库中男性人脸图像测试,模版和测试人脸图像如图4.3(a),(b)所示:(a)(b)图4.3北京航天航空大学IRIP实验室自采图像算法测试——男性测试结果如图4.4所示:图4.4男性人脸眼睛定位结果(2)基于ORL数据库测试结果输入模版图像和测试人脸图像如图4.5(a),(b)所示:(a)(b)图4.5ORL人脸图像算法测试算法定位结果如图4.6所示:图4.6ORL数据库人眼定位结果(3)基于网络开源人脸数据库的测试结果输入模版和测试图像如图4.7(a),(b)所示:(a)(b)图4.7网络开源数据库算法测试人眼定位结果如图4.8所示:图4.8网络开源人脸图像测试结果4.2实验结果分析 本文在Matlab平台上进行试验,采用ORL人脸数据库(40人,400张图像),网络开源数据库(100人,1000张图像),实验室自采人脸数据库(200人,3000张图像)对提出的算法进行测试。可以看出,在大部分情况下,本文所实现的算法对三个数据库中的任意图片具有较好的识别效果,验证了利用灰度值计算模版与测试图片的相关系数作为模版匹配的基本方法是可行有效的。然而,在模版图像眼睛轮廓与测试图像差别过大,或者模版中有头发、眉毛等其他非人眼成分时,识别结果不尽如人意。图4.9,4.10为识别失败的范例,主要原因是人眼模版选择与测试图像的人眼区域相关性过低导致:(a)人眼模版图像和测试人脸图像(b)人眼识别结果图4.9人眼定位识别失败范例1(a)人眼模版图像和测试人脸图像(b)人眼识别结果图4.10人眼定位识别失败范例2五总结与展望随着科学技术和社会经济的发展,越来越多的智能化技术将会得到推广应用。特别是以计算机视觉为代表的高科技高智能化领域,研究内容丰富,越来越多的研究成果被人们所使用。作为计算视觉的一个重要研究方向,人眼识别技术得到了长足的发展,具有广阔的应用前景。本文通过对人眼跟踪及视线检测,实现人眼交互,为以后进一步的开发及应用打下基础。人眼检测最初是随人脸识别而提出的,现在人眼所包含的信息得到越来越多的关注,人眼检测的成果也得到了广泛应用。本论文所做的工作:(1)介绍研究人眼检测的意义以及常见的人眼检测算法。(2)通过将相关系数和模板匹配结合的方法,搜寻出人眼窗口所在的位置。 本文的算法经过Matlab平台进行测试,通过对三种数据库中任意人脸图像的测试,验证了本文算法的精确性和鲁棒性。综合分析当前国内外的人眼检测技术,结合笔者在研究过程中的问题,探讨一下当前制约人眼检测技术发展的主要因素以及其发展的趋势。a)依赖于人脸检测技术的发展。由于眼睛区域在整幅图像中的面积较小,直接在图像中实施眼睛检测会因为目标过小致使精度不高。目前多数的眼睛检测研究都是建立在成功实施人脸检测的基础上,人脸检测效果的好坏直接影响眼睛检测的准确与否。b)眉毛、头发、眼睫毛、鼻孔等脸部特征与瞳孔的色彩相近,如何有效区分眼睛与这些区域成为了制约眼睛检测发展的重要问题。c)当前研究针对正面人脸图像比较多,在人脸出现偏移和旋转时检测精度不高。因为此时图像中人眼的部分信息会发生变化,很难鲁棒地检测眼睛。d)大多数研究没有考虑配戴眼镜的影响。尤其利用色彩信息进行检测时,眼镜对眼部区域的亮度有明显影响,眼镜边缘也会造成干扰,且配戴眼镜后,瞳孔等区域会变得不清晰。e)图像中眼睛的大小不一也给检测带来了难度。对于较大且轮廓较清晰的眼睛检测起来比较方便,且检测精度较高;对于较小的眼睛,由于受到的干扰较多且特征不明显,很难找到一种有效的方法实施检测。f)对图像中有遮挡物的情形没有很好的应对策略,这也是制约人眼检测的一大难题。g)多数研究都是针对分辨率高、噪声小、质量较高的图像实施检测,对质量较差的图片往往难以实现有效的检测。而在实际应用中并不能保证每一幅目标图像都足够清晰。h)目前的人眼检测研究包括人脸检测,均会受到人种肤色的制约,并不能够很好地适应不同肤色的人种。这是制约这项研究国际化的一个重大瓶颈。本文的人眼跟踪方法虽然具有很好的时效性,但仍然有不少地方需要改进。人脸特征的检测受到光照、复杂背景、大幅度人脸转动等影响,我们分析的只是简单背景下且没有大幅度人脸转动的情况,对人眼的跟踪也是简单的跟踪。参考文献[1]邓肯.格雷厄姆-罗.眼球跟踪:身份识别新技术[J].科技创业,2010,(12):25.[2]李江泓.七成重大事故源于超载和疲劳驾驶[N].中国安全生产报,2002-12-7.[3]R.Barea,L.Boquete,S.Ortega,E.López,etal.EOG-basedeyemovementscodificationforhumancomputerinteraction[J].ExpertSystemswithApplications,2012,39(3):2677-2683.[4]K.Abe,S.Ohi,M.Ohyama.AnEye-gazeInputSystembasedontheLimbusTrackingMethodbyImageAnalysisforSeriouslyPhysicallyHandicappedPeople[J].AdjunctProc.,2002:185-186.[5]许俏文.眼睛不会说谎[N].广州日报,2011-01-09(B1).[6]Forsyth,D.A.andPonce,J.Computervision:AModernApproach[M].PrenticeHallProfessionalTechnicalReference,2002.[7]ZhouZ.H,GengX.Projectionfunctionsforeyedetection[J].PatternRecognition.2004,37(5):1049~1056.[8]RizonM,KawaguchiT.Automaticeyedetectionusingintensityandedgeinformation.Proceedings[J].IEEETENCON.2000,2:415~420[9]徐艳,陈孝威.人脸检测中的眼睛定位算法研究[J].计算机与信息技术.2006,9:24~28.[10]Xinghuas,GuoyongC,ChunxiaZetal.GazeEstimationofHumanEye[C].6thInternationalConferenceonITSTelecommunicationsProceedings,2006:310-313.[11]KazuhiroTskeshita,AkihikoUchibori,YoshikiMizukami.ACommunicationsystemforALSpatientsusingeyeblinkInternationalJournalofAppliedElectromagneticsandMechanics2003[C],18:1~3[12]ArneJohnGlenstrupandTheoEngell-Nielsen,“EyeControlledMedia:PresentandFutureState”,ThesisofBachelorinInformaitonPsychology[C],PsychologicalLaboratory,UniversityofCopenhagen,Denmark,1995.[13]Graumank,BetkeM,GipsJetal.Communicationviaeyeblinksdetectionanddurationanalysisinrealtime[J].IEEEComputerSocietyConferenceonComputerVisionandPatternRecognition,2001,1010~1017.[14]OpenCV中文网站.人脸检测.http:///index.php/%E9%A6%96%E9%A1%B5[15]FrobaB,ErnstA.FastFrontal-ViewFaceDetectionUsingaMulti-pathDecisionTree[J].InProceedingsofAudioandVideobasedBiometricPersonAuthentication,2003:921-928.[16]LiSZ,ZhuL,ZhangZQ,ZhangHJ.Learningtodetectmulti-viewfacesinreal-time[Z].WashingtonDC:ProceedingofInternationalConferenceonDevelopmentandLearning,2002.[17]王海涛.基于灰度的人脸检测系统[M].北京:电子工业出版社,2004.[18]ShenLansun.EyeLocationusinggabortransform[J].measurementandcontroltechnology,2006,25(6):27~29.[19]叶剑波.基于卡尔曼粒子滤波器的人眼跟踪[J].计算机工程.2006[20]DoucetA.OnSequentialSimulationMonteCarloSamplingMethodsforBayessianFiltering[J].StaticsandComputing,2000,10(3):197-208.[21]刘党辉,沈兰荪,LAMKM.人脸检测研究进展[J].计算机工程与应用,2003,39(28):5-9,21.[22]REINDERSMJT,KOCHRWC,GERBRANDSJJ.Locationfacialfeaturesinimagesequencesusingneuralnetworks[C].Procofthe2ndInternationalConferenceonAutomaticFaceandGestureRecognition.LosAlamitos:IEEECSPress,1996:230-235.[23]武妍,杨洋,王丽萍.基于灰度信息和瞳孔滤波器的人眼定位算法[J].计算机工程与应用,2005,41(33):45-47.[24]VOILAP,JONESM.Rapidobjectdetectionusingaboostedcascadeofsimplefeatures[C].ProcofIEEEConferenceonComputerVisionandPatternRecognition.Kaua,Hawaii,2001:511-518.[25]石华伟,夏利民.基于MeanShift算法和粒子滤波器的人眼跟踪[J].计算机工程与应用,2006,42(19):26-28.[26]HUANGJ,LID,SHAOX,etal.Posediscriminationandeyedetectionusingsupportvectormachines[C].ProcofNATO-ASIonFaceRecognition:fromTheorytoApplications.1998:528-536.[27]LID-ihua,PODOLAKIT,LEESW.Facialcomponentextractionandfacerecognitionwithsupportvectormachines[C].ProcofAutomaticFaceandGestureRecognition.2002:76-81.[28]PANGang,LINWeixun,WUZhao-hu,etal.AneyedetectionsystembasedonSVMfilter[C].ProcofElectronicImagingandMult-imediaTechnology.2002:326-331.[29]WANGQiong,YANGJing-yu.Eyedetectioninfacialimageswithunconstrainedbackground[J].JournalofPatternRecognitionResearch,2006(1):55-62.[30]唐旭晟,欧宗瑛,苏铁明,等.复杂背景下人眼的快速定位[J].计算机辅助设计与图形学学报,2006,18(10):1535-1540.致谢经过将近一个学期的努力,终于如期完成了本次毕业设计。首先我要感谢我的毕设导师杨扬老师,从选题到整个毕设的进行过程中,杨老师不但为我们创造了良好的学习环境提供了毕业设计的设备,而且一直悉心教导并推荐给我们很多毕设需要的相关文献资料供我们参考。论文行文过程中,杨老师也多次帮助我分析思路,开拓视角,给予了我很大的帮助和鼓励。从杨老师那里我不仅学习到了知识,他严谨求实的治学态度,踏实坚韧的工作精神,也将使我终生受益。感谢北方工业大学信息工程学院为我们提供了做毕业设计的实验室,也感谢信息工程学院所有帮助过我、指导过我的老师,是他们细心的指导和耐心的教诲,让我学到了很多,懂得了很多。另外还要感谢通信10A-1班的所有同学。在与他们共同学习,共同生活的四年里,我们一同经历了四年的风风雨雨,与他们的交流和讨论,扩展了我的思路,锻炼了我的能力,对论文的完成颇有益处。最后,我感谢大学四年以来给过我帮助和关注的所有人,你们帮助我度过了大学中的一个个难关,帮助我成长。附录外文资料翻译(附原文)基于半边脸的人脸检测概要:图像中的人脸检测是人脸识别研究中一项非常重要的研究分支。为了更有效地检测图像中的人脸,此次研究设计提出了基于半边脸的人脸检测方法。根据图像中人半边脸的容貌或者器官的密度特征,比如眼睛,耳朵,嘴巴,部分脸颊,正面的平均全脸模板就可以被构建出来。被模拟出来的半张脸是基于人脸的对称性的特点而构建的。图像中人脸检测的实验运用了模板匹配法和相似性从而确定人脸在图像中的位置。此原理分析显示了平均全脸模型法能够有效地减少模板的局部密度的不确定性。基于半边脸的人脸检测能降低人脸模型密度的过度对称性,从而提高人脸检测的速度。实验结果表明此方法还适用于在大角度拍下的侧脸图像,这大大增加了侧脸检测的准确性。关键词:人脸模板,半边人脸模板,模板匹配法,相似性,侧脸。介绍近几年,在图像处理和识别以及计算机视觉的研究领域中,人脸识别是一个很热门的话题。作为人脸识别中一个重要的环节,人脸检测也拥有一个延伸的研究领域。人脸检测的主要目的是为了确定图像中的信息,比如,图像总是否存在人脸,它的位置,旋转角度以及人脸的姿势。根据人脸的不同特征,人脸检测的方法也有所变化[1-4]。而且,根据人脸器官的密度或颜色的固定布局,我们可以判定是否存在人脸。因此,这种基于肤色模型和模板匹配的方法对于人脸检测具有重要的研究意义[5-7]。这种基于模板匹配的人脸检测法是选择正面脸部的特征作为匹配的模板,导致人脸搜索的计算量相对较大。然而,绝大多数的人脸都是对称的。所以我们可以选择半边正面人脸模板,也就是说,选择左半边脸或者有半边脸作为人脸匹配的模板,这样,大大减少了人脸搜索的计算。人脸模板构建的方法人脸模板的质量直接影响匹配识别的效果。为了减少模板局部密度的不确定性,构建人脸模板是基于大众脸的信息,例如,平均的眼睛模板,平均的脸型模板。这种方法很简单。在模板的仿射变换的实例中,人脸检测的有效性可以被确保。构建人脸模板的过程如下[8]:步骤一:选择正面人脸图像;步骤二:决定人脸区域的大小和选择人脸区域;步骤三:将选出来的人脸区域格式化成同一种尺寸大小;步骤四:计算人脸区域相对应像素的平均值。在构建模板之前,挑选些有正面人脸的图片。首先,决定人脸区域的尺寸大小。然后,在图像中手动挑选人脸区域。我们设选定的人脸区域的数量为n。因为人脸区域的矩阵向量都是被独立分布的,所以在那些人脸图像相同位置的像素值也是独立分布的。我们设在人脸区域第k(k=1,2,Ă,n)位置的像素值是fk(i,j)(k=1,2,…,n),那些人脸图像的是标准比例系数wk(k=1,2,…,n),由此得出正面人脸模板的表达式:根据统计学,如果在人脸区域第k个位置,有些像素值fk(i,j)趋于正态分布,其中u是像素fk(i,j)的平均值,是方差,T(i,j)是正态分布。所以模板局部密度的不确定性大大降低了。如果抽样的人脸图像都是在同一间距下拍摄的,相对应的人脸尺寸是一致的,标准的比例像素wk就等于1.那么,大众人脸模板T(i,j)也就变成了正面的平均全脸模板的构建在人脸与相机间距相同,鸟瞰图的拍摄角度是15°的情况下,120张人脸图像被取样,包含正面的,左侧倾斜30°和左侧倾斜45°。每种角度的图像都是40张。其中20张中的人戴帽子,2张没有戴帽子。被抽样的图像如图1所示。正面左侧倾斜30°左侧倾斜45°图1:各个角度的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论