基于ga作特征模板的人脸特征快速提取_第1页
基于ga作特征模板的人脸特征快速提取_第2页
基于ga作特征模板的人脸特征快速提取_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于ga作特征模板的人脸特征快速提取

1基于gabo变换的人脸识别哈尔哈和德尔曼最初将高等动物扁平层的简单细胞接受场和gaor函数联系起来。大量基于简单细胞接受场的实验表明,图像在视觉皮层的表示存在空域和空频域分量,并且可以将一副图像分解为局部对称和反对称的基函数表示,Gabor函数正是这种基信号的良好近似。二维Gabor函数可以看作二维高斯函数被某空间频率调制的情况,在空域和空频域都具有解析性,且可以达到空域和空频域分辨率的下限,即:∆u⋅∆v⋅∆x⋅∆y=1/(16π2),一个二维Gabor函数具有较多的变量,如空间位置、空频分量、方向分量、带宽、占空比等,这些量的选取视具体问题而定,一般都依赖于生物实验的结果。Gabor变换的一个应用是用于图像的表征。但由于Gabor函数本身并不能构成正交基,因此不能简单地做内积。Bastiaans提出一种辅助函数法,可以弥补基函数不正交造成的混迭。Porat将其推广到二维,但其计算量大,并且基函数的选择须满足一定的条件,并且不适合不完备的基。Daugman用一个三层神经网络,两层权重固定,一层权重可调整,依最小二乘方准则来寻找一组基函数的最佳展开系数。这种神经网络的方法并不要求Gabor基函数完备,其基函数的选取在空频域遵循log-polar模式,这也得到生物学上的验证,但同样需要大量的训练时间。通过旋转、平移、尺度变化形成的Gabor函数族,可称为Gabor小波,它虽然不能构成正交基,但在特定参数下可构成紧框架,这样一副图像可由下式近似表征:为框架界。由于Gabor函数的生物特征,所以可用于特征提取和模式识别。这种情况下,我们不关心它是否可以最大限度地表征一副图像,只关心在Gabor变换下,图像的特征是否容易提取,是否更加显著化,或者特征表征的有效数据量是否有所下降。Lades应用Gabor变换进行人脸识别取得了良好的效果,对于128×128的人脸图像,采用5个采样频点,8个极化方向的Gabor小波与图像卷积,在7×10的采样网格上提取特征,则特征向量维数达到2800维。特征点通过随机优化达到最佳匹配,对图像的几何变化不敏感,因此可以提高识别率,并且图像不需要归一化预处理,这是其他识别算法如PCA,所不可比拟的。人眼是人脸图像中最重要的特征,大多数的模式识别算法都需要精确地定位脸部特征,因此,人眼定位在人脸识别中具有重要的意义。只要人眼被精确定位,则脸部其他特征,如眉、鼻、嘴等,可由潜在的分布关系比较准确地定位。人脸可以较好地归一化,预处理的效果也更明显,同时也可提高识别速度和降低识别算法的复杂度。本文就是利用Gabor变换建立人眼模板,通过快速匹配寻优算法来定位人眼。第一部分为引言,第二部分为图像处理,第三部分为多分辩定位算法,第四部分为实验结果,第五部分给出结论。2不同采样方向的微织构拟合一个2DGabor函数是一个高斯包络的平面波,式(1)比较普遍地用于特征提取中:ψ(kr,rr)=σkr22expuf8ecuf8ecuf8eduf8eb-kr22σrr22uf8f7uf8f7uf8f8uf8f6⋅uf8efuf8efuf8f0uf8eeekir·rr-e-σ22uf8fauf8fauf8fbuf8f9(1)是平面波波矢量,其模值控制了高斯包络的宽度。σ是与小波频率带宽有关的常数,当带宽∆ω=1octave时,σ≈π;∆ω=15.octave时,σ≈.25;∆ω=2octave时,σ≈.196。项消除了直流分量(如均匀光照)的影响。在空频域上,以半octave采样为例,采样模式取5个不同频带的小波,;每个小波都有6个不同的方向,即φ=πj/6,j=0,1,……5。几种采样策略如图1所示。由于Gabor函数是复函数,它具有一个很好的性质,假定图像表示为I(rr),则有即卷积滤波的结果就是Gabor基展开系数,它是复数,为了减轻运算的复杂性,对人眼定位来说仅采用其模值。实验中采用的模板是3×3网格,如图2所示。则整个特征矢量的维数为30×9=270维,相对于识别所采用的特征矢量维数已大大降低,因此可以显著地提高寻优速度。正如弹性图匹配(ElasticGraphMatching)一样,在人眼定位中仍然采用全局寻优的策略,只是不需要第二步变形匹配操作,它的寻优势能函数为一个比较重要的问题是左眼模板是不是常定位在右眼上?这可以从图3中看出,全局搜索的势能最小点十分明显,并不存在一个十分接近它的另外的最小点,也就是说,左眼模板总是能定位在左眼上,同样,右眼模板也总是能定位在右眼上。但是在寻优的路径上,确实存在一些另外的极小值点。如果采用梯度下降法进行快速搜索的话,则有可能陷入局部极小值。一个改进的考虑是在可能的局部极小值处进行强制跳转(即结合coarse-to-fine和fine-to-coarse),问题是难以确定跳转的次数及步长,只能根据经历的局部极小值,选取最小值记录下来,如果有别的更小的点,则以新位置代替之,最终可以很好地定位。如果实验的数据库比较大的话,则额外花费的时间也是可观的。4抗起眼位置检测一个恰当的人眼定位的数据库是很难选择的,这不但决定于研究问题的侧重点,也决定于数据库本身,因为它影响到实验结论是否具有普遍性。本实验采用的是Manchester人脸库的图像,具有表情、头部位置、倾侧、背景干扰、眼镜等变化。定位策略是,先建立不同分辨率的几组模板,对其中之一进行由低分辨率到高分辨率的金字塔寻优,凡是正确定位的(以眼球上下左右两个像素为准),在下一组模板寻优以前筛选出去,如此遍历各组模板。双眼定位的结果示例于图6。实验在左眼、右眼和双眼上针对不同组数模板得到的检测率如图7。可以看出,在仅有4组模板的情况下,双眼正确检测率可达90%以上,单眼可达95%左右。在增加模板组数的情况下,对双眼定位进一步研究,结果如图8。可见在经历了初始几组模板检测率提高很快以后,再增加模板,改善的效果不大,对于左眼定位位置的一组统计数据如表1,可以看出和图3,4,5表明的一致,即左眼模板一般仍定位于左眼,定位于右眼的只寥寥几个,还不如错误定位于嘴上的多。一个有意思的看法是嘴与眼具有某些相似性,这实际上可以由Gabor小波的性质得到解释,对方向敏感的Gabor小波,显然对于同是垂直梯度变化比较大的嘴和眼都有较大的展开系数,这就造成匹配时模值比较具有一定的相似性。5人脸资特征提取基于Gabor滤波器的图像表征、压缩和模式识别的研究比较多。但考虑到基于Gabor变换的识别算法对预处理要求不高,但运算时间延长。故而可以利用它来进行人脸面部特征的定位提取,这不但是大多数识别算法所必须的,也与高等动物的视觉特性有一致性,并能在一定程度上提高运算速度。作者还将这种定位算法应用于Yale人脸,在一组模板下,对于66个人脸,正确定位52个,检测率为78.8%。一般来说,基于Gabor变换的人眼定位对于光照强度比较敏感,尤其是侧面光。对于带眼镜且光照变化大的情况尤其差。但对于一定的尺度、旋转、表情等都具有良好的鲁棒性。3低分辨率图像在实践中,可以采用多分辩分析解决这个问题,具体地说,就是通过高斯金字塔法建立一组不同分辨率的人脸图像,最高分辨率的就是原始图像,令为金字塔第0层,下一个分辨率的图像就是上一级分辨率图像的低通滤波输出,频带为上一级的一半,为金字塔第1层,依次类推。每一个分辨率水平的图像都需要经过预定义的一组Gabor滤波器滤波以提取特征,同时,每个分辨率水

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论