下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一种改进的ldp人脸描述方法
1局部二元模式人脸描述方法人脸识别广泛应用于门禁系统、摄像头监控系统、身份识别、网络支付、信息安全、刑事司法等领域。随着软硬件技术的发展,人脸识别领域在最近几十年获得了长足的发展。人脸描述是人脸识别系统的核心技术,这一问题受到了普遍关注,涌现出了大量的人脸描述方法。根据人脸表示数据的空域特性,可将人脸描述方法分为基于全局特征[1,2,3,4,5,6,7,8,9,10,11]和基于局部外观特征两大类。其中,局部二元模式(LBP,localbinarypatters)人脸描述方法由于其简单的原理和卓越的人脸识别性能受到了广泛的关注,文献和对原始LBP算子和扩展算子LBPu2P,R作了详尽的论述。但是,LBP具有对非单一光照的变化和随机噪声比较敏感的缺点。为此,Jabid等人提出了一种对噪声更具鲁棒性的局部方向模式(LDP)人脸描述方法。LDP充分利用局部边缘梯度信息进行人脸特征的表达,但是LDP仅仅参照了局部3×3邻域的梯度信息而忽视了更大范围的梯度信息。从对噪声信号进行平滑操作的角度,小范围采样受到噪声干扰的程度要大于大范围采样。本文针对LDP的不足提出了一种改进的LDP(ILDP)方案,利用局部井型邻域的边缘梯度值进行人脸特征提取。实验结果表明,无论是复杂面部的状态变化情况,还是在无人眼定位等图像预处理情况,ILDP比同类基于局部纹理的单一人脸描述器更具鲁棒性。2il审判2.1局部作用下的ldp模式人脸图像的每个像素点都有一个局部3×3邻域,该像素点处于邻域的中心。邻域中心像素点的四周8个点处于不同的方向,从正东、东北、正北、西北、正西、西南、正南、直到东南。将该局部3×3邻域的灰度值与8个Kirsch模板(参见图1)卷积得到8个边缘梯度值mi(i=0,1,…,7),这些梯度值分别位于上述8个不同的方向。一个LDP模式表示为一个八位二进制数——LDP码,该数的每一位分别代表这8个方向。将边缘梯度值的绝对值|mi|进行排序,求出第k大的值|mk|,并将大于等于|mk|的|mi|对应的第i位二进制数设置为1,剩余8-i位设置为0。图2给出了LDP码的计算过程,图3给出了k=3时计算LDP码的一个实例。2.2ildp码的计算为考察局部更大范围的梯度信息,设计了局部井型邻域,如人脸图像某中心像素点(i,j)的井型邻域参见图4。井型邻域与传统的3×3邻域相比采样范围更广,包含采样半径R=1和R=2;而与传统的5×5邻域相比采样点更少,只有16个像素。同时,以(i,j)点为中心,井型邻域的16个采样点所在径线不重叠,这保证了在采样充分的前提下而避免了信息的冗余。ILDP将局部中心像素的井型邻域16个像素根据采样半径(R=1或2)分成两组{Pi}和{Qi}(i=0,1,…,7)并排列成两个3×3子邻域,将{Pi}和{Qi}分别与8个Kirsch模板卷积,得到两组边缘梯度值{pi}和{qi}。边缘梯度值pi和qi的正负号代表两个相对立的梯度变化趋势,正号表示梯度上升,而负号表示梯度下降。再加上人脸图像局部像素灰度值在空域存在相关性,因此ILDP不对边缘梯度求绝对值,而直接利用{pi}和{qi}中各自的最大值的方向作为局部特征信息,同时用pi或qi的下标i代表pi或qi所在的方向。设pa是{pi}的最大值,qb是{qi}的最大值,中心像素的ILDP模式可用一个两位的八进制数(ab)8表示,称该数为ILDP码,可由ILDPcode=a×81+b×80(1)转换为十进制数。a和b均可取8个值,所以ILDP模式共有82=64种。图5描述了ILDP码的完整计算过程。一张人脸图像的所有像素分别以己为中心获取井型邻域并转换成ILDP码,所有像素的ILDP码根据原图坐标排列而形成对应的ILDP图,该人脸图像就可用对应的ILDP图代表。图6给出了一张来自YALE人脸库的人脸图像和对应的ILDP图。2.3子块直方图的形成通过对人脸图像的ILDP图进行直方图统计提取人脸的鉴别特征,直方图包含了局部边缘梯度值的分布信息。为了获取空域的信息可将人脸图像划分成一定数量的子块B1,B2…Bm,分别提取每一个子块的直方图HRi=(hi,0,…,hi,63)。直方图为hi‚j=∑x‚yJ((x‚y)∈Ri)J(C(x‚y)=Cj)‚1≤i≤m;0≤j≤63(2)其中:C(x,y)是像素(x,y)的ILDP码,J(A)是一个布尔函数,当A为真时函数值为1,反之为0。将各子块的直方图连接形成连接直方图,该连接直方图作为人脸的特征表达,图7给出了连接直方图的形成过程。最终,提取的人脸特征由一个64×m维向量(即连接直方图)所描述。2.4log相似性统计在人脸识别阶段,可用直方图正交、Log相似性统计和卡方统计等非相似性度量工具计算提取的人脸连接直方图间的距离。Log相似性统计在小窗口尺寸上性能较差,卡方统计的性能比直方图正交更好,故本文采用卡方统计非相似性度量。卡方非相似性度量定义为χ2(Η1‚Η2)=∑i(h1i-h2i)2h1i+h2i(3)另外,为简便,采用最近邻分类器进行分类,这并不影响对同类描述器的性能对比结果。3温度和图像域变换操作通过实验对几种性能最佳的基于局部纹理特征的单一人脸描述器的性能进行评估,包括CS-LBP、LDP、LBPu28,1和本文提出的ILDP。所谓单一人脸描述器是指该方法没有采用图像域变换和图像滤波等复杂操作,这些操作不仅大大增加了时间开销,而且破坏了实验对比的公平环境。比如Gabor小波变换对CS-LBP、LBP、LDP、ILDP的鉴别性能都有所提高,但是性能提高有限而时间开销大幅上升。实验分为两个类型,第1类是常规的无人为添加噪声的实验,第2类是人为添加噪声的实验。所有的实验均在IntelT2350+RAM1G+WindowsXP平台上进行,使用Matlab7.9得出实验数据。3.1对orl人脸库的选择为验证在既包含光照变化又包含表情和小饰物变化的情况下识别性能的对比,选择YALE人脸数据库。YALE库包含15个人,每个人11张共计165张图片。每个人的图片包含光照(左、中、右),表情(正常、高兴、悲伤等)和小饰物(戴眼镜、不戴眼镜)的变化。所有图片根据人的两眼坐标进行校准,然后裁剪并调整分辨率为100pixel×100pixel,图8(a)给出了一个人经过预处理后的11张人脸图像。为了验证在没有人眼标定、坐标重定位、分辨率调整并进行裁剪等有利于识别的预处理情况下的识别性能,ORL人脸库被选作第2个实验数据库。ORL人脸库包含40个人的400张图片,每个人10张。每个人的图片包含表情(闭眼和睁眼、笑和不笑)、面部有无眼镜以及10%以内的尺度变化,同时部分人的部分图片是在不同的时间采集的。所有图片背景都是黑色,分辨率是92pixel×112pixel,部分图片有20°以内的角度变化。对该库的图片不做任何的预处理,图8(b)给出了其中一个人的10张图片。另外,以上两个个实验库的图片格式都为BMP。3.2实验结果和讨论共进行两组实验,分别在上述的两个实验数据库中进行。YALE库和ORL库中图片都划分成5×5个子块。同时,为比较不同大小训练集情况下的识别性能,随机选择每个人的k(k=2,3,4,5,6)张样本图像构成训练集,剩余的样本图像形成测试集。每一种情况重复10次实验,记录实验中的正确识别率,并计算平均识别率和标准偏差。表1给出了在YALE人脸库上的实验结果,表2给出了ORL库上的实验结果。表1的数据表明,ILDP在有光照、表情和小饰物变化下的人脸识别性能优于LDP和CS-LBP,跟LBPu28,1的性能互有高低。表2的数据表明,在无进一步图像预处理的ORL人脸库中,ILDP的性能要稍优于其它几种方法。3.3实验结果和讨论分别在YALE人脸库和ORL人脸库上进行两组实验,同样将图像划分为5×5个子块。这里不再考察训练样本数对识别率的影响,故将每个人的前5张图像作为训练样本,剩余的图像作为测试样本。由于现实中噪声来源复杂,并且每张图像受噪声污染的程度也千差万别,因此试验中很难准确模拟噪声污染的各种参数。采用人脸识别仿真实验中常规的添加噪声方式。首先,只对测试样本图像人为添加噪声,而训练样本没有故意添加的噪声;其次,噪声模型选择高斯白噪声,其均值设为0,归一化方差分别设置为0.0001,0.0002,0.0003,0.0004,0.0005。在每一个实验库中一个特定设置的噪声参数下进行10次实验,记录每次实验的正确识别率并计算每一种情形下的平均正确识别率。在两个实验库中的结果分别通过折线图表示,一条折线是某种算法在一个实验库中的平均正确识别率与高斯白噪声归一化方差的二维对照。图9是在YALE人脸库中的实验结果,图10是在ORL人脸库中的实验结果。实验结果表明,ILDP抗噪声的能力明显优于其它几种基于局部纹理特征的人脸描述方法。4人脸描述阶段针对基于LDP的人脸描述方法的不足,通过进一步挖掘更大范围的梯度信息改善人脸特征的鉴别性,从而提出了一种ILDP人脸描述方法。ILDP将中心像素的井型邻域根据采样半径分成两组,每组按照原来的相对位置排列在8个不同的方向;然后将两组像素的灰度值与Kirsch模板卷积,分别得到两组边缘梯度值;最后对两组梯度值中各自最大值的方向信息编码成一个二位八进制数,形成ILDP码。在人脸描述阶段,首先对人脸图像进行分块,把每块转换成ILDP图,然后对ILDP图进行直方图统计,将所有子块的直方图连接生成人脸特征。最后根据产
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 印刷包装销售心得交流
- 通讯器材行业销售工作总结
- 公共空间设计师的工作内容
- 医院保安工作总结
- 体育用品行业销售技巧总结
- 消防安全数据分析与应用培训
- 现代商务谈判课程设计
- 我爱我家演讲稿汇编七篇
- 护士支援核酸采集心得(10篇)
- 机械cadcam课程设计泵
- 项目主要技术方案计划表
- 【真题】北京市西城区六年级语文第一学期期末试卷 2021-2022学年(有答案)
- 压铸件气孔通用标准
- 安捷伦气质联用仪(Agilent-GCMS)培训教材
- 2022年FURUNO电子海图完整题库
- 奔驰卡车产品分析(课堂PPT)
- 加固工程竣工验收资料(质量验收表全套)
- 卫生技术人员执业监管记录
- 反循环钻孔灌注桩施工方案
- 齿轮传动的设计论文
- 国家开放大学《纳税筹划》章节测试参考答案
评论
0/150
提交评论