人脸识别中AlexNet网络设计和改进方法研究_第1页
人脸识别中AlexNet网络设计和改进方法研究_第2页
人脸识别中AlexNet网络设计和改进方法研究_第3页
人脸识别中AlexNet网络设计和改进方法研究_第4页
人脸识别中AlexNet网络设计和改进方法研究_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1卷积神经网络的设计1.1AlexNet在人脸识别领域的应用Alexnet网络利用ReLU激活功能作用于每个卷积层和完全连接层,并且局部响应归一化层连接在第一个卷积层和第二个卷积层之后。卷积1层,卷积2层和卷积5层的输出上均与最大池化层相连接。AlexNet(后文称为原网络)的基本架构如图1所示。图1AlexNet结构图本设计使用ORL人脸数据库的新卷积神经网络结构模型进行训练;对于训练过程中发生的过拟合问题,Hinton提出了“Dropout”方法,即在网络学习的时候以固定的(概率),通常设置为0.5,再把输入层或者隐藏层的神经元输出设置为0,这个神经元没法连续正向传播和误差反向传播,但在测试时,p乘以输入层或者隐层的神经元输出作为该层的输出。由于网络中每个输入图像神经元被随机设置为0,因此需要要求图像中最基本的特征是由隐藏层神经元提取,采用“Dropout”解决过拟合问题。1.2AlexNet的改进本文网络的模型结构如图2所示。图2本文网络的结构图(1)用7x7和5x5的两个小卷积核替代原来的11x11的大卷积核,为了保证原结构maxpooll(第一最大池化层)的输出不发生变化,Convl-1(第一卷积层的第一卷积核)、Convl-2(第一卷积层的第二卷积核)个数保持不变,并对其进行补充操作。后面的模型结构图和原网络相同,原来的FC8层变为FC7层,具体参数如表1所示。表1Conv1-1和Conv1-2具体参数(2)在激活函数与池化层之间删除LRN层。(3)本文网络模型减少了1层(FC7层),第一层变为两个小卷积模块形式。其中改进层具体参数变化如表2所示。表2原网络和本文网络参数对比1.3人脸图像的预处理人脸原图片的尺寸是112x92,标准化变为256x256的人脸,就可以随机在标准化后的图片上裁剪一个227x227的图像来训练,并横向的进行翻转、平移等-系列的操作来拓展数据集大小。0RL人脸数据库的样例如图3所示。图3ORL人脸数据库样例对ORL数据库做以下处理:(1)将数据库中的训练集、验证集、测试集的比例设置为3:1:1,然后再把ORL中图片标准化大小,如图4所示,经cvResize函数将原图112x92标准化256x256。图4人脸标准化过程(2)将训练集、验证集、测试集的40个人分别分为40类制作标签,放到40个编号0〜39的文件夹内。(3)制作标签txt文件。(4)转换Imdb格式的数据集。(5)训练集均值文件。至此,人脸图像的预处理结束。2网络的训练和测试本文利用批量随机梯度下降的方式,准确率提升得更快。对于ORL人脸数据库原网络和本文网络的网络训练,最大迭代次数均为10000,批处理图片大小分别为4个和8个,动量均为0.9,常数因子均为0.1(本实验由于最大迭代次数和步长设置相同,所以此参数可以忽略),初始权值均为0.0005,步长均为10000,初始学习速率均为0.0001,均为训练1次测试一次,训练1000次存储一个模型。每次训练网络,更新的参数都会遍历它的批处理量。更新公式为:其中:表示更新前的权值,表示更新后的权值,表示动量,表示初始学习速率,L表示步长,表示第批图像的误差对偏导的平均值。3实验与结果分析AlexNet网络和本文网络通过迭代次数找到最适合ORL人脸数据库的网络模型。本设计的测试集的识别率只是通过网络模型测试人脸数据的优劣性,最终的识别率是全部样本的识别率。同时通过比较各个集合的损失值得出网络模型在保留尽可能多的人脸信息的前提下保证其识别率的准确性。3.1卷积神经网络的人脸识别AlexNet网络的迭代次数取为1000~10000),本文网络的迭代次数取为(1000~10000)用这些模型进行人脸识别的测试来比较它们的损失值和识别率。图5表示出对应于ORL中的原网络和本文网络的迭代次数的训练集成本函数损失。图5原网络和本文网络训练集损失曲线由图5可以看出本文网络只有在迭代2000、3000、3500、4000、4500、4800、9400、9600次的时候训练集损失的值要比改进前的网络高,其余的时候远远低于原网络,最后趋于零达到平稳。图6显示于ORL中原网络和本文网络的迭代次数的验证集成本函数损失图6原网络和本文网络验证集损失曲线由图6可以看出验证集本文网络在迭代1000次、2200次、9500次、9700次的时候损失值比原网络损失值高,其余的时候均比原网络损失值低,最后趋于零达到平稳。图7显示了对应于ORL中原网络和本文网络的迭代次数的测试集成本函数损失。图7原网络和本文网络测试集损失曲线由图7可以看出本文网络下降的速度比原网络下降的快,在迭代5000次之后,基本趋于稳定,虽然在迭代8000-9500次的时候损失值略高于原网络,但是原网络的损失值一直在上下震荡,最后本文网络的损失值收敛在0.1附近。图8显示了ORL中原网络和本文网络的迭代次数样本集成本函数损失。图8原网络和本文网络样本集损失曲线图8和图7的曲线类似,不同的是图8的样本集损失值一直处在原网络的下方,最后样本集的损失值也收敛在0.1附近。图9显示了ORL人脸数据库中原网络和本文网络迭代次数训练集的准确率。图9原网络和本文网络验证集对训练集测试的准确率曲线

由图9可以看出本文网络验证集对训练集的准确率的上升速度比原网络快,并且在迭代6000次之前都是稳步上升的,而迭代6000次之后原网络上下强烈震荡,本文网络减小了震荡,在97.5%的时候趋于平稳。图10显示了ORL人脸数据库原网络和本文网络迭代次数中每次迭代的测试集识别率。图10原网络和本文网络测试集识别率曲线由图10可以看出在迭代6000次之前,原网络和本文网络对测试集的识别率均稳步上升,其中原网络识别率最高为97.5%,而本文网络识别率最高为98.75%。但在迭代6000次之后原网络发生强烈震荡,本文网络也略微下降,在迭代8000〜9200次的时候略低于原网络测试集的识别率,本文网络随后继续上升直到识别率为96.25%的时候趋于稳定。图11显示了ORL原网络和本文网络迭代次数的样本集识别率。图11原网络和本文网络样本集识别率曲线图11和图10基本相似,不同的本文网络的样本集识别率几乎一直在原网络样本集识别率之上(除了迭代9000〜10000次)。其中,原网络对样本集的最高识别率为98.75%,本文网络对样本集的最高识别率为99%。原网络和本文网络对全部样本的识别率分别在98.5%和98.75%达到平衡。综上所说,本文网络损失曲线和识别率曲线要比原网络损失曲线和识别率曲线震荡减小趋于平稳,达到的实践效果更好。测量对于相应的人脸数据库训练集和测试集的每个模型的正确识别率,结果如表3、表4所示。表3AlexNet网络0RL人脸数据库的正确识别率(%)表4本文网络ORL人脸数据库的正确识别率由上述表格的数据得到,原网络最佳的模型AlexNet网络的_iter_9000;本文最佳的网络模型本文网络的_iter_6000;本文人脸的识别率是以测试集的识别率为准,本文网络的人脸识别率比原网络高1.25%,在一定程度内能提高识别率的收敛速度。3.2AlexNet网络的模型和本文网络的模型与其他算法的比较传统人脸识别算法的识别率如表5所示。表5传统算法ORL人脸数据库的正确识别率(%)表6AlexNet网络和本文网络与用于ORL库的其他算法的比较AlexNet网络结构模型对ORL人脸数据库的识别率是97.5%,样本识别率是98.75%。而本文网络结构模型对ORL人脸数据库的识别率达到98.75%,样本识别率是99%。表6是本文设计的网络与传统算法在ORL人脸数据库识别率的对比。从中可以得出结论,本文所设计的网络对ORL人脸数据库中的识别率提高1.25%,样本识别率提升0.25%。3.3实验总结本文提出了一个7层网络应用于0RL人脸数据库的人脸识别,提高了AlexNet网络中的超参数的批处理量,在迭代次数很小的时候就达到饱和程度,发现训练的收敛程度更快,验证的准确率更高。从训练集、验证集、测试集的损失曲线可以看出本文网络损失更少,并且训练出的模型测试人脸的识别率为98.75%(比原网络提高1.25%),所有样本的识别率可以达到99%(比原网络提高0.25%),人脸

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论