神经网络在人脸识别中的应用_第1页
神经网络在人脸识别中的应用_第2页
神经网络在人脸识别中的应用_第3页
神经网络在人脸识别中的应用_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

神经网络在人脸识别中的应用引言早在上世纪60年代末,人脸识别即引起了研究者的强烈兴趣.但早期的人脸识别一般都需要人的某些先验知识,无法摆脱人的干预。进入上世纪9O年代,由于高速度、高性能计算机的出现,人脸识别的方法有了重大突破,进入了真正的机器自动识别阶段,人脸识别研究得到了前所未有的重视。人脸识别方法有很多种:⑴特征脸方法。这种方法起源于图像描述技术,采用特征脸识别方法有良好的稳定性、位移不变性、特征向量与图像的高度成比例变化以及转置不变性。不足之处是受表情变化、光照角度强度变化和视角变化等严重影响,鲁棒性较差。⑵隐马尔可夫模型方法(HiddenMarkovModel)是用于描述信号统计特征的一组统计模型。HMM的基本理论是由Baum和Welch等人在20世纪60年代末70年代初建立,在语音识别中应用较多。⑶弹性图匹配方法。弹性图匹配方法是一种基于动态连接结构的方法。它将人脸用格状的稀疏图表示。⑷神经网络方法。人工神经网络是由多个神经元按照一定的排列顺序构成的,是一个非线性动力学系统,其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但由大量冲经元所构成的网络系统却能够实现复杂丰富的功能。神经网络系统除了具有集体运算的能力和自适应的学习能力外,还有根强的容错性和鲁棒性.善于联想、综合和推广。神经网络模型各种各样。它们是从不同的角度对生物神经系统不同层次的描述和模拟。有代表性的网络模型有感知器、多层映射BP网络、RBF网络等。目前,在人工神经网络的实际应用中,绝大部分的神经网络模型都是采用BP网络及其变化形式,它也是前向网络的核心部分,是人工神经网络最精华的部分。2BP神经网络的人脸识别BP神经网络用于人脸识别一般应先对输入图像实行图像预处理,然后进行特征提取,接下来就是BP网络训练,最后用训练好的网络进行识别,获得识别结果。基于特征脸和BP神经网络的人脸识别方法2.1特征脸分析这种方法是根据图像的统计特征进行正交变换(K-L变换)[3],以去除样本间的相关性,然后根据特征值的大小选择特征向量(主分量),由于这些特征向量的图像类似人脸,所以称为特征脸[4,5]。下面就这种方法作简要介绍。XERN为表示一幅图像的随机向量,这里N是图像的大小,X由图像的行或列连接而成的向量。假设有p个人,每个人有r1(IWiWP)个人脸样本图像,样本集为{Xji),Xji表示第j个人的第i个样本。那么每个人样本均值向量为mi(1WiWp);总体样本均值向量为m;类间散布矩阵为Sb项产”n厂m)(11}J-初7, (4;/=L'Sb是NXN的大矩阵,一般由奇异值分解定理[8]得到其特征向量矩阵U及样本集的特征系数向量矩阵C。其中u=f峋」…/U]一17JC=>r'n>%[打U的秩总是小于p的,它的每一列就是一特征脸(向量),一般有p-1个。每一张人脸都可以投影到这p-1个特征脸张成的子空间中,得到一个特征系数向量,C就是样本在子空间中投影得到的系数,每一列ci就代表mi在特征脸空间投影的特征系数向量,它有p-1行,即投影得到的p-1特征系数。如图1是本文实验一张人脸的具体展开,第一项为平均脸,其他是按特征值大小排序的特征脸,常称为主元。在最近邻识别中,将输入的人脸图像连接成一维向量,向特征脸张成的子空间投影,然后在子空间中,如果与ci的距离最近,就判别为第i类。图】用特征脸表示人脸示意图2.2神经网络实现分类器基于BP算法的前向多层神经网络以其算法、概念及基本理论都很简单,但有很强的学习能力,已经在实际问题中有了大量成功的应用:10],简称其为BP神经网络。本文用最小均方误差小于0.0001的学习,这样神经网络学习的实质就是进行后验概率估计;分类时实质就是采用最大后验概率分类方法[10,12]。下面简要对它们的关系作推导。神经网络实现的映射F:RdTRM,这样期望最小均方误差E[y-F(x)]2最小,这里F(x)=E(y/x),y是期望的输出yj=(0,…,0,1,0,…,0)T,如果xE(第j类)。F(x)=E(y/x),这样对给定第j类的输入x,对应的输出为

Fj(x)=E[yj/x]1xP((yj=1)/x)+0xP((y=0)/x)=P((yjFj(x)=E[yj/x]1xP((yj=1)/x)+0xP((y=0)/x)=P((yj=1)/x)=P(coj/x)本文中,神经网络的输入是特征脸分析得到的39个特征,输出是40个人的每个人的后验概率。训练时,如果是第j个人,让输出的向量的第j元素为1,其他全为0。换句话说,让第j类的概率为1。分类识别时,取最大的输出作为结果,即最大后验概率作为输出。实验及结果分析本文的实验是在ORL人脸数据库上进行的,有40人,每人有10张人脸样本。实验中,每人随机选择五张图片作为样本集,剩下的作为测试集,然后交叉实验,让第一次的测试集作为样本集,第一次的样本集用来测试。特征脸识别用最近邻判别方法,为了较客观的反映它的识别率,选择了四种常用的相似性度量方式[9]。对于识别率本文采取人脸识别中常用的累积识别率的办法。由于神经网络结构的不同,会带来识别率较大的差别;并且由于网络权值初始化的随机,性,每一次的结果不会完全一样。所以统计了几种不同隐层神经元数目的平均识别率。在实验中,发现多于三层的网络结构无益于识别率的提高,所以采用常见的三层结构,39个输入层,40个输出层。而隐层的数目不能少于20个,当少于20个时,识别率将会变得很差;当多于100个时,识别率增加不明显,有时反而会下降。从表1,表2可以看到,在最近邻识别的几种方法中,马氏距离取得了较好的效果。BP网络的隐层神经元数目在一个较大的范围内,都取得了令人满意的识别率,比最近邻的识别率要好。当隐层神经元数目是样本的一半左右时,取得了更高的识别率。在交叉实验的比较中,发现第二组的识别率明显好于第一组,这是因为人脸识别问题可以看作回归问题,而回归问题中,样本显得特别重要,样本只是一定程度上反映问题的真实模型,好的样本能较好地逼近真实模型。在实际问题中,当样本没有选择余地时,就会出现偏差和方差两难问题:10一12] 。\嬲马氐仰,离隐层神谿元敖;30(半均诅元敏;90别啊隐层州辨其妇湘〔平均俱别申)Aft;110(Y-均诅别啊TopDir81%剧.眺£5.5%36.75%ffi.75%&O.75%阳.75%lopRe脂,5%91.5%我%虬5%95%95.25%TopUtm92,5%9盅94.5%鼻,眺94,25%囹.5%97.25%97.25%表1识别率比较\类型戴JEBffifflS8FS企弦顶育马KR离BE神斟元St30(平均诅刖啊元数:90(平均帜隐层神鑫;L®:100(平均双Mt)SEWS兀数:no(均俱别啊TapOre84蜘困%82.5%88%91.S%92.3%92%Tap加91S%93.5%观96%93.5%ffi.诳96.75%90.25%TopBree94%97%挪95,75%97%99%99%表2样本集和测试集交换后识别率比较结论人脸识别是一个困难的研究课题,目前还处于探索阶段。本文利用特征脸的方法提取特征,利用BP神经网络学习能力强、分类能力强的优点,实现分类器。为了与经典的最近邻分类器更好地比较,选择了四种相似度测量方法。用神经网络实现分类器时,较多地研究了网络结构的构造。实验结果表明,如果网络的结构合理,识别率比最近邻分类器有较大的提高。5・参考文献:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论