神经网络在人脸识别中的应用_第1页
神经网络在人脸识别中的应用_第2页
神经网络在人脸识别中的应用_第3页
神经网络在人脸识别中的应用_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、神经网络在人脸识别中的应用 1引言 早在上世纪60年代末,人脸识别即引起了研究者的强烈兴趣.但早期的人脸识别 一般都需要人的某些先验知识,无法摆脱人的干预。进入上世纪 90年代,由于 高速度、高性能计算机的出现,人脸识别的方法有了重大突破,进入了真正的机器 自动识别阶段,人脸识别研究得到了前所未有的重视。人脸识别方法有很多种 : (1) 特征脸方法。这种方法起源于图像描述技术,采用特征脸识别方法有良好的 稳定性、位移不变性、特征向量与图像的高度成比例变化以及转置不变性。不足 之处是受表情变化、光照角度强度变化和视角变化等严重影响,鲁棒性较差。 (2) 隐马尔可夫模型方法(Hidde nMark

2、ovModel)是用于描述信号统计特征的一组 统计模型。HMM的基本理论是由Baum和Welch等人在20世纪60年代末70 年代初建立,在语音识别中应用较多。 (3) 弹性图匹配方法。弹性图匹配方法是一种基于动态连接结构的方法。它将人 脸用格状的稀疏图表示。 (4) 神经网络方法。人工神经网络是由多个神经元按照一定的排列顺序构成的,是 一个非线性动力学系统,其特色在于信息的分布式存储和并行协同处理。虽然单 个神经元的结构极其简单,功能有限,但由大量冲经元所构成的网络系统却能够 实现复杂丰富的功能。神经网络系统除了具有集体运算的能力和自适应的学习能 力外,还有根强的容错性和鲁棒性善于联想、综合

3、和推广。神经网络模型各种各 样。它们是从不同的角度对生物神经系统不同层次的描述和模拟。有代表性的网 络模型有感知器、多层映射BP网络、RBF网络等。目前,在人工神经网络的实际 应用中,绝大部分的神经网络模型都是采用 BP网络及其变化形式,它也是前向网 络的核心部分,是人工神经网络最精华的部分。2BP神经网络的人脸识别 BP神 经网络用于人脸识别一般应先对输入图像实行图像预处理,然后进行特征提取,接 下来就是BP网络训练,最后用训练好的网络进行识别,获得识别结果。 2. 基于特征脸和BP神经网络的人脸识别方法 2.1特征脸分析 这种方法是根据图像的统计特征进行正交变换 (K-L变换)3,以去除样

4、 本间的相关性,然后根据特征值的大小选择特征向量 (主分量),由于这些特 征向量的图像类似人脸,所以称为特征脸4, 5。下面就这种方法作简要介绍。 X RN为表示一幅图像的随机向量,这里N是图像的大小,X由图像的行或列连 接而成的向量。假设有p个人,每个人有r1 ( 1 i P)个人脸样本图像,样 本集为 Xji , Xji 表示第j个人的第i个样本。那么每个人样本均值向量为 mi ( 1 i p);总体样本均值向量为 m;类间散布矩阵为 p q-p sb = 6- m) (m - m) 1(4) j-i Sb是NX N的大矩阵,一般由奇异值分解定理8得到其特征向量矩阵 U 及样本集的特征系数

5、向量矩阵 G其中 U = f I、* U?、T t “亡 _ j / t C Up o U的秩总是小于p的,它的每一列就是一特征脸(向量),一般有p - 1个。 每一张人脸都可以投影到这p - 1个特征脸张成的子空间中,得到一个特征系数 向量,C就是样本在子空间中投影得到的系数,每一列ci就代表mi在特征脸 空间投影的特征系数向量,它有p - 1行,即投影得到的p - 1特征系数。如 图1是本文实验一张人脸的具体展开,第一项为平均脸,其他是按特征值大小 排序的特征脸,常称为主元。 在最近邻识别中,将输入的人脸图像连接成一维向量,向特征脸张成的子 空间投影,然后在子空间中,如果与ci的距离最近,

6、就判别为第i类。 图1用持征脸表示人脸示懸图 2.2神经网络实现分类器 基于BP算法的前向多层神经网络以其算法、概念及基本理论都很简单,但 有很强的学习能力,已经在实际问题中有了大量成功的应用10, 简称其为 BP神经网络。本文用最小均方误差小于0.0001的学习,这样神经网络学习的实 质就是进行后验概率估计;分类时实质就是采用最大后验概率分类方法10, 12。下面简要对它们的关系作推导。 神经网络实现的映射F: Rd - RM,这样期望最小均方误差 E y - F( x) 2 最小,这里 F( x) = E( y/x) , y 是期望的输出 yj =( 0,? ,0, 1,0,? , 0)

7、T,如果x (第j类)。F( x) = E( y/x),这样对给定第j类的输入x,对 应的输出为 Fj( x) = E yj/x = 1 =1 ) /X) = P( 3 j /X) x P( ( yj = 1) /x) + 0 x P( ( y = 0) /x) =P( ( yj 本文中,神经网络的输入是特征脸分析得到的 39个特征,输出是40个人的 每个人的后验概率。训练时,如果是第j个人,让输出的向量的第j元素为1, 其他全为0。换句话说,让第j类的概率为1。分类识别时,取最大的输出作为 结果,即最大后验概率作为输出。 3. 实验及结果分析 本文的实验是在ORL人脸数据库上进行的,有40人

8、,每人有10张人脸样 本。实验中,每人随机选择五张图片作为样本集,剩下的作为测试集,然后交叉 实验,让第一次的测试集作为样本集,第一次的样本集用来测试。 特征脸识别用最近邻判别方法,为了较客观的反映它的识别率,选择了四种常 用的相似性度量方式9。对于识别率本文采取人脸识别中常用的累积识别率 的办法。由于神经网络结构的不同,会带来识别率较大的差别;并且由于网络权 值初始化的随机性,每一次的结果不会完全一样。所以统计了几种不同隐层神经 元数目的平均识别率。在实验中,发现多于三层的网络结构无益于识别率的提高 所以采用常见的三层结构,39个输入层,40个输出层。而隐层的数目不能少于20 个,当少于20

9、个时,识别率将会变得很差;当多于100个时,识别率增加不明 显,有时反而会下降。 从表1,表2可以看到,在最近邻识别的几种方法中,马氏距离取得了较好 的效果。BP网络的隐层神经元数目在一个较大的范围内,都取得了令人满意的 识别率,比最近邻的识别率要好。当隐层神经元数目是样本的一半左右时,取得 了更高的识别率。在交叉实验的比较中,发现第二组的识别率明显好于第一组, 这是因为人脸识别问题可以看作回归问题,而回归问题中,样本显得特别重要, 样本只是一定程度上反映问题的真实模型,好的样本能较好地逼近真实模型。在 实际问题中,当样本没有选择余地时,就会出现偏差和方差两难问题 10 12 。 炎型 金弦夹

10、甫 iFW 马氏即s ft神盟 Stt: 30 (平均识 削书) urns jl ft: 90 (平均识 Sfcioo (半均刃 别啊 隐层址洋 jutt: no (T均讥 别利 Top Orr BL 5% Bl 5% 83.5% 86.75% 90.75% 90.75% 89.75% Top Tw 88,5% 砒 91.5% 90.5% 92% 94.5% 95% 96.25% lop llree 92.5% 91% 94.5% 9(. 5% 94.25% 96. 5% 97.25% 97.25% 表1识别率比较 娄型 讥别平 bU丽离 皿 汆弦来角 跖璽 |b 30 (平均识 Slf) 隐

11、E#劭 元数;90 (T均M 隐展伸经 ;LiJOO (f 均 1H W) 隐层昭 Sfijfc lio (f禺识 Jf) Top Ort 815% 87% 82 5% ffi% 88% 91.2S% 923% 32% Top Tw 915% 93.5% 90% 96% 93.5% % 25% 9675% 9G.25% lop Tlree 94% 97% 94% 98% 95.75% 97% 99% 99% 表2样本集和测试集交换后识别率比较 4. 结论 人脸识别是一个困难的研究课题,目前还处于探索阶段。本文利用特征脸的 方法提取特征,利用BP神经网络学习能力强、分类能力强的优点,实现分类 器。为了与经典的最近邻分类器更好地比较,选择了四种相似度测量方法。用神 经网络实现分类器时,较多地研究了网络结构的构造。实验结果表明 ,如果网络 的结构合理,识别率比最近邻分类器有较大的提高。 5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论