




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、滨江学院毕业论文题目 基于Gabor小波和极限学习机的表情识别 学生姓名 王帅凌 学 号 20102336037 院 系 滨江学院自动控制 专 业 自动化 指导教师 刘青山 职 称 教授 二O一四 年 五 月 二十 日目 录1绪论21.1课题研究的背景及意义21.2课题研究难点21.3 国内外对表情识别的研究31.4 本文的研究工作31.5本章小结42 表情识别基本理论52.1 表情识别的方法52.3 理论基础52.3 仿真的实现以及MATLAB介绍52.3.1 表情识别的仿真52.3.2 MATLAB介绍52.4 本章小结63 基于Gabor小波和PCA降维处理73.1 Gabor小波73.
2、1.1系统概要73.1.2 预处理73.1.3 Gabor小波特征提取83.1.4Gabor小波特征提取的实验结果93.2 主成分分析(PCA)93.2.1 PCA介绍93.2.2 PCA算法93.3.3 PCA算法103.3.4 降维处理实验结果113.5 本章小结114 极限学习机124.1 极限学习机介绍124.2 ELM原理124.3 极限学习机算法134.4 极限学习机训练144.5 本章小结155 实验结果与分析165.1实验结果165.2 实验分析185.3 本章小结18参考文献19致谢21Abstract22基于Gabor小波和极限学习机的表情识别王帅凌南京信息工程大学滨江学院
3、,江苏南京,210044摘要:人们相互间的交流能够从表情来传达出内心的情感,20世纪以来,图像技术以及人工智能化得到了飞速的发展,尤其是智能机器人在人脸表情识别的运用上,所以人脸表情识别技术越来越受到学术界的研究发展,成为了一个很重要的课题。表情识别在人机交互界面、游戏互动、以及一些高端医疗设备上的到了很好的运用,本实验是基于Gabor小波和极限学习机的算法,对预处理过后的图片进行Gabor小波特征提取,将特征提取后的结果用极限学习机进行训练并分类识别,用日本JAFFE表情库在MATLAB中进行了表情识别实验,结果表明实验识别率达到80%。关键字:表情识别;Gabor小波;PCA降维处理;极限
4、学习机;分类识别1 绪论1.1课题研究的背景及意义社会心理研究学发现,表情包含了个人的情感状态、活动状态、性格、精神状态等多个复杂的信息,并且这些信息基本上都是不能由其他表达方式所代替的,因此,人脸表情分析成为医疗设备、心理研究等多个智能化领域的重要研究课题。表情识别是人类表达自身情绪的一种方法,表情含有丰富的行为信息,是人类自身状态的体现,所以,表情是一种表达人类情绪的一种手段。表情识别实现了计算机以及机器人对人脸面部表情的认识,从本质上改善了人机关系,对于人机交互界面有种重要的意义,大大提高了人机交互界面的智能化。人与人面对面的交流过程中很容易识别人的面部表情,并且通过大脑作出正确的判断,
5、可是这相对于计算机的某种程序来说却是很艰难的。计算机最简单的识别系统是识别一些一成不变的物体,对于表情来说,它是一种运动,想跟踪并识别这些运动有一定的困难,表情识别需要跟踪一些表情点,并且提取这些表情的特征点。所以,运用计算机实现表情识别是一个实现友好的人机界面以及智能化设备的一项有研究意义的课题。在交流的过程当中,有时候语言与心理的表达并不是一致的,也就是人们常说的口是心非,但是一个人的表情往往是最能证明一个人的心理感受,在刑侦部门办案时会用到测谎仪,我们可以将表情识别加入进去,更加有效的增加它的效率。在医院内,如果花费大量的人工去监护一位病人,这会大大降低工作效率,我们可以研发一种监测病人
6、的表情设备,在病人难受以及病情发作时会产生一定的表情,通过这些表情来达到监测的效果,并及时作出报警,这样会降低夜间病人病情发作带来的严重后果。在远程教育过程中,通过摄像头来采集学生的表情,再通过表情来了解其潜在的心理状态以及一些性格,这有助于我们去采用更好的教学方式,达到最好的教学效果,也能够将表情信息跟心理学进行一些对比分析,帮助老师特高教学效率。表情识别的技术甚至可以普及到我们平常的生活工作当中,近年来,汽车行业较为发达,也越来越走向智能化,运用表情识别我们可以监测驾驶员的生理以及情绪的变化,可以达到预防重大事故的发生,有一些需要精神高度集中的岗位上也可以应用表情识别,火车哨岗以及军事岗位
7、等地方,这些都需要负责人的精神高度集中,通过监测表情,来预防重大事故的发生。1.2课题研究难点人脸表情是一种肌肉运动,并不是一个一成不变的物体,这导致不能用一块模型来描绘。表情识别也依赖于它对各个人脸表情的熟悉度、对多种表情的分类,表情有多种表达形式,比如中性脸是相对平静的一种肌肉运动,而高兴、悲伤等表情是一种相对比较剧烈的肌肉运动,这些都是它的研究难点。计算机本身只是一个系统,需要人类给它具体的操作方法,而且其存在误差,这都需要一一解决,这也就是本课题的重要难点。每种表情都是固定在那几块肌肉的运动时,这导致了一些表情的相似,哭、笑、以及惊奇这些表情都是嘴巴张开,所以一个特征点的改变并不能判断
8、出一种表情,这使得表情识别需要注意更多的细节。我们提供的表情库是比较简单的,人脸没有任何东西遮挡,但是日常生活当中,人脸可能会有眼睛、头发等物体的遮挡,还有人脸的光照条件、以及摄像头采样会造成人脸的倾斜而导致特征点的改变,等等诸多影响都需要我们将它解决,这些会涉及到计算机的智能化,所以表情识别这项课题很富有挑战性。1.3 国内外对表情识别的研究表情识别能够实现智能化,作为人机界面、机器人智能技术、医疗设备、游戏界面的人工情感等领域,具有广阔的应用前景和经济价值,使得学术界和企业界产生了一个高优先级,并且退出了一批又一批的研究。日本率先开发了表情识别的机器人(personalrobot)产品,索
9、尼公司情感机器人、Q班型情感机器人以及机器狗为典型代表(10)。中国有很多研究人员,比如赵力,王志良,陶霖密,等学者也都在积极开展表情识别的研究。1971年,美国提出了:生气、厌恶、恐惧、悲伤、惊讶、高兴六种基本表情,并在1978年开发了面部动作编码系统来检测表情的微妙变化,大多数的表情识别系统都是设计了6种表情识别,而且研究人员建立的模型也都是根据面部动作编码来设计的。近年来,各个国家都在研究人工情感模式的识别,使得这个领域成为一个研究重点,日本、美国。ART建立了日本女性表情数据库(JAFFE)是有213副表情,美国机器人研究所和心理学研究所共同建立了Kanade人脸表情数据库,含有200
10、0张面部表情图片,以上表情库为表情识别的研究提供了很多用处。1.4 本文的研究工作本实验主要是识别表情库内的图片表情,对图片进行预处理、特征提取,最后进行表情分类。对表情库中的每种表情进行眼睛定位,定位结束之后将定位完成的图片进行相应的几何变化,为了消除光照的影响,将图片进行拉伸处理。本文选用人本JAFFE人脸表情库进行实验,首先在读取表情库里面的图片,运用Gabor小波分析法,对图片进行特征提取,在运用主成分分析法(PCA)对特征提取过的图片进行降维处理,以达到降低小波变换后产生的高维数,最后运用神经网络中的极限学习机ELM进行训练和分类,最终达到预计的效果。图1.1表情识别流程图:PCA降
11、维处理Gabor小波特征提取获取人脸数据库ELM训练识别结果ELM分类识别提取Gabor特征载入待识别的图像图1.1 表情识别流程图 第一,对图像建立几何模型,对图像进行预处理,减少光照以及噪声的影响。第二,运用Gabor小波对图片进行特征提取,再结合主成分分析来将提取过的图片进行降维处理。第三,采用神经网络的极限学习机进行学习分类,极限学习机在对于处理海量图库有一定的优越性。每个章节的具体安排如下:第一章,介绍本课题的研究目的和意义,再介绍表情识别的难点,以及国内外对表情课题的研究现状,说明本论文的流程。第二章,表情识别基本理论,介绍表情识别的方法和基本概念,对仿真软件作一些简单介绍。第三章
12、,介绍Gabor小波特征提取的方法,以及如何用PCA进行降维处理。第四章,介绍神级网络的一种极限学习机算法,并介绍本文如何运用极限学习机分类识别的。1.5 本章小结本章介绍课题的背景意义,国内外研究现状,以及难点,简单描述了以下本文的研究工作。2 表情识别基本理论2.1 表情识别的方法表情识别的流程一般有三步:图像的获取,特征提取,最后对表情进行分类。人脸检测表情特征提取人脸表情分类图2.1 表情识别的流程人脸检测方法有样本学习,子空间方法,以及模板法。表情识别的特征提取有主成分分析(PCA),LBP,Gabor小波,本文主要介绍Gabor小波特征提取。最后需要对提取的特征向量进行分类,常用的
13、分类方法有支持向量机(SVM),基于神经网络的,弹性模板匹配等方法。2.3 理论基础人脸表情识别是由以下几个流程组成的:首先需要MATLAB读取需要识别的表情数据库,然后对人脸进行检测,主要是眼睛和嘴巴几个主要特征点,在对人脸几个关键点进行特征点的定位,最后对特征提取过的表情进行分类。由于人脸图片会对识别有一些影响,需要对图片进行预处理,这样消除光照和噪声的影响,再对它进行特征提取,最后分类识别。本实验的理论基础是利用小波变化进行特征提取,小波变换对于数字、语音、模式的识别,等各种信号有一定的应用。在运用PCA降维,增加识别率,最后分类识别。2.3 仿真的实现以及MATLAB介绍2.3.1 表
14、情识别的仿真表情识别的方法有很多,有U3D,kinet,以及MATLAB,本文利用了MATLAB来实现,下面具体介绍MATLAB,由于MATLAB对图像处理有良好的性能,利用这一点,本实验运用日本JAFFE表情库来进行仿真。2.3.2 MATLAB介绍MATLAB是一种图像处理好数值计算的软件(5)。MATLAB中含有很多的工具箱,可以实现各种仿真,比如线性控制、神经网络、数字信号、非线性控制、鲁棒性、数字统计、模糊控制、系统仿真(6),借助于MATLAB的这些功能,使用者可以精确的计算出数据以及更好的分析数据。MATLAB语法比较通俗易懂,相对了C+来说,它的语言更具有适用性,不需要反复的编
15、写调试程序,只需要简单的调用即可,对于C语言来说,也许C语言的几百句语言只需要MATLAB的一条指令来代替,这大大节约了开发者的时间,因此,MATLAB成为更加应用广泛的一款软件。MATLAB图形处理功能非常强大,它有一个强大的工具箱,多种图片的格式都可以支持。比如:BMP、JPEG、GIF、PNG等格式,MATLAB最新的版本增加了多种图片处理函数,包括了最新的一些图片处理方法。这些处理函数分为图片分析、图片文件接口、图片显示、像素处理、几何处理、图片增强、线性滤波以及设计、图片转换等等方式。MATLAB强大的工具箱使得我们根本不需要考虑图片文件的格式、像素等等细节,我们只需要考虑算法,这大
16、大减少的开发者的精力,也提高了效率。调试算法时我们可以方便的得到数据统计,也能直观的显示出结果。MATLAB可以从实际运用角度来进行图片的分析,这种语言之所以能够迅速的发展,主要是这种语言能够摆脱了人们对计算机硬件的操作,主要是它拥有很多的函数资源,并不需要人们记住那么多的程序代码。其工具箱有两个核心部分,功能型和学科型工具箱,功能型的来扩大符号的计算、建模的仿真、文字的处理和硬件的交换,这两种功能也是相辅相成的,功能型工具箱是用来服务于学科型的工具箱,学科型工具性需要较强的专业知识,这些都是专家实现编写好的,并不需要我们去了解。MATLAB界面友好,编程简单,它最大的有点就是简洁,能够用一段
17、函数来代替繁琐的C语言,为用户带来更好的开发环境。MATLAB允许使用者二次开发,使用者可以将自己的程序写成一个新的函数并添加到工具箱中,以增加工具箱的函数,为下次使用提供方便。MATLAB的数值、符号计算功能,以及数据分析、仿真、图文处理功能很好,能够为程序实际带来良好的工具环境。2.4 本章小结本章介绍了表情识别的基本方法,介绍现有的一些识别方法,以及本实验的仿真软件MATLAB。3 基于Gabor小波和PCA降维处理3.1 Gabor小波3.1.1系统概要本章重点介绍小波特征提取,以及具体的Gabor小波的算法。Gabor小波主要用于图片的特征提取,有效的反映图片的在各个位置以及尺度的纹
18、理改动,能够缩小图片里光线改动、噪声的干扰。3.1.2 预处理无论是表情识还是人脸识别以及各个识别系统,在表情识别中表情图像的预处理是一个非常重要的环节,它需要把一张图片中的面部表情的重要特征点来进行定位。本文需要把图片中的光线影响去除,以及噪声等对图片产生的失真效果,只有解决了这些问题,才能达到预处理的效果,从而达到理想的处理结果,图3.1是人脸面部的几何模型:图3.1 人脸几何模型根据面部的几何模型来获得表情的纯区域,对表情模型建立一个几何算法,产生函数,把图片转化成一种数字处理的方式,经过尺度的变化来得到一个校准的图像(1)。在一幅表情图像中,眼睛、嘴巴、鼻子的位移会给人脸的定位造成一定
19、的困难,为了准确的确定几何位置,需要对图像进行归一化,本实验对双眼球作为特征点,始终保持双眼球在水平线上,然后以两眼中心位置的距离为基准,按一定的比例裁剪,得到表情最多的区域,最后进行图像的缩放处理,使各图的大小统一。尽管小波变化对光照的影响并不敏感,但是为了的到最优化的提取效果,采用灰度均衡化: I(x,y)=0(I(x,y)-)+0 (公式3.1)I(x,y)是均衡前的灰度图像,I(x,y)是均衡后的灰度图像,这样所有图像就得到一致的均值和方差。3.1.3 Gabor小波特征提取把眼睛和嘴部作为Gabor特征维数的选取,其中我们去除网格大小,一律改用五种频率,用八个核函数Gabor小波进行
20、函数特征抽取。在眉毛部位,我们选用三种频率,十二个核函数Gabor小波进行核函数特征抽取。Gabor小波变化对图片的微小改动有较好的提取能力,人脸表情主要在于局部的变化,基于这一点,可以使用Gabor小波变化来提取表情图片的特征向量,另外Gabor小波对于光线的改变没有太多的影响,使得其拥有很好的鲁棒性。目前,对于表情识别的研究大多是基于Gabor小波的特征提取,Gabor小波函数能够较好的反映视觉系统的变化。我们设定图像的灰度值I(x,y),图像本文采用的小波变化核函数如下(3): (公式3.2),(小波的核频率),其中选取(v=0,1,2,3,4,)五个频率,本文主要是对表情特征的选取,局
21、部细节和纹理特性是最主要的,而这些特性都属于高频部分,所以我们选取的参数尽量小一点。(k=0,1,2,3,4,5,6,7)八个方向,计算得到40个函数。我们选取这些函数进行图像卷积,可以得到卷积结果:Ouv(x,y)=|I(x,y)*guv(x,y)| (公式3.3)I(x,y)表示图像,Ouv(x,y)表示卷积结果,*表示卷积因子(2)。由于小波变化是对图像进行卷积实现的,卷积是对图像上给定范围区域内的像素灰度值进行乘积、累加的结果。所以,得到的小波系数图的值不会像像素的灰度值那样随着位置的改变发生剧烈变化,这就是Gabor变换具有对位置部敏感的性质(4)。图3.2是图像的小波变化结果:图3
22、.2 特征提取结果每幅表情图片的Gabor小波的特征向量可以这么定位,图片位置(x,y)位置的各个方向跟尺度位置的小波变化的幅值想结合,就可以得到这个点的小波特征数值,在将每个像素位置的Gabor小波特征向量组合,就可以得到图片的小波特征向量:X=(O0,0,O0,1O4.7)T (公式3.4)本文是五个尺度八个方向的小波函数,所以变换后得到的40个小波系数图,我们预处理的图像是128*128维的,提取后特征维数变成128*128*5*8,如此高的维数想用特征分类基本不可能,所以需要进行降维处理。3.1.4Gabor小波特征提取的实验结果一张人脸表情的图片的Gabor的特征表示就是图片与Gab
23、or小波的卷积效果,本实验利用MATLAB进行仿真,运用日本JAFFE表情图库,来实现特征提取。实验结果图3.3所示:图3.2 Gabor特征提取结果3.2 主成分分析(PCA)3.2.1 PCA介绍主成分分析(PCA)算法是一种建好的线性鉴别方法,目前被广泛的应用于图片的处理以及文字方面。3.2.2 PCA算法在多种测试变量中,m个参数面合成n个测试变量x=x1,x2,.,xn,对比发现,m远远比n小的多。一个随机测试向量在实际情况下可以表示为: x=Fy+e (公式3.5)F是有m*n的矩阵,e是误差。 相关矩阵Rx主要的特征值按照一定顺序排列,并且按F=UT变换,使误差降到最小。对于N中
24、维的数据,正交化的方式能够获得数据里的大多数变化,在最小的误差下,可以利用投影来实现重新整理组内数据。最有代表的数据降维方式,是利用保存大部分已知的结构,抽取少量有意义的成分。PCA算法是线性算法,无法满足一线非线性结构的数据。3.3.3 PCA算法经过Gabor小波变化后得到的特征数据维数高达16384维,后续处理十分困难。传统PCA是对PCA所有训练样本进行一次处理,而类内PCA是对每一种训练样本进行PCA处理,得到每类的训练样本最主要特征。类内PCA思想如下:设X=X1,X2,X3,Xi,,Xc是c类且总个数为N的训练样本总集,Xi=xi,j为第i类样本的集合,它有样本Ni个,且 i=1
25、cNi=N (公式3.6)其中i表示第i类样本集的类别(i=1,2,3,c),j表示当前样本集的当前样本的序号j=(1,2,Ni),xi,j表示第i类j个样本。假设要处理的第i类样本,则该类样本集为xi,1,xi,2,xi,Nj,i=1,2,c,该类样本的的产生矩阵为 i=1Nij=1Ni(xi,j-i)(xi,j-i)T (公式3.7) i=1Nij=1Nixi,j (公式3.8)是第i类表情训练样本的平均向量,与矩阵SVD定理(9)得到 i=1Nij=1Ni(xi,j-i)(xi,j-i)T=1NiMiMiT (公式3.9)其中Mi=xi,1-i,xi,2-i, xi,Nj-i,故构造矩阵
26、: Ri=MiTMi (公式3.10)由于xi,j的维数为(m*n)*1=128*128*1,所以i的维数16384*1,xi,j-i的维数也是(m*n)*1=16384*1,(xi,j-i)T的维数为16384*1,Mi的维数是16384*Ni*16384,MiMiT的维数16384*16384,MiTMi的维数为Ni*Ni,由于Ni是每类表情样本的个数,一般情况下,它远远小于16384.所以Ri的维数相对于i来说大大降低了。3.3.4 降维处理实验结果如前所述,特征提取时实验所用的训练样本的分辨率都是128*128,经过Gabor变换后如果直接进行分类,往往容易陷入“维数灾难”使得问题变得
27、实际上不可能实现。为此本文采用PCA降维的方法进行降维。由于Gabor特征在相邻像素间是高度相关和信息冗余的,所以只需要提取部分特征就足够了,因此首先对特征空间进行降维处理是非常有必要的,图3.3是降维效果图:图3.3 PCA降维处理结果3.5 本章小结本章将图像进行Gabor小波特征提取,由于Gabor小波变换会产生很高的维数,所以我们需要降低它的维数,主成分分析是一种很好的降低维数的工具,运用其中的一些算法,来实现其中的目的。4 极限学习机4.1 极限学习机介绍极限学习机(extreme learning machine)ELM是一种简单易用、有效的单隐层前馈神经网络SLFNs学习算法。2
28、004年由南洋理工大学黄广斌副教授提出。传统的神经网络学习算法(如BP算法)需要人为设置大量的网络训练参数,并且很容易产生局部最优解。极限学习机只需要设置网络的隐层节点个数,在算法执行过程中不需要调整网络的输入权值以及隐元的偏置,并且产生唯一的最优解,因此具有学习速度快且泛化性能好的优点。极限学习机(ELM)是基于神经网络的一种有效的算法,与传统的学习算法相比有很大的优势。近年来,多媒体技术日益进步,人们生活中产生了越来越多的图像,这些繁琐复杂的图像运用一般的分析以及识别技术根本无法识别,现在的图像分类模型面临严峻的挑战。极限学习机以及神经网络在图像识别中取得了一些较好的成果。4.2 ELM原
29、理 神经网络的结构可以看出,其实ELM是一个简单的SLFNs,其结构图如图4.1所示: f(x)m 1 . . . . .1iLLi1 . . . . . . . . . G(ai,bi,x) G(a1,b1,x) G(aL,bL,x)d1 . . . . . x图4.1 SLFNS结构图4.3 极限学习机算法 fN(x)=i=1NiG(wi,bi,xi),xRn,wiRn,iRm (公式4.1)是SLFNS的n个隐含神经元的输出。式(4-1)中:G(wi,bi,xi)是xi相对的第i 个隐含层神经元的输出数据;i=i1,i2,imT是连接权向量,这个向量是基于第i 个隐含层神经元与输出神经元
30、之间的。当函数g(x)被选定并且加性神经元时,第i个隐层神经元的输出结果将会改变,其结果为: G(wi,bi,xi)= g(wixi+bi),biR (公式4.2)式(4-2)中:wi=wi1,wi2,wimT是权向量。给定N个隐层神经元和激活函数G(wi,bi,xi),就存在i,wi,bi使极限学习机算法可以使N个样本点无线近似的接近零偏差,即: i=1NiG(wi,bi,xi)=tj,j=1,2,N (公式4.3)式(4-3)可以写成矩阵形式H=T。其中: (公式4.4)=1T,NTN*mT,T=t1T,tBTN*mT,式(4-4)中:隐含层输出举证H的第i列是关于输入x1,x2,xn的第
31、i 个隐层神经元的输出结果。神级网络的单项隐含层,极限学习机学习算法可以用于任何无限可以微分激活的函数,这一函数算法加大了神级网络前向激活函数的确定空间,传统的函数对于输入层和隐含层的偏差,这种偏差是不能随机选择的,但是该算法的输入层权值和隐含层的偏差是可以随机选择的,在网络的训练过程中,在参数训练确认之后,对输入层权值和隐含层偏差不需要进行调整,极限学习算法在训练数据的时候,隐含层矩阵H的的数值是永远不会变化的。因此,极限学习机算法的训练过程可以表示为寻找H=T的最小二乘解,假设隐含层神经元的个性N等于网络内的输入样本个数N,为了确定矩阵H是否可以判断为可逆矩阵,只有确定了输入权值跟隐含层偏
32、差才能确定。然而在大多数情况下,矩阵H 不是方阵,从而不可能有i,wi, bi(i=1,2,.N)使得H=T。但是可以求此线性系统的最小范数的最小二乘解:=H+Y,其中H+是矩阵H的Moore-Penrose 广义逆。ELM极限学习机算法与传统的一些算法相比,改算法处理数据更快,广泛性更加高,它可以解决很多其他算法不能良好解决的问题,比如一些算法不能解决一些局部问题,学习速度慢等问题。仿真结果表示,极限学习机算法在学习处理海量图库,在一些外界因素造成影响的同时,选用极限学习机算法的函数可以良好的解决这些问题,在处理激活函数的选取当中极限学习机算法有一定的问题依赖性。ELM极限学习机的算法是以下
33、步骤:步骤 1 任意确定输入层权值wi和偏差bi,i=1,,N。步骤 2计算隐层函数矩阵H。步骤 3 计算:=H+T,其中T=t1,tnTELM算法就如上所述,从2004年至今年,近来一些学者多算法进行了一些改进,其改进内容主要是对输入层和隐含层数值随着确定数值的优化、算出隐含层和输出层数值的优化,这样使ELM更加匹配与噪声数据集,核函数ELM以及加入了正则化项的损失函数、ELM和其它方法项结合等等。神经网络因为ELM和产生了一个新思路,也使得我们更加清楚的了解神经网络,但是还有一些问题有待我们去解决,比如隐含层节点的确定。ELM作为一个应用及其,我们可以将它应用到很多学科的研究以及应用。4.
34、4 极限学习机训练极限学习机(ELM)是一种前馈神经网络简单、快速、有效的算法,跟传统的基于梯度下降的学习算法相比极限学习机有很大的优势(7)。对于N个任意的各不相同的(xi,yi),其中 xi=xi1,xi2,xinTRn,yi=yi1, yi2,yinTRm (公式4.5)拥有L个隐层节点,前馈神经网络的输出可以表示为: fL(x)=i=1LiG(aixi+bi)ai,xi,biRn (公式4.6)ai=ai1,ai2,aimT是网络的输入层到第i个节点的输入权值,bi是第i个隐层节点的偏置;i=i1, i2,imT是第i个隐层节点的输出权值;aixi表示向量ai和xi的内积。如果这个具有
35、L个隐含层节点的前馈神经网络能以0误差逼近这N个样本,则存在ai,bi,i,使fL(x)=i=1LiG(aixi+bi)=yi,i=1,2,,L),那么H=Y,则: G(a1x1+b1) . G(aLx1+bL)H(a1,aL,b1,bL,x1,xN)=. . . . . . .G(a1xN+b1) . G(a1xN+b1) N*L 1T y1T . . = . Y= . .LT L*M yLT N*M (公式4.7)H被称作网络的隐含层输出矩阵,在极限学习机算法中,输出权值和偏差可以随机给定。这样隐层矩阵H就变成了一个确定的矩阵,这样前馈神经网络的训练就可以转化为一个求给输出权值矩阵的最小二
36、乘解的问题(11),只需要求出输入权值的最小二乘解就能完成网络的训练,输出权值矩阵可以有下式得到(8): =H+Y (公式4.8)4.5 本章小结极限学习机是基于神经网络的算法,是一种很好的分类器,它可以解决海量图像处理的问题,很好的解决了JAFFE图片较多的问题,本章将极限学习机跟支持向量机进行了对比,发现其能够很好的训练并且分类(12)。5 实验结果与分析5.1实验结果本实验采用了现在应用最广泛的日本女性表情数据库JAFFE进行实验,该数据由10个人的213幅图像组成,每个人展示生气、厌恶、害怕、高兴、悲伤、惊奇和中性7种基本表情各2到4幅图像,均为128*128的图像。实验坏境是MATL
37、AB2013b为工具,虽然整个算法复杂度较大,但是模块功能清晰,结构复杂度不高,识别系统能够结构接受。为了能够简洁的识别图片里的表情,本文在MATLAB里面添加了可视化,使得读取图片,以及特征处理可降维处理更加简洁,最后在运用ELM分类器进行分类,可视化视图如图5.1所示:图5.1 MATLAB可视化界面本次实验运用了日本JAFFE表情库,调试了多种表情,有悲伤、厌恶、恐惧、愤怒、惊奇、高兴、中性脸七种基本表情,图5.2是载入的待识别图像:图5.2 载入的待识别图像实现对图像进行Gabor小波特征提取,将算法写入MATLAB中,让MATLAB进行特征提取,图5.3是对图像进行特征提取以及进行降
38、维处理的实验结果:图5.3 图像Gabor小波特征提取结果图5.4是实验的识别结果:图5.4 ELM分类识别结果从实验派别成绩中察觉,高兴的识别成绩最高,其次是悲伤、惊奇,厌恶和悲伤表情识别率相对于高兴表情较低,最低的是中性脸,平均识别率80%,实验结果如表1所示:表1 表情识别率表情识别结果高兴中性惊奇愤怒恐惧厌恶悲伤识别率%平均识别率%高兴2910000096.6780中性0280001193.3惊奇0025031183.33愤怒0202312276.67恐惧0032222173.33厌恶0022321270悲伤0202242066.67本实验与不进行降维处理的实验结果比较,发现不进行降维
39、处理的图像识别率仅为68%,而进行过降维处理的图像识别率高达80%,这充分说明了降维处理的重要性。5.2 实验分析人脸表情识别是一个富有挑战的课题,随之智能化的发展,需要机器人、人机交互界面、医疗设备等方面能够对表情有一个很好的识别和分析,但是毕竟是一个机器,并不能像人类一样去思考判断。本文运用Gabor小波特征提取,由于特征提取之后产生了高维数,虽然运用了PCA降维处理,但是并不能完全让分类器分类并识别。上面的实验结果可以看出,高兴、悲伤等表情识别率比较高,因为它的表情特征变化比较明显,Gabor滤波器在这些特征点的输出比较强,这里的特征向量相对来说比较容易抽取,厌恶等表情特征变化不是很明显
40、,所以特征抽取效果比较差。在众多表情图片中,惊奇和恐惧、厌恶这三种表情比较难以分辨,因为这三组表情存在一定的相似之处,需要更加深入的提取它的一些细节特征,只有这样才能区分。实验中采用了近年来细节抽取中运用比较多的Gabor小波算法。在实验的特征抽取中,各类投影轴可以得到不同的识别率,对于抽取特征量后的Gabor系数采用PCA降维处理能达到较好的效果。本文的算法是Gabor小波算法以及PCA算法,最后用极限学习机训练,为了突出极限学习机对于海量图片处理的优势,我们将它与支持向量进行了对比,对比发现,极限学习机的分类效果比支持向量机要有很多的优势,表明极限学习机能够有效的用于分类。5.3 本章小结
41、本章主要阐述本论文的实验仿真,阐述仿真结果,以及一些误差分析,对一些误差分析其原因。参考文献1 罗亮, 金文表, 龚勋. 基于Gabor 小波和支持向量机的人脸识别J. 重庆大学学报(自然科学版),2008,20(1):230-2352 叶敬福, 詹永照. 基于Gabor 小波变换的人脸表情识别J.计算机程,2005,31(2):173-1743 朱健翔, 苏光大, 李迎春. 结合Gabor 特征与Adaboost 的人脸表情识别 J . 光电子激光, 2006, 8(3): 993-9984 罗飞, 王国胤, 杨勇. 一种基于Gabor小波特征的人脸表情识别新方法 J . 计算机科学, 20
42、09, 36 (4) : 181- 1835 MATLAB在数字图像处理中的应用_涂望明,2007,2(5):2-106 MATLAB在图像处理和分析中的应用_邓巍,2005,6(6):4-67 基于Gabor变换和极限学习机的贝类图像种类识别_杨靖尧,2013,7(7):10-308 在线极限学习机及其在图像识别中的应用,杨晶晶,2012,4(8):20-309 一种基于局部Gabor滤波器组及PCA_LDA的人脸表情识别方法_邓洪波,2007,2(9):15-3510 A. W. M. Smeulders, M. Worring, S. Santini, A. Gupta,R. Jain.
43、 Content-based image retrieval at the end of theearly yearsJ.IEEE Transactions on Pattern Analysis andMachince Intelligence, 2000, 22(10):1349 138011 董绍江,汤宝平,宋涛改进投票策略的morlet小波核支持向量机及应用震动、测试与诊断,2011.3(11):50-10012 焦李成,周伟达,张莉,等智能目标识别与分类北京:科学出版社2010(12):196-20213 邓万宇,郑庆华,陈琳。神经网络急速学习方法研究J。计算机学习报,2010,33
44、(7):279-28714 程建,应自炉,基于二维主分量分析的面部表情识别J。计算机工程,2006,31(4):32-3915 章品正,王征,赵宏玉,面部表情特征抽取的研究进展J,计算机工程与应用,2006,38(4):38-4216 杨智勇,许爱强,牛双诚。基于多信号模型的系统测试性建模与分析J。工程设计学报,2007,14(5):222-22417 彭辉,张长水,荣钢。基于K-L变换的人脸自动识别方法J.清华大学学报(自然科学版),2007,37(6):67-7018 陈陪俊。基于静态图像的人脸表情识别研究M。成都:西南交通大学,2007(5):20-3019 李云霞,李治柱,吴亚栋。基于HMM的关键词识别系统J。计算机工程,2004,30(7):130-13220 黄剑玲。利用MATLAB进行数字图像的分析和处理J.计算机现代化,2000,70(6):104-10721 李了了,邓善熙。MATLAB在图像处理技术方面的应用J.微计算机信息,2003,19(6):65-66致谢通过完成这篇论文,我学到了
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 急诊介入病例分享会:多学科协作与技术创新
- 肝硬化治疗与护理
- 南工院财务管理课件
- 小学生文明礼仪中队课件
- 囊性肾癌超声评价
- 2025年海南货运从业资格证模拟考试试题题库
- 高血糖急救与护理
- 培训养生馆销售课件
- DB5305∕T 157-2024 余甘子主要病虫害监测及防治技术规程
- 热力企业安全培训课件
- 小学音乐课歌唱活动流程
- 无菌技术及手卫生
- 托管机构转让合同范本
- 绿电制绿氢及其综合利用技术
- “临床营养科建设与管理指南”实施细则-I级标准化临床营养科建设示范基地
- 科学活动《自制饮水机》
- 初步设计及概算评估咨询服务方案投标文件(技术方案)
- 急性中毒的治疗与护理
- 收益法评估企业价值操作指导意见试行
- 《teamLab无界美术馆(上海)的运营模式分析案例》7200字
- 尘肺病诊断试题及答案
评论
0/150
提交评论