【精品】人脸识别技术是模式识别与人工智能的研究热点之一在生...65.doc_第1页
【精品】人脸识别技术是模式识别与人工智能的研究热点之一在生...65.doc_第2页
【精品】人脸识别技术是模式识别与人工智能的研究热点之一在生...65.doc_第3页
【精品】人脸识别技术是模式识别与人工智能的研究热点之一在生...65.doc_第4页
【精品】人脸识别技术是模式识别与人工智能的研究热点之一在生...65.doc_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

五邑大学本科毕业设计摘 要人脸识别技术是模式识别与人工智能的研究热点之一。在生物特征识别中,人脸识别占有极为重要的地位。它在访问控制、司法应用、电子商务和视频监控等领域都有广泛的应用。人脸特征提取是人脸识别过程的核心,特征提取的有效性直接影响到分类的速度和识别的性能。本文的主要研究内容包括以下方面:(1) 基于gabor变换的人脸特征提取算法。通过对人脸傅里叶变换和gabor变换的实验比较,证明了gabor变换在提取人脸特征方面具有很大的优越性。接着,介绍了gabor小波变换的快速算法。(2) 从基于图像整体代数特征pca算法着手,主要介绍了“特征脸”算法的原理和实现过程,对组成特征投影空间的特征值选择问题,距离度量方法问题及训练样本的选择等进行了一定的研究。(3) 研究了基于gabor小波变换的人脸识别算法。本文研究的算法首先对人脸进行gabor小波变换,然后应用pca方法降低gabor特征向量的维数,来实现对人脸的识别。实验表明,采用该方法得到的识别率要远优于单纯采用pca方法的结果。关键词 人脸识别;gabor小波变换;pca 33五邑大学本科毕业设计abstractface recognition technology(frt)is emerging as an active research area in the field of pattern recognition and artificial intelligence.as a biometric technology,frt has numerous applications such as access control,law enforcement,e-commerce,video surveillance and so on. face feature extraction is the core of recognition task,which directly impact on classification velocity and face recognition ability.the main contributions of this work are listed as follows:(1) face feature extraction algorithm based on gabor transform is introduced.compared with fourier transform,gabor transform is proved to be better in face feature extraction.and then,a fast algorithm of gabor transform is introduced.(2) based on algebraic features of the images,this paper first introduced the pca-based face recognition algorithm.some research has done on the selection of the eigenvector which used to create the eigen-space,the distance measure methods and the selection of the training set.(3) a face recognition algorithm base on gabor wavelet transform is studied the algorithm studied in this paper consists of three steps:gabor wavelet is first applied to face images,and then reduce the dimensionality of gabor eigenvector via pca. the improved performance of this new algorithm over pure pca algorithm is demonstrated by the experiments.key words face recognition gabor wavelet transform pca目 录摘要iabstractii第1章 绪论11.1研究的背景和意义11.2 人脸识别的研究现状21.3如何进行人脸识别-人脸识别的步骤及方法31.3.1人脸的图像表示31.3.2人脸的检测与定位31.3.3图像预处理31.3.4特征提取31.3.5分类器41.4 本文研究的主要内容4第2章 gabor小波变换62.1引言62.2 gabor小波变换的定义72.3 gabor变换在人脸识别中的应用82.4 gabor滤波器92.4.1 gabor滤波器参数的选择112.4.2 gabor滤波器的性质和计算方法122.4.3 gabor变换的人脸特征提取122.5 gabor快速算法图132.5.1快速傅里叶变换(fft)152.5.2gabor变换的快速算法162.6 本章小结17第3章 主成分分析(pca)183.1引言183.2 pca的基本概念183.2.1 pca原理183.2.2 主成分分析的具体算法193.3 用pca进行特征提取的经典算法eigenface算法203.3.1 特征脸空间203.3.2通过特征脸空间来识别人脸203.3.3 特征向量的选取223.3.4 距离测量223.4 程序的调试233.5 本章小结25第4章 基于gabor+pca的人脸识别264.1 引言264.2 使用pca降维的方法264.3 orl人脸库实验分析274.3.1实验1:算法的比较274.3.2 实验2:样本数目的选择284.3.3 实验3:采样因子的确定294.4 yale人脸库实验304.5本章小结31结论32参考文献33致谢34第1章 绪论1.1研究的背景和意义现代社会中,身份鉴定技术具有非常重要的应用价值,随着网络技术的发展,信息安全也显示出前所未有的重要性。在金融、保安、司法、网络传输等各个应用领域,都需要精确的身份鉴定1。但是现今的身份鉴别主要依靠id卡(如身份证、工作证、智能卡、存储卡等)和密码手段。但这些手段携带不方便、容易遗失,或者由于使用过多或不当而损坏、不可读和密码易被破解等。尤其是近年来电子商务的飞速发展,制假伪造的手段也越来越高明,传统的身份确认方法面临着严峻的挑战,并显得越来越不适应科技的发展和社会的进步。作为模式识别中的热门技术,生物特征识别(biometrics)由于提供了对唯一的,高可靠性和稳定性的人体生物特征的鉴别方法,成为身份鉴别的一个热门发展方向1。所谓生物特征识别1,就是根据不同人之间的身体(physical)的或者行为(behavioral)的特征的独特性,来唯一地把未知身份识别出来。身体特征包括:指纹、视网膜、虹膜、人脸等;行为特征包括签名、声音、步态等。有的识别是几种特征的结合,如身份识别可以结合人脸和指纹两个特征。日常生活中,人类每时每刻都通过感官自然而然地从外界获取想要的信息。这些信息中有大约80%是通过视觉得到的,因此,视觉信息处理在现代人工智能技术中占有极为重要的地位。而人脸数据的提取方式多种多样,既可取静态图像,也可取视频序列,背景还可以变化。人脸数据的提取对设备也没有特殊要求,既可对真人拍照或摄像,也可从照片扫描。更为重要的是人脸识别和人类通常的识别相一致,更易被接受。因此,人脸识别及其相关技术的应用前景是生物特征识别诸多技术中最被看好的。生物特征识别在国外发展很快2,我国截止2002年也已举行了三届生物特征识别研讨会3。1992年,samal总结了早期的人脸识别方法。后来,valentin讨论了人脸识别的神经网络模型。chellappa主要从工程应用方面对人脸识别进行了评述。而从不同角度出发的综述文章还有。两个有关人脸识别的国际会议afgr和avbpa的出现,充分说明了人脸识别的重要性。ieee模式分析与机器智能(pami)协会在1997年7月出版了有关人脸和手势识别的专刊,daugman这样写道“在未来的机器智能领域,我们将发现一个有趣的现象,即为建立具有类似人类外貌、表情、手势等特征的人机界面所做出的努力,将最终导致我们可以和机器随心所欲地交流”4。人脸识别在模式识别领域的发展和应用方面都有着重要意义:一是可以推进对人类视觉系统本身的认识;二是可以满足人工智能应用的需要。采用人脸识别技术,建立自动人脸识别系统,用计算机实现对人脸图像的自动识别有着广阔的应用领域和诱人的应用前景。人脸识别在社会交往中扮演着十分重要的角色,是人类在确定一个人身份时所采用的最普通的生物特征。相对于其它的生物特征识别技术来说,人脸识别具有以下技术优势:(1)直观、友好、方便。人脸识别不会对使用者造成心理上的障碍,并且比较符合人们的习惯,很容易被大多数用户所接受;(2)对用户的非干扰性。人脸识别不需要和设备直接接触,不需要被测试者的配合,在这一点上是其它识别方式难以取代的;(3)对硬件无特殊要求,可以借助于现有的硬件进行识别。数码摄像头、数码相机、数码摄像机等已经走进人们的日常生活,这为人脸识别的应用提供了有力的保障;(4)通过对人脸表情的识别,可以获得其它的生物特征识别技术难以得到的信息。1.2 人脸识别的研究现状 人脸识别的输入图像通常有3种情况:正面、倾斜、侧面。由于实际情况的要求,对人脸正面图像识别的研究最多,它的发展大致可分为3个阶段5:第一阶段以bertillon、allen和parke为代表,主要研究人脸识别所需要的面部特征。1893年,bertillon用一个简单的语句与数据库中某一张脸相联系,同时与指纹分析相结合,提供了一个较强的识别系统。为了提高脸部识别率,allen为待识别人脸设计了一种有效和逼真的摹写,parke则用计算机实现了这一想法,并产生了较高质量的人脸灰度图模型。这一阶段的工作特点是识别过程完全依赖于操作人员。显然这不是一种可以完成自动识别的系统。第二阶段是人机交互式识别阶段。20世纪70年代,美、英等发达国家开始重视人脸识别的研究工作并取得一定进展。1972年,goldstion,harmon和lesk用几何特征来表示人脸正面图像。他们采用21维的特征矢量表示人脸面部特征,并设计了基于这一特征表示法的识别系统。kaya和kobayashi则采用了统计识别方法,用欧氏距离来表征人脸的特征,如嘴唇与鼻子之间的距离,嘴唇的高度等。更进一步地,t.kanad(m.nagao)设计了一个高速且有一定知识导引的半自动回溯识别系统,创造性地运用积分投影法从单幅图像上计算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配。kanad的系统实现了快速、实时的处理,是一个很大的进步。相比之下,baron所做的工作较少为人所知:他先将图像灰度归一化,再用4个掩模(眼、鼻、嘴及眉毛以下的整个脸部)表示人脸,然后分别计算这4个掩模与数据库中每幅标准图像的相应掩模之间的互相关系数,第一章绪论以此作为判别依据。总的来说,这类方法需要利用操作员的某些先验知识,仍然摆脱不了人的干预。第三阶段是真正的机器自动识别阶段。从1990年代起,由于计算机、数字图像处理、模式识别等技术的发展,加上人们对人脸图像自动识别的迫切需求,人脸模式识别方法有了较大的突破,提出了多种机器全自动识别系统。1996年美国军方组织了人脸自动识别系统大赛,勒克菲勒大学的face1t系统获得冠军。最近,美国的lau公司研制的人脸图像自动识别系统,是以人眼辨别人脸的原理,基于生物测量学、人像复原技术开发的装置。用人脸1242个特征点,对人群中寻找的人进行定量定性识别,已经用在机场、火车站、公共场所、重点控制地区6。在人脸识别技术诞生至今的二三十年中,人们已提出了很多成熟、高效的识别算法,为工程应用提供了强有力的后盾。自从“911”事件以来,世界上对人脸识别系统的需求有了明显增长。对人脸识别的研究也是理论界的一个热点。目前世界上最有名的识别系统为visionics公司的“faceit”系统,在活动场景(人和照相机都是活动的)下,该系统的识别率仅为50%;而可控条件下,识别率可达80%以上。在中国,中科院计算所高文教授主持的863项目“面像检测与识别核心技术”通过鉴定。该系统会自动在人脸上选取103个点,然后通过分析面部皮肤反射属性、三维结构等特征进行识别,静态场景下识别准确率达到96.5。中科院自动化所和微软亚洲研究院也在进行这方面的研究。1.3人脸识别的步骤及方法chellappa给出的人脸识别定义是,给出静态或者视频图像,将其中的一个或多个人脸和存储于数据库中的人脸相比较,确定出图像或视频中各个脸的身份。一般要在输入之前对图像进行预处理,若有人脸存在,则将其从背景中分割出来。一般来说,一个完整的人脸识别系统包括。图像输入、人脸检测/定位、预处理、特征提取、分类器5部分。1.3.1人脸的图像表示计算机处理的图像是以数字形式表示的。如果仅从识别的角度出发,我们希望数字图像能够尽可能地保留原图像的信息,但在实践中,由于场合的不同,输入图像保留的信息是不一样的。灰度图像失去了颜色信息;二维图像则失去了深度等三维信息;红外图像仅和热辐射有关,分辨率太低;sketch图像则失去了纹理信息;上述几种图像都没有运动信息。除了图像形态,输入设备也不尽相同,有的图像是由ccd摄像头拍摄的,有的则是照片扫描或报纸扫描,还有可能是在web上下载的压缩图像,等等。由于应用环境的不同,所得图像的性质也是不同的,这实际上会影响到以后提取的特征也有所不同。本论文主要是在二维灰度(2d intensity)静态图像上进行人脸识别的研究。1.3.2人脸的检测与定位检测图像中是否有人脸,若有,将其从背景中分割出来,并确定其在图像中的位置。在某些可以控制拍摄条件的场合,如警察拍罪犯照片时将人脸限定在标尺内,此时人脸的定位很简单。证件照背景简单,定位也比较容易。在另一些情况下,人脸在图像中的位置是未知的,比如在复杂背景下拍摄的照片,这时人脸的检测与定位将受以下因素的影响:(1)人脸在图像中的位置、角度和不固定尺度以及光照的影响;(2)发型、眼镜、胡须以及人脸的表情变化等;(3)图像中的噪声。人脸检测的基本思想是用统计或知识的方法对人脸建模,比较所有可能的待检测区域与人脸模型的匹配程度,从而得到可能存在人脸的区域。其方法大致可分为基于统计和基于知识两类。前者将图像看作一个高维向量,从而将人脸检测问题转化为高维空间中分布信号的检测问题;后者则利用对人脸的认知知识建立若干规则,从而将人脸检测问题转化为假设/验证问题。1.3.3图像预处理图像特征提取之前一般需要做预处理。一般改善的方法有直方图均衡、图像锐化等。如果需要提取不同的频带信息,则进行相应的低通、带通或高通滤波。图像的边缘、梯度信息的提取,消除照相机位置、方向的影响和相机抖动,某些背景的去除等也属于预处理操作。背景的去除是必要的,否则人脸识别将不是“pure”人脸识别。还有几何归一化和灰度归一化。前者是指根据人脸定位结果将图像中的人脸转换到同一位置和大小;后者是指对图像进行补偿等处理,以克服光照变化的影响。1.3.4特征提取特征提取就是采用某种表示方法表示检测出的人脸与数据库中的人脸,表示方法不同,代表了人脸不同方面的信息。在特征提取之前,一个重要的问题是消除姿态、光照变化的影响。通常采用的人脸表示方法包括几何特征(如欧式距离、曲率、角度)、代数特征(如矩阵特征向量)和固定模板特征。识别人脸主要依据那些在不同个体之间存在较大差异而对于同一个人则比较稳定的特征,具体的特征形式随识别方法的不同而不同。常用的人脸表征方法有:几何特征,主分量分析,线性判别分析,独立分量分析,gabor小波变换、离散余弦变换等;早期研究较多的静态人脸识别方法有基于几何特征的人脸识别方法和基于相关匹配的人脸识别方法。目前,静止图像的人脸识别方法主要有3个研究方向:基于统计的识别,包括特征脸(eigenface)方法和隐马尔科夫模型(hidden markov model)方法;基于连接机制的识别,包括一般的神经网络方法和弹性图匹配(elastic graph matching)方法;其它一些综合方法或处理非二维灰度图像的方法。1.3.5分类器分类器的设计是模式识别的难点。在人脸识别中,常用的分类器有以下几种:最小距离分类器(nc)相似度量是以检测样本到类中心的距离大小为判据。最近邻分类器(1-nn,k-nn)相似度量以检测样本到模板的距离为判据。当模板库中每类只有一个模板时,nn就退化为nc。距离的测度主要有l1范数、l2范数,马氏距离,hausdorff距离等。贝叶斯分类器如果知道各类的先验分布和条件分布,就可以采用最大后验估计(map)的方法进行分类。在人脸识别中,有时假定人脸服从高斯分布,能够得到不错的结果7。支撑向量机(svm)是基于结构风险最小化得出的。尤其在小样本情况下,既降低了训练集的错分风险,又降低了未知人脸(如检测集)的错分风险。在人脸识别中已逐渐得到应用。神经网络分类器(nnc)。采用神经网络作为分类器是很自然的。一般一个3层网络对应模式识别中图像输入、特征提取、分类3部分。通常的nnc有多层感知机(mlp)模型、bp网络、径向基函数网络等。svm也借鉴了神经网络的思想。1.4 本文研究的主要内容基于人脸识别技术在当今社会的重大意义,本文主要研究了gabor小波变换和pca算法在人脸识别的应用。人脸识别的核心问题,就是如何将人脸的特征抽取出来,并得到对应于不同分类方法进行分类。因此算法的好坏就直接影响了最终的正确识别结果。算法的好坏主要体现在提取特征的效率和准确率。本论文主要探讨gabor小波变换和pca算法的优点。其中,仿真实验是基于orl人脸库和yale人脸库上进行测试的。首先,本文将研究gabor小波变换的性质及其在图像处理上的优点。用gabor小波变换研究人脸识别,事实上就是gabor滤波器的设计,gabor滤波器在图像处理中的特征提取、纹理分析和立体视差估计等方面有许多应用。gabor滤波能够体现出不同的方向性和尺度性。gabor函数从实质上来说是一个gauss函数窗所限制的滤波函数。通过定义不同的gabor函数核,就可以得到一组gabor滤波器。通常将灰度人脸图像记为i(x,y),再分别各个gabor滤波器进行卷积,即可得到人脸图像的gabor小波表示。然后,再探讨pca算法的原理,pca算法是一种经典的算法,由于pca变换基函数的个数往往远小于信号的维数,因此pca变换能够大大降低数据的表示维数。这对图像识别中的特征提取非常有利。pca算法是根据样本点在多模式空间的位置分布,以样本点在空间中变化最大方向,即方差最大的方向,作为判别变量来实现特征的提取。因此比较适合用于gabor变换后的降维。最后分别在orl和yale两个人脸库进行实验,不断改进算法模型,不断向识别率高,识别效率高改进。第2章 gabor小波变换2.1引言gabor展开是一种同时用时间和频率表示一个时间函数的方法,而求解gabor展开系数的公式被称为gabor变换。传统的gabor变换的缺点是窗口尺寸一经确定就无法更改,因此不具有变焦特性,无法对信号进行多分辨率分析。为解决这一问题人们将gabor理论同小波理论相结合,提出了gabor小波。gabor小波具有小波变换的多分辨率特性,同时具有gabor函数本身所具有的局域性和方向性。 标准傅立叶变换是数字信号处理的有利工具,然而它只能反映信号在整个实轴的整体性质,而不能反映信号在局部时间范围中的特征。对于图像,我们关心的往往是局部的特征,如图像边缘,由于标准傅立叶变换不能同时在时域和频域具有对信号的局部分析能力,dennis gabor于1946年在他的论文中,为了提取信号傅立叶变换的局部信息,引入了一个时间局部化“窗函数”,其中参数用于平移动窗以便覆盖整个时域。实际上,gabor使用了一个gaussian函数作为窗函数。因为一个gaussian函数的傅立叶变换还是一个gaussian函数,所以傅立叶逆变换也是局部的。gabor变换是唯一能够达到时频测不准的下界的函数,是图像表示中一种较好的模式,它的最大优点在于它能够达到交叉熵的最低边缘,能够最好地兼顾信号在时域和频域的分辨率,而且人类的视觉系统对于这种函数有非常好的匹配特性。gabor函数的这些特性,使得它在信号处理中获得广泛的应用,特别应用于低级视觉如纹理分割、光流估计、数据压缩和边缘检测等。gabor变换虽然在一定程度上克服了标准傅立叶变换不具有局部分析能力的缺陷,且能最好地兼顾信号在时城和频域地分辨率,但它同时也存在着自身不可克服的局限,即当窗函数确定后,窗口的形状就确定了,因此gabor变换是一种单一分辨率的分析8。 目前gabor变换和gabor展开已被公认是信号与图像表示的最好的方法之一。gabor变换中要解决的最基本问题是:在给定综合窗下如何求解分析窗及gabor变换系数。gabor变换广泛应用的困难也就是在于找不到一种简单的计算变换系数的方法,因为gabor基本函数彼此之间互不正交。近十几年来,围绕这一问题国内外相继提出了很多解决方法,最主要的有以bastiaans、wexler和qian等人为代表的解析法,daugman等人提出的神经网络方法以及ibrahim等人提出的自适应学习算法等等。但不论上述哪一种方法,均为复数形式的gabor变换。gabor基本函数、gabor展开系数、双正分析窗函数求解的约束条件式及gabor展开式都是复数形式,计算量很大。为了简化gabor变换的计算,提出了一种实数形式的离散gabor变换(rdgt)方法,这种方法类似于复数形式的离散gabor变换的解析理论体系,并可采用快速的离散hartley变换算法计算gabor变换系数,尤其是实数形式的离散gabor变换系数与复数形式的离散gabor变换系数的实部和虚部有着非常简单的加减关系,因此前者的计算完全可以替代后者的计算,从而达到大大减小gabor复变换系数计算量的目的;同样,在信号的重建方面,实数形式的离散gabor逆变换也比复数形式的离散gabor逆变换快得多,并且在实际应用中,实值gabor变换更方便于软件和硬件的实现910。2.2 gabor小波变换的定义由于fourier变换存在着不能同时进行时间和频率局部分析的缺点,1946年gabor提出了一种加窗的fourier变换方法,它在非平稳信号分析中起到了很好的作用。在fourier变换中,把非平稳信号过程看作是一系列短时平稳信号的叠加,而短时性是通过时间上加窗来实现的。整个时域的覆盖是由参数的平移达到的。换句话说,该变换是用一个窗函数与信号相乘实现在附近开窗和平移,然后施以fourier变换,这就是gabor变换也称短时fourier变换或加窗fourier变换。gabor变换的定义由下式给出:对于, (2-1) 其中是积分核。该变换在点附近局部测量了频率为的正弦分量的幅度。通常选择能量集中在低频处的实偶函数;gabor采用高斯(gauss)函数作窗的函数,相应的fourier变换以后仍旧是gauss函数,从而保证窗口fourier变换在时域和频域内均有局部化功能。令窗口函数为,则有 (2-2)式中a决定了窗口的宽度,的fourier变换用表示,则有 (2-3)由以上可以得到 (2-4)显然,信号经过gabor变换按窗口宽度分解了的频谱,提取出它的局部信息。当在整个时间轴上平移时,就给出了fourier的完整变换。相应的重构公式为: (2-5)窗口fourier变换是能量守恒变换,即 (2-6) 这里应注意,积分核对所有和都有相同的支撑区,但周期数随而变化。支撑区是指一个函数或信号的自变量的定义域,当在定义域内取值时的值域不为零,在支撑区之外信号或过程下降为零。 为了研究窗口fourier变换的时频局部化特性就要研究和的特性。这里是的fourier变换。由于fourier变换是能量守恒的,所以有parseval定理存在。即: (2-7)这里的和分别是和的复共轭函数,当为实数时,两种表示是相等的。如果把上述函数乘积的积分运算用内积符号表示,则有 (2-8)其中和都是在实数域的平方可积函数。由此: (2-9)当时有: 其中叫做的范数。这一表达式的物理意义是fourier变换的时域和频域的一对共扼变量具有对易关系,从而使fourier变换与加窗口的fourier变换具有对称性。如果用角频率变量代替时间变量,用频域窗口函数代替时域窗口函数则可得到: (2-10) 这里是时域窗口函数的fourier变换。该式的意义在于频域中的信号通过窗口函数的加窗作用获得了在频域附近的局部信息即: (2-11)如果选用窗口函数在时域和频域均有良好的局部性质,那么可以说fourier变换给出了信号的局部时一频分析。这样就有利于同时在频域和时域提取信号的精确信息。2.3 gabor变换在人脸识别中的应用 campben和robson提出并在心理学实验中证实,人类的视觉具有多通道和多分辨率的特征,因此,近年来基于多通道、多分辨率分析的算法受到广泛重视11。在诸如信号检测、图象压缩、纹理分析、图象分割和识别等领域,gabor小波得到了非常广泛的应用。大量基于简单细胞接受场的实验表明,图像在视觉皮层的表示存在空域和空频域分量,并且可以将一幅图像分解为局部对称和反对称的基函数表示,gabor函数正是这种基信号的良好近似。lee.t.s用zd一gabor小波来表征图像,将daubeehies的一维框架理论拓展到二维,并证明在一定条件下,zd一gabor小波是紧框架,原图像能从小波系数重建,因此用小波变换的系数幅值作为特征来匹配有着良好的视觉特性和生物学背景,gabor小波的这些特性使得其对于亮度和人脸表情的变化不敏感,在人脸识别和图像处理中有着广泛的应用。lades等首先提出用基于gabor变换的弹性图匹配算法进行人脸识别。节点上的gabor滤波响应作为人脸特征,通过特征匹配和节点几何位置的匹配实现人脸识别。2.4 gabor滤波器 在实验室中我们用的最多的是gabor滤波器。根据gabor变换的原理和实际需要,可构造不同的gabor滤波器。gabor滤波器在图像处理中的特征提取、纹理分析和立体视差估计等方面有许多应用。有研究表明神经细胞的感受也可以用gabor函数来表示。gabor滤波能够体现出不同的方向性和尺度性。gabor函数从实质上来说是一个gauss函数窗所限制的滤波函数。通过定义不同的gabor函数核,就可以得到一组gabor滤波器。gabor核函数的定义: (2-12)gabor滤波可以定义为: (2-13)下面我们对式(4-12)中的各项参数作一个说明:是一个振荡函数,实部为余弦函数,虚部为正弦函数。是gauss函数,这实际上是通过加窗限制了函数的范围,使其在局部有效。由gauss函数的局部性可知,这个滤波器实际上抽取x附近的特征,因此可以看作是一种gabor小波。是直流分量,这样滤波器就可以不受直流分量大小的影响。 向量描述了滤波器对不同方向和不同尺度的响应,通过选取一系列的,就得到了一族gabor滤波器,是一个常量,和一起刻画了gauss窗的波长。这里取=/2,可以表示为: 这里 (2-14)选取不同的下标可以描述不同的gauss窗波长,从而控制采样的尺度。选取不同的下标可以描述振荡函数不同的振荡方向,从而控制采样的方向。我们这里选取=0 ,.,4这样可以在5个不同的尺度上采样。选取=0 ,.,7这样就可以在8个不同的方向上采样13。各个滤波器窗口的大小为3232,确定滤波器的所有参数(可自己决定)后,当采取上述的参数后,可得如下图2-1的40个滤波器。图2-1 gabor 5个尺度8个方向的滤波器族的实部2.4.1 gabor滤波器参数的选择 由于不同,u代表了不同的采样方式,因此需要保证在不同的尺度和不同方向上的采样尽量均匀。一些研究表明0, 区间可以描述所有的方向,因此只需对区间0, 进行采样。也就是说:+方向上的滤波完全可以由?方向的结果确定。由于的变化是连续的,不可能取无穷多个,必须对其进行离散均匀采样。因此这里我们选取作为采样间隔,反映了空间尺度上采样。由于尺度的大小实际上决定于gauss窗的大小,而其窗长正比于,由于是在二维上的采样,因此其面积正比于。为了反映尺度上的合理采样,实验表明每次采样的面积成倍的方式递减比较合理,是一个常量,这就要求。gabor滤波器利用公式定义的卷积,就可以在图像每个不同的处得到个不同复值的滤波结果12。2.4.2 gabor滤波器的性质和计算方法 (1)gabor滤波器的性质1 gabor滤波器具有生物学的意义。gabor核函数与脊椎动物大脑视觉区域皮层细胞的感受行状十分类似。2 gabor滤波器能充分描述图像的纹理信息。gabor滤波特性说明了gabor滤波结果是描述图像局部灰度分布的有力工具。因此,图像的纹理信息可以用gabor滤波作为特征抽取的方法。3 对二维gabor滤波的研究表明,通过恰当选择若干个gabor核函数可以重构出原图像。4 gabor核函数由于去掉了直流分量,对局部光照影响不敏感。这和直接将图像的灰度特征作为模板相比,优势是很明显的。5 gabor滤波结果可以描述不同方向上灰度的分布信息。6 gabor滤波结果可以描述不同尺度上灰度的分布信息。一般来说,大尺度滤波可以描述全局性较强的信息,同时可以掩盖掉图像中噪声的影响,而小尺度滤波可以描述比较精细的局部结构,受噪声影响也大。7 核函数有良好的频域特性。gabor核函数在频域内的形状和空域内的形状完全相同。8 gabor滤波可以容忍图像有一定的平移、旋转、深度上的转动、尺度变化等情况。 (2)gabor核函数的计算方法由于输入的图像为灰度图像,这就是直接的离散化表示。从gabor核函数的定义公式可以看出,由于gauss窗函数的限制,gabor核函数只在一个局部非零,因此我们只需要对其局部进行离散抽样即可。抽样范围的大小由gauss窗的大小所确定,这里我们取作为抽样半径。2.4.3 gabor变换的人脸特征提取 根据以上分析,我们知道gabor变换在人脸特征提取方面具有很多优点,前面定义的gabor小波是一组带通滤波器,通过参数的选择,每一组滤波器具有各自的频率选择性和方向选择性,这样不同方向和尺度的滤波器覆盖整个频域,从而一幅人脸图像的gabor特征表示就是该图像和一族gabor小波卷积的结果。 假设表示一幅图像的灰度分布,则其gabor特征表示为: (2-15) 其中,是gabor核函数,是尺度,方向的gabor小波卷积结果。在这里,我们选用5个尺度8个方向的gabor小波,即0 ,.,4,0,.,7,其于参数设为以及为了包含不同的空间尺度和方向的gabor滤波特征,一般将一幅图像的所有尺度方向gabor滤波变换表示成一个级联的特征矢量。由于一般图像的维数比较高,直接将所有尺度、方向的gabor小波变换特征级联会导致维数大而难于处理,因此有必要对图像的各个gabor小波表示进行下采样处理,假设下采样因子为,则一幅图像的特征矢量为: (2-16) 从特征提取的角度出发,对人脸图像的不同尺度不同方向的gabor滤波可以认为是提取了人脸图像具有不同性质的特征,因此对于一般所采用的5尺度8方向的gabor小波,可以认为其对人脸图像的滤波得到了40组具有不同性质的特征矢量,一般都将这40组特征矢量简单级联成一个长特征矢量,然后在对该特征矢量进行学习和识别分类,而不考虑各组特征矢量的有效性问题,即哪些尺度和方向的gabor滤波特征更能反应人脸之间互相区别的本质特征。以下是gabor变换人脸提取特征的流程图: 下采样特征提取fft变换gabor核函数乘法器fft变换图像输入 图2-2 gabor变换人脸提取特征流程图 从以上流程图可以得出一幅人脸图像(如图2-3)经gabor小波变换后的结果,如图2-4所示:图2-3原始图像截取图2.5 gabor快速算法图 前面我们通过实验分析了gabor变换在人脸特征提取中的重要作用,在这一章中,我们就着重介绍gabor的快速算法。由于我们所说的gabor变换的快速算法是基于傅里叶快速算法而来的,所以我们先介绍傅里叶快速算法。离散傅里叶变换(dft)在信号的频谱分图2-4 gabor小波变换后的图像析、系统的分析、设计和实现中得到了广泛的应用,原因之一就是计算dft有很多的快速算法,快速傅里叶变换(fft)算法就是其中之一。在使用数字信号处理技术的各种各样的应用领域里,fft算法都起着极为重要的作用。设为n点的有限长序列,则其正变换dft为: (2-17) 逆变换oft为: (2-18) 通常我们用算法所需的乘法和加法运算次数,来衡量各种算法的复杂性和效率。这里的通常都是复数,于是整个dft运算就需要n2次复数乘法和n(n-1)次复数加法。因此,直接计算dft,乘法和加法的次数都与n2成正比。 当n较大时,计算量太大,无法得到实际的应用。2.5.1快速傅里叶变换(fft) 自从1965年图基(j.w.tuky)和库利(t.w.coody)在计算机数学(math.computer,vol.19,1965)杂志上发表了著名的机器计算傅里叶级数的一种算法论文之后桑德(g.sand)、图基等快速算法相继出现,又经人们进行改进,很快的形成一套高效运算方法,这就是现在的快速傅立叶变换,简称fft,这种算法使dft运算效率提高1-2个数量级,为数字信号处理技术应用于各种信号的实时处理创造了良好的条件,大大推动了数字信号处理技术的发展。 快速傅里叶变换的算法有很多,主要的算法有: 时间抽取(dit)基-2fft算法。这种算法是将输入序列在时域上的次序按偶数和奇数来抽取,对于任意一个n =2m点长序列的dft运算,可以采用m次分解,最后分解成2点的dft运算的组合,从而降低了运算量。dit的运算量为: 复数乘法次数:mp=(n/2)m=(n/2)log2n 复数加法次数:ap=nlog2n (1)频域抽取(dif)基2fft算法。与dit算法相对应,dif算法是把频域输出x(k)按k是偶数或是奇数,逐级分解成2点的dft运算,其原理与dit算法相对偶,运算量也与dit算法的相同,这里不再赘述。 (2)n为复合数的fft算法。这是统一的fft算法,而前面的dit算法、dif算法不过是在输入序列的列长为n=2的统一fft算法的特例而已。这种算法是把dft的运算通过分解成很多短长度的dft来完成的.如果能分解成4点或2点的dft,因不需要乘法,可减少旋转因子的数量,运算量更少。n为复合数时的fft算法,采用下标映射是个关键,然后再分别对列(或行)和行(或列)求小点数长度的dft,并用旋转因子做各小点数dft间运算的媒介,但这同时也带来了运算量的增加。 若复合数n=lm,则其fft的运算量大致为: 复数乘法次数:n(m+l+1) 复数加法次数:n(m+l-2) 分裂基fft算法(srfft)。这是一种利用将基-2和基-4于变换的不同部位,进一步改善固定一基和混合一基的算法,其基本思路是对偶序号输出使用基-2算法,对奇序列输出使用基-4算法,将大点数的dft逐级分解成小点数的dft运算。由于分解的不对称性,算法结构比固定-基算法稍微复杂一些,是目前针对n =2m的算法中具有最少乘法和加法次数的,又允许以同址计算和蝶形方式实现,所以被认为是最好的快速傅里叶变换算法。其运算量为: 实数乘法次数:nlog2n-3n+4 实数加法次数:nlog2n-3n+4(3)素因子算法(pfa)。当复合数n可以按照good映射分解为几个互素因子的乘积时,其fft变换就可以避免旋转因子的影响。pfa算法就是采用了good映射,将长度为n=n1*n2的一维dft转换成尺寸为n=n1n2的二维dft,然后以行列方式沿每一维采用最有效的算法计算这个二维的dft。该算法的运算量为:乘法次数:m(n)=n2m(n1)+n+n1*m(n2)其中m(n)表示计算n点dft需要的总乘法次数。 (4)winograd傅里叶变换算法(wfta)。该算法利用了good映射将长度为“大n”因子的dft分解成若干“小n”因子的连乘,再利用“小n”因子的dft,就可以得到“大n”因子的dft。“小n”因子的dft是指2,3,4,5,7,8,9和16点的dft。wfta算法结构比fft复杂的多,程序编译的时间也长,但运算速度比较快。wfta算法被证实为具有最少的乘法和加法次数的算法,该算法除了用到下标映射外,还涉及到数论和近代数的知识。 (5)实序列的fft。对于输入为实数序列的fft没有必要专门编写实数据的fft,而是直接利用复数据fft进行计算。利用dft奇偶对称性质,可以用一个n点的fft同时运算两个n点实序列,或者是用一个n点的fft运算一个2n点的实序列。前者是把一个实序列作为实部,同时另一个实序列作为虚部,计算fft后再把输出按奇、偶、虚、实特性加以分离,后者是将2n长的实序列的偶序号置为实部,奇序号置为奇部,同样在计算fft后再加以分离。用一个n点的fft运算一个2n点的实序列的运算量为: 乘法次数:m2f=n/2(4+log2n) 加法次数:a2f=n(4+log2n)主要有4类计算二维fft的方法。即行一列算法、矢量一基算法(vr)、嵌套算法、多项式变换算法。行一列算法实现最容易,仅要求有效的一维fft算法即可。而多项式变换因为具有最低的算术复杂性,同址计算的可能性和实现工作量不大的优点,受到人们的普遍重视。二维fft的一个重要参数是考虑存储器的存取次数。更高维的fft变换可以类似得到,但在实际应用中采用的不多。2.5.2gabor变换的快速算法 我们只要把gabor变换转换成傅立叶形式,根据fft快速算法将乘法转换成加法就可以了。下面我们对其做具体的介绍。dft的卷积公式定义如下: 若,dft=x(),dft=h(),则 =idftx()h(),但是,我们需要注意的是:进行的是循环卷积,循环卷积的定义如下:其中: 表示的圆周移位序列, 其实质上与的含义类似。从直观上说,就是对两个卷积的函数重叠部分以外都用周期延拓的方式填充。 线性卷积的定义如下:从直观上说,就是当两个卷积的函数重叠部分以外都用零填充。在实际中我们提取特征需要的是线卷积的结果。如果将序列和都适当的补零,设长度为i,长度为m,则当我们将和都补零到长度为时,圆卷积和线卷积结果相同。在实际实验中,我们将滤波器组和图像都补零到256,这样可以满足上面的补零要求。在这种情况下,对于一幅图像,如果我们的滤波器组是事先计算好的,则只需要进行1个fft(对图像),40个乘法(图像fft的结果与滤波器相乘),40个工fft(对相乘结果进行)。同时256是2的8次幂,2d-fft的计算复杂度为n2log2n。由此,复杂度大大减少。2.6 本章小结 本章主要介绍了gabor小波变换的具体原理和实际应用,及用于人脸识别的具体算法,事实上,gabor小波变换最主要就是一个滤波器设计的问题,通过采取不同的方向和尺度,不同的波长和频率,就可以得到不同的滤波器,本文是采用了一般所采用的5尺度,8方向的gabor小波,同时取,可以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论