人脸识别技术研究毕业论文.doc_第1页
人脸识别技术研究毕业论文.doc_第2页
人脸识别技术研究毕业论文.doc_第3页
人脸识别技术研究毕业论文.doc_第4页
人脸识别技术研究毕业论文.doc_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人脸识别技术研究毕业论文目 录第1章 引 言61.1人脸识别技术的应用与难点61.1.1人脸识别技术的广泛应用61.1.2人脸识别技术的难点81.2人脸识别技术的发展与现状81.2.1人脸识别技术发展的三个阶段91.2.2国内外发展现状91.3人脸识别的研究内容与主要方法101.3.1人脸识别的研究内容101.3.2人脸识别的视觉机理111.3.3人脸识别系统的组成111.3.4主要的人脸识别方法121.4人脸识别测试数据库161.5本文的主要内容17第2章 基于主分量分析的人脸识别方法182.1引言182.2主分量分析的理论基础182.2.1多维统计数据的线性变换192.2.2主分量分析方法202.3基于主分量分析的人脸识别方法212.3.1基于主分量分析的人脸特征提取212.3.2基于主分量分析的人脸分类识别222.4实验结果及分析242.5本章小结27第3章基于独立分量分析的人脸识别方法283.1引言283.2独立分量分析的理论基础283.2.1独立分量分析与盲源分离283.2.2独立分量分析的线性模型293.3基于独立分量分析的人脸识别方法303.3.1人脸图像的预处理313.3.2基于独立分量分析的人脸特征提取323.3.3独立分量的排序及选择343.3.4基于ICA系数的人脸分类识别353.4独立分量分析的算法研究353.4.1 Informax算法363.4.2Fast ICA算法及其改进373.5实验结果及分析393.6 本章小结41第4章 基于隐马尔可夫模型的人脸识别方法444.1 引言444.2 隐马尔可夫模型的理论基础444.2.1马尔可夫链444.2.2隐马尔可夫模型464.2.3 隐马尔可夫模型中的三大问题474.2.4隐马尔可夫模型的类型484.3 基于隐马尔可夫模型的人脸识别方法概述484.3.1 基于HMM人脸识别的基本原理484.3.2 基于HMM人脸识别的系统概述494.4基于一维隐马尔可夫模型的人脸识别方法494.4.1特征提取504.4.2模型训练504.4.3分类识别524.5 基于伪二维隐马尔可夫模型的人脸识别方法524.6 基于I以特征和SMV/1翎以的人脸识别方法534.7 实验结果及分析544.8 本章小结56第5章 结束语575.1人脸识别方法评估575.1.1 人脸识别方法评估的性能指标575.1.2 本文中人脸识别方法的评估结果585.2本文工作的总结及进一步研究方向的展望595.2.1本文的主要工作595.2.2进一步研究方向的展望60参考文献62第1章 引 言1.1人脸识别技术的应用与难点人脸是自然界存在的一种特殊的、复杂的视觉模式,它包含着极其丰富的信息。首先,人脸具有一定的不变性和唯一性,人脸识别是人类在进行身份确认时使用的最为普遍的一种方式,其次,人脸图像还能提供一个人的性别、年龄、种族等有关信息。人类在人脸识别中所表现出来的能力是令人惊异的,但是让计算机能够识别人脸,却是非常困难的问题。迄今为止,人脸识别的认知过程和内在机理仍然是一个未解之谜,如何实现一个自动的人脸识别系统仍然是一个悬而未决的难题。 从上个世纪六十年代以来,随着计算机和电子技术的迅猛发展,人们开始利用计算机视觉和模式识别等技术对人脸识别进行研究。近年来,随着相关技术的不断发展和实际需求的日益增加,人脸识别已经引起了越来越多的关注,成为了信息处理和人工智能等领域研究的热点之一,新的研究成果和实用系统也不断涌现。1.1.1 人脸识别技术的广泛应用一项技术的问世和发展与人类的迫切需求是密切相关的,飞速发展的社会经济和科学技术使得人类对安全(包括人身安全、隐私保护等)的认识越来越重视。人脸识别的一个重要应用就是人类的身份识别。一般来说,人类的身份识别方式分为三类:a.特殊物品,包括各种证件和凭证,如身份证、驾驶执照、房门钥匙、印章等;b.特殊知识,包括各种密码、口令和暗号等;c.人类生物特征,包括各种人类的生理和行为特征,如人脸、指纹、手形、掌纹、虹膜、DNA、签名、语音等。前两类识别方式属于传统的身份识别技术,其特点是方便、快捷,但致命的缺点是安全性差、易伪造、易窃取。特殊物品可能被丢失、偷盗和复制,特殊知识容易被遗忘、混淆和泄露。相比较而言,由于生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此生物特征是身份识别的最理想依据。基于以上相对独特的生物特征,结合计算机技术,发展了众多的基于人类生物特征的身份识别技术,如NDA识别技术、指纹识别技术、虹膜识别技术、语音识别技术和人脸识别技术等。表1-1为各种生物识别技术的综合比较。表1-1 各种生物特征识别技术的综合比较生物识别技术在上个世纪己经有了一定的发展,其中指纹识别技术己经趋近成熟,但人脸识别技术的研究目前还处于起步阶段。指纹、虹膜、掌纹等识别技术都需要被识别者的配合,有的识别技术还需要添置复杂昂贵的设备。人脸识别则可以用已有的照片或是摄像头远距离捕捉图像,无须特殊的采集设备,系统的成本低。并且自动人脸识别可以在当事人毫无察觉的情况下即完成身份确认识别工作,这对反恐怖活动等有非常重大的意义。由于人脸识别技术具有如此之多的优势,因此它的应用前景非常广阔,已成为最具潜力的生物特征识别技术之一。本文将人脸识别技术的各种应用及其特点总结在表1-2中。表1-2 人脸识别技术的应用 人脸识别最初的应用源于公安部门关于罪犯照片的存档管理和刑侦破案。现在该技术在安全系统、商业领域和日常生活中都有很多应用,主要有以下几类应用: 1.刑侦破案。当公安部门获得罪犯的照片后,可以利用人脸识别技术,在存储罪 犯照片的数据库中找出最相像的人作为嫌疑犯,极大的节省了破案的时间和人力物力。还有一种应用就是根据目击证人的描述,先由专业人员画出草图,然后用此图到库里去找嫌疑犯。罪犯数据库往往很大,由几千幅图像组成。如果这项搜索工作由人工完成,不仅效率低,而且容易出错,因为人在看了上百幅人脸图像后,记忆力会下降,而由计算机来完成则不会出现此问题。 2.证件验证。身份证、驾驶执照以及其他很多证件上都有照片;现在这些证件多由人工验证完成。如果应用人脸识别技术,这项工作就可以交给机计算机完成,从而实现自动化及智能管理。当前普遍使用的另一类证件是用符号或者条形码标记的,比如信用卡。这类卡的安全性比较低,可能遗失、被窃取,使用场合(比如自动提款机)的安全性也比较差。如果在这类卡上加上人脸的特征信息,则会大大改善其安全性能。 3.入口控制。需要入口控制的范围很广,它可以是重要人物居住的住所、保存重要信息的单位,只要人类觉得安全性比较重要的地点都可以进行入口控制,比较常用的检查手段是核查证件。人员出入频繁时,保安人员再三检查证件是很麻烦的,而且证件安全性也不高。在一些保密要求非常严格的部门,除了证件外,已经使用了生物特征识别手段,如指纹识别、掌纹识别、虹膜识别和语音识别等。人脸识别与这些技术相比,具有直接、方便和友好的特点。当前计算机系统的安全管理也备受重视,通常使用由字符和数字组成的口令(Password)进行使用者的身份验证,但口令可能被遗忘,或被破解,如果将人脸作为口令,则既方便又安全。 4.视频监控。在银行、公司、公共场所等处设有24小时的视频监控,如何对视频图像进行筛选分析,就需要用到人脸检测、跟踪和识别技术。 除了以上应用外,人脸识别技术还可以用于视频会议、机器人的智能化研究等方面。尤其从美国9.11事件后,人的身份识别问题更是提升到了国家安全的角度,如何利用人脸信息迅速确定一个人的身份成了各个国家重点研究的技术。1.1.2人脸识别技术的难点 虽然人类可以毫不困难地根据人脸来辨别一个人,但是利用计算机进行完全自动的人脸识别,仍存在许多困难。人脸模式的差异性使得人脸识别成为一个非常困难的问题,表现在以下方面: 1.人脸表情复杂,人脸具有多样的变化能力,人的脸上分布着五十多块面部肌肉,这些肌肉的运动导致不同面部表情的出现,会造成人脸特征的显著改变; 2.人脸随年龄而改变,随着年龄的增长,皱纹的出现和面部肌肉的松弛使得人脸的结构和纹理都将发生改变; 3.人脸有易变化的附加物,例如改变发型,蓄留胡须或者佩戴帽子和眼镜等饰物; 4.人脸特征遮掩,人脸全部、部分遮掩将会造成错误识别; 5.人脸图像的畸变,由于光照、视角、摄取角度不同,可能会造成图像的灰度畸变、角度旋转等,降低了图像质量,增大了识别难度。 所以很难从有限张人脸图像中提取出反映人脸内在的、本质的特征。另外人脸识别还涉及模式识别、图像处理、计算机视觉、生理学和心理学等学科领域。这诸多因素使得人脸识别至今仍是一个有待深入研究,极富挑战性的课题。同时一个成功的、具有商用价值的快速的人脸识别系统将会给社会带来极大的影响。1.2人脸识别技术的发展与现状 人脸识别的研究可以追溯到20世纪60年代末,最早的研究见于文献1。Bledsoe以人脸特征点的间距、比率等参数为特征,建成了一个半自动的人脸识别系统。人脸识别的发展大致经过了三个阶段,其中伴随发展了多样的人脸识别技术。1.2.1人脸识别技术发展的三个阶段 第一阶段一非自动识别阶段:主要研究如何提取人脸识别所需的特征。通过简单的语句描述人脸数据库成为待识别人脸设计逼真的摹写来提高面部识别率。这是需要手工干预的阶段。此阶段以Bertillon、Allen和Parke为代表。在Bertillon系统中,用了一个简单的语句与数据库中的某一张脸相联系,同时与指纹识别相结合,提供了一个较强的识别系统。为了提高面部识别率,Allen为待识别人脸设计了一种有效逼真的摹写2,Parke则用计算机实现了这一想法3,并且产生了较高质量的人脸灰度图模型。在此阶段,识别过程全部依赖于操作人员,所以不是一种自动识别的系统。 第二阶段一人机交互阶段:这一阶段虽然实现了一定的自动化,但还需要操作员的某些先验知识,仍然不是一个完全自动的识别系统。此阶段的代表性工作有:Goldstion、Harmon和Lesk等人用几何特征参数来表示人脸正面图像4。他们采用21维特征矢量表示人脸面部特征,并设计了基于这一表示法的识别系统。Kaya和Kobayashi则采用了统计识别的方法,用欧氏距离来表示人脸特征5,例如嘴和鼻子之间的距离,嘴唇的高度,两眼之间的距离等。更进一步的,T.Kanad设计了快速且有一定知识引导的半自动回溯识别系统6,创造性的运用积分投影法从单幅图像上计算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配。Kanad的系统实现了快速、实时的处理,是一个很大的进步。总的来说,上述方法都需要利用操作员的某些先验知识,始终摆脱不了人的干预。 第三阶段一自动识别阶段:这一阶段真正实现了机器自动识别,产生了众多人脸识别方法,出现了多种机器全自动识别系统。近十余年来,随着高速度、高性能计算机的发展,人脸识别方法有了较大的突破,提出了多种机器全自动识别系统7。近年来,人脸识别技术研究也非常活跃,除了基于K一L变换的特征脸方法与奇异值特征为代表的代数特征方法取得了发展外89,人工神经网络1011、隐马尔可夫模型小波变换等也在人脸识别研究中得到了广泛的应用1213,而且出现了不少人脸识别的新方法141516。本文将在1.3节介绍人脸识别的主要内容与方法。1.2.2国内外发展现状目前,国外对人脸识别问题的研究比较多,其中比较著名的有MTI、CMU、Cornell和Rockfeller等,MPEG标准组织也已经建立了专门的人脸识别草案小组。国际上发表的相关论文数量也大幅度增长,EIEE的著名国际会议,如EIEE International Conference on Automatic Face and Gesture Recognition、 International Conference on Image Processing、Conference on Computer Vision and Pattern Recognition等,每年都有大量关于人脸识别的论文。截至2005年3月,EIEE/IEE全文数据库中收录的关于“face”的文章8916篇,其中有关“face recognition”的3280篇,约占36.8%,并且每年的文献呈急剧上升趋势。同样在工程索引El中,至2005年3月,共有81657篇有关“face”的文献,数目是惊人的,并且2000年后快速增长。国内对人脸识别领域的研究起步较国外晚,但近十年来呈现飞速发展,据中国期刊网统计,1996年至2005年3月,有关“人脸”的文献1467篇,其中人脸识别领域的文章494篇,并且再近几年获得快速增长,也预示人脸识别领域得到快速发展。目前国内大部分高校有人从事人脸识别相关的研究,其中技术比较先进的有中科院自动化所、清华大学、浙江大学等。1.3人脸识别的研究内容与主要方法 自动人脸识别技术(AFR)就是利用计算机技术,根据数据库的人脸图像,分析提取出有效的识别信息,用来“辨认”身份的技术。人脸识别技术的研究始于六十年代末七十年代初,其研究领域涉及图像处理、计算机视觉、模式识别、计算机智能等领域,是伴随着现代化计算机技术、数据库技术发展起来的综合交叉学科。1.3.1人脸识别的研究内容人脸识别的研究范围广义上来讲大致包括以下五个方面的内容。1.人脸定位和检测(Face Detection):即从在动态的场景与复杂的背景中检测出人脸的存在并且确定其位置,最后分离出来。这一任务主要受到光照、噪声、面部倾斜以及各种各样遮挡的影响。2.人脸表征(Face Representation)(也称人脸特征提取):即采用某种表示方法表示检测出人脸与数据库中的己知人脸。通常的表示方法包括几何特征(如欧氏距离、曲率、角度)、代数特征(如矩阵特征向量)、固定特征模板等。3.人脸识别(Face Identification):即将待识别的人脸与数据库中已知人脸比较,得出相关信息。这一过程的核心是选择适当的人脸表征方式与匹配策略。4.表情姿态分析(Expression/Gesture Analysis):即对待识别人脸的表情或姿态信息进行分析,并对其加以归类。5.生理分类(Physical Classification):即对待识别人脸的生理特征进行分析,得出其年龄、性别等相关信息,或者从几幅相关的图像推导出希望得到的人脸图像,如从父母图像推导出孩子的脸部图像和基于年龄增长的人脸图像估算等。人脸识别的研究内容,从生物特征技术的应用前景来分类,包括以下两个方面:人脸验证与人脸识别。1.人脸验证(Face Verification/Authentication):即是回答“是不是某人?(Am I whom I claim I am?)”的问题。它是给定一幅待识别人脸图像,判别它是否是“某人”的问题,属于“一对一”的两类模式分类问题,主要用于安全系统的身份验证。2.人脸识别(Face Identification/Recognition):即是回答“是谁?(Who am I?)”的问题。它是给定一幅待识别人脸图像,在已有的人脸数据库中,判别它的身份的问题。它是个“一对多”的多类模式分类问题,通常所说的人脸识别即指此类问题,这也是本文的主要研究内容。1.3.2人脸识别的视觉机理近几年的研究表明17,人类视觉数据处理是多层次的过程,其中最低层的视觉过程(视网膜功能)起到信息转储作用,即将大量图像数据转换为较为抽象的信息,这一任务由视网膜中的两类细胞完成:低层次的细胞对空间的响应与小波变换作用类似,高层次的细胞则依据低层次细胞的响应,而作出具体的线、面乃至物体模式的响应。这表明在视觉处理过程中,神经元并不是随便的、不可靠的把视觉图像的光照强度投射到感觉中枢,它们可以检测模式单元,区分物体的深度,排除无关的变化因素,并组成一个令人感兴趣的层次结构。人脸识别不仅有着以上普通视觉过程的特点,而且具有以下独特之处18-2223。 1.人脸识别是大脑中一个特有的过程。针对人脸识别,大脑中存在一个专门的处理过程; 2.在人脸感知与识别过程中,局部特征与整体特征均起作用。若存在明显的局部特征,整体特征将不起作用; 3.不同的局部特征作用对识别的贡献也不同。在正面人脸图像中,头发、人脸轮廓、眼睛以及嘴巴对识别和记忆有着重要影响,鼻子的作用则不是很重要。但在侧面人脸识别中,鼻子对特征点的匹配很有作用。通常来讲人脸的上部比下部对识别作用更大些; 4.不同空间频率上信息的作用不同。低频信息代表了整体的描述,高频信息包含了局部的细节。对于性别的判断,仅利用低频信息就足够了,对于身份识别没有高频信息就无法完成; 5.光照对视觉有影响。有实验表明,从人脸底部打光会导致识别困难; 6.动态信息比静态信息更利于识别。研究还发现,对熟悉的人脸,人类的识别能力在动态场景中要高于静态场景; 7.十岁以下的儿童识别人脸较多的采用显著特征,而较少的使用整体分析; 8.不同的种族。性别的人脸识别的难易程度不同,这可能因为不同类型的人脸图像具有不同的特征; 9.面部表情的分析与人脸识别并行处理。通过对脑部受损的病人研究表明,表情的分析与识别虽有联系,但总体来说是分开处理的。 人脸识别是一种复杂的信息处理任务,它的研究涉及计算机技术、心理学和神经生理学。视觉机理、心理学和神经生理学的研究结果无疑将非常有益于人脸识别技术的发展,这些结论对于设计有效的识别方法起到了一定启发作用。但除少数文献外24,机器识别人脸的研究还是独立于心理学和神经生理学的研究的。1.3.3人脸识别系统的组成 在人脸识别技术发展的几十年中,研究者们提出了多种多样的人脸识别方法,但大部分的人脸识别系统主要由三部分组成:图像预处理、特征提取和人脸的分类识别。一个完整的自动人脸识别系统还包括人脸检测定位和数据库的组织等模块,如图1-1。其中人脸检测和人脸识别是整个自动人脸识别系统中非常重要的两个技术环节,并且相对独立。下面分别介绍这两个环节。图1-1人脸识别系统框图人脸检测与定位检测图像中是否有人脸,若有,将其从背景中分割出来,并确定其在图像中的位置。在某些可以控制拍摄条件的场合,如警察拍罪犯照片时将人脸限定在标尺内,此时人脸的定位很简单。证件照背景简单,定位也比较容易。在另一些情况下,人脸在图像中的位置预先是未知的,比如在复杂背景下拍摄的照片,这时人脸的检测与定位将受以下因素的影响: 1.人脸在图像中的位置、角度、不固定尺寸以及光照的影响; 2.发型、眼镜、胡须以及人脸的表情变化等; 3.图像中的噪声等。特征提取与人脸识别 特征提取之前一般需要做几何归一化和灰度归一化的工作。前者是指根据人脸定位结果将图像中的人脸变化到同一位置和大小;后者是指对图像进行光照补偿等处理,以克服光照变化的影响,光照补偿能够一定程度的克服光照变化的影响而提高识别率。提取出待识别的人脸特征之后,即可进行特征匹配。这个过程是一对多或者一对一的匹配过程,前者是确定输入图像为图像库中的哪一个人(即人脸识别),后者是验证输入图像的人的身份是否属实(即人脸验证)。 以上两个环节的独立性很强。在许多特定场合下人脸的检测与定位相对比较容易,因此“特征提取与人脸识别环节”得到了更广泛和深入的研究。近几年随着人们越来越关心各种复杂的情形下的人脸自动识别系统以及多功能感知研究的兴起,人脸检测与定位才作为一个独立的模式识别问题得到了较多的重视。本文主要研究人脸的特征提取与分类识别的问题。1.3.4主要的人脸识别方法 人脸识别技术作为模式识别领域的一个研究热点,每年都有许多相应的研究成果发表,并且涌现出各种各样的识别方法,可以说信息处理领域的各种新方法的研究和算法的改进都尝试在人脸识别中得到应用。文献2526对近十年来人脸识别领域取得的成果进行了总结。人脸识别方法的分类,根据研究角度的不同,可以有不同的分类方法,这是研究人脸识别方法首先遇到的问题。本文在深入研究国内外人脸识别技术的发展和研究成果的同时,将已有的不同的分类方法做一个比较,目的是希望能从不同角度认识人脸识别问题,在较全面的了解各种方法优缺点的基础上,给本文的人脸识别方法提供研究方向。 根据输入图像中人脸的角度,人脸识别技术可分为基于正面、侧面、倾斜人脸图像的人脸识别。由于实际情况的要求,对人脸正面模式的研究最多,这也是本文的研究内容。 根据图像来源的不同,人脸识别技术可分为两大类:静态人脸识别和动态人脸识别。静态人脸识别,即人脸来源为稳定的二维图像如照片。如果人脸的来源是一段视频图像,则人脸识别就属于动态人脸识别。在头部运动和表情变化状态下的人脸识别都可以看作动态人脸识别,如视频监视中的人脸识别。动态人脸识别具有更大的难度:首先,视频输出的图像质量较差:其次,背景较复杂,目前对动态人脸识别的研究还局限于简单背景,较少人物的情况,对静态人脸识别的研究比较多。本文的研究也是基于静止图像的。 根据人脸识别技术的发展历史,人脸识别方法大致可分为基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法和基于模型的人脸识别方法。a.基于几何特征的人脸识别方法这是人脸识别技术发展中,应用最早的方法。该方法是通过提取人脸的几何特征,包括人脸部件的归一化的点间距离、比率以及人脸的一些特征点,如眼角、嘴角、鼻尖等部位所构成的二维拓扑结构进行识别的方法。所构造的几何特征既要清晰区分不同对象人脸的差异,又要对光照背景条件不敏感,常规的几何特征量很难满足这些要求。因此该方法识别效果不理想。b.基于模板匹配的人脸识别方法基于模板匹配的方法,主要是利用计算模板和图像灰度的自相关性来实现识别功能。一般基于人脸的全局特征,利用人脸模板和相关参数如灰度的相关性来进行检测和识别的。Berto在27中将基于几何模型的人脸识别方法和模板匹配进行了全面比较后,得出结论:前者具有识别速度快和内存要求小的优点,但在识别率上后者要优于前者。增加几何特征对于基于几何特征的人脸识别方法只能轻微的提高识别率,因为要提高几何特征的提取质量本身就十分困难,而且随着图像质量的下降和人脸遮挡的引入,基于几何特征的人脸识别效果会大幅下降。总之,认为模板匹配法要优于几何特征法。c.基于模型的人脸识别方法通过统计分析和匹配学习找出人脸和非人脸,以及不同人脸之间的联系。该方法包括特征脸法(Eigenface)、神经网络方法(NN)、隐马尔可夫模型方法(HMM)和支持向量机(SVM)等方法。和模板匹配的方法相比,基于模型方法的模板是通过样本学习获得,而非人为设定。所以该方法,从原理上更为先进合理,实验中也表现出更好的识别效果。根据人脸表征方式(即特征提取)的不同,还可以将人脸识别技术分为三大类:基于几何特征的识别方法、基于代数特征的识别方法和基于连接机制的识别方法。a.基于几何特征的人脸识别方法该方法在上文中已有阐述,它将人脸用一个几何特征矢量表示,用模式识别中层次聚类的思想设计分类器达到识别目的。该方法的困难在于没有形成一个统一的、优秀的特征提取标准。由于人面部的模式千变万化,即使是同一个人的面部图像,由于时间、光照、摄影机角度等不同,也很难用一个统一的模式来表达,造成了特征提取的困难。不过,由于现在各种优秀特征提取算法(如动态模板、活动轮廓等)的提出,使得人脸的几何特征描述越来越充分。而且在表情分析方面,人脸的几何特征仍然是最有力的判据。b.基于代数特征的人脸识别方法这类识别法仍然是将人脸用特征矢量表示,只不过用的是代数特征矢量。该方法在实际应用中取得了一定的成功28。由于代数特征矢量(即人脸图像向各种人脸子空间的投影)具有一定的稳定性,识别系统对不同的倾斜角度,乃至不同的表情均有一定的鲁棒性。所以,也说明了这种方法对表情的描述不够充分,难以用于表情分析。c.基于连接机制的人脸识别方法这类识别法将人脸直接用灰度图(二维矩阵)表征,利用了神经网络(Neural Network,NN)的学习能力及分类能力2930。这种方法的优势在于保存了人脸图像中的纹理信息及细微的形状信息,同时避免了较为复杂的特征提取工作。而且,由于图像被整体输入,符合格氏塔(Gestalt)心理学中对人类识别能力的解释。与前两种识别方法相比,基于连接机制的识别法具有以下明显不同:信息处理方式是并行而非串行;编码存储方式是分布式。但由于原始灰度图像数据量十分庞大,因此神经元数目通常很多,训练时间很长。另外,完全基于神经网络的识别法在现有的计算机系统(冯一诺伊曼结构)上也有其内在的局限性。神经网络虽然有较强的归纳能力,但当样本数目大量增加时,其性能可能会严重下降。 本文根据人脸表征方法与特征综合方式的不同,认为将人脸识别方法分为基于几何特征的方法、基于模板匹配的方法和基于统计学习的方法,比较合适。此分类方法即符合人脸识别技术发展的历史,又将人脸特征提取与分类识别有机的结合在一起。识别人脸主要依据那些在不同个体之间存在较大差异,而对于同一个人比较稳定的特征,具体的特征形式和综合方式(分类方式)的不同决定了识别方法的不同。图1-2列出了主要的人脸特征与综合方法。早期静态人脸识别方法研究较多的是基于几何特征的方法和基于模板匹配方法。目前,静止图像的人脸识别方法主要是基于样本通过统计学习识别人脸的方法,主要研究方向有:基于代数特征的识别方法,包括特征脸(Eigenface)方法8和隐马尔可夫模型(HMM)方法31;基于连接机制的识别方法,包括一般的神经网络方法和弹性图匹配(Elastic Graph Matching)方法32,以及以上方法的一些综合方法。基于统计学习的方法属于基于整体的研究方法,它主要考虑了模式的整体属性。因为基于整体的人脸识别不仅保留了人脸部件的拓扑关系,而且也保留了各部件本身的信息。文献27认为基于整个人脸的分析要优于基于部件的分析,理由是前者保留了更多信息。对于基于整个人脸的识别而言,由于把整个人脸图像作为模式,那么光照、视角以及人脸尺寸会对人脸识别有很大的影响,因此如何能够有效的去掉这些干扰就尤为关键。神经网络的方法在人脸识别上有其独到的优势,即它避免了复杂的特征提取工作,可以通过学习的过程获得其它方法难以实现的关于人脸识别的规律和规则的隐性表达。但是NN方法通常需要将人脸作为一个一维向量输入,因此输入节点庞大,降维就显得尤为重要。根据文献32对于自组织神经网络方法的分析,认为可采用自组织神经网络的P个节点来表达原始的N个输入(Pm),降维后仍保存了数据中的主要信息。主分量分析是一种正交变换,在多维数据统计分析中是一个应用广泛的工具。假设原始向量特征维数为n,即xi=(xi1,xi2,xni)T,i=1,2,N,要求构造N个新的特征yl,y2,yn,并使它们满足以下的条件:a.每个新特征是原有特征的线性组合,即 (2-4) b. 各个新变量之间是不相关的,即相关系数为零: (2-5) c. wi使yi的能量达到极大,i=1,2,N 可以证明满足条件的城为样本的协方差矩阵Sx=EXXT,对应于i特征值的正交规范化的特征向量ui,满足以上条件的新特征y1,y2,yn分别称为样本点的第1,2,N个主分量。令W=(ul,u2,un)T,且满足正交归一化,即 (2-6)经过Y=WTX的变换之后,因为X的协方差矩阵SX为实对称阵必然与一个对角阵相似,所以对应于Y的协方差矩阵如下式: (2-7) 这就是说,新特征y1,y2, ,yn两两之间的协方差为零,即它们是不相关的。由于yi也是零均值,每个特征的方差数值Eyi2在一定意义下反映了它所包含的能量即信息量。由前面叙述可知,所有这些映射矢量作为基向量,便构成主分量分析对应的变换矩阵W=w1,w2,wm,wn,T其中前几个基向量wl,w2,wm,对应能量占主导地位的几个主分量的映射方向,现将余下的基向量置零,得到W=wl,w2,wm,0,0,,0T。利用W对信号进行近似恢复,得到x=WW Tx。其中W Tx为所选择的前m个主分量。重构信号的均方误差为E|x-x|2。当选择m个主分量去重构原信号时,由于原信号的维数nm,所以从信号维数的角度来讲PCA起到了对信号降维的作用。在很多情况下,有效的降维会使得在最大程度保持原信号中所蕴涵的信息的情况下,大大降低运算复杂度。譬如在进行人脸识别应用中,输入的人脸图像的维数往往很高,采用P以方法对其进行特征提取可以降低样本的维数,从而降低计算复杂度,提高了计算速度。 主分量分析是是一种基于统计特征的最佳正交变换,称其为最佳变换是因为它具有优良的性质,使变换后产生的新的分量正交或不相关。主分量分析也是一种最小均方误差(MSE)意义下的最优变换39。也就是说,变换后的信号能量主要集中在前几个主分量中,而由这少数几个主分量张成的子空间去重构原信号,逼近效果从最小均方误差意义下是最优的。主分量分析使变换矢量更趋确定,能量更趋集中等,这使得它在特征提取、数据压缩等方面都有着及其重要的作用。2.3基于主分量分析的人脸识别方法2.3.1基于主分量分析的人脸特征提取任何基于统计学习的模式识别系统都包括两个过程,一个是训练阶段(training Process),二是测试阶段(testing process),且两个阶段都需要特征提取,应用CAP的人脸识别系统也不例外。假定在训练阶段,数据库中有K个人,每个人有M幅人脸灰度图像,其中每一幅图像都用NxN的二维数组I(x,y)来表示,数组元素表示象素点的灰度值。同样,每一幅图像都可以视为一个N2xI的向量。因此,它等同于N2维的人脸象素域空间中的一个点。设xij表示一个N2xI的向量来表示数据库中第i个人的第j幅图像(0ik-1,0jM-1)然后,定义平均人脸如下: (2-8)表示了每一幅人脸与平均人脸的差值,它是零均值的。它们组成了一个N2xMK的矩阵,=(00, 01, ,K-1,M-1), PCA方法就是要找到对应于矩阵T 的前m个较大特征i 的正交规范化的特征向量i : (2-9)因为T 是N2xN2 的矩阵,求它的N2个特征值的计算量非常大。一般而言,训练过程中人脸数据库里的图像数目MxK比人脸空间的维度N2要小,所以我们可以先求得T 见的正交规范化的特征向量城i: (2-10)在式(2-10)两边左乘,然后与式(2-9)比较,我们可以得到: (2-11)这些特征向量,称为特征脸,构成了人脸空间的一个子空间的正交基,这个子空间就是通常所说的特征空间。特征空间有训练图像的协方差的特征向量构成,将数据库中的每一幅人脸x从人脸空间转化到特征空间: (2-12)既然每一幅人脸都可以用特征空间里的向量y=(w0,wl,wm-1)T,利用最近邻法就可以在特征空间里进行人脸识别。在训练阶段,数据库中的所有人脸xij到特征空间为,那么,第i个人在特征空间里的平均向量为: (2-13)在测试阶段,给出测试人脸,首先,将按照同样的步骤式(2-12)转化到特征空间,得到在特征空间各坐标上的系数向量。然后,利用最近邻法则将判定为求得dj最小的一类: (2-14)综上所述,基于主分量分析的人脸识别方法的具体步骤如下:a. 初始化,获得人脸图像的训练集并计算特征脸,定义为人脸空间;b. 输入新的人脸图像,将其映射到特征脸空间,得到一组坐标系数;c. 通过检查图像与人脸空间的距离判断它是否为人脸;d. 若为人脸,根据坐标系数判断它是否为数据库中的某个人。2.3.2基于主分量分析的人脸分类识别 人脸图像被投影到特征空间中后,剩下的任务就是如何利用待识别人脸图像在此特征子空间的投影系数,实现分类识别了。此任务由两部分构成:一是相似性测量;二是分类器设计。传统的分类识别是基于欧氏距离的最近邻分类方法,实验证明效果并不理想。因为欧氏距离容易受到图像光线、噪声等整体干扰因素的影响。分类器选取与特征提取一样也是模式分类中的一个重要环节,不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论