




已阅读5页,还剩58页未读, 继续免费阅读
(控制理论与控制工程专业论文)数字图像处理应用于人脸识别的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理工大学硕士学位论文 摘要 随着微电子、计算机和网络技术的发展,传统的身份鉴别方法,如标识号码、 磁卡、i c 卡等,正面临着严峻的考验,迫切需要研究出新的个人身份鉴定方法。 由于人体的很多特征具有单一性的特点,人们把目光转向了利用人体生物特征进 行识别的技术,目前指纹、虹膜等识别技术也己经达到了很好的识别效果。与利 用指纹、虹膜等其他人体生物特征进行个人身份鉴别的方法相比,人脸识别具有 直接、友好、方便的特点,是进行身份确认的最自然直接的手段。正是因为如此, 近年来在国际上有很多研究者对基于人脸特征的身份识别和验证进行了大量的研 究。 用计算机进行人脸识别是当今的一个研究热点和难点,尤其在已知样本集中 每个人只有少数甚至是一个样本的情况。论文综述了人脸识别系统的结构和技术 组成以及研究现状,在此基础上,对人脸图像预处理、特征提取及识别算法进行 了深入的研究,并以v c 为平台,开发了人脸识别系统。 在预处理阶段,首先对图像进行了光照补偿和直方图均衡化处理,因为主分 量分析( p c a ) 方法对光照很敏感。针对图像向量维数大,导致大大增加计算的 复杂程度的特点,文中引入了小波变换,用小波变换的方法滤掉高频信息,采用 低频子带来表达图像,变换后图像向量的维数大大降低。 对于人脸图像特征的提取,本文采用了p c a 方法。文中用训练样本集的类间 散布矩阵作为k - l 变换的产生矩阵,与总体散布矩阵相比,正交基向量的个数大 大降低,因而降低了计算量。 寻求适用、优秀的分类方法构造出性能优良的分类器,是提高模式识别的关 键环节。本文研究了一个新的分类器:将传统方法中的最近邻分类法和b p 神经网 络方法结合起来,构造了一个组合分类器。 实验结果表明,论文所提出的识别方法对人脸的姿态和表情有一定的不敏感 性,组合分类器的识别率比单一的分类器的识别率有所提高。 结合论文研究和写作中的体会,针对今后的研究工作,论文对以后进一步的 深入研究做了一个简单的展望。 关键词:人脸识别,小波变换,p c a ,b p 神经网络 武汉理工大学硕士学位论文 a b s t r a c t w i n lm ed e v e l o p 抽go fl h et e c h n o l o g yo fm i c m e l e c t r o n ,c o m p u t e ra 工1 di n t e m e t , t h et r a d i 廿o n a i i d e m 面c a t i o nm 甜1 0 d sm e e tc h a l l e n g e ,s u c ha su s i n gp a s s w o r d sa n di c c a r d 1 h er e s e 甜c ho fn e wm e t h o df o ri d e t i f i c a t i o ni sn e c e s s a r y ,b e c a u s eo fm e1 】i l i t y o fh u m a nb o d yf b a t u r e ,p e o p l et h i r l ko fi d e m i f i c a t i o nb yu s eo fb i o l o g i c a lf b a t u r e s b y n o w ,t h ef m g e l p r i mi d e 埘f i c a t i o na i l dt h ei r i si d e 而f i c a t i o nh a v e1 1 i 曲r c c o g n i z em t e c o m p a r e dt oo m e rb i o l o g i c a lf e a l = u r e s ,t h ef a c eh a s 出r e c t ,艇e n d l ya n dc o n v e n i t c h a r a c t e li nr e c e n t ly ,m a l l yi n t e m a t i o n a lr e s e a r c h e r sf o c u so nt h ea u t o m a t i cf a c e r e c o g n i t i o na n dh a v ed o n em u c hs m d yo ni t , a u t o m a t i cf 她er e c 0 9 1 1 i t i o n 疔o mi m a g e si sd i 街c u l t ,e s p e c i a l l ym ep r o b l e mb a s e d o ns m a i ls p e c i m e n t 1 1 i sm e s i ss u “e y st h ec u r r e n ts t a m so fa u t o m a t i cf a c er e c o g 血t i o n s y s t e m ,o u t l m e si t ss t n l c t u r ea r l dm o d u e s t h et e c h n i q u e so fp r e p r o c e s s i n g ,f e a t u r e e x t m c t i o na n dr e c o g n j t i o na r es t u d i e di nm et h e s i sw o r k af a c er e c o g n “i o ns ”t e r n b a s e do nv ci sd e v e l o p e d i n 血es t a g eo fi m a g ep r c p r o c e s s i n 昏l i g h t i n gc o m p e n s a t i o na n dh i s te q u a l i 母a r e d o n ef i r s tb e c a u s et h a tp c am 甜l o di ss e n s m v ct oi l l u m i n 撕o n c o n s i d e r i n gm e c h a r a c t e r so fd a t a - d e n s i t ya n dc o m p u t e d e n s i 坝t h i sm e s i si n t r o d u c e sw a v e l e t t r a n s f o 咖b y 啪v e l e tt r a i l s f o 肌,廿1 ei n f o 彻a t i o no fh i g h 丹e q u e n c yi s 矗l t e r 咄t h e i n f o m a t i o no fl o w 丘e q u e n c yi sr e m a i n e d s om ed i i i l e n s i o no fi m a g ev e c t o r si sg r e a t l y d e c r e a s e da f t e rw a v e l e tt r a n s f o n p r i n c i p a lc o m p o r l e ma n a l y s i s c a ) m e t l l o di su s e dt oe x 仃a c tf e a n l r ei nt l l i s t 1 1 e s i s t h ed e s i g no fc l a s s m e ri sc m c i a lt of 犯er e c o g i l j t i o n ac o m b i n a t i o nb e t w e e n m i n i m u md i s t a n c ec k i s s 讯e ra n db pn e u r a ln e t w o r kc l a s s i f i e ri sd r e s e n t e di 1 1 也e s i s e x p e r i r n e m a lr e s u l t ss h o wm a tt 1 1 ea l g 嘶t hp r e s e m e db ym i st h c s i si sn o t s e n s i t i v et op o s ea n de x p r e s s i o n ,t h en e wc l a s s i f i e ri ss u p e r i o rt ot h es i n g l ec l a s s i f i e l f e a t u r er e s e a r c h e sa r ep o i n t e do mc o n s i d e r i n g 吐1 ee x p e r i e n c e so fo u rs y s t e ma n d t t l ed e v e l o d m e mn n d k e y w o r d :f a c er e c o g l l i t i o n ;w a v e l e tt r a i l s f 0 肌;p c a ; b pn e u r 址n e t 、v o r k i i 武汉理工大学硕士学位论文 1 1 引言 第1 章绪论 近年来,在日常事务和工业生产的各个方面,随着计算机的普及和应用, 对个人身份的自动鉴定提出了越来越多的要求。目前广泛采用的身份验证形式 主要有标识号码、磁卡、i c 卡等。这些方式的优点是技术己比较成熟,并可以 采用各种加密手段加以保护,但所有这些都难以阻止伪造,传统的系统安全性 技术己经遭遇严重的挑战,迫切需要研究出新的个人身份鉴定方法。 由于人体的很多特征具有单一性的特点,人们把目光转向了利用人体生物 特征进行识别的技术,这种利用人体的身体特征来进行身份验证的技术称为生 物识别技术。要把人体的生物特征用于身份识别,这些特征必须具有唯一性和 稳定性。研究和经验表明,人的指纹、掌纹、面孔、发音、虹膜、视网膜、骨 架等都具有唯一性和稳定性的特征,即每个人的这些特征都可以认为是与别人 不同而且是终生不变的,因此就可以借此识别出人的身份。基于这些特征,人 们发展了指纹识别、人脸识别、语音识别等等多种生物识别技术,目前指纹、 虹膜等识别技术也已经达到了很好的识别效果。 与利用指纹、虹膜等其他人体生物特征进行个人身份鉴别的方法相比,人 脸识别具有直接、友好、方便的特点,是进行身份确认的最自然直接的手段。 正是因为如此,近年来在国际上有很多研究者对基于人脸特征的身份识别和验 证进行了大量的研究。人脸识别作为模式识别学科的一个重要分支,是模式识 别领域中一个非常困难、既具有重要理论意义又具有广阔应用前景的研究课题。 1 2 人脸识别研究的意义 人脸识别研究的意义主要体现在以下几个方面p 】; 首先,人脸识别研究成果能为公安、银行、海关等机要部门在鉴别人的身 份时提供新的、方便的检测手段,从而大大提高安全部门的工作效率和方便性。 其次,人脸识别作为一种典型的对于三维自然物体的识别,具有重要的理 论价值,它的研究恩想和实现方法可为其它三维动态自然物体的识别提供重要 理论和参考、借鉴。 武汉理f 大学硕士学位论文 最后,人脸识别研究的一个主要内容是如何描述与表示人脸,这对于图像 压缩及信息传输也具有重要应用价值。 1 3 人脸识别研究的难点 人脸识别是一项极具挑战性的任务,其困难主要体现在以下两个方面口j : 第一,人脸的相似性。所有的人脸都具有相似的结构,在纹理上也比较接 近,因而构成了一种在空间上极接近的类别。人脸识别系统只能利用不同人脸 之间的细微差别来实现正确识别任务。 第二,人脸的非刚体性。同一个人在光照、姿态、表情、人脸大小等不同 采样条件下所获得的图像有很大的不同,更不用说发型、年龄、化妆以及饰物 的变化了。因此,建立一种具有各种条件不变性的描述模型是极其困难的。 然而,人脸识别的复杂性和挑战性并没有影响人们对这一课题的研究热情, 这与人脸识别潜在的应用价值和重要的理论意义是分不开的。 1 4 入脸识别研究的现状 人脸自动识别系统包括两个主要技术环节,如图1 1 所示 4 l 。 一殿躲 图l 一1 人脸自动识别系统组成 首先是人脸的检测和定位,即从输入图像中找到人脸及人脸存在的位置, 并将人脸从背景中分割出来,然后对归一化的人脸图像进行特征提取与识别。 1 4 1 人脸的检测与定位 人脸检测的基本思想是用知识或统计的方法对人脸建模,比较所有可能的 待检测区域与入脸模型的匹配度,从而得到可能存在人脸的区域,其方法大致 可分为基于统计和基于知识两类,前者将人脸图像视为个高维向量,从而将 人脸检测问题转化为高维空间中分布信号的检测问题;而后者则利用人的知识 建立若干规则,从而将人脸检测问题转化为假设验证问题。 2 武汉理工大学硕士学位论文 1 基于统计的人脸检测4 j ( a ) 事例学习。将人脸检测视为区分非人脸样本与人脸样本的两类模式分类 问题,通过对人脸样本集和非人脸样本集进行学习以产生分类器。目前国际上 普遍采用人工神经网络方法。 ( b ) 子空间方法。p e n t l a l l d 等将k l 变换引入了人脸检测,在人脸识别中利 用的是主元子空间( 特征脸) ,而人脸检测利用的是次元子空间( 特征脸空间 的补空间) ,用待检测区域在次元子空间上的投影能量,也即待检测区域到特 征脸子空间的距离作为检测统计量,距离越小,表明越像人脸。 f c ) 空间匹配滤波器方法。包括各种模板匹配方法,合成辨别函数方法。 2 基于知识建模的人脸检测【4 i 瞳器官分布规则。虽然人脸在外观上变化很大,但遵循一些几乎是普遍适 用的规则,如五官的空间位置分布大致符合“三停五眼”等,检测图像中是否 有人脸即是测试该图像中是否存在满足这些规则的图像块。这种方法的思路是: 先直接检测几个器官可能分布的位置,然后将这些位置点分别组合,用器官分 布的几何关系准则进行筛选,找到可能存在的人脸。 ( b ) 轮廓规则:人脸的轮廓可以简单地看成一个近似椭圆,而人脸检测可以 通过椭圆检测来完成。g o y i n d a r a j u 提出认知模型方法,将人脸建模为两条直 线( 左右两侧面颊) 和上下两个弧( 头部和下巴) ,通过修正h o u 曲变换来检 测直线和弧。近期t a n k u s 利用凸检测的方法进行人脸检测。 ( c ) 颜色、纹理规则:同民族人的面部肤色在颜色空间中的分布相对比较集 中,颜色信息在一定程度上可以将人脸从大部分背景区分开来。l e e 等设计了 肤色模型表征人脸颜色,利用感光模型从复杂背景下检测与分割人脸及器官。 d a i 利用了s g l d ( 空间灰度共生矩阵) 纹理图信息作为特征进行低分辨率的人 脸检测。s a b e r 等则将颜色、形状等结合在一起来进行人脸检测。 倒运动规则:通常相对背景人总是在运动的,利用运动信息可以简单有效 的将人从任意复杂背景中分割出来。 ( e ) 对称性:人脸具有轴对称性,各器官也具有一定的对称性。z a b r o d s h k y 提出连续对称性检测方法,检测一个圆形区域的对称性,从而确定是否为人脸; r i e s f i e l d 提出广义对称变换方法检测局部对称性强的点来进行人脸器官定 位。 武汉理工大学硕士学位论文 1 4 2 人脸特征提取【4 - 9 2 1 人脸特征的提取是人脸识别过程中至关重要的一步,它对识别效率有着重 要的影响。根据手段的不同,可将特征提取分为以下两类p j : 1 基于面部几何特征方法。所谓几何特征是指眼、鼻、口等器官在人脸图 像中的几何位置及形状表达出的特征,各种几何特征并不具有致密的相关性, 但通过对这些几何特征的提取可达到比较详尽地描述人脸的目的。 早期人脸识别几乎都提取人脸几何特征进行识别研究,如边界跟踪口j 、模 板匹配【6 】【7 1 等。y u i l l e 利用变形模板对人脸图像进行特征提取【8 】,他对眼睛模板 采用了包括眼白的上下边缘,瞳孔边界,眼部倾角,上、中、下三条唇线等1 1 个参数进行了描述。 几何特征提取具有很强的直观性,但由于在提取过程中过多地依赖于先验 知识,提取的特征或是过于严格,使识别的自适应性不强,或是过于简略而不 足以识别相似度极高的人脸样本。因此,提取何种特征和如何控制特征数量, 以保证识别的精确性而又可避免特征的冗余性,是一个值得研究的问题。 2 基于统计的方法。该种方法从整个图像甚至整个样本群中提取信息,这 种特征未必有明确的含义,但在某种意义上是易于分类的特征。 主分量分析( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 是统计学中分析数据的 一种有效的方法,其目的是在数据空间中找一组向量以尽可能的解释数据的方 差,将数据从原来的r 维空间降到m 维( r m ) ,在降维后保存了数据中的主要 信息,从而使数据更易于处理。它是根据k l 变换从最大信息压缩方向获得图 像在低维空间的信息表达,从信息论的观点来看,就是在所有的正交变换中, k l 变换所对应的信息熵最小,所以用p c a 方法所获得的识别空间就是原图像 空间的一个最优低维逼近。 奇异值分解( s i n g u l a rv “u ed e c o m p o s i t i o n ,s v d ) 可看作是与k l 类似的 代数特征提取方法。图像的奇异值可表达图像内在的代数特征,因为对于任意 个实矩阵,它的奇异值分解是唯一的。奇异值向量具有良好的代数和几何不 变性。 1 - 4 3 人脸识别0 1 人脸识别所用的方法与一般模式分类方法基本相同,根据所选特征的不同 d 武汉理i = 大学硕士学位论文 和判别决策方法的不同,可分为以下几种: 1 模板匹配法。对每个待识别的类别给出典型标准模板作为识别标准,它 可以是一类模式,也可以是一模式集合。 2 统计特征法。它对己知类别的模式样本进行各种特征的提取和分析,选 取对分类有利的特征,并对其统计均值等按己知类别分别进行学习,按贝叶斯 最小误差准则,根据以上统计特征设计出一个分类误差最小的决策平面。识别 过程就是对未知模式进行相同的特征提取和分析,通过决策平而方程决定该特 征相应的模式所属的类别。 3 模糊识别法。该方法在识别过程中引入模糊集的概念。模糊集的概念可 以在模式识别的后几个环节中的任何地方引入。若在后两个环节( 特征提取和 分类决策) 的任何一个中引入,则在判别决策时,所求得的结果就是该模式特 征与每一标准类的隶属度,进而可求出隶属度最大的标准类为被识别类。 4 神经网络法。用神经网络的方法来进行分类识别,由于其良好的容错能 力和并行计算能为,引起了很多学者的广泛关注。 1 5 本文的主要研究内容 人脸鉴别( f a c ei d e n t m c a t i o n ) ( 即通常所说的“人脸识别”) 技术就是分 析给定的包含人脸的输入图像,从中提取出有效信息,并通过某种方式与数据 库中的已知人脸信息进行比较,从而得出决策或认证信息的种技术。 本论文研究内容主要包括以下三个方面: 1 图像预处理研究与实践。图像预处理目的就是提高图像的质量,为准确 提取人脸特征做准备。由于本文利用主分量分析( p r i n c i p a lc o m p o n e n t a n a l y s i s , p c a ) 提取人脸图像的特征向量,针对该变换方法易受光照影响的缺点,文中 首先用光照补偿和直方图均衡化对图像进行了预处理。为了降低后续处理算法 的复杂度,引入了小波变换,对图像进行一次小波分解,保留分解后的低频子 带信息,而滤除高频信息。 2 ,人脸特征提取方法及改进研究。在本文中,特征提取有两个作用:是 去掉冗余信息、,突出人脸的主要特征;二是降低神经网络的规模。该部分重点 研讨了p c a 方法的基本原理和算法,并根据人脸识别的特殊性对其进行了适应 性改进和实验。 武汉理工大学硕士学位论文 3 人脸识别组合分类器研究。识别问题其实质就是分类器的设计问题。该 部分从尽可能提高识别率角度出发,将最近邻分类器与b p 神经网络分类器相 结合构成了个新的分类器,然后进行研究和实验,以期提高人脸识别率。 本文研究的人脸识别系统,以s u “c + + 为开发平台,完成图像预处理、 特征提取及识别全过程。 1 6 本文的创新点 l 。在图像预处理阶段引入小波变换,保留小波变换后的低频子带。经小波 变换后,图像对人脸的表情和姿势不敏感,即它模糊了人脸的不同表情和不同 姿势等引起的差异,而且大大降低了图像的维数。 2 在利用p c a 进行特征提取时,采用训练样本集的类间散布矩阵作为k 。l 变 换的产生矩阵,与总体散布矩阵相比,正交基向量的个数大大降低,因而降低 了计算量。 3 在分类器的设计上,将最近邻分类器与b p 神经网络分类器相结合构成了 个新的分类器,实验结果表明,组合分类器的识别率比单一的分类器的识别 率有所提高。 6 武汉理工大学硕士学位论文 第2 章人脸图像的预处理 由于实际成像系统或多或少地存在一些不完善的地方,以及外界光照条件 等因素的影响,在一定程度上增加了图像的噪声,使图像变得模糊,对比度低, 区域灰度不平衡等。因此,为提高图像的质量,保证提取特征的有效性,进而 提高系统的识别效率,在提取特征之前,有必要对图像进行一些预处理。对输 入图像的预处理是图像识别系统中非常重要的一步,预处理的目的是去除噪声。 加强有用的信息,并对输入测量仪器或其他因素所造成的退化现象进行补偿和 复原,以保证图像的质量。由于本文是采用k l 变换的方法来进行特征抽取的, k l 变换作为一种图像的统计方法,图像中所有的像素被赋予了同等的地位, 因此同一人脸在不同的光照角度、光照强度下的差异会反映到特征空间中有较 大的差异。角度、光照、尺寸及表情等于扰会导致识别率的下降,因此对输入 图像的预处理尤为重要。 2 1 w i n d o w s 下图像处理基础 本课题主要针对w i n d o w s 操作系统而开发的,因此需要了解在w i n d o w s 环境下图像的存储、显示等方面的机制。在,i n d o w s 操作系统中,任何图像格 式( 如j p e g 格式,g i f 格式) 在系统中显示之前最终必须转化为位图b m p 格式。 b m p 图像文件格式是微软公司为其w i n d o w s 环境设置的标准图像格式,而且 w i n d o w s 系统软件中还同时内含了一系列支持b m p 图像处理的a p i 函数,因 此在w i n d o w s 下进行图像处理,需要熟悉位图的文件格式及其处理的a p i 函数。 2 1 1 b p m 文件格式【4 2 】 b m p 文件大体上分成四个部分,如图2 1 所示。 图2 一1w i n d o w s 位图文件结构示意图 7 武汉理工大学硕士学位论文 b m p 图像文件结构设计得相当简单,这无疑有利于图像文件的处理速度, 但是同时也使得b m p 图像文件格式具有一定的局限性,即一个b m p 图像文件 只能存储一幅图像。 2 1 1 ,1 位图文件头 b p 文件结构的第一部分为位图文件头b i t m a p f i l e h e a d e r ,它是一个结构, 其定义如下: t y p e d e fs t r u c tt a g b i t m a p f i l e h e a d e r w o r d b f t y p e : d w o r db f s i z e : w o r db f r e s e r v e d l : w o r db f r e s e r v e d 2 : d w o r db f o f f b i t s : )b i t m a p f i l e h e a d e r : 这个结构的长度是固定的,为1 4 个字节( w 0 r d 为无符号1 6 位整数,d w o r d 为无符号3 2 位整数) ,各个域的说明如下: b f t y p e 指定文件类型,必须是o x 4 2 4 d ,即字符串“b m ”,也就是说所有b m p 文件 的头两个字节都是“b m ”。 b f s i z e 指定文件大小,包括这1 4 个字节。 b f r e s e r v e d1 ,b f r e s e r v e d 2 为保留字,不用考虑。 b f 8 f f 8 i t s 为从文件头到实际的位图数据的偏移字节数,即图2 1 中前三个部分的长 度之和。 2 1 1 2 位图信息头 酬p 文件结构的第二部分为位图信息头b i t m a p i n f o h e a d e r ,它也是一个结 构,其定义如下: t y p e d e fs t r u c tt a g b i t m a p i n f o h e a d e r 8 垫坚里三奎堂堡主兰堡堡苎一 d w o r db i s i z e : l o n g b i w i d t h : l o n gh i h e i g h t : w o r db i p l a n e s : w o r db i b i t c o u n t d w o r db i c o m p r e s s i o n ; 口w o r db i s i z e i m a g e : l o n gb i x p e l s p e r m e t e r : l o n gb i y p e ls p e r m e t e r : d w o r db i c l r u s e d : d w o r db i c l r i m p o r t a n t : b i t m a p i n f o h e a d e r : 这个结构的长度是固定的,为4 0 个字节( w o r d 为无符号1 6 位整数,d w o r d 无符号3 2 位整数,l o n g 为3 2 位整数) ,各个域的说明如下: b i s i z e 指定这个结构的长度,为4 0 。 b i 舭d t h 指定图像的宽度,单位是象素。 b j h e i 曲t 指定图像的高度,单位是象素。 b j p i a n e s 必须是1 ,不用考虑。 b i b it c o u n t 指定表示颜色时要用到的位数,常用的值为1 ( 黑白二色图) ,4 ( 1 6 色图) ,8 ( 2 5 6 色) ,2 4 ( 真彩色图) ( 新的b m p 格式支持3 2 位色) 。 b i c o 印r e s s i o n 指定位图是否压缩,有效的值为b i g b ,b i l e 8 ,b i - r l e 4 ,b i - b i t f i e l d s ( 都是一些w i n d o w s 定义好的常量) 。 b i s iz e i m a g e 指定实际的位图数据占用的字节数,其实也可以从以下的公式中计算出来: b i s i z e i m a g e = b i w i d t h 木b i h e i g h t 9 武汉理工大学硕士学位论文 上述公式中的b i w i d t h 必须是4 的整倍数( 所以不是b i w i d t h ,而是 b i w i d t h ,表示大于或等于b i w i d t h 的,离4 最近的整倍数。例如,如果 b i _ | i l f i d t h = 2 4 0 ,则b i w i d t h = 2 4 0 ;如果b i w i d t h = 2 4 1 ,b i w i d t h = 2 4 4 ) 。 b i x p e i s p e r m e t e r 指定目标设备的水平分辨率,单位是每米的象素个数。 b i y p e ls p e r e t e r 指定目标设备的垂直分辨率,单位同上。 b i c i r u s e d 指定本图像实际用到的颜色数,如果该值为零,则用到的颜色数为2 的 b i b it c o u n t 次方。 b i c ir i m p o r t a n t 指定本图像中重要的颜色数,如果该值为零,则认为所有的颜色都是重要 的。 2 1 1 3 调色板 b m p 文件结构的第三部分为调色板( p a l e t t e ) 。有些位图需要调色板,有些 位图,如真彩色图,是不需要调色板的,b i t m a p i n f o h e a d e r 后直接是位图数据。 调色板实际上是一个数组,共有b i c l r u s e d 个元素( 如果该值为零,则有2 的b i b i t c o u n t 次方个元素) 。数组中每个元素的类型是一个r g b q u a d 结构,占 4 个字节,其定义如下: t y p e d e fs t r u c tt a g r g b q u a d b y t e r g b b l u e :该颜色的蓝色分量 b y t e r g b g r e e n :该颜色的绿色分量 b y t e r g b r e d :该颜色的红色分量 b y t e r g b r e s e r v e d :保留值 r g b q u a d : 值得注意的是,r g b q u a d 结构定义的颜色值中,红、绿、蓝的排列顺序与 一般图像的颜色数据排列顺序恰恰相反。 2 1 ,1 4 图像数据 b m p 文件结构的第四部分就是实际的图像数据了。对于用到调色板的位图, 1 0 武汉理工大学硕士学位论文 图像数据就是该像素颜色在调色板中的索引值,对于真彩色图,图像数据就是 实际的r ,g ,b 值。 对于2 色位图,用l 位就可以表示该像素的颜色( 一般0 表示黑,1 表示 白) ,所以一个字节可以表示8 个像素。 对于1 6 色位图,用4 位可以表示一个像素的颜色,所以一个字节可以表示 2 个像素。 对于2 5 6 色位图,一个字节刚好可以表示1 个像素。 对于真彩色图,三个字节才能表示1 个像素。 2 1 2 位图显示 在认识了位图文件的结构以后,对特定位图文件进行读写操作就显得简单 了,关键要确定文件头、信息头等结构在内存中的地址。 把图像信息由内存拷贝到显示设备上下文的过程就是显示位图图像的过 程。位图的显示还是调用w i n d o w s 的a p i 函数来进行,需要传递的参数包括当 前位图信息头,位图数据等。g d i ( 图形设备接口) 提供s e t d i b i t s t o d e v i c e 和s t r e t c h d i b i t s ,实现在不同设备上下文间进行位块数据传输。两者不同之 处在于:s e t d i b i t s t o d e v i c e 在显示时不进行缩放处理,目标图像的尺寸大小 与源图像的尺寸大小是一致的,即位图的每一像素对应于一个显示器的像素或 一个打印机的打印点。而s t r e t c h d i b i t s 可以根据设置的目标图像的尺寸,对 源图像进行拉伸或压缩显示。 2 1 3 图像类 虽然v c + + 的m f c 类库对位图提供了部分支持,例如利用c b i t n l a 口类可以 操作程序资源中的位图( 与设备相关位图) ,但m f c 并没有提供对图像文件进 行单一集成操作的对象类,因此在编制软件时需要设计一个类,用于封装对图 像的读入、显示和保存等操作。该类定义如下: c l a s sc d i b i m a g e p u b l i c : c d i b i m a g e ( ) ; 武汉理工大学硕士学位论文 c d i b i m a g e ( ) ; b o o la t t a c h ( h d i bh g i o b “) ; b o o lc r e a t e ( c s i z es i z e ,w o r dn b i t c o u n t ) ; v o i dd e s t r o y ( ) ; v o i dd e s t r o y h d i b 0 ; v o i dd e s t r o y h p a l e t t e ( ) ; b o o ll o a d ( l p c t s t rl p s z p a t h n 锄e ) ; b o o ls a v e ( l p c t s t r1 p s z p a t h n a m e ) ; b o o l d r a w ( c d c &d c , c o n s tc r e c pr c d s t = n u l l ,c o n s tc r e c t + r c s r c = n u l l ,c p a l e t t e + p p a l = n u l l ) ; c s i z es i z e ( ) c o n s t r e t u mc s i z e ( r k n w i d m ,m _ n h e i g h t ) ;) c r e c tr e c t ( ) c o n s t r e t u m c r e c t ( c p o i n t ( o ,o ) ,s i z e ( ) ) ;) ; d i r e c tp i x e la c c e s s i n l i n eb 0 0 lg e t p i x e l ( i n tx ,i n ty ,u l o n g v a l u e ,l p s t r1 p d i b b i t s = n u l l ) c o n s t : i n l i n eb o o ls e t p i x e l ( i n tx ,i n ty ,c o n s tu l o n g & v a l u e ,l p s t rl p d i b b i t s = n u l l ) ; 光照补偿 b o o ll i g h t c o m p e n s a t e ( ) ; 灰度均衡化 b o o l h i s t e q ( ) ; ,一层h a a r 小波分解 b o o lw f i l t e r ( ) ; 1 2 武汉理工大学硕士学位论文 计算特征矢量 d o u b l e 币f e a t u r e v b c t o r ( c p o i n ts t a n p o i n t ,c s i z et e m p l 砒e s i z e ,i mf e a t l l r d n u m , d o u b l eu 】【2 0 】) ; i n tg e t b i t s p e r p i x e l 0c o n s t ; m c o m p u t e n 啪c o l o r s ( d w o r dn b i t c o u m ) h d i b 咄i b ; h p a l e t t e l _ j 1 p a l ; i n tr n - n w i d t h ; 抽tn u l e i g h t ; i n tm _ n s c a n w i d t h ; i n tr n i b i t s p e r p i x e l : ) ; 2 2 光照补偿1 】 光照的补偿是通过对人脸图像的灰度直方图的修正从而调整图像的均值和 方差来完成的。 图像的直方图与图像的均值和方差密切相关。图像的均值和方差分别定义 为: 归志荟善训们 ( 2 。) 矿5 志善丢( 刚阴叫) 2 ( 2 2 ) 其中,d 【小刀表示图像像素的灰度值,形表示图像的宽度,表示图像的高度。 光照越强均值越大,光照越弱均值越小:图像的亮度变化越大,方差越大, 图像的亮度变化越小,图像的方差越小。因此我们要补偿光照强度的影响,可 以通过对图像的均值和方差进行处理。通过对人脸图像的每一个像素的灰度值 进行下式的运算: 1 3 武汉理工大学硕士学位论文 研f 【门:! 蔓( d f 【卜) + “。 ( 2 3 ) 仃 这样经过光照补偿后的人脸图像都具有相同的均值 。和方差c r 0 ,在本文中 取“。= 1 4 0 ,c r 0 = 3 3 。光照补偿后的效果和直方图如图2 2 所示。 ( a ) 、( e ) 为光照补偿前的图像:( c ) 、( g ) 为光照补偿前的直方图 ( b ) 、( f ) 为光照补偿后的图像;( d ) 、( h ) 为光照补偿后的直方图 图2 2 光照补偿效果 1 4 武汉理工大学硕士学位论文 2 3 直方图均衡化旧】 一幅灰度范围为 0 ,2 5 5 的图像的灰度级经归一化处理后可认为分布在 o , 1 区间,对 o ,l 】区间内的任一灰度值r 进行变换: s = 7 ( ,) 0 sr 1 ( 2 4 ) 在原始图像中,对于每一个灰度值,产生一个灰度值s 。变换函数丁( r ) 满足条 件: ( a ) 在区间 0 ,1 内,丁( r ) 为单值且单调递增; ( b ) 在区间【o ,1 内,存在0 丁( r ) 0 。 条件( a ) 中要求f ( r ) 为单值是为了保证反变换存在,单调递增是为了保证输出 图像从黑到白顺序增加。条件( b ) 是为了保证输出输出的灰度值与输入值有同 样的范围。 灰度级j 的概率密度函数为: 髓) :掣:掣吲,) 妾 ( 2 - 5 ) d sd sc l s 其中只( s ) 为s 的分布函数,e ( ,) 为,的概率密度函数。 若图像的直方图是均衡的,则灰度的概率密度函数只( s ) = ,其中是图 像灰度级的取值范围,对于归一化的灰度值,三= 1 ,所以只( j ) = 1 。由式( 2 5 ) 得 凼= 只( ,) 咖 即变换函数为 s2 j 只p 炒 丁( ,) = f 只( r ) 办 ( 2 6 ) 对于离散数字图像,我们处理其概率与和,而不是概率密度函数与积分。 设象素的总个数为肝,聆。表示灰度级为的像素个数,共上个灰度级,则一幅 图像中灰度级“出现的概率为 1 5 武汉理工大学硕士学位论文 只( 0 ) = 兰皇-( o 0 l ,0 t 兰一1 ) ( 2 7 ) 门 式( 2 6 ) 中变换函数的离散形式为: “ 吼= 丁( k ) = p ( o ) = 等 ( 2 8 ) 户o= o 经过直方图均衡化后的图像的灰度分布趋于均匀,图像的对比度大大提高, 直方图均衡化后的效果如图2 3 所示。 ( a ) 、( b ) 分别为直方图均衡化前的图像和直方图 ( c ) 、( d ) 分别为直方图均衡化后的图像和直方图 图2 3 直方图均衡化效果 2 4 小波分解 2 4 1 小波概述【1 2 】 自从1 8 2 2 年傅立叶( f o u r i e r ) 发表“热传导解析理论”以来,傅立叶变换 一直是信号处理领域中最完美。应用最广泛,效果最好的一种分析手段。但是, 傅立叶变换只是一种纯频率的分析方法,它在频域的定位性是完全准确的( 即 频域分辨率最高) ,而在时域无任何定位性( 或分辨能力) ,也即傅立叶变换所 1 6 武汉理工大学硕士学位论文 反映的是整个信号全部时间下的整体频域特征,而不能提供任何局部时间段上 的频率信息。相反,当一个函数用万函数展开时,它在时间域的定位是完全准 确的,而在频域却无任何定位性( 或分辨能力) ,也即拶函数分析所反映的只是 信号在全部频率上的整体时域特征,而不能提供任何频率段所对应的时间信息。 为了研究信号在局部时间范围内的频域特征,1 9 4 6 年g a b o r 提出了著名的 g a b o r 变换,之后又进一步发展为短时傅立叶变换( s h o nt i m ef o u r i 盯 t r a n s f 0 衄,简计为s t f t ,又称为加窗傅立叶变换) 。目前,s t f t 已在许多领域 获得了广泛的应用。但由于s t f t 的窗函数的大小和形状是保持固定不变的,这 对于分析时变信号来说是不利的。因为高频信号一般持续时间很短,而低频信 号持续时间较长,因此,我们期望对于高频信号采用小时间窗,对于低频信号 则采用大时间窗进行分析。 与f o u r i e r 变换,加窗f o l l r i e r 变换相比,小波变换是时间和频率的局部变换, 因而能有效的从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进 行多尺度细化分析( m m t i s c a l ea n a l y s i s i ) ,解决了f o w i e r 变换不能解决的许多 困难问题,从而小波交换被誉为“数学显微镜”,它是信号分析发展史上的里程 碑式进展l 。小波变换在信号分析、语音合成、图像识别、计算机视觉、数据 压缩、c t 成像、地震勘探、大气与海洋波的分析,分形力学,流体湍流以及天 体力学方面都已取得了具有科学意义和应用价值的重要成果。除了微分方程的 求解问题之外,原则上能用f o l m e r 分析的地方均可用小波分析,甚至能获得更 好的效果。 为了克服傅立叶变换没有任何时域局部化,以及短时傅立叶变换固定分辨 率的缺陷,希望用于分解信号的基函数是持续时间很短的高频函数和持续时间 较长的低频函数。严格的说就是要求这些基函数有足够的光滑性,函数本身及 其倒数在无穷远处速降,具有紧支撑集和高阶消失矩,其傅立叶函数集中在原 点附近。小波基函数就是满足这一条件的理想函数族,它是由一个基本小波( 母 小波) 矽通过平移和伸缩得到的,即 1 ,一r y ( r ) = ;彳( 二习 ( 2 - 9 ) 、,1 口i 口 其中口为尺度函数,r 为位置函数。 设工9 ) 是平方可积函数( 记作工p ) 亭( 丑) ) ,( f ) 是基
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教A版 (2019)必修 第一册5.5 三角恒等变换获奖教案
- 一年级信息技术上册 千姿百态的热带鱼教学设计 清华版
- 初中政治 (道德与法治)人教部编版九年级上册共圆中国梦教案
- 九年级历史上册 第二单元 古代欧洲文明第5课 罗马城邦和罗马帝国教学设计 新人教版
- 化学九年级人教版酸碱盐专题的教学设计
- 工厂管理培训
- 2024华润怡宝校园招聘发布笔试参考题库附带答案详解
- 七年级生物上册 1.1.2 调查周边环境的生物教学设计 (新版)新人教版
- 分娩期贫血的护理查房
- 电线绞铜技术培训
- 学众-福建省中职《计算机网络技术》学业水平考试综合模拟测验(一)卷II
- 土地整治项目立项、入库审批、验收流程图
- 民办非企业单位变更登记申请表
- 阿那亚案例详细分析
- 选煤厂安全管理制度汇编
- 住房公积金个人账户合并申请表(文书模板)
- 部编版八年级历史(下)全册教案
- 叉车驾驶员培训手册-共89页PPT课件
- 面试无机化学研究前沿ppt课件
- 【项目申报书】神经环路的形成、功能与可塑性
- 金属矿床地下开采——矿床开拓方法设计(完整版)
评论
0/150
提交评论