已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 近年来,生物信息特征识别技术在各个领域蓬勃发展,它是利用人 的固有的生理特征作为研究对象,来进行个人身份的鉴定。本文结合掌 纹纹理特征及支持向量机理论进行探讨。具体内容如下: ( 1 ) 针对掌纹图像的特点,先用o s t u 算法选取阂值,对掌纹灰 度图像进行二值化处理,用改进的h a r r i s 方法来检测角点,并根据角点 的情况来建立基准坐标系,提取固定大小的矩形区域作为研究对象。 ( 2 ) 把已经提取出来的矩形区域进行分块,对分块后的小区域 g a b o r 滤波,提取g a b o r 滤波器的纹理能量,得到5 1 2 维的向量作为掌 纹的特征向量。 ( 3 ) 把这些特征向量输入s v m 进行训练和识别,并与传统的神 经网络的方法进行比较,验证了用支持向量机的方法进行图像分类能够 得到很高的识别率,比传统的神经网络方法有更好的分类效果,尤其是 小样本,高维度的情况。 本文所设计的方法经过验证,取得了较好的实验效果。用s v m 的 方法进行掌纹图像的识别是对掌纹识别方法的一个创新,这种方法能够 得到比传统的神经网络方法更好的识别效果。 关键词:掌纹角点检测g a b o r 滤波纹理支持向量机 a b s t r a c t i nr e c e n ty e a r s ,b i o m e t r i c si d e n t i f i e a t i o ni sd e v e l o p e di nm a n yf i l e d s w ew i l ld i s c u s ss o m ei s s u e sa b o u tt h ep a l m p r i n ti d e n t i f i c a t i o n f r o mi m a g e a c q u i s i t i o nt op a r e mm a t h i n g ,w eh a v ed o n eal o to f w o r k a tl a s t w eu s e s v mm e t h o dt oh a v eam a t h i n g ( 1 ) t h ef i r s ts t e pi sa p p l y i n gal o w - p a s sf i l t e rt ot h eo r i g i n a li m a g e t h e n u s eat h r e s h o l dt p , t oc o n v e r tt h i so r i g i n a li m a g ei n t oab i n a r yi m a g e ( 2 ) t h es e c o n ds t e pi sd e t e r m i n i n gac o o r d i n a t es y s t e mt oe x t r a c tt h ec e n t e r p a r tf r o mt h eg i v e np a l m p r i n ti m a g e ( 3 ) t h e “r ds t e pi sf i n d i n gs o m es t a b l ea n du n i q u ef e a t u r e s w eu s eg a b o r f i l t e ra n dh a v ee x t r a c t e dt h et e x t u r ei n f o r m a t i o n w ec o m p a r e dt h e m b a s e do ns v mm e t h o da n dd e c i s i d ew h e t h e rt w o p a l m p f i n t sa r ef r o m t h es a m e p e r s o n t h er e s u l ts h o w st h a ta c c o r d i n gt os v m ,t h e r ei sah i 【g hr e c o g n i t i o n r a t e ,p a r t i c u l a rs m a l ls a m p l e sa n dh i 曲d i m e n t i o n s k e yw o r d s :p a l m p r i n tr e c o g n i t i o n ,c o r n e rd e t e c t i o n ,g a b o rf i l t e r , s u p p o m v e c t o rm a c h i n e , 长春理工大学硕士学位论文原创性声明 本人郑重声明:所呈交的硕士学位论文基于s v m 的掌 纹验证方法的研究是本人在指导教师的指导下,独立进行研 究工作所取得的成果。除文中已经注明引用的内容外,本论文 不包含任何其他个人或集体已经发表或撰写过的作品成果。对 本文的研究做出重要贡献的个人和集体,均已在文中以明确方 式标明。本人完全意识到本声明的法律结果由本人承担。 作者签名:摊 12 年月- 阳 长春理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“长春理工大学硕 士、博士学位论文版权使用规定”,同意长春理工大学保留并 向国家有关部门或机构送交学位论文的复印件和电子版,允许 论文被查阅和借阅。本人授权长春理工大学可以将本学位论文 的全部或部分内容编入有关数据库进行检索,也可采用影印、 缩印或扫描等复制手段保存和汇编学位论文。 作者签名:碎趾丁母月上日 指导导师签名:。:嬗垒:幺簖厶一月之一日 1 1 引言 第一章绪论 随着信息化的不断深入,越来越多的高科技产品与人们的生活息息 相关,例如,我们现在所使用的银行卡、智能卡、身份证、以及在大学 校园里被广泛使用的一卡通,都是用口令加密码的方式进行身份验证。 这些产品在提供方便的同时,安全性也受到挑战,密码可以很容易被盗 用或猜到,经常更换密码带来的是更加沉重的记忆负担,人们要求有更 快捷,更安全的措施来保护个人信息。在这种呼声的召唤之下,应运而 生的是生物信息特征识别技术。它是基于人体的生理特征,通过计算机 运算而达到身份鉴别的目的。它有较强的稳定性,安全性和不可盗用性, 是作为身份鉴别的良好依据。生物识别技术的蓬勃发展,带给人们全新 的识别理念,给人们的生活带来巨大无比的方便,因此,这一技术已成 为身份鉴别领域的研究热点,并将成为今后几年的发展方向。 目前,比较成熟的生物识别技术有指纹识别,掌纹识别,掌型识别, 人脸识别,虹膜识别,声音识别等。其中,指纹识别的时间较长,它的 优点是采集设备简单,可靠性好,但是因为指纹识别经常用于公安等领 域,所以让人对指纹识别的戒备心较强,心理接受稍差;人脸识别也是 近年来兴起的识别方法,它是三维的图像,但是这种图像会因为是否留 胡须,以及头发的式样不同而判断的难度较大,准确率较低;虹膜识别 的准确率很高,但成本较大,很多场合不适用:掌型识别只对手掌的形 状产生兴趣,而对内部的细节不予考虑,所以也在很多方面不适合。还 有一些其他的识别方法也应用在某些领域,如步态,笔迹,讲话等,但 是这些特征很容易被伪造,可靠性较低。 并不是所有的生物特征都能够用于个人的身份鉴别,它必须满足以 下几个条件:第一,普遍性:即每个人必须都具备这种特征。第二,唯 一性:即任何两个人的特征不能够一样。第三,可测量性:即能够提取 生物特征作为匹配的标准。第四,稳定性:即特征在一段时间内不发生 改变或改变很小,可以忽略不计。当然,在应用过程中还要考虑识别精 度和识别速度等问题。 利用掌纹进行身份鉴别是一项开拓性的工作,是对基于指纹和掌型 的身份鉴别技术的重要补充。它比基于掌型的身份鉴别细节更多,能够 提取出更多的特征。它的稳定性和唯一性,仍然被认为是识别一个入身 份最可靠的方法。掌纹图像有许多优良的特征,它的三大主线就是掌纹 图像最明显的特征,此外,它的脊线,褶皱线也是良好的特征,包括掌 型和一些其他的信息,都让掌纹识别成为一种最有魅力的识别方式。 1 2 掌纹识别技术 1 2 1 掌纹识别技术简介 现有的生物信息特征识别技术主要应用在两个方面,一个是身份验 证,一个是身份鉴别。身份验证是判断现有的特征是否与已知特征相匹 配,是一对一的,即只有是或不是两个答案;身份鉴别则是要判断现有 特征与哪一个已知特征属于一类,是一对多的问题。利用这些生物信息 组成的个人身份鉴别系统是现代安全体系的一个重要组成部分,它面临 着更多的挑战和很多实际的应用。它既可以用在公安系统的身份识别, 也可以用于民用的身份验证。例如考勤系统、人员出入管理方面、公共 安全方面( 如门禁系统) 、银行及信用卡方面、电子商务中的个人身份鉴 别、户籍、身份证管理方面的应用、对机密信息的存取控制( 包括计算 机网络中的信息访问控制) 等。掌纹识别也可以应用在医疗诊断领域, 采用神经网络的知识处理方法来构建一个基于掌纹病理特征的诊病专 家系统,可以判断一些遗传病。 掌纹作为生物识别技术的优点,主要有: ( 1 ) 具有唯一性和终身不变性,并且不易仿造,人的掌纹出生后便 很稳定,虽然因为年龄的成长也会有大小的变化,但是主线和主要的特 征都是不变的,而且一旦成熟,便不再变化; ( 2 ) 利用基准点和中心对掌纹进行定义具有旋转不变性和唯一性, 在掌纹采集的时候,我们用一个物体来固定手掌,之后扫描的图像就是 不因手掌的旋转而得到的图像,我们可以在这个图像上进行角点检测和 建立坐标系: ( 3 ) 可以比较容易的获取掌纹质量较好的掌纹块用来提取细节特 征;建立坐标系之后,就可以提取固定大小的图像作为子图像来研究; ( 4 ) 除细节特征外,掌纹的其他特征如屈肌线、三角点也有较好的 稳定性和唯一性: ( 5 ) 在获取掌纹的同时往往也能获取手掌的一些几何特征。 掌纹识别的实现过程采用通用的统计模式识别模式,即图像采集, 预处理,特征提取,分类决策四个主要部分。掌纹图像的采集一般分为 脱机的掌纹图像采集和在线的掌纹图像采集。脱机的掌纹图像采集是用 油墨按印的方法,将掌纹图像用扫描仪扫描,得到数字图像,这样的方 法得到的图像会省去很多细节,分辨率低,在对图像要求不高的情况下 很有用;在线的掌纹图像用一个数码相机,并固定在一个架子上,有一 个光源,用一个支架固定手掌的位置,并且保证每次采集到的掌纹图像 都是固定位置的,将采集到的图像进行模数转换,得到数字图像,这种 图像的质量高,适合实时处理。 这两种掌纹图像由于采集方式不同,所进行特征提取的方式也略有 差别。脱机的掌纹识别大多采用点和线等物理结构作为特征来提取,而 在线的掌纹图像由于图像的分辨率较高,可以进行时频分析,子空间分 析,统计特征的提取,所以,在线掌纹得到了越来越多的应用。特征提 取是分类决策的依据,特征的提取和选择,关系到分类决策是否能高效 准确的完成。因此,用统计模式进行掌纹识别,特征提取是关键。 总结掌纹的特征有以下四大特征:第一,掌纹的结构特征;第二, 掌纹的时频分析特征;第三,掌纹的统计特征;第四,掌纹的子空间 特征。首先,基于结构特征,我们可以从掌纹图像中提取点、线【1 1 1 2 1 3 1 。 掌纹中的点特征非常丰富,有局部奇异点,三角点,纹形的起始点等等; 线特征包括三大主线,脊线及褶皱线。传统的线特征提取主要是边缘检 测,投影算法。其次,时频特征也是掌纹的主要特征之一,用傅立叶变 换,g a b o r 变换,小波变换等将图像变换到频域,可以深入掌握掌纹的 信息。再次,统计特征1 4 】也是非常有用的特征,可以通过提取各阶矩等 特征量来分析掌纹。最后就是子空间分析,即主成分的分析,包括维 和二维主成分分析。 1 2 2 掌纹识别方法的发展现状 在分析掌纹特点的基础上,利用掌纹进行身份自动鉴别就有四种方 法1 2 ,分别是基于掌纹几何结构特征的方法,基于掌纹时频分析特征的 方法,基于掌纹统计特征的方法和基于掌纹子空间的方法。这些方法为 基于掌纹的身份自动鉴别技术的研究积累了有益的经验。 ( 1 ) 基于掌纹几何结构特征的特征提取 基于结构的特征提取主要有点特征提取和线特征提取。掌纹的数据 点作为最重要的记录,要归功于它的位置的不变性,这样,就产生了最 简单和最有效的特征提取和匹配的方法,这不仅为掌纹中其它特征的定 义建立了参照,也为掌纹比对提供了重要的依据。点特征提取在指纹识 别中应用较多,主要是提取奇异点,三角点等有价值的点,这种方法对 图像的要求比较高,只能在高分辨率的图像中完成,计算比较复杂。提 取点的算法主要是方向投影法【5 】 6 1 ,这个算法分为三步:方向投影、平滑 和求最大值,由于方向投影是核心 因此称此基本算法为方向投影算法。 根据方向角,一般分为水平( 0 0 ) 投影、( 4 5 。) 投影、垂直( 9 0 0 ) 投影、( 1 3 5 。) 投影。利用这种方法可以将特征点快速简单的检测出来。 基于线特征【7 ) 【哪。的提取是掌纹识别中比较重要且用处较多的一种 方法。它提取的主要是掌纹的三大主线t 1 1 l 【2 3 1 ,脊线,和褶皱线。主要方 法是边缘检测和堆栈滤波。边缘检测是一种比较传统的方法,它主要采 用梯度算子,即用两个模板和图像进行卷积,两个模板分别对应x 方向 和y 方向的梯度,可以用于梯度算子的有索贝尔算子,拉普拉斯算子等。 基于堆栈滤波的方法是利用形态学【1 0 】中的腐蚀,膨胀,开运算,闭运算 来提取边缘。 ( 2 ) 基于掌纹时频分析的方法 时频分析方法主要是对掌纹图像进行傅立叶变换【12 】【1 3 1 ,g a b o r 变换 0 4 1 i 5 ,和小波变换。傅立叶变换的基本思想是先将掌纹图像应用傅立 叶变换转换到频域,然后在频域中进行特征提取和描述。一般是在频域 中定义r _ 特征和0 一特征,r 特征是沿半径方向能量的变化,是极坐标 上每个同心环上的能量,0 一特征是沿方向角上的能量。 g a b o r 变换的公式是: g 只“驴五矛1 唧 孚卜唧 拥c o s 卧缈s i l l 纠 、 其中,i = 4 1 ,p 是正弦曲线的频率,0 是函数的角度,6 是高斯 包络的偏离水平。将掌纹图像经g a b o r 滤波器处理后进行编码,形成两 位码【啡,”,其离散的g a b o r 函数为: 托。,。:一。乙g x ,y ,0 ,p ,印 g x ,y ,9 ,p ,6 】= g 【x ,y ,9 ,p ,6 一1 2 二! = ! ! = ;i i ! i i ;i :二 f 1 ,1 其中,g x ,y ,0 ,儿印是g 【x ,y ,0 ,p ,们的离散形式,这种改进的g a b o r 滤波函数去除了直流分量,是系统的鲁棒性更强。编码规则为: 6 ,= 1 i fr e g x ,y ,0 ,p ,棚 i 】2 0 ( 1 3 ) 6 ,2 0 i f r e g x ,y ,0 ,p ,们 刀 o ( 1 4 ) 6 j = 1i fi m g x ,y ,0 ,p ,e l * 朋0 r 1s 、 芒l 。0矿i r i l 【g x ,儿0 ,肛,m 刀 o ( 1 6 ) 小波变换 2 4 1 是近年来比较新兴的方法,它的思想是掌纹中不同区域 的纹线方向和空间频率代表着掌纹图像内在的特征。为了提取该特征, 提出了一种基于原始灰度图像的小波变换的新算法,它可以用于图像纹 理特征的提取和图像的去噪。由于该算法直接对原始的灰度图像进行处 理,而无需对图像进行预处理( 例如图像增强、滤波、区域分割、二值化、 纹线细化等) ,因此它与传统的细节特征识别方法相比大大减小了计算消 耗。近年来三通道小波变换的思想,也慢慢地悄然兴起,它解决了由于 采样问题而产生严重几何变形的校正问题。三通道小波分解后进行二插 值重建对数字图象进行重采样,从而达到图象几何变换的目的。 ( 3 ) 基于掌纹统计特征的分析方法 常见的统计特征提取主要是各阶矩的提取,它包括均值( 一阶原点 矩) ,方差( 二阶中心矩) ,斜态( 三阶中心矩) ,峰态( 四阶中心矩) 。 还可以通过计算灰度共生矩阵来求熵和能量。提取能量的方法在很多文 献中都有应用,这种方法是一种全局的方法,不需要关心手掌纹线具体 的分布和尺寸,而只关心手掌在某指定方向的纹理能量分布,即忽略纹 线的细节,而只看重不同纹线对不同方向贡献的全局变量。 ( 3 ) 基于掌纹子空间的分析方法 目前应用的有主成分分析,独立成分分析堋,特征掌【瑚,f i s h e r 掌 1 9 1 2 0 等方法。主成分分析是多变量统计中的一种降维方法,它将图像 图像分解成为一系列向量与系数的线性组合,该类系数是彼此不相关 的,并且服从高斯分布,将其中包含信息量最多的向量视为主要成分方 向,去除其他的方向。并将获得的一维向量进行k l 变换,获得正交的 k l 基底,对应的前删 0 , 有 1一生 ( r ) = 走p 4 4 z v 月a ( 3 3 ) 由公式( 3 2 ) 可知,对信号的g a b o r 变换就是用平移后的窗函数 去乘以信号本身后再作f o u r i e r 变换。这样就使得皿,( u ,b ) 7 e t = b 的周 围使,的f o u r i e r 变换局部化了,即大部分能量处于t = b 的时间间隔 p ,r 】和频率间隔为【q ,q 的信号,其g a b o ,变换将局限在区域口,丁】。内, 而在此外的空间中,g a b o r 因子将逼近于零。窗的“宽度”由约定的正常 数a 决定,并满足: 岛( f _ 6 ) 动= g 口( x ) 出一 ( 3 4 ) 通过公式( 3 2 ) 我们可以等价地将g a b o r 变换的基函数看成是窗 口函数的调制函数,这就是g a b o r 函数。g a b o r 函数一般采用g a u s s i a n 函数乘以一个调制函数的形式,因为g a u s s i a n 函数在时间和频率域中的 形式是一致的,因此g a b o r 函数具有较好的局域性。 一维g a b o r 函数是由椭圆形的高斯函数和复平面波的乘积组成,其 表达式为: 田班击晰吉争e x p ( y w 0 ( x 叫) ( 3 j 5 ) 其中,盯为高斯函数的标准差,为复平面波的空间频率,为 函数的中心点坐标。通过简单的实验,我们取口= 1 ,。o = 1 ,其函数 的奇偶分量的m a t l a b 仿真图形为下图表示: 图3 1g a b o r 函数奇函数 图3 2g a b o r 函数偶函数 随着一维g a b o r 函数在信号处理领域的广泛应用,d a u g m a n 于1 9 8 5 年在一维g a b o r 函数的基础上将其扩展成为二维形式,即2 dg a b o r 函 数。其一般表达式为; 吣m ) = 南c x p 【- 圭( 垡笋+ 业笋) 】e x p j w 0 ( ( x 训m 一虬) ) ( 3 6 ) 其中t a d o 仍然为复平面波的空间频率,卢分别为x , y 方向上的 g a u s s i a n 标准方差,x 0 ,y 0 分别为小波在空域的中心坐标。 二维g a b o r 函数同样可以分解成奇函数皿( x ,y ,仃,) e 和偶函数 皿( x ,y ,盯,) a 两部分,其表达式分别为: 吣胍吼= 南e x p 【_ 三( 学+ 与幽( 州工训地训) ( 3 7 ) 皿( 五弘盯,) 。= 丽1e x p 卜圭( 学+ ! 上云学) s i n ( ( 一) + ( y 一) ) ) ( 3 8 ) 和一维形式一样,我们仍然在满足o z o o 兰1 的条件,此时我们取盯= 1 ,p = 1 ,= 1 ,= 1 ,虮= 1 ,此时2 dg a b o r 函数的奇偶分量的 m a t l a b 仿真图形为下图表示: 图3 32 dg a b o r 函数奇函数图3 42 dg a b o r 函数偶函数 应用g a b o r 函数进行特征提取时主要通过两种途径:第一种是 g a b o r 表达式,第二种就是g a b o r 滤波器( 即g a b o rf i l t e r i n g ) 。二维o a b o r 滤波器是在二维g a b o r 函数的基础上构建的,其不仅可以象一维g a b o r 函数一样同时获取时间域和频率域的最小不确定性。2 dg a b o r 滤波器 是以2 dg a b o r 函数作为其基函数,虽然其基函数不能构成一个完备的 正交集,但g a b o r 滤波器仍然可以看作是一种小波滤波器。由于在时域 和频域都具有的显著的优势,因此g a b o r 函数作为分析滤波器被广泛应 用于图像处理中。由于g a b o r 滤波器的定义是基于g a b o r 小波族的基础 上进行离散化的处理,因此我们通过对通过对标准2 dg a b o r 函数( 如 公式( 3 2 ) 所示) 进行归一化处理,即满足i 尘,掣户l ,这样我们可以得 到g a b o r 滤波器的函数形式,即: 岫以炉e 冲 - 暑笋h 塑半幽f 0 = 三( _ j 一1 ) k = l ,2 3 一,挖 ( 3 9 ) ( 3 1 0 ) 其中,a 和0 分别为正弦波的波长和方向,6 为高斯包络在x 和y 方 向上的标准差,这里疋= 氏,它决定了高斯包络在空间上的扩展方向。 假设我们将滤波器组选定为( 6 x 4 ) 大小,即沿行方向为6 个尺度, 沿列方向为4 个方向。我们将g a b o r 滤波器组中每个特定的尺度和方向 滤波器分别表示,其在频域的表示图,如图3 5 所示: 图3 5g a b o r 滤波器组的频域表示 相应的g a b o r 滤波器组每个特定的尺度和方向的滤波器在空域的 表示图,如图3 6 所示: 图3 6o a b o r 滤波器组的空域表示 从图3 6 中可以直观地看到滤波器在方向上的变化,同时随着尺度 的变化,滤波器的频率及覆盖的范围都发生了相应的变化,与其在频域 的变化方式( 如图3 5 ) 是完全一致的。 方向的确定是依据公式( 3 1 0 ) 确定的,由 = 4 ,可以得到的4 个方向分别为( 0 。,4 5 。,9 0 。,1 3 5 。) 。 3 3 基于g a b o r 滤波器的纹理特征提取 o a b o r 函数是目前唯一能够达到时频测不准关系下界的函数,能最 好地兼顾信号在时域和频域中的分辨能力。应用2 do a b o r 函数形成的 o a b o r 滤波器有着优良的滤波器性能,并且与生物视觉系统相近。 根据公式( 3 9 ) 和( 3 1 0 ) ,本文实验数据设定如下m : 一 一一一 口= o 5 a ;a = 2 2 ,4 2 ;口= o ,导,兰,竿滤波器组有2 x 4 个滤波器组成。 斗z| 设样本图像为l ( x ,y ) ,从图像l ( x ,y ) 中抽取的样点为( x ,y ) ,其中,w 为滤波器窗口的大小。则在该点处提取的特征为: g ( x y , o ,= l ,冀登i ( x 憾m m 川y l 1 1w12y=-w12 , ,a ) = l + x ,y + y ) m ,口,a ) l ( 3 ) i l 在这里,将1 2 8 x 1 2 8 像素的图像分成8 8 ,即“块,每块为1 6 x 1 6 象 素的图像,如图3 7 所示。每块分别用8 个不同的g a b o r 滤波器,可以得 至u 5 1 2 维的特征向量。 图3 7 将一幅掌纹图像分成6 4 块1 6 x 1 6 像素的图像 图3 8 所示为特征加权组示意图,图中有1 6 个窗口,每个窗口包含4 个特征抽取子窗口,即这1 6 个窗口代表原样本图像的6 4 个特征抽取子窗 口。 图3 8 特征加权组示意图 例如,w 4 包含 1 ,2 ,3 ,4 ) 特征抽取子窗口。现将图3 8 q m l 6 个窗 口分成互相重叠的9 组,称为“特征加权组”,用圆圈中的数字代表,记 为形,= 1 ,2 ,9 。圆圈经过的窗口为该特征加权组所包含的全部特征 抽取子窗口。如图3 8 所示, w 4 ,w 8 ,w 2 0 ,w 2 4 磁, w 2 0 ,w 2 4 ,w 3 6 ,w 4 0 ,以此类推。 令代表彬中包含特征抽取子窗口的个数,这里为1 6 。对每一 个特征抽取子窗口,应用式( 3 1 0 ) 进行特征抽取。设提取的特征为勖, 其中i 代表第f + o a b o r 滤波器( f 2 1 ,2 ,8 ) ,代表第_ ,个特征抽取子 窗口u = 1 ,2 ,6 4 ) 。例如,对于彬,当g a b o r 滤波器为f 时,依次提取 的特征为 蜀l ,一,。,g ,蜀:。 。令砩为每个彤的方差,代表第个 g a b o r 滤波器,代表第,个特征加权组。则 印棚= 击荔 g , a o , , x ) - l 鹕柚j 1 2 ) 用式( 3 1 2 ) 对特征岛进行加权,得到加权后的特征邑为 洲= 揣 1 3 ) 虽然特征加权组是互为重叠的,但每次特征加权时,都取原g a b o r 特征值。 实际上,此时提取的g o ”特征是一个复数量,即: 岛”( 口,a ) = p + q i ( 3 1 4 ) 其中,p 为实部,q 为虚部,定义晶,”( 口,a ) 的纹理能量为: e = p 2 + q 2 ( 3 1 5 ) 表3 1 为a = 2 互,口:4 5 9 时,第一幅正类样本掌纹g a b o r 滤波器的纹 理能量,分别计算8 个滤波器的纹理能量,得蛰j 5 1 2 维的特征向量。 计算每一幅训练集与测试集样本的特征向量。在下一章中,将把训 练集样本的特征向量输n s v m 网络,进行训练,并对测试集样本进行测 试。 表3 1 入:2 j ,0 = 4 5 9 时掌纹g a b o f 滤波器的纹理能量 12345678 1 0 3 0 50 2 2 30 1 4 7o 1 8 40 2 3 20 2 8 2 0 _ 3 3 5 0 1 8 4 20 3 9 80 3 5 20 6 8 7o 1 7 20 2 8 30 2 0 9o 1 8 90 1 0 5 3 0 7 6 0 o 1 4 4 0 8 8 20 0 9 6 0 1 6 60 5 7 60 8 3 9 0 3 5 7 4o 3 1 6o 2 4 5 0 3 9 10 5 9 90 1 5 30 1 4 0 0 5 7 7 0 7 4 4 50 4 6 7o 6 0 90 2 3 80 4 2 50 2 6 8o 6 2 40 9 7 70 8 2 8 60 2 4 10 3 8 60 3 7 70 3 8 50 2 6 40 2 6 30 4 7 60 7 6 9 7 0 2 3 6 0 9 7 7 o 7 1 8 0 3 6 40 4 2 3 0 4 3 00 7 7 90 9 7 7 8o 2 1 50 7 8 00 3 1 9o 3 0 90 7 2 60 6 2 90 6 4 50 2 9 4 3 4 小结 在本章中,重点阐述了基于纹理特征的提取问题。特征提取是掌纹 识别的关键所在,基于纹理的特征提取有其特定的优势,它不关心手掌 纹线具体的分布和尺寸,而只关心手掌在某指定方向的纹理分布,即忽 略纹线的细节,而只看重不同纹线对不同方向贡献的全局变量。本章讨 论了1 dg a b o r 滤波器和2 dg a b o r 滤波器的特性,提取g a b o r 滤波器的 纹理能量作为特征向量,为下一章的特征匹配做好准备。 第四章基于s v m 方法进行掌纹识别 4 1 引言 支持向量机( s u p p o r t v e c t o r m a c h i n e ) 2 5 1 1 别是在统计学习理论基 础之上发展起来的一种全新的机器学习算法,它以统计学理论的结构 风险最小化原则为理论基础,将最大化分类间隔的思想和基于核的方法 结合在一起,表现出很好的泛化能力。它通过把高维空间的函数转化为 较小的v c 维函数集,把原问题转化位对偶问题这一特点,把计算重心 由空间维数转移到了样本数,尤其是支持向量的个数。它根据有限的样 本信息,在模型的复杂性与学习能力之间寻求最佳折中,具有良好的抗噪 性和较高的识别率,并且具有良好的扩展性。与传统的基于神经网络的 图像分类相比具有极高的优越性,尤其在处理小样本、高维数问题上有 很好的表现。由于s v m 方法有坚实的数学基础,并且可以有效地克服“维 数灾难”等问题,所以受到了越来越多的关注和青睐。s v m 方法在人脸 识别,文本识别,车牌识别,遥感图像等多个领域有重要的应用,成为 近二十年发展最快的研究方向之一。本文利用该算法做掌纹图像的分 类,并与传统的神经网络分类算法进行了比较。 4 28 v m 方法简介 4 2 1 线性支持向量机 图4 1 最优分类面 支持向量机算法【4 2 4 3 4 4 1 1 4 5 1 可以分为线性和非线性两类,首先涉及 的是线性支持向量机。如图4 1 中所示,实心点和空心点代表两类样本,粗 线为分类线,过各类样本中离分类线最近的样本且平行于分类线的直线 之间的距离叫做分类间隔( m a r g i n ) 。在这里要求对两类进行最优分类, 所谓最优分类,就是求一个分类线,它不但能将两类正确分开( 训练错 误率为o ) ,而且使分类间隔最大。在高维空间,就需要求一个最优分类面, 将两类正确分开。 支持向量机的主要思想是构造一个分类间隔最大的分类超平面,使 各类中与分类超平面距离最近的样本之间的距离最大。 我们有如下方程:p o g + b 2 0 ,可以对它进行归一化,使得对线性可 分的样本集( t ,乃) ,5 1 ,2 ,x e r 4 ,y + 1 ,一,满足条件: 只【( 蕾) + 6 】一1 0 , i = 1 ,2 ,。,n ( 4 1 1 此时分类间隔等于2 物9 ,使间隔最大等价于使俐j 2 最小,使分类间 隔最大实际上就是对推广能力的控制,这是s v m 算法的核心思想之一。 满足条件式( 1 ) 且使1 2 | 2 最小的分类面就叫做最优分类面,训练样本 点就称作支持向量。 利用l a g r a n g e 优化方法可以把上述最优分类面问题转化为其对偶 问题,即:在约束条件y , c t = o 下对l a 口a 1 1 9 e 系数哎求解下列函数的最 f 1 1 大值: q ( c t ) = q 一去q 叼乃乃( t ) 9 1q 1 ( 4 2 ) q 为原问题中与每个约束条件对应i 拘l a g r a n g e 乘子。这是一个不等 式约束下二次函数寻优的问题,存在唯一解。容易证明,解中将只有一部 分( 通常是少部分) q 不为零,对应的样本就是支持向量。解上述问题后得 到的最优分类函数是: m ) = s g n ( u x ) + 6 0 = s g n o ? 只( t x ) + 6 1 l 仁l ( 4 3 ) 式中的求和实际上只对支持向量进行。b 是分类阈值,可以用任一 个支持向量( 满足式( 1 ) 中的等号) 求得,或通过两类中任意一对支持向量 取中值求得。 4 2 2 非线性支持向量机 对非线性问题,要通过非线性变换将输入向量映射到一个高维空间 中,在这个高维空间进行分类运算,即在变换空间求最优分类面。首先 假设有一个非线性映射o :r d - - * h ,将输入空间的样本映射到高维( 可能 是无穷维) 的特征空问h 中,使其在高维空间中线性可分。根据h i l b e r t s c h m i d t 卿,只要有一种核函数k ,x j ) 满足m e r c e r 条f e ( ,它就对应某一 变换空间中的内积,而且并不需要知道m 的具体形式。当在特征空间h 中构造最优超平面时,训练算法仅使用空间中的点积,即m ( t ) 。( 一) ,而 没有单独的m 【t ) 出现。因此,如果能够找到一个函数k 使得 k ( t ,乃) 2 ( t ) 中( _ ) ,这样,在高维空间实际上只需进行内积运算。称 k ( t ,乃) 2 中( t ) o ( _ ) 为内积函数,也称核函数。 因此,在最优分类面中采用内积函数k ,) 就可以实现某一非线 性变换后的线性分类,此时目标函数式( 4 2 ) 变为: q ( a ) = 嘶一寺o t t a 只乃足( _ ) “ “f 1 ( 4 4 ) 而相应的分类函数也变为 rn1 ,( z ) = s g n 吖卫k ( x ) + 6 l i = 1j ( 4 5 ) 由以上分析可见,样本在映射空间内无论是线性可分还是线性不可 分,在求解其最优分类面时,都无需考虑映射中的具体形式,只用一个 满足m e r c e r 条件的核函数代替映射空间的内积运算即可,因此克服了 “维数灾难”现象,并且在运算的复杂度上也没有明显增加。这种不但不 对原输入空间降维却反而升维的方法与传统的思路是完全不同的,它要 寻求的是在高维空间的线性可分。 4 2 3s v m 算法的核函数 利用核函数就可实现该空间的内积运算,有效地简化了计算的复杂 度。同时对于仅使用内积运算的每一种线性方法都可以在映射空间中通 过核函数伫7 1 来实现。根据核函数k 的不同形式,可生成不同的支持向量 机核函数。 支持向量机中常用的核函数主要有以下几种: ( 1 ) 线性核函数:g ( x ,x ) = ( 墨x 。) ; ( 4 6 ) ( 2 ) 多项式核函数;k ( x ,x ) = ( x ,x ) ; ( 4 7 ) ( 3 ) r b f 核硪m 小c x p ( 一嘴; ( 4 8 ) ( 4 ) s i g m o i d 核函数:x ( x ,i ) = t a n h ( p ( x ,x ) + c ) 。 ( 4 9 ) 4 3 用支持向量机实现掌纹验证 支持向量机的基本思想是使用简单的线性分类器划分样本空问。对 于在当前特征空间中线性不可分的模式,则使用一个核函数把样本映射 到一个高维空间中,使得样本能够线性可分。支持向量机( s u p p o r t v e c t o r m a c h i n e ,s v m ) 起源于统计学习理论,它研究如何构造学习机,实现模 式分类问题。由于支持向量机方法有几个主要优点: 攀蘩i 专门针对有限样本情况的,其目标是得到现有信息下的最优解而不 仅仅是样本数趋于无穷大时的最优值; 2 ) 算法最终将转化成为一个二次型寻优问题,从理论上说,得到的将 是全局最优点,解决了在神经网络方法中无法避免的局部极值问 题: 3 ) 算法将实际问题通过非线性变换转换到高维的特征空间( f e a t u r e s p a c e ) ,在高维空间中构造线性判别函数来实现原空间中的非线性 判别函数,特殊性质能保证机器有较好的推广能力,同时它巧妙地 解决了维数问题,其算法复杂度与样本维数无关;又由于统计学习 理论为人们系统研究有限样本情况下机器学习问题提供了有力的 理论基础。 本文所用的数据库为香港理工大学的掌纹数据库。此数据库共采集 1 0 0 个人的手掌图像,这些人是从香港理工大学的学生和职员中选出的, 每个人又分别根据不同时间采集六幅图像,总共6 0 0 幅图像,图像大小 为3 8 4 x 2 8 4 像素,灰度级为2 5 6 级。 本文为构建s v m 网络,需要分别选取正、负类样本。正类样本是来 源于同一手掌的图像:负类样本为与正类样本相异的掌纹图像。如图4 2 所示,为某人不同时间采集到的六幅掌纹图像;图4 3 为其他人的掌纹 图像。分别从正、负类样本中各选取四幅作为训练样本,其余各2 幅作 为测试样本,同时又选取其他1 1 6 幅图像作为负类样本,共得到1 2 0 幅测 试样本。 图4 2 正类样本 图4 3 负类样本 本文所用的核函数为多项式内积核和高斯核,所用的分类器为多项 式分类器和径向积函数网络,如表4 1 所示。 表4 1 本文所用核函数以及分类器 内积核分类器 多项式内积核:k ( x ,工) = ( 五x ) 多项式分类器 径向积函数网络 高斯核: 鳟2 用s v m 进行分类的过程如下: 输入:样本集输出:分类结果 具体步骤: 1 1 从掌纹数据库中选出四个正类样本和四个负类样本,构造初始 训练集。 2 ) 构造分类超平面,选取支持向量,并将支持向量构成集合。 3 ) 正确标注支持向量的样本类别。 4 ) 从掌纹数据库中选取1 2 0 幅图片作为测试集。 5 ) 测试图片,得出结果。 如下图所示:为s v m 网络结构图,输入为而) ,输出为y 。 回 回 回 图4 , 4s v m 网络结构图 一般来讲,核函数选取不同,识别率也不同。下表给出了应用不同 核函数时,所得到的识别率。在本文的掌纹识别系统中,r b f 核函数比 多项式核函数有更好的识别效果。 表4 2 选择多项式核函数和r b f 核函数,这两种核函数得到的识别率比较: s v m k ( x ,y ) 多项式 r b f 核参数 d = 2y 锄1 训练样本数 88 支持向量个数 32 测试样本数 1 2 01 2 0 错分样本数 1 4 8 识别率 8 8 9 3 4 4 用神经网络方法实现掌纹验证 b p 算法,即误差反向传播算法( e r r o rb a c kp r o p a g a t i o n ) 广泛应用于 模式识别领域,采用b p 算法的多层神经网络模型一般称为b p 网络,它 是目前人工神经网络中研究最深入、应用最广泛的一类网络。b p 网络 由输入层、中间层和输出层组成,中间层也就是隐含层可以是一层或多 层。本文采用的是3 层b p 网络,即隐含层只有一层。 输入层取已经提取过的5 1 2 维的特征向量;隐层节点的数目根据经 验公式可以计算出来为9 3 5 ,实验结果表明,隐层节点取1 5 2 5 之间 网络的分类正确率比较高,在这里取2 0 ;由于用于分类设计,类别数 为2 ,因此输出层节点数为2 ,输出层节点用s i g m o i d a l 函数或硬极限函数。 假设b p 网的输入矢量为x r ”,其中工2 ( x o ,x z ,矗一,) 1 ;隐含层有 惕个神经元,它们的输出为,r n ,x k ( x 。,x j ,x _ 一,y ;输出层有m 个神经元,输出y r ”,y2 ( ,m ,虼一- ) 。设输入层到隐含层的权为 嘞,阈值为6 1 ,;隐含层到输出层的权为m j ,阈值为口? 。于是隐含层 输出为: 旦i x j = ( 吩五一q ) ,- = o ,1 ,r 4 一l、 ( 4 1 0 ) 输出层的输出为: 一l 乃= f ( e c o z 1 厂口:) ,l = 0 ,1 ,一,m 一1 ;o ( 4 1 1 ) 其中,( + ) 是激励函数,采用双极s 函数即可,实际上,连续可微 单调上升即可。 训练过程如下: 1 ) 选定正类样本和负类样本作为训练集。 2 ) 初始化精度控制参数和学习率。 3 1 开始训练,并计算隐含层输出矢量和输出层输出矢量。 4 ) 计算误差项和各权重的调整量,并调整权重。 5 1 直到误差函数符合要求为止,结束训练。 测试过程如下: 1 ) 从测试样本中选取测试文件。 2 ) 应用已经训练好的权重和阙值,根据网络输入,计算网络输出。 3 ) 根据输出值进行判断。 表4 3 本文所用的神经网络输入向量维数和识别率: 输入向量维数 识别率 6 48 7 2 5 67 3 5 1 25 6 采用6 4 维输入向量时得到的结果为8 7 ,采用2 5 6 维输入向量时 得到的结果为7 3 ,采用5 1 2 维输入向量时得到的结果为5 6 ,可以看 出,神经网络只适用于输入向量不大的情况,一旦输入向量的维数增加, 其收敛性和错误率都会发生较大的偏差。 表4 4 神经网络和支持向量机的比较: 分类准确性 分类器 多项式核r b f 核 支持向量机 8 8 、9 3 神经网络 8 7 由上表看出,b p 算法在识别方面较s v m 方法还有一定的差距,s v m 方法由于克服了局部最小,同时实现全局优化,得到了更好的泛化能力, 由此验证了s v m 算法分类的优越性远远大于传统的神经网络算法分类。 4 5 小结 本章通过用s v m 算法和神经网络算法两种方法对掌纹图像进行分 类,验证了基于s v m 算法分类的优越性远远大于传统的神经网络算法 分类。而且,s v m 算法具有良好的抗噪性,而对于神经网络算法,一 旦输入向量的维数增加,其收敛性和错误率都会发生较大的偏差。实验 结果验证了用s v m 算法比用神经网络算法有更大的准确率,尤其在小 样本、高维数的分类上。 5 1 结论 第五章结论和展望 本文以掌纹为研究对象,进行了一系列的工作。首先,对在线掌纹 进行预处理,采用改进的h a r r i s 算法对图像进行角点检测,建立直角坐 标系,取固定矩形区域进行研究。对固定矩形区域特征提取,本文用 g a b o r 滤波器进行纹理特征提取,得到特征向量。输入s v m 网络进行 训练和识剐,并与传统的神经网络方法进行比较,验证了对于小样本、 高维数的分类问题,s v m 有更好的识别率。 本文的主要工作如下: 1 ) 采用o s t u 算法,对掌纹图像进行二值化。以往的掌纹图像预处 理大多采用固定阈值法,这种方法存在一定的误差,不是最优的二值化 方法;而o s t u 算法可以以最佳门限将图像灰度直方图分割成两部分, 使两部分类间方差取最大值,即分离性最大,这种方法取得的阈值误差 较小。 2 ) 本文中提取得子图像为固定1 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 华师大版初中科学氧气(第2课时)(30课件)
- 客户关系管理与客户体验制度
- 小学生成长册样板
- 4《梅花魂》核心素养分层学习任务单-2022-2023学年五年级语文下册新课标(部编版)
- 福建省龙岩第二中学2024届高三5月调研测试数学试题试卷
- 大连市第九中学2023-2024学年高三下学期第三次质量检测试题数学试题
- 2024年江西客运上岗证模拟考试题答案
- 2024年北海小型客运从业资格证考试培训试题和答案
- 2024年云南客运从业资格证模拟考试app
- 吉首大学《风景园林速写》2021-2022学年第一学期期末试卷
- 2024年四川省达州市中考英语试题含解析
- 金融求职自我介绍
- 辽宁省大连市中山区2024-2025学年九年级上学期期中化学试题
- 天津市天津市红桥区2024-2025学年八年级上学期10月期中英语试题
- 湘教版(2024新版)七年级上册数学期中考试模拟测试卷(含答案)
- 期中试题-2024-2025学年六年级上册语文统编版
- 中建测评2024二测题库及答案
- 教科版六年级科学上册期中测试卷附答案
- 全国中学生物理竞赛集锦(电磁学)
- 电饭煲项目财务分析表
- 天文知识太阳系八大行星知识科普PPT模板下载
评论
0/150
提交评论