已阅读5页,还剩50页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
r 摘要 图像的自动分类在许多领域都是一项关键的任务,其中包括图像检索、可 视场景的目标检测、网络信息过滤、医学图像应用等等。当直接在图像上进行 操作时,传统的分类方法由于数据的高维特性表现差,很难取得较好的效果。 而支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 却可以克服高维表示的缺陷,因此 被广泛运用到图像分类中。 由于支持向量机的分类性能极大程度地依赖于核参数的选择,因此,本文 着重研究了核参数选择方法,并利用不同的颜色、纹理特征对图像进行分类。 本文所做的主要工作如下: 1 分析了支持向量机核函数中各个参数对分类模型的影响,使用网格搜索法 和粒子群算法对模型中的参数进行了优化,比较各方法对s v m 核参数的寻优能 力。 2 对彩色图像在h s v 空间使用不同的量化方法提取颜色特征,针对传统直 方图丢失颜色空间信息的情况,使用一种区域加权直方图与颜色矩结合的颜色 特征提取方法。纹理方面,使用灰度共生矩阵法、l b p 分别提取出图像的纹理 特征,对l b p 模式的进行了降维方面的研究,分析了l b p 统一模式的不足。 3 应用p s o 算法的s v m 对图像进行分类,对图像的色彩、纹理等多种特征 的分类能力进行了测试和比较,分析了不同参数优化方法对图像分类准确率的 影响。 关键词:支持向量机,灰度共生矩阵,局部二值模式,颜色直方图 a b s t r a c t a u t o m a t i cc l a s s i f i c a t i o no fi m a g e si sc r i t i c a lt a s ki nm a n ya r e a s ,i n c l u d i n gi n f o r m a t i o nr e t r i e v a l , v i s u a ls c e n ed e t e c t i o n , i n t e m e td a t af i l t e r i n g ,m e d i c a la p p l i c a t i o n s ,e t c w h e no p e r a t e dd i r e c t l yi n t h ei m a g e ,t h ec o n v e n t i o n a lm e t h o d sa l w a y sd i f f i c u l tt oo b t a i ng o o dr e s u l t sb e c a u s et h e ya r ep o o r i nh i g hd i m e n s i o np e r f o r m a n c e h o w e v e r , s u p p o r tv e c t o rm a c h i n e ( s v m ) c a l lo v e r c o m et h e d e f e c to fh i 曲- d i m e n s i o n a lr e p r e s e n t a t i o n ;i th a sb e e nw i d e l yu s e di ni m a g ec l a s s i f i c a t i o n s i n c et h ec l a s s i f i c a t i o nc a p a b i l i t yo fs v mg r e a t l yd e p e n d e n to nt h es e l e c t i o no fk e r n e l p a r a m e t e r s ,t h e r e f o r e ,t h i ss t u d yf o c u s e do nt h ek e r n e lp a r a m e t e rs e l e c t i o nm e t h o d s ,t h e nt h e d i f f e r e n tc o l o r , t e x t u r ef e a t u r e sw e r ee m p l o y e di ni m a g ec l a s s i f i c a t i o ne x p e r i m e n t t h em a i nw o r ko f t h i sp a p e ri sa sf o l l o w s : 1 t h i sp a p e ra n a l y z e st h ek e r n e lp a r a m e t e r so fs v mc l a s s i f ym o d e l ,a n du s et h eg r i d s e a r c hm e t h o da n dp a r t i c l es w a r mo p t i m i z a t i o na l g o r i t h mt oo p t i m i z et h ep a r a m e t e r so fs v m k e r n e l t h e nc o m p a r et h e i rc a p a b i l i t yi nk e r n e lp a r a m e t e ro p t i m i z a t i o nb ye x p e r i m e n t s 2 u s i n gd i f f e r e n tq u a n t i t a t i v em e t h o d sf o rc o l o rf e a t u r e se x t r a c t i n gi nh s v c o l o rs p a c e , b a s e do nt h et r a d i t i o n a lh i s t o g r a ml o s sc o l o rs p a c ei n f o r m a t i o n ,ar e g i o n a lw e i g h t e da n dc o l o r m o m e n tc o m b i n e dc o l o rf e a t u r ee x t r a c t i o nm e t h o di sp r o p o s e d t h ec o o c c u r r e n c em a t r i x e sa n d l b pw e r ee m p l o y e dt oe x t r a c tt e x t u r ef e a t u r e s t h ed i s s e r t a t i o ni n v e s t i g a t e dt h ed i m e n s i o n r e d u c t i o no fl b pp a t t e r n ,t oo v e r c o m et h el i m i t a t i o no ft h eu n i f o r ml b pp a t t e r n , an e wl b p h y b r i dp a t t e r nw a sd e v e l o p e df o rt e x t u r ef e a t u r ee x t r a c t i o n 3 t h ep s ob a s e ds v mh a sb e e n a p p l i e d i ni m a g ec l a s s i f i c a t i o n ,t h er e c o g n r i o n p e r f o r m a n c ea b o u ti m a g e sc o l o r ,t e x t u r ea n do t h e rc h a r a c t e r i s t i c sw e r et e s t e d ,a n a l y z e da n d c o m p a r e d ,t h i sp a p e ra l s oa n a l y z e st h ei n f l u e n c eo fd i f f e r e n tp a r a m e t e r so p t i m i z a t i o nm e t h o d s o ni m a g ec l a s s i f i c a t i o na c c u r a c y k e y w o r d s :s v m ,g l c m ,l b p , c o l o rh i s t o g r a m h 1 目录 一章绪论1 1 研究背景及意义1 2 研究现状2 3 论文的主要研究内容3 4 论文的组织结构4 二章图像特征提取5 1 颜色特征5 2 1 1 颜色空间模型5 2 1 2 颜色直方图8 2 1 3 颜色集9 2 1 4 颜色的量化处理1 1 2 1 5 颜色矩1 3 2 1 6 颜色聚合向量1 4 2 1 7 颜色相关图1 5 2 2 纹理特征1 6 2 2 1 灰度共生矩阵1 6 2 2 2l b p 特征提取1 9 2 3 形状特征2 2 2 3 1 边界特征法2 3 2 3 2 傅里叶形状描述符法2 3 2 3 3 几何参数法2 3 2 3 4 其它方法2 3 2 4 空间关系特征2 4 第三章s v m 分类器构造2 5 3 1s v m 基本思想2 5 3 2s v m 优点2 6 3 3 线性分类器2 6 3 4 核函数2 8 3 4 1 利用核函数进行非线性映射2 8 3 4 2 常用核函数2 8 3 5 松弛变量及惩罚因子2 9 3 6 多类分类3 0 3 6 1s v m 多类分类方法3 0 3 6 2 决策矩阵模板匹配多分类3 l 3 7s v m 参数选择3 3 3 7 1 核函数选择3 3 3 7 2 网格搜索法3 3 3 7 3 基于p s o 的s v m 参数选择3 4 第四章系统实验3 7 4 1 基于s v m 的图像分类实验说明3 7 4 2 基于颜色特征的分类结果与分析3 8 4 2 1 颜色直方图分类结果3 8 4 2 2 区域加权直方图与颜色矩结合的分类结果3 9 4 3 基于纹理特征的分类结果与分析4 0 4 3 1 基于灰度共生矩阵特征的图像分类4 0 4 3 2 基于l b p 纹理特征的图像分类4 l 4 4 本章小结4 2 第五章总结4 3 参考文献4 5 致谢4 8 附录本文对应图表4 9 攻读硕士学位期间发表的论文5 0 第一章绪论 1 1 研究背景及意义 第一章绪论弟一早 三百下匕 伴随网络和多媒体技术的飞速发展,包括声音、图形、图像、视频和动画 等数字信息急剧膨胀。图像作为一种内容丰富、表现直观的媒体信息,受到人 们的关注。在现实生活中时时刻刻都有大量的图像产生,如何从这些图像信息 中找出符合用户要求的图像,是研究者需要解决的问题。图像分类就是模式识 别的过程,利用计算机对图像进行定量分析,把图像中的每个像元或区域划归 为若干类别中的一种,以代替人的视觉判读。图像的内容丰富多彩,其所包含 的内容抽象复杂。由于目前图像理解和计算机视觉发展的水平所限,人对图像 的理解与计算机对图像的描述存在较大差异。而且不同的人对同一幅图像的理 解和描述也存在差距,甚至大相径庭,诸如此类问题,都是图像分类需要考虑 和解决的难题。图像分类的应用领域范围很广,几乎各行各业或多或少的与图 像分类有关。目前,主要应用领域有:搜索引擎、图像检索【l 捌、图像识别等等。 支持向量机p ,4 j ( s u p p o r tv e c t o rm a c h i n e ,s v m ) 是v a p n i k 等人根据统计学 习理论提出的一种学习方法,近年来在模式识别、回归分析、图像处理和数据 挖掘等方面得到了广泛应用。支持向量机方法根据v a p n i k 的结构风险最小化原 则,尽量提高学习机的泛化能力,即由有限训练样本得到的决策规则对独立的 测试集仍能够得到小的误差。此外,支持向量机算法是一个凸二次优化问题, 能够保证找到的极值解就是全局最优解。这些特点使支持向量机成为一种优秀 的学习算法。近年来由于支持向量机基于小样本训练的优越性,被广泛应用于 模式识别的各个领域,在图像检索,人脸识别等中都涌现了许多新的算法和改 进,越来越受到广泛的关注和重视。但支持向量机方法也存在一些问题,如对 一般函数的v c 维( v a p n i k - c h e r v o n e n k i s d i m e n s i o n 简称v c ) 确定问题、训练算法 的改进问题及核函数的选择及参数的确定问题,以及多分类应用等尚未有很好 的确定办法。 由上可知,对基于s v m 的图像分类的研究,改善图像分类的性能具有实际 的应用价值,是个很有意义的研究课题。 南京信息工程大学硕士学位论文 1 2 研究现状 早在2 0 世纪7 0 年代当时的图像分类主要采用人工手动进行文本标注的方 法,使用人们生活中关键词进行类别描述。如今随着数字图像数据库的急剧膨 胀,如何快速提取有用的视觉信息越来越受到人们的重视。对图像的有效分类 成为获取图像信息的关键问题。支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 是一 种通用学习机器,是统计学习理论的一种实现方法,它以结构风险最小化作为 评判原则。为解决原空间数据的线性不可分问题,通过核函数将输入向量映射 到一个高维的特征空间,并在该特征空间中构造最优分类面。由于其优越的性 能近年来得到了广泛的应用。 图像分类( i m a g ec l a s s i f i c a t i o n ) 就是根据各自在图像信息中所反映的不同特 征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定 量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以 代替人的视觉判读。图像分类方法常见的有以下几种: ( 1 ) 图像空间的分类方法一利用图像的灰度、颜色、纹理、形状、位置等底 层特征对图像进行分类;例如,利用灰度直方图特征对图像进行分类1 5 j ;利用 纹理特征对图像进行分类【6 ”;采用纹理,边缘和颜色直方图混合特征对图像进 行分类【8 。1 2 】;用矩阵表示图像,矩阵元素是相应象素的灰度值,然后用s v d 1 3 】 和p c a 1 4 】方法抽取图像特征,前三个均采用s v m 作为分类器,后一个采用b p 网络作为分类器;图像空间的分类方法的共同缺点是数据量大,计算复杂性高, 但分类精度一般比较理想。 ( 2 ) 特征空间的分类方法一首先将原图像经过某种变换如k l 变换i i 引,小波 变换【l6 】等变换到特征空间,然后在特征空间提取图像的高层特征以实现图像的 分类。这类分类方法尤以纹理图像分类和遥感图像分类最多,基本上都用到了 高波过滤器( g a b o rf i l t e r s ) 1 1 。7 。1 9 】。特征空间的分类方法可降低数据维数,降低计算 复杂性,但问题相关性较强,与特征提取的方法和效果有很大关系。 目前支持向量机研究现状与热点有这几方面:核函数的构造和参数的选择 2 0 , 2 1 】;支持向量机从两类问题向多类问题的推广,将二分类方法转化为多分类 方法常用的思路有两种:一是间接构造,通过多个2 类分类器组合起来完成多 类分类,如d a g s v m1 2 2 】、二叉树【2 3 】等方法;二是利用w e s t o n 等人提出的方法 直接构造多类s v m 分类器,如k - s v m t 2 4 j ;更多的应用领域的推广;与目前其 2 第一荦绪论 它机器学习方法的融合,如s v m _ k n n t 2 5 1 ;与数据预处理( 样本的重要度,属 性的重要度,特征选择等) 方面方法的结合,将数据中脱离领域知识的信息, 即数据本身的性质融入支持向量机的算法中从而产生新的算法;支持向量机训 练算法的探索,如r s v m l 26 。、1 ) s v m 2 7 1 ,在国内,刘向东和陈兆乾提出了一种 快速支持向量机分类算法f c s v m l 2 引,实验表明在几乎不损失识别精度的情况下 识别速度有显著的提高;有监督学习向无监督学习的应用推广【2 9 】。 1 3 论文的主要研究内容 图像分类技术能使用户较为直观的浏览和检索图像数据,是图像高效检索 和处理的前提。目前图像处理在低层特征提取方面相对比较成熟,但高层特征 如图像中包含什么物体以及这些物体的空间关系都还不能可靠地得到。例如, 颜色直方图是低层特征,可以方便地得到;而图像中有没有建筑物、天空、草 地、人等等,目前的图像处理和计算机视觉技术还不能解决这个问题。本文仍 是采用应用十分广泛的颜色特征来进行图像分类,研究的主要内容有: ( 1 ) 图像颜色特征的提取 基于颜色特征的图像分类算法研究图像特征的提取是图像分类的基础,所 选取的特征应该能够充分表示图像的语义属性和视觉属性,对环境的改变具有 鲁棒性和一般性。由于颜色特征往往和图像中所包含的物体或场景十分相关, 并且与其它的视觉特征相比,颜色特征对图像本身的尺寸、方向、视角的依赖 性较小,具有较强的鲁棒性等原因,本文采用颜色特征来进行图像分类,分别 对图像进行了颜色直方图和颜色矩的提取,并通过实验对比了两种特征提取方 式的图像分类准确率。 ( 2 ) 图像纹理特征的提取 介绍了灰度共生矩阵纹理的原理和提取方法,主要研究了基于l b p 的纹理 特征提取,并比较了普通模式l b p 与统一模式l b p 的纹理特征提取方法。 ( 3 ) 基于s v m 的分类器的设计与实现 支持向量机以结构风险最小化为准则,具有完善的数学基础和很好的泛化 性能。本文在深入研究s v m 原理的基础上,将图像分为训练集和测试集,在训 练集上为每一类图像训练子s v m ,然后应用多类分类策略构建多类分类s v m , 在测试集上测试训练得来的多类分类器。 南京信息工程大学硕士学位论文 1 4 论文的组织结构 图像的特征提取以及特征选择和分类是图像处理中的关键技术,对其进行 深入研究将极大的推动图像处理技术的发展。本文的研究方向是分析图像的颜 色特征,用支持向量机的方法对其进行分类识别。论文的结构安排如下: 第一章简要介绍了图像分类的基本概念及其应用领域,简述图像分类技术 的发展和几种分类方法的特点。第二章介绍了图像特征的各种提取方法,主要 研究了颜色特征与纹理特征,颜色特征方面包括颜色空间的转换、颜色模型的 选取、颜色特征的表达方法和相关反馈技术等内容;纹理特征方面包括灰度共 生矩阵和l b p 普通模式、l b p 统一模式、l b p 旋转不变性。第三章介绍了支持 向量机的主要原理。内容包括统计学习理论中的v c 维理论以及结构风险最小 化理论,并介绍了s v m 的最优超平面概念、线性s v m 、非线性s v m 以及多类 分类问题等。重点研究了s v m 参数寻优、s v m 多分类器构造。第四章在第二 三章的基础上设计并实现了基于s v m 的图像分类系统。第五章对论文的工作进 行小结,并展望论文的下一步研究内容和工作。 4 第二章图像特征提取 第二章图像特征提取 图像特征提取是图像识别的关键步骤,图像特征提取的效果如何直接决定 着图像识别的效果,常用的图像特征有颜色特征、纹理特征、形状特征、空间 关系特征。 2 1 颜色特征 颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性 质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素 都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所 以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查 询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是 最常用的表达颜色特征的方法,虽然不受图像旋转和平移变化的影响,进一步 借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布 的信息。常用的颜色特征提取与匹配方法有颜色直方图、颜色集、颜色矩、颜 色聚合向量、颜色相关图。 2 1 1 颜色空间模型 从数字图像中提取颜色特征依赖于对数字图像中颜色的表示和颜色理论的 理解,因此找到符合人眼视觉特征的颜色模型是利用颜色特征进行图像检索的 关键。图像的颜色特征不仅取决于图像本身,还与观察者的视觉系统和观察经 验有关。因此为了准确提取表达原始图像的颜色信息,提取算法必须在符合人 类视觉系统的生理特征和人类观察经验的视觉感知特征的颜色空间内进行,对 彩色图像颜色特征提取的研究,必须在特定的颜色空间中进行。常用到的颜色 空间很多,比如r g b 、c m y 、h s v 、h s l 、等。在实际应用中,应根据 具体情况选择合适的颜色空间模型。本文主要介绍r g b 和h s v 颜色空间。 ( 1 )r g b 空间模型 r g b 颜色模型是目前提出的多种颜色模型中最常用的颜色模型。由于现有 的图像采集设备最初采集到的颜色信息以及图像显示设备最终使用的颜色信息 都是r g b 值,使得r g b 颜色空间方便图像交换,通用性好。数字图像一般用 南京信息工程大学硕士学位论文 r g b 颜色模型空间表示。r g b 图像由红( r e d ) 、绿( g r e e n ) 、蓝( b l u e ) - - - 个通道合 成,分别反映了颜色在某个通道上的亮度值。所有的颜色都可以看作是3 个基 本颜色:红、绿、蓝的不同组合。每个像素都能用三维空间中的一个点来表示, 如图2 1 所示。虽然用r g b 颜色空间表示颜色方法简单,但这种表示方法在面 向彩色图像处理中不直观,对于某一r g b 值,人们无法感知所对应的颜色;它 并不是以一致的尺度表示色彩,不符合人的感知心理。在r g b 颜色空间中改变 第二章图像特征提取 r g b 空间更直观,更容易接受,因而在计算机视觉、图像处理等领域应用广泛。 c y a n1 8 0 。 e d0 。 s 图2 - 2h s v 空间模型 h s v 颜色空间可以看成是倒置的圆锥体,如图2 2 所示,其中v 轴表示亮 度的变化:离开v 轴的距离表示饱和度;围绕着v 轴的角度表示色调。沿着v 轴从底部到顶部由黑色变到白色。具有最高亮度、最大饱和度的颜色位于圆锥 体顶面的圆周上 一种颜色在r g b 模式中三个因数分别为红( r ) 、绿( g ) 和蓝( b ) ,将 0 2 5 5 的数值转换为0 0 1 0 ,三个因数中最大的值为m a x ,最小的值为m i n 。 从r g b 空间转换为h s v 空间公式如下: h = ( 6 + j 黑) 6 0 。,矿( r :m a x ) 、m a x m n 。 、 ( 2 - i 音呈l ) 6 0 。,f ( g :m a x ) ( 2 一m n ( 4 + 音粤l ) 6 0 。,f ( b :m a x ) 、一m n 1 s = m a x m i n v = m a x 7 ( 2 - 2 ) ( 2 - 3 ) 南京信息工程大学硕士学位论文 其中色相( h ) 的值为0 0 。一3 6 0 0 。,饱和度( s ) 和明度( v ) 的值为0 0 1 0 , 再把它们转换成0 1 0 0 。如果m a x = m i n ,h = 0 。没有色彩,是纯灰色。如果 h 超过3 6 0 。,用3 6 0 除的余数为色相值。如果m a x = 0 ,s = 0 也是没有色彩。 如果v = 0 没有亮度,是纯黑色。 类似的,给定在h s v 中( h ,s ,v ) 值定义的一个颜色,带有如上的h ,和 分别表示饱和度和明度的s 和v 变化于0 到1 之间,在r g b 空间中可以 计算对应的( r ,g ,b ) 三原色值。 从h s v 空间转换为r g b 空间公式如下: 忽= 吲m o a 6 4 , f 丽h 一吃 ( 2 5 ) p = v ( 1 一s ) ( 2 - 6 ) q = v x ( 1 一f x j ) ,= 1 ,( 1 一( 1 一f ) s ) 对应于每个颜色向量( r ,g ,b ) : 2 1 2 颜色直方图 o ,g ,b ) = ( v ,f ,p ) ( g ,v ,p ) ( p ,v ,f ) ( p ,q ,v ) ( f ,p ,v ) ( v ,p ,g ) f h ,= 0 矿忽= 1 f h ,= 2 纩曩= 3 fh f = 4 矿h ,= 5 颜色直方图能描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中 所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间 第二章图像特征提取 位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处 的空间位置,即无法描述图像中的某一具体的对象或物体。最常用的颜色空间: r g b 颜色空间、h s v 颜色空间。颜色直方图特征匹配方法:直方图相交法、距 离法、中心距法、参考颜色表法、累加颜色直方图法。 颜色直方图计算简单、快速、而且具有尺度、平移、旋转不变性,作为最 常用的一种颜色特征,在基于内容的图像分类中得到了广泛的应用。它所描述 的是不同色彩在整幅图像中所占的比例,即出现了哪些颜色以及各种颜色出现 的概率,而并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物 体。全局颜色直方图反映彩色图像的颜色信息在颜色空间的分布情况,多种系 统的应用同样表明颜色直方图具有很好的表现能力。为利用图像的特征( 如h 分 量) 描述图像,可以借助特征的全局颜色统计直方图。图像特征的统计直方图实 际上是一个一维的离散函数。即: 日( 后) = n k 七= o ,1 ( 2 - l 。) 上式中k 代表图像的特征提取,l 是总特征数,仇是图像中具有特征值为 k 的像素个数,n 是图像像素的总数。对彩色图像,可对其三个分量分别提取直 方图。由于三维颜色空间的概率分布可视化操作比较困难,颜色直方图的表示 一般用3 个一维直方图来表示,各个通道是相互独立进行一维直方图统计得到 的,也就是三维分布在三个坐标上的投影。一维颜色直方图是常用的颜色信息 提取和表示方法。 在直方图特征提取中,颜色直方图是最常用的一种表示方法。颜色直方图 的主要性质有:直方图中的数值都是统计而来,描述了该图像中关于颜色的数 量特征,反映图像颜色的统计分布和基本色调。任一幅图像都能唯一的给出一 幅与它对应的全局直方图,但不同的图像可能有相同的颜色分布,从而就具有 相同的直方图,因此直方图与图像是一对多的关系,如将图像划分为若干个子 区域,所有子区域的直方图之和等于全局直方图。 2 1 3 颜色集 为支持大规模图像库中的快速查找,s m i t h 和c h a n g 提出了用颜色集( c o l o r s e t s ) 作为对颜色直方图的一种近似【引。他们首先将r g b 颜色空间转化成视觉 9 南京信息工程大学硕士学位论文 均衡的颜色空间( 如h s v 空间) ,并将颜色空间量化成若干个b i n 。然后,他们 用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜 色分量来索引,从而将图像表达一个二进制的颜色索引集。在图像匹配中,比 较不同图像颜色集之间的距离和色彩区域的空间关系( 包括区域的分离、包含、 交等,每种对应于不同得评分) 。因为颜色集表达为二进制的特征向量,可以构 造二分查找树来加快检索速度,这对于大规模的图像集合十分有利。 由于全局颜色直方图仅描述图像颜色的统计特性,丢失了颜色的空间分布 信息,导致相似的两个颜色直方图,图像的内容可能完全不同,因此还应加进 颜色的空间分布信息,因此人们提出了分块直方图,即人为地将图像划分成固 定的分块,然后为每个分块提取相应的局部颜色特征。 计算颜色直方图需要将颜色空间划分为若干个小的颜色区间,每个颜色区 间称为颜色直方图的一个b i n ,这个过程称为颜色量化。然后通过计算图像中颜 色落在每个小区间内的像素数量可以得到颜色直方图。颜色量化有许多方法, 例如,聚类方法或者神经网络方法。最为常用的做法是将颜色空间的各个分量 均匀地进行划分。选择合适的颜色小区间( h p 直方图的b i n ) 和颜色量化方法与具 体应用的性能和效率要求有关。一般来说,颜色小区间的数目越多,直方图对 颜色的分辨能力就越强。然而,b i n 的数目很大的颜色直方图会增加计算负担, 也不利于在大型图像库中建立索引。 本文在h s v 颜色空间中进行特征提取,由于人眼对h 值较敏感,对s 、v 值的感知较弱,因此将h s v 三个分量按照人的颜色感知进行非等间隔的量化, 将图像量化为一个2 5 6 b i n 的直方图。在完成量化后,考虑到颜色直方图的时间 复杂度与空间复杂度会影响着图像分类的性能,而且对于分辨能力来说存在着 一定的信息冗余。而代表色体现了图像的概貌,同时大大减小了特征的存储空 间。因此本文分别利用全局代表色和分块代表色来对图像进行特征提取。全局 代表色用于粗粒度分类及不考虑位置信息的图像整体颜色的图像分类,为图像 找出像素分布最多的前k 个颜色;分块代表色则考虑了图像的空间分布,将图 像划分成适当的分块,然后为每个分块选择代表色。颜色空间量化和特征提取 的具体算法将在第四章中进行介绍。 颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信 息。颜色集是对颜色直方图的一种近似首先将图像从r g b 颜色空间转化成视觉 均衡的颜色空间( 如h s v 空间) ,并将颜色空间量化成若干个b i n 。然后,用色 彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分 1 0 第二章图像特征提取 。1 量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较 不同图像颜色集之间的距离和色彩区域的空间关系 2 1 4 颜色的量化处理 颜色量化的目的主要是对图像的特征向量进行降维,以提高系统的运行速 度。人眼对h 值较敏感,对s 、v 值的感知较弱,下面就将h s v 三个分量按照 人的颜色感知进行非等间隔的量化: ( 1 ) 根据光学理论,物体的颜色与光的波长和频率有关。不同的色光在真空 中的波长和频率的范围不一样,因此可以将色调进行不等间隔量化。 ( 2 ) 按照人的视觉分辨能力,把色调h 空间分成1 6 份,饱和度s 和亮度v 空间分成4 份。 ( 3 ) 根据h s v 颜色模型的特性做如下特殊处理: 黑色区域:所有v 的第k 个 分量表示颜色为c ( i ) 的像素和颜色为c o ) 的像素之间的距离小于等于k 的概率。 如果考虑到任何颜色之间的相关性,颜色相关图会变得非常复杂和庞大( 空间复 杂度为o ( n 2 d ) ) 。一种简化的变种是颜色自动相关 ( c o l o r a u t o c o r r e l o g r a m ) , 它仅仅考察具有相同颜色的像素间的空间关系,空间复杂度降为o ( n d ) 。本文 采用颜色自动相关图提取颜色特征。 1 南京信息工程大学硕士学位论文 2 2 纹理特征 纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表 面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质 属性,所以仅仅利用纹理特征是无法获得全部图像内容的。与颜色特征不同, 纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计 计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的 偏差而无法匹配成功。作为一种统计特征,纹理特征常具有旋转不变性,并且 对于噪声有较强的抵抗能力。但是,纹理特征也有其缺点,一个很明显的缺点 是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外, 由于有可能受到光照、反射情况的影响,从2 d 图像中反映出来的纹理不一定 是3 d 物体表面真实的纹理。 例如,水中的倒影,光滑的金属面互相反射造成的影响等都会导致纹理的 变化。由于这些不是物体本身的特性,因而将纹理信息应用于检索时,有时这 些虚假的纹理会对检索造成“误导”。 在检索具有粗细、疏密等方面较大差别的纹理图像时,利用纹理特征是一 种有效的方法。但当纹理之间的粗细、疏密等易于分辨的信息之间相差不大的 时候,通常的纹理特征很难准确地反映出人的视觉感觉不同的纹理之间的差别。 常用的纹理特征提取与匹配方法有统计法、几何法、模型法、信号处理法。 2 2 1 灰度共生矩阵 统计方法的典型代表是一种称为灰度共生矩阵( g l c m ) 的纹理特征分析方 法g o t l i e b 和k r e y s z i g 等人在研究共生矩阵中各种统计特征基础上,通过实验, 得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。 该方法是建立在估计图像的二阶组合条件概率密度基础上的。g l c m 是描 述在p 方向上,相隔d 像素距离的一对像素分别具有灰度层i 和j 的出现概率。 显然g l c m 是一个对称矩阵,是距离和方向的函数,其阶数由图像中的灰度级 n g 决定,由g l c m 能够导出1 4 种纹理特征岭j 。尽管由g l c m 提取的纹理特 征具有较好的鉴别能力,但是这个方法在计算上是昂贵的,尤其是对于像素级 的纹理分类更是应用受限。首先计算g l c m 很耗时,再者需要提取1 4 个纹理 特征,其所需时间可想而知。因此不断有研究者尝试对其改进。 1 6 第二章图像特征提取 通过减少图像的灰度级,可以减少计算量,但是这种做法会损失一定的灰 度的空间依赖信息。方向和距离d 的选择。大部分研究者在应用时,d 一般取1 , 口一般选择为0 度、4 5 度、9 0 度、1 3 5 度。如s o h k 和t s a t s o u l i s 3 9 j 盈过对不同 距离和方向的g l c m 进行平均来降低计算量。研究提取的纹理特征之间的相关 性,选择最有鉴别能力的纹理特征。u l a b y 等人研究发
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 变更合同条款模板
- 北京机动车抵押合同模板
- 服装售后服务情景演练
- 统编版2024-2025学年四年级语文上学期第三次月考质量检测(原卷版+ 解析版 考查范围:第五六单元)
- 颅脑外伤急救治疗方法
- 糖尿病的常用药物
- 环境应急预案汇报
- 预防传染病和艾滋病
- 电气机械及器材行业相关投资计划提议范本
- 【初中地理】世界主要气候类型第一课时-2024-2025学年七年级地理上学期(湘教版2024)
- MOOC 国家安全概论-西安交通大学 中国大学慕课答案
- GB-T 9251-2022 气瓶水压试验方法(高清版)
- CTD格式申报对药品研发和审评的影响
- Q∕GDW 12176-2021 反窃电监测终端技术规范
- 8 煤矿安全监测监控系统PPT课件
- 新产品试制流程管理办法
- 通用横版企业报价单模板
- Excel 会计记账模板-录入凭证自动生成财务报表(超实用)
- 从高考“函数与导数”压轴题看数学学科核心素养
- 装修公司员工劳动合同
- 数控技术毕业论文幻灯片 数控立式铣床工作PPT学习教案
评论
0/150
提交评论