(通信与信息系统专业论文)基于区域的图像检索关键技术研究.pdf_第1页
(通信与信息系统专业论文)基于区域的图像检索关键技术研究.pdf_第2页
(通信与信息系统专业论文)基于区域的图像检索关键技术研究.pdf_第3页
(通信与信息系统专业论文)基于区域的图像检索关键技术研究.pdf_第4页
(通信与信息系统专业论文)基于区域的图像检索关键技术研究.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

武汉理工大学硕士学位论文 摘要 为了从互联网海量的图像数据中检索出用户所需图像,基于内容的图像检索 技术( c b i r ,c o n t e n t b a s e di m a g er e t r i e v a l ) 一直是人们研究的热点和难点。而基于 区域的图像检索技术( r b i r , r e g i o n b a s e di m a g er e t r i e v a l ) 是c b i r 的进一步发展, 它利用分割后的区域形成区域特征向量,允许区域之间相互匹配。该技术不仅迈 向了对象层次的检索,可以在对象层次上表示和索引图像,而且在一定程度上减 小了图像低层视觉特征和高层语义特征的鸿沟,因此在图像搜索领域具有重要的 研究价值和市场应用前景。 论文首先介绍了r b i r 国内外发展现状,分析其相对于其他检索系统的技术 优势。在此基础上,研究了图像检索的关键技术,包括区域分割、特征提取、区 域匹配、相似性度量等。接着重点论述了模糊c 均值聚类( f c m ,f u z z yc m e a n s c l u s t e r i n g ) 算法和综合区域匹配( i r m ,i n t e g r a t e dr e g i o nm a t c h i n g ) 算法,分析了 它们的优势和不足,并提出了相应的改进方案。最后将改进后的算法应用在一个 图像检索原型系统中,使用查准率和查全率作为评价准则,对比改进前后算法的 检索结果。创新点主要体现在以下两个方面:针对f c m 算法在图像分割时很难 选取最佳m 值以及分割鲁棒性较弱的问题,提出了先采用初步阈值分割图像, 然后采用f c m 算法进一步细分割。在此基础上,考虑像素之间的空间位置关系 因素,定义某一像素属于某一聚类中心的概率为两者的空间距离,这样使得图像 中的每一个像素同时包含颜色信息和空间信息。传统i r m 算法的时间复杂度较 大且没有考虑区域面积比因素,导致检索效果欠缺鲁棒性。为此,改进了综合区 域距离和显著性矩阵的算法。对区域距离设置阈值并作归一化处理,极大地降低 了算法复杂度。同时,考虑图像目标和背景的面积比关系对图像匹配的影响,提 出了“有效距离”概念,使得区域面积特征权重增加,达到区域匹配算法中“最 相似最优先 的效果。 实验结果表明,改进后的算法较好地融合了颜色、纹理和区域面积特征,返 回的检索结果中相似的图像排列更加集中,不仅在效果上更符合人眼视觉感受, 而且相比其它文献的算法在查准率和查全率上都有明显提高,图像检索系统性能 良好。 关键词:区域分割,综合区域匹配,相似性度量,图像检索 a b s t r a c t i no r d e rt or e t r i e v et h ei m a g ef r o mt h em a s si m a g ed a t ao nt h ei n t e r n e tf o ru s e r s , c o n t e n t - b a s e di m a g er e t r i e v a l ( c b i r ) h a sb e e nah o t s p o ta n dd i f f i c u l t y h o w e v e r , r e g i o n b a s e di m a g er e t r i e v a l ( r b i r ) i sad e e p e rd e v e l o p m e n to ft h ec b i r , w h i c h u s e st h es e g m e n t e dr e g i o n st of o r mt h er e g i o n a lf e a t u r ev e c t o r sa n da l l o w st h er e g i o n s m u t u a lm a t c h i n g t h et e c h n o l o g yh a sn o to n l yd e v e l o p e dt o w a r dt ot h eo b j e c tl e v e l , e x p r e s s i n ga n di n d e x i n gi m a g ea tt h el e v e l ,b u ta l s or e d u c e dt h eg a pb e t w e e n l o w - l e v e lv i s u a lf e a t u r e sa n dh i g h 1 e v e ls e m a n t i cf e a t u r e sa ts o m ee x t e n t t h e r e f o r e ,i t h a si m p o r t a n tr e s e a r c hv a l u ea n dm a r k e ta p p l i c a t i o np r o s p e c ti nt h ei m a g es e a r c h f i e l d f i r s t l y , t h ed e v e l o p m e n ta n dt e c h n i c a la d v a n t a g e so fr b i ra r ei n t r o d u c e d a n d s o m ek e yt e c h n i q u e so fi m a g er e t r i e v a la r ed i s c u s s e d ,i n c l u d i n gr e g i o ns e g m e n t a t i o n , f e a t u r ee x t r a c t i o n ,r e g i o nm a t c h i n g ,s i m i l a r i t ym e a s u r e m e n ta n ds oo n s e c o n d l y , t h e a d v a n t a g e sa n dd i s a d v a n t a g e so ff u z z yc - m e a n sc l u s t e r i n g ( f c m ) a l g o r i t h ma n d i n t e g r a t e dr e g i o n a lm a t c h i n g ( i r m ) a l g o r i t h ma r ed i s c u s s e d b a s e do na b o v e ,t h e c o r r e s p o n d i n gi m p r o v e m e n ts c h e m e sa r ep r o p o s e d f i n a l l y , a ni m a g er e t r i e v a ls y s t e m p r o t o t y p ei sd e s i g n e d ,u s i n gp r e c i s i o na n dr e c a l la st h ee v a l u a t i o nc r i t e r i o nt oc o n t r a s t t h ei m p r o v e da l g o r i t h ma n di r ma l g o r i t h m t h ei n n o v a t i o n sm a i n l yf o c u so nt h e f o l l o w i n gt w oa s p e c t s a i m i n ga tt h ep r o b l e m so fs e l e c t i n ga no p t i m u mmv a l u e d i f f i c u l t l ya n di m a g es e g m e n t a t i o nw i t hw e a kr o b u s t n e s s ,an e wm e t h o di sp r o p o s e d t h et h r e s h o l dm e t h o di sa d o p t e dt os e g m e n ti m a g ea tf i r s t ,a n dt h e nu s e dt h ef c m a l g o r i t h mt of u r t h e rs e g m e n t i n g b a s e do na b o v e ,t h ep r o b a b i l i t yo fap i x e lb e l o n g i n g ac l u s t e ri sd e f i n e dt h ed i s t a n c eb e t w e e nt h e m ,s oe a c hp i x e li s c o n t a i n i n gb o t ht h e c o l o ri n f o r m a t i o na n ds p a t i a li n f o r m a t i o n t h et i m ec o m p l e x i t yo ft r a d i t i o n a li r m a l g o r i t h mi sv e r yl a r g ea n di td o e s n tc o n s i d e rt h er e g i o na r e ar a t i of a c t o r s ot h e r o b u s t n e s so fr e t r i e v a lr e s u l ti sw e a k t h e r e f o r e ,t h e i m p r o v e da l g o r i t h m sa b o u t i n t e g r a t e dr e g i o n a ld i s t a n c ea n ds i g n i f i c a n c em a t r i xa r ep r o p o s e d at h r e s h o l di ss e tt o a l lt h er e g i o n a ld i s t a n c e s ,t h e nt h er e s ta r en o r m a l i z e d i tg r e a t l yr e d u c e st h ea l g o r i t h m c o m p l e x i t y w h a t sm o r e ,t a k i n gi n t oa c c o u n tt h ei m p a c to ft a r g e ta n db a c k g r o u n d a r e ar a t i o0 ni m a g em a t c h i n g ,t h ec o n c e p to f e f f e c t i v ed i s t a n c e ”i s p u tf o r w a r d , m a k i n gt h er e g i o na r e af e a t u r ew e i g h ti n c r e a s ea n da c h i e v et h ee f f e c to f t h em o s t i i s l m i l a ra n dt h eh i g h e s t p r i o r i t y ” 叭1 1 1 :? 即? n ? 铋伽潞川话s h o w t h a tt h ec o l o r , t e x 嘶a n dr e g i o na r e af e a 嘶s a r c a 1 3 ? s e d mt l l e1 m p r 0 v e da l g o r i t h m ,a n dt h es i m i l a r i m a g e sa r em o r cc o n c e n t r a t e d , 讹曲n 0 :0 m y 躺m 0 弛c o n s i s t e n t w i t hh u m a nv i s u a lp e r c e p t i o n ,b u ta l s oi m p r o v e t h ep r e c l s l o n 锄dr e c a l lo b v i o u s l y a n dh a v eb e t t e rp e r f o r m a n c et h e nt h eo t h e r r e t r i e v a l k 蚋田r d s :p e g i o ns e g m e n t a t i 。n ,i n t e g r a t e dr e g i 。n a lm a t c h i n g ,s i m i l 鲥t y m e a s u r e i m a g er e t r i e v a l 。 一 i i i 武汉理工大学硕士学位论文 第1 章绪论 1 1 课题来源及研究意义 1 1 1 课题来源 课题来源于夏定元导师省部级项目广西科学研究和技术开发计划项目( t h e p r o j e c to fs c i e n c er e s e a r c ha n dt e c h n o l o g yd e v e l o p m e n to fg u a n g x iu n d e rg r a n t n o 0 5 1 1 2 0 0 1 - 7 a 2 ) 及武汉理工大学自主创新研究基金( f i n a n c i a l l ys u p p o r t e db y s e l f - d e t e r m i n e da n di n n o v m i v er e s e a r c hf u n d so fw u tu n d e rg r a n tn o 2 0 1 0 z y - x x 0 2 1 ) 。第一个项目主要研究基于内容的图像检索技术,针对现有的 图像检索系统的不足,结合其优点设计出性能更优良的图像检索系统。本人主要 负责图像匹配模块及其数据测试工作。第二个项目是基于语义和视觉特征相结合 的图像检索系统研究,本人主持并参与此项目,在技术上主要负责此项目的图像 分割与区域匹配模块。此外,负责此项目的申请报告、任务书及结题报告等所有 文档撰写工作。 1 1 2 研究意义 在互联网图像检索技术的推动下,基于内容的图像检索( c b i r , c o n t e n t b a s e d i m a g er e t r i e v a l ) 成为一个非常活跃的研究领域。c b i r 突破了传统的基于关键字检 索的局限,根据描述图像内容的各种特征进行检索,主要以基于图像底层视觉特 征( 颜色、纹理、形状等) 的图像检索方式为研究重点,从数据库中检索到具有 指定特征或含有特定内容的图像。这种查询技术涉及许多学科和领域,是一门有 关图像特征相似性匹配的新技术。从技术基础来看,它不同于图像处理、模式识 别、计算机视觉、图像理解、人工智能、数据库系统、人机交互、信息检索等专 门的图像分析与处理技术,但又与这些研究领域的技术成果相结合;从研究内容 上看,它与数学、物理学、生理学、心理学等许多学科密切相关,其中很多技术 都是相应领域长期以来的研究重点和难点。为了从互联网海量的图像数据中检索 出用户所需图像,基于内容的图像检索技术一直是人们研究的热点和难点。而基 于区域的图像检索技术( r b i r , r e g i o n b a s e di m a g er e t r i e v a l ) 是c b i r 的进一步发 展,它利用分割后的区域形成区域特征向量,允许区域之间相互匹配。该技术不 仅迈向了对象层次的检索,可以在对象层次上表示和索引图像,而且在一定程度 上减小了图像低层视觉特征和高层语义特征的鸿沟,因此在图像搜索领域具有重 武汉理工大学硕士学位论文 要的研究价值和市场应用前景。 h a n j a l i c 等【l 】认为基于内容的图像检索可以为三个层次,感知层、认知 层、情感层。其中,感知层是指图像低层视觉特征,包括颜色、纹理、形状等; 认知层主要描述图像对象以及对象之间的关系;情感层涉及到图像的最高层,即 图像语义。人类对图像的语义存在着不同的理解使得低层视觉特征和高层语义之 间存在着“鸿沟 【2 j 。 以图像特征的作用域为研究重点,c b i r 可分为基于全局特征和基于区域分 割这两种检索类型。基于全局特征的检索是以图像为整体提取其特征,并不区分 图像中的前景和背景,因而不能准确地反映图像内容。然而,基于区域分割的检 索方法能更好的反映图像内容,在理想情况下能完美地分割图像,使得最后得到 的区域能较好地反映一个对象,这是一种能产生较精确检索结果的策略。 1 2 国内外研究现状 1 2 1 基于内容的图像检索技术 基于内容的图像检索方式自9 0 年代初开始,以颜色、纹理、形状、对象等 低层视觉特征的检索方式为研究重点,因其直观、高效、通用等特点,克服了基 于关键字的图像检索方式因人工注解图像的主观性、不准确性和工作量大而导致 的检索结果不直观、检索效率低( 自然语言对图像内容描述的歧义性) 的缺陷, 呈现出蓬勃的发展势头。经过几年发展,技术上相对成熟,已成为是计算机视觉、 数字图像和视频处理、知识挖掘等领域最活跃的研究课题之一p 刮。c b i r 系统的 结构框图主要包括特征提取和特征匹配两部分,如图1 1 所示。 图1 1c b i r 系统的结构框图 2 武汉理工大学硕士学位论文 目前有代表性的一些实用的图像检索系统有q b i c 系统、v i s u a ls e e k 系统、 v i r a g e 系统、p h o t o b o o k 系统等【5 1 。 其中q b i c 是i b ma l m a d e n 研究中心发开的最早的基于内容的图像检索系 统,主要由图像入库、特征计算、查询阶段3 部分组成。在索引技术方面q b i c 提供了基于色彩、纹理、形状和手绘草图的图像索引方法,并已在一些领域得到 了应用,如超媒体管理器、i b m 数字图书馆、d b 2 数据库的图像扩展等工具软 件。 v i s u a ls e e k 是一个可视化的图像特征搜索引擎,由美国哥伦比亚大学开发; w e bs e e k 是基于w w w 方式的文本图像搜索引擎。其中v i s u a ls e e k 主要研 究图像中区域的空间关系特征和机遇压缩域的视觉特征提取,并采用了基于颜色 和纹理的检索方法。 v i r a g e 是由v i r a g e 有限公司开发的基于内容的图像检索引擎。v i r a g e 系统可 分图像表达层、图像对象层、领域对象层和领域事件层四个部分。它支持基于颜 色、纹理和形状的可视化样图查询。j e f f r e y 等人进一步提出了图像管理的开放式 框架,他们将图像的视觉特征分为两类:一类是通用特征( 如颜色、形状或纹理) , 一类是领域相关的特征( 如用于人脸识别、癌细胞检测的特征等) 。根据不同领 域的具体需要,各种有用的基本特征可以加入到这个开放式结构中。 p h o t o b o o k 是m i t 多媒体实验室开发的用于交互式浏览的图像检索系统。用 户除了可以通过它的三个子部分进行基于形状、纹理和面部特征的图像检索外, 还能同时结合关键字进行查询。在其最近的扩展版本中,提出了一个基于统计学 习的“模型团体 ( s o c i e t yo f m o d e l s ) 的概念,提供了基于用户提供的图像进行特 征的交互性学习的方法。 1 2 2 基于区域的图像检索方法 近几年,基于区域的图像检索技术发展迅速,并已开发出一些原型系统,主 要有n e t r a 、b l o b w o r d 引、w a l r u s 、s i m p l i c i t y 8 】等等。其中,最早采用基于 区域的图像检索的是n e 仃a 系统,它利用分割后的区域进行图像检索,首先采用 e d g ef l o w 分割算法将图像分成多个区域;再以颜色、纹理、区域间的位置关系 等特征为基础,综合描述每个区域的局部特征并形成特征矢量;最后使用统一的 相似度量准则来计算整体图像之间的相似度。后续的许多检索系统都沿袭了 n e t r a 框架,如c a l i f o r n i a 大学的b l o b w o r l d 系统【9 】。不同的是,它采用期望最大化 算法i 1 0 1 分割图像,以更有效地方法提取图像特征形成特征矢量。n e 打a 和 b l o b w o r l d 系统都需要用户从分割后的图像中选择感兴趣的区域,但在实际分割 过程中很难完美地将图像背景和目标分离开来,从而导致分割结果不完全符合人 3 武汉理工大学硕士学位论文 眼视觉感受。 s t a n d f o r d 大学推出的s i m p l i c i t y 检索系统,在允许一个区域与多个区域进行 匹配的基础上提出了综合区域匹配( i r m ,i n t e g r a t e dr e g i o nm a t c h i n g ) 【】算法。 s u d h a m a n imv 1 2 - 1 3 l 等人提出了基于低维颜色的聚类索引技术,具有较好的鲁棒 性。y u m i n t i a n 0 4 j 等人开发了一种交互式区域的图像检索模型,取得较好的检索 效果。李锐等【”】人提出了一种基于m p e g 7 的区域综合特征检索算法,在区域 分割上采用粗分辨率方法,再综合区域的颜色、纹理特征实现检索。 基于区域图像匹配流程图如图1 2 所示。 图1 2 基于区域图像匹配流程图 在理论上,可以从图像的对象层表示和索引图像,但其中仍有很关键技术尚 不成熟:没有一种分割算法使得分割后的区域总能形成有意义的物体,即完成对 图像的完美分割,尤其是一些复杂图像没有明确的物体对象,这样让用户选择感 兴趣区域十分困难;区域匹配也不能完全符合用户对图像相似性的语义理解;如 何建立一种快速有效地检索方式实现海量图像的高速检索;如何实现图像低层特 征和高层语义的有机融合技术等等。 本文重点讨论基于区域的图像检索方式。首先对图像进行初步的区域分割, 然后对分割后的区域提取特征,如颜色、纹理、形状特征等,并生成特征矢量加 以描述,最后按照适当的区域匹配准则得到两幅图像之间的相似度。在理论上, 可以从图像的对象层表示和索引图像,但其中仍有很多关键技术尚不成熟。例如: 没有一种分割算法使得分割后的区域总能形成有意义的物体,即完成对图像的完 美分割,尤其是一些复杂图像中没有明确的物体对象,这样让用户选择感兴趣区 域十分困难;区域匹配也不能完全符合用户对图像相似性的语义理解;如何建立 4 武汉理工大学硕士学位论文 一种快速有效地检索方式实现海量图像的高速检索;如何实现图像低层特征和高 层语义的有机融合技术等等。 1 3 研究工作及安排 1 3 1 主要研究内容 本文以基于区域的图像检索系统为研究重点,深入研究了区域分割、特征提 取、图像匹配等关键技术,主要工作体现在区域分割和区域相似性匹配两方面。 在图像分割阶段,针对现有的图像分割算法造成的分割不足或图像内容丢失等问 题,采用初步阈值分割和进一步f c m 算法将结合进行图像分割,并对现有的f c m 算法做出了适当的改进。仿真实验证明,改进后算法的分割结果能较好地分离图 像背景与目标。在图像匹配阶段,分析综合区域匹配( i r m ) 算法的优缺点,在计 算量较大、效率不高两方面对i r m 算法做出了相应地改进;最后将前面的改进 工作应用在图像检索中以进行分析与总结。 1 3 2 结构安排 第l 章是绪论,主要介绍了课题来源及研究意义、深入分析了目前基于内容 和基于区域的图像检索技术的国内外研究现状,给出了两者的系统框图,最后阐 述了本文的主要研究内容和结构安排。 第2 章研究了特征提取和图像分割的相关原理。首先介绍了颜色、纹理和形 状三种图像低层特征常用的提取方法及其应用范围。接着对现有的图像分割技术 进行分析研究,重点阐释了模糊c 均值聚类算法的原理,针对彩色图像区域分 割和现有聚类算法的局限性,考虑图像中像素的空间位置关系,对现有的聚类算 法做出了相应的改进。最后对传统的f c m 算法和改进后的算法进行实验仿真对 比,分析其分割结果。 第3 章为基于综合区域图像匹配算法,简要介绍了两个关键技术( 相似性度 量和归一化方法) ,其中相似性度量包括欧氏距离、曼哈顿距离、马氏距离等, 归一化分为外部归一化和内部归一化。然后介绍了综合区域匹配( i r m ) 算法的原 理以及实现的关键技术,举例验证算法的可行性。最后分析其优缺点,提出了需 要改进的问题等。 第4 章首先针对第3 章提出的i r m 算法的不足做出了适当的改进,接着介 绍了本论文所设计的图像检索整体框架,主要包括特征提取、图像分割、区域匹 配模块等。接着将前几章的工作应用到次图像检索中,通过大量实验证明改进后 算法的优越性。最后将算法改进前后的图像检索结果进行比较,以查准率和查全 5 武汉理工大学硕士学位论文 率为准则,分析实验结果。 第5 章为总结和展望,总结了本文对算法的改进之处及其成果,并对图像检 索系统的结果做出总结,分析其在学科领域和实际应用中的重要性和发展前景, 最后根据现有算法和检索系统的不足,结合实际,展望下一步研究方向和工作重 点。 6 武汉理工大学硕士学位论文 第2 章特征提取及图像分割 特征提取与描述是图像检索的关键技术之一,主要工作为计算、组织存储图 像特征向量值。在图像检索过程中,图像的特征信息被预先提取出来形成特征矢 量并存入特征数据库,然后使用统一的相似性准则来匹配查询图像和图像库中图 像的特征信息。图像分割是由图像处理进入到图像分析的关键步骤之一,即从输 入输出均为图像的处理方法转变为输入为图像,而输出为从这些图像中提取的属 性的处理方法。图像分割的程度取决于要解决的问题,即在实际应用中,感兴趣 的对象已经被分离出来时就停止分割。 2 1 特征提取 2 1 1 颜色特征提取 在图像处理中,颜色是一个强有力的描绘子。颜色特征计算量小,对于旋转、 平移和尺度变化都具有较好地鲁棒性,可简化图像中物体之间的区分。并且人可 以辨别几千种颜色、色调和亮度,但相比之下只能辨别几种灰度层次。因此,颜 色特征对于图像信息的获取十分重要。 ( 1 ) 颜色直方图,它是通过统计图像颜色出现的次数而得到的,也是使用最 广的特征之一。在计算颜色直方图时,首先将颜色量化为若干个小的颜色空间, 即每个区间成为颜色直方图的一个柄惭n ) ,然后统计落在每个小区间的像素数 量,最后将其归一化。 假定一幅彩色图像有膨个像素,将其颜色空间量化为个不同的颜色,则 颜色直方图日定义为办 j l l l ,h 2 $ h 9 h d ,其中玩为第k 种颜色具有的像素数,即: h ( k ) = h k m ,k = 1 , 2 ,n ( 2 - 1 ) 在此基础上,文献【1 6 】采用了g a u s s i a n 向量量化技术提出颜色直方图。文献 【1 7 】提出了一种在特定距离和角度内统计颜色的直方图方法。文献【1 8 】提出了一 种基于位平面直方图的检索方法。文献 1 9 】构建了颜色主观信息量函数,描述了 不同颜色强度的视觉感知差异。文献【2 0 】提出了重心距离加权直方图( c d w h , c e n t r o i dd i s t a n c ew e i g h t e dh i s t o g r a m ) 的概念。 ( 2 ) 颜色矩方法,s t r i c k e r 和o r e n g o 提出用矩来表示图像中任何颜色的分布 情况,即颜色矩( c o l o rm o m e n t s ) 2 1j 方法。与颜色直方图不同的是,它不用量化颜 7 武汉理工大学硕士学位论文 色特征,仅采用三个低阶矩就可以表达图像的颜色分布。其中,每个颜色分量的 平均强度表示为一阶矩( m e a n ) ,方差为二阶矩( v a r i a n c e ) ,偏斜度为三阶矩 ( s k e w n e s s ) 。颜色分量的三个低阶矩表达式如下: “2 亩善弓( 2 - 2 ) 铲( 专善( 弓叫) 2 ) l ,2 ( 2 - 3 ) 铲( 专善( 弓叫) 3 ) 3 ( 2 - 4 ) 其中,b 是第个像素的第f 个颜色分量,f = 1 , 2 ,3 ) ,分别表示颜色空间的 三个颜色分量;是像素数量。 ( 3 ) 颜色相关图( c o l o rc o r r e l o g r a m ) ,也可用来表达图像颜色特征分布情况, 它同时包含了颜色的统计信息和颜色之间的空间关系。相对于颜色相关图,颜色 直方图检索效率更高,尤其是空间关系一致的图像。其表达式为: v s 似, j =0 【b i c ( ,) i1 只一i = 七】 ( 2 - 5 ) ,c ( ,) 以副 其中,j 表示图像的所有像素,i c 表示颜色是c ( f ) 的所有像素,1 只一只i 表 示两个像之间的距离,f ,j = 1 , 2 ,) ,k = 1 ,2 ,d ) 。 2 1 2 纹理特征提取 纹理特征即为物体的表面细节特征,主要包括物体表面结构排列形式以及它 们与环境的联系。一般情况下,纹理在局部区域内呈现出不规则性,但在全局上 却能表现出某种规律的不依赖于图像的颜色或亮度变化。常用的纹理描述法有以 下三种:统计法、频谱法和结构法。 统计法实质上是采用图像中灰度等级分布情况来描述纹理特征。基于灰度直 方图的矩描述纹理是最简单易行的方法,但它没有考虑像素的空间信息 2 2 - 2 4 】。 t a m u r a 等从视觉心理学角度出发,定义了粗糙度、对比度、方向行等六种特征, 它们相互独立且具有可视性。下面介绍粗糙度和对比度的数学表达。 ( 1 ) 粗糙度。它定义一个大小为2 k 2 k 的活动窗口,所有像素的平均强度为: j + 2 k iy + 2 k 。i 4 ( x ,y ) = g ( i ,j ) 2 2 ( 2 6 ) i m x - 2 1 j = y - 2 。 式中,k = 1 , 2 ,5 ,g ( i ,j ) 表示像素( f ,_ ,) 的强度值。每一个像素在水平和垂 直方向上互不重叠的窗口之间平均强度差为: 武汉理工大学硕士学位论文 最 ( x ,j ,) = a k ( x + 2 k - l , j ,) 一a k ( x 一2 k - iy ) i ( 2 - 7 ) 邑 y ( x ,j ,) = l a k ( x + 2 k - t , y ) 一a k ( x - 2 k - i , y ) l ( 2 8 ) 对于每个像素,将使得e 值达到最大值( 无论方向) 的k 值设为最佳尺寸,有: ( x ,y ) = 2 七 ( 2 9 ) e = ( 巨 ,巨v ,毛j i ,毛y ) ( 2 - 1 0 ) 粗糙度即为整幅图像中的平均值,即: = 志善善( “) ( 2 - 1 1 ) ( 2 ) 对比度。主要指整幅图像的像素强度分布情况,公式如下: f 删2 赤( 2 - 1 2 ) ( a 4厂 其中,= 地a 4 ,地表示四次矩,仃2 是方差。 频谱法即采用频谱特性来描述纹理特征,通过对图像进行各种变换( 如傅立 叶变换、小波变换、g a b o r 变换【2 5 - 2 6 1 ) 等。结构法的特征提取方式是指获取复杂 纹理表面的基元并分析基元的排列规律。其中纹理基元以一定形式的重复排列形 式复杂纹理,因此获取纹理基元是关键步骤。v o o r h e e s 和p o g g i o 采用多尺度的 l o g ( l a p l a c i a n o f g 跚s s i 锄) 算子鲫预处理图像以获取纹理基元。b l o s t e i n 和a h u j a 在此基础上做出了改进,结合图像块检测与表面形状,不仅减小了计算量,且改 善了处理结果。 2 1 3 形状特征提取 形状特征是图像对象较明显、较稳定的信息特征,是人们区分各种对象的关 键特征。相对于颜色和纹理特征,形状特征是较高一层次的图像特征,它以图像 中目标区域的划分为基础,与图像对象相联系,具有一定的语义信息。因此,形 状特征也是图像中最难描述的特征之一。 在二维图像空间中,一条封闭的轮廓曲线所包围的连通区域即称为形状。通 常将形状特征分为基于边界轮廓特征( c o n t o u r - b a s e d ) 和基于区域特征 ( r e g i o n b a s e d ) 两种【2 舢2 9 1 。基于边界轮廓的形状特征是指在图像分割后提取边缘特 性从而得到对象的外边界,这是一种以边界为基准的形状特征检索。基于区域的 形状特征为目标的整个形状区域,是针对图像寻找适当的特征矢量进行检索的 【3 0 1 。 9 武汉理工大学硕士学位论文 2 2 图像分割的一般方法 令尺表示整幅图像区域,可以将分割看成是将尺划分为狞个子区域 尺l ,r 2 ,r 。的过程【3 1 】: ( 1 ) ijr s = r ; ( 2 ) 是一个连通的区域,汪1 ,2 ,聆; ( 3 ) r ,nr j = 囝,对所有的f 和,f ,; ( 4 ) p ( r f ) = t r u e ,对于扣1 , 2 ,刀; ( 5 ) e ( r ,u r ,) = f a l s e ,对于任意相邻区域r 和尺f 。 条件( 1 ) 说明图像分割具有完全性,分割后所有区域的总和为整幅图像区域, 即每一个像素必须属于一个区域。条件( 2 ) 要求分割得到的区域是连通的,区域 中的点必须和某个预定的准则相联系。条件( 3 ) 说明不同区域必须是不相交的, 即图像中的任何一个元素不能同时属于两个不同的区域。条件( 4 ) 涉及在分割区 域内的像素必须满足的性质。条件( 5 ) 说明区域r ,和r ,对于谓词p 是不同的,即 不同的区域有不同的条件。条件( 1 ) 和( 3 ) 说明分割准则应当可应用于图像中每一 个区域像素,条件( 4 ) 和( 5 ) 说明合理的分割准则有利于每一个像素分别属于哪一 个区域。 当前的图像分割算法主要分为以下三类:阈值化分割【3 2 】,即用一个或几个 阈值将图像的灰度等级分为几部分,属于同一部分的为同一区域;基于边缘检测 分割,即检测图像边缘像素,再将其连接起来形成分割边界;基于区域分割3 3 。4 】, 即将像素划分到某一具体区域的像素聚类方法。 2 3 模糊c 均值聚类算法 2 3 1 算法原理 聚类是指按照一定的要求和规律对事物进行区分及分类的过程,仅依赖于事 物之间的相似性。而模糊聚类的算法则运用了模糊数学的概念,对事物的分类存 在着一定的模糊性,而不是“非此即彼 。一般情况下,模糊聚类算法可分为基 于模糊等价聚类关系的动态聚类方法和基于模糊划分的方法。其中f c m 算法属 于后者,即模糊i s o d a t a ( i n t e r a t i v es e l fo r g a n i z i n gd a t a ) 方法。 模糊聚类最先由d u m a 提出,经过多年研究,由b e z d e k 推广到了一个模糊 目标函数聚类的无限簇。f c m 算法允许目标边界的不确定性,是一种迭代最优 化方法,通过计算数据点和聚类中心的距离以决定数据点与每一个聚类的关系, 且聚类的中心点根据聚类结果加以更别3 5 j 。具体算法如下: 1 0 武汉理工大学硕士学位论文 假定图像像素组成个样本的集合x ( x j , j f = 1 , 2 ,n ) ,设v , 扣1 , 2 ,c 为每 个聚类的中心,z o 是第j 个样本对第f 类的隶属度函数。则图像分割可看成是将 这个样本分成c 个聚类的问题。f c m 算法是一种模糊目标函数法,其目标函 数为: f r r ( u ,矿) = ( p ,) ”( d ,) 2 ( 2 - 1 3 ) j - t 1 - 1 其中v = v i , v :,v 。) 为c 个聚类中心的集合,随着算法的迭代而变化。 u - 【北1 ( i = 1 , 2 ,c ;k = 1 , 2 ,厅) 为隶属度矩阵,且满足下式: 鲰= l( 1 k n , 0 1 ) ( 2 - 1 4 ) i - i 在( 2 1 3 ) 式中m 为权值指数,它反映了模糊子集之间的重复程度。m 值越大, 各个模糊子集之间的区分程度越大,模糊子集越分离,从而提高模糊聚类的效率。 但因此减慢算法的收敛速度而降低了算法的效率。所以根据文献 3 6 】的最佳m 取 值范围是【1 5 ,2 5 】,丸是第k 个样本到第f 类的欧氏距离,在此定义为: d l = l i x k - - v ,l | 2 ( 2 一1 5 ) 为得到样本集合x 的最佳划分,f c m 算法采用迭代最优化准则使得目标函 数r r ( u ,v ) 极小化 3 7 - 3 8 1 ,具体算法实现如下: ( 1 ) 确定c 和m 。设定迭代停止阈值s 。为一小正数,初始化迭代次数,= 0 和 隶属度矩阵u 【u ) ( 2 ) 将u 7 代入下式计算c 一聚类中心值矩阵v ( t ) , 中,v ,r s 是类别i 的聚类中心值矢量。 ( p 膻) ”z 。 v ,= 上 一 ( j l l 睹) 。 ( 3 ) 利用v 。代替u n ,有 v = ( v l ,v 2 ,y c ) r c s 。其 ( 2 - 1 6 ) j l l 腑= 7 一 ( 2 17)1 j l l 腑= 1 一 u 。 ( 九d 肚) 2 伽_ j - i ( 4 ) 如果忖m 一u 忙s 工,停止迭代;否则,1 = l + 1 ,返回( 2 ) 。 2 3 2 实验结果与分析 本实验算法采用f c m 算法分割图像,采用m a t l a b 仿真实现的实验结果如图 武汉理,l :人学顾化沦史 苣越涵 ( a ) 腺图( b ) 分割结果图 图2 。lf c m 算法分割结果图 图2 1 湿示了采用f c m 算法的图像分割结果,其中图( a ) 为三幅原图,图( b ) 为对应的分割结果图。由图可以看出,f c m 算法已经可以较好地分割出图像中 主要的景物,例如第1 幅图的建筑物与树苗、第2 幅图中的马。当然,从第2 幅图不难观察到,作为背景的草地、栅栏与大树没有较好地与目标分开,尤其是 对于最左边的马的分割,看不清其轮廓。第3 幅图中花与叶子也连在一块,没有 很好地分割出花这个目标,只能大致看出其轮廓。因此背景较复杂的图像的分割 效果不是很理想,背景容易对目标造成干扰,导致不能很好地分割出图像的目标, 形成“对象”。 从仿真过程及其实验结果图可以看出传统的f c m 算法存在以下局限性: ( 1 ) 图像受到噪声污染时分割的准确性大大降低,即分割很敏感、欠缺鲁棒 性,可能由于f c m 算法在分割时只考虑到图像中每一个像素点的灰度值进行聚 类,并没有结合像素的空问领域信息; ( 2 ) 由于该算法对每一个像素点都要计算其对每一类的隶属度,因此当图像 尺寸变大时,样本集也随之增大,收敛明显减慢,增加了分割时间: ( 3 ) 在分割过程中对初始聚类中心的选取十分重要,如果初始聚类1 ,心落在 武汉理工大学硕士学位论文 局部最小附近时容易陷入局部最小; ( 4 ) 分割前需预先确定分割的类别数以及如何选取最佳所值。 2 4 改进的聚类分割算法 一般情况下,当图像中的目标和背景的颜色及纹理特征比较单一且易于区分 时,目标或背景中存在的相似区域增加了图像内容的不确定性。为此,在进行聚 类分割之前先采用阈值化分割方法将图像进行粗分割,以便于后期的聚类细分 割。传统的模糊聚类算法只定义了结构空间上的距离,而没有考虑每个像素的空 间位置信息,不利于后期的综合区域匹配算法的研究。因此,本文对现有算法进 行改进,重点研究融入图像中像素的空间位置后的聚类算法。 2 4 1 颜色空间转换 彩色图像分割是指在一幅彩色图像中分离出主要的色彩一致的区域。因此彩 色图像分割主要有两个方面,选择合适的颜色空间及采用合适的分割技术。即常 用彩色图像分割方法= 单色图像分割方法+ 颜色空间。颜色空间常常根据具体的应 用场合、不同的目的而选择不同的模型,如r g b 、h s i 、y i q 等等。一般情况下, 彩色图像分割的方法如图2 2 所示。 单色图像分割方法 1 基于区域的分割( 直方图阈值法、 模糊聚类、区域生长、分裂合并) 2 基于边缘的分割( 边缘检测、分水 岭分割) 3 基于特定理论工具的分割( 基于小 波分析、基于水平集的彩色图像分 割、基于m a r k o v 随机场、基于神经网 络、基于模糊集合) 4 分形技术 5 混合技术 + 颜色空间 1 r g b 2 y l 3 y i q 4 h i s 5 c i e ( l 毒a 木b ) 6 c i e ( l 宰u 宰v ) 9 以上空间的 组合 图2 2 彩色图像分割 本文主要采用h s i 颜色空间f 3 9 4 们,即色调( h u e ) 、色饱和度( s a t u r a t i o n 或 c h r o m a ) 、亮度( i n t e n s i t y 或b r i g h t n e s s ) 。相对于r g b 颜色空间,h s i 更符合人眼 视觉感受,这是因为在亮度和颜色浓淡之间,人眼对前者更加敏感。同时,在 h s i 色彩空间中可更加方便的使用各种图像处理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论