(机械设计及理论专业论文)基于形状的商标图像检索技术的研究.pdf_第1页
(机械设计及理论专业论文)基于形状的商标图像检索技术的研究.pdf_第2页
(机械设计及理论专业论文)基于形状的商标图像检索技术的研究.pdf_第3页
(机械设计及理论专业论文)基于形状的商标图像检索技术的研究.pdf_第4页
(机械设计及理论专业论文)基于形状的商标图像检索技术的研究.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

、 一_, ,口l一 - : 1 lj j ! , _,:。: 。j:。,1q 1 -_r1 独创性声明 i i i i i i tuil i i i i l l t li l u l l li li y 18 0 9 8 6 6 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究工作所取得的成果。除文中已注明引用的内容以外,本论 文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文 的研究做出重要贡献的个人和集体,均己在文中以明确方式标明。本 人完全意识到本声明的法律结果由本人承担。 学位论文作者签名:来科钤 日期:一叨f年厂1 月彤e l “ 基于形状的商标图像检索技术的研究 s t u d yo nt e c h n o l o g y o ft r a d e m a r kr e t r i e v a lb a s e d o ns h a p ef e a t u r e 姓 2 0 0 5 年1 2 月 江苏大学硕士学位论文 摘要 基于内容的图像检索技术已成为国际研究的热点课题之一。它融合了图像理 解技术和数据库技术,综合利用颜色、形状、纹理等图像内容特征,从符合人类 视觉语义的角度检索相似图像。 本文的商标图像检索基于内容的图像检索技术,从形状特征出发对图像进行 描述和相似性匹配。本文主要做了如下的研究工作: 对经过预处理的商标图像进行形状描述的研究。本文从两种不同的角度描述 图像的形状。对完整图像,首先分割成多个子图像,对每个子图像进行描述:用 h u 不变矩进行粗描述;通过傅立叶描述和边界直方图进行细描述。描述子都具有 平移、缩放和旋转不变性。对缺损的轮廓图像采用量化方向法描述,并修正了噪 声和观测尺度引起的误差,使描述子满足变换和变形的不变性。 形状描述的相似性度量方法研究。在子图像检索的基础上,本文提出子图像 融合匹配算法,实现整幅完整图像的最终检索目的。对缺损的轮廓图像采用邻接 表的寻址匹配方法。 最后,本文分析和设计了商标图像检索的原型系统,并用实例验证,初步证 明了文中所提方法的有效性和合理性。 关键词:形状特征、商标图像、形状描述、形状匹配、检索 江苏大学硕士学位论文 a bs t r a c t t e c h n o l o g yo fc o n t e n t b a s e di m a g er e t r i e v a lh a sb e e no n eo ft h eh o ts u b j e c t si n t h ew o r l d i tu t i l i z e si m a g e u n d e r s t a n d i n gt e c h n i q u ew h i c ha n a l y z e st h ec o l o r , s h a p ea n d t e x t u r eo ft h e i m a g ea n dd a t a b a s et e c h n i q u e s ,t h e nr e t r i e v a l ss i m i l a ri m a g e st h a t a c c o r d i n gw i t hh u m a n sv i s u a ls e m a n t i c s b a s e do nt h ec o n t e m - b a s e di m a g er e t r i e v a l ,at e c h n i q u eo ft r a d e m a r ki m a g e s q u e r yw h i c hu s e ss h a p ef e a t u r ea st h ed e s c r i p t o r st om a t c h i n ge a c ho t h e ri sp r e s e m e di n t h i sp a p e r t h er e s e a r c hw o r kc a nb es u m m a r i z e di nt h ef o l l o w i n g r e s p e c t s : t h es t u d yo fs h a p ed e s c r i p t o r sf o rp r e t r e a t e dt r a d e m a r ki m a g e s w eu s et w o m e t h o d st od e s c r i b ei m a g es h a p e s f o rt h ei n t e g r i t i e s ,t h ei m a g e sa r ef a s td i v i d e d i n t o s e v e r a ls u b i m a g e s t h e nw ei n t r o d u c e 也eh ui n v a r i a n tm o m e n t sa s t h e p r i m a r y d e s c r i p t o r s ,w h i l ef o u r i e rd e s c r i p t o r sa n dt h eh i s t o g r a mo fe d g ed i r e c t i o n sa st h ef i n e o n e sf o re a c hs u b i m a g e t h e ya l la r er o b u s tt oi n v a r i a n tp e r f o r m a n c eu n d e r t r a n s l a t i o n , s c a l ea n dr o t a t i o n f o rt h ep a r t i a l l yv i s i o n e d g es h a p e s ,t h e ya r ed e s c r i b e dw i t h q u a n t i z e d - d i r e c t i o n s ,a n dt h ee 玎o r sc a u s e db yn o i s ea n do b s e r v a t i o n sa r ec o r r e c t e ds oa s t ob er o b u s tt ol o c a ls h a p et r a n s f o r m a t i o n sa n dd e f o r m a t i o n s t h es t u d yo fm a t c h i n gm e t h o d sf o rd i f f e r e n ts h a p ed e s c r i p t o r s t oi n d e x i n gt h e i n t e g r i t i e s ,w eu n i t et h es u b - i m a g em a t c h i n gr e s u l t st og e tt h ef i n a lr e t r i e v a l s t h e p a r t i a l l yv i s i o ne d g es h a p e sa r er e t r i e v a l l e db ya d d r e s s e si nt h em a p a tl a s t ,ap r o t o t y p es y s t e mf o rt r a d e m a r ki m a g ei n d e x i n gi sd e s i g n e db ya n a l y z i n g t h em o d u l a rs t r u c t u r e ,a n de x a m p l e sa l eg i v e nt oc h e c kt h ev a l i d i t yo ft h ea l g o r i t h m e l e m e m a r i l y k e y w o r d s :s h a p ef e a t u r e ,t r a d e m a r ki m a g e ,s h a p ed e s c r i b i n g ,s h a p em a t c h i n g , r e t r i e v a l i i 江苏大学硕士学位论文 第1 章 1 1 1 2 1 3 1 4 第2 章 2 1 2 4 第3 章 3 1 目录 绪论1 研究背景和意义1 商标图像检索的理论基础1 1 2 1图像处理学2 1 2 2 基于内容的图像检索技术3 1 2 3数据库技术4 国内外研究概况4 论文的内容及安排5 商标图像的预处理,7 二值化处理7 2 1 1二值化和阈值的选取7 2 1 2 商标图像二值化8 2 1 3 实验结果9 数学形态学运算1 0 2 2 1基本概念1 0 2 2 2 形态学腐蚀运算1 0 2 2 3形态学膨胀运算1 1 2 2 4 开运算和闭运算矗1 2 2 2 5实验结果冀1 2 图像分割1 3 2 3 1基本概念13 2 3 2区域生长法1 3 2 3 3商标图像的分割1 5 本章小结1 5 全局特性的形状描述与匹配1 6 形状描述1 6 3 1 1区域描述1 6 3 1 2 边界描述18 形状匹配2 2 3 2 1相似性度量方法的要求一2 2 3 2 2 距离计算方法2 2 二值商标图像的形状描述与匹配2 3 l i l 江苏大学硕士学位论文 3 4 第4 章 3 3 1 “粗粒度”描述及其匹配2 4 3 3 2 质心一致的二值商标图像的形状描述与匹配2 4 3 3 3 质心不一致的二值商标图像的形状描述与匹配3 l 本章小结3 6 局部特性的形状描述与匹配 4 1 形状的描述3 7 4 1 1 子线段及其级联一3 7 4 1 2 子段。3 8 4 1 3 形状描述子3 9 4 2 形状描述子的修正4 0 4 2 1几何因子。4 0 4 2 2 拓扑不变性4 0 4 3 形状匹配4 3 4 3 1 形状匹配4 3 4 3 2 实验结果4 3 4 4 本章小节。4 4 第5 章商标图像检索系统的设计和软件实现4 5 5 1 开发平台4 5 5 2 面向对象的系统设计4 5 5 2 1系统结构4 5 5 2 2 系统设计4 6 5 3 数据管理4 9 5 4 人机界面。5 0 5 4 1 入库界面5 0 5 4 2 检索界面5 3 5 5 系统演示与性能分析5 4 5 6 本章小结5 5 第6 章总结与展望。一5 6 6 1 本文主要研究工作5 6 6 2 创新点。5 6 6 3 对本课题研究的展望5 7 参考文献。5 8 致谢。6 0 硕士期间发表的论文。一6 l i v 江苏大学硕士学位论文 第l 章绪论 1 1 研究背景和意义 商标( t r a d e m a r k ) 是商品的一个重要标识,经过正式注册的商标受到法律 的保护。商家在注册商标或者发生商标使用权纠纷时需要从已经注册的商标中 查找所需的商标。2 0 0 2 年麦当劳和北京快餐万德福公司的商标侵权之争【2 】( 如 图1 1 ) ,2 0 0 4 年世界知名企业苹果公司和中国广东苹果公司的商标纷纠3 l 等无 一不是商标图像理解产生的侵权纠纷。开发一种自动有效的商标图像检索系统, 从浩瀚的商标库中找出语义相似的商标图像,对于加强商标管理,保护商标专 用权,促使生产者保证商品质量和维护商标信誉,保障消费者的权益,具有非 常重要的意义。 图1 1 麦当劳和刀德福的争议商标 传统的商标检索采用纯文本的关键字检索法,这种手工描述图像的方法难 度大、效率低且误差明显。随着计算机技术的迅速发展,如何从海量图像信息 中快速准确地检索到用户所需的图像已成为近年来国际研究的热点课题之一。 针对图像内容理解的问题,人们进行了大量研究,提出了一种基于内容的图像 检索方法( c o n t e n t - b a s e di m a g er e t r i e v a l ,简称c b i r ) 。它主要通过图像本身 的视觉内容,如颜色、纹理和形状等特征进行匹配,达到检索的目的。基于内 容的商标图像检索是根据商标图像显著的可视化特征,利用基于内容的图像检 索技术进行匹配和检索。因此,商标图像检索可分为基于颜色、形状、轮廓、 版面等单一或复合特征的不同检索方式。本文主要研究的是基于形状特征的商 标图像检索问题。 1 2 商标图像检索的理论基础 商标图像检索技术是一门交叉学科,涉及计算机图像处理、图像理解、模 式识别、人工智能及数据库技术等多个领域,其实质是对图像的某种可视化特 江苏大学硕士学位抡文 征进行描述,通过相似性度量判断待检图像与数据库中各幅图像间的相似程度, 检索出语义上最相似的图像。 1 2 1图像处理学硼 图像处理学所包含的内容是相当丰富的,根据抽象程度不同可分为三个层 次:狭义图像处理、图像分析和图像理解。如图1 2 所示。 抽 象 程 度 图1 2 图像处理学三层示意图 符号 目标 操 作 对 象 小 大 数 据 量 狭义图像处理主要指对图像进行各种操作以改善图像的视觉效果,或对图 像进行压缩编码以减少存储空间或传输时间、传输通路,其输出仍是图像,图 像增强、图像平滑、图像锐化、图像变换、图像编码等都属于这一范畴。图像 分析主要是对图像中感兴趣的目标进行检测,从而建立对图像的描述,是一个 从图像到数值符号的过程,主要内容有图像分割、图像特征提取等。图像理解 则是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互 联系,并得出对图像内容含义的理解以及对原来客观场景的解译,从而指导和 规划行动。图像理解在一定程度上是以客观世界为中心,借助知识、经验等来 把握客观世界。 狭义图像处理、图像分析和图像理解是相互联系又相互区别的。狭义图像 处理是低层操作,它主要在图像像素级上进行处理,处理的数据量非常大;图 像分析则进入了中层,经分割和特征提取,把原来以像素构成的图像转变成比 较简洁的非图像形式的描述;图像理解是高层操作,它是对从描述中抽象出来 的符号进行推理,其处理过程和方法与人类的思维推理有许多类似之处。由图 1 2 可见,随着抽象程度的提高,数据量逐渐减少。一方面,原始图像数据经过 2 层 层 层 高 中 低厂,_、i、l 语义 古旧一氐 一一一- 一 江苏大学硕士学位论文 一系列的处理逐步转化为更有组织和用途的信息,在这个过程中,语义不断引 入,操作对象发生变化,数据量得到了压缩;另一方面,高层操作对低层操作 有指导作用,能提高低层操作的效能。 1 2 2 基于内容的图像检索技术 商标图像是特殊的图像,基于内容的商标图像检索属于基于内容的图像检 索范畴。基于内容的图像检索的基本原理是分析图像库中每幅图像,提取图像 特征,建立相应的特征库,即在检索前系统已建立了图像库和特征库。检索时, 对用户给定的查询示例提取特征,选取相似性比较方法,逐个与特征库中的图 像特征作匹配,得到一组接近查询要求的检索结果。最后,用户通过相关反馈 技术对查询结果精益求精【5 1 。图像检索过程如图1 3 所示。关键技术包括:特征 提取、相似性计算和相关反馈。 图1 3 基于内容的图像检索过程 图像特征是图像内部所具有的最基本的内容,是该图像独有的、用于区别 于其他图像的本质属性。图像的底层特征主要可分为:颜色特征、纹理特征、 形状特征。颜色信息是图像检索中使用最广泛的底层特征,基于颜色的图像检 索涉及的关键问题主要有:颜色模型的选择、颜色的量化以及颜色的相似性测 度。颜色的特征描述有:直方图和二值向量等。图像的纹理可分为确定性纹理 和随机性纹理。纹理特征由两个要素构成:纹理基元:基元的排列。因此,纹 江苏大学硕士学位论文 理的分析方法又可分为统计法和结果法。目前纹理特征主要用统计和滤波来检 索。形状是最接近用户需求的匹配特征。按表达的形式分,可分为基于边界和 基于区域两大类。边界特征包括线性形状、多边形逼近、有限元模型和傅立叶 描述子等。区域特征主要有矩不变量等。特征量的相似性度量主要有欧几里德 距离、海明距离和二次距离等。在图像检索中仅仅使用底层的特征是远远不够 的,必须结合图像的语义信息。视觉语义是和人的理解紧密联系的高级特征。 然而,目前的计算机视觉技术还不能很好地解决这个问题,c b i r 只能在特定的 应用领域如指纹识别等方面取得成功【b 9 1 。 图像的检索结果往往不胄月匕p - , ,4 1 = 1 好地符合用户的要求,人机交互技术作为补充 被应用到检索技术中。其基本思想是:用户对系统新一轮的检索结果进行评价 和标识,并将相关信息反馈给系统,系统对其学习后再次进行下一轮的检索, 直到满足用户要求为止。图像检索中的相关反馈技术大致分为四种:参数调整 法、聚类分析法、概率学习法、神经网络法。值得注意的是,系统在考虑怎样 得到用户更多信息的同时,应尽量地不增加用户负担。 1 2 3 数据库技术 数据库【io 】是以某种方式组织起来,使之可以检索和利用的信息的集合。它 的基本特征之一是相互关联的数据的集合。它用综合的方法组织数据,具有较 小的数据冗余,可供多个用户共享,具有较高的数据独立性和安全控制机制, 能够保证数据的安全、可靠,允许并发地使用数据库,及时、有效地处理数据, 并能保证数据的一致性和完整性。从2 0 世纪6 0 年代后期开始,数据库技术进 入数据库系统阶段,开始面向整个企业( 组织) 或整个应用。数据库技术的日 益成熟为商标图像检索系统提供良好的数据平台奠定了坚实的基础。 1 3 国内外研究概况 、 最先将基于内容的图像检索技术应用到实际中的是1 9 9 2 年日本的t k a t o 建立的形状检索系统。他采用图像的颜色和形状特征描述图像,通过比较轮廓 点来判断图像的相似程度。该方法的匹配算法简单,但是存在匹配运算量大、 噪声敏感等问题,只能描述对象极为相似的图像。 此后,越来越多的国内外学者投入到基于内容的图像检索研究中,并将研 究成果应用到商标图像的检索。下面只对基于形状的图像检索和商标图像检索 的研究近况作简单介绍【9 i n - t 3 1 。 描述封闭形状的简单特征有拐点、面积、周长、重心、狭长度等。表示和 4 江苏大学硕士学位论文 描述形状的方法有f r e e m a n 链码、傅立叶描述子、二次曲线、b 样条等。后来发 展出超二次曲线、小波描述的形状逼近法和形态学方法( m o r p h 0 1 0 9 i c a l m e t h o d s ) 。此外还有斜率直方图、c h m m 描述子。 距离计算法是全局形状匹配的常用方法。很多形状相似度匹配算法都是基 于两点间的m i n k o w s k i 距离l p ,当p = 2 时即是e u c l i d e a n 距离l 2 。瓶颈距离 和h a u s d o r f f 距离是从中发展出来的算法。局部特性的形状匹配可以解决更加 广泛的形变和遮掩问题。这类方法主要是通过搜索最优点对应或特征对应来判 断形状是否匹配。经典方法是h o u g h 变换。广义h o u g h 变化可以通过模板匹配 来实现。近年来变形模板的研究成为了解决形变问题最关注的方法,它能发生 变形以匹配到显著的图像特征,因此是一个有力的形状匹配工具。此外,形状 匹配方法还有几何参数法、不变矩法、小波重要系数法和小波变换极大值法等。 基于内容的商标图像检索是一个新兴的研究方向,在最近十年里提出,并 迅速发展起来。国内外学者在基于内容的图像检索技术研究基础上,提出了许 多适合商标图像的检索方法 1 4 - 2 2 】。如j a i n a k 等将h u 不变矩、变形模板匹配 用作分级商标图像检索:e a k i n s 等用圆形性、相对面积和复杂度等作为形状特 征进行检索;p e n g - y e n gy i n 等则采用面积、偏移、对称性、轮廓描述串等特征 来提取和匹配;郭丽把距离分布直方图应用在商标图像检索中;而黄元元利用 形状与空间位置特征检索商标图像;w i n gh ol e u n g 和t s u h a nc h e n 在检索手绘 商标图像时同时应用了骨架和轮廓特征,并取得较好的试验效果。 从国内外研究现状来看,基于内容的商标检索技术虽已取得了一定的研究 成果,然而在许多方面还存在不足。例如:现有的提取商标图像特征的方法大 多针对商标图像的全局,而忽略了组成商标图像的各个组成部分;在特征选取 和匹配时,只将基于内容的图像检索技术生硬地照搬到商标图像中,没有很好 地考虑商标图像本身的特性;对平移、缩放和旋转后的图像检索技术研究还不 完善。因此,基于内容的商标图像检索作为新兴的研究课题,还有许多有待解 决和提高的方面。 1 4 论文的内容及安排 r 本文主要针对图像检索中的关键技术:形状表示、形状描述和形状匹配展开 研究。全文内容安排如下: 第一章分析本课题研究的背景、意义和国内外研究现状,介绍与其相关的图 像处理学、基于内容的图像检索和数据库技术等方面的理论知识,并对本文内容予 江苏大学硕士学位论文 以安排。 第二章对商标图像预处理,以便于进一步形状描述。 第三章在传统的形状描述和匹配方法研究的基础上,提出商标图像全局特性 的描述及匹配方法。 第四章对缺损的商标图像轮廓进行深入分析,提出利用局部特性来描述并匹 配形状,以便于检索缺损的商标图像。 第五章对商标图像检索的原型系统进行模块分析和实现,设计菜单,并用实 例对本文提出的算法加以验证。 第六章总结本文研究工作,并对今后可能开展的研究工作加以展望。 6 江苏大学硕士学位论文 第2 章商标图像的预处理 商标图像可以分为:文字、几何图形和二者的组合三大类。文字的相似比较 可以通过文字识别与关键字相结合的检索方法达到很好的检索效果;文字和几何 图形的组合商标图像可先分离文字和图形,对几何图形部分的图像采用本文的检 索方法,再与文字部分的图像的检索结果相结合,从而检索出相似的图像。因此, 本文的研究对象是几何图形组成的图像。 图像特征一般包括颜色、形状和纹理特征。商标图像的纹理特征不明显,因 此基于纹理的检索方法对商标图像不适合。颜色是商标图像的明显特征,然而, 颜色不具有很强的平移、缩放和旋转鲁棒性,同时,基于颜色的图像检索采用统 计方法,只能达到粗略的检索结果。形状是最接近用户需求的匹配特征,适合商 标图像图像的特点,因此,本文采用基于形状的商标检索方法。 为便于形状特征的描述和相似性度量,我们首先对商标图像进行预处理,以 减少冗余数据,提高检索精度。商标图像预处理包括三部分:二值化处理、数学 形态学运算和图像分割。 2 1 二值化处理 2 1 1 二值化和阈值的选取 由于本文采用基于形状的检索方法,因此可以忽略颜色信息。二值化后的图 像完全符合形状特征的描述要求,同时仅仅通过黑、白两色表征形状,大大节省 了存储空间,并在很大程度上简化后面的图像分析和处理运算,因此我们把彩色 商标图像转换成灰度图,然后进行二值化处理。 所谓二值化,是指对于任一灰度图像,通过某种方法选取出合适的阈值,然 后根据阈值来判断和划分灰度图像中的每一个像素归属于目标区域或背景区域, 从而将原来的灰度图像变换成黑白二值图像的过程。对于任一灰度图像f ( x ,y ) , 如果取定阈值为t ,则经过二值化后所得到的二值图像g ( x ,y ) 可表示为: 小= 彤渤 ( 2 ) 显然,进行二值化处理的关键问题在于阈值的选取。从上世纪六十年代以来, 国内外对此进行了大量的研究,提出了许多解决方法:直方图方法与直方图变换 法;最大类间方差法( o t s u 法) :最小误差法与均匀化误差法:共生矩阵法:矩量 7 江苏大学硕士学位论文 保持法;最大熵方法:简单统计法与局部特性法:概率松弛法;模糊集方法等。 通常,阈值选取方法被简单地划分为两类:全局阈值法和局部阈值法。 所谓全局阈值法,是指选取一个固定不变的阈值t ,对于整个灰度图中所有的 像素点都按照这个阈值进行分割。阈值t 被称为全局阈值或固定阈值。典型的全 局阈值方法包括最大类间方差法、矩量保持法和直方图变换法等等。全局阈值法 的特点是算法简单,对于目标区域和背景区域的灰度差别明显、直方图分布形状是 双峰的图像效果良好,但它对于因为光照不均匀、噪声干扰较大等原因使得直方图 分布形状不是双峰的图像,二值化效果明显变差。 所谓局部阈值法,是指在很多情形下,灰度图的目标区域与背景区域的对比 度变化比较大,因此在图像中的某一个区域使用效果很好的阈值,对其它区域可 能并不适用,此时必须将阈值t 选取成随着像素位置而变化的阈值函数,该函数 的每一个值只适合于图像的局部区域。阈值t 被称为局部阈值或动态阈值。典型 的局部阈值法包括b e r n s e n 算法、自适应光栅算法等等。与全局阈值法相比较, 对于非均匀光照条件等情况,复杂的灰度背景虽然对整体图像的灰度分布影响较 大但是对局部区域的图像性质影响较小,使得局部阈值法较全局阈值法应用性能 更好。但局部阈值法也存在不足之处:算法较为复杂,运算量较全局阈值法要大。 2 1 2 商标图像二值化 转变为灰度图后的商标图像,其目标区域和背景区域对比度较大,且两类区 域的灰度分布也较均匀,因此通过o t s u 法1 2 3 j 可以很容易找出一个最佳的全局阈值, 进而很好地实现二值化处理。但是o t s u 法作为一种固定阈值法对于噪声干扰较大 的图像,其二值化效果较差。b e r n s e n 算法1 2 4 】作为一种动态阈值法,所选取的阈值 是随着像素点邻域的灰度值变化而动态变化,因此对灰度不均的图像有较好的适 应性。 此外,商标图像二值化时,阈值选择时要避免出现下列两种情况: 1 笔画断裂现象: 如果当前像素点位于目标区域( 图形区域) 的内部,即如果其邻域均为目标 点,这时选取的阈值若偏大,使得部分目标点被错误地二值化成背景,从而导致 商标图像的连通性受到影响,会产生了笔画断裂的问题。 2 伪影现象: 与上一种情形相反,如果当前像素点位于背景区域( 底色区域) 的内部,即 如果其邻域均为背景点,这时选取的阈值若偏小,使得部分背景点被错误地二值 化成目标,由此就产生伪影的问题。此外,当邻域内无目标点时,一些灰度值相对 8 江苏大学硕士学位论文 较大的干扰噪声有可能被二值化成目标,也会产生伪影现象。 笔画断裂和伪影现象虽然可以通过下节中的膨胀和腐蚀处理消除,但是与原 图像有一定差异,因此,在二值化处理时应尽量避免这两种情况的发生。我们的 思路是针对根据b e r n s e n 算法计算得到的阂值曲面运用中值滤波和o t s u 算法进行 修正。以下为基于经过修正的b e r n s e n 法的商标图像二值化算法主要步骤: 1 对灰度图f ( x ,y ) ,按照b e r n s e n 算法计算每一点阈值t 。( x ,y ) : r 丁= 互( ) = 0 5 慨m a xf ( x + 七,y + f ) + 撒m j 。n f ( 工+ 七,y + 1 ) l ( 2 2 ) l w i w 一( , j 2 将获得的阈值函数t 。( x ,y ) 也看成一幅灰度图像,并利用中值滤波算法对 该图像进行平滑。将平滑后的阈值函数记为t = t :( x ,y ) ; 3 对灰度图f ( x ,y ) ,按照o t s u 算法计算出全局阈值僻: , t = a r g 0 - 2 ( 7 ) ( 2 3 ) i t m 4 对阂值函数进行修正: , 得: t = 丁3 ( x ,y ) = 口丁木,t a t + t 4 ( x ,夕) ,a t 奉 r y t 一w i w一舻,s w i t 2 ( x ,y ) + ( 1 一旯) 丁宰一m a 删xf ( x + k ,y + d 一帆m 脚i n f ( x + k ,y + ,) r r 宰 - w i _ c ;w w f s ( 2 5 ) 在上面的式子中,旯,7 均为常系数,且满足0 t , y l 。 2 1 3 实验结果 按照上述算法,对商标图像进行二值化处理,实验结果如图2 1 所示。图中, 左列图像为商标图像的灰度图,右列为二值化处理后得到的二值图像。 9 江苏大学硕士学位论文 i il i lc ) llai 2 2 数学形态学运算 灰度图 二值化图像 图2 1 二值化处理效果 2 2 1基本概念 数学形态学 2 5 2 6 l ( m a t h e m a t i c a lm o r p h o l o g y ) 是分析几何和结构的数学方法, 建立在集合代数的基础上,用集合论方法定量描述集合结构的学科。数学形态学 包括一组基本的形态学算子:腐蚀、膨胀、开、闭等。运用这些算子及其组合进 行图像形状和结构的分析及处理。 2 2 2 形态学腐蚀运算 对于给定的目标图像x 和一个结构元素s ,想象一下将s 在图像上移动,在每 个当前位置x ,s x 只有三种可能状态,如图2 2 ,即( 1 ) s 【x 】x ;( 2 ) s 【x 】贾; ( 3 ) 斟x 】n x 与s 【x 】r 、牙均不为空。第一种情形s e x - 与x 相关最大;第二种情形 s i x 不相关;而第三种情形s x 与x 部分相关。满足( 1 ) 的点x 为s 对x 的腐蚀, 简称腐蚀,记为x o s ,即x o 胆 x i s x 】冬x ( 2 6 ) 图2 2 s 【x 3 】的三种可能状态 1 0 s x 2 江苏大学硕士学位论文 腐蚀在数学形态学运算中的作用是消除物体边界点。如果结构元素取3 x3 的 黑点块,腐蚀将使物体的边界沿周边减少一个像素,如图2 3 所示。 二值图像 图2 3 腐蚀的不恿图 腐蚀可以把小于结构元素的物体去除,这样选取不同大小的结构元素,就可 以去掉不同大小的物体。如果两个物体之间有细小的连通,那么当结构元素足够 大时,通过腐蚀运算可以将两个物体分开。这对消除二值化处理后的伪影现象很 有用。对同一图像,选取的结构元素不同,腐蚀结果也不同。 利用腐蚀运算的定义式( 2 6 ) 可以直接设计腐蚀变换的算法。但有时,更为 方便的是另一种表达式:x e s - - r 、 x n i s s 。这一公式可从( 2 6 ) 中推出, 它把腐蚀表示为图像平移的交,这在某些并行处理环境中特别有用。: 数学形态学腐蚀运算的具体算法如下: ( 1 ) 读入原图像中的一个点( 当前点) 的像素值,并把缓存图像中对应位置 的点赋成黑色。 ( 2 ) 把结构元素“覆盖”在原图像中以当前点为中心的区域上,如果在结构 元素中某点为黑色而下面原图像中对应的点为白色,则把缓存图像中当前点赋成 鬣i : 白色,即腐蚀掉。 ( 3 ) 将原图像中的点读入一遍,按( 1 ) 、( 2 ) 循环操作,在缓存图像中就得到 原图像的腐蚀结果。 ( 4 ) 拷贝缓存图像到原图像上并返回。 2 2 3 形态学膨胀运算 腐蚀可以看做是将图像x 中每一个结构元素s 全等的子集s x 收缩到点x 。 那么反之,也可以将x 中的每一个点x 扩大为s x 。这就是膨胀运算,记为zo s 。 它定义为: x o s = p i s x 】厂、x ( 2 7 ) 与之等价的定义形式为: x e ) s = u x s 】i s s ; xo s = u s 【x 】i x x 膨胀运算的示意图如图2 4 所示。 江苏大学硕士学位论文 二值图像 图2 4 膨胀的示意图 膨胀运算的作用是把图像周围的背景点合并到物体中。如果两个物体之间距 离比较近,那么膨胀运算可能会使这两个物体连通在一起。这对消除二值化处理 后的图像笔画断裂很有用。 数学形态学膨胀运算的具体算法与腐蚀的过程相似,不同的是首先把缓存图 像中当前点赋成白色,而只要结构中某点和原图像与之对应的点都为黑色,则把 缓存图像中当前点赋成黑色,即进行了膨胀。 2 2 4 开运算和闭运算 腐蚀运算后再进行膨胀运算的组合运算称为开运算。它具有删除小物体、将 物体拆分为小物体和平滑大物体边界而不明显改变它们的面积的效果。 丌运算可以定义为: x o s = ( x q s ) o s ( 2 8 ) 膨胀运算后再进行腐蚀运算的组合运算称为闭运算。它具有填充物体的小洞、 连接相近的物体、平滑物体的边界而不明显改变它们的面积的效果。 闭运算可以定义为: x o s = f x o s ) o s ( 2 9 ) 数学形态学基本算子还有击中和击不中变换,衍生运算有收缩、细化、骨骼 化、修剪、加厚等。数学形态学提出的独特的变换和运算方法为图像处理和分析 提供了强有力的基础。 2 2 5 实验结果 根据2 2 节数学形态学理论,对二值化后的商标图像进行相应运算,达到彻底 消除笔画断裂、交叠、缺漏及伪影现象,为图像分割做准备。示例如图2 5 所示。 其中第一幅图像进行了水平方向的膨胀处理,第二幅图像进行了闭运算。由图可 见,在进行了形态学运算后,第一幅商标图像避免了区域遗漏,而第二幅的轮廓 显得更为清晰明了。, 1 2 江苏大学硕士学位论文 2 3 图像分割 二值化图像 形态学运算结果 图2 5 形态学运算示例 2 3 1 基本概念 二值商标图像可以看作是一些具有一定形状的几何图形的集合体,这些几何 图形反映在图像中就是众多的区域。图像分割可以把整幅图像分成互不交叠的有 意义的区域,以便进一步的处理、分析、应用。 图像分割的方法很多,一般分为两大类:一类是边界方法,这种方法的假设 是图像分割结果的某个子区域在原来图像中有边缘存在;一类是区域方法,这种 方法的假设是图像分割结果的某个子区域有相同的性质,而不同区域的像素则没 有共同的性质。两种方法又都可以分为并行和串行分割,即图像分割主要包含四 种技术:并行边界分割技术、串行边界分割技术、并行区域分割技术和串行区域 分割技术。 2 3 2 区域生长法 区域分割的方法,最基本的是区域生长法。这种方法是指从某个像素出发, 按照一定的准则,逐步加入邻近像素,当满足一定条件时,区域生长终止。 如图2 6 所示为区域生长的示意图,其中邻域系统采用4 邻域。图2 6 ( a ) 中, 带有阴影的像素为初始的种子点,假设生长准则是种子点和所考虑像素灰度值差 的绝对值,并且小于或等于某个阈值t ,就将该像素包括到该种子像素所在的区域。 图2 6 ( b ) 中给了t = 1 时区域生长结果,图像被分成4 个区域。图2 6 ( c ) 给出了t = 3 ,种子点为图2 6 ( a ) 中像素值为2 和1 1 的两个像素,结果是整个图像被分成 了2 个区域。图2 6 ( d ) 给出了t = 5 ,种子点为图2 6 ( a ) 中像素值为2 的像素,生 江苏大学硕士学位论文 长的结果是最后图像变成了一个区域。从这个例子可以看出:关系区域生长结果 的因素有以下3 个条件: ( 1 ) 初始点( 种子点) 的选取; ( 2 ) 生长准则: ( 3 ) 终止条件。 初始点的选择,可以是人工加入的交互信息。当不清楚初始点应该在什么位 置时,可以让计算机自己选择种子点进行区域生长。 这种方法的缺点是对那些区域边缘灰度变化很平缓,或对比度较弱的边缘相 交为一点时,两个区域会合并在一起。数学形态学运算使二值商标图像避免了这 些情况的发生,区域生长法能很好地应用于商标图像,达到图像分割的目的。 231 0l o 01 :誊 箩! 移谚 3i2 蠛 1 0箩i i 荔 嚣一,嗨屯罐 ,z 二矗j 二蕊0 :* , 5 5 98 黎“节穆 多4 :? 48 蓦5 8 髻 貔:知锄翘滋 ( a ) 黪= 絮,鸳磷繁 蠹2 , :。? ,2 鼍篱 1 l1 l :私! 。二、。疆 舅一 ,。一蕊 陵如 一! 麓 2 ;,矮 l ll l 謦一,:。? ;+ 鬟 塾之。:臻 l l1 1 酊 ;i ;鬻 萝芝- :,2 :鬈 1 11 l 目锄磊鳞s掰晒边蕊 冀产烨吁7濒 1 0 1 0 蓬一25 : + 群 1 0 1 0 奠,: i i -2鬟7- 鲁 爹:2 :+ 熬警! 芝;二警?黪翔黪黝 霸艮。 4 丘2 嘿 豢囊 ;玺蒜 隧篷鍪幽张黼 鬻鬏燃 穗# 精袋 秽孺醪缨眨芝。,芝: i 2 i 爹 1 恶囊 雾j,:l 黔:哆 糖,驾 眢警一: ? 蓬 王i 。 ;辅 器东 专 2 铎 2、r “ 2二盖, k # + j 如j f 、 二; j _ 。粤穗 疑耋 囊幺l二囊 j ;翻 ,2 。; 。? 羚j :;7 t:一。-7_7;! 豢饔 t ,) 。峙 一1 , 一淄 ,f 馘 基蕊矗逸 翻菇亥蕊 (c)(由 图2 6 区域生长示意图 具体算法如下: ( 1 ) 对图像顺序扫描,找到第一个不属于任何区域的像素,设该像素为( 而,) 。 ( 2 ) 以( 而,) 为中心,考虑( 而,) 的4 邻域像素o ,y ) ,如果( x ,y ) 满足生长准 则,则将( 工,y ) 与( ,) 合并,同时将( x ,y ) ! k , a 堆栈 ( 3 ) 从堆栈中取出一个像素,把它当作( j c o ,) ,回到步骤( 2 ) 。 1 4 江苏大学硕士学位论文 ( 4 ) 当堆栈为空时,回到步骤( 1 ) ( 5 ) 重复( 1 ) ( 4 ) ,直到图像中的每个点都有归属时,生长结束。 2 3 3 商标图像的分割 我们把区域生长法应用到商标图像中,根据图像的特点,选择初始的种子点 是图像的中心点,生长准则是像素值的绝对值小于设定阈值t = i ,终止条件是一直 遍历到没有符合生长条件的像素为止。 根据2 3 2 节的算法及上述的3 个条件,我们对二值商标图像进行图像分割, 其分割结果如图2 7 所示。 2 4 本章小结 图图圆 圈匦 图2 7 二值商标图像分割示例 本章分以下三个步骤对商标图像进行预处理,并取得了很好的效果: 1 在详细分析现有的典型二值化处理方法基础上,提出了一种经过o t s u 算法 修正的b e m s e n 法的商标图像二值化算法,将商标图像转换成目标图像是黑色的二 值图。 2 利用数学形态学基本算子:腐蚀、膨胀、开、闭等,分析及处理二值商标 图像的形状和结构,达到彻

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论