(机械电子工程专业论文)标牌压印字符图像获取与处理中的关键技术研究.pdf_第1页
(机械电子工程专业论文)标牌压印字符图像获取与处理中的关键技术研究.pdf_第2页
(机械电子工程专业论文)标牌压印字符图像获取与处理中的关键技术研究.pdf_第3页
(机械电子工程专业论文)标牌压印字符图像获取与处理中的关键技术研究.pdf_第4页
(机械电子工程专业论文)标牌压印字符图像获取与处理中的关键技术研究.pdf_第5页
已阅读5页,还剩133页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 工业中广泛应用的一类标识字符,是直接采用机加工的方法制作在物体 表面上的,标识字符与母体同色,且为立体字符。正是这个特点使得对它们 的研究难以直接借用现有的字符识别研究成果,因而成为光学字符识别中的 一个新的研究领域。随着制造业信息化水平的提高,对这类字符的自动识别 也成为产品信息化管理的一个必然要求。本文在教育部资助下,开展了如下 研究工作: 设计了获取标牌压印字符图像的机器视觉系统。采集图像质量的高低是 影响压印字符识别性能的关键,基于此,首先介绍了机器视觉系统的组成, 分析了各个硬件的性能参数和选择方法,并根据标牌图像采集系统的性能特 点选择了相应的硬件。分析了光照对标牌字符图像的影响,在一个机器视觉 应用系统中,好的光源与照明方案往往是整个系统成败的关键。字符图像能 否很好地反映字符的特征信息,照明方案起着关键的作用。研究了不同的照 明方案对标牌压印字符成像的影响,同时研究了字符载体的反射特性对图像 质量的影响。基于l e d 光源等机器视觉硬件建立了标牌图像采集系统,通过 对大量不同材质和版面的标牌进行图像采集实验,最终确定了低角度l e d 光 源构成的照明方案作为标牌图像采集的最佳照明方案。 研究了标牌图像的光照处理方法。选择辐射度光照模型作为标牌图像的 模型。针对标牌图像的特性,将多种光照处理方法应用于标牌图像进行处理。 在此基础上,根据标牌压印字符系统的特点,提出了一种对光照处理效果对 比方案。通过理论分析和实验验证证明,同态滤波算法可以作为一种有效的标 牌图像光照处理算法。 提出了利用图像分层技术对压印字符图像进行自动分割的方法。系统地 研究了标牌图像压印字符的自动分割问题。根据标牌图像的特点,提出利用 图像分层技术对标牌压印字符进行分割的方法。首先根据标牌图像灰度分布 的特点将图像从最暗层到最亮层进行分层,对最暗层图像进行自适应二值化 可得到标牌图像中的印刷文本图像。继而,基于连通域分析对印刷文本图像 进行分析确定其所在区域,最后将确定的印刷文本区域从原始图像中去除, 可得到目标区域,即仅含有压印字符区域的目标图像。经过对大量标牌图像 山东大学博+ 学位论文 进行分割实验证明,图像分层技术是一种适用于标牌压印字符分割的有效算 法。 研究了压印字符图像质量的评价及恢复算法。图像质量是影响字符识别 系统精度鲶关键,对标牌圈像串进行质量臣动检测麓有效地降低识别系统的 掇识率和误识率。提出了利用五个质量参数来评价标牌图像质量,即黑色斑 点因子、良色斑点因子、粘连字符殿子、断裂字符因子和字符鲢嵩发、宽度 和位置等参数,对标牌图像的质量进行了整体评价,定量地给出图像的质量 等级。针对某些具有特定质量的标牌图像建立了相应的图像质量改善方法。 实现了从举幅图像中自动提取出不同图像质量等级的字符,即实现了不同质 量等级字符图像的分类功麓,为下一步针对不圊质量等级字符建立摆应鲍图 像处理算法奠定了良好的基础。 利餍g a b o r 滤波器提取压印字符的方向特征进褥识别。提出了一釉基于 获度图像和g a b o r 变换的藤印字符特征提取新方法。设计了一组g a b o r 滤波 器,然后对压印字符的灰度图像直接进行特征抽取,分别提取压印字符水平、 竖直、左、右对角线等西个方向上的局部笔画特征,在此基础上,建立一种 不变g a b o r 特征空间。经大量实验证明,这种不变g a b o r 特征具有优良的可 分性,并且其有良好韵旋转、尺度和平移不变性,褥时对光照变讫和噪声也 具有较强的鲁棒性,从而进一步证明了g a b o r 滤波器适用于类似压印字符等 低质量餮像的特征提取。 本课题为2 0 0 6 年国家教育部博士点基金项目资助课题。 共键词:服印字符;凹凸字符;机器视觉;字符识别;特征提取;字符分割; g a b o r 滤波器 a b s t r a c t a b s t r a c t c h a r a c t e r sf o r m e do nt h es u r f a c eo fo b je c t sb ym a c h i n i n gm e t h o da r e w i d e l y u s e di ni n d u s t r i a l p r o d u c t s t h e s ec h a r a c t e r s a r et h r e e - d i m e n s i o n a l c h a r a c t e r sa n d t h e yh a v e t h es a m ec o l o ra st h e b a c k g r o u n d i t i st h i s c h a r a c t e r i s t i ct h a tm a k e si td i f f i c u l tt ou s et h ee x i s t i n gr e s e a r c ha c h i e v e m e n t so f t h et r a d i t i o n a l o p t i c a l c h a r a c t e r r e c o g n i t i o n ( o c r ) t or e c o g n i z e t h e m a c c o r d i n g l y , r e c o g n i t i o no fs u c hc h a r a c t e r sb e c o m e san e wh o ts p o ti no p t i c a l c h a r a c t e rr e c o g n i t i o nr e s e a r c hf i e l d r e c e n t l y , w i t ht h ed e v e l o p m e n to ft h e i n f o r m a t i o nt e c h n o l o g y , a u t o r e c o g n i t i o ns y s t e m sf o rp r e s s e dc h a r a c t e r sb e c o m e an e c e s s a r yr e q u i r e m e n tf o rp r o d u c ti n f o r m a t i o nm a n a g e m e n t s u p p o r t e db y d o c t o r a lf u n do fm i n i s t r yo fe d u c a t i o no fc h i n a ,t h er e s e a r c hc a r r i e do u ti nt h i s t h e s i si sa sf o l l o w i n g s am a c h i n ev i s i o ni m a g ea c q u i s i t i o ns y s t e mf o rc h a r a c t e r sp r e s s e do nl a b e l s i sd e s i g n e d t h eq u a l i t yo fi m a g e sa c q u i r e di sam a i nf a c t o rt oa f f e c tt h e p e r f o r m a n c eo ft h ep r e s s e dc h a r a c t e rr e c o g n i t i o ns y s t e m i no r d e rt oi m p r o v et h e q u a l i t yo ft h el a b e li m a g e ,t h ec o m p o n e n t so ft h em a c h i n ev i s i o ns y s t e ma r e i n t r o d u c e da n dt h e i rp e r f o r m a n c ei sa n a l y z e d i l l u m i n a t i o ni sv i t a li nm a c h i n e v i s i o na p p l i c a t i o n sf o rp r o v i d i n gc o n t r a s ts ot h a tt h ec a m e r ac a ns e et h ei m a g e c l e a r l y e f f e c to ft h ei l l u m i n a t i o no nt h el a b e li m a g e si sa n a l y z e d t ob ee f f e c t i v e , t h ei l l u m i n a t i o nn e e d st op r o v i d ea l la d e q u a t ea m o u n to fu n i f o r ml i g h ta n db e f r o mt h ec o r r e c ta n g l e ,s oa st og e te n o u g hi n f o r m a t i o no ft h ep r e s s e dc h a r a c t e r s f r o mt h el a b e li m a g e e f f e c to ft h es e v e r a li l l u m i n a t i o ns c h e m e sf o rm a c h i n e v i s i o ni m a g i n gs y s t e m so fl a b e li ss t u d i e d a l s o ,t h er e f l e c t i v ep r o p e r t i e so ft h e l a b e la r ea n a l y z e d b a s e do nl e dl i g h t i n g ,a ni m a g ea c q u i s i t i o ns y s t e mf o rl a b e l i se s t a b l i s h e d e x p e r i m e n t so nl a b e l sw i t hd i f f e r e n tk i n d so fm a t e r i a l sa n d l a y o u t sa r ec a r r i e do u ta n dt h er e s u l t sp r o v et h a tt h el o w - a n g l el e dl i g h t i n gi s t h eb e s ti l l u m i n a t i o ns c h e m ef o rt h ec h a r a c t e r sp r e s s e do nl a b e l i l l u m i n a t i o np r e p r o c e s s i n gm e t h o d sf o rl a b e li m a g e sa r es t u d i e d a c c o r d i n g t ot h ec h a r a c t e r i s t i c so ft h el a b e li m a g e s ,s e v e r a li l l u m i n a t i o np r e p r o c e s s i n g i i i 山东大学博十学位论文 m e t h o d sa r e a p p l i e d o nt h e m i no r d e rt oc h o o s eab e s t i l l u m i n a t i o n p r e p r o c e s s i n gm e t h o df o rl a b e l ,ac o m p a r i s o ns c h e m ei sd e s i g n e d b o t ht h e t h e o r e t i c a la n a l y s i sa n dt h ee x p e r i m e n tr e s u l t sp r o v et h a tt h eh o m o m o r p h i cf i l t e r c a nb er e l i a b l yu s e df o ri l l u m i n a t i o np r e p r o c e s s i n go fl a b e li m a g e s an o v e ls e g m e n t a t i o nm e t h o df o rc h a r a c t e r s p r e s s e do nl a b e lb a s e do n l a y e r e di m a g e si sp r e s e n t e d a u t o m a t i cs e g m e n t a t i o nm e t h o d sf o rs e g m e n t i n gt h e c h a r a c t e r sf r o mt h el a b e li m a g ea r es t u d i e d s y s t e m a t i c a l l y a c c o r d i n gt ot h e c h a r a c t e r i s t i c so ft h el a b e li m a g e ,as e g m e n t a t i o nm e t h o db a s e do nl a y e r e d i m a g e si sp r e s e n t e d t h ea l g o r i t h mc l a s s i f i e dt h el a b e li m a g ei n t ot h r e ep l a n e s : t h eb r i g h t e s tp l a n e ,t h ed a r k e s tp l a n ea n dt h em i d d l ep l a n e t h ep r i n t e dt e x to n t h el a b e li se x t r a c t e df r o mt h ea d a p t i v e l yb i n a r yi m a g eo ft h ed a r k e s tp l a n e t h e n , t h eb l o c ko fp r i n t e dt e x ti sd e f i n e db a s e do nc o n n e c t c o m p o n e n t sa n a l y s i s f i n a l l y , b yr e m o v i n gt h eb l o c ko ft h ep r i n t e dt e x tf r o mt h eo r i g i n a li m a g e ,t h e p r e s s e dc h a r a c t e r sa r ep i c k e du ps u c c e s s f u l l y e x p e r i m e n t sa r ec a r r i e do u tw i t ha l a r g en u m b e ro fl a b e li m a g e s e x p e r i m e n tr e s u l t ss h o wt h a tt h e p r o p o s e d s e g m e n t a t i o nm e t h o dc a nb er e l i a b l yu s e di nt h el a b e li m a g e s i m a g eq u a l i t ya s s e s s m e n ta n dr e s t o r a t i o na l g o r i t h m sf o rt h e p r e s s e d c h a r a c t e r sa r es t u d i e d t h eq u a l i t yo fi m a g ea c q u i r e di sa k e yf a c t o rt oa f f e c tt h e a c c u r a c yo fc h a r a c t e rr e c o g n i t i o ns y s t e m a l g o r i t h m sf o re s t i m a t i n gt h eq u a l i t y o fa n yg i v e ni m a g e sc a nb eu s e dt oa u t o m a t i c a l l yd e t e r m i n ei m p r o v e m e n tm a d e b ya d a p t i v ei m a g e - r e s t o r a t i o na l g o r i t h m s i no r d e rt oe s t i m a t et h eq u a l i t yo ft h e i m a g e ,f i v eq u a l i t ym e a s u r e sa r ei n t r o d u c e d t h a ti s ,s m a l ls p e c k l ef a c t o r , w h i t e s p e c k l ef a c t o r , b r o k e nc h a r a c t e r f a c t o r , t o u c h i n g c h a r a c t e rf a c t o ra n d c h a r a c t e r - h e i g h t ,w i d t ha n dl o c a t i o nf a c t o r b a s e do nt h ei n f o r m a t i o np r o v i d e d b yt h eq u a l i t ym e a s u r e s ,aq u a n t i t a t i v eg r a d ec a nb eg i v e nt ot h el a b e li m a g ef o r i t sq u a l i t ye s t i m a t i o n s e v e r a li m a g e r e s t o r a t i o n a l g o r i t h m sa r ei n t r o d u c e dt o i m p r o v et h el a b e li m a g e a l s o ,b a s e do nt h eq u a l i t ym e a s u r e s ,c h a r a c t e r sw i t h d i f f e r e n tq u a l i t i e sc a nb es e g m e n t e df r o mal a b e l i m a g e ,w h i c hi sh e l p f u lt o a d a p t l ys e l e c t t h e i m a g ep r o c e s s i n ga l g o r i t h mf o rc h a r a c t e r sw i t h s p e c i f i c q u a l i t y i v a b s t r a c t r e c o g n i t i o nt h ep r e s s e dc h a r a c t e r sw i t ht h e i rd i r e c t i o nf e a t u r ee x t r a c t e db y g a b o rf i l t e r s an o v e lf e a t u r ee x t r a c t i o nm e t h o df o rr a i s e do ri n d e n t e dc h a r a c t e r s p r e s s e do nal a b e lu s i n gg a b o rt r a n s f o r mb a s e do nt h eg r a yi m a g ei sp r e s e n t e d a s e to fg a b o rf i l t e r si sd e s i g n e da c c o r d i n gt ot h ec h a r a c t e r i s t i c so ft h ep r e s s e d c h a r a c t e r s t h e s ef i l t e r sa r eu s e dt ob r e a kd o w nag r a yi m a g eo fac h a r a c t e ri n t o f o u rd i r e c t i o n a lf e a t u r es u b i m a g e st og e tt h el o c a lg a b o rf e a t u r e s b a s e do n t h e s el o c a lf e a t u r e s ,a ni n v a r i a n tf e a t u r es p a c ei se s t a b l i s h e d e x p e r i m e n t sa r e c a r r i e do u tw i t hal a r g en u m b e ro fr a i s e do ri n d e n t e dc h a r a c t e ri m a g e s e x p e r i m e n tr e s u l t ss h o wt h a tt h ep r o p o s e di n v a r i a n tg a b o rf e a t u r e sh a v eg r e a t s e p a r a t ec a p a b i l i t ya n d h a v eg r e a tr o b u s tt or o t a t i o n ,s c a l e ,t r a n s l a t i o ni n v a r i a n c e a n da r ea l s oi n s e n s i t i v et oi l l u m i n a t i o nc o n d i t i o n sa n dn o i s ec h a n g e s i ti sp r o v e d t h a tg a b o rt r a n s f o r mc a nb er e l i a b l yu s e df o re x t r a c t i n gt h ef e a t u r eo fl o w q u a l i t yc h a r a c t e r i ni m a g ep r o c e s s i n g t h i sw o r ki ss u p p o r t e db yd o c t o r a lf u n do fm i n i s t r yo fe d u c a t i o no fc h i n a k e yw o r d s :p r e s s e dc h a r a c t e r s ,r a i s e do ri n d e n t e dc h a r a c t e r s ;m a c h i n ev i s i o n ; c h a r a c t e rr e c o g n i t i o n ;f e a t u r ee x t r a c t i o n ;c h a r a c t e rs e g m e n t a t i o n ;g a b o rf i l t e r 坛, v 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进 行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何 其他个人或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡 献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人 承担。 论文作者签名:季连丧日期:塑塑:! 兰 关于学位论文使用授权的声明 本人同意学校保留或向国家有关部门或机构送交论文的印刷件和电子 版,允许论文被查阅和借阅;本人授权山东大学可以将本学位论文的全部 或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手 段保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:查耋叁导师签名:论文作者签名:澎垒圣导师签名:期:兰! 生尘 第1 章绪论 1 1 研究背景与目的意义 第1 章绪论 工业标牌广泛地应用于钢铁、轮胎、汽车及各种机电产品中,用于标识 产品的重要信息,是企业进行生产管理、质量控制和产品跟踪的重要载体。 为了使工业标牌对产品的标识具有永久性,要求工业标牌必须适应各种恶劣 的工业环境( 高温、长期户外存放等) 。园此,目前大多数工业标牌中用于实 时记录产品信息的内容是通过字模压印而成【i 】。这样形成的字符质量和印刷 字符相比,受时间和现场的影响很小,所以近年来越来越多的被应用到一些 t 业产品标识上,圈1 1 是目前钢铁企业中广泛使用的一种工业标牌。 图1 ,1 业标牌图像 如图1 1 所示,工业标牌中的内容分为两部分,一部分是静态数据,如 “炉批号”、“规格”等,这部分数据是固定不变的,一般事先印刷在标牌上: 另一部分是动态数据,如“2 0 0 3 0 8 1 2 4 3 ”、“中1 2 ”等,用于实时记录产品的 生产信息,因而具有不固定性,一般不能事先制作,需要在生产线上通过凹 凸字模实时压制而成。通过字模压制的动态字符可能是上凸的或者是下凹的, 统称为“压印凹凸字符”f 本文简称“压印字符”) 。 压印字符的内容承载着产品的重要信息,随着制造业信息化的发展,对 于压印字符的自动识别也成为产品信息化管理的一个必然要求。目前藐国机 电产品的生产、入库、出库到市场各环节信息的记录工作基本是靠人工完成, 山东大学博七学位论文 工作量极大。以钢材为例,全国每年的钢产量已突破4 亿吨,平均2 吨一捆, 每捆需要3 0 个左右的标识字符,每年需要录入的“压印字符”1 2 0 亿个,这 样的海量数据,都由人工录入,工作量可想而知。标识信息的自动录入问题 已成为制约企业e r p 发展的瓶颈。 压印字符与印刷字符等一般的光学字符相比,是空间立体字符,字符与 背景没有色差。正是这种“无色差“立体 的特点,使得对压印字符的识别 与一般的光学字符识别有很大的区别,目前无法直接借用一般光学字符识别 领域的研究成果。而对于压印字符的识别研究目前还处在起步阶段。因此, 本文将工业标牌的压印字符作为研究内容,不仅有重要的理论意义而且有广 阔的市场前景。 1 2 光学字符识别技术概述 尽管压印字符的特点决定了在具体方法实现上,压印字符的识别与一般 光学字符识别有所不同,但仍然遵循光学字符识别的一般过程,因而,压印 字符识别仍然属于光学字符识另l j ( o p t i c a lc h a r a c t e rr e c o g n i t i o n ,o c r ) 范畴。 1 2 1 光学字符识别技术的发展 光学字符识另u ( o c r ) 概念的诞生可以追溯到1 8 0 9 年的一项帮助盲人阅读 装置的发明专利。1 9 2 9 年,由德国的科学家t a u s h e c k 首先正式提出o c r 的 概念,并且申请了专利,美国科学家h a n d e l 也提出了对文字进行识别的方案 【2 1 。但真正的o c r 系统,直到电子计算机诞生后才变成为现实。现在o c r 的含义通常是指对将字符通过扫描等方法转换为数字图像,对其进行识别转 化成计算机内码。o c r 的技术核心是识别的软件一对人的智能的模拟。经过 近一个世纪的发展,o c r 已经成为当今模式识别领域中最活跃的研究内容之 一。它综合了数字图像处理、计算机图形学和人工智能等多方面的知识,并 在计算机及其相关领域中得到了广泛应用。 第一个o c r 软件【3 】是在1 9 5 7 年开发的e r a ( e l e c t r i cr e a d i n g a u t o m a t i o n ) ,它是基于窥视孔方法实现的,识别的速度是每秒1 2 0 个英文字 母。在此以后,世界范围内广泛地进行着o c r 技术的研究和开发工作。现 第1 章绪论 代典型的商品化o c r 系统可分为三代: 1 9 6 0 年到1 9 6 5 年出现的商品化o c r 产品属于第一代,n c r 公司、 f a r r i n g t o n 公司、i b m 公司分别研制出了自己的o c r 软件。其中最早的o c r 产品应该是i b m 公司的i b m l 4 1 8 。它的识别对象是印刷体的数字、英文字母 及部分符号。这一代产品的特点是被识别字符的字体很少,是经过特殊设计 或指定的,甚至于某些字符看上去都不太自然。 二十世纪6 0 年代中期到7 0 年代初期的o c r 产品属于第二代。典型系 统是i b m 公司于1 9 6 5 年在“纽约世界博览会 上展出的o c r 产品- - i b m l 2 8 7 。 这些系统能识别规则的印刷体字符,也能识别部分手写字符,但这些手写字 符只限于数字和少数字母和符号。这些成果迅速得到了应用,第一个实现手 写体邮政编码识别的信函自动分拣系统是由日本东芝公司研制的,两年后 n e c 公司也推出了同样的系统。在这个时期,另一些有重要意义的事件是建 立了一些供字符识别研究的标准化字符数据库,使研究人员可以很容易地评 估自己的进展。 第三代o c r 产品起始于二十世纪7 0 年代中期。从这时开始,主要解决 的技术问题就是对于质量较差的文档及大字符集的识别,以及达到非常高的 识别精度,例如汉字的识别,高精度的手写数字识别等。最先投入汉字识别 研究的日本东芝公司,于1 9 8 3 年发布了其识别印刷体日文汉字的o c r 系统 一o c r v 5 9 5 ,其识别速度为每秒7 0 1 0 0 个汉字,最高识别率达到9 9 5 9 。 我国在o c r 技术方面的研究工作起步较晚,在7 0 年代才开始对数字、 英文字母及符号的识别进行研究,7 0 年代末开始进行汉字识别的研究,到8 0 年代汉字识别的研究进入一个实质性阶段,取得了较大的成果,不少研究单 位相继推出了中文o c r 产品。1 9 8 9 年,清华大学率先推出了国内第一套中 文o c r 软件一清华文通t h o c r l 0 版,至此中文o c r 正式从实验室走向了 市场,开创了中文o c r 技术的应用先例。 如今,o c r 技术已在金融保险、工业生产和日常生活等领域广为应用。 在日本,金融行业中大量的存单、储单、保单以及户籍登记等都是通过o c r 技术来实现的。在美国,大规模的人口普查、针对个人的信贷业务、个人所 得税申报等也都采用o c r 技术。在我国,重庆大学精密仪器系研制的高精 度a v l 0 0 表格自动阅读系统在l9 9 4 年第四次全国人口普查和19 9 7 年第一次 山东大学博士学位论文 全国农业普查中得到大规模的成功应用。另外,很多基于o c r 技术的商用 系统已经投入使用,如汉字自动识别系统【4 1 ,邮政编码自动识别系统【5 1 ,车 牌识别系统6 】等。随着o c r 识别技术的发展,o c r 技术正逐步向行业应用 方向迈进。 1 2 2 光学字符识别技术的过程、原理和方法 对于应用于不同环境的o c r 系统,尽管在具体方法的实现上不完全相 同,但其大致过程是相同的,图1 2 给出了字符识别的一般过程。 图 图 字 特分 后 像 像符 征类 处 获 预分提 器理 取 处割取 设 理 计 图1 2o c r 一般过程 ( 1 ) 图像获取 图像获取是整个o c r 系统的第一步,一般是利用c c d 摄像机和扫描仪 等光学技术进行图像采集,得到的图像是字符的像素描述。像素描述的重要 参数是分辨率,分辨率包括空间( 二维平面) 分辨率和灰度分辨率,前者反映 了像素描述在空间上的精细程度,而后者则反映了像素描述在灰度空间的精 细程度。 图像特点和系统应用环境决定了具体的图像采集方法,获取的图像质量 不仅对系统的性能具有重要的影响,而且决定了o c r 系统后续处理过程中 具体算法的实现,因而,图像获取在整个o c r 系统中是非常关键的环节, 本文第二章针对压印字符的特点,进行了标牌图像获取系统的设计。 ( 2 ) 图像预处理 一般情况下,成像系统获取的图像( 即原始图像) 由于受到种种条件限 制和随机干扰,往往不能在视觉系统中直接使用,必须在视觉的早期阶段对 原始图像进行灰度校正、噪声过滤等图像预处理f 7 1 。 对于机器视觉系统来说,所用的图像预处理方法并不考虑图像降质原因, 4 第1 章绪论 只将图像中感兴趣的特征有选择的突出,衰减其不需要的特征,故预处理后 的输出图像并不需要去逼近原图像。这类图像预处理方法通称为图像增强, 图像增强技术主要有两种方法:空间域法和频率域法。空间域方法主要是在 空间域内对图像像素直接运算处理,如直方图修正技术、灰度拉伸等。频率 域方法就是在图像的某种变换域对图像的变换值进行运算,常见的方法有低 通滤波器、高通滤波器等。为了突出标牌图像中压印字符的特征而抑制背景 的特征,本文第三章对标牌图像进行了光照处理研究。 ( 3 ) 字符分割 在众多的o c r 应用系统中,文本图像往往先被分割成只含有单个字符 的子图像集,然后送入识别模块进行字符识别。将多字符图像切分成单字符 图像的过程就是字符分割。字符分割在o c r 系统中处于重要地位,分割的 准确率将直接影响整个o c r 系统的性能。 不同的对象一般采用不同的分割方法,然而许多不同字符也可以采用相 同的分割策略。字符分割的基本策略可以分为以下几类【8 】:基于图像特征的 切分、基于识别的分割以及基于整体识别的字符分割。 基于图像特征的分割就是对图像的内在特征进行分析,然后将图像分割 成字符块。分割过程常用的特征有字符的灰度特征、边缘特征、区域特征等, 常见的分割方法有基于投影曲线的分割【9 1 、基于连通元的分割【1 0 】等。 套 基于识别的分割策略【1 1 】是利用识别结果,进行词法、句法和语义的判别, 确定合理的分割方案。它避免了建立复杂的分割方法,但识别的可靠性对分 割效果有直接的影响。 基于整体识别的分割方法【1 2 j 4 】是把字符串作为一个整体对象,直接对字 符串进行识别而不是对单个字符识别。这种方法适用于内容比较固定的场合, 比如票据识别或地名识别等。 根据分割对象特点的不同,所采用分割方法也不同。一般来讲,对于质 量比较理想的字符图像,常常采用投影的方法来实现分割。而对于断裂字符 或粘连字符的分割,一般要考虑字符的结构特征来采用相应的分割方法。除 了经典的分割方法,目前还出现了一些基于特定理论的分割方法,比如基于 形态学、基于分形理论【1 5 】、基于隐m a r k o v 模型( h m m ) 的方法【1 6 】等。 寻找适用于标牌压印字符分割的方法是保证压印字符识别系统具有良好 山东大学博+ 学位论文 性能的另一关键环节,本文第四章内容即针对压印字符的特点对其分割方法 进行了研究。 ( 4 ) 特征提取 特征向量的抽取与选择是字符识别系统设计的核心之一,提取特征的好 坏对于系统的分类性能有直接影响。在过去的几十年中,人们提出了很多能 够有效表征字符信息的特征,根据提取方法的不同,这些特征可分为统计特 征、结构特征和两者的结合【1 6 】。 统计特征根据某个特征统计量统计字符的整体特征信息,反映字符的全 局特征。统计特征具有良好的抗噪声、抗笔画粘连与断裂等优点,但其区分 结构相似字符的能力较差。常见的统计特征有变换特征、矩特征【1 7 也0 1 、基于 轮廓的特征【2 1 。2 3 1 等,其中,变换特征是对字符图像进行变换,以变换系数作 为字符特征,常用的变换有f o u r i e r 变换【2 4 1 、k l 变换【2 5 ,2 6 1 、d c t 变换【2 7 1 、 g a b o r 变换【2 8 ,2 9 1 、w a v e l e t 变换【3 0 】等。针对压印字符的灰度不均匀等低质量 特点,本文第六章即利用g a b o r 变换提取压印字符的变换特征进行识别。 结构特征是从字符轮廓或骨架图像上提取的反映字符形状的基本特征, 如字符轮廓折线的折点、线段等,字符骨架的端点、折点、交叉点等【3 1 】以及 汉字的笔画、部件等都是常用的结构特征。字符的结构特征充分利用了字符 的内在结构关系,对字符的变形有较好的适应性,但抗噪能力差。 统计特征和结构特征的融合【3 2 ,3 3 1 。不论是字符的统计特征还是结构特征 都不能很好地反映字符的特征,充分利用统计和结构两方面的信息,发挥各 自的优势,才能有效地识别字符。 本文第六章利用g a b o r 变换首先提取字符的笔画方向特征,在此基础上, 建立了全局g a b o r 特征空间对压印字符进行了识别研究。 ( 5 ) 分类器设计 一旦特征向量提取后,就应该设计分类器。分类器设计的原则可归纳为 三类:基于相似性测度的分类器,如模板匹配【3 4 1 、距离分类器 3 5 1 等;基于概 率统计的分类器,如贝叶斯分类器【3 6 】等;基于判别函数的分类器,如支持向 量机【3 7 】等;基于特定理论的分类器,如神经网络分类器【3 8 1 、决策树分类器:e 3 9 1 、 粗糙集分类器【4 0 】及模糊分类器【4 1 】等。本文第六章利用距离分类器实现了压印 字符的g a b o r 特征分类。 6 第1 章绪论 ( 6 ) 后处理 后处理阶段是指o c r 系统在识别出单个字符后,利用上下文信息对识 别结果进行修正的阶段。后处理阶段不是o c r 系统所必须的,但是如果能 够选择合适的后处理方法,往往能较大地改善和提高系统的整体性能。 1 3 机器视觉技术及其应用 要想建立完善的字符识别系统,利用机器来代替人的大脑来对字符进行 识别,就离不开具有人眼功能的机器视觉系统。因而,选择合适的机器视觉 系统无疑会在很大程度上提高整个字符识别系统的性能。 1 3 1 机器视觉技术简介 机器视觉【7 】主要是利用计算机来模拟人的视觉功能,从客观事物的图像 : 中提取信息,进行处理并加以理解,最终用于实际检测、测量和控制。一个 典型的工业机器视觉应用系统包括光源、光学系统、图像捕捉系统、图像数 字化模块、数字图像处理模块、智能判断决策模块和机械执行模块。首先, 采用摄像机获得被测目标的图像信号,然后通过a d 转换变成数字信号传 送给专用的图像处理系统,根据像素分布、亮度和颜色等信息,进行各种运 算来抽取目标的特征,然后再根据预设的判别准则输出判断结果,去控制驱 动执行机构进行相应处理。 机器视觉是一项综合技术,其中包括数字图像处理技术、机械工程技术、 控制技术、光源照明技术,光学成像技术、传感器技术、模拟与数字视频技 术、计算机软硬件技术、人机接口技术等。机器视觉强调实用性,要求能够 适应工业现场恶劣的环境,要有合理的性价比、通用的工业接口、较高的容 错能力和安全性,并具有较强的通用性和可移植性,它更强调实时性,要求 高速度和高精度。 作为一门新生的科学,机器视觉显示出了强大的生命力。人们从2 0 世纪 5 0 年代开始研究二维图像的统计模式识别,6 0 年代开始进行三维机器视觉的 研究,7 0 年代中期,m i t 人工智能实验室正式开设机器视觉课程,8 0 年 代初期开始了全球性的研究热潮,机器视觉获得了蓬勃发展,新概念、新理 7 山东大学博十学位论文 论不断涌现。伴随着计算机技术的不断提高和图像处理与传输技术的日益成 熟,机器视觉在生产实践中的应用也加快了步伐。现在机器视觉已经广泛地 用于工业、农业、军事、航空、医学等领域中。同时,机器视觉在理论研究 上也取得了很大的发展,现在机器视觉涉及了多门学科,包括:光学、机械、 图像处理、计算机图形学、模式识别、人工智能、人工神经网络等。 1 3 2 机器视觉技术应用现状 近几十年来,由于视觉系统的非接触、速度快、精度合适、现场抗干扰 能力强等突出的优点,使机器视觉技术得到了广泛的应用,取得了巨大的经 济与社会效益。 目前,机器视觉已成功地应用于工业检测领域【4 2 州】,大幅度地提高了产 品的质量和可靠性,保证了生产的速度。例如产品包装印刷质量的检测、饮 料行业的容器质量检测、饮料填充检测、饮料品封口检测、木材厂木料检测、 半导体集成块封装质量检测、卷钢质量检测和水果分级检测等。在制药生产 线上,使用机器视觉技术可以对药品包装进行检测,以确定是否装入正确的 药粒。在木材加工中,要根据木料纹理检测木料中缺陷或测量木料的体积等。 在其他领域,机器视觉也得到广泛的应用。比如在医学领域【4 引,机器视 觉用于辅助医生进行医学影像的分析,主要利用数字图像处理技术、信息融 合技术对x 射线透视图、核磁共振图像、c t 图像进行分析或对其它医学影像 数据的统计和分析。在机器人导航及视觉伺服系统的应用方面,赋予机器人 视觉是机器人研究的重点之一,其目的是要通过图像定位、图像理解,向机 器人运动控制系统反馈目标或自身的状态与位置信息【4 6 1 。在卫星遥感中方面 【4 7 1 ,机器视觉技术被用于分析各种遥感图像,进行环境监测、地理测量,根 据地形、地貌的图像和图形特征,对地面目标进行自动识别、理解和分类等 等。 机器视觉在o c r 的应用开始于三十多年前,用于读取步枪和手枪上面的 字母和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论