(计算机应用技术专业论文)智能方法在车牌定位与字符分割中的应用研究.pdf_第1页
(计算机应用技术专业论文)智能方法在车牌定位与字符分割中的应用研究.pdf_第2页
(计算机应用技术专业论文)智能方法在车牌定位与字符分割中的应用研究.pdf_第3页
(计算机应用技术专业论文)智能方法在车牌定位与字符分割中的应用研究.pdf_第4页
(计算机应用技术专业论文)智能方法在车牌定位与字符分割中的应用研究.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着我国公路交通事业的发展,提高公路交通配套设施的自动化程度及其效 率日益成为关注的焦点。基于视频、静态图像的车辆自动化识别( a v i ) 系统以 其所具有的在系统安装、图像回放、图像检索等方面方便快捷的特点,成为解决 公路交通配套设施效率瓶颈问题的重要技术之一,具有广阔的发展前景和巨大的 经济价值。 针对这方面的迫切需求,本文结合对前人已有技术经验的研究和分析,从车 牌定位、车牌阈值化分割和字符切分算法三方面着手,详细阐述了基于车牌图像 的车辆自动化识别( a v i ) 系统关键技术部分的理论研究及实现方法。 车牌定位部分,文中实现了两种定位算法:基于传统h o u g h 变换和统计方法 的车牌定位算法、基于对称h o u g h 变换的车牌定位算法,通过对采样图像的实验, 显示后一种方法在降维的同时,提高了定位的准确度和鲁棒性。 车牌阈值化分割部分,本文结合模糊理论,实现了基于模糊测度最小的闽值 选取方法,并且对图像进行了灰度拉伸和平滑去噪预处理,以克服由于光照不充 分和噪声对图像产生的寄生效应。通过与其它阈值分割方法的实验结果相比较, 显示了文中选取方法的有效性。 对于字符切分,本文采用最大宽度回溯方法完成了单个字符的切分任务,并 利用采样图像进行实验,得到了较好的切分结果。 关键词:车牌定位,对称h o u g h 变换,阈值化,模糊测度,字符分割 摘要 a b s t r a c t w i t ht h ef a s td e v e l o p m e n to f t r a n s p o r t a t i o n m o r ea n dm o r ea t t e n t i o nh a sb e e n p a i dt oi t sa u t o m a t i o n a u t o m a t i cv e h i c l ei d e n t i f i c a t i o ns y s t e mb a s e do nv i d e o sa n d s t i l l i m a g e s ,w i t h i t s a d v a n t a g e s i n s y s t e mi n s t a l l a t i o n ,i m a g e s e a r c ha n di m a g e r e t r i e v a l ,s e e m st ob ea ne x t r e m e l yu s e f u lm e t h o dt os o l v et h e s ep r o b l e m s ,a n dt h u s a p p e a l s t om a n y p e o p l e i nt h i st h e s i s ,w em a i n l ys t u d yt h r e e p a r t so f t h ea u t o m a t i cv e h i c l ei d e n t i f i c a t i o n s y s t e mo nt h eb a s i so ft h ep a s te x p e r i e n c e s t h e s ec r i t i c a lp a r t sa r er e s p e c t i v e l yt h e l i c e n s ep l a t el o c a t i o n ,t h et h r e s h o l ds e g m e n t a t i o no fl i c e n s ep l a t ea n dt h ec h a r a c t e r s e g m e n t a t i o n t h i sp a p e rp r e s e n t st h e t h e o r e t i c a li n v e s t i g a t i o na n d p r a c t i c em e t h o d s t w o a l g o r i t h m si sp r e s e n t e di nt h i sp a p e rf o rt h el i c e n s ep l a t el o c a t i o n :t h ef i r s t b a s e do nh o u g ht r a n s f o r ma n dt h es e c o n db a s e do ns y m m e t r yh o u g ht r a n s f o r m t h e e x p e r i e n c e r e s u l t ss h o wt h a tt h es e c o n dm e t h o di s b e t t e r , w h i c hd e c r e a s e st h e d i m e n s i o n sw i t ht h eh i g hv e r a c i t ya n dr o b u s t n e s s w es e l e c tt h et h r e s h o l db ym i n i m i z i n gt h em e a s u r eo ff u z z i n e s si nt h el i c e n s e p l a t es e g m e n t a t i o n m o r e o v e r , w ep r e p r o c e s st h ei m a g ew i t ht h eg r a ys t r e t c ha n d s m o o t h i n gi n o r d e rt o c o n q u e r t h e l i g h ta s y m m e t r y c o m p a r i n gw i t h t h eo t h e r m e t h o d st h er e s u l t sp r o v et h ev a l i d i t yo fo u rm e t h o d f o rt h ec h a r a c t e r s e g m e n t a t i o n ,t h er e s u l t s i nt h e p a p e ri m p r o v e s t h a tt h e m e t h o do f m a x i m u mw i d t h r e t r o s p e c tf o rt h es i n g l ec h a r a c t e r i se f f e c t i v e k e y w o r d s :l o c a t i o n o ft h el i c e n s ep l a t e ,s y m m e t r yh o u g ht r a n s f o r m ,t h r e s h o l d i n g , m e a s u r eo f f u z z i n e s s ,c h a r a c t e rs e g m e n t a t i o n 绪论 第一章绪论 人类传递信息的主要媒介是语音和图像。据统计,在人类接受的信息中,听 觉信息占2 0 o ,视觉信息占6 0 ,其他如味觉、触觉、嗅觉总的加起来占2 0 。 所以,作为传递信息的重要媒体和手段一一图像信息是十分重要的,俗话说“百 闻不如一见”、“一目了然”,都反映了图像在传递信息中的独到之处。 图像处理科学对人类具有重要意义,主要表现在如下三个方面: ( 1 ) 图像是人们从客观世界获取信息的重要来源。视觉信息的特点是信息量 大,传播速度快,作用距离远,有心理和生理作用,加上大脑的思维和联 想,具有很强的判断能力。其次,是人的视觉十分完善,人眼灵敏度高, 鉴别能力强,不仅可以辨别景物,还能辨认别人的情绪,由此可见,图像 信息对人类来说是十分重要的。 f 2 ) 图像信息处理是人类视觉延续的重要手段。众所周知,人眼睛只能看到可 见光部分,但就目前科技水平来看,能够成像的并不仅仅是可见光。一般 来说,可见光的波长为o 3 8 o 8 t o n ,而迄今为止人类发现可成像的射线 已有多种,如:y 射线、x 射线、紫外线、红外线、微波,这些射线均可 以成像。利用图像处理技术把这些不可见射线所成图像加以处理并转换成 可见图像,实际上大大延伸了人类视觉器官的功能,扩大了人类认识客观 世界的能力。 ( 3 ) 图像处理技术对国计民生有着重要意义。图像处理技术发展到今天,许多 技术已日趋成熟。在各个领域的应用取得了巨大的成功和显著的经济效 益。如,通过分析资源卫星得到的照片可以获得地下矿藏资源的分布及埋 藏量;利用红外线、微波遥感技术可侦查到隐蔽的军事设施;x 射线、c t 已广泛应用于临床诊断,可准确的确定病灶位置,为诊断和治疗疾病带来 了极大的方便。总之,图像处理技术在工程领域、工业生产、军事、医学 以及科学研究中得到了广泛的应用。 1 1 车辆自动识另i j ( a v i ) 系统的研究 随着社会现代化程度的提高以及我国公路交通事业的飞速发展,汽车广泛普 及乃至进入千万普通百姓家庭也逐渐变成现实。这在促进我国经济发展的同时, 也为公路交通配套设施建设的进一步发展和完善提出了新的要求。目前我国高速 绪论 公路收费、停车收费、城市道路监控等大部分工作仍然停留在人工阶段,其效率 问题己日益成为阻碍公路交通事业发展的瓶颈,提高其自动化程度的要求非常迫 切。 车辆的自动识别( a u t o m a t i cv e h i c l ei d e n t i f i c a t i o n ,简称a v i ) 技术指通过识 别车辆所具有的牌照图像、条形码或射频识别标志等特征来自动识别车辆的技 术,可以广泛应用于公路和桥梁收费站、公路流量监测站、城市监控系统、港口 和机场停车场等车辆认证交通系统中,它以快速、准确、安全以及投入产出比高 等特点,提高了交通系统的车辆监控和管理的自动化程度,具有巨大的经济价值 和现实意义。 较之其它两种a v i 技术,基于图像或视频来识别牌照的技术特点是,首先 无需在汽车上安装专门的条形码或射频识别标志;其次,它是基于视频技术的识 别系统,可进行图像回放、图像检索,因而具有更广泛的应用前景,成为计算机 视觉与模式识别技术在智能交通领域的重要研究课题之一。 1 1 1a v i 系统框图 根据使用场合的不同,它们的组成会有一些差异,但总体功能实现部分都是 大同小异的。典型a v i 系统如图1 1 所示,包括以下几大部分: 1 ) 视频图像采集子系统,主要是摄像头、照明装置及帧采集卡等,负责单 帧图像数据源的采集; 2 ) 图像处理和中央控制单元,包括图像的去噪、车牌目标的定位提取、字 符分割及字符识别、控制信号处理等; 3 ) 对感兴趣的图像及并发数据( 如图像采集时间、地点等) 的存储和网络 传输子系统; 4 ) 客户端应用,包括对本端及远程数据库的查询、收费控制等。 a v i 系统 视频图像采集i4 图像处理和中央控制单元 帧ll 摄像 采jf 头及 集jl 照明 rfi 装置 图 像 预 处 理 生 牌 定 位 字 符 分 割 子 符 识 别 控 钰 信 号 盘 王单 存储和网络传输jl 客户端应用 图l _ 1 典型a v l 系统组成 1 1 2a v i 系统发展现状 数 据 库 网 络 通 讯 本 地 数 据 库 由于车辆自动识别技术巨大的商业价值,国外技术成熟的发达国家都不公开 浚技术;而国内的车辆自动识别技术还不够成熟。由于受汽车行驶速度、光照条 件、天气、牌照位置种类等多种因素的影响,不同环境设置条件下a v i 系统的 效率也都有所差异,难以相互比较。 世界上目前商业应用比较成功的有,a v i 技术的领先公司之一以色列的 h i t e c hs o l u t i o n s 公司,提供从车辆到集装箱号码识别的一系列解决方案,已投 入商用的产品如s e e c a r ,可以以每秒2 3 辆的速度在多种天气下进行高达 8 0 公里时速的汽车识别;美国的a l p h a t e c h 公司则因其a v i 产品容错性等方 面性能较强而得以在该领域站稳脚跟。据称,其在s k yh a r b o r 国际机场使用的 系统三年来每日进行4 0 0 0 0 起检测而从未发生过系统崩溃。我国香港的亚洲视觉 有限公司也能够针对中国的汉字车牌识别提供较为成熟的产品。 我国大陆地区,也有许多高等院校和商业公司进行该系统的研究工作和商业 开发。上海交通大学、西安交通大学等高校都有许多进行该方面研究的专家学者, 他们提出了许多新颖的研究思路和研究方法,特别是在汉字识别领域;上海、重 庆、深圳等地也有专门进行a v i 系统产品开发的公司企业,例如深圳科安信实业 有限公司开发的k c 9 9 0 0 车牌识别组件。但是由于该系统对准确性、实时性和鲁 棒性都要求很严格,所以我们尚未看到实际应用的例子。 趣 程 数 据 库 1 1 3a v i 系统的难点与关键问题 在a v i 系统的设计与实现中,车牌在原始视频图像中的定位以及车牌中字 符的分割是整个系统的难点和关键所在。 汽车牌照的快速准确定位是汽车牌照实时自动识别系统技术中非常关键的 一步,也是第一步。要从背景复杂的汽车图像中快速准确地将汽车牌照分割出来 是一件非常不容易的事情,这主要是要求定位分割算法对噪声、光照变化、牌照 缺损、倾斜及变形等情况不敏感。经典的算法包括从简单的灰度闽值方法、h o u g h 变换方法、频域和空域分割方法到复杂的连接元素分析方法。 现有的大部分o c r ( o p t i c a lc h a r a c t e rr e c o g n i t i o n ) 系统中,字符识别是对 单个字符而言的,所以字符的正确分割是o c r 技术的关键,分割的质量直接决 定识别率。大多数字符分割算法以垂直投影、字符间距或尺寸的测定、轮廓分析 或分割识别结合技术为基础。但是无论是打印或手写字体、扫描文本图像还是摄 像文本图像,都存在对断裂、粘连字符分割的困难。 1 2 智能方法在图像处理中的应用 1 2 1 人工神经网络 自6 0 年代以来,神经系统的实验研究证实了:抑制原理,感受野概念,皮 层的功能柱结构,信息处理的并行层次化观点是神经系统信息处理的普遍原则, 符合人类视知觉的规律,这些成果从神经生理学和脑科学方面对涉及视觉处理的 神经网络计算机系统提供了依据和启示。视觉信息处理需要非确定性推理和大规 模计算量,这正是具备自适应、自组织、自学习功能和并行分布式结构的神经网 络的优势所在,也与生物感知觉过程在一定程度上具有相似性。因而开发反映视 觉信息处理特点的神经网络模型与算法,对求解图像处理中长期存在的难题具有 很大潜力。 近年来,神经网络在图像分割、模式识别等图像处理领域中已得到广泛应用。 包括k o h o n e n 网络、h o p f i e l d 网络、c n n 网络、b o l t z m a n 机、条件约束网络等 模型都被用于解决噪声情况下简单图像的分割问题;而b p 网络、r b f 网络、e l m a n 网络等被证明在光学字符识别( o c r ) 系统中有广阔的应用前景。 1 2 2 模糊理论 模糊集合论是一门新兴的学科,从1 9 6 5 年美国l a z a d e h 教授提出第一篇 开创性论文一模糊集合至今,还只有短短的3 7 年的时间,却已经取得了举 绪论 世瞩目的进展,应用的触角已伸向工程技术、生态环境、社会经济等领域的许多 方面,发展速度超过了许多应用数学的分支学科。 模糊性作为一种基本事实而客观存在着,它的根源在于客观现象、概念在共 维条件下的差异之间存在着中介过渡,存在着亦此亦彼性。如果说,在过去的科 学发展长河中,人们可以回避模糊性而运用经典数学,那么,在今天即将跨入 2 1 世纪的科学发展中,人们就再也无法回避模糊性了。这是模糊集合论新学科 产生的历史必然性。 模糊集合理论能较好地描述人类视觉中模糊性和随机性。在模式识别的各个 层次都可以使用模糊集合理论,如在特征层,可将输入模式表达成隶属度值( 某 些性质的拥有程度) 的矩阵;在分类层,可表达模糊模式的多类隶属度值并提供 损失信息的估计。模糊集合理论主要可解决在模式识别的不同层次由于信息不全 面,刁i 准确,含糊,矛盾等造成的不确定性问题。基于模糊集合的概念,人们已 提出一些新的图像分割算法,并特别在医学图像分析中得到了较多的应用。本文 介绍了模糊集合在图像分割中的应用。 1 3 课题的研究工作 1 3 1 构造趟厂i 系统 根据我们的构想,a v i 系统完成车牌识别的任务,主要面向高速公路、自动 停车收费站等应用,能够从静态图像中检测出车牌号码,完成从车牌图像到车牌 号码简单字符串的高度信息提取,并能够对其进行适应客户需求的图像回放、检 索等功能的基本应用。系统框图如图1 2 所示。 图1 2 系统构成框图 绪论 图1 2 中,已经标出了大致的信息流程,共分为六个步骤。系统的初始状态 处于待机状态。当有车通过闸道口时,首先由埋在路下的探测线圈发现,并随即 向主机发出“有车到达”的信号,这是第一步。 主机收到信号后,立即向图像采集卡和摄像头发出命令,请求拍照。图像采 集卡通过摄像头将获取照片以一定的图像格式( 本文为j p e g 格式) 送给主机, 这分别是第二和第三步。 获取既定格式的图像数据后,主机以此图像数据为参数,调用图像分析程序, 返回值中包括是否分析成功以及识别出的牌照号码,这是第四步和第五步。因为 关键的处理均在此图像处理程序中进行,所以本文称为“核心算法”,调用该核 心算法所用的时间就是此核心算法的效率,这是本文所关心的主要内容,也是本 文要做的主要工作。 第六步是数据入库操作。无论前面的核心算法分析是否成功,都要进行入库 操作。若分析成功,则将汽车通过时间、分析出的牌照号码以及由此牌照号码所 得到的汽车型号、应缴和剩余费用等相关信息送入数据库中,否则图像数据按既 定文件格式存盘,然后将文件名、通过时间等信息存入数据库中。 1 3 2 本文的研究框架 由于摄像机的性能、车牌的整洁程度、光照条件、拍摄时镜头与车牌的角度 及车辆的运动等因素的影响使车牌中字符可能较严重的模糊、歪斜、缺损或污迹 干扰,这给识别带来了困难。这也是本文在本系统中着重致力于解决的问题和技 术难点。 本文主要针对a v i 系统中的车牌定位和字符分割部分进行研究。首先介绍 了有关图像处理的基本知识,包括边缘检测、h o u g h 变换、图像平滑处理技术以 及应用神经网络的图像分割方法,为此后的定位算法的图像预处理提供了方法; 在第二章的车牌定位算法研究中,介绍了我们尝试过的两种定位算法,分别是: 基于传统h o u g h 变换的车牌定位算法、基于对称h o u g h 变换的车牌定位算法, 实验证明后种方法在降维的同时,提高了定位的准确度和鲁棒性;第三章提出 了基于模糊测度的图像二值化方法,实验结果证明了该方法的有效性;第四章研 究字符分割方案,利用字符的垂直投影特征,采用改进的最大宽度回溯方法进行 分割;最后一章对本文进行了总结和展望。 图像处理预备知识 第二章图像处理的基本理论和方法 2 1 边缘检测算子 2 1 1 图像边缘分类 图像处理中,边缘的检测常借助空域微分算子进行,通过将其模板与图像卷 积完成。两个具有不同灰度值的相邻区域之间总存在灰度边缘,灰度边缘是灰度 值不连续的结果,这种不连续常可以利用求导数方便的检测到。一般常用一阶和 二阶导数来检测边缘,其原理可借助图2 1 来说明。 图像 剖面 一阶导数 二阶导数 口一一 十小廿v ( a )( b )( c )( d ) 图2 1 边缘和导数示例 图2 1 中第一排是一些具有边缘的图像示例,不同的深浅代表不同的灰度。 第二排是沿图像水平方向的一个剖面。第三和第四排分别为剖面的一阶和二阶导 数。常见的边缘剖面有三种:阶梯状( 如图2 1 ( a ) 和( b ) 所示) ;脉冲状( 如 图2 1 ( c ) 所示) ;屋顶状( 如图2 1 ( d ) 所示) 。本文研究的车牌边缘剖面属于 第三类。阶梯状的边缘处于图像中两个具有不同灰度值的相邻区域之间,脉冲状 主要对应细条状的灰度值突变区域,而屋顶状的边缘上升下降沿都比较缓慢。描 述边缘主要有五个参数:位置;朝向;幅度;均值:斜率。 下面分析导数与边缘的关系。在图2 1 ( a ) 中,灰度值剖面的一阶导数在图 像由暗变明的位置处有一个向上的阶跃,而在其它位置都为零。这表明可用一阶 仓 几十v r 蚴 f ( x ,j ,) , 其它 式中t 就是规定的非负阈值。这个表达式的物理意义是:当一些点和它的邻 图像处理预缶知识 域内的点的灰度的平均值不超过规定的阈值,时,就仍然保留其原灰度值不变: 如果大于阈值r 就用它们的平均值来代替该点的灰度值。这样就可以大大减少模 糊的程度。 2 3 2 低通滤波法 这是一种频域处理方法。在分析图像信号的频率特性时,一幅图像的边缘、 跳跃部分以及颗粒噪声代表图像信号的高频分量,而大面积的背景区则代表图像 信号的低频分量。用滤波的方法滤除其高频部分就能去掉噪声,使图像得到平滑。 由卷积定理可知, g ( u ,v ) = h ( u ,v ) f ( u ,v ) ( 2 1 3 ) 其中f ( u ,v ) 是含有噪声的图像的傅立叶变换,g ( u ,v ) 是平滑处理后的图像的 傅立叶变换,n ( u ,v ) 是传递函数。选择传递函数1 4 ( u ,v ) 使得高频分量得到衰减, 得到g ( u ,v ) 后,再经傅立叶逆变换就可以得到所希望的平滑图像。根据前面的分 析,h ( u ,v ) 显然要具有低通滤波特性,所以这种方法称为低通滤波平滑处理。 低通滤波平滑处理流程图如图2 7 所示。 血虬叵p 心医一叵p 五如 图2 7 线性滤波器处理框图 常用的滤波器传递函数h ( u ,v ) 主要有以下几种 ( 1 ) 理想低通滤波器 1 1 h ( ) 2 o d ( “,”) d o ( 2 1 4 ) d ( u ,v ) d o 式中d 。是一个规定的非负量,叫做理想低通滤波器的截止频率。d ( u ,v ) 是 从频域的原点到( “,v ) 的距离。即, d ( u ,v ) = 阻2 + v 2 】1 7 2 ( 2 1 5 ) h ( u ,v ) 对“,v 来说是一幅三维图形。h ( u ,v ) 的剖面如图2 8 所示。将此剖 图像处理预备知识 面绕图中纵轴旋转3 6 0 。就可以得到整个滤波器的传递函数。 图2 8 理想低通滤波器传递函数径向剖面图 ( 2 ) b u t t e r w o r t h 低通滤波器 一个n 阶b u t t e r w o r t h 低通滤波器的传递函数由式( 2 1 6 ) 表示 啪) 2 砑l 1 + 二望2 1 “ 式中d o 为截止频率,d ( u ,v ) 的值由式( 2 1 5 ) 决定。 b u t t e r w o r t h 低通滤波器h ( u ,v ) 的剖面图如图2 9 所示。 h ( u ,v 1 0 d ( u ,v ) d o 图2 9b u t t e r w o r t h 低通滤波器剖面图 ( 3 ) 指数低通滤波器 在图像处理中常用的另一种平滑滤波器是指数低通滤波器。 如下式表示: 日( 州矗掣】” ( 2 1 6 ) 它的传递函数 ( 2 1 7 ) 式中d o 为截止频率,n 是决定衰减率的系数,d ( u ,v ) 的值由式( 2 1 5 ) 决定。 指数低通滤波器h ( u ,v ) 的剖面图如图2 1 0 所示。 图像处理预备知识 h ( u ,v 1 o d ( u ,v ) d o 图2 1 0 指数低通滤波器传函径向剖面图 ( 4 ) 梯形低通滤波器 梯形低通滤波器传递函数的形状介于理想低通滤波器和具有平滑过渡带的 低通滤波器之间。它的传递函数由式( 2 1 8 ) 表示: h ( u ,v ) = 1 ,d ( “,v ) d 1 其中d ( u ,v ) 由式( 2 1 5 ) 计算,规定d o d l 。把传递函数的第一个转折点d o 定义为截止频率;d ,可以任意选取,只要大于d o 就可以了。梯形滤波器传递函 数的剖面图如图2 1 1 所示。 h ( u ,v ) 1 图2 1 1 梯形滤波器传函剖面图 用低通滤波器进行平滑处理可以使噪声伪轮廓等寄生效应减低到不明显的 程度,但是由于低通滤波器对噪声等寄生成分滤除的同时,对有用高频成份也滤 除,因此这种去噪的美化处理是以牺牲清晰度为代价而换取的。 本文在后面对拍摄到的原始图像进行去噪处理时,使用了上述介绍的邻域平 均法,并且采用了阈值来减少图像模糊。 图像处理预备知识 2 4 基于神经网络的图像分割方法 狄度图像分割是图像分析与理解的一个最关键的课题。只有将图像分割为若 干有意义的区域以后,我们才可以建立对图像的理解和表达。图像分割是计算机 视觉系统的关键操作,其处理效果直接影响景物理解的准确性,在生物神经系统 中相当于视觉感知过程,被称为预注意( p r e a t t e n t i v e ) 操作。 2 4 1 神经网络用于图像分割的建模策略 图像分割在本质上是将空域象素聚类成满足一定均匀性的区域,从视觉特性 角度看,这些区域应满足连续性( c o n t i n u a t i o n ) 、贴近性( p r o x i m i t y ) 和封闭性 ( c l o s u r e ) 三个基本度量。 近年来,神经网络在图像分割中已得到广泛应用。针对视觉信息处理特点, 图像分割的神经网络建模策略可归纳为: ( 1 ) 并行层次化网络结构; ( 2 ) 自学习、自组织和自适应机制; ( 3 ) 网络层结点的递归选择机制; ( 4 ) 有效的系统收敛性; 通过这四个性能的考察,建造非监督图像分割的神经网络模型,不仅可以使 图像分割技术具备较强的适应性和鲁棒性,而且有助于泛化的神经网络分割理论 的形成。 2 4 2k o h o n e n 自组织模型用于图像分割 自组织的含义是指在不知道有关输入数据任何信息结构的情况下,学习输入 数据结构的一种能力,它是人类视觉系统感知方法的基本原理。1 9 8 1 年,t k o h o n e n 提出了自组织特征映射( s e l f - o r g a n i z i n gf e a t u r em a p p i n g ,s o f m ) 网络 模型,该模型由输入一输出两层神经元构成,输入节点到输出节点全连接,输出 节点之间局部连接。网络功能是通过自组织方法用大量样本训练数据来调整网络 权值,使最后网络输出能反映样本数据的分布情况。神经元之间的连接权值具有 一定的分布,最邻近的神经元相互激励,较远的神经元之间相互抑制,更远的神 经元之间又有较弱的激励作用。在受到外界的刺激时,在刺激最强的地方形成一 个鼓泡( 墨西哥草帽) 。 鬯堡竺堡蔓鱼塑塑 图2 1 2k o h o n e ns o f m 网络拓扑结构 在墨西哥草帽区域中,神经元的权向量会自动调节到与输入模式向量的某一 主分量方向重合。所以s o f m 是一种无导师的聚类方法。与传统聚类方法相比, s o f m 所形成的聚类中心能保持特征空间的拓扑不变性。s o f m 网络可用作自联 想最近邻分类器,能将任意连续模式4 = j ,d ! ,口:) ,( = 1 , 2 ,m ) 2 z ) f f c z p 类。 s o f m 网络用竞争学习规则脱机学习,按离散时间方式运行。图2 1 2 为该网络 的拓扑结构,其中l a 层的月个单元对应于以的n 个分量,而层的p 个单元对 应于输入模式的p 个分类。输出层的各单元对输入模式响应的竞争是通过侧抑制 实现的。 s o f m 学习过程如下: ( 1 ) 将l 层到层间连接权值赋以 0 ,1 】间随机数; ( 2 ) 令如层单元对应的连接权值向量为,对于每个输入模式 a ( k = 1 , 2 ,? f i t ) 做如下操作: ( 2 1 ) 求( ,= 1 ,2 ,p ) 中与a k 距离最小的连接权值向量,有 一l i :h 矗n 一岷| | ( 2 1 9 ) j = l ( 2 2 ) 定义单元g ( 优胜者) 及其邻域g ( f ) ,将g ( r ) 中各单元对应的连 接权值向量向a 靠拢,其学习方程为: 阡0 = 口o ) d ? 一阡0 ( 2 2 0 ) w 图像处理预各知识 这里n 。( ,) ,且f - 1 , 2 , 。a ( t ) 是时刻f 的学习率,o a ( t ) l 口 ( 4 1 8 ) ( 4 1 9 ) 0 9 2 5 5 ,由此灰度拉 爿f 口 i b ( 4 2 0 ) b f 口 ( 4 2 1 ) ( 4 2 2 ) f g ( f ) i f b b ( ) 2 塑1 + 型b ,f 舶 6 , ( 4 2 3 ) i 十廿,z ,d b ,贝1 j a j = l 为j + 1 个字符的左边界,重复以上步骤,至车牌右边界位置。 其流程图如图5 3 所示。 i 确定平均字高 l 字符左右边界污点处理 i 搜索字符的左右边界 l 相连字符的切开 l 左右分离的字的合并 图53 算法流程图 上述算法仅仅找到字符的左右边界,由于车牌内字符都在一行,所以左右边 界的确定是最重要的。 但是,为防止个别字符在纵向( 上下方向) 存在偏移,本文也对纵向进行处 理,具体做法为:首先,规定一个偏移范围,我们取字符高度的1 5 。然后,对 字符c h a r ,从已知的车牌上边界进行扫描,若存在黑象素( 第四章我们已经规 定字符为黑象素,车牌背景为白象素) ,说明此字符c b a r 在纵向存在扩展,应在 字符分割算法研究 偏移范围内进一步向上查找上边界,若找不到,则不进行替换,若找到了,则用 新的上边界代替车牌上边界;否则,说明该字符在纵向存在收缩,应在偏移范围 内进一步向下查找其上边界,以确定是否需要替换。对下边界的确定也用类似的 方法。 对于数字“1 ”,因为其字符宽度很小,用上述步骤进行处理,可能被认为是 干扰而被忽略,所以我们选择特别处理。当检测到的字符宽度是字符高度的一半, 且笔划垂直没有环圈,我们认为检测到字符“1 ”。 5 4 实验结果 我们取上一章进行闽值化后的车牌图像进行字符分割。取字符最大宽度 = 5 0 ,回溯范围d = 1 3 。实验结果如图所示。 侧浏目曰| 日 蚓吲 图5 4 图4 2 ( d ) 的分割结果 番j i i lw l dl 园曰 图5 5 图4 4 ( d ) 的分割结果 4 7 结束语 第六章结束语 智能方法包括神经网络、模糊方法、遗传算法等内容,是解决非线性问题的 有效工具。本文提出的车辆自动识别( a v i ) 系统是实现交通智能化的一个重要途 径,其中基于视频图像的识别,受天气变化、车牌安放、车牌整洁程度等因素影 响,情况十分复杂,这就增加了系统实现的难度。作为识别前期处理的车牌定位、 车牌阂值化分割以及字符分割步骤都是十分关键的问题,所以我们对这些问题进 行了研究,以期找到最佳方案。 本文的创新点在于: ( 1 ) 将对称h o u g h 变换应用到车牌定位问题的研究中,克服了传统h o u g h 变换在检测矩形等图形时参数维数过高以及运算速度慢的缺点,而且该 方法有较强的鲁棒性。 ( 2 ) 利用基于模糊测度的阈值选取方法,并进行了灰度拉伸和光滑预处理以 适应光照变化的环境,可以去除可能对字符分割及识别产生影响的小噪 声,实验表明该方法的有效性。 作为一个系统,本文尚未涉及字符识别问题,这是下一步我们要进行的研究 工作之一。在上述研究过程中,我们发现阈值化处理对光照不充分的车牌进行类 似增强的处理效果,但是阈值化处理又是产生字符粘连和断裂的重要原因之一, 阈值较低可能造成断裂字符,高阈值又可能产生粘连字符。所以,直接利用原灰 度图中的大量信息进行字符分割将大有前途,也是我们今后要继续研究的内容。 一一 至耋塞燮 参考文献 【1 】k e n n e t hrc a s t l e m a n d i g i t a li m a g ep r o c e s s i n gp r e n t i c e h a l l i n t e r n a t i o n a l , i n c2 0 0 1 f 2 】h o u g bpvcm e t h o d sa n dm e a n sf o rr e c o g n i z i n gc o m p l e xp a u e r n s u sp a t e n t3 0 6 9 9 5 4 1 9 6 2 【3 】3 l e iy w ,w o n g kc e l l i p s ed e t e c t i o nb a s e do ns y m m e t r yp a t t e r nr e c o g n i t i o nl e t t e r s 1 9 9 9 ,2 0 ( 1 ) :4 1 4 7 4 】k a p u rj n ,s a h o op k an e wm e t h o df o rg r a y - l e v e lp i c t u r et h r e s h o l d i n gu s i n gt h e e n t r o p yo f t h eh i s t o g r a m c o m p u t e rv 妇i o n ,g r a p h i c s , a n d i m a g e p r o c e s s i n g ,1 9 8 5 ,2 9 : 2 7 3 - - 2 8 5 5 】l i a n g k a ih u a n g ,m a n j i u nj w a n g i m a g et h r e s h o l d i n gb ym i n i m i z i n gt h em e a s u r e so f f u z z i n e s s p a t t e r n r e c o g n i t i o n , 1 9 9 5 ,2 8 ( 1 ) :4 1 5 l 6 】s a h o opk ,s o l t a n is ,w o n ga k c ,c h e nyc 。as u r v e yo ft h r a s h o l d i n gt e c h n i q u e s c o m p u t e rv i s i o n , g r a p h i c s , a n d i m a g e p r o c e s s i n g , 1 9 8 8 ,4 1 :2 3 3 2 6 0 7 a h m e ds a b u t a l e b a u t o m a t i ct h r e s h o l d i n go fg r a y - l e v e lp i c t u r e su s i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论