版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 2007年第 31卷第 5期 (301期 电视技术文章编号 :1002-8692(2007 05-0088-03车辆牌照字符识别算法的设计张谢华 1, 2, 张申1(1. 中国矿业大学 信息与电气工程学院 , 江苏 徐州 221008; 2. 徐州师范大学 现代教育技术中心 , 江苏 徐州 221116 【摘 要 】 对当前典型的车辆牌照字符识别算法进行了研究和分析 , 在此基础上提出一种新型算法 , 通过提取一些具有表征性的字符结构特征构建合理的判决树进行有效识别 。 采用车牌识别系统中分割出的一些数字和字母进行识别仿真 , 实验结果表明该算 法简单 、 快速 、 高效 , 在复杂的噪声环
2、境下同样具有较高的识别率 。 【关键词 】 车牌字符识别 ; 结构特征 ; 判决树 【中图分类号 】 TP391.41【文献标识码 】 B Research of Algorithm for Recognition of Characters on Vehicle License PlateZHANG Xie-hua 1,2, ZHANG Shen 1(1. School of Information Electronic &Engineering Institute, China Univ of Mining &Tech, Jiangsu Xuzhou 221008, Chi
3、na ;2. Morden Education Technology Center, Xuzhou Normal Univ, Jiangsu Xuzhou 221116, China 【 Abstract 】 Based on the analysis and comparison of current popular vehicle plate character recognition methods, we propose anovel algorithm, which extracts some discriminative structure features of characte
4、rs, and constructs a rational decision tree to per-form effective recognition.The results of recognition simulation on numbers and characters extracted from vehicle plate recognitionsystem prove that the algorithm is simple and efficient, and has high recognition rate even in noisy environment.【 Key
5、 words 】 vehicle license plate characters recognition; structure feature; decision tree1引言车辆牌照自动识别系统是图像模式识别领域的一个经典课题 1。 系统涉及到车牌定位 、字符分割和字符识别 3种关键技术 。字符识别是整个系统的核心 。 当前常用的 方法主要有基于神经网络 、 基于模板匹配 、 主分量分析 等 。 在其实际应用中 , 最为关键的问题是字符特征的选 择 , 如果特征选择不具有很好的区分度 , 不仅特征维数较 大而且还很难获得较好的识别效果 。字符识别的方法很多 , 主流方法有 3大类 :采用
6、基 于 模 板 匹 配 的 OCR 算 法 2、基 于 人 工 神 经 网 络 的 OCR 算法 3以及主分量分析 OCR 算法 4。模板匹配算法主要通 过使用相应字符特征来构建字符的特征向量 , 通过比对 模板特征向量和待选字符特征向 量之间的距离进行匹 配 , 这类方法只有找到了准确的字符特征描述方法 , 才能 较好地识别出相应的字符 , 而常用的字符特征包括字符 像素点值 、 字符边界有向链表 、 字符笔画 、 字符拐点等 , 这 些特征虽然可较好地表示字符 , 但同时也非常易受到噪 声干扰 , 鲁棒性不够 。利用神经网络进行识别是目前应用最广泛的一种基 于机器学习的识别方式 , 为保证
7、高识别率 , 神经网络需要 使用大量样本进行训练 , 而样本的收集和选取大大增加 了这类系统的局限性 , 且神经网络本身对有噪声和变化 较大的样本训练集难以适应 , 易陷入局部最优出现 “ 过拟合 ” (Over fitting 现象 。 同时 , 神经网络训练时能否收敛 , 以及收敛的最终状态与初始设置关系相当大 , 不同的神 经网络层次结构获得的效果也不同 , 稳定性也不够 。 此 外 , 神经网络对于样本的特征选择也非常敏感 , 样本的特 征要求能尽量稳定地描述样本的本质 , 不仅要有稳定性 也要有区分度 。 在以往的一些神经网络系统中 , 提取字符 特征时往往忽略了一些字符结构特征的不
8、变性 , 将整个 字符以一个庞大的二进制矩阵形式提供给分类器 , 造成 样本特征变化较大 , 无法得到较好的训练效果 。主分量分析法往往需要配合分类器一起使用 , 它能 将高维的特征数据映射到相互正交的特征空间中去 , 并 选择其中能量最大的特征量来表征和区分样本 , 它对于 特征的优化和选择具有很重要的意义 。 但这类算法需要 给样本建立高维的特征空间 , 如果特征空间过低则会降 低特征选择的效果 , 也不利于分类 。针对以上字符识别方法的不足 , 笔者提出一种基于结 构统计特征的新型字符识别算法 , 创新性地定义和使用了 字符占空量 、 边缘重心等字符结构的统计特征 , 构建了字 符识别判
9、决树 , 针对车牌识别系统中分割出的字符设计了 最有区分度的一些统计特征用于识别 , 在不使用或者很少 使用样本进行训练的基础上就能对字符较好进行识别 。2字符特征的选择车辆牌照字符识别系统在对字符识别之前需进行一 实用设计 VIDEO ENGINEERINGNo.52007(No. 301图 3轮廓信息定义些必要的预处理工作 , 以去除一些噪声的影响 , 实现字符 的矫正和分割 5, 具体流程如图 1所示 。经过一系列的预处理过程 , 可将字符从目标车辆上分割出来用于识别 。 为此 , 笔者设 计出最具有表征性的一些字符特 征 , 其具体定义如下 :1 边缘数指一个字符的边缘连通轮廓 的数目
10、 , 如字符 6的边缘数为 2, 如图 2所示 。2 边缘重心边缘重心针对边缘数为 2的字符 , 其实质是分别计 算两个边缘顶端和底端的 Y 坐标 , 分别记为 y TopEdge1, y BottomEdge1,y Top Edge2, y BottomEdge2, 再求这两个边缘的顶端和底端的差分 D Top =y TopEdge1-y TopEdge2; D Bottom =y BottomEdge1-y BottomEdge2。定义边缘中心特征值为这两个参数的比值 , 当D TopBottom<1, 边缘重心在上半部 ; 当 DTop Bottom>2, 边 缘 重 心 在
11、 下 半 部 。 图 2中 , 由于 DTop Bottom >2, 所以字符 6的边缘重心在下 半部 。3 轮廓特征值首先分别定义如下 4个特征轮廓值 :左侧轮廓 (P L :P L (i =minx|P (x , y C , y=i, i=0, 1, , 43; 右 侧 轮 廓 (P R :P R (i =maxx|P (x , y C , y=i, i=0, 1, , 43; 顶部轮 廓 (P T :P T (j =miny|P (x , y C , x=j, j=0, 1, , 31; 底部 轮廓 (P B :P B (j =maxy|P (x , y C , x=j, j=0,
12、 1, , 31。为了描述轮廓的变化特征 , 定义 4个方向的一阶微 分 , 由于图像中微分 lim x 0f (x+! x -f (x , 其像素点是离散取值的 , 故 ! x 最小值为 1, 因此 , 微分常常表示为相邻位置 的差分 , 即 f (x+1 -f (x 。 因此 , 有 :D LP =P L (i+1 -P L (i , D RP =P R (i+1 -P R (i , D TP =P T (j+1 -P T (j , D BP =P B (j+1 -P B (j 。利用轮廓的一阶微分变化趋势定义构成字符轮廓的 基本单元 , 共分 5类 :左斜 (L 、右斜 (R 、 直线
13、(V 、 圆弧 (C 、 突变 (P 。 例如图 3, 字符 2 的顶部结构为圆弧 (C , 底部结构为直线 (V , 左侧结构为突变 (P 和左斜 (L , 右 侧结构为圆弧 (C 。4 占空信息主要利用轮廓特征计算字符图像 的顶部 、 底部 、 左侧 、 右侧以及左上 、 左 下 、 右上 、 右下 、 上左 、 上右 、 下左 、 下右共 12个区域的占空量 , 列于表 1中 。 表 中 , top , bottom , left , right 分 别 指 图 像 中 字 符 的 最 上 、 下 、 左 、 右端所在的行或列 。5 笔划数主要采取对字符某一位置的上下或左右任 意画 直
14、线 , 检查其经过白色区域的次数 。 例如对字符图像 C 和 E 分别在第 15列画一条直线 , 可以得到 C 的第 15列 笔划数为 2, E 的第 15列笔划数为 3。 6 投影主要对字符进行竖直或水平投影 , 统计不同位置的 投影量 。 例如 , 字符 7 的水平投影 , 上半部分有一段投影 很大 , 而下半部分投影小且基本不变 。7 最长线主要是计算竖直或水平方向连通区域的白线长度 , 然后找出其中最长的一条 , 可在整幅图像找也可在某个 区域找 。8 面积比计算某一区域内的字符所占面积比 , 主要是区分 0 ( O , D , Q , 4 和 A 等这类的字符 。 在求面积时 , 需
15、对白色连通区域包含的黑色区域进行填充 。3字符识别根据上节中所提出的字符结构特征 , 可构建一个较为合理的如图 4所示的判决树 , 并利用判决树分析每个 分割出来的字符具体是哪个字符 。图 1车牌识别系统图像预处理过程图 2字符边缘信息表 1占空量信息位置占空量信息位置占空量信息左侧 S L =" P L (i top i bottom 右侧 S R =" (32-P R (i top i bottom 顶部 S T =" P T (j left j right 底部 S B =" (44-P B (j left j right 左上S LT =&quo
16、t; P L (i top i 21右上 S RT =" (32-P R (i top i 21左下 S LB =" P L (i 22 i bottom 右下 S RB =" (32-P R (i 22 i bottom 上左S TL =" P T (j left j 15下左 S BL =" (44-P B (j left j 15上右 S TR =" P T (j 16 j right下右S BR =" (44-P B (j 16 j right图 4字符特征判决树89 2007年第 31卷第 5期 (301期 电视技
17、术下面 , 以字符 2 的识别 过程为例具体描述判决的过 程 :1预处理后的字符图像如图 5所示 。2 特征提取获得如表 2所示信息 。3 字符识别 如下 :第一级判断 :由表 2得字符 2 的 边 缘 数 为 1, 判 决 域 缩 小 为 : 2,3, 5, 7, C , E , F , G , H , J , K , L , M , N , S , T , U ,V , W , X , Y , Z ; 第二级判断 :由表 2得字符 2 的 左 侧 轮 廓 和 右 侧轮廓突变 , 判决 域 缩 小 为 : 2, 3,5, C , E , F , G , S , V , W , X , Y ,
18、 Z ; 第三级判断 :由表 2得字符 2 的占空信息 , 判决域 进一步缩小为 : 2, G , X ; 第四级判断 :由表 2得字符 2 在下半部分最长线为 32pixel , 而字符 G 和 X 的最长线不可能超 过 整 个 字 符图像宽度的一半 (即 22 , 所以通过对比确定最后的输 出结果为 2。 4实验结果与结论本文对 300个定位车牌中正确分割的 1800个数字与字母进行识别 , 在 P42.80GHz , 内存 512Mbyte 的机 器上使用 VC+6.0编译环境 对算法进行了程序仿真 6, 所 得 结 果 为 :1758个 字 符 识 别 正 确 , 34个 字 符 识
19、别 错 误 , 8个字符无识别结果 ; 识别准确率为 97.67%; 识别平 均速度为 6字符 /20ms 。 同时在不加入噪声因素情况下 , 使用基于像素信息的 BP 神经网络系统对相同字符图像 进行识别 , 效果如图 6所示 , 识别率与样本数目具有非常 显著的关系 。 再对上述同一组样本加入不同强度的噪声 (060dB , 比较本算法和神经网络的性能差别 , 效果如 图 7所示 。 可见本算法明显优于样本训练较少的神经网 络系统 , 与样本训练较多的神经网络相比 , 在一定信噪比 的条件下系统具有较好的抗噪性能 , 在噪声环境中性能 得到很好体现 。本文采用的字符识别方法既保证了识别的高
20、准确率和速度 , 同时又不需要机器对字符进行大量样本训练 。 但 该方法对某些结构非常相似的字符如 0 和 O , 1 和 I , 8 和 B 等识别效果有时不是很理想 。 因此 , 今后将 对这些较难识别的字符作进一步研究 。5小结实验表明 , 在不需样本训练的情况下就能达到较高的识别率 , 同时这些特征对环境的适应性和抗噪性能也 十分显著 。 参考文献1PARIST R.Car plate recognition by neural networks and imageprocessing C/Proc.of IEEE International Symposium on Circuits and Systems.S.l.:IEEE Press, 2000.2张珂 , 毛峡 . 机动车牌照自动识别技术的研究 J. 计算机应用研究 , 2005, 22(12 :163-164.3杨凡 , 赵建民 , 朱信忠 . 一种基于 BP 神经网络的车牌字符分类识别 方法 J. 计算机科学 , 2005, 32
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 咨询合同解约协议
- 2024年全球电子产品购销合同范本
- 2024年专业软件开发服务合同
- 律师事务所劳务派遣合同
- 2024年居民小区快递柜使用合同
- 2024年专用抗裂砂浆隔热材料购销合同
- 2024年农资产品订购合同范例
- 钱包特许经营合同
- 酒店客房防疫管理制度
- 2024年工业厂房改造装修工程施工合同
- 毛泽东思想和中国特色社会主义理论体系概论(复旦大学)智慧树知到课后章节答案2023年下复旦大学
- 22.第10课第2框课件《促进文化交流文明互鉴》
- 2021全国农民科学素质网络知识竞赛题库及答案(应急避险276题)
- Stable-Diffusion基础知识和概念
- 人教版小学数学六年级上册第四单元《比》作业设计
- GB 1886.370-2023食品安全国家标准食品添加剂辛烯基琥珀酸淀粉钠
- 大学信息设备和存储设备保密管理办法
- 橡胶部分作业指导书
- (完整)仪表检修规程(DOC)
- 采用新技术、新工艺、新材料、新设备的安全管理措施
- 膈肌保护性通气策略专家共识
评论
0/150
提交评论