版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于BP神经网络的车牌识别技术研究摘 要 随着科学技术的不断发展,交通管理手段正从人工管理逐步转变成自动或半自动方式,车牌识别问题作为现代交通工程领域中研究的重点和热点问题之一,受到越来越多人们的关注。近年来,神经网络在许多领域中得到应用,利用神经网络自适应的特点,本文采用基于BP构成的神经网络进行字符识别。本文通过对在车牌识别系统中图像预处理、车牌定位、字符分割、字符识别四个关键环节的分析研究,提出了一种基于神经网络的车牌字符自动识别算法。用此方法对车牌图像进行实验,对车牌字符样本进行特征提取,并且在MATLAB环境下对车牌字符识别进行仿真模拟,结果证实此算法对车牌字符的定位和分割具有良好的
2、效果,对车牌字符的识别具有一定的准确性。关键词:BP神经网络;车牌定位;车牌识别;字符分割;字符识别1. 引言随着汽车数量的增加,使得世界各国都存在着交通拥挤的城市状况。为了解决这一问题,众多城市将车道拓宽,但仍远远不能解决问题,在不增加现有的道路设施情况下,如何提高交通运输效率已成为世界各国研究的焦点。智能型交通体系(ITSIntelligent Transportation System)是未来交通监管系统的主要发展趋势。车辆牌照识别技术(LPRLicense Plate Recognition)又是ITS中的核心技术之一。因此研究与开发车牌识别系统对于我国交通管理领域的发展具有重要实用价
3、值。 目前的车牌识别系统还存在着很多不足。识别率还不可能做到百分之百,但随着研究的不断深入,车牌识别技术肯定会逐步走向成熟。现代智能交通的发展,使其具有巨大的应用潜力,更广阔的市场。与此同时,神经网络在分类等问题中得到广泛应用,针对车牌识别问题,首先要找到车牌的一些特征,以及对应的评价数据,用这些数据来训练神经网络。由于人工神经网络具有并行处理、分布式存储与容错性等结构特点,因此被广泛应用于LPR系统中。结构上的并行性使神经网络的信息存储必然采用分布式方式,即车牌字符信息不是存储在网络的某个局部,而是分布在网络所有的连接权中。这些特点必然使神经网络在车牌识别的两个方面表现出良好的容错性: (1
4、)由于字符特征信息的分布式存储,当网络中部分神经元损坏时不会对车牌识别系统的整体性能造成影响。 (2)神经网络通过预先存储信息和学习机制进行自适应训练,可以从不完整的车牌信息和噪声干扰的车牌图像中通过联想恢复原始的完整记忆,从而实现对不完整输入信息的正确识别。 基于以上特性,人工神经网络应用于车牌识别系统具有很大的研究价值。2 bp神经网络原理简介 BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而
5、无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)。2.1 BP算法误差反向传播算法(BP算法)的学习过程,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理
6、过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。2.2 BP网络模型BP网络模型包括其输入输出模型、作用函数模型、误差计算模型和自学习模型。图2.1 BP神经网络模型(1) 节点输出模型 隐节点输出模型: Oj=f(Wij×Xi-qj) (2.1) 输出节点输出模型: Yk=f(Tjk×
7、Oj-qk) (2.2)其中,f-非线形作用函数;q -神经单元阈值。(2)作用函数模型作用函数是反映下层输入对上层节点刺激脉冲强度的函数又称刺激函数,一般取为(0,1)内连续取值Sigmoid函数: f(x)=1/(1+e) (2.3)(3)误差计算模型误差计算模型是反映神经网络期望输出与计算输出之间误差大小的函数: (2.4)其中,tpi- i节点的期望输出值;Opi-i节点计算输出值。(4)自学习模型神经网络的学习过程,即连接下层节点和上层节点之间的权重矩阵Wij的设定和误差修正过程。BP网络有师学习方式-需要设定期望值和无师学习方式-只需输入模式之分。自学习模型为: Wij(n+1)=
8、 h×i×Oj+a×Wij(n) (2.5)其中,h-学习因子;i-输出节点i的计算误差;Oj-输出节点j的计算输出;a-动量因子。3 车牌识别原理一个完整的汽车车牌识别系统的工作过程主要分为以下四个步骤4。如下图所示:车牌定位字符分割图像处理车牌识别识别训练图1 车牌识别主要步骤 (1)图像处理:无论对改善牌照图像的可辨认度,还是简化字符的定位与分割,图像转换及压缩,图像水平校正和图像增强处理都是很有必要的。(2) 车牌定位: 主要包括车牌图像的边缘提取与二值化,车牌水平方向的定位算法,车牌垂直方向的定位算法。最后确定车牌在整个图像中的相对位置,输出长方形车牌图
9、像。(3)字符分割:利用像数累积检测的字符定位分割方法得到单个的字符。(4) 字符识别:利用模板匹配的方法与神经网络数据库中的字符进行匹配从而确认出字符,得到最后的汽车牌照,包括英文字母和数字。4. 系统设计与实现4.1 BP神经网络的建立BP网络是目前应用极为广泛的一种前馈神经网络,具有与人脑相似的高度并行性良好的容错性和联想记忆功能,自适应学习和容错能力都较强,由理论上的研究可知,具有单隐层的神经网络足够执行任意复杂的函数映射系统,因此我们选用具有一个隐层的三层BP网络来实现字符的识别。用人工神经网络进行字符识别主要有两种方法:一种方法是先对待识别字符进行特征提取,然后用所获得的特征来训练
10、神经网络分类器。识别效果与字符特征的提取有关,而字符特征提取往往比较耗时。因此,字符特征的提取就成为研究的关键。另一种方法则充分利用神经网络的特点,直接把待处理图像输入网络,由网络自动实现特征提取直至识别。在这里,我采用的是第二种方法来进行字符的识别。与模板样版进行计算寻找相关度最大的模块读入字符根据模块输出值 图4.1 字符识别的方法 神经网络的工作方式,由两个阶段组成:(1)学习期: 神经元之间的连接权值可由学习规则进行修改,以使目标函数达到最小。汽车牌照的字符一般有七个,大部分车牌第一位是汉字,通常代表车辆所属省份,或是军种、警别等有特定含义的字符简称;紧接其后的为字母与数字。车牌字符识
11、别与一般文字识别在于它的字符数有限,汉字共约50多个,大写英文字母26个,数字10个。所以建立字符模板库也极为方便。 本次识别的车牌有汉字、字母和数字,但是数量不是很大,而且对于汉字来说就只有一个“苏”字。字母和数字是从网上收集到的经过PHOTOSHOP CS处理后得到的“数字”和“字母”集合,用来建立识别的模板库。库中包含的汉字有:“京”“浙”“苏”“豫”“辽”“陕”“鲁”,字母有:A-Z,数字的库有:0-9。(2)工作期: 本文采用隐藏层神经元数目为13,输出神经元数目为6的BP神经网络进行训练。连接权值不变,由网络的输入得到相应的输出。读入训练样本后根据程序进行神经网络的训练。用bp神经
12、网络进行训练,隐含层13个神经元,输出层6个神经元,训练步长2000,期望误差值0.0001,学习速率0.0003。训练过程见下图: 图4.2 训练误差曲线4.2 车牌定位 靠一种单一的传统车牌定位方法,很难在实际应用中,达到令人满意的效果。因此需要探索一种综合多种方法的新的车牌定位法,才能在实际应用中,达到预期效果。本文采用的是一种将顏色特征和纹理特征相结合的车牌定位法。 将汽车图像送入计算机,进行汽车图像的预处理,并根据牌照图像的颜色特征且结合车牌尺寸的先验知识在汽车图像中找到牌照所在的确切位置,然后分割出车牌的边框,得到精确的车牌子图像。车牌定位的过程如图4.3所示。 图4.3 车牌定位
13、过程(1)预处理: 在得到车辆图片后,首先对图像进行图像预处理。所做的工作为,调整图像的亮度和对比度,为后面的工作做准备。(2) 灰度图: 将图像转化为灰度图。得到灰度图以后,先进灰度拉伸,以提高图像的对比度,为下一步的灰度跳变做准备。(3) 粗定位: 利用车牌的特点,即车牌区的前景和背景有很强的反差和对比效果,在灰度图中的表现为在字符与背景边缘灰度值有很大的跳变(灰度值变化在50以上)。经实验发现,对灰度图进行水平扫描时车牌所在区域的灰度跳变次数明显高于非车牌区域5。利用这一特点,就可以粗略的确定车牌的水平区域,从而缩小搜索范围。从而可以稳妥的完成车牌的粗定位。上下边界定位具体步骤为: 从上
14、到下逐行扫描; 以灰度跳变次数最高的所在行为基准,向上、向下进行扫描; 如果灰度跳变次数小于某一阈值,则停止扫描。其所在的上下行,即为车牌的上下边界。 实现车牌区域上下边界定位后,还需进行左右定位。左右定位的方法步骤与上下定位的方法步骤基本类似:将上下定位后的灰度图,从左到右进行逐列扫描; 以灰度跳变次数最高的所在列为基准,向左、向右进行扫描; 如果灰度跳变次数大于某一阈值,则停止扫描。其所在的左右列,即为车牌的左右边界。(4)准确定位: 本文采用HSI颜色空间的理论5。HSI颜色空间是近似的均匀颜色空间,也就是说HSI颜色空间两点的欧式距离与人的感知程度近似成正比,相对于RGB空间,它更符合
15、人类的直觉感觉。其中的色度分量H反映颜色的本质特征,一般情况下不受光线的强弱的影响。经实验测试通常蓝色车牌得色度大于等于0.75,饱和度大于等于0.51。 依据灰度跳变扫描所得到的粗定位车牌区域,再结合HSI的颜色空间理论我们可以准确地找出车牌区域。图4.5为对图4.4中原图进行准确定位后得到的分割图。(5)二值化: 二值化处理利用图像中要提取的目标物体与背景之间灰度上的差异计算出一个阈值,用最大方差法计算出来的阐值把原始图像分为对象物和背景两部分:设图像f(x,y),其灰度级范围为Z1,Z2,在Z1,和Z2之间选择一个合适的灰度阐值t,则二值化后的图像f(x,y)可以表示为: (4.1)图4
16、.6为车牌定位图的二值化图像。 图4.4 原图 图4.5 车牌定位图 图4.6 二值化图像 4.3 字符分割字符分割有承前启后的作用。它在前期汽车牌照已经定位的基础上把所提取出的车牌区域图像分割成单个字符图像6。首先,需要写入车牌定位得到的二值图像,然后进行中值滤波,图像腐蚀,再进行下面的字符分割。实际拍摄的图像车牌有可能是歪斜的,这会导致分割后的字符边缘可能会有像素的冗余区域,分别寻找二值图像矩阵中行向量和不为0的上下边界;列向量和不为0的左右边界,从而分割出二值图像中的字符区域。(1)汉字分割:从字符区域左侧第一列向右寻找全黑的列,从而确定汉字的宽度,从字符区域分割出汉字,同时将原二值图像
17、汉子区域全部置零,并将边界为全黑的列去冗余。(2) 字母分割:从汉字切割后的二值图像边界像素去冗余后,从左侧第一列向右寻找全黑的列,从而确定字母的宽度,分割出字母区域。(3)数字分割: 从字母切割后的二值图像边界像素去冗余后,从左侧第一列向右寻找全黑的列,从而确定字母的宽度,分割出字母区域,依次分割出五个数字。分割结果如下: 图4.6 均值滤波后图像 图4.7 腐蚀后图像 图4.8 分割得到的单个字符4.4 字符识别 本文首先采用训练样本进行神经网络的训练,从而得到一个对牌照敏感的人工神经网络,然后利用训练好的神经网络检测处理后的汽车图像,识别车牌2。BP算法就是把一组样本输入输出问题转化为一
18、个非线性优化问题,并通过梯度算法利用迭代运算求解权值问题的一种学习方法。基于神经网络的字符识别算法一般包括以下四个步骤:(1) 对分割出来的字符样本进行预处理,对图像进行归一化大小为40*20;(2) 提取样本字符特征;(3) 将特征送到神经网络中训练,训练好的神经网络对特征敏感;(4) 将待识别字符预处理提取特征后送到训练好的神经网络中进行识别。 图4.9 检测结果 5 总结 基于图像处理的一些方法,结合具有良好学习能力和容错能力的神经网络,本文在速度上对算法进行了一些改进,用于对汽车照片中的牌照进行定位以及对牌照中的字符进行识别。另外对所给车牌进行了测试,从测试结果可知,对于字母的识别率大大低于数字。且形状相同的最容易识别错误,如A和4,8和B,D和0等由于其特征的相似性增大了辨别的难度。另一方面,由于时间和精力的有限,本文仅考虑图片中车牌为正的情形,若车牌倾斜则需要先校正,使得算法具有一定的局限性。如若有机会,会深入的对其进行研究,优化算法。参考文献1 傅德胜,范春年. 基于BP神经
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论