《纸币图像预处理的技术基础(5600字)》_第1页
《纸币图像预处理的技术基础(5600字)》_第2页
《纸币图像预处理的技术基础(5600字)》_第3页
《纸币图像预处理的技术基础(5600字)》_第4页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

纸币图像预处理的技术基础目录TOC\o"1-2"\h\u26213纸币图像预处理的技术基础 1140851.1数字图像基础 141701.2图像采集 2311061.3图像去燥 370261.3.1图像的噪声 399261.3.2中值滤波 3213931.4灰度化 4149231.5图像的倾斜矫正 7293121.6字模分割 8106591.6.1字符间隙法 8138581.6.2直方图投影法 8182691.6.3连通区域法 9189991.6.4三种字模分割法对比总结 10199611.7本章小结 111.1数字图像基础在机器视觉领域,图像是基本数据结构,其中数据通过图像捕获设备传输到计算机存储器。每个数据对应于一个像素,并且每个像素可以被视为能量收集的结果。在曝光过程中,该能量由传感器上的相应光敏单元累积,吸收光谱响应范围内的所有光能。由于不同类型的相机,黑白相机的每个像素收集的能量结果构成单通道灰度图像;RGB彩色摄像机有三个R,G和B通道,返回相应的三个像素。样本结果。类似地,由于在一些场中需要更详细的光谱采样,因此每个像素点对应于更多的能量样本。例如,HYDICE传感器的每个像素可以对应于210个光谱采样结果。因此,图像由单个通道或多个通道组成。在图像处理中,经常使用单通道灰度图像和三通道RGB图像。高通道可以转换为低通道,RGB图像可以通过将三个通道组合成一个通道转换为灰度图像,但灰度的计算公式对于不同的RGB空间是不同的,通用公式如下。Gary=0.299∗R+0.587∗G+0.114∗B图像处理中,常见的多通道模式包括HSV(表示色相、饱和度、亮度)、RGB(表示红、绿、蓝)、CMYK(表示青、洋红、黄、黑)、CIE-Lab等,每种模式的图像描述和重现色彩的原理及所能显示的颜色数量是不同的。综上所述,数字图像分为两大类,第一类是彩色图像与灰度图像;第二类是连续图像与离散图像。1.2图像采集在对图像进行预处理操作之前,首先要采集研究所要用到的图像样本,即是完成图像采集操作。美国的TeledyneDALSA是世界上一家技术一流的公司,他们主要致力于高性能数字成像设备和半导体器件的生产与制造。该公司利用其现有的高端CCD(ChargeCoupledDevice)和CMOS(ComplementaryMetal-OxideSemiconductor)芯片自主研发及生产能力,可对外销售各种线阵、面阵、TDI等不同系列的高速工业相机,其中面阵数字摄像机主要有Pantera系列,Falcon系列;线扫描数字相机主要有Piranha系列,Spyder系列,Eclipse系列等。以下是Falcon系列的一种成像相机,如图1所示。图1为Falcon系列工业相机一旦图像捕捉设备被设置,它可以被用于访问该图像。首先,把相机下方的区域被获取的图像的目标对象,然后手动设置在计算机上存储信息,并选择存储路径,最后保存我们需要的图像。当然,我们可以通过调整相机镜头适当的焦距,这样不仅可以收集到的图像信息是完整的,而且拍摄的图像可以更加清楚。图2就是通过此装置采集的一张彩色人民币图像。图2采集的彩色人民币图像1.3图像去燥1.3.1图像的噪声噪声可以被理解为防止一个人的视觉器官或系统传感器从理解或分析接收到的图像的源信息的一个因素。一般噪声是不可预测的随机信号,这只能通过概率统计是已知的。噪声对图像处理,其影响输入,获取,和图像处理的处理和输出的整个过程有很大的影响。如果输入的是坏的,它会通过一个大的噪声,这将影响到整个过程和输出陪同。因此,一个好的图像处理系统中,无论是模拟处理或计算机处理,所有将前级的噪声降低是一个重要的步骤。图像中的噪声的种类繁多,噪声对图像信号幅度和相位的影响也十分复杂。一般在图像处理技术中常见的噪声有:(1)加性噪声(2)乘性噪声(3)量化噪声(4)“盐和胡椒”(Saltandpepper)噪声此类噪声如图像闽值分割时引起的即黑图像上的白点,白图像上的黑点噪声:在变换域引入的误差,使图像反变换后造成的变换噪声等。对于人民币图像,在分割之后得到二值图上面有一些影响进一步识别的小点,这些小点可以看作椒盐噪声,应该去除。对于这类噪声最有效的去除方法就是中值滤波。1.3.2中值滤波中值滤波最早是由杜克提出。中值滤波是在空间非线性滤波算法的方法。它是基于统计原理的排序算法上是最有代表性的低通滤波器。该算法的主要功能是,不仅有力地消除噪音,同时也保护了图像的边缘,算法并不需要利用在计算图像的统计特性。因此,这种方法是在使用便利。该方法也被广泛使用,并且不仅可以一维图像的信号处理也能二维信号处理来施加。中值滤波的基本思想是将某个像素邻域内所有像素的灰度值,按照升序或降序重新排列,用这个排列中的中间值替换这个像素的灰度值,通过这样的方法就能去除噪声。这点和加权平均的平滑滤波方式有所不同。中值滤波不仅抚平一些图像噪音,而且不破坏要被处理的区域的图像的结构。这种滤波技术的优点是突出的,也就是说,它可以克服线性滤波器的缺陷,例如在平滑化处理中值滤波,而不模糊的图像的边缘或轮廓,并且该技术是用于脉冲干扰或图像。造成扫描噪音非常明显。这种技术也有其自身的缺点。对于具有多个点,线或毛刺的图像,该算法被用于处理,并且效果也很差。中值滤波器用于滤波。效果是通过在模板的大小,在模板的像素的数目,并且所述模板的形状确定。中值滤波数学表达式公式2:g公式2中,(x,Y)代表图像中的像素点,f(x,y)代表被噪声污染的原始图像,g(x}Y)代表经过中值滤波算法处理后的图像,S表示滤波窗口。Median表示对窗口内的像素进行排序操作。中值滤波算法的实现步骤:(1)选择滤波模板N,N通常取奇数,如3,5或7等。(2)由像素遍历图像上的模板在一定方向上的像素,以确保该图像中的像素与所述模板的中心重合。(3)获取与模板图像重叠区域内所有像素的灰度值,并排成一个序列,记为F(x,y)。(4)将序列F(x,y)按照升序(降序)重新排成一列,记为F(x,y)。(5)如果序列F(x,y)中的像素个数为奇数,则选择该序列的中间值作为中值。否则,将中值设置为最中间两个值的均值。(6)将步骤5中计算的中值作为待处理图像的像素值,进行更新。(7)重复步骤1-6,直到整幅图像扫描结束。例如,有一个像素集合为{3,7,2,8,9,4,5,7,1},对该像素集合进行升序排列后的序列为{1,2,3,4,5,7,7,8,9},最中间的值为5。因此,中值滤波之后,在初始设定的第五像素的灰度值9由5取代。1.4灰度化彩色图像I由亮度和颜色两部分组成。颜色信息由R,G,B三个分量组成,它又代表红色,绿色和蓝色的三原色。图像采集设备获得的图像front是一个24位真彩色图像。也就是说,图像的每个像素用24位表示,其中R,G和B各占8位。当直接处理彩色图像信息时,算法往往很复杂因此,为了使图像处理更加高效,本文首先将获取的彩色图像转换为0255之间的灰度级表示的图像(总共256灰色),这不仅消耗巨大的系统内存而且消耗很多。我们称之为图像。对于灰度图像,此过程称为彩色图像的灰度[ys}。图像被灰度化并与彩色图像,其中包含少得多的信息。在后续处理中的灰度级图像的直接处理,不仅可以提高图像的处理效率,同时也大大降低了系统的存储器中。存在用于图像灰度的各种方法,并且经常使用的方法主要包括最大灰度级方法,平均灰度方法,和加权平均灰度级方法的三种方法。(1)最大值法分别求取彩色图像中每个像素的R,G,B三个分量值的最大值,将其作为对应灰度图像的像素值,原理如下列公式所示:f(2)平均值法将彩色图像中每个像素的R,G,B三个颜色分量值分别求平均值,将得到的值作为对应像素的灰度值。原理如下列公式所示:f(3)加权平均法将彩色图像的R,G,其中三个部件通过合理的重量[21]相乘,然后相加,以获得灰度图像的方法,是一个加权平均法。基本原理如下列公式所示:f公式中ωR根据我们的YUV色彩空间分布的了解,以获得最佳的灰度图像,你应该选择下列公式中的值时,计算公式如下:f根据上述三个颜色人民币图像灰度的方法中,彩色图像是逐渐变化的,且结果示于图。3,4,和5。图3加权平均法灰度化结果图4平均值法灰度化结果图5最大值法灰度化结果它可以从处理结果中可以看出的是,R,G和B的三个颜色分量进行加权和通过式中的系数平均化,并且将得到的灰度级图像具有最好的感官效果,以及用于平均值的方法感官效果。利用最大值的方法,具有最差的感官效果,这是与理论分析结果一致。1.5图像的倾斜矫正在输入的图像的过程中,如果钞票被放置倾斜时,则会出现图像倾斜的情况,如图6所示。图6倾斜的纸币图像由于倾斜所造成的形变可以采用图像旋转的方法来校正,这里我们以图像的左上角为原点进行旋转,令左上角的坐标为(x0,yF令β为上边缘与水平线之间的夹角,容易推得(x',y')与(x,y)之间的关系:x`=ycos∝+旋转校正后,将硬币图像仍然与平行于x轴的上侧和下侧平行四边形。这是由硬币的在扫描过程中的侧向运动而引起的。校正这种变形可以通过根据左,右两侧的倾斜角度移动所述图像横向来解决。具体方法如下:令侧移之后的图像为FsF令左边缘与x轴之间的夹角为θ,以钱币图像左上角(x0x图7图像几何校正后的结果1.6字模分割字符区域定位之后,字符模块分割也是最光学字符识别算法处理的不可缺少的一部分。有三种主要类型的字体的分割方法:字符间隙的方法,直方图的投影方法,以及连接区域的分析方法。1.6.1字符间隙法在光学字符识别系统的相应的应用程序,始终存在的人物之间的间隙。因此,在算法处理,在字符区域中的间隙可被检测到,并且字体分裂完成。字符间隙方法的原理如下。通过移动垂直扫描线段,扫描线段的在不同的位置计算时的长度被计算出来。如果间隙比原来的长字符间隙法时,是将所述字体的步骤如下:(1)检测得到字符的矩形区域;(2)矩形竖直长度为扫描线段长,并确定扫描间隔;(3)从区域的左侧开始,根据扫描间隔,水平移动扫描线段;(4)扫描完整个区域后,计算各扫描长度;(5)对比原长度,并确定间隔区域。这种方法抗噪声能力不强,若字符图像中出现噪声,导致字符连接或字符断裂,不能达到正确的分割结果。只适用于图像质量好的情况下。1.6.2直方图投影法直方图投影方法,像字符间隙方法,是分割应用的字体之间的间隙特性。不同的是,该字符间隙通过垂直扫描线无论是在字体间隙的长度检测;直方图投影方法判断基于所述字符区域的垂直投影结果的统计信息的字体间隙。对于二进制图像,目标字符图像是1(即黑色)时,背景图像是0时(即白色),单行字符图像垂直投影,在每列中的黑色像素的数量进行计数,并且字体分割根据结果规则进行。它是字体分割的直方图投影方法。图例如下。图8直方图投影法图例(a)字符区域:(b)直方图垂直投影在图像处理的领域中,投影直方图是从灰度直方图本质的不同。投影直方图是每一行或图像的列坐标空间中,并且结果以根据图像的行和列的顺序分布的目标点(黑色)的数量的统计分析;的灰度直方图是整个图像的所有像素进行分类,并在0-255将它们合并,共256个灰度级,所述统计结果是图像像素的每个灰度级的数量。直方图投影方法是简单地实现,并且是字体分割的常用方法。然而,由于噪声污染,在一些图像,字符出现在中间的被打破,字符由噪声连接,并且字符的区域重叠。在这种情况下,投影的图像可以具有假分割点或直方图的最小值。改进传统的字符映射表来解决字符之间的重叠区域的问题。如图9所示。其中,图(a)是字符的直方图投影结果,由于"from"字符区域重叠,因此不能将其除以投影结果。图(b)是导出直方图投影值的结果,并且所获得的最大点是原始直方图投影中的最小点。图(c)是图(b)的水平邻域,最大水平坐标是字体的边缘。图9改进的直方图投影法1.6.3连通区域法由于字符间隙法与直方图投影法的算法原理,导致抗噪声能力不强,在图像背景简单、图像质量较好的前提下,例如小噪声印刷体字符图像,可以正确分割字符。若字符区域内出现字模区域部分重叠、大噪声干扰,应用上述两种方法不能很好的完成分割。采用二维空间的连通区域外接矩形分析方法,可以解决以上难题。连接区域的延续矩形方法是通过跟踪字体,其中,所述连接区域是一个字体的边缘来确定字体的外接矩形。用于确定外接矩形的方法如下:首先,从左至右,以便各连接区域进行排序,并且所述序列号被用作相应的字图案连接区域的标签;其次,每个连接的区域的像素点的坐标被计算和分析,并得到各外接矩形区域。也就是说,字体区域。图示见图10。图10子模外接矩形分析并计算矩形区域。在一定高度范围内,当字体区域的宽度太宽,继续判断是否有噪声

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论