基于特征统计的字符识别_第1页
基于特征统计的字符识别_第2页
基于特征统计的字符识别_第3页
基于特征统计的字符识别_第4页
基于特征统计的字符识别_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于特征统计的字符识别摘要采用数字字符轮廓结构特征和统计特征相结合的方法,并从中选出稳定的局部特征,利用结构语句是别的方法进行数字的识别,能够实现不同字体数字的准确识别,同时还提高了是别的速度。关键字:字符识别,MATLAB,统计特征。前言字符识别是模式识别的一个分支,它能人人提高信息的采集录入速度,减轻人们的工作强度。随着计算机技,字符识别技术多年来不断改进和完善,现在已经广泛应用于各个领域,使人量的文档资料能快速、方便、省时省力和及时地自动输入计算机,实现信息处理的电子化。到目前为止,尽管人们研究中已取得很多可喜成就,但还不能满足我们口常的需求.研究字符识别技术,提高字符识别率具有非常重要

2、的意义。ORC技术简介OCR技术是光学字符识别的缩写(OpticalCharacterRecognition),是通过打描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用于银行票据、人量文字资料、档案卷宗、文案的录入和处理领域。适合于银行、税务等行业人量票据表格的自动扫描识别及长期存储。相对一般文本,通常以最终识别率、识别速度、版面理解正确率及版面还原满意度4个方面作为OCR技术的评测依据;而相对于表格及票据,通常以识别率或整张通过率及识别速度为测定OCR技术的实用标准。OCR识别技术不仅具有可以自动

3、判断、拆分、识别和还原各种通用型印刷体表格,在表格理解上做出了令人满意的实用结果,能够自动分析文稿的版面布局,自动分栏、并判断出标题、横栏、图像、表格等相应属性,并判定识别顺序,能将识别结果还原成与扫描文稿的版面布局一致的新文本。表格自动录入技术,可自动识别特定表格的印刷或打印汉字、字母、数字,可识别手写体汉字、手写体字母、数字及多种手写符号,并按表格格式输出。提高了表格录入效率,可节省大量人力。同时支持将表格识别直接还原成PTF、PDF、HTML等格式文档;并可以对图像嵌入横排文本和竖排文本、表格文本进行自动排版面分析。早在60、70年代,世界各国就开始有OCR的研究,而研究的初期,多以文字

4、的识别方法研究为主,且识别的文字仅为0至9的数字。以同样拥有方块文字的口本为例,1960年左右开始研究OCR的基本识别理论,初期以数字为对彖,直至1965至1970年之间开始有一些简单的产品,如印刷文字的邮政编码识别系统,识别邮件上的邮政编码,帮助邮局作区域分信的作业;也因此至今邮政编码一直是各国所倡导的地址书写方式。OCR可以说是一种不确定的技术研究,正确率就像是一个无穷趋近函数,知道其趋近值,却只能靠近而无法达到,永远在与100%作拉锯战。因为其牵扯的因素太多了,书写者的习惯或文件印刷品质、扫描仪的扫描品质、识别的方法、学习及测试的样本等等,多少都会影响其正确率。识别算法简介目前用于字符识

5、别中的算法主要有基于模板匹配的算法以及基于人工神经网络的算法。1.基于模板匹配的算法基于模板匹配的的基本过程是:模板匹配方法是一种经典的模式识别方法,是最直接的识别字符方法,其实现方式是计算输入模式与样本之间的相似性,取相似性最人的样本为输入模式所属类别。首先要建立模版库,将待识别字符进行二值化并将其尺寸人小缩放为字符数据库中模板的人小,然后与所有的模板进行匹配,最后选择最佳匹配作为结果。这种方法具有较快的识别速度,尤其对二值图像速度更快,可以满足实时性要求,但是,它对噪声很敏感,而且对字符的字体风格不具有适应性,任何有关光照、字符清晰度和人小的变化都会影响识别的正确率,因此在实际应用中为了提

6、高正确率往往需要使用人的模板或多个模板进行匹配,而处理时间则随着模板的增人以及模板个数的增加而增加。该算法的一种改进是基于关键点的模板匹配算法,但针对不同的应用坏境,关键点的选取方法是不同的。该算法可用于类似车牌字符等印刷体字符识别。在字符较规整时,算法对字符图像的缺损、污迹有较强的抗干扰能。2基于人工神经网络的算法神经网络理论自20世纪中期提出以来,取得了一系列的研究成果。近年来,随着计算机术和非线性科学的发展,神经网络理论的研究又进入一个新的高潮,其应用己经渗透到各个域,并在智能控制、模式识别、计算机视觉、生物医学工程等方面取得了巨大贡献。用神经网络进行字符识别,主要有两种方法:一种方法是

7、先对待识别字符进行特征提取,然后用所获得的特征来训练神经网络分类器。这种方法实际上是传统方法与神经网络技术的结合,可以利用人的经验来获取模式特征,然后充分利用神经网络的分类能力来识别字符,其识别效果与字符特征的提取有关,而字符的特征提取往往比较耗时。因此,字符特征的提取就成为研究的关键,特征参数过多会增加训练时间,过少会引起判断上的歧义。另一种方法是充分利用神经网络的特点,直接把待处理图像输入网络,由网络自动实现特征提取直至识别。这种网络互连较多,待处理信息量人。这种方法无需特征提取,由网络自动识别字符,抗干扰性能好,识别率高。但该方法产生的网络结构比较复杂,输入模式维数的增加可能导致网络规模

8、庞大。虽然,神经网络在识别效果上提高的余地较人,具有较强的容错能力,还可进一步训练学习,识别率较高,但其识别速度较慢,不能满足实时性的要求。正文一.特征统计匹配法介绍特征统计匹配法的要点是先提取待识别模式的一组统计特征,再按照一定准则所确定的决策函数进行分类判决。汉字的识别是将字符点阵看作一个整体,根据每个字符的笔画特征不同,将字符分解为横、竖、撇、捺、折、圆中的一种或几种结构特征的集合,经过大量的统计得到所用特征,再与字符库中的特征集合进行匹配,从而得到输入字符的识别结果。1字符轮廓的定义由于受噪声和随机污点的干扰,以及二值化和粘连字符处理会引起的字符变形。为了尽量减少这种变形对信息特征的干

9、扰,或者从变形的字符中提取可靠的特征信息,将字符的整体轮廓分解为顶部,底部,左侧和右侧4个方向的轮廓特征来描述,使得当其中的的某部分的笔画发生变形时,不会改变或者减少对其他部位特征的影响。左轮廓(LP(K),k=l,2,3.M)定义为字符最左边边界像素点的水平方向坐标值。LP(i)=minx|P(x,y)GCzy=ii=l,2.M式中P(x,y)表示图像中的坐标为(x,y)的像素点,C表示字符像素点的集合。同理,右侧轮廓(RP(k),k=l,2,3.M)定义为字符最右边边界像素点的水平方向坐标值。LP(i)=maxx|P(x,y)EC,y=ii=l,2.M相应的顶部轮廓(TP(K),k=l,2

10、,3.M)定义为字符最高边界像素点的垂直方向坐标值。底部轮廓(BP(K),k=123.M)定义为字符最低边界像素点的垂直方向坐标值。TP(j)=minx|P(x,y)eC,y=jj=l,2.NBP(j)=minx|P(x,y)eC,y=jj=lz2.N为了描述轮廓变化的特征,定义了4个方向的轮廓的一阶微分:LPD=LP(i+l)-LP(i);RPD=RP(i+l)-RP(i);TPD=TP(j+l)-TP(j);BPD=BP(j+l)-BP(j);式中i=l,2.M-l;j=12.N-l;结构基元利用定义的一阶微分变化趋势,定义构成字符轮廓的基本基元。基本基元共有5个,分别是左斜(L),右斜(

11、R),竖直(V),圆弧(C),突变(P)。以左侧轮廓为例,定义上述基本基元:竖直定义:假设SL,SV和SR分别表示某一侧轮廓的一阶微分值大于零,等于零和小于零的个数,若SR=O,SL=O,则结构为V。左斜定义:假设SL,SV和SR分别表示某一侧轮廓的一阶微分值大于零,等于零和小于零的个数,若SR=O,SL大于阈值LT,则结构为L。右斜定义:假设SL,SV和SR分别表示某一侧轮廓的一阶微分值人于零,等于零和小于零的个数,若SL=O,SR大于阈值RT,则结构为R。圆弧定义:假设SL,SV和SR分别表示某一侧轮廓的一阶微分值大于零,等于零和小于零的个数,若SR大于阈值RT,SL大于阈值LT,则结构为

12、C。突变连续的字符轮廓,其一阶微分值的变化量比较小,而当字符轮廓不连续时,其一阶微分值相对较人,因此,定义:当轮廓的一阶微分值超过阈值PT时,则字符轮廓有突变,即为结构Po基元的检测根据上述定义,考虑实际应用中存在的干扰,基元的检测如下:假设PD(K)表示某侧轮廓的一阶微分,kJ,2,.K,SL,SV,和SL分别检测到的PD(K)犬于零,等于零和小于零的个数,PT,RT和LT为正整数,贝IJ:若PD(K)MPT,则在K处检测到的结构为突变P:若SLLT,SRLT,SRRT,则在K处检测到的结构为左斜L:若SLRT,则在K处检测到的结构为右斜R;若SLLT,SRRT,则在K处检测到的结构为圆弧C

13、:由于字符轮廓突变处,表示字符轮廓不连续,则突变前后的字符轮廓特征必须分别检测。即若K1处检测到P,则在l,kl-l的字符轮廓范围内统计SL,SV和SR独立进行结构基元检测。若在k2处又检测到P,则在kl+l,k2-l的范闱内进行结构基元检测,以此类推。由于字符轮廓基元的形成需要一定的数(T)轮廓像素点,即只有当SL+SV+SR事T时,才能进行基元检测,否则不进行基元检测,例如,当SL+SV+SR二2时,其形成的基元结构是不稳定的。检测到突变结构P有效的范围在XGST,N-ST+1,yeST,M-ST+1,其中的ST表示字符笔画的宽度。这主要是为了避免干扰严重的情况下,轮廓边缘光滑处理不够理想

14、时,可能检测到的假突变基元。轮廓的统计特征采用上述的结构基元还不足以准确识别残缺和完整的数字,引入轮廓的统计特征。(1)水平方向的最人字符宽度Vfeax:Wmax=maxRP(k)LP(K)该特征主要用于识别数字1.当WmaxW%即为数字1.(2)垂直方向的比划数该特征主要用于识别数字0和8.因为0和8的轮廓结构特征极其相似,所以借助于垂直方向的比划数加以区分,受数字底部残缺的影响8在垂直方向的最人笔画数也可能为2.采用检测到的笔画数为2时垂直方向的最小值来代替。数字识别算法将数字字符的顶部,左右两侧的局部轮廓结构特征和轮廓统计特征组合成特征向屋,用以描述10个数字。根据特征向屋,采用结构语句

15、识别算法识别底部残缺的和完整的数字字符。由于底部特征丢失,会改变左右两侧的部分特征结构,但不会影响顶部特征,因此特征描述和机构匹配识别都从顶部轮廓特征开始。实验结果结果显示数字0的识别结果:源图像左轮廓上轮廓右轮廓数字2的识别结果:源图像jiJ/v|rrfpa左轮廓上轮廓数字2的识别结果:源團像左轮廓上轮廓010202数字3的识别结果:源图像2031000201002040数字4的识别结果:源图像4E|2010数字5的识别结果:源圉像左轮廊上轮廊20100620100数字7的识别结果:源图像左轮廊上轮廓0204002040数字8的识别结果:10源團像20I111-10W0_L/1L上轮廓501

16、020802040左轮廊10200数字9的识别结果:01020902040二.结果分析由于外部原因的存在常常会出现字符模糊、字符倾斜等情况,从而影响识别效呆,当字符出现笔画融合、断裂、部分缺失时,此方法更加无能为力。因此,实际应用效呆不理想,鲁棒性不强。参考文献冈萨雷斯数字图像处理第二版MATLAB从入门到精通.周建兴2008SJ.ChapmanMATLAB编程2008MATLAB7_0基础教程清华人学2005苏金明Matlab图形图像2005基于MATLAB图像处理的汽车牌照识别系统仇成群2008(6)许志影、李晋平.MATLAB极其在图像处理中的应用.计算机与现代化,2004一种复杂车辆图

17、像中的多车牌定位方法,光子学报2007(1)Vol.36No.l基于图像处理的汽车牌照的识别,陈秋菊宋建才.汽车牌照识别技术研究J.工业控制计算机,2002,4:45-57.张兴汇,刘玲,杜升之等.车牌照定位及倾斜校正方法研究J.系统工程与电子技术,2004,2:237239.崔屹.数字图像处理技术与应用M.电子工业出版社,1997.张旭,王宏安,戴国忠等.面向车牌识别的区域分割技术卩计算机工程,2002,12::U3215.袁志民,潘晓露等.车牌定位算法的研究卩.昆明理工学报,2001,26(2):56-60.附录源代码主函数IO=imreadf2.jpg*)必须为二值图像l=im2bw(I

18、OzO.4);yOx0=size(l);Range二sum(l);Hy=O;forj=l:yOif(Range(j)=l)Hy=Hy+l;endendRangeX=sum(r*l);Wx=0;fori=l:x0if(RangeX(i)=l)Wx=Wx*l;endendAmp=24/Hy;%将文字图像归一化到24像素点的高度,l=imresize(lfAinp);yx=size(l);%l=bwmorph(1/skelfInf);%l;tic%=基本结构=%第一类:竖(V):左斜%第二类:左半岡弧(C):右半圆弧(Q)%的三类:结构待定(T):Left=zeros(l,y);%左端轮嗨检测for

19、j=li=l;while(i=x)&(l(jri)=l)i=i+l;endif(i=x)endendforj=1-1LeftD0)=Left0+l).Left(j);end%=结构特征提取=%j=l;while(Left(j)l)&(jY)j=M;endYl=j;j=y;while(Left(j)=l)&(l0J)=l)i=i-l;endif(i=l)RightO)=i;endendforj=1-1RightD(j)=Right(j+l)-RightO);endTop=zeros(l,x);%顶端轮廉检测fori=l:xj=l;while(j=y)&(IOJ)=l)j=M;endif(j=V)

20、Top(i)=j;endendfori=l:x-lTopD(i)=Top(kl)-Top(i);endi=l;while(Top(i)l)&(ix)i=i+l;endX1M;i=x;while(Top(i)=l)&(l(j,i)=l)i=H;endifG=l)Bottom(i)=j;endendfori=l:x-lBottomD(i)=Bottom(i+l-Bottom(i);end%=字1的宽度待征=%Width=zeros(lzy);forj=lWidth(j)=Right(j)-Left(j);endW=mac(Width);Po=0;%用于检测笙划Ne=0;NS=O;%笔划故fori=

21、Xl*4:X2-4forj=l-lif(l(j+UH(j)X)%由黑到白Po=Po+l;if(Po=2)&U=fix(0.7*y)Po=3;endelseif(l(j+l,i)-l(jJ)=2)&(j10)StrokeT=StrDetect01(TopD.XlzX2/3,6);%顶部垂$结构检测StrokeL=StrDetectf)l(LeftD,Yl,Y235);%左边基木结构检测StrokeR=StrDetectO:L(RightD,Yl,Y235);%右边基本结构检测StrokeB=StrDetectO:L(BottomD,Xl,X236);%底部基本结构检测%=识别=%Digit=Re

22、cognition(StrokeTrStrokeL5trokeR,StrokeB,Comp)elseDigit=l*endt=toc%=显示=%px=(lc);PV=(l:y);S=num2str(Digit);figurefl);subplot(231)imshow(l);tltleC源图像Jsubplot(232)plot(Left);gridtitleC左轮廓);subplot(233)plot(Top);gridtitlefI:轮廓J;subplot(234)plot(Right);gridtitleC右轮廓);subplot(235)plot(Width);gridtltief宽度)

23、;subplot(236)imshow(l);title(S)子函数一functionStrokedStrDetectOltLeftDYlPT)%ST为结构闽值为J拆定高度和宽度结构变化的不同SL=O;SR=O;sv=c;Count=0;%PT=5;%突变的闽值Str=7*;%T表示纳沟未定.SU用于保存当前的基本结构Stroke=T;%用于保存基本结构Range=Y2-Yl-l;%字符的宽度或者高度forj=Yl:Y2Count=Count+l;if(abs(LeftD(j)PT)if(LeftD0)=fix(Range/4)+l)%设定字符轮廊可能发生的突变范圉rf(SL=3)&(SR=3

24、)Str=C*;elseif(SV=2*(SL+SR)&(max(SL,SR)3)|(min(SL,SR)SR)&(SL=O.54SV)&(SR(SR+SV)Str=l*;elseif(SRSL)&(SR=0.54SV)&(SL(SR+SV)StrR*;elseif(max(SL,SR)=3)&(min(SL,SR)=2)StrC*;endendendendendStroke二StrokeStr;endif(j=2*Yl)&(j=fix(Range/4)+l)%发生突变后.稠余部分可能无法形成字符结构if(SL=ST)&(SR=ST)StrC*;elseifSV=24(SL+SR)&(max(SUSR)3)|(min(SLrSR)SR)&(SL=0.54SV)&(SR=(SR+SV)StrL*;elserf(SRSL)&(SR=0.5SV)&(SL2)|(SLx(SR+SV)StrR*;elseif(1113(&15口*刃&(皿泊(55口2)Str=C*;endendendendendStroke珂StrokeStr;end子函数二functionNumeral=Recognition(StrokeTop/StrokeLeft/StrokeRight,StrokeBottom/Comp

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论