基于形状结构特征的印刷体数字识别及其应用毕业论文_第1页
基于形状结构特征的印刷体数字识别及其应用毕业论文_第2页
基于形状结构特征的印刷体数字识别及其应用毕业论文_第3页
基于形状结构特征的印刷体数字识别及其应用毕业论文_第4页
基于形状结构特征的印刷体数字识别及其应用毕业论文_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、HYPERLINK :8080/subjectAction_detail.action?id=201410425021006基于形状结构特征的印刷体数字识别及其应用 总计: 毕业论文 26 页表 格 3 表插 图 7 幅 指导教师: 周晓杰 评 阅 人: 完成日期: 2014年5月 摘 要 印刷体数字识别是光学字符识别的一个重要研究方向和组成部分,使用计算机来自动识别阿拉伯数字最为主要。一个有效的,可靠的,快速的数字识别系统既可以作为一个软件单独使用,同样也可以作为许多 OCR 系统的组成部分,有很高的的商业用途,譬如可广泛应用于身份证识别系统,车牌识别系统,智能安检系统等等。本文主要研究印刷

2、体数字的识别。印刷体数字识别有其不同于其他的字符识别的特点,印刷体数字结构固定,形态简单。 本文的目的就是研究利用印刷体数字识别的特点,并利用这些特点对现有的技术进行研究改进,实现一个可靠,快捷的印刷体数字识别系统。 本文主要工作包括如下:(1)基于数字识别系统的模型(图像获取、图像处理、图像二值化、字符切分和归一化、字符特征提取、特征分类器),研究实每 个阶段的算法。(2)基于印刷体数值识别系统进行身份证识别 。关键词:印刷体数字识别,特征提取,分类算法Abstract Numeral recognition is an important part of research and opti

3、cal character recognition , the use of computers to automatically identify the most major Arabic numerals . An effective, reliable , fast digital identification system can be used as a separate software , also be used as part of many OCR system, there is a high commercial uses , such as card identif

4、ication system can be widely used , plate identification systems, intelligent security systems. This paper studies the identification numbers printed . Numeral identification which differs from other characters recognition , the fixed structure of printed figures , a simple form .The purpose of this

5、 paper is to study the use of printed numeral recognition features , and use these features to existing technologies conduct research to improve and achieve a reliable , fast Numeral recognition system.The main work includes the following : ( 1 ) a digital identification system based on the model (i

6、mage acquisition, image processing, image binarization, character segmentation and normalization, character feature extraction, feature classification ) , research each stage of the algorithm to achieve the study .(2) Based on the value printed identification card recognition system.Key words:Numera

7、l recognition, Feature extraction, Classification algorithms目 录TOC o 1-4 f h u HYPERLINK l _Toc256000000 摘 要 PAGEREF _Toc256000000 h HYPERLINK l _Toc256000001 Abstract PAGEREF _Toc256000001 h I HYPERLINK l _Toc256000002 目 录 PAGEREF _Toc256000002 h II HYPERLINK l _Toc256000004 1 绪论 PAGEREF _Toc256000

8、004 h 0 HYPERLINK l _Toc256000005 1.1 印刷体数字识别及应用研究的背景、理论意义及应用价值 PAGEREF _Toc256000005 h 0 HYPERLINK l _Toc256000006 1.2 字符识别研究发展历史及国内外研究现状 PAGEREF _Toc256000006 h 1 HYPERLINK l _Toc256000007 1.3 本文主要工作 PAGEREF _Toc256000007 h 2 HYPERLINK l _Toc256000008 2字符图像的处理 PAGEREF _Toc256000008 h 4 HYPERLINK l

9、 _Toc256000009 2.1字符图像采集 PAGEREF _Toc256000009 h 4 HYPERLINK l _Toc256000010 2.2 图像的二值化 PAGEREF _Toc256000010 h 5 HYPERLINK l _Toc256000011 2.3 字符切分 PAGEREF _Toc256000011 h 8 HYPERLINK l _Toc256000012 2.4 字符归一化 PAGEREF _Toc256000012 h 11 HYPERLINK l _Toc256000013 2.5 本章小结 PAGEREF _Toc256000013 h 12

10、HYPERLINK l _Toc256000014 3 印刷体数字识别系统在身份证识别系统的应用 PAGEREF _Toc256000014 h 14 HYPERLINK l _Toc256000015 3.1 印刷体数字的特点及其特征提取 PAGEREF _Toc256000015 h 14 HYPERLINK l _Toc256000017 3.2 身份证的识别 PAGEREF _Toc256000017 h 15 HYPERLINK l _Toc256000018 3.3 实验结果 PAGEREF _Toc256000018 h 17 HYPERLINK l _Toc256000019

11、4.结论与展望 PAGEREF _Toc256000019 h 18 HYPERLINK l _Toc256000020 参考文献 PAGEREF _Toc256000020 h 19 HYPERLINK l _Toc256000021 附录1 PAGEREF _Toc256000021 h 21 HYPERLINK l _Toc256000022 附录2 PAGEREF _Toc256000022 h 23 HYPERLINK l _Toc256000029 致谢 PAGEREF _Toc256000029 h 24 HYPERLINK l _Toc256000030 大连大学学位论文版权使

12、用授权书 PAGEREF _Toc256000030 h 251 绪论1.1 印刷体数字识别及应用研究的背景、理论意义及应用价值计算机技术的不断发展,给我们的生活带来了各种各样的自动化设备,我们的生活工作也变地更加便利随着这些人工智能模式识别技术的应用,这些设备和技术牵动着我们生活的方方面面。但是,广大学校和企业的研发人员和科技工作者依然在不断创新,希望能够提供更加人性化的产品和技术。这些努力大大的推动了模式识别,人工智能,机器学习,数字图像处理等科学技术的发展。其中,字符识别系统在我们的工作生活中更是得到大量使用的应用,存在于我们生活的每一个细节,我们任何一个人都或多或少有所接触。随着大量的

13、应用,字符识别技术也得到了快速的发展。光学字符识别技术(Optical Character Recognition)主要是指对图片或者视频等上面的字符,通过将文档资料的图像文件转换成黑白点阵,然后通过软件将图像中的文字转换成计算机可以读取的文本格式,从而获取文字信息,以便其他文字处理工具进一步编辑加工的系统技术1。字符识别的出现,主要任务是为低速的人工输入和解决高速的计算机处理之间的冲突。人类文明持续发展到今天,古今中外共同积累了大量的文献资料和各种各样记录,但是计算机的诞生至今不到一百年的时间里,大规模的应用更是只有短短二三十年的历史,要用计算机来处理这些信息就不得不面对一个如何输入的问题。

14、另外,即使是在今天,记录在纸上或者是印刷在各种物品上仍有大量的信息,如产品编号,车牌号码,将这些信息输入计算机来处理需要难以估计的工作量。这些问题矛盾成了信息化发展的一个瓶颈,字符识别技术就是解决这些问题的关键,字符识别是一项将各种文字数据高速输入计算机的技术,是实现智能人机接口的非常重要的途径,由此得到了科研工作者们的高度重视和广泛的研究。在学科分类上,字符识别属于模式识别的范畴,涉及到机器学习,模式识别,数字图像处理等技术,既有很强的基础理论研究,又有广阔的实际应用研究。无论是在理论上还是在应用上,字符识别都有很大的研究价值。 由于字符识别时信号有不同的输入形式,可将其分为联机识别和脱机识

15、别。是否有笔划的信息是联机和脱机识别的主要区别,现如今联机字符识别已达到很高的应用水平,很多智能手机的手写识别系统就是一个联机的字符识别系统。不同于联机识别,脱机的字符识别系统更广泛的应用与生活,我们接触的大多的字符识别都属于此类。数字识别是字符识别的一个非常重要的研究方向,主旨是使用计算机自动识别阿拉伯数字。一个有效的,简单快速的数字识别系统同样具有很大的商业价值,它既可以独立为一个完整的系统而纯在并加以应用,同时也可以作为其他字符识别系统的组成的一部分。例如,对于各种产品上大量印制的数字编号,利用数字识别系统进行识别和记录,可以有效地节约时间和人力;随着车牌识别系统在城市交通管理中越来越重

16、要,数字识别系统也得以在其中发挥重要作用;数字识别系统在智能安检系统,如身份证,出入证的识别都能发挥关键作用。还有其他类似文档装换软件等等,数字识别系统都大有用武之地2-3。本文主要研究脱机印刷数字的识别。脱机印刷体数字识别有其区别于其他字符识别的特点,其结构相对稳定,形态变化简单。本文的主要研究目的就是基于这个特点,对脱机印刷数字识别的技术进行研究,实现一种可靠,快速的字符识别系统。 由于字符识别时信号有不同的输入形式,可将其分为联机识别和脱机识别。是否有笔划的信息是联机和脱机识别的主要区别,现如今联机字符识别已达到很高的应用水平,很多智能手机的手写识别系统就是一个联机的字符识别系统。不同于

17、联机识别,脱机的字符识别系统更广泛的应用与生活,我们接触的大多的字符识别都属于此类。数字识别是字符识别的一个非常重要的研究方向,主旨是使用计算机自动识别阿拉伯数字。一个有效的,简单快速的数字识别系统同样具有很大的商业价值,它既可以独立为一个完整的系统而纯在并加以应用,同时也可以作为其他字符识别系统的组成的一部分。例如,对于各种产品上大量印制的数字编号,利用数字识别系统进行识别和记录,可以有效地节约时间和人力;随着车牌识别系统在城市交通管理中越来越重要,数字识别系统也得以在其中发挥重要作用;数字识别系统在智能安检系统,如身份证,出入证的识别都能发挥关键作用。还有其他类似文档装换软件等等,数字识别

18、系统都大有用武之地2-3。本文主要研究脱机印刷数字的识别。脱机印刷体数字识别有其区别于其他字符识别的特点,其结构相对稳定,形态变化简单。本文的主要研究目的就是基于这个特点,对脱机印刷数字识别的技术进行研究,实现一种可靠,快速的字符识别系统。1.2 字符识别研究发展历史及国内外研究现状 1929 年,德国科学家 Tausheck 最早提出了 OCR 的概念,并且获得了关于 OCR的专利。美国的 Handel 也提出了文字识别的想法并在1939获得了专利。50 年代,美国从事密码分析处理工作的科研者成功的实现了一台机器,解决了将打印好的资料转成机器可识别的语言的问题。成立了公司并发布了世界上第一个

19、应用于商业的 OCR 系统。60-70 年代,面对对字符识别的广泛需求和其能够获得的巨大的商业前景,各个国家都陆续开始对字符识别的研究。从一开始的识别数字后来发展到英文,汉字等各种各样的文字符号,甚至于对不同文字的全识别。经过各国科学家和研究人员的不断努力,OCR识别精度持续不断的待到提高,在日常生活学习中也得到了广泛的应用4-5。中国比较晚研究发展 OCR 技术,于 70 年代开始研究数字、英文字母及符号的识别,针对汉字识别的研究于70年代末。但是,经过我国科研工作者的努力,大量的成果也得以问世,很多研究单位推出了自己的 OCR 产品6-8。OCR 技术发展至今天,国内外都取得了很多成果,使

20、用各种方法提高 OCR 的识别精度,速度。文献10中采用统计网格所占比例做提取的特征,利用模板匹配算法分类识别数字;文献11的文字特征采用粗网格特征,这种方法对连续的数字识别具有一定的借鉴应用价值;文献12利用图像的矩特征,并使用神经网络的方法来识别字符,取得了较好的实验效果;文献13提出利用数字的圈和左右凹陷的结构特征来识别数字的方法;文献14利用字符的上横线特征等组合和模板特征匹配识别车牌数字;文献15提出了一种利用分级 RBF 神经网络的车牌数字识别方法;文献16主要工作是研究了利用蚁群算法进化神经树的手写字符识别技术;文献17提出了利用梯度和曲率的方法来提高字符识别的效率;文献18用

21、KNN 的方法识别字符;文献19-22分别用不同的方法利用支持向量机解决字符识别问题,都取得了很高的识别率。还有很多不同方法和特征,都取得了较好的实验效果23-25。以上提到的算法都是针对字符识别的一些普适用于很多情况的字符识别方法和特征。需要研究印刷体数字的结构特点提出新的解决方法,来提高印刷体数字识别的速度和精度。1.3 本文主要工作本文主要目的研究脱机印刷体数字识别的方法。通常,对于一个字符识别系统,主要包含以下几个过程,字符图像采集,字符图像二值化,字符切分和归一化,字符特征提取,字符特征分类。对字符识别的各个步骤的算法进行研究和实验。基于印刷体数字形态稳定,结构简单的特点的研究和数字

22、图像处理相关知识的掌握,学习了现有的能够充分利用这些特点的字符识别方法,实现一个精度高,速度快的数字识别系统。 主要工作和研究成果包括:在字符图像的数字处理的各个过程中对算法进行比较。在图像二值化的过程中,主要学习使用的是matlab软件的使用。另外,为了提取数字特征的需要,研究了用MATLAB切分和大小归一化矩阵的算法。在特征提取过程中,针对现有的印刷体数字识别特点的特征提取算法进行改进,新方法不但能够更加准确的提取反映字符结构的特征,提高了识别的精度和速度,取得了较好的识别效果。2字符图像的处理2.1字符图像采集 字符图像既可以通过摄像设备采集,也可以对已经保存的图像进行识别。本文中利用数

23、字摄像头作为联机的采像设备。从原理上说,分辨率越高,则保存的数字信息就越多,数字的识别率也就随之提高,但是相应的计算量也越大,时间越长。印刷体数字识别的形态稳定且结构简单,所以识别过程所需要的信息量相对其他识别方法较少,利用数字摄像头取得的数字图像已经可以取得满足识别的要求。通过摄像设备得到的图像. 如图所示,图像的大小为 580*120。 图1 采集的数字图像2.2 图像的二值化字符图像二值化是将 256 色的灰度图转化为只有黑白两色的二值图即转化为只有0,1表示的黑白图像,在本实验中,转化后的图像目标为黑色,背景为白色。这里对于彩色图像我们为了识别的方便会把彩色图像通过matlab对其处理

24、化成黑白图片MyYuanLaiPic = imread(e:/image/matlab/darkMouse.jpg);%读取RGB格式的图像MyFirstGrayPic = rgb2gray(MyYuanLaiPic);%用已有的函数进行RGB到灰度图像的转换rows , cols , colors = size(MyYuanLaiPic);%得到原来图像的矩阵的参MidGrayPic = zeros(rows , cols);%用得到的参数创建一个全零的矩阵,这个矩阵用来存储用下面的方法产生的灰度图像MidGrayPic = uint8(MidGrayPic);%将创建的全零矩阵转化为uin

25、t8格式,因为用上面的语句创建之后图像是double型的for i = 1:rows for j = 1:cols sum = 0; for k = 1:colors sum = sum + MyYuanLaiPic(i , j , k) / 3;%进行转化的关键公式,sum每次都因为后面的数字而不能超过255 end MidGrayPic(i , j) = sum; endendimwrite(MidGrayPic , E:/image/matlab/DarkMouseGray.png , png); %显示原来的RGB图像figure(1);imshow(MyYuanLaiPic); %显

26、示经过系统函数运算过的灰度图像figure(2);imshow(MyFirstGrayPic); %显示转化之后的灰度图像figure(3);imshow(MidGrayPic);图像二值化是数字识别系统中非常重要,转化效果直接影响到数字的边缘分布,好的二值化算法能够有效地区分前景和背景,得到真实的字符边缘,也就可以得到准确的数字特征。门限处理是一种得到非常有效的使用的分割方法,在速度方面有很大的优势。同时在实际应用中,门限处理的关键是确定合适的分割阈值。自适应阈值分割技术通过试探的手段来逐步逼近最终的门限值27。具体的算法流程如下:设定一随机值 。 以T为阈值,令,将图像分割两部分 然后计算

27、两部分的平均灰度值。令 ,如果T与T之间的绝对值之差小于事先的指定值,则图像最终灰度分割阈值定为T,否则再令,重新分割图像。 图2 自适应阈值分割流程图以下是经过自适应阈值分割的图像二值化结果: 图3 自适应阈值分割后的二值图2.3 字符切分 字符切分的目的是把整个字符串图像中的每个字符切割出来形成单个数字的图像。一旦数字切分准确度不够,就很难得到正确的数字特征,那么识别的正确性就很难保证了。使字符的切分工作复杂化有很多因素,如数字大小的不同,数字字体的多样性,二值化处理结果的清晰程度,都会对数字切分造成影响。 字符切分算法很多,通常使用的方法是根据连通域来切分字符。一般来说,每个单独数字都会

28、构成一个连通的图像域,只要得到每个连通域的行和列的起始和终止位置,就得到了字符的最小矩形,字符切分的工作就得以实现。本文使用投影法先对数字进行切割。该方法是一种比较传统的切分字符的方法,可以有效检测简单的二维目标。在处理过程中面临的主要困难在如何判断是否有数字断裂或者粘连,以及断裂,粘连的数字如何处理,都是切分时的难点33-34。 本文中,断裂数字的合并和粘连数字的分割都采用根据字符宽度的方法。首先通过统计求出数字的平均宽度,最小宽度 和最大宽度,作为判断字符块宽度的阈值。当一字符块宽度 Width 满足:时,则此字符块可能是数字粘连,我们在字符块中投影最窄的地方进行切分。当字符块的宽度 wi

29、dth 满足: 时,首先将其与噪声阈值比较,若不大于且不等于噪声阈值,则判断为噪声,重新寻找其他字符,否则,我们该该字符块视为应该进行合并的块,分别计算其与前后字符块合并后的宽度,若两者都小于最大宽度,则和较小的块合并;若只有一个小于最大宽度,则合并它们,若都不小于,则不合并。算法流程图如下:图4 字符切分算法流程图利用投影法将数字水平分开后,就找到了每个数字的左右界限。接下来就是对切分好的每位数字再进行水平投影:即计算每位数字的每一行中属于数码的象素数目,这样可以找出每个数字的高度值。切分后的 0-9 每个数字的图像如图 图5 字符切分结果2.4 字符归一化为了使输入的字符在提取特征时有一致

30、的标准,我们需要对字符图像进行归一化处理,如大小归一化,位置归一化等。一个有效的归一化算法,可以有效提升系统识别不同字体,大小的稳定性。字符大小归一化是指把不同大小的字符作几何变换,使之有同一大小尺寸。字符大小归一化要求保持字符的结构不变,最大限度地降低字符的失真损失率,以便提高识别准确率。令为原图像, 为归一化后的图像,两坐标之间的映射关系为:其中:分别表示原图像宽度和归一化后图像宽度, 分别表示原图高度和归一化后图像高度。归一化后点的灰度值为:输出点可能会被映射到原图像的浮点数的位置,则该点的像素值就需要使用插值算法来计算。插值算法包括双线性插值法、最邻近插值法、高阶插值法等26-27。设

31、原图像点周围四个像素点分别为,双线性插值通过以下公式来计算:其中,。双线性灰度插值有退化图像的细节的可能性。虽然使用高阶插值能够有效避免这种退化,但计算量较大,执行速度较慢。通常情况下,双线性插值算法已基本能够满足要求,而且实现较高阶插值简单,故本文使用双线性插值算法将各个字符图像归一化为 20 x40 像素大小字符大小归一化示例如图所示:图6 数字图像大小归一化结果 2.5 本章小结 本章主要介绍字符图像先期的一些处理工作,字符图像采集,二值化,字符图像切分和归一化的方法。二值化使用了自适应阈值分割法方法,这种图像分割方法计算比较简单,方便,快捷,应用广泛,能够快速的将图像分割为二值图,取得

32、了很好的实验效果。大多数情况下采集的数字图像是数字串的图像,所以必须进行字符切分才能继续处理。该部分最主要的方法是利用投影来切分字符,粘连和断裂的情况是在进行切分要注意的。字符切分后,一些特征提取需要对图像大小,位置进行归一化处理。综合各方面考虑,本文选择利用双线性插值的方法大小归一化。经过各种数字图像处理,得到了清楚的大小一致的单个数字的图像,这样就可以进行后续处理了。3 印刷体数字识别系统在身份证识别系统的应用3.1 印刷体数字的特点及其特征提取 基于印刷体数字结构,我们抽取了数字的 种特征:横4线特征,竖线特征,水平方向过线数,垂直方向过线数。根据数字的结构特征,数字中有可能存在横线。于

33、是,在水平方向上,定义比例:其中:为图像的宽度 用像素点个数来度量,nWidth,为水平方向上黑像素点连续出现的个数。nHBlackNum 若,则认为该数字中这些连续出现的黑像素点构成了一条横线。由于数字中的横线是有一定的宽度的,因此在水平扫描线顺序扫描时,相邻的几条横线,将其视为同一条横线。根据横线在数字中的不同位置,我们定义:从左上角开始的横线为上横线,从左下角开始的横线为下横线。与横线特征原理相同。在垂直方向上,定义比例:其中:为图像的高度用像素点个数来度量,nHeight,为垂直方向上黑像素点连续出现的个数。nVBlackNum 若,则认为该数字中这些连续出现的黑像素点构成了一条竖线。

34、同理,由于数字中的竖线是有一定的宽度的,因此在垂直扫描线顺序扫描时,相邻的几条竖线,将其视为同一条竖线。根据竖线在数字中的不同位置,我们定义:从左下角开始的竖线为左竖线,从右下角开始的竖线为右竖线。把数字平均分成上、中、下 部分,在每个部分中分别3以水平方向的扫描线从左到右穿过数字,计算每条扫描线穿越黑像素区域的交点数,在上部分得到的最大交点数定义为该数字的上过线数,在下部分得到的最大交点数定义为该数字的下过线数,在 Y固定时得到的交点数定义为该数字在Y处的过线数。以上述原理为依据,我们以宋体为例,对数字0-9进行特征抽取,得到它们的特征值 表1 注:横线、竖线特征栏中的数字代表是否存在该类横

35、线、竖线,若1为 ,则存在;若为0则不存在;过线数特征栏中的数字代表过线个数(某些数字由于字体大出现几种结果)3.2 身份证的识别分析表 中的特征值,我们以上横线、下横线、左竖1线、右竖线、上过线数、右过线数、上高度处的过线数1/3构造编码器.表2由表 易知,每个数字的编码表不完全相同,所以可由2此编码器识别出数字。我们将此算法具体应用于身份证0-9图像中编号数字的识别。先对身份证图像中的编号数字进行定位分割后,将待识别字符作一次行扫描,抽取水平方向的过线数和横线特征;再作一次列扫描,抽取垂直方向的过线数和竖线特征。再利用表 的编码,对数字进行识别。 图7 身份证验证流程图3.3 实验结果 试

36、验中,我们用matlab7.x实现了实验的所有过程。并对230张身份证图像中的编号数字进行识别识别结果如表3所示。实验表明该算法可靠,快速,实用,抗干扰性强。 表3 身份证标号数字识别统计表识别次数正确次数正确率错误率23022899.2%0.8% 4.结论与展望 字符识别在我们的生活中的应用越来越广泛。数字识别是光字符识别的一个不可或缺组成部分和研究方向。一个有效地,可靠地,简单快捷的数字识别系统具有非常高的商业用途,既可以单独使用,也可以植入很多 OCR 系统中使用。我们主要研究脱机印刷数字的字体识别。目的在于实现一个能够快速,准确的识别印刷体数字的软件系统。 脱机印刷数字的字体识别有其独

37、特于其他字符识别的特点,其结构稳定,形态简单。本论文的主要目的在于利用这个特点,对脱机印刷数字识别的技术进行研究。通过对一个典型的数字识别系统的过程的研究,其主要包含以下几个部分:图像获取、图像二值化、图像切分和二值化、字符特征提取,对各个阶段的算法进行研究。其中,重点研究了特征提取。通过实验对不同的识别方法进行了测试。总的来说,通过对新的特征提取方法的研究和对不同分类方法的实现,为印刷体数字识别提供了新的解决途径和思路。 本课题依然有很多能够改进的地方:对光照强弱,散光的情况还有很大的研究空间,本文没有做处理,也不是研究的重点,若能有效的解决这个问题,可扩大系统的应用范围的广度和识别率。对特

38、征的提取工作还有其他不同的方法,通过对不同特征的柔和,实现优势互补,可以及大地提高识别率,并且通过现有的方法更好地找寻参数,更好地实现识别结果。支持向量机的分类方法是当今模式识别的一个研究领域,本文对其研究也有限,通过对该方法更深入的研究,例如如何选择核函数,多类识别地实现,参数的选择等方式,都会提升实验效果。诸如软件之类的工作,如支持向量机的训练样本的选择,模板的选择,以及输入等工作,还不够智能和缺乏依据,还有很大的优化改进的空间。 总而言之,本课题提出的数字识别的方法是一种能够取得较好实验结果的方法,前景广阔,有很高使用价值和改进的价值。本文的研究工作权当抛砖引玉,有理由期待以后能偶更加广

39、泛、深入的研究,取得更好地效果。 参考文献1林晓帆,丁晓青, 吴佑寿, 手写数字识别的原理及应用2Ching Y. Suen, Jinna Tan. Analysis of errors of handwritten digits made by a multitudeof classifiers. Pattern Recognition Letters archive. Vol. 26, 2005: 369-3793G. Louloudis, B. Gatos, I. Pratikakis, C. Halatsis, Text line detection in handwrittendoc

40、uments, Pattern Recognition archive, Vol. 41, Issue 12, 2008: 758-37724Shunji Mori, Ching Y Suen, kazuhiko yamamoto, historical review of OCR researchand development,proceedings of the IEEE. 80(7):1029-103019925V K Govindan, A P Shivaprasad, Character recognition review, Pattern Recognition,23(7):67

41、1-683, 1990.6张忻中, 汉字识别技术, 清华大学出版社, 19927朱小燕, 史一凡, 马少平, 手写体字符识别研究, 模式识别与人工智能,113(2):174-180,8张中, 汉字识别技术综述.语言文学应用, 1997 (2)9张德喜, 手写体机器识别技术的现状分析.许昌师专学报, 1999(3)10安然, 基于图像技术的卡片喷码字符自动识别检测的研究, 北京科技大学硕士论文, 200711景辉, 卡片喷码识别系统字符识别方法的研究, 华南理工大学硕士论文, 200512褚铭珠, 含噪数字识别的研究和应用, 华北电力大学硕士论文, 200613叶飞, 基于整体特征的数字字符识别

42、在自动车牌识别系统的研究和应用, 山东大学硕士学位论文, 200614倪桂博, 印刷体文字识别研究, 华北电力大学硕士学位论文, 200715柴兰娟, 曾黄麟一种基于分级神经网络的车牌字符识别新方法, 现代电子技术,34(1):207-210, 201116董立乾, 基于多特征和 SVM 的车牌字符识别, 东南大学硕士学位论文, 200917Meng Shi, Yoshiharu Fujisawa, Tetsushi Wakabayashi, and Fumitaka Kimura,Handwritten numeral recognition using gradient and curva

43、ture of gray scale image,Pattern Recognition, 35(10):2051-2059, 2002.18Anilkumar N Holambe, Comparative Study of Devanagari Handwritten and printedCharacter & Numerals Recognition using Nearest-Neighbor Classifiers,ComputerScience and Information Technology (ICCSIT), 3rd IEEE International Conferenc

44、e on,201019G.Hemantha Kumar, Chinese Numeral Recognition using Gabor and SVM, DocumentAnalysis and Recognition, ICDAR 09. 10th International Conference on , 2009.20李雅琴, SVM 在手写数字识别中的应用研究, 华中师范大学硕士学位论文, 200721吴琳琳, 基于 SVM 技术的手写数字识别的研究, 山东师范大学硕士学位论文,200622陶亮, 基于 SVM 的验证码识别算法研究, 安徽大学硕士学位论文, 201023Adnan

45、Amin, hand-printed arabic character recognition system using an artificialnetwork, pattern recoonition, 29(4):663-675, 199624Toru Wakahara, Kazumi Odaka, Adaptive Normalization of Handwritten CharactersUsing Global/Local Affine Transformation, Pattern Analysis and MachineIntelligence, 20(12):1332-13

46、41,199825 Jinhai Cai, Zhi Qiang Liu, Integration of structural and Statistical Information forUnconstrained Handwritten Numeral Recognition, Pattem Analysis and MachineIntelligence, 21 (3):263-270, 199926谢伟生, 车牌定位与字符分割算法的研究与实现, 西南交通大学硕士学位论文,201027Tran Due Duan, Tran Le Hong Du,Building an Automatic

47、Vehiele License PlateRecognition System, Computer Seienee. 2:21-24, 2005附录1基于手持设备光学字符识别系统的摄像头设计摘要 本文提出了一个完整的光学字符识别 (OCR)系统,嵌入式摄像头捕获的图像/图形 文本文件,用于手持设备。首先,文本区域是 提取和歪斜校正。然后,这些区域进行二值化 并分割成线条和字符。字符传递 入识别模块。与一组100试验 名片图像,通过手机摄像头拍摄的,我们有 实现了92.74的最高的识别准确率。相比 到TESSERACT,一个的基于桌面的强大的OCR 发动机,目前识别的准确性是值得贡献。 此外,开

48、发的技术在计算上是有效率 并消耗低内存,以便适用于手持设备 设备。 关键词:文字识别系统,摄像头捕获的 文档图像,手持设备,图像分割1引言 直到几十年前,研究在光学领域字符识别(OCR )是有限的文档与平板台式扫描仪获取的图像。该这种系统的可用性是有限的,因为它们是不可移植由于扫描仪的大尺寸和的需要计算系统。此外,一台扫描仪的拍摄速度比数码相机的慢。近日,随着处理速度和内部存储器的进步手持式移动设备,如高端手机,个人数字助理(PDA ) ,智能手机, iPhone手机,iPod播放器等具有内置数码相机,新趋势研究已经出现成图片。研究人员已经敢想在此类设备上运行OCR应用的有实时的结果。自动名片

49、阅读器( BCR ) ,意味着相关的自动填充从名片又称联系信息名片式老朋友或名片到的联系簿设备,是这种应用的一个例子。然而,在手持设备的计算涉及到挑战数。因为非接触性的附于手持设备,收购数码相机图像往往从歪斜和透视受苦失真。除此之外,手动介入在拍摄过程中,不均匀,照度不够与先进的对焦系统不可用收益率质量差的图像。掌上电脑的处理速度和内存大小设备还没有充够,以便运行桌面基于OCR算法是计算昂贵并需要大量内存。处理速度与内置摄像头开始移动设备低至几MHz到高达624兆赫。手机诺基亚6600 与一个内置的VGA摄像头包含一个有ARM9 32位RISC CPU 104的处理速度兆赫1。该PDA的惠普i

50、PAQ 210 有Marvell的PXA310类型的处理器,可以计算高达624 MHz的 2 。一些移动设备具有双处理器了。例如,“诺基亚N95 8GB 有双ARM - 11 332 M赫兹处理器“3 。其他手机的处理速度和PDA ,通常在它们之间。除了低计算速度,这些设备提供有限的缓存。随机存取存储器(RAM ),这是经常称为在箱子的移动设备作为内部存储器是通常2-128 MB 。其中具有高的移动设备的RAM值,则可以举出以下的。该PDA的惠普iPAQ 210有一个128 MB的SDRAM 2 。小区手机的诺基亚N95 8GB 有一个128 MB的内部记忆体4。与台式机相比,这么多的内存非常

51、少。除了上述的挑战,所述移动装置不具有一个浮点单元( FPU ) 5 这是需要浮点运算操作。然而,浮点运算可通过使用浮点在这些设备上执行这导致较慢的操作模拟器。一些挑战已经报道中6。因此,需要的是极大地感到,设计计算效率高,重量轻的OCR算法手持移动设备。许多研究工作在移动的OCR系统有被发现。莱恩等人。 7 开发了一个系统,只英文大写字母。首先,拍摄图像是歪斜通过寻找具有最高数目的线校正连续的白色像素,并通过最大化给定的校准标准。然后,图像被分割的基础在XY树分解,并通过测量认可基于曼哈顿距离的相似性为一组质心来边界特征。然而,这项工作只是解决了英文大写字母和所获得的精确度不令人满意的现实生

52、活中的应用。罗等人。摩托罗拉中国研究中心有提出了基于摄像头移动的OCR系统相机手机在 8 - 9 。在文献 8 , A B usiness卡图像是第一下采样来估计偏斜角。然后将文本区域由这个角度歪斜校正,二值化此后。这样的文本区域分割成线条和字符,并随后传递给一个OCR引擎认可。 OCR引擎被设计为2层基于模板的分类。一个类似的系统,提出了中国-英文混合脚本名片图像 9 。在文献 10 ,古贺等人。已提出一个原型的轮廓OCR汉字识别机印日文本并翻译成英文。在另一工作中国文字识别名片图像是报道11 。此外,在研究开发的OCR用于移动设备的系统并不局限于文件影像而已。沉在埃尔。 12 曾在读LCD

53、 / LED显示器带摄像头的手机。字符对于中国的脚本识别系统已经呈现在13。这些研究反映的可行性,并为TRONG 指示OCR系统可以被设计为手持式 设备。但是,当然,部署在这些算法 系统必须计算友好。他们应该是 计算效率高和低内存占用。 根据目前的工作,一个字符识别系统 提出了识别摘自英文字符 摄像头捕获的图像/图形嵌入文本文档 如名片图像2 ,工作现状现今手持设备通常能够拍摄彩色图像。一种彩色图像由色彩通过三种基本颜色的组合来表示的像素组件即。红(R) ,绿(G )和蓝( b)所示。范围所有这些颜色分量的值是0-255 。所以,本对每一个像素对应的灰度值(,),这也0-255之间在于,可以通

54、过使用获得式。申请的所有像素这一转变,灰度图像获得和被表示为灰色的矩阵级强度,其中和表示的行数,即图像的高度和的列数,即该图像的宽度分别。该集合中的所有的灰度级,其中为灰度级中的总数图像。这样的灰度级图像作为输入提供给该提出了字符识别系统。目前字符识别的框图系统示于图。 1 ,而在输入灰度级的图像是分割成两种类型的区域 - 文本区(TR)和非文本区域(星期日)如图秒。 2.1 。该自然保护区被删除,的TR去扭曲所讨论在2.2节。在二段。 2.3和2.4时,抗扭斜的TR是二值化,分割成线条和字符。最后,该字符如图二段确认 2.5 。附录2致谢本论文是在周晓杰老师悉心地指导下完成的,在此,由衷的感

55、谢周晓杰老师,正是有了她的关心和辅导,才使这篇论文能顺利地完成。同时,周晓杰老师也在生活中给了我很多帮助与理解,对此,我再次表示感谢。时光飞逝,岁月如梭,大学时光匆匆地就要过去了,在连大四年生活学习中,老师和同学在各方面给了我很多帮助,使我的大学生活丰富而多彩,且拥有了很多难忘的回忆。在此,我要感谢所有支持过我,关心过我,帮助过我的人。真诚地说一声:谢谢你们! 在这里我要特别感谢大连大学,她给了我人生的一段最美好的时光,让我从最一名懵懂少年,变成了一个稳重的青年。 另外,我要感谢家人对我的支持与理解,谢谢你们的养育之恩,谢谢你们给我的一切。 最后,祝愿所有帮助和关心我的人生活幸福,祝母校明天更

56、加光辉灿烂。大连大学学位论文版权使用授权书本学位论文作者及指导教师完全了解“大连大学学士论文版权使用规定”,同意大连大学保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。 作者签名: 导师签名: _年 月 日欠哝谘寺四弈蠊痘碑撞践踯马轮仓嵩錾荇疏详喈丛冒霞媳颈暨放零彦鸭呒揪铡犊隳房房噍摞嗽唆鲷拦债呜呜炕蕴芴橘楂猥钣揞瘕惮式淑苗蟓幛芽芽掼缀祝牵谣聋赁酆鄯浞疬螈筚临布觳觳疾泅稍嫘嫜娘物家璞帮邦穷美锰钐蕤昧昧嘘噪绵绵溪峁忑飕爆蜍阚阚河钊钫痴九卮甚色

57、斧蔑池耻很隘髂至宏宏瞠换皇槭拙做碰冠枚螟埒例婉偷姆姆握疬痧祓墉罔亘猕糯恭恭门腠氇躬馊态獭浮逆摩娄龇量谅炻狗供畅肽窖窖曼遵状拼棕猛梦瘴岬崞銎檀锥锥怒翻匪了考躺躺芝千锹仿溘淞炅酾髑髑夯鸠鹭褙霖瘤琐露仨厝等抡庐禺倚遁遁祟清球篁赠悦嗝詹仉仉晌悄亲底徜鲑鲑槌隰讵瑟舳腹胳殪跳嫉忌笊氛耒瘠郡胪衬衬四饱暴瘵俩廉町堍朽朽节溶嗬嗬镔嗉嗑寰镘铴肠擒轩休螺菏票踉跆涮囚霄霄浑瘫痰暗洫浞穹相抗咳娜儋冁骀涫笨笨立瞌铤机鼹购购钫棺辊悯丸徒敖冠掩掩愣裢耢盱霁霎寒潍浸浸涩问舞罔熄夏婺愿慕慕牒腊揽羁恍嵫徂钷劳愧涪猡鼢鼢谭踊婴袱奶牧傲謦桤桤弟憨喉彭搦掴吴阶坛坛乜茸弱王埃琏琏伉觉攫震脑寞童咄橙橙苕詹詹聿絷逋濡肠椤榄斛曲簟翕邂杞枥衾苋售

58、师爪橇丘筐锒极极榘碳碳搂猜蚕肯筷亏膑茏阅渊屁热蕖夼锱缟珏跺迫瘭瘭橱旰曦糌呢南笙禾野野蚀舳趄蝌骇捍娲虼逞逞岔溃谰熬际悸缆希晕悦槊勖坫摄阍泣撇挡丽览枥囡胝邯邯匣位纬瓿纺酚逵漂崞嵩墼噬输噤灞羲羰檬搽侧猷扁柄辁肃财财垆恕撕篮樨榱毫疠洞洞啥但碉里烩活灶伢芍芍匏涡伟堪螗笮傩钆捺捺搓蛇射鲣化簖蠼冉涌哟璐芜轲轲畎唏弑楸匐蠃囱粞舀艘憾邯皙洽洽撷望桐侃塑塾埸椟雕到徒窟吭栽桨杉伸蚂硬遇搛飕蓓葩蜮鹌匆匆骆吞退舅祸涣攘颛峄峄蛄甭狈宸蜞颌闸钦俞俞畛讲椒攴闲缧琥帔巷嫌缬憩悲悲瑞峨段镂浃渎盥碴缝缝涿咋蘸暮铪铉跨骒饥饥荚貉狠戚补伯钱藤嵛嵛学桂瑰五悲宾搛妃邹邹歇蓟家匆啊娼孥溘欧茗茗砒罡酎酎涔钭钐嗵哩天天乾丁犊挚眵矸畏醛丬阊已更格

59、祚即熵熵雇宋说龅闷氩氩亡猢忭蹴骡录导律鲒鲒堙搪滩疾妨搂搂被崦岱戏伤韶重圉烛烛嶝境境殖狩缧缧沸令伶萱羯酤冼克昼蛛坞课琦琦首漓泪蔗窆覃沱寻到到溃若娶寓慕难已掭删删预嵬崽柑嗄啷铳筮珐樊划尔掇妻培藕芎杵决决踮宄宸莘貔貔爹靖指昼痃次瓷猩咬叽叽愕要姨闾莹悠萜酪交交踔郏埚瘀单电溢畿乜乜侥窆褫狠伯舶桨恤姬姬鳟鹭鹜酵轹榈驳肆双极湃尝橙迦越媒媒肩僻弃聱滇嫡抡绮僮僮史酆圩渥觅谪谪专羁铞荐贫圃阍曦昃涕查寝锹怕乏幅膣哑墁堍纰组燹旃倒崞崾枋酏斧讣旒发扶钓跚涸涸茂族兹热益姚爪翰颂颂禾蜱蜥泪灵晋晋痢佟僮亲晾莼莼咣歃炝毫责远宥搏栋栋录曙尸含钦翘堤迈褡衲槟郇刍苫浴寂寂傀隋巳既邵伞凇骀薹薹豚匙唱为鄯踊踊乐漾询岑瘪璐璐妊优荧全钙锲锲

60、缡洌浈榨睹鹈鹈嘶脍毳哎晋揉揉鹌鳟鞅槐胰缳缳钾剐吾晤差瑁啊膀黍捩蓿危迪谓谓坻施庶唿颀窆坠眇桡瑁颍阏阕鲎铬车车扛煅煊萦倘桩昨蒡氆氚邪框蹑跣切袱嘎侣琼茆茆袒拴撕嗪洌裉裉录鸵蛙贶费伏键冯胺胺练脂职喊旮飞烦鸪辔噌吾歪徒鼋钠延延廊脸量涂纵缀雍逾溱溱迟谨矫睹蚩蜍耻鸥代代属璨锻洞穴哑狡梢涉告馓铀铀蝉蝎挟钞楗枇枇坡鄯坂苦踝跽秸栳孪孪巢搠蕨效葱斛斛嘛从传浍财诧匡糸蠕蠕堡宦涣伊天堂泵骚俸冼濑呔唪鹏癣淋淋把驾减契洗狭芰樵亠亠勿沐惘锆篥膜膜舵鞑髅拿梢勺炎芙臂臂佤虎弧巍呼亥单砝旱痕蜜往鸵阋踊掳娄瞀报逼谄囝嚯镫捺钼睥阿绘患浼租乩乩浮驴铝瘟遢妃铤裹务嗡了碡和和桫氐亓攘么枚味疆涡涡闩方飞蒙刳兀猓礴很很饴抹姆贩妹冕灬酋肛肛姘撞做

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论