自由手写体数字识别系统的设计与实现

上传人：猪*** IP属地：江西上传时间：2023-04-04 格式：DOCX 页数：17 大小：2.01MB 积分：12 举报 版权申诉

已阅读5页，还剩12页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

自由手写体字识别系统设计和实现摘要：本文论述并设计实现了一个脱机自由手写体数字识别系统。文中首先对待识别数字的预处理进行了介绍，包括二值化、平滑滤波、规范化、细化等图像处理方法；其次，探讨了如何提取数字字符的结构特征和笔划特征并详细地描述了知识库的构造方法最后采用了以知识库为基础的模板匹配识别方法并以MATLAB作编程工具实现了具有友好的图形用户界面的自由手写体数字识别系统。实验结果表明，本方法具有较高的识别率，并具有较好的抗噪性能。关键词：手写体数字；预处理；模式识别；特征提取Abstrct：Thisanddesignsahandwrittenrecognitionthepretreatmentofthecharactertoberecognizedisintroduced,includingbinarization,smoothing,normalizationandtoextractstructuralfeaturesofnumbersisdiscussed,andwedescribetheconstructingmethodofrepository.Finally,weusethemethodoftemplatematching,basedonrepository,torecognizethedigitalnumber.Matlabisusedasatothishandwrittendigitalrecognitionsystemfriendlygraphicaluserinterface.Theexperimentalresultsshowthattherateoftherecognitionsystemishigh,andtheproposedmethodisrobusttonoise.Keywords:handwrittennumber;pretreatment；patternrecognition;featureextraction向成熟，并推出了很多使用系统；另1

引OCR（OpticalCharacter

一类是数据信息，主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据，如：邮政编码、统计报表、Recognition）即光学字符识别技术，是通过扫描仪把印刷体或手写体文稿扫描成图像，然后识别成相应的计算机可直接处理的字符是模式识别的一个分支，按字体分类主要分为印刷体识别和手写体识别两大类。对于印刷体识别又可以分成单一字体单一字号和多种字体多种字号几类。而手写体识别又可分为受限手写体和不受限手写体两类；按识别方式可分为在线识别和脱机识别两类。字符识别处理的信息可分为两大类：一类是文字信息，处理的主要是用各国家、各民族的文字（如：汉字，英文等）书写或印刷的文本信息，目前在印刷体和联机手写方面技术已趋

财务报表、银行票据等等，处理这类信息的核心技术是手写数字识别。因此，手写数字的识别研究有着重大的现实意义，一旦研究成功并投入使用，将产生巨大的社会和经济效益。在整个域中，最为困难的就是脱机自由手写字符的识别。到目前为止，尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就，但距离实用还有一定距离。而在手写数字识别这个方向上，经过多年研究，研究工作者已经开始把它向各种实际使用推广，为手写数据的高速自动输入提供了一种解决方案。本文首先介绍了自由手写体数字识别的基本原理，包括数字图像预处预处理主要由二值化预处理主要由二值化，平滑去噪，法过最人即OTSU方法，大预图择，图像改进分类识别测试理、特征提取和模式识别的基本原理和方法；其次介绍了；最后通过基于MATLAB的实验结果，对本系的性能进行了分析。

本系统主要由手写体数字识别的训练过程和识别过程组成，训练过程和识别过程均包括预处理、特征提取和模式识别三部分统构成如图所示。2

手体字别基原待识对象数据采集，图2.1分类识别下面分别介绍各部分工和消除，否则保留。以上每理过

一步都是一个邻域运算。细化是2.1

预处理训练过程

将一个曲线性数字细化为一条单像素训练样本数据采集，特图形化地显示出其拓扑分类识别预处理和规范化，细化等组成。数字图像预处理前后效果比较如本文采用了基于阈值的二值化算改进数据采集，改进为数字5预处理2.3为对图.2预处理后的统计图像的灰度直方图选取全局阈结果图。类似地，图24数字“6”值，然后进行二值化处理。的原始图像，图25为对图.4预处其次，在二值化后利用均值滤波理后的结果图。的方法消除孤立点、线的噪声，这样图中就只剩下手写体数字。在滤波中本文采用的是3*3大小的模板。平滑去噪后，对图像进行规范化处理。找出图像中数字的边界，然后提取出数字把它居中放置在正方形方框中，再对此正方形图像进行线性插值缩放，使它变为统一规格大小的图像，文中一化图像的大是36*36。在提取特征之前，要对手写体数字进行细化。本文是采用的基于数学形态学的细化算法。细化可用两步腐蚀来实现：第一步是正常的腐蚀，但它是有条件的，也就是说，那些被标为可除去的像素点并不立即消去；在第二步中，只将那些消除后并不破坏

图2.2

原图图2.3处后像

了节约资源，节省计算机存储空间、处理时间、特征提取的费用，有时更是为了可行性，在保证满足分类识别正确率要求的条件下，按某种准则尽量选用对正确分类识别作用较大的特征，使得用较少的特征就能完成分类识别任务。这项工作表现为减少特征矢量的维数或符号字符数。在本系统中采用对待识别数字图像进行行列扫描和数字起点结合的方法提取特征。2.2.1结构特征提取首先对经预处理后的图像进行分割，如图2.6所示。图2.4始像图2.5

预理图

图2.6图分对图像分割后，结构特征提取的算法如下：(1)对细化后的数字图像取竖直的三条直线,分别取在5/12,1/2,7/12,下这三条竖直直线和数字笔段的交点数。2.2

特征提

(2),在特征提取的目的是从原始数据中抽取出用于区分不同类型的本质特征。无论是识别过程还是学习过程，都要对研究对象固有的、本质的重要特征或属性进行量测并将结果数值化，形成特征矢量。通常能描述对象的元素很多，为

1/3,1/2,2/3处分别记下这三条水平直线和数字笔段的交点数。(3)再取对角两条直线,分别记下这两条对角直线和数字笔段的交点数。2.2.2笔划特征提取经细化后的数字图像其特征较为稳,且笔划简,因此对其抽取的基本结构组件能反映数字的本质特征,从而可快速有效地识别数字符,达到较好的分类效果字端点如图所示。提取笔划特征的算法如下：(1)按从上到下,左到右的顺序扫描预处理后图像并选择黑像素点P；(2)计算像素P的8－邻域之和N；(3)若N=1,则像素P为端点端点计数器加一；(4)重复步骤1)-(3),到遍历整个图像。

2.2.3数字的特向量说依据上述特征提取方,系统中的特征矢量由9个分量组成,其排列如下所示:DATA=[竖直中线交点数，竖直5/12处，竖直7/12处，水平中线交点，水平1/3处交点数，水平2/3处交点数，左对角线交点数，右对角线交点数，端点数];2.3

知识库建立由于本文采用的是基于模式知识库的识别方法，所以对字符的结构特征的分析以及字符模型的构造是一个十分重要的环节，图就是对识别数字的标准形态进行具体分析而构造的模板。图2.7字点图2.8

规手体字态DATA0＝[2,2,2,2,2,2,2,2,0]1DATA1＝[1,0,0,1,1,1,1,1,2]1DATA2＝[3,3,3,1,1,1,1,1,3]1DATA3＝[3,2,3,1,1,1,2,2,3]1DATA4＝[1,1,1,2,2,1,3,2,4]1DATA5＝[3,3,3,1,1,1,2,2,4]1DATA6＝[3,3,2,1,1,2,3,2,1]1

DATA7＝[2,2,2,1,1,1,1,1,2]1DATA8＝[4,4,4,2,2,2,2,2,0]1DATA9＝[3,3,3,1,2,1,3,1,1]1由于本系统是对自由手写体进行识因而要考虑数字书写体的多变性。通过对图.9示数字变体的分析来对知识库进行补充。11221122图手写数变DATA0＝[1,1,2,2,2,2,1,2,2]2DATA2＝[3,2,2,1,1,1,1,3,2]2DATA3＝[3,1,4,2,1,1,2,2,3]2DATA4＝[1,2,2,3,3,1,2,2,2]2DATA5＝[3,3,3,1,1,1,2,2,4]2DATA6＝[3,1,3,1,1,2,2,2,2]2DATA8＝[4,4,4,2,1,2,1,2,2]2DATA9＝[3,2,3,2,1,1,3,1,3]2最后得到知识库由上述两套模板所组成。

点。其缺点是在建立知识库时需要进行大量的训练，当知识库中的模板增多时，特征矢量间的距离会减小。3序计本次设计使用MATLAB语言实现该系统,其用户界面分别介绍如下。(1)读入图像：2.4本系统模式识别方在本次设计过程中我们选择了模板匹配的识别方法过计算欧氏距离来衡量匹配程度。本系统中的特征矢量有9个分量，其计算距离公式如下：

所示。

读入图像的用户界面如图3.1xii

公(2.1)但在本次设计中我们计算距离时对上述公式进行了改进，对于可靠性较高的端点数即最后一维特征值加大了权重，改进后的距离计算公式如下：dxii99i公(2.2)在识别过程，分别计算待识别图像的特征值和知识库中两个模板的距离，和10个数字逐个比较，距离最小的对应的数字就是最后识别结果。该算法具有特征提取和模板建立都比较直观，时间复杂度低，易于实现等优

图3.1读图(2)对图像进行各种处理：选择对图像的各种操作的用户界面如图示，对图像取反的用户界面如图示，对图像平滑去噪的用户界面如图示，对图像进行二值化操作的用户界面如图3.5所示，对图像进行规范化处理的用户界面如图示，对图像进行细化操作的用户界面如图3.7所示，图选择图的种作

图规化图3.3像反

图细(3)数字图像的识别手写数字进行识别的结果显示界面如图38所示。图平滑噪图识别果示在上述界面中,系统可根据用户对识别结果正误的选择，自动计算识别识别率结果显示在图像界面上方。图3..5二化4

实结及析在实验过程中我们以两组样本作为训练样本对知识库的参数进行调

9合计

993

90%93%整，这两组训练样本分别为个规范手写体样本和个自由手写体样本范手写体样本训练结果如表41所示，自由手写体样本训练结果如表42示。

在测试实验中，我们以个规范手写体和个自由手写体共两组样本作为测试样,识别实验结果分别如表.3，44示。表4.3规范写识实结表4.1规范写训结

数字类别

正识样本数

误识样本数

识别率数字类别0

正识样本数10109991010

误识样本数001111000

识别率100%100%90%90%90%90%100%100%100%

0合计

202018201918185

00322015

100%100%85%90%90%85%90%100%95%90%92.5%9合计

995

90%95%

由上表可以看,本系统对规范的手写体有较好的识别效果，识别率达表4.2自由写训结

到。数字类别0

正识样本数10

误识样本数0

识别率100%

表4.4自由写识结数字正识样误识别率类别本样数

1098101010

021000

100%80%90%90%80%100%100%100%

16181820

104220

95%100%80%90%90%85%90%100%合计

1917182

1318

95%85%91

[4]

清华大学出版社[M],2003.蔡炯.于旋转不变性的印刷体数识别[J].,由上表所示，字符2和的误识率较高，常误识别为对方数字，对待识别数字要求严格，这是由于它们的标准特征向量距离较小，需要通过增添标准库或参数调整对此情况进行改进。

[5][6]

no.3,2002.郝红卫.手写体字符的识别和集[北:中国科学院声学研究所,1998.马向辰.字符识别系统中图像预处理方法的研究北:北京5

结

科技大学,2002.本文对自由手写体数字识别的基本及方法了介，MATLAB具实现了自由手写体数字识别系统。实验结果表明，基于所用结构模型和知识库的识别方法对规范手写体数字是可行的，具有较高的识别率及较好的抗噪性能，也可以识别一定条件下的自由手写体数字。为了提高识别率和可靠性，除了要增强对噪声的滤除能力外，还要增大知识库，以解决细化中出现的结构畸变问题，这些都有待我们进一步的研究。参文

[7][8][9]

林晓帆,丁晓青,吴佑寿.手写数字识别的原理及使用/number_descript.htm邹.精

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

自由手写体数字识别系统的设计与实现

文档简介

温馨提示

最新文档

评论

自由手写体数字识别系统的设计与实现

文档简介

温馨提示

最新文档

评论

相关文档