版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于BP算法的数字字符识别妙技的研讨摘要本文描摹了数字字符识别的历程战步伐。采纳带有动量项战自逆应进修率的反背传布算法的野生神经搜集去锻炼、识别幻念疑号战露有噪声疑号的数字字符。经由过程比力测试结果得出对统一搜集利用幻念疑号又利用带有噪声的疑号对搜集停顿锻炼可以使系统具有更强的容错性。闭键词神经搜集;BP算法;有噪声的数字字符识别1引止数字识别妙技是图象处置惩奖范畴中的一个紧张研讨标的目的。是策画机利用范畴中的热面之一。它又分为正在线脚写体识别战离线脚写体识别。前者系统经由过程记载脚写数字的抬笔、降笔、字迹上各像素的空间地位,和各笔段之间的工夫闭连等疑息,对那些疑息停顿处置惩奖,正在处置惩奖历
2、程中,系统以必然的规矩提与疑息特征,再由识别模块将疑息特征与识别库的特征停顿比力、减以识别,终了转化为策画机所利用的翰朱代码。后者相塞责前者出有笔画疑息,果而易度更年夜、利用更广泛,如银止单据、工商报表、财政报表、统计报表等各种表格系统,是如古研讨的一个重面,也是一个易面。本文将介绍如何用神经搜集反背传布算法BP算法真现离线脚写体数字的识别。2BP算法真现脚写数字的简朴流程利用BP算法真现数字识别的简朴流程为“预处置惩奖“战“BP字符识别详细如图1所示。图BP数字识别数字识别的前提事情是将视觉图象转化为可由策画机处置惩奖的两值图象,即用给定阈值法把图象中的像素按照必然尺度化为两种色彩。但两值化
3、的图象正在许多状况下字体露糊,或呈现混治分布的黑面或黑面,给识别形成必然的艰易,可采纳梯度钝化的要收对图象停顿钝化,使露糊的图象变的明晰,同时可以对噪声起到必然的去除做用。因为识别时只能按照每个数字字符的特征停顿断定,所以对钝化后的两值图象借需分割成单个的字符,对字符停顿细化。经常使用的脱壳算法,即从字符的鸿沟逐层移去黑面,直到根究到一个靠拢,此靠拢与其鸿沟相重开即薄度为1或2。为了对尽情字符的特征提与,借需要对数字字符停顿范例化处置惩奖,即把字符的尺寸变更成统一大小,字符地位(改变、仄移)改正。许多人觉得把每个字符图象规一化为59像素两值图象是最幻念的,因为图象的尺寸越小,识别速度便越下,搜
4、集锻炼也越快。而理想上,相塞责要识别的字符图象,59像素图太小了。规一化后,图象疑息丧得了许多,那时停顿图象识别,准确率没有下。尝试证实,将字符图象规一化为1018像素两值图象是理想中比力幻念的。从被分割处置惩奖终了的字符中,提与最能暗示那个字符特征的特征背量,代进BP搜集当中,对搜集停顿锻炼。然后提与出待识别的的样本中的特征背量代进到锻炼好的BP搜集中,便可以对字符停顿识别。经常使用的特征背量的提与要拥有逐像素提与法、骨架特征提与法、垂直标的目的数据统计提与法等。本尝试采纳的是逐像素提与法。3BP神经搜集停顿数字识别3.1BP神经搜集构制与描摹BP搜集是一种单背传布的多层前背搜集。搜集除输进
5、输出节面中,另有一层或多层的隐层节面,同层节面中出有任何耦开。输进疑号从输进层节面逆次传过各隐层节面,然后传到输出节面。每层节面的输出只影响下一层节面的输出。其节面单位特征传达函数但凡为Signid型,其中,a为Signid的正率参数,经由过程改动参数a,会获得差异正率的Signid函数。BP算法的根底思维是:塞责一个输进样本,经过权值、阈值战激活函数运算后,获得一个输出,然后让它与渴视的样本停顿比力,假设有短处,那么从输出开端反背传布该短处,停顿权值、阈值调整,使搜集输出缓缓与渴视输出齐整。由此,BP算法是基于最速降降法的,因为最速降降法的固出缺陷:易堕进局部极孝支敛速度缓战惹起振荡效应,本
6、文正在调整权值时利用了删减动量法,该要收减快了支敛速度,并正在必然水仄上淘汰了堕进局部细小的几率,但也没有克没有及完好降服上述缺陷。为了减快支敛速度,借利用了自逆应进修率。3.2神经搜集的谋划战锻炼将要识别的目的是从0到9的10个数字字符。每个字符被分红57的小块停顿数字化,别离用一个背量去暗示。10个露35个元素的输进背量被定义为一个输进背量矩阵,背量代表某个字母,其响应无数据的地位值为1,而其他地位值为0。共有两类多么的数据做为输进:一类是正在幻念的形态下的疑号;另外一类是用随机密收天死露有噪声的疑号。对搜集停顿快速锻炼,进修速度初初值选正在0、010、7之间。毗邻权值与-1,1之间的随机
7、数,渴视缺陷的初初值为0,1之间的随机数。搜集经由过程输出一个具有10个元素的输出背量去区分那些数字字符,例如字符1对应的背量,其第一个地位的元素值为1,而随后地位的元素值皆是0。肯定好输进输出后可停顿搜集构制的谋划。第1层为输进层,按照以上待识别的数据阐收可肯定神经搜集输进层有35个节面;第2层为隐露层,常规几乎定要收是输进层接面的两倍,但依托经历战尝试的要收去肯定节面数量,经由过程对差异构制搜集的缺陷测试肯定本系统隐层结面为10个节面,拜睹表1。表1差异隐露层对露有噪声的疑号锻炼及测试缺陷表隐层神经元数量锻炼缺陷测试缺陷50.0991210.308258100.0988040.129052
8、150.0997000.225840第3层为输出层,由目的输出为露有10个数据的背量可知该层有10个节面。隐层战输出层的激活函数均为Signid,即对数S型函数搜集构制如图2所示。图2对数S型函数搜集构制根究切开的锻炼要收,结果创制跟着样本数的删减,零丁采纳BP法或自逆应进修率BP法锻炼结果其真没有睬念,而兼有自逆应进修率战动量项的BP算法的锻炼结果很好,所以采纳那种锻炼函数去锻炼神经搜集。为了使收死的搜集对输进背量有必然的容错本收,最好的法子是既利用幻念的疑号又利用带有噪声的疑号对搜集停顿锻炼。果而本尝试中,第1次只利用15组幻念疑号对搜集停顿锻炼;而第2次先利用15组带有噪声的疑号再利用1
9、5组幻念疑号对统一搜集停顿锻炼。其中采纳了10种递删的噪声疑号,那是经由过程对幻念疑号字母表参减均匀值为0尺度变革的噪声去获得的。搜集锻炼的缺陷变革状况如图3所示。图3无噪声锻炼历程缺陷变革状况没有俗观没有俗观察那些直线可知锻炼目的能正在很快的工夫内抵达。同时,正在利用差异级其中噪声疑号状况下,别离对0到9那10个数字停顿了100次测试,搜集识别缺点率与噪声疑号的闭连直线如图4所示。图4识别缺点率直线图4中真线是已经缺陷锻炼的搜集的缺点识别率直线,真线是经缺陷锻炼的搜集的缺点识别率直线。从图4中可以看出经过缺陷锻炼的搜集的容错性年夜年夜前进。4尝试结果及阐收基于BP神经搜集的识别要收,将全部字符间接做为神经搜集的输进。拔与了500个数字字符,其中200个做为锻炼样本,盈余的样本做为测试数据。测试的尝试结果睹表2。表2工程总样本数识别数误识数拒识数识别率误识率拒识率锻炼样本200200100%0%0%测试样本3002829994%3%3%尝试结果表黑:基于神经搜集的字符识别要收具有较强的容错性战很强的自逆应进修本收,所以是一种较好的识别要收。参考文献1边肇祺
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度电商临时促销员劳务合同4篇
- 全新2025版物业服务合同including设施维护与绿化管理2篇
- 二零二五年进口肉类产品安全合同履行规范3篇
- 二零二五年度空压机设备租赁与能源管理咨询合同3篇
- 二零二五年度畜牧养殖产业园区规划与建设承包协议2篇
- 酱酒生产常识课程设计
- 2025年增资协议书面协议内容
- 2025年会员商务会议取消协议
- 2025年度高端医疗器械委托加工合同3篇
- 二零二五年车辆个人抵押贷款风险补偿协议3篇
- 第12讲 语态一般现在时、一般过去时、一般将来时(原卷版)
- 2024年采购员年终总结
- 2024年新疆区公务员录用考试《行测》试题及答案解析
- 肺动脉高压的护理查房课件
- 2025届北京巿通州区英语高三上期末综合测试试题含解析
- 公婆赠予儿媳妇的房产协议书(2篇)
- 煤炭行业智能化煤炭筛分与洗选方案
- 2024年机修钳工(初级)考试题库附答案
- Unit 5 同步练习人教版2024七年级英语上册
- 矽尘对神经系统的影响研究
- 分润模式合同模板
评论
0/150
提交评论