基于BP神经网络的手写数字识别研究人工智能_第1页
基于BP神经网络的手写数字识别研究人工智能_第2页
基于BP神经网络的手写数字识别研究人工智能_第3页
基于BP神经网络的手写数字识别研究人工智能_第4页
基于BP神经网络的手写数字识别研究人工智能_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、人工智能系别: 计算机系专业: 计算机科学与技术班级: 0701班姓名: 李玉茹学号 : 2007151115指导老师:严武军1 神经网络.摘要.关键词.1.引言2 BP 神经网络.3基于BP神经网络的手写数字识别.3.1输入向量与目标向量.3.2BP神经网络的构建.3. 3网络的训练4 实验结果与分析.5结论基于BP神经网络的手写数字识别研究摘要:将BP神经网络应用于手写数字识别,通过实验证实,该方法具有较高的识别率和可靠性.关键词: BP神经网络;模式识别;图像处理;特征提取1.引言手写数字识别是光学字符识别技术的一个分支,研究如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字. 由于手

2、写体数字的随意性很大,例如,字体的大小、倾斜、笔画的粗细等等,都会对识别结果造成影响. 在过去的数十年中,研究者们提出了许多识别方法,取得了较大的成果. 手写数字识别技术的实用性很强,例如在大规模数据统计(人口普查、例行年检) 、财务、保险、税务、邮件分拣等应用领域中都有广阔的应用前景. 手写数字识别一般通过基于结构的识别法及模板匹配法来进行处理,但识别率和可靠性都不高. 为了提高识别率,就必须寻求新的方法和途径. 近年来, BP神经网络技术取得了巨大发展,它是一种前馈反向型神经网络,具有并行处理信息、自组织、自学习信息等优点,特别适用于模式识别领域. 本文基于BP神经网络原理对手写数字进行识

3、别,通过对1000个手写数字的识别,证实本方法在手写数字识别方面的有效性.2BP神经网络神经网络的概念、原理和设计是受生物、特别是人脑神经系统的启发提出的. 神经网络由大量简单的处理单元来模拟真实人脑神经网络的机构和功能以及若干基本特性,是一个高度复杂的非线性自适应动态处理系统.BP网络是1986年由Rinehart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一. BP网络能学习和存贮大量的输入- 输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程. 它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和

4、阈值,使网络的误差平方和最小. BP神经网络模型拓扑结构包括输入( input) 、隐层( hide layer)和输出层(output layer) ,如图1所示.3基于BP神经网络的手写数字识别3. 1输入向量与目标向量首先对手写数字图像进行预处理,包括二值化、去噪、倾斜校正、归一化和特征提取,生成BP神经网络的输入向量Alphabet和目标向量Tar2get. 其中Alphabet选取40 10的矩阵,第1列到第10列代表09的数字. Target为10 10的单位矩阵,每个数字在其所排顺序位置输出1,其他位置输出0.3. 2BP神经网络的构建BP算法由数据流的前向计算(正向传播)和误差

5、信号的反向传播两个过程构成. 正向传播时,传播方向为输入层隐层输出层,每层神经元的状态只影响下一层神经元. 若在输出层得不到期望的输出,则转向误差信号的反向传播流程. 通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程.首先考虑正向传播,设输入层有n个节点,隐层有p个节点,输出层有q个节点. 输入层与隐层之间的权值为vk i, 隐层与输出层之间的权值为w jk. 隐层的传递函数为f1 ( x) ,输出层的传递函数为f2 ( x) ,则隐层节点的输出为输出层节点的输出为通过式(1) 和(2) 可得BP神经网

6、络完成n维到q维的映射. 其次考虑反向传播. 在反向传播中,需要对不理想的权值进行调整, B P神经网络的核心要务即在于调权. 定义误差函数, 设输入P个学习样本,用x1 , x2 , , xp 来表示. 第p个样本输入网络得到输出ypj ( j = 1, 2, , q) ,其误差为式中为期望输出. P个样本的全局误差为将式(3) 代入得输出层权值的变化采用累计误差BP算法调整wjk 使全局误差E变小,即式(5) 中为学习率. 现定义误差信号为将式(3) 代入可得第一项为第二项为输出层传递函数f2 ( x) 的偏微分将式(7) 和(8) 代入可得误差信号为则输出层各神经元权值wjk 调整公式将

7、式(9)代入可定义为在得到输出层权值调整公式后, 需要定义隐层权值vk i 调整公式根据输出层各神经元权值wjk 调整公式推导过程,可得vk i 为3. 3网络的训练神经网络的训练过程是识别字符的基础, 十分重要,直接关系到识别率的高低. 输送训练样本至B P神经网络训练, 在梯度方向上反复调整权值使网络平方和误差最小. 为使网络对输入向量有一定鲁棒性,可先用无噪声的样本对网络进行训练,直到其平方和误差最小,再用含噪声的样本进行训练,保证网络对噪声不敏感. 训练完毕, 把待识别数字送BP神经网络中进行仿真测试.4 实验结果与分析权值初始化为( - 1, 1) 之间的随机数, 期望误差为0. 0

8、1, 最大训练步数5000, 动量因子为0.95,隐层和输出层均采用“logsig”函数, 手写数字的识别结果如图2 ( a) ( e) 所示,以数字4为例给出处理过程对1000个手写数字(每个数字取100幅不同的图像) 进行识别,其识别结果如表1所示.5结论针对传统的手写数字识别中识别率和可靠性不高的情况, 提出了将B P神经网络应用于数字识别,并通过实验,证实B P神经网络算法识别率较高,具备可行性.参考文献. 1 张猛等. 手写体数字识别中图像预处理的研究 J . 微计算机信息, 2006 2 Pandya A S, Macy R B. 神经网络模式识别及其实现M .徐勇,荆涛译. 北京:电子工业出版社, 1999. 3 朱小燕等. 手写体字符识别研究 J . 模式识别与人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论