BP神经网络详解与实例.ppt

上传人：1*** IP属地：浙江上传时间：2020-03-24 格式：PPT 页数：62 大小：1.24MB 积分：20 举报 版权申诉

已阅读5页，还剩57页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

人工神经网络 ArtificialNeuralNetwroks ANN HZAU数模基地引言利用机器模仿人类的智能是长期以来人们认识自然改造自然和认识自身的理想研究ANN目的 1 探索和模拟人的感觉思维和行为的规律设计具有人类智能的计算机系统 2 探讨人脑的智能活动用物化了的智能来考察和研究人脑智能的物质过程及其规律 ANN的研究内容 1 理论研究 ANN模型及其学习算法试图从数学上描述ANN的动力学过程建立相应的ANN模型在该模型的基础上对于给定的学习样本找出一种能以较快的速度和较高的精度调整神经元间互连权值使系统达到稳定状态满足学习要求的算法 2 实现技术的研究探讨利用电子光学生物等技术实现神经计算机的途径 3 应用的研究探讨如何应用ANN解决实际问题如模式识别故障检测智能机器人等研究ANN方法 1 生理结构的模拟用仿生学观点探索人脑的生理结构把对人脑的微观结构及其智能行为的研究结合起来即人工神经网络 ArtificialNeuralNetwroks 简称ANN 方法 2 宏观功能的模拟从人的思维活动和智能行为的心理学特性出发利用计算机系统来对人脑智能进行宏观功能的模拟即符号处理方法 ANN研究的目的和意义 1 通过揭示物理平面与认知平面之间的映射了解它们相互联系和相互作用的机理从而揭示思维的本质探索智能的本源 2 争取构造出尽可能与人脑具有相似功能的计算机即ANN计算机 3 研究仿照脑神经系统的人工神经网络将在模式识别组合优化和决策判断等方面取得传统计算机所难以达到的效果神经网络研究的发展 1 第一次热潮 40 60年代未 1943年美国心理学家W McCulloch和数学家W Pitts在提出了一个简单的神经元模型即MP模型 1958年 F Rosenblatt等研制出了感知机 Perceptron 2 低潮 70 80年代初 3 第二次热潮1982年美国物理学家J J Hopfield提出Hopfield模型它是一个互联的非线性动力学网络他解决问题的方法是一种反复运算的动态过程这是符号逻辑处理方法所不具备的性质 1987年首届国际ANN大会在圣地亚哥召开国际ANN联合会成立创办了多种ANN国际刊物 1990年12月北京召开首届学术会议人工神经网络研究的局限性 1 ANN研究受到脑科学研究成果的限制 2 ANN缺少一个完整成熟的理论体系 3 ANN研究带有浓厚的策略和经验色彩 4 ANN与传统技术的接口不成熟人工神经网络概述什么是人工神经网络 T Koholen的定义人工神经网络是由具有适应性的简单单元组成的广泛并行互连的网络它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应二神经元与神经网络大脑可视作为1000多亿神经元组成的神经网络图3神经元的解剖图神经元的信息传递和处理是一种电化学活动树突由于电化学作用接受外界的刺激通过胞体内的活动体现为轴突电位当轴突电位达到一定的值则形成神经脉冲或动作电位再通过轴突末梢传递给其它的神经元从控制论的观点来看这一过程可以看作一个多输入单输出非线性系统的动态过程神经网络研究的两个方面从生理上解剖学上进行研究从工程技术上算法上进行研究脑神经信息活动的特征 1 巨量并行性 2 信息处理和存储单元结合在一起 3 自组织自学习功能神经网络基本模型神经元的数学模型图4神经元的数学模型其中x x1 xm T输入向量 y为输出 wi是权系数输入与输出具有如下关系为阈值 f X 是激发函数它可以是线性函数也可以是非线性函数例如若记取激发函数为符号函数则 S型激发函数或注若将阈值看作是一个权系数 1是一个固定的输入另有m 1个正常的输入则 1 式也可表示为 1 参数识别假设函数形式已知则可以从已有的输入输出数据确定出权系数及阈值 2 神经网络的数学模型众多神经元之间组合形成神经网络例如下图的含有中间层隐层的B P网络基本BP网络的拓扑结构 b1 bi a1 c1 cq cj ah bp an Wp1 Wiq Wpj W1q W1j Wij V11 W11 Wpq Wi1 Vh1 Vhi V1i Vn1 Vni V1p Vhp Vnp 输出层LC 隐含层LB 输入层LA W V ANN类型与功能一般而言 ANN与经典计算方法相比并非优越只有当常规方法解决不了或效果不佳时ANN方法才能显示出其优越性尤其对问题的机理不甚了解或不能用数学模型表示的系统如故障诊断特征提取和预测等问题 ANN往往是最有利的工具另一方面 ANN对处理大量原始数据而不能用规则或公式描述的问题表现出极大的灵活性和自适应性人工神经网络 ArtificialNeuronNets ANN 例 1981年生物学家格若根 W Grogan 和维什 W Wirth 发现了两类蚊子或飞蠓midges 他们测量了这两类蚊子每个个体的翼长和触角长数据如下翼长触角长类别1 641 38Af1 821 38Af1 901 38Af1 701 40Af1 821 48Af1 821 54Af2 081 56Af 翼长触角长类别1 781 14Apf1 961 18Apf1 861 20Apf1 721 24Af2 001 26Apf2 001 28Apf1 961 30Apf1 741 36Af 问如果抓到三只新的蚊子它们的触角长和翼长分别为 l 24 1 80 l 28 1 84 1 40 2 04 问它们应分别属于哪一个种类解法一把翼长作纵坐标触角长作横坐标那么每个蚊子的翼长和触角决定了坐标平面的一个点其中6个蚊子属于APf类用黑点表示 9个蚊子属Af类用小圆圈表示得到的结果见图1 图1飞蠓的触角长和翼长思路作一直线将两类飞蠓分开例如取A 1 44 2 10 和B 1 10 1 16 过AB两点作一条直线 y 1 47x 0 017其中X表示触角长 y表示翼长分类规则设一个蚊子的数据为 x y 如果y 1 47x 0 017 则判断蚊子属Apf类如果y 1 47x 0 017 则判断蚊子属Af类分类结果 1 24 1 80 1 28 1 84 属于Af类 1 40 2 04 属于Apf类图2分类直线图缺陷根据什么原则确定分类直线若取A 1 46 2 10 B 1 1 1 6 不变则分类直线变为y 1 39x 0 071 分类结果变为 1 24 1 80 1 40 2 04 属于Apf类 1 28 1 84 属于Af类哪一分类直线才是正确的呢因此如何来确定这个判别直线是一个值得研究的问题一般地讲应该充分利用已知的数据信息来确定判别直线再如如下的情形已经不能用分类直线的办法新思路将问题看作一个系统飞蠓的数据作为输入飞蠓的类型作为输出研究输入与输出的关系基本BP网络的拓扑结构 b1 bi a1 c1 cq cj ah bp an Wp1 Wiq Wpj W1q W1j Wij V11 W11 Wpq Wi1 Vh1 Vhi V1i Vn1 Vni V1p Vhp Vnp 输出层LC 隐含层LB 输入层LA W V 四反向传播算法 B P算法 Backpropagationalgorithm 1 简单网络的B P算法算法的目的根据实际的输入与输出数据计算模型的参数权系数图6简单网络假设有P个训练样本即有P个输入输出对 Ip Tp p 1 P 其中输入向量为目标输出向量为实际上的网络输出向量为理论上的记wij为从输入向量的第j j 1 m 个分量到输出向量的第i i 1 n 个分量的权重通常理论值与实际值有一误差网络学习则是指不断地把与比较并根据极小原则修改参数wij 使误差平方和达最小记 Delta学习规则 4 3 表示递推一次的修改量则有称为学习的速率 ipm 1 wim 第i个神经元的阈值 5 注由 1 式第i个神经元的输出可表示为特别当f是线性函数时 6 图7多层前馈网络 2 多层前馈网络 l 输入层不计在层数之内它有N0个神经元设网络共有L层输出层为第L层第k层有Nk个神经元假设 wk i j 表示从第k 1层第j个元到第k层第i个元的权重表第k层第i个元的输出 3 设层与层间的神经元都有信息交换否则可设它们之间的权重为零但同一层的神经元之间无信息传输 4 设信息传输的方向是从输入层到输出层方向因此称为前向网络没有反向传播信息 5 表示输入的第j个分量假设在上述假定下网络的输入输出关系可以表示为 7 其中表示第k层第i个元的阈值定理2对于具有多个隐层的前馈神经网络设激发函数为S函数且指标函数取 8 9 则每个训练循环中按梯度下降时其权重迭代公式为 10 表示第 1层第个元对第层第个元输入的第次迭代时的权重其中 11 12 BP算法 Step1 选定学习的数据 p 1 P 随机确定初始权矩阵W 0 Step2 用 10 式反向修正直到用完所有学习数据用学习数据计算网络输出 Step3 五应用之例蚊子的分类已知的两类蚊子的数据如表1 翼长触角长类别1 781 14Apf1 961 18Apf1 861 20Apf1 721 24Af2 001 26Apf2 001 28Apf1 961 30Apf1 741 36Af 目标值0 90 90 90 10 90 90 90 1 翼长触角长类别1 641 38Af1 821 38Af1 901 38Af1 701 40Af1 821 48Af1 821 54Af2 081 56Af 目标t0 10 10 10 10 10 10 1 输入数据有15个即 p 1 15 j 1 2 对应15个输出建模输入层中间层输出层每层的元素应取多少个建立神经网络规定目标为当t 1 0 9时表示属于Apf类 t 2 0 1表示属于Af类设两个权重系数矩阵为分析如下为第一层的输出同时作为第二层的输入其中为阈值为激励函数阈值作为固定输入神经元相应的权系数则有取激励函数为同样取 1 随机给出两个权矩阵的初值例如用MATLAB软件时可以用以下语句令p 0 具体算法如下 rand 2 3 rand 1 3 2 根据输入数据利用公式算出网络的输出取 3 计算 4 取或其他正数可调整大小 j 1 2 3 i 1 2 3 j 1 2 3 6 p p 1 转 2 注仅计算一圈 p 1 2 15 是不够的直到当各权重变化很小时停止本例中共计算了147圈迭代了2205次最后结果是即网络模型的解为 BP网络建模特点非线性映照能力神经网络能以任意精度逼近任何非线性连续函数在建模过程中的许多问题正是具有高度的非线性并行分布处理方式在神经网络中信息是分布储存和并行处理的这使它具有很强的容错性和很快的处理速度自学习和自适应能力神经网络在训练时能从输入输出的数据中提取出规律性的知识记忆于网络的权值中并具有泛化能力即将这组权值应用于一般情形的能力神经网络的学习也可以在线进行数据融合的能力神经网络可以同时处理定量信息和定性信息因此它可以利用传统的工程技术数值运算和人工智能技术符号处理多变量系统神经网络的输入和输出变量的数目是任意的对单变量系统与多变量系统提供了一种通用的描述方式不必考虑各子系统间的解耦问题神经网络的应用人工神经网络以其具有自学习自组织较好的容错性和优良的非线性逼近能力受到众多领域学者的关注在实际应用中 80 90 的人工神经网络模型是采用误差反传算法或其变化形式的网络模型简称BP网络目前主要应用于函数逼近模式识别分类和数据压缩或数据挖掘基本BP网络的拓扑结构 b1 bi a1 c1 cq cj ah bp an Wp1 Wiq Wpj W1q W1j Wij V11 W11 Wpq Wi1 Vh1 Vhi V1i Vn1 Vni V1p Vhp Vnp 输出层LC 隐含层LB 输入层LA W V 1 样本数据1 1收集和整理分组采用BP神经网络方法建模的首要和前提条件是有足够多典型性好和精度高的样本而且为监控训练学习过程使之不发生过拟合和评价建立的网络模型的性能和泛化能力必须将收集到的数据随机分成训练样本检验样本 10 以上和测试样本 10 以上 3部分此外数据分组时还应尽可能考虑样本模式间的平衡 2 神经网络拓扑结构的确定2 1隐层数一般认为增加隐层数可以降低网络误差Hornik等早已证明若输入层和输出层采用线性转换函数隐层采用Sigmoid转换函数则含一个隐层的MLP网络能够以任意精度逼近任何有理函数显然这是一个存在性结论在设计BP网络时可参考这一点应优先考虑3层BP网络即有1个隐层一般地靠增加隐层节点数来获得较低的误差其训练效果要比增加隐层数更容易实现在确定隐层节点数时必须满足下列条件隐层节点数必须小于N 1输入层的节点数变量数必须小于N 1 2 训练样本数必须多于网络模型的连接权数一般为2 10倍否则样本必须分成几部分并采用轮流训练的方法才可能得到可靠的神经网络模型 2 2隐层节点数学习率和冲量系数大的学习率可能使网络权值每一次的修正量过大甚至会导致权值在修正过程中超出某个误差的极小值呈不规则跳跃而不收敛但过小的学习率导致学习时间过长不过能保证收敛于某个极小值所以一般倾向选取较小的学习率以保证学习过程的收敛性稳定性通常在0 01 0 8之间增加冲量项的目的是为了避免网络训练陷于较浅的局部极小点理论上其值大小应与权值修正量的大小有关但实际应用中一般取常量通常在0 1之间而且一般比学习率要大 4网络的初始连接权值由于Sigmoid转换函数的特性一般要求初始权值分布在 0 5 0 5之间比较有效 MATLAB神经网络工具箱的应用在网络训练过程中使用的是Matlab7 0forWindows软件对于BP神经元网络的训练可以使用NeuralNetworksToolboxforMatlab 美国的Mathwork公司推出的MATLAB软件包既是一种非常实用有效的科研编程软件环境又是一种进行科学和工程计算的交互式程序 MATLAB本身带有神经网络工具箱可以大大方便权值训练减少训练程序工作量有效的提高工作效率 BP神经网络学习算法的MATLAB实现 MATLAB中BP神经网络的重要函数和基本功能 BP神经网络学习算法的MATLAB实现 MATLAB中BP神经网络的重要函数和基本功能newff 功能建立一个前向BP网络格式net newff PR S1S2 SN1 TF1TF2 TFN1 BTF BLF PF 说明net为创建的新BP神经网络 PR为网络输入取向量取值范围的矩阵 S1S2 SNl 表示网络隐含层和输出层神经元的个数 TFlTF2 TFN1 表示网络隐含层和输出层的传输函数默认为 tansig BTF表示网络的训练函数默认为 trainlm BLF表示网络的权值学习函数默认为 learngdm PF表示性能数默认为 mse BP神经网络学习算法的MATLAB实现 MATLAB中BP神经网络的重要函数和基本功能tansig 功能正切sigmoid激活函数格式a tansig n 说明双曲正切Sigmoid函数把神经元的输入范围从映射到 1 1 它是可导函数适用于BP训练的神经元 logsig 功能对数Sigmoid激活函数格式a logsig N 说明对数Sigmoid函数把神经元的输入范围从映射到 0 1 它是可导函数适用于BP训练的神经元 BP神经网络学习算法的MATLAB实现例2 3 下表为某药品的销售情况现构建一个如下的三层BP神经网络对药品的销售进行预测输入层有三个结点隐含层结点数为5 隐含层的激活函数为tansig 输出层结点数为1个输出层的激活函数为logsig 并利用此网络对药品的销售量进行预测预测方法采用滚动预测方式即用前三个月的销售量来预测第四个月的销售量如用1 2 3月的销售量为输入预测第4个月的销售量用2 3 4月的销售量为输入预测第5个月的销售量如此反复直至满足预测精度要求为止 BP神经网络学习算法的

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

BP神经网络详解与实例.ppt

文档简介

温馨提示

最新文档

评论

BP神经网络详解与实例.ppt

文档简介

温馨提示

最新文档

评论

相关文档