版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、目 录第一节 神经网络基本理论一、人工神经网络概论二、生物神经元模型三、Matlab的神经网络工具包第二节 感知器一、感知器神经元模型二、感知器的网络结构三、感知器神经网络的学习规则四、感知器神经网络的训练五、重要的感知器神经网络函数的使用方法六、感知器神经网络应用举例第三节 线性神经网络一、线性神经元模型二、线性神经网络结构三、线性神经学习网络的学习规则四、线性神经网络训练五、重要线性神经网络函数的使用方法六、线性神经网络的应用举例第四节 BP网络一、BP网络的网络结构二、BP网络学习规则三、BP网络的训练四、重要BP神经网络函数的使用方法五、BP网络的应用举例第五节 径向基函数网络一、径向
2、基函数神经网络结构二、径向基函数的学习算法三、重要径向基函数的函数使用方法第六节 反馈网络一、Hopfield网络的结构与算法二、Hopfield网络运行规则三、重要的反馈网络函数四、重要的自组织网络函数五、反馈网络应用举例第七节 自组织网络一、自组织特征映射的网络结构二、自组织特征映射网络的学习三、自组织特征映射网络的训练四、重要的自组织网络函数五、自组织网络应用举例第一节 神经网络基本理论一、人工神经网络概论近代神经生理学和神经解剖学的研究结果表明,人脑是由约一千多亿个神经元(大脑皮层约140多亿,小脑皮层约1000多亿)交织在一起的、极其复杂的网状结构,能完成智能、思维、情绪等高级精神活
3、动,无论是脑科学还是智能科学的发展都促使人们对人脑(神经网络)的模拟展开了大量的工作,从而产生了人工神经网络这个全新的研究领域。人工神经网络(ANNS)常常简称为神经网络(NNS),是以计算机网络系统模拟生物神经网络的智能计算系统, 是对人脑或自然神经网络的若干基本特性的抽象和模拟。网络上的每个结点相当于一个神经元,可以记忆(存储)、处理一定的信息,并与其它结点并行工作。神经网络的研究最早要追述到40年代心理学家Mcculloch和数学家Pitts合作提出的兴奋与抑制型神经元模型和Hebb提出的神经元连接强度的修改规则,其成果至今仍是许多神经网络模型研究的基础。5060年代的代表性工作主要有R
4、osenblatt的感知器模型、Widrow的自适应网络元件Adaline。然而在1969年Minsky和Papert合作发表的Perceptron一书中阐述了一种消极悲观的论点,在当时产生了极大的消极影响,加之数字计算机正处于全盛时期并在人工智能领域取得显著成就,这导致了70年代人工神经网络的研究处于空前的低潮阶段。80年代以后,传统的Von Neumann数字计算机在模拟视听觉的人工智能方面遇到了物理上不可逾越的障碍。与此同时Rumelhart、Mcclelland和Hopfield等人在神经网络领域取得了突破性进展,神经网络的热潮再次掀起。目前较为流行的研究工作主要有:前馈网络模型、反馈
5、网络模型、自组织网络模型等方面的理论。人工神经网络是在现代神经科学的基础上提出来的。它虽然反映了人脑功能的基本特征,但远不是自然神经网络的逼真描写,而只是它的某种简化抽象和模拟。求解一个问题是向人工神网络的某些结点输入信息,各结点处理后向其它结点输出,其它结点接受并处理后再输出,直到整个神经网工作完毕,输出最后结果。如同生物的神经网络,并非所有神经元每次都一样地工作。如视、听、摸、想不同的事件(输入不同),各神经元参与工作的程度不同。当有声音时,处理声音的听觉神经元就要全力工作,视觉、触觉神经元基本不工作,主管思维的神经元部分参与工作;阅读时,听觉神经元基本不工作。在人工神经网络中以加权值控制
6、结点参与工作的程度。正权值相当于神经元突触受到刺激而兴奋,负权值相当于受到抑制而使神经元麻痹直到完全不工作。如果通过一个样板问题“教会”人工神经网络处理这个问题,即通过“学习”而使各结点的加权值得到肯定,那么,这一类的问题它都可以解。好的学习算法会使它不断积累知识,根据不同的问题自动调整一组加权值,使它具有良好的自适应性。此外,它本来就是一部分结点参与工作。当某结点出故障时,它就让功能相近的其它结点顶替有故障结点参与工作,使系统不致中断。所以,它有很强的容错能力。人工神经网络通过样板的“学习和培训”,可记忆客观事物在空间、时间方面比较复杂的关系,适合于解决各类预测、分类、评估匹配、识别等问题。
7、例如,将人工神经网络上的各个结点模拟各地气象站,根据某一时刻的采样参数(压强、湿度、风速、温度),同时计算后将结果输出到下一个气象站,则可模拟出未来气候参数的变化,作出准确预报。即使有突变参数(如风暴,寒流)也能正确计算。所以,人工神经网络在经济分析、市场预测、金融趋势、化工最优过程、航空航天器的飞行控制、医学、环境保护等领域都有应用的前景。人工神经网络的特点和优越性使它近年来引起人们的极大关注,主要表现在三个方面:第一,具有自学习功能。例如实现图像识别时,只需把许多不同的图像样板和对应的应识别的结果输入人工神经网络,网络就会通过自学习功能,慢慢学会识别类似的图像。自学习功能对于预测有特别重要
8、的意义。人工神经网络计算机将为人类提供经济预测、市场预测、效益预测,其前途是很远大的。第二,具有联想存储功能。人的大脑是具有联想功能的。如果有人和你提起你幼年的同学张某某,你就会联想起张某某的许多事情。用人工神经网络的反馈网络就可以实现这种联想。第三,具有高速寻找最优解的能力。寻找一个复杂问题的最优解,往往需要很大的计算量,利用一个针对某问题而设计的人工神经网络,发挥计算机的高速运算能力,可能很快找到最优解。人工神经网络是未来微电子技术应用的新领域,智能计算机的构成就是作为主机的冯·诺依曼计算机与作为智能外围机的人工神经网络的结合。二、生物神经元模型神经元是脑组织的基本单元,其结构如
9、图1所示,神经元由三部分构成:细胞体,树突和轴突;每一部分虽具有各自的功能,但相互之间是互补的。树突是细胞的输入端,通过细胞体间联结的节点“突触”接受四周细胞传出的神经冲动;轴突相当于细胞的输出端,其端部的众多神经未梢为信号的输出端子,用于传出神经冲动。神经元具有兴奋和抑制的两种工作状态。当传入的神经冲动,使细胞膜电位升高到阀值(约为40mV)时,细胞进入兴奋状态,产生神经冲动,由轴突输出。相反,若传入的神经冲动,使细胞膜电位下降到低于阀值时,细胞进入抑制状态,没有神经冲动输出。图1 生物神经元结构二、人工神经元模型人工神经元模型是以大脑神经细胞的活动规律为原理的,反映了大脑神经细胞的某些基本
10、特征,但不是也不可能是人脑细胞的真实再现,从数学的角度而言,它是对人脑细胞的高度抽象和简化的结构模型。虽然人工神经网络有许多种类型,但其基本单元人工神经元是基本相同的。如图2是一个典型的人工神经元模型:图2 人工神经元模型神经元模型相当于一个多输入单输出的非线性阀值元件,X1,X2,Xn表示神经元的n个输入,W1,W2,Wn表示神经元之间的连接强度,称为连接权,称为神经元的激活值,O表示这个神经元的输出,每个神经元有一个阀值,如果神经元输入信号的加权和超过,神经元就处于兴奋状态。以数学表达式描述为:O=f(-)三、Matlab的神经网络工具包由于神经网络自身的特点,计算中经常涉及到大量的训练样
11、本数据、复杂的运算操作、繁琐的程序设计等问题。对此,具有强大功能的数学软件Matlab,为我们提供了神经网络工具箱Neural Netwoks Toolbox (NNT)及丰富的函数命令。NNT是进行神经网络训练和仿真的优良平台。常用来对网络进行初始化、仿真、设计、调整、优化。集成化的处理方式、友好的界面、形象的演示过程、简易的操作,为神经网络应用者节约了大量的不必要的编程时间,使得非专业人士应用神经网络成为了可能。Matlab是Mathworks公司开发的工程计算软件包,其中有一个神经网络工具包,可以用来方便地创建各种神经网络,对数据进行学习和模拟输出。Matlab中普遍采用的是物理和工程学
12、中强有力的矩阵描述的语言,简洁优美。第二节 感知器感知器(Pereceptron)是一种特殊的神经网络模型,是由美国心理学家F.Rosenblatt于1958年提出的,一层为输入层,另一层具有计算单元,感知器特别适合于简单的模式分类问题,也可用于基于模式分类的学习控制和多模态控制中。一、感知器神经元模型感知器神经元通过对权值的训练,可以使感知器神经元的输出能代表对输入模式进行的分类,图2.1为感知器神经元模型。x1x2xRoooiwi1wi2wiR1o图2.1 感知器神经元模型感知器神经元的每一个输入都对应于一个合适的权值,所有的输入与其对应权值的加权和作为阀值函数的输入。由于阀值函数的引入,
13、从而使得感知器可以将输入向量分为两个区域,通常阀函数采用双极阶跃函数,如: (2.1)而感知器神经元模型的实际输出为 (2.2)其中b为阀值二、感知器的网络结构图2.2所描述的是一个简单的感知器网络结构,输入层有R个输入,Q个输出,通过权值wij与s个感知器神经元连接组成的感知器神经网络。P oN1 obR×QS×RS×1S×QnS×Qa图2.2 感知器神经网络结构 根据网络结构,可以写出感知器处理单元对其输入的加权和操作,即: (2.3)而其输出ai为ai=f (ni+bi) (2.4)由式2.1易知 (2.5)则当输入ni+bi大于等于0,
14、即有nibi时,感知器的输出为1;否则输出为0。上面所述的单层感知器神经网络是不可能解决线性不可分的输入向量分类问题,也不能推广到一般的前向网络中去。为解决这一问题,我们可以设计多层感知器神经网络以实现任意形状的划分。图2.3描述了一个双层感知器神经网络。其工作方式与单层感知器网络一样,只不过是增加了一层而已,具体的内容这里不做讨论。P ow11 obR×QS×RS×1a1W2a2图2.3 感知器神经网络结构 ob三、感知器神经网络的学习规则感知器的学习规则主要是通过调整网络层的权值和阀值以便能够地网络的输入向量进行正确的分类。如图2.2所示的输入向量P、输出和量
15、a和目标向量为t的感知器神经网络,感知器的学习规则是根据以下输出矢量a可能出现的几种情况未进行参与调整的:1)如果第i个神经元的输出是正确的,即有ait1,则与第i个神经元联接的权值和阀值保持不变。2)如果第i个神经元的输出是不正确,应该有两种情况。i)实际输出为0,而理想输出为1,即有ai=0,而ti1,则所有的输入j对权值和阀值进行调整,修正值w1j=pj,bj=1。ii)实际输出为1,而期望输出为0,即有ai=1,而ti=0,则对所有的输入j进行权值和阀值调整,w1j=pj,bi=1。基于感知器误差e=ta,感知器学习规则可望写为:w1j=ei·pj可以证明当前输入样本来自线性
16、可分的模式时,上述学习算法在有限步同收敛,这时所得的权值能对所有样本正确分类,这一结论被称为感知器收敛定理。四、感知器神经网络的训练要使前向神经网络模型实现某种功能,必须对它进行训练,让它逐步学会要做的事情,并把所学到的知识记忆在网络的权值中。感知器神经网络的训练是采用由一组样本组成的集合来进行。在训练期间,将这些样本重复输入,通过调整权值使感知器的输出达到所要求的理想输出。感知器的训练主要是反复对感知器神经网络进行仿真和学习,最终得到最优的网络阀值和权值。我们可以用以下方法训练网络:1) 确定我们所解决的问题的输入向量P、目标向量t,并确定各向量的维数,以及网络结构大小、神经元数目。假定我们
17、采用图2.2的网络结构。2)初始化:权值向量w和阀值向量b分别赋予1,+1之间的随机值,并且给出训练的最大次数。3)根据输入向量P、最新权值向量w和阀值向量b,计算网络输出向量a。4)检查感知器输出向量与目标向量是否一致,或者是否达到了最大的训练次数,如果是则结束训练,否则转入(5)。5)根据感知器学习规则调查权向量,并返回3)。五、重要的感知器神经网络函数的使用方法对于感知器的初始化、训练、仿真,在MATLABP神经网络工具箱中分别提供了init( ), trainp( )和sim( )函数。1初始化函数init( )感知器初始化函数init( )可得到R个输入,S个神经元数的感知器层的权值
18、和阀值,其调用格式为:w,b=init(R,S)另外,也可以利用输入向量P和目标向量t来初始化。w,b=init(p,t)在介绍trainp( )函数前,让我们先介绍一下训练的控制参数tp。tp=disp_freq max_epoch其中disp_freq指定两次显示间训练次数,缺省值为1;map_epoch指定训练的最大次数,缺省值为100。调用训练函数trainp( )函数后又得到新的权值矩阵,阀值向量以及误差te。trainp( )函数所需要的输入变量为:输入向量P、目标向量t以及网络的初始权值和阀值,训练的控制参数tp。调用格式为:w,b,te=trainp(w,b,p,t,tp)由于
19、函数trainp( )并不能保证感知器网络所得到的网络权值和阀值达到要求。因此,在训练完后,要用下列验证语句验证一下。a=sim(p, w, b);if all(a= =t),disp( It works!),end假如网络不能成功运行,就可以继续运用trainp( )函数对网络进行训练。经足够的训练后,网络仍达不到要求,那么就应当认真分析一下,感知器网络是否适合于这个问题。3仿真函数sim( )sim( )函数主要用于计算网络输出。它的调用比较简单。a=sim(p,w,b)六、感知器神经网络应用举例为了便于消化与理解感知器神经网络的四只问题,下面将给出一个具体的问题进行分析,问题的描述如下:
20、两种蠓虫Af和Apf已由生物学家W.L.Grogan与w. w. Wirth(1981)根据它们触角长度和翼长中以区分。见表2.1中9Af蠓和6只Apf蠓的数据。根据给出的触角长度和翼长可识别出一只标本是Af还是Apf。1给定一只Af或者Apf族的蒙,你如何正确地区分它属于哪一族?2将你的方法用于触角长和翼中分别为(1.24,1.80)、(1.28,1.84)、(1.40,2.04)的三个标本表2.1Af触重长1.241.361.381.3781.381.401.481.541.56翼 长1.721.741.641.821.901.701.701.822.08Apf触角长1.141.181.2
21、01.261.281.30翼 长1.781.961.862.002.001.96输入向量为:p=1.24 1.36 1.38 1.378 1.38 1.40 1.48 1.54 1.56 1.14 1.18 1.20 1.26 1.28 1.30;1.72 1.74 1.64 1.82 1.90 1.70 1.70 1.82 2.08 1.78 1.96 1.86 2.00 2.00 1.96 目标向量为:图2.4 样本图形显示t=1 1 1 1 1 1 1 1 1 0 0 0 0 0 0图形显示,目标值1对应的用“+”、目标值0对应的用“o”来表示:plotpv(p,t)为解决该问题,利用函
22、数newp构造输入量在0,2.5之间的感知器神经网络模型:net=newp(0 2.5;0 2.5,1)初始化网络:net=init(net)利用函数adapt调整网络的权值和阀值,直到误差为0时训练结束:net, y, e=adapt(net, p, t)训练结束后可得如图2.5的分类方式,可见感知器网络将样本正确地分成两类:图2.5 网络训练结果感知器网络训练结束后,可以利用函数sim进行仿真,解决实际的分类问题:p1=1.24;1.80a1=sim(net,p1)p2=1.28;1.84a2=sim(net,p2)p3=1.40;2.04a3=sim(net,p3)网络仿真结果为:a1=
23、0 a2=0 a3=0第三节 线性神经网络线性神经网络是最简单的一种神经元网络,由一个或多个线性神经元构成。1959年,美国工程师B.widrow和M.Hoft提出自适应线性元件(Adaptive linear element,简称Adaline)是线性神经网络的最早典型代表。它是感知器的变化形式,尤其在修正权矢量的方法上进行了改进,不仅提高了训练收敛速度,而且提高了训练精度。线性神经网络与感知器神经网络的主要不同之处在于其每个神经元的传递函数为线性函数,它允许输出任意值,而不是象感知器中只能输出0或1。此外,线性神经网络一般采用WidrowHoff(简称WH)学习规则或者最小场方差(Leas
24、t mean Square,简称LMS)规则来调整网络的权值和阀值。线性神经网络的主要用途是线性逼近一个函数表达式,具有联想功能。另外,它还适用于信号处理滤波、预测、模式识别和控制等方面。一、线性神经元模型线性神经元可以训练学习一个与之对应的输入输出函数关系,或线性逼近任意一个非线性函数,但它不能产生任何非线性的计算特性。图3.1描述了一个具有R个输入的由纯线性函数组成的线性神经元。P1P2PRooow1w2wRb1a图3.1 线性神经元模型由于线性神经网络中神经元的传递函数为线性函数,其输入与输出之间是简单的比例关系:a=g(w*p,b)其中函数g(x)为线性函数。二、线性神经网络结构如图3
25、.2描述了一个由S个神经元相并联形成一层网络,这种网络也称为Madaline网络。P oN1 obR×1S×RS×1S×1nS×1a图3.2 线性神经元网络WH学习规则只能训练单层的线性神经网络,但这并不是什么严重问题。因为对线性神经网络而言,完全可以设计出一个性能完全相当的单层线性神经网络。三、线性神经学习网络的学习规则前面我们提到过,线性神经网络采用WH学习规则。WH学习规则是Widrow是Hoft提出的用来求得权值和阀值的修正值的学习规则。首先要定义一个线性网络的输出误差函数:E(w,b)=(ta)2=(tw*p)2 3.1由式3.1可看
26、出,线性网络具有抛物线型误差函数所形成的误差表面。所以只有一个误差最小值。通过WH学习规则来计算权值和偏差的变化,并使网络的误差平方和最小化,总能够训练一个网络的误差趋于最小值。这可通过沿着相对于误差平方和最速下降方向连续调整网络的权值和阀值来实现。根据梯度下降法,权矢量的修正值正比于当前位置上E(w,b)的梯度,对于第i输出节点为: 3.2或表示为: 3.3 3.4这里i定义为第i个输出节点的误差:i=tiai 3.5式3.3称为WH学习规则。WH学习规则的权值变化量正比于网络的输出误差及网络的输入向量。它不需求导数,所以算法简单,又具有收敛速度快和精度高的优点。式3.3中的ç称为
27、学习率,学习率的选取可以适当防止学习过程中产生振荡,提高收敛速度和精度。四、线性神经网络训练首先给线性神经网络提供输入向量P,计算线性网络层的输出向量a,并求得误差e=ta;然后比较输出的误差平方和是否小于期望的误差平方和,如果是,则停止训练;否则,采用WH规则调整权值和阀值,反复进行。如果经过训练网络不能达到期望目标,可以继续对网络进行训练。经过足够的训练后,网络还是达不到要求。那么就仔细地分析一下, 所要解决的问题,是否适合于线性神经网络。五、重要线性神经网络函数的使用方法在MATLAB神经网络工具箱中提供了基于线性神经网络的初始化函数initlin( )、设计函数solvelin( )、
28、仿真函数simulin( )以及训练函数trainwh和adaptwh。下面我们将分别介绍多种函数的使用方法。1初始化函数initlin( )函数initlin( )对线性神经网络初始化时,将权值和阀值取为绝对值很小的数。其使用格式w,b=initlin(R,S)R为输入数,S为神经元数。另外,R和S也可用输入向量P和目标向量t来代替,即w,b=initlin(p,t)2设计函数solvelin( )与大多数其它神经网络不同,只要已知其输入向量P和目标向量t,就可以直接设计出线性神经网络使得线性神经网络的权值矩阵误差最小。其调用命令如下:w,b=solve lin(p,t);3仿真函数simu
29、lin( )函数simulin( )可得到线性网络层的输出a=simulin(p,w,b)其中a为输出向量,b为阀值向量4训练函数trainwh 和adaptwh( )线性神经网络的训练函数有两种:trainwh( )和adaptwh( )。其中函数trainwh可以对线性神经网络进行离线训练;而函数adaptwh( ) 可以对线性神经网络进行在线自适应训练。利用trainwh( )函数可以得到网络的权矩阵w,阀值向量b,实际训练次数te 以及训练过程中网络的误差平方和lr。w,b,te,lr=trainwh(w,b,p,t,tp)输入变量中训练参数tp为:·tp(1)指定两次更新显
30、示间的训练次数,其缺省值为25;·tp(2)指定训练的最大次数,其缺省值为100;·tp(3)指定误差平方和指标,其缺省值为0.02;·tp(4)指定学习速率,其缺省值可由maxlinlr( )函数(此函数主要用于计算采用WH规则训练线性网络的最大的稳定的分辨率)得到。而利用函数adaptwh( )可以得到网络的输出a、误差e、权值矩阵w和阀值向量b。a,e,w,b=adaptwh(w,b,p,t,lr)输入变量lr为学习速率,学习速率lr 为可选参数,其缺省值为10。另外,函数maxlinlr( )的调用格式为:lr=maxlinlr(p);六、线性神经网络的应
31、用举例为了理解线性神经网络的理论及其应用问题,下面给出一个实际问题进行分析,设计一个线性神经网络,用于信号仿真及信号预测。首先输入信号样本为:time=1:0.0025:5;p=sin(sin(time)*time*10);目标信号为:t=p*2+2;图形显示样本信号的规律为:plot(time, p, time, t, -)title(Input and Target Signals)xlabel(Time)ylabel(Input_ Target_)图3.3 样本信号利用输入样本信号和理想输出进行线性神经网络初始化:w,b=initlin(p,t)然后利用函数adaptwh对构造的网络进行
32、训练,lr=0.01; a, e, w, b=adaptwh(w, b, p, t, lr)其中lr为学习率,a为网络的输出,e为误差。仿真结果与目标信号对比分析:plot(time, a, time, t, -)title(Output and Target Signals)xlabel(Time); ylabel(Output_ Target_)图3.4 仿真结果与目标信号对比分析误差分析:plot(time,e)hold on; plot(min(time) max(time),0 0,':r')xlabel('Time'); ylabel('Er
33、ror')图3.5 误差分析第四节 BP网络感知器神经网络模型和线性神经网络模型虽然对人工神经网络的发展起了很大的作用,它们的出现也曾掀起了人们研究神经网络的热潮。但它们有许多不足之处。人们也曾因此失去了对神经网络研究的信心,但rumelhart、mcclellard和他们的同事洞悉到网络信息处理的重要性,并致力于研究并行分布信息处理方法,探索人类认知的微结构,于1985年发展了BP网络的学习算法。从而给人工神经网络增添了活力,使其得以全面迅速地恢复发展起来。BP网络是一种多层前馈神经网络,其神经元的激励函数为S型函数,因此输出量为0到1之间的连续量,它可以实现从输入到输出的任意的非线
34、性映射。由于其权值的调整是利用实际输出与期望输出之差,对网络的各层连接权由后向前逐层进行校正的计算方法,故而称为反向传播(Back-Propogation)学习算法,简称为BP算法。BP算法主要是利用输入、输出样本集进行相应训练,使网络达到给定的输入输出映射函数关系。算法常分为两个阶段:第一阶段(正向计算过程)由样本选取信息从输入层经隐含层逐层计算各单元的输出值;第二阶段(误差反向传播过程)由输出层计算误差并逐层向前算出隐含层各单元的误差,并以此修正前一层权值。BP网络主要用于函数逼近、模式识别、分类以及数据压缩等方面。一、BP网络的网络结构P oW11 oB1R×QS1×
35、RS1×1a2a1f11 ow2S2×S1b2S1×qf2S2×q隐含层输出层BP网络通常至少有一个隐含层,如图4.1所示的是一个具有R个输入和一个隐含层的神经网络模型。图4.1 具有一个隐含层的BP网络结构感知器与线性神经元的主要差别在于激励函数上:前者是二值型的,而后者是线性的。BP网络除了在多层网络上与已介绍过的模型有不同外,其主要差别也表现在激励函数上。图4.2所示的两种S型激励函数的图形,可以看到f(· )是连续可微的单调递增函数,这种激励函数的输出特性比较软,其输出状态的取值范围为0,1或者-1,+1,其硬度可以由参数来调节。函数的
36、输入输出关系表达式如下所示:双极型的S型激励函数:, f(net)(-1,1)单极型的S型激励函数:, f(net)(0,1)图4.2 sigmoid型函数图形对于多层网络,这种激励函数所划分的区域不再是线性划分,而是由一个非线性的超平面组成的区域。因为S型函数具有非线性的大系数功能。它可以把输入从负无穷到正无穷大的信号变换成1到1之间输出,所以采用S型函数可以实现从输入到输出的非线性映射。二、BP网络学习规则BP网络最为核心的部分便是网络的学习规则。用BP算法训练网络时有两种方式:一种是每输入一样本修改一次权值;另一种是批处理方式,即使组成一个训练周期的全部样本都依次输入后计算总的平均误差。
37、这里我们主要探讨的是后一种方式。下面我们给出两层网络结构示意简图4.3,并以此探讨BP算法。BP网络的学习过程主要由以下四部分组成: 1)输入样本顺传播 输入样本传播也就是样本由输入层经中间层向输出层传播计算。这一过程主要是输入样本求出它所对应的实际输出。 隐含层中第i个神经元的输出为 (4.1) 输出层中第k个神经元的输出为: (4.2)其中f1(·), f2 (·)分别为隐含层的激励函数。2)输出误差逆传播在第一步的样本顺传播计算中我们得到了网络的实际输出值,当这些实际的输出值与期望输出值不一样时,或者说其误差大于所限定的数值时,就要对网络进行校正。首先,定义误差函数E
38、(w,b)= (4.3)其次,给出权值的变化 输出层的权值变化从第i个输入到第k个输出的权值为: (4.4)其中: (4.5) (4.6) 隐含层的权值变化从第j个输入到第i个输出的权值为: (为学习系数) (4.7)其中: (4.8) (4.9)由此可以看出:调整是与误差成正比,即误差越大调整的幅度就越大。调整量与输入值大小成比例,在这次学习过程中就显得越活跃,所以与其相连的权值的调整幅度就应该越大,调整是与学习系数成正比。通常学习系数在0.10.8之间,为使整个学习过程加快,又不会引起振荡,可采用变学习率的方法,即在学习初期取较大的学习系数随着学习过程的进行逐渐减小其值。最后,将输出误差由
39、输出层经中间层传向输入层,逐层进行校正。3)循环记忆训练为使网络的输出误差尽可能的小,对于BP网络输入的每一组训练样本,一般要经过数百次甚至上万次的反复循环记忆训练,才能使网络记住这一样本模式。这种循环记忆训练实际上就是反复重复上面介绍的输入模式正向传播和输出误差逆传播过程。4)学习结束的检验当每次循环记忆结束后,都要进行学习是否结束的检验。检验的目的主要是检查输出误差是否已经符合要求。如果小到了允许的程度,就可以结束整个学习过程,否则还要进行循环训练。三、BP网络的训练对BP网络进行训练时,首先要提供一组训练样本,其中每个样本由输入样本和输出对组成。当网络的所有实际输出与其理想输出一致时,表
40、明训练结束。否则,通过修正权值,使网络的实际输出与理想输出一致。实际上针对不同具体情况,BP网络的训练有相应的学习规则,即不同的最优化算法,沿减少理想输出与实际输出之间误差的原则,实现BP网络的函数逼近、向量分类和模式识别。以图4.3为例来说明BP网络训练的主要过程。图4.3 含一个隐含层的BP网络结构首先:网络初始化,构造合理的网络结构(这里我们采用图4.3的网络结构),取可调参数(权和阀值)为-1,1上服从均匀分布随机数,并取定期望误差、最大循环次数和修正权值的学习率的初始值。其次,利用相应的BP网络学习规则对网络进行训练,求得权值修正后的误差平方和。最后,检查网络误差平方和是否降低到期望
41、误差之下,若是,训练结束,否则继续。四、重要BP神经网络函数的使用方法函数initff( )和simuff可以用来初始化和仿真不超过三层的前馈型网络。函数trainbp( )、trainbpx( )、trainlm( )可用来训练BP网络。其中trainlm( )的训练速度最快,但它需要更大的存储空间,也就是说它是以空间换取了时间;trainbpx( )的训练速度次之;trainlm( )最慢。1初始化函数initff( )函数initff( )的主要功能就是对至多三层的BP网络初始化。其使用格式有多种,现列如下:w,b=initff(p, s, f)w1, b1, w2, b2=initff
42、(p, s1, f1, s2, f2)w1, b1, w2, b2, w3, b3=initff(p, s1, f1, f2, s3, f3)w, b=initff(p, s, t)w1,b1,w2,b2=initff(p, s1, f1, s2, t)w1, b1, w2, b2, w3, b3=initff(p, s1, f1, s2, f2, s3, t)w, b=initff(p, s, f)可得到s个神经元的单层神经网络的权值和阀值,其中p为输入向量,f为神经元的激励函数。BP网络有一个特点很重要,即p中的每一行中必须包含网络期望输入的最大值和最小值,这样才能合理地初始化权值和阀值。
43、2仿真函数simuff( )BP网络是由一系列网络层组成,每一层都从前一层得到输入数据,函数simuff( )可仿真至多三层前馈型网络。对于不同的网络层数,其使用格式为:a=simuff(p, w1, b1, f1)a=simuff(p, w1, b1, f1, w2, b2, f2)a=simuff(p, w1, b1, f1, w2, b2, f2, w3, b3, f3)以上三式分别为单层、双层和三层网络结构的仿真输出。3训练函数关于前面所提到的几种BP网络训练函数,在这里只介绍其中之一:trainbp( )。函数trainbp( )利用BP算法训练前馈型网络。trainbp( )函数可
44、以训练单层、双层和三层的前馈型网络,其调用格式分别为:w, b, te, tr=trainbp(w, b, f,p, t, tp)w1, b1, w2, b2, te, tr=trainbp(w1,b1, f1,w2, b2, f2,p, t, tp)w1,b1,w2,b2,w3,b3,te,tr=trainbp(w1, b1, f1,w2, b2, f2,w3, b3, f3,p, t, tp)可选训练参数tp内的四个参数依次为:·tp(1)指定两次显示间的训练次数,其缺省值25;·tp(2)指定训练的最大次数,其缺省值100;·tp(3)指定误差平方和指标,其
45、缺省值0.02;·tp(4)指定学习速率,其缺省值0.01;只有网络误差平方和降低到期望误差之下,或者达到了最大训练次数,网络才停止学习。学习速率指定了权值与阀值的更新比例,较小学习速率会导致学习时间较长,但可提高网络权值收敛效果。五、BP网络的应用举例BP网络的函数逼近举例:设计一个BP网络,其隐含层神经元的激励函数为双曲正切函数,输出层神经元的激励函数为线性函数,学习样本为21组单输入矢量,理想输出为相应的单输出矢量。输入矢量为:p=-1:0.1:1;理想输出矢量为:t=-0.96 -0.577 -0.0729 0.377 0.641 0.66 0.461 0.1336 -0.2
46、01 -0.434 -0.5 -0.393 -0.1647 0.0988 0.3072 0.396 0.3449 0.1816 -0.0312 -0.2183 -0.3201;输入输出的函数关系曲线:plot(p,t)xlabel('Input')ylabel('Output')图4.4 输入输出关系利用输入和理想输出进行BP神经网络初始化:w1,b1,w2,b2=initff(p,5,'tansig',t,'purelin')利用函数trainbp对构造的BP网络进行训练:df=10me=8000eg=0.02lr=0.01tp
47、=df me eg lrw1,b1,w2,b2,ep,tr=trainbp(w1,b1,'tansig',w2,b2,'purelin',p,t,tp)其中df指定两次显示间的训练次数,其缺省值25;me指定训练的最大次数,其缺省值100;eg指定误差平方和指标,其缺省值0.02;lr指定学习速率,其缺省值0.01;训练结果与理想输出对比分析:图4.5 训练结果与理想输出对比分析网络的训练过程中,网络收敛效果一定程度上要受网络初始化的初始值的影响,实际输出和理想输出的误差的变化情况可以反映网络学习的效果,这一点可以通过如图4.6反映:ploterr(tr, eg
48、)其中tr为网络学习的循环次数。图4.6 误差曲线第五节 径向基函数网络我们前面所学习的多层前馈型网络模型对于每个输入输出数据对,网络的每一个权值均需要调整,这样的神经网络称之为全局逼近神经网络。全局逼近神经网络学习速度很慢,这对于控制来说常常是不可忽视的。下面我们将介绍一种新的网络:径向基函数(Radial basis Fanction简记为RBF)网络。径向基函数网络属于局部逼近网络,所谓局部逼近网络就是对于每个输入输出数据对,只有少量的权值需要进行调整,也正是基于这一点才使得局部逼近网络具有学习速度快的优点。另外,BP网络用于函数逼近时,权值的调整是同梯度下降法,存在局部极小和收敛速度慢
49、等缺点。而RBF网络在逼近能力、分类能力和学习速度等方面均优于BP网络。一、径向基函数神经网络结构如图5.1所示为径向基函数神经网络结构图。径向基函数网络输出单元是线性求和单元,所以输出是各隐单元输出的加权和。隐单元的作用函数用径向基函数,输入到隐单元间的权值固定为1,只有隐单元到输出单元的权值可调。输入层隐含层输出层pjSiwkiak图5.1 RBF网络结构图二、径向基函数的学习算法径向基函数网络的学习算法常用的有两种:一种是无导师学习,另一种便是有导师学习。这里我们只介绍无导师学习。无导师学习也称非监督学习,地所有样本的输入进行聚类,求得各隐层节点的RBF的中心Ci。具体的算法步骤如下:1
50、给定各隐节点的初始中心Ci( · );2计算距离(欧氏距离)并求出最小距离的节点;di (t) = p (t) Ci(t1), 1imdmin(t)=mindi(t)=dr(t) (5.1)式中,Ci第i个隐节点的中心, i=1,2,m; ·通常为欧氏范数。3调整中心Ci(t)=Ci(t1), 1im, irCr(t)=Ci(t1)+(p(t)-Cr(t1)式中,学习速率,0<<1。4计算节点r的距离dr(t)=p(t)-Cr(t) (5.3)三、重要径向基函数的函数使用方法径向基函数网络的仿真是用函数simurb( )来实现的,传递函数是radbas( ),而
51、它的训练可以用两个函数来实现,solverb或solverbe。1仿真函数simurb ( )径向基函数网络只有一个隐含层,隐含层单元采用径向基函数作为其输出特性,输入层到输出层之间的权值均固定为1,输出节点为线性求和单元,隐含层到输出层节点之间的权值可以调节。径向基函数网络能在有限步内以任意精度拟合函数,而且训练时间比较短。仿真函数simurb( )可得网络层的输出a=simurb(p,w1,b1,w2,b2)式中,p为输入矢量,w1,b1为径向基神经元层的权值和阀值,w2,b2为线性神经元的权值和阀值。2径向基传递函数rodbas( )径向基传递函数用于径向基网络中,其使用方式多种:rad
52、bas(n)radbas(z,b)其中radbas(n)函数可对网络输入矩阵n中的所有元素如同径向基函数。radbas(z,b)函数提供成批处理矢量,并且提供阀值的情况,这时阀值b与加权输入矩阵z是分开的,阀值b乘以z 中的每个矢量,以形成网络的输入矢量,然后利用径向基函数网络输入转换成输出。对于径向基函数的训练可用两个函数来实现。现在我们介绍如下:1)solverb ( )径向基函数网络能较好地拟合任意有限值函数,而且可以通过快速的设计来取代漫长的训练。利用solverb ( )函数可得到径向基函数隐层的权值w1和阀值b1,还得到了线性输出层的权值w2和阀值b2。w1, b1, w2, b2
53、=solverb(p, t, tp)其中设计参数tp指示如何进行训练。·tp(1)指定更新显示之间的迭代次数,其缺省值25;·tp(2)指定最多的神经元数,其缺省值100;·tp(3)误差平方和门限,缺省值为0.02;·tp(4)指定径向基层的宽度,缺省值1.0。2)函数solverbe( )函数solverbe( )的订功能是精确径向基函数求解。利用solverbe( )也可得到径向基网络隐层的权值w1和阀值b1,以及线性输出层的权值w2和阀值b2。其调用格式如下w1, b1, w2, b2=solverbe(p, t, sc)式中的可逆变量sc为径向
54、基函数的宽度,即从函数值为1到其值为0.5之间的距离,其缺省值为1。第六节 反馈网络 按照人工神经元网络运行过程中信息的流向分类。现有网络可分为前馈型和反馈型以及它们的结合。从计算的观点看,前馈型神经元网络大部分是学习网络而不具有的力学行为。在反馈式神经网络中,所有单元都是一样的,它们之间可以相互连接,所以反馈式神经网络可以用一个无向完备图来表示。从系统的观点看,反馈网络是一个非线性动力学系统。它必然具有一般非线性动力学系统的许多性质,如网络系统具有若干个稳定状态,当网络从某一初始状态开始运动,网络系统总可以收敛到某一个稳定的平衡状态;还有系统稳定的平衡状态可以通过设计网络的权值而被存储到网络中。在某些情况下,还有随机性和不可预测性等,因此,比前馈网络的内容要广阔
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 马鞍山职业技术学院《艺术形态采集课程设计》2023-2024学年第一学期期末试卷
- 吕梁学院《成本会计模拟》2023-2024学年第一学期期末试卷
- 2024年临时活动场地租赁合同范本
- 2025年南宁货车资格证试题及答案
- 2024年个人担保书填写说明3篇
- 2024年上门女婿财产分割及婚姻关系解除协议书3篇
- 洛阳文化旅游职业学院《池塘养殖学A》2023-2024学年第一学期期末试卷
- 2024年水利工程劳务分包协议样本
- 单位人事管理制度精彩选集
- 办公物业招投标攻略流程掌握
- 实验室水质监测的质量控制和质量保证
- 昆曲艺术学习通超星课后章节答案期末考试题库2023年
- 六年级上册英语-选择题-人教pep(含答案)
- 印象派美术课件
- 小学话剧课本剧兴趣小组社团教学设计附社团活动记录(已填好,直接打印)
- 《散文创作与研究》(10543)自考考试复习题库(含答案)
- 稳定系数计算表
- 河北省对口升学计算机基础资料课件
- Cytiva:层析介质寿命和清洁验证综合设计的良好实践白皮书
- 全冀教版六年级上册英语第四单元知识点总结
- 酒店接待醉酒客人流程课件
评论
0/150
提交评论