版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章 反馈神经网络,2,第五章 反馈神经网络,5.1 前言 5.2 Hopfield神经网络 5.3 Boltzmann模型 5.4 小结,3,5.1 前言,反馈网络又称递归网络,或回归网络。在反馈网络(Feedback NNs)中,输入信号决定反馈系统的初始状态,然后系统经过一系列状态转换以后,逐渐收敛于平衡状态。这样的平衡状态就是反馈网络经计算后的输出结果,由此可见,稳定性是反馈网络中最重要的问题之一。如果能找到网络的Lyapunov函数,则能保证网络从任意的初始状态都能收敛到局部最小点。 Hopfield神经网络是反馈网络中最简单且应用最广的模型,它具有联想记忆的功能。如果把Lyapu
2、nov函数定义为寻优函数的话,Hopfield网络还可用来解决快速寻优问题。,4,5.1 前言,在这类网络中,多个神经元互连以组成一个互连神经网络,如右图所示。,表示节点的状态,返回,有些神经元的输出被反馈至同层或前层神经元。因此,信号能够从正向和反向流通。Hopfield神经网络是反馈网络中最有代表性的例子。,5,5.2 Hopfield神经网络,Hopfield神经网络是美国物理学家J. J. Hopfield于1982年首先提出的。它主要用于模拟生物神经网络的记忆机理。 Hopfield网络是一种全连接型的神经网络。对于每一个神经元来说,自己的输出信号通过其它神经元又反馈到自己,所以Ho
3、pfield网络是一种反馈型神经网络。 Hopfield神经网络可分为离散型(DHNN)和连续型(CHNN)两种。,6,5.2 Hopfield神经网络,Hopfield神经网络状态的演变过程是一个非线性动力学系统,可以用一组非线性差分方程(对于离散型Hopfield神经网络)或微分方程(对于连续型Hopfield神经网络)来描述。系统的稳定性可用所谓的“能量函数”(即李雅普诺夫或哈密顿函数)进行分析。在满足一定条件下,某种“能量函数”的能量在网络运行过程中不断地减小,最后趋于稳定的平衡状态。,7,离散型Hopfield神经网络是一种单层的、输入输出为二值的反馈网络,它主要用于联想记忆,其结构
4、如图所示。,离散型Hopfield神经网络,8,网络的结构与工作方式,离散型反馈网络的拓扑结构,离散型Hopfield神经网络,9,(1)网络的状态 DHNN网中的每个神经元都有相同的功能,其输出称为状态,用 xj 表示。,j=1,2,n,所有神经元状态的集合就构成反馈网络的状态 X=x1,x2,xnT,反馈网络的输入就是网络的状态初始值,表示为 X(0)=x1(0), x2(0), xn(0)T,反馈网络在外界输入激发下,从初始状态进入动态演变过程,变化规律为,10,j=1,2,n,DHNN网的转移函数常采用符号函数,式中净输入为,j=1,2,n,对于DHNN网,一般有wii=0 ,wij=
5、wji。,反馈网络稳定时每个神经元的状态都不再改变,此时的稳定状态就是网络的输出,表示为,11,(2)网络的异步工作方式 网络运行时每次只有一个神经元进行状态的调整计算,其它神经元的状态均保持不变,即,(3)网络的同步工作方式 网络的同步工作方式是一种并行方式,所有神经元同时调整状态,即,j=1,2,n,12,1. 网络的稳定性 DHNN网实质上是一个离散的非线性动力学系统。网络从初态X(0)开始,若能经有限次递归后,其状态不再发生变化,即X(t+1)X(t),则称该网络是稳定的。 如果网络是稳定的,它可以从任一初态收敛到一个稳态:,网络的稳定性与吸引子,13,若网络是不稳定的,由于DHNN网
6、每个节点的状态只有1和-1两种情况,网络不可能出现无限发散的情况,而只可能出现限幅的自持振荡,这种网络称为有限环网络。,如果网络状态的轨迹在某个确定的范围内变迁,但既不重复也不停止,状态变化为无穷多个,轨迹也不发散到无穷远,这种现象称为浑沌。,14,网络达到稳定时的状态X,称为网络的 吸引子。 如果把吸引子视为问题的解,从初态朝吸引子演变的过程便是求解计算的过程。若把需记忆的样本信息存储于网络不同的吸引子,当输入含有部分记忆信息的样本时,网络的演变过程便是从部分信息寻找全部信息,即联想回忆的过程。,定义5.1 若网络的状态X 满足 X=f(WX-T) 则称X为网络的吸引子。,吸引子与能量函数,
7、15,定理5.1 对于DHNN 网,若按异步方式调整网络状态,且连接权矩阵W 为对称阵,则对于任意初态,网络都最终收敛到一个吸引子。 证明: 定义网络的能量函数为:,令网络的能量改变量为E,状态改变量为X,有,16,则网络能量可进一步展开为,将 代入上式 ,并考虑到W为对称矩阵,有,17,上式中可能出现的情况:,情况a :xj(t)=-1, xj(t+1)=1, 得xj(t)=2, netj(t)0,得E(t)0。,情况b :xj(t)=1, xj(t+1)=-1, 所以xj(t)=-2, netj(t)0,得E(t)0。,情况c :xj(t)=xj(t+1), 所以xj(t)=0, 从而有E
8、(t)=0。,由此可知在任何情况下均有E(t)0 。,18,由于网络中各节点的状态只能取1 或 1 ,能量函数E(t) 作为网络状态的函数是有下界的,因此网络能量函数最终将收敛于一个常数,此时E(t)=0 。综上所述,当网络工作方式和权矩阵均满足定理5.1的条件时,网络最终将收敛到一个吸引子。,综上所述,当网络工作方式和权矩阵均满足定理5.1的条件时,网络最终将收敛到一个吸引子。,定理5.2 对于DHNN网,若按同步方式调整状态,且连接权矩阵W为非负定对称阵,则对于任意初态,网络都最终收敛到一个吸引子。,19,证明:,前已证明,对于任何神经元 j ,有,因此上式第一项不大于0,只要W为非负定阵
9、,第二项也不大于0,于是有E(t)0 ,也就是说E(t)最终将收敛到一个常数值,对应的稳定状态是网络的一个吸引子。,20,以上分析表明,在网络从初态向稳态演变的过程中,网络的能量始终向减小的方向演变,当能量最终稳定于一个常数时,该常数对应于网络能量的极小状态,称该极小状态为网络的能量井,能量井对应于网络的吸引子。,吸引子与能量函数,定义:若网络的状态 X 满足 则称X为网络的吸引子。,21,性质1 :若X 是网络的一个吸引子,且阈值T=0,在sgn(0)处,xj(t+1)=xj(t),则 X 也一定是该网络的吸引子。,证明:X 是吸引子,即X= f (WX),从而有 f W(X)=f WX=f
10、 WX= X X 也是该网络的吸引子。,吸引子的性质,22,性质2:若Xa是网络的一个吸引子,则与Xa的海明距离dH(Xa,Xb)=1的Xb一定不是吸引子。,证明:不妨设x1ax1b,xjaxjb,j=2,3,n。 w11=0,由吸引子定义,有,由假设条件知,x1ax1b,故, Xb不是该网络的吸引子。,23,能使网络稳定在同一吸引子的所有初态的集合,称为该吸引子的吸引域。,定义5.2 若Xa是吸引子,对于异步方式,若存在一个调整次序,使网络可以从状态X 演变到Xa ,则称 X 弱吸引到Xa;若对于任意调整次序,网络都可以从状态X 演变到Xa,则称X强吸引到Xa。,定义5.3 若对某些X,有X
11、弱吸引到吸引子Xa,则称这些X的集合为Xa的弱吸引域;若对某些X,有X强吸引到吸引子Xa,则称这些X的集合为Xa的强吸引域。,吸引子的吸引域,24,例5.1 设有3节点DHNN网,用无向图表示如下,权值与阈值均已标在图中,试计算网络演变过程的状态。,x1 -0.1 -0.5 0.2 x2 0.0 0.0 x3 0.6,25,解:设各节点状态取值为1 或0 ,3 节点DHNN 网络应有23=8种状态。不妨将X=(x1,x2,x3 )T=(0,0,0)T 作为网络初态,按123的次序更新状态。,第1步:更新x1 , x1=sgn(-0.5)0+0.20(-0.1) =sgn(0.1)=1 其它节点
12、状态不变,网络状态由(0,0,0)T变成(1,0,0)T。如果先更新 x2 或 x3,网络状态将仍为(0,0,0)T,因此初态保持不变的概率为2/3,而变为(1,0,0)T的概率为1/3。,x1 -0.1 -0.5 0.2 x2 0.0 0.0 x3 0.6,26,第2步:此时网络状态为(1,0,0)T,更新x2后,得 x2=sgn(-0.5)1+0.600=sgn(-0.5)=0 其它节点状态不变,网络状态仍为(1,0,0)T。如果本步先更新 x1 或 x3,网络相应状态将为(1,0,0)T和(1,0,1)T,因此本状态保持不变的概率为2/3,而变为(1,0,0)T 的概率为1/3。,第3步
13、:此时网络状态为(1,0,0)T,更新x3得 x3=sgn0.21+0.600=sgn(0.2)=1,同理可算出其它状态之间的演变历程和状态转移概率。,27,DHNN网络状态演变示意图,28,为了使所设计的权值满足要求,权值矩阵应符合以下要求:,为保证异步方式工作时网络收敛,W应为对称阵; 为保证同步方式工作时网络收敛,W应为非负定对称阵; 保证给定样本是网络的吸引子,并且要有一定的吸引域。,外积和法,设给定P个模式样本Xp,p=1,2,P,x-1,1n,并设样本两两正交,且nP,则权值矩阵为记忆样本的外积和,网络的权值设计,29,若取wjj=0,上式应写为,式中I为单位矩阵。上式写成分量元素
14、形式,有,下面检验所给样本能否称为吸引子。,因为P个样本Xp,p=1,2,P,x-1,1n是两两正交的,有,30,因为nP,所以有,可见给定样本Xp,p=1,2,P是吸引子。,31,连续型Hopfield神经网络,连续型Hopfield神经网络(CHNN)是J. J. Hopfield于1984年在离散型Hopfield神经网络的基础上提出来的,它的原理与离散型网络相似。 CHNN是以模拟量作为网络的输入输出量,各神经元采用并行方式工作,因此在信息处理的并行性、联想性、实时性、分布存贮、协同性等方面比DHNN更接近于生物神经网络。,32,Hopfield动态神经元模型,和电容,并联,模拟生物神
15、经元的延时特性,运算放大器是一个非线性放大器,它模拟生物神经元的非线性特性。Ii为独立的外输入信号。,电阻,电阻,模拟生物神经元之间的突触特性,33,其输入、输出关系常用如下的两种非线性函数,图中每个神经元可由同向端或反向端输出。当由反向端输出时,它对其它神经元将起到抑制作用。对于每一个神经元而言,自己的输出信号经过其它神经元又反馈到自己,所以CHNN是一个连续的非线 性动力学系统。,连续型Hopfield神经网络的结构图,返回,34,5.3 Boltzmann模型,Boltzmann机模型与离散型Hopfield神经网络(DHNN)模型基本相似 共同点 1. 神经元取二值输出(0和1) 2.
16、 神经元之间得连接权矩阵是对称的 3. 神经元的抽样是随机的,每次只调整一个神经元 4. 无自反馈,35,不同点 1.Boltzmann机允许使用隐含层,而离散型Hopfield神经网络(DHNN)没有 2. Boltzmann机的神经元采用随机激活机制,而DHNN则是确定性的 3. DHNN在无监督状态下运行,而Boltzmann机可以以某种随机模式进行有监督的学习,36,Boltzmann机模型结构,由可视层和隐含层两部分组成,主要用于随机性自联想记忆。 训练时可视层神经元由外输入矢量钳制在特定状态,隐含层运行在自由状态。 隐含层神经元是用于检测外输入的统计特征,这种网络可以通过无监督的学
17、习模拟外界给定的概率分布。,37,Boltzmann机模型结构,这种结构主要用于联想记忆。 这种网络采用有教师学习方式,把某个记忆模式加到网络的输入部分,同时在网络的输出部分按一定概率分布给出一组期望模式。 给出的概率分布函数实际上是输出模式对于输入模式的条件概率分布。,38,例:一个Boltzmann机构成的柴油机故障诊断系统,当网络提供一个表示排气管有黑烟的故障输入模式后,在网络的输出部分(故障诊断系统的诊断输出端)按产生这种故障现象原因的概率大小提供一系列输出模式,如气缸点火位置不准,油料中含有杂质等,从而构成网络学习的模式对。 与DHNN相似, Boltzmann机能量函数定义为: 其
18、中,n为网络的神经元总数(包括可视层和隐含层)。能量函数E的值与网络的全状态有关。,(1),39,所谓全状态是指由网络全体神经元输出所构成的状态。网路的全状态数为 。,对应于第i个神经元的能量函数为:,设xi为神经元i的输出,则网络的状态可表示为,全连接权为,输出阀值为,则神经元i的综合输入(即内部状态为),(2),(3),40,当 发生变化时,将引起神经元状态的更新。这种更新在神经元之间是同步进行的,并用概率分析方法来描述。全神经元i 的输出 为1和0的概率分别为 和 :,T为网络温度。,(5),(4),(6),41,按式(7)和(8)反复进行网络的状态更新,当更新系数足够大,网络处于“热平
19、衡”状态时,则网络某状态出现的概率服从Boltzmann分布,且与到达“热平衡”状态的路径无关。,可见,状态能量越小,这一状态出现的概率越大。这就是Boltzmann分布的一大特点,即“最小能量状态以最大概率出现”。,由式(5),相邻两次叠代第i个神经元能量变化为,(7),(8),42,令(7)中的 则,表明(4)和(5)中的 可以用 代替,所以式(4)和(5)可以写成,(10),(9),43,和 的关系如图所示。由式(7)可以看出,令 ,当 时 ,表示状态更新能量单调减少;当 时 ,表示能量增加或不变。,当 时,当 时,在Boltzmann机中,当 时,也容许以较小的概率接受状态更新。,44
20、,从图中还可以看出 随 的变化较平缓。特别是当 时,曲线变成一条恒为0.5的直线,此时 取1和0的概率相等。 在T 较高时,网络神经元有更多机会进行行状态选择;当T 降低时, 曲线变陡,即 对 的变化敏感。当 时曲线退化为一阶函数,算法就成为Hopfield算法。,45,Boltzmann机的工作规则,工作规则是指在连接权确定的情况下,网络采用的算法。 Boltzmann机工作规则与Hopfield网络规则相似,不同是以概率方式代替阶跃函数方式,以决定网络根据其神经元内部状态进行状态更新。 网络的温度参数随着状态更新而逐渐减小。 Boltzmann机的工作规则就是模拟退火算法的神经网络实现。,
21、46,Boltzmann机工作规则的步骤,初始化,令 根据设计计算给定 1. 从n个神经元随机选择一个神经元i。 2. 按式(8)计算神经元的综合输入,即内部状态,3. 按式(9)的概率将神经元i的状态更新为1。更新 概率为:,(11),47,4. i以外神经元的输出状态保持不变 5. 从n个神经元中另选一个神经元,重复步骤1-4,直到该温度下网络达到“热平衡”状态。 6. 以某种方式取 ,令 。 7. 判断运行过程是否结束?未结束则返回1.,Boltzmann机工作规则的步骤,(12),48,研究表明,按下式的降温策略可以保证网络收敛到全局最小。 其中,k为降温过程的迭代次数。 这种降温策略
22、通常网络收敛时间很长,可采用快速降温策略,返回,(13),(14),49,Boltzmann机的学习规则,Boltzmann机的学习规则是指连接权和阀值的修正规则,主要用于把网络作为一种外界概率分布的模拟。 Boltzmann机的隐含层用于检测外输入的统计特征。隐含层的引入增强了网络的计算能力,但也增加了网络的复杂程度。,50,具有可视层和隐含层的随机网络,设网络有n个神经元,其中可视层有k个,隐含层有l个,nkl 可视层有2k个状态,隐含层有 2l 个状态,网络共有 个状态。 可视层的状态向量为 隐含层的状态向量为,51,表示网络工作在钳制状态下(即有外输入)可视层神经元处于状态 的概率。
23、表示网络工作在自由状态(即无外输入)下可视层神经元处于状态 的概率。 可以认为概率集合:,为外输入的期望概率,为网络输出的实际概率,52,Boltzmann机的学习过程中,调整网络的连接权的目的是使可视层神经元具有期望的概率分布,即学习的任务是使实际概率 趋近于期望的概率 。 表示外输入与网络内部模型之间偏差的测度。这种测度可以采用由下式定义的相对熵来表示。,(15),53,只有对于所有 都有 才等于0。这种情况下表明内部模型与外部输入完全匹配。 的分布是与连接权 无关的,而 则与它有关。因此 可以通过调整 使之极小化,并可用梯度算法实现。,对于Boltzmann机,当网络处于热平衡状态时,由
24、于其概率分布的简单性质可以直接求出式(5) 对 的偏导数。,取式(5)对 的偏导数,(16),54,因此,连接权的调整量可表示为:,式中, 是一个正的常数。,55,的计算,令 为网络工作在自由状态下可视层神经元处于状态 ,隐含层神经元处于状态 的联合概率。在这种情况下, 可表示为可视层神经元处于状态 ,而隐含层神经元处于任意可能状态 的概率。 由全概率公式:,(17),56,当网络处于热平衡状态时,可以引用Boltzmann分布计算 式中, 为可视层神经元处于状态 ,而隐含层神经元处于状态 时网络的能量。T为网络温度,考虑: 则函数Z为,(18),(19),57,由网络能量函数定义有 式中,
25、, 为可视层神经元处于状态 ,隐含层神经元处于状态 时网络神经元i和j的状态(输出),式(20)的wij已隐含阀值项在内,由式(19)有,(20),(21),(22),58,由式(20) , 有,式(21)左边第一项为,(24),(25),(23),59,式(21)右边第二项为,由式(18),上式第一个因子为Boltzmann分布 。 由式(22)、(23), 上式的第二因子为:,(26),(27),60,将式(18)和式(26)代入(27),得,将式(24)和式(28)代入(21),得,将上式代入(16)则得连接权的调整公式如下:,(30),(29),(28),61,为使表达进一步简化,考虑
26、以下因素: 全部状态概率之和为1,即 应用Bayes公式,联合概率 表示为 式中, 是可视层神经元处于状态 ,且网络工作在自由状态条件下隐含层神经元处于状态 的条件概率。,(31),(32),62,同样网络工作在钳制状态的条件下,有 式中, 是可视层神经元处于状态 ,且网络工作在钳制状态条件下隐含层处于 状态下的概率。,(33),对于Boltzmann机而言,在给定某一个可视层状态的情况下,不管它是外输入的钳制状态,还是网络自由运行所达到的状态,隐含层状态的条件概率是相同的,即,(34),则有,(36),(35),63,将式(31)应用于式(30)的第二项,将式(36)应用于式(30)的第一项,则得到如下的化简结果。,为了简化表达形式,引入如下定义,(37),(38),(39),64,式中状态 的范围是 ,状态 的范围是 , 是可视层神经元处于钳制状态下,神经元i和j所有可能状态的相关矩。 是可视层神经元处于自由状态下,神经元i和j所有可能状态之间的相关矩。 将前式用于式(37) ,最后得到如下的简化结果: 式中, 为学习速率参数。式(40)的梯度规则称为Boltzmann 机的学习规则。,(40),65,Boltzmann 机的学习规则,连接权 赋予-1,+1区间的随机值,并令 按给定的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度存量房交易咨询合同
- 改扩建项目土地使用权转让合同3篇
- 2024年度定龙水库渔业资源养护合同2篇
- 牛肉买卖合同范本
- 2024年度版权许可合同音乐作品使用权限2篇
- 建筑材料砖块购销合同2024:含进口关税与汇率波动条款
- 项目合作合同协议书正规范本完整版2篇
- 2024年度饭店装修工程合同进度款支付合同3篇
- 铝单板产品包装设计与材料供应合同(2024版)
- 基于5G技术的2024年度智能网络设备采购与维护合同
- 国内外智慧护理服务模式的研究进展
- 安全生产法律法规注册安全工程师考试(初级)试卷与参考答案
- 深圳2020-2024年中考英语真题专题03 阅读理解之记叙文(解析版)
- 数据安全风险评估
- 【初中历史】秦汉时期的科技与文化课件 2024-2025学年统编版七年级历史上册
- 教育研究方法课程设计
- 国家职业技术技能标准 5-02-03-02 野生植物保护员 人社厅发201512号
- GB/T 44264-2024光伏组件清洁机器人通用技术条件
- 2024至2030年中国服务器电源行业市场竞争力分析及发展策略分析报告
- 中外政治思想史-形成性测试二-国开(HB)-参考资料
- 宽QRS波心动过速鉴别班.ppt
评论
0/150
提交评论