版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Matlab的神经网络工具箱实用指南文章摘要:第一章是神经网络的基本介绍,第二章包括了由工具箱指定的有关网络结构和符号的基本材料以及建立神经网络的一些基本函数,例如new、init、adapt和train。第三章以反向传播网络为例讲解了反向传播网络的原理和应用的基本过程。第一章介绍1神经网络神经网络是单个并行处理元素的集合,我们从生物学神经系统得到启发。在自然界, 网络功能主要由神经节决定, 我们可以通过改变连接点的权重来训练神经网络完成特定的功 能。一般的神经网络都是可调节的,或者说可训练的,这样一个特定的输入便可得到要求 的输出。如下图所示。这里,网络根据输出和目标的比较而调整,直到网络输
2、出和目标匹配。作为典型,许多输入/目标对应的方法已被用在有监督模式中来训练神经网络。神经网络已经在各个领域中应用,以实现各种复杂的功能。这些领域包括:模式识别、 鉴定、分类、语音、翻译和控制系统。如今神经网络能够用来解决常规计算机和人难以解决的问题。我们主要通过这个工具箱来建立示范的神经网络系统,并应用到工程、金融和其他实际项目中去。一般普遍使用有监督训练方法,但是也能够通过无监督的训练方法或者直接设计得到其 他的神经网络。无监督网络可以被应用在数据组的辨别上。一些线形网络和Hopfield网络是直接设计的。总的来说,有各种各样的设计和学习方法来增强用户的选择。神经网络领域已经有 50年的历史
3、了,但是实际的应用却是在最近15年里,如今神经网络仍快速发展着。因此, 它显然不同与控制系统和最优化系统领域,它们的术语、数学理论和设计过程都已牢固的建立和应用了好多年。我们没有把神经网络工具箱仅看作一个能正常运行的建好的处理轮廓。我们宁愿希望它能成为一个有用的工业、教育和研究工具,一个能够帮助用户找到什么能够做什么不能做的工具,一个能够帮助发展和拓宽神经网络领域的工具。因为这个领域和它的材料是如此新,这个工具箱将给我们解释处理过程,讲述怎样运用它们,并且举例说明它们的成功和失败。我们相信要成功和满意的使用这个工具箱,对范例和它们的应用的理解是很重要的,并且如果没有这些说明那么用户的埋怨和质询
4、就会把我们淹没。所以如果我们包括了大量的说明性材料,请保持耐心。我们希望这些材料能对你有帮助。这个章节在开始使用神经网络工具箱时包括了一些注释,它也描述了新的图形用户接口和新的运算法则和体系结构,并且它解释了工具箱为了使用模块化网络对象描述而增强的机 动性。最后这一章给出了一个神经网络实际应用的列表并增加了一个新的文本-神经网络设计。这本书介绍了神经网络的理论和它们的设计和应用,并给出了相当可观的MATLAB和神经网络工具箱的使用。2.准备工作基本章节第一章是神经网络的基本介绍,第二章包括了由工具箱指定的有关网络结构和符号的基 本材料以及建立神经网络的一些基本函数,例如new、in it、ad
5、apt和train。第三章以反向传播网络为例讲解了反向传播网络的原理和应用的基本过程。帮助和安装神经网络工具箱包含在 nnet目录中,键入 help nnet可得到帮助主题。工具箱包含了许多示例。每一个例子讲述了一个问题,展示了用来解决问题的网络并给 出了最后的结果。显示向导要讨论的神经网络例子和应用代码可以通过键入help nndemos找到。安装神经网络工具箱的指令可以在下列两份MATLAB文档中找到:the Installation Guidefor MS-Windows and Macintosh 或者 the Installation Guide for UNIX 。第二章神经元模型
6、和网络结构1.符号数学符号下面给出等式和数字中用到的基本符号:标量-小写的斜体字a,b,c向量-小写加粗的非斜体字a,b,c矩阵-大写加粗的非斜体字A,B,C向量表示一组数字数学符号和字符的等价从数学符号到字符的转换或者反过来可以遵循一些规则,为了便于今后引用我们将这些规则列出。为了从数学符号变为MATLAB符号用户需要:变上标为细胞数组标号例如' " 1变下标为圆括号标号例如 -和兀=汀"变圆括号标号为二维数组标号例如变数学运算符为MATLAB运算符和工具箱函数2神经元模型单神经元下图所示为一个单标量输入且无偏置的神经元。输入 无偏置神经元输入有偏置神经元、亠乞斗
7、/亠*7wp,这仍是一个标量。这里,加权a。右边的神经元有一个标量偏置 b,也可以认为它把函数 f左移了 b个单V/It = f(即)这个输入标量通过乘以权重为标量w的连结点得到结果的输入wp仅仅是转移函数f的参数,函数的输入是标量 你既可以认为它仅仅是通过求和节点加在结果wp上,位,偏置除了有一个固定不变的输入值1以外,其他的很像权重。标量n是加权输入wp和偏置b的和,它作为转移函数 f的参数。函数f是转移函数,它可以为阶跃函数或者曲线函 数,它接收参数n给出输出a,下一节将给出各种不同的转移函数。注意神经元中的w和b都是可调整的标量参数。神经网络的中心思想就是参数的可调整使得网络展示需要和
8、令人感 兴趣的行为。这样,我们就可以通过调整权重和偏置参量训练神经网络做一定的工作。或者神经网络自己调整参数以得到想要的结果。在这个工具箱里所有的神经元都提供偏置,我们的许多例子中都用到了偏置并且假定它在这个工具箱的大多数情况下都要用到。可是,如果你愿意的话,你也可以在一个神经元中省略偏置。正如上面所提到的,在神经元中,标量b是个可调整的参数。它不是一个输入。可是驱 动偏置的常量1却是一个输入而且当考虑线性输入向量时一定要这样认为。转移函数在这个工具箱里包括了许多转移函数。你能在"Transfer Function Graphs"中找到它们的完全列表。下面列出了三个最常用的
9、函数。aA+1m免-Ia - hardlim(n)上图所示的阶跃转移函数限制了输出,使得输入参数小于0时输出为0,大于或等于0时输出为1,在第三章中我们将用它来进行分类。工具箱中有一个函数hardlim来数学上的阶跃,如上图所示。我们可以输入以下代码n = -5:0.1:5;plot( n,hardlim( n),'c+:');它产生一张在-5到5之间的阶跃函数图。所有在工具箱中的数学转移函数都能够用同名的函数实现。线性转移函数如下图所示a = purelin(n)这种类型的神经元将在第四章的自适应线性滤波中用作线性拟合。下图显示的曲线转移函数的输入参数是正负区间的任意值,而将
10、输出值限定于 之间。企±1这种传递函数通常用于反向传播( BP)网络,这得益于函数的可微性。在上面所示的每一个转移函数图的右边方框中的符号代表了对应的函数,这些图表将替换网络图的方框中的f来表示所使用的特定的转移函数。第13章列出了所有的转移函数和图标。你能够定义自己的传递函数,你可以不限于使 用第13章所列的转移函数。你能够通过运行示例程序nn2n1来试验一个神经元和各种转移函数。带向量输入的神经元一个有R个元素输入向量的神经元如下图所示。这里单个输入元素P jt乘上权重得到加权值输入求和节点。它们的和是Wp,单行矩阵 W和向量p的点乘。这里R二输入向量的 元素个数a = A Wp
11、 +6)这个神经元有一个偏置 b,它加在加权的输入上得到网络输入n,和值n是转移函数f的参数。表达式自然可用 MATLAB代码表示为:n =W*p + b可是,用户很少要写如此底层的代码, 因为这些代码已经被建立到函数中来定义和模拟 整个网络。上面所示的图包括了许多细节。 当我们考虑有许多神经元和可能是许多神经元组 成的多层网络时,我们可能会漏掉许多细节。因此,作者设计了一个简洁的符号代表单个神 经元。这个符号如下图中所示,它将会在以后的多重神经元电路中用到。输入神经元这里输入向量p用左边的黑色实心竖条代表,p的维数写在符号p下面,在图中是Rx1。 (注意我们用的是大写字母,正如在以前句子里R
12、用来表示向量大小时一样。)因此,p是一个有R个输入元素的向量。这个输入列向量乘上R列单行矩阵 W。和以前一样,常量 1作为一个输入乘上偏置标量 b,给转移函数的网络输入是 n,它是偏置与乘积 Wp的和。这 个和值传给转移函数 f得到网络输出a,在这个例子中它是一个标量。注意如果我们有超过 一个神经元,网络输出就有可能是一个向量。上面图中定义了神经网络的一层。一层包括权重的组合, 乘法和加法操作(这里就是向量乘积 Wp),偏置b和转移函数f。输入数组,即向量 p不包括在一层中。这个简洁的网络符号每一次都会被用到,向量的大小会显示在矩阵变量名字的下面。我们希望这个符号会让你理解神经网络的结构以及与
13、之相关的矩阵数学。正如前面所讨论的,当特定的转移函数在一张图中被使用时,转移函数将用上面所示的符号代替。下面是几个例子:1_hard lintpurelin你可以通过运行示例程序nnd2n2来试验有2个兀素的神经兀。3.网络结构两个或更多的上面所示的神经元可以组合成一层,一个典型的网络可包括一层或者多 层。我们首先来研究神经元层。单层神经元网络有R输入元素和S个神经元组成的单层网络如下图所示:输入神经兀尾ii 里喻人向捷的 元素个Jft的-个數在一个单层网络中,输入向量p的每一个元素都通过权重矩阵W和每一个神经元连接起来。第I个神经元通过把所有加权的输入和偏置加起来得到它自己的标量输出n(i)
14、。不同的n(i)合起来形成了有 S个元素的网络输入向量 n。最后,网络层输出一个列向量 a,我们 在图的底部显示了 a的表达式。注意输入元素个数 R和神经元个数 S通常是不等的,我们也并不需要这两者相等。你 也可以建立一个简单的复合神经元层,它将上面所示的网络并行的合在一起,使用不同的转移函数。所有的网络都有相同的输入,而每一个网络都会产生输出。输入向量兀素经加权矩阵W 作叫2JtE用输入网络。W=严畑注意加权矩阵 W的行标标记权重的目的神经元, 列标标记待加权的输入标号。 因此,的。有S个神经元和R个输入元输人神经元层f、这里R=输入向董的 元素个数S二层中神经元 的个数标号表示从输入信号的
15、第二个元素到第一个神经元的权重是 素的神经网络也能够简化成以下符号:3= f (Wp+ b)这里,p是一个有R个元素的输入向量, W是一个SxR的矩阵,a和b是有S个元素 的向量。如前面所定义的,神经元层包括权重矩阵,乘法运算,偏置向量b,求和符和转移函数框。输入和层我们将要讨论多层网络,所以我们需要拓展我们的符号来描述这样的网络。特别是我们要弄清连接输入的权重矩阵和连接层的权重矩阵之间的区别。我们也要分清权重矩阵的目的和源。我们将把连接输入的权重矩阵成为输入权重,把来自层输出的权重矩阵称为层矩阵。进一步说,我们在各个权重和其他网络元素中将用上标区分源(第二个标号)和目的(第一个标号)。作为示
16、例,我们用简化的形式重画了上面所画的单层多输入网络。你可以看到,我们把连接输入向量p的权重矩阵标记为输入权重矩阵(IW1,1),第二个标号1是源,第二个标号1是目的。同样,第一层的元素,比如偏置、网络输入和输出都有 上标1来表示它们属于第一层。在下一章节,我们将用 LW表示层权重矩阵,用IW表示输入权重矩阵。你可以复习以下这一章开始的符号那一节,它把特定的网络 net中用数学符号表示的层权重矩阵转换成代码,如下所示:IW1,1 n et. IW1,1这样,你就可以写代码来得到对转移函数的网络输入了:n 1 =n etW1,1*p+net.b1多层神经元网络一个网络可以有几层,每一层都有权重矩阵
17、W,偏置向量b和输出向量a。为了区分这些权重矩阵、输出矩阵等等,在图中的每一层,我们都为感兴趣的变量以上标的形式增加了 层数。你能够看到在下面所示的三层网络图和等式中使用层符号。输入第一层第二层笫三层L 和a>-P(LWai *皿)皿-P (LWvas+fc*>* =P (TWM 仪(LWwfl (IWijp +>Q+bfl>bs)上面所示的网络有 R1个输入,第一层有 S1个神经元,第二层有 S2个神经元,以次类 推。一般不同层有不同数量的神经元。每一个神经元的偏置输入是常量1。注意中间层的输出就是下一层的输入。第二层可看作有 S1个输入,S2个神经元和S1xS2阶权
18、重矩阵 W2的单层网络。第二层的输入是al,输出是a2,现在我们已经确定了第二层的所有向量和矩阵,我们就能把它看成一个单层网络了。其他层也可以照此步骤处理。多层网络中的层扮演着不同的角色。 给出网络输出的层叫做输出层。所有其他的层叫做 隐层。上图所示的三层网络有一个输出层(第三层)和两个隐层(第一和第二层)。有些作者把输入作为第四层,这里不用这种指定。上面所示的三层网络的简洁画法如下图所示:输人第一层第二层第三层H = P (IWvp+bi)单-v +血» -Pa*(LWv f? (LWnf 1 (TWiJp +b)+,多层网络的功能非常强大。举个例子,一个两层的网络,第一层的转移函
19、数是曲线函数, 第二层的转移函数是线性函数,通过训练,它能够很好的模拟任何有有限断点的函数。这种两层网络集中应用于"反向传播网络”。注意我们把第三层的输出 a3标记为y。我们将使用这种符号来定义这种网络的输出。4 数据结构这一节将讨论影响网络仿真的输入数据结构的格式。我们首先讨论静态网络, 在讨论动态网络。我们将关心两种基本的输入向量类型:同步(同时或者无时序)向量和异步向量。对异步向量来说,向量的顺序是非常重要的。对同步向量来说,顺序是不重要的,并且如果我们已经有一定数量的并行网络我们就能把一个输入向量输入到其中的任意网络。静态网络中的同步输入仿真仿真静态网络(没有反馈或者延迟)是
20、网络仿真最简单的一种。在这种情况中,我们不需要关心向量输入的时间顺序,所以我们可以认为它是同时发生的。另外,为了是问题更简单,我们假定开始网络仅有一个输入向量。我们用下面的网络作为例子。为了建立这个网络我们可以用以下命令:输入綾性神经元net = n ewli n(-1 1;-1 1,1);简单起见我们假定权重矩阵和偏置为W=1,2,b=0其命令行是:netW1,1 = 1 2;n et.b1 = 0;假定模拟的网络有四个无序向量,即Q=4 :这些同步向量可以用一个矩阵来表示:P = 1 2 2 3; 2 1 3 1;现在我们就可以模拟这个网络了:A = sim( net,P)A =5 4 8
21、 5我们向网络输入一个简单的同步向量矩阵,得到了一个简单的同步向量输出矩阵。结果不论是由一个网络串行输出还是由四个网络并行输出得到的都是一样的。由于输入并无关 联,输入向量的顺序并不重要。动态网络中的异步输入仿真当网络中存在延迟时,顺序发生的输入向量就要按一定的序列输入网络。为了演示这种情况,我们用了一个有延迟的简单网络。p(fi 输入线性神经元rn(t)/ j0(0 = 0为了建立这个网络我们可以用以下命令:net = n ewli n(-1 1,1,0 1);n et.biasC onnect = 0;假定权重矩阵为:W=1,2命令行为:netW1,1 = 1 2;假定输入顺序为:p(1)
22、=1,P(2)=2, p(3)=3, p(4)=4输入序列可以用一个细胞数组来表示:P = 1 2 3 4;这样我们就能模拟这个网络了:A = sim( net,P)A =1 4 7 10我们输入一个包含输入序列的细胞数组,网络产生一个包含输出序列的细胞数组。注意异步输入中的输入顺序是很重要的。在这个例子中,当前输出等于当前输入乘 1加上前一个输入乘2。如果我们改变输入顺序,那么输出结果也回随之改变。动态网络中的同步输入仿真如果我们在上一个例子中把输入作为同步而不是异步应用,我们就会得到完全不同的响应。(虽然我们不清楚为什么要在动态网络中使用这种方式。)这就好象每一个输入都同时加到一个单独的并
23、行网络中。在前一个例子中,如果我们用一组同步输入,我们有:P1=1, P2=2, p3=3, p4=4这可用下列代码创建:P =1 2 3 4;模拟这个网络,我们得到:A = sim( net,P)A =1 2 3 4这个结果和我们同时把每一个输入应用到单独的网络中并计算单独的输出没什么两样。 注意如果我们没有初始化延迟时间,那么缺省值就是0。在这个例子中,由于当前输入的权重是1,输出就是输入乘 1。在某些特定的情况下,我们可能想要在同一时间模拟一些不同 序列的网络响应。这种情况我们就要给网络输入一组同步序列。比如说,我们要把下面两个序列输入网络:p(1)=1, p(2)=2, p(3)=3,
24、 p(4)=4p(1)=4, p(2)=3, p(3)=2, p(4)=1输入P应该是一个细胞数组,每一个数组元素都包含了两个同时发生的序列的元素。P = 1 4 2 3 3 2 4 1;现在我们就可以模拟这个网络了:A = sim( net,P);网络输出结果将是:A = 1 4 4 11 7 8 10 5你可以看到,每个矩阵的第一列是由第一组输入序列产生的输出序列,每个矩阵的第二列是由第二组输入序列产生的输出序列。这两组序列之间没有关联,好象他们是同时应用在单个的并行网络上的。下面的图表显示了当我们有Q个TS长度的序列时,在函数sim中输入P的一般格式。它函盖了单输入向量的所有的情况。每一
25、个细胞数组的元素都是一个同步向量矩阵,它对应于每一个序列的同一时间点。如果有多输入向量,那么在细胞数组中的矩阵里就有多行。Qth Sequence,p2("p】,p2(2),p*2> * P|( TSjt pjfrS), * pTS)First Sequence这一节我们我们把同步和异步输入应用到了动态网络中。在以前的章节中我们把同步输 入应用到了静态网络中。我们也能把异步序列应用到静态网络中。这不会改变网络的输出响 应,但是这会影响训练过的网络的形式。在下一节你会更清楚的了解这一点。5.训练方式在这一节中,我们将描述两种不同的训练方式。在增加方式中,每提交一次输入数据, 网络
26、权重和偏置都更新一次。在批处理方式中,仅仅当所有的输入数据都被提交以后,网络权重和偏置才被更新。增加方式(应用与自适应网络和其他网络)虽然增加方式更普遍的应用于动态网络,比如自适应滤波,但是在静态和动态网络中都可以应用它。在这一节中我们将示范怎样把增加方式应用到这两种网络中去。静态网络中的增加方式继续考虑前面用过的第一个静态网络的例子, 我们用增加方式来训练它,这样每提交一 次输入数据,网络权重和偏置都更新一次。在这个例子里我们用函数adapt,并给出输入和目标序列:假定我们要训练网络建立以下线性函数:t=2p1+p2我们以前用的输入是:刊卜花=;卜目标输出是:t仁4,t2=5 ,t3=7 ,
27、t4=7我们首先用0初始化权重和偏置。为了显示增加方式的效果,我们把学习速度也设为0。net = n ewli n(-1 1;-1 1,1,0,0);n etW1,1 = 0 0;n et.b1 = 0;为了用增加方式,我们把输入和目标输出表示为以下序列:P = 1;2 2;1 2;3 3;1;T = 4 5 7 7;前面的讨论中,不论是作为一个同步向量矩阵输入还是作为一个异步向量细胞数组输 入,模拟的输出值是一样的。而在训练网络时,这是不对的。当我们使用adapt函数时,如果输入是异步向量细胞数组,那么权重将在每一组输入提交的时候更新(就是增加方式),我们将在下一节看到,如果输入是同步向量矩
28、阵,那么权重将只在所有输入提交的时候更新 (就是批处理方式)。我们现在开始用增加方式训练网络:n et,a,e,pf = adapt (n et,P,T);由于学习速度为0,网络输出仍然为0,并且权重没有被更新。错误和目标输出相等。a = 0 0 0 0e = 4 5 7 7如果我们设置学习速度为0.1,我们就能够看到当每一组输入提交时,网络是怎么调整的了。n et.i nputWeights1,1.learnParam.lr=0.1;n et.biases1,1 .learn Param.lr=0.1;n et,a,e,pf = adapt (n et,P,T);a = 0 2 6.0 5.
29、8e = 4 3 1.0 1.2由于在第一个输入数据提交前还没有更新,第一个输出和学习速率为 0时一样。由于权重已更新,第二个输出就不一样了。 每计算一次错误,权重都不断的修改。如果网络可行并且学习速率设置得当,错误将不断的趋向于0。动态网络中的增加方式我们同样也能用增加方式训练动态网络。实际上,这是最普遍的情况。让我们用前面用过的那个有输入延迟的线性网络作为例子,我们将初始化权重为0,并把学习速率设为0.1。net = n ewli n(-1 1,1,0 1,0.1);n et.IW1,1 = 0 0;n et.biasC onnect = 0;为了用增加方式,我们把输入和目标输出表示为细胞
30、数组的元素:Pi = 1;P = 2 3 4;T = 3 5 7;这里我们尝试训练网络把当前输入和前一次输入加起来作为当前输出。输入序列和我们 以前使用 sim 的例子中用过的一样,除了我们指定了输入序列的第一组作为延迟的初始状 态。现在我们可以用 adapt 来训练网络了:net,a,e,pf = adapt(net,P,T,Pi);a = 0 2.4 7.98e = 3 2.6 -1.98 由于权重没有更新,第一个输出是0。每一个序列步进,权重都改变一次。批处理方式在批处理方式中, 仅仅当所有的输入数据都被提交以后, 网络权重和偏置才被更新, 它 也可以应用于静态和动态网络。我们将在这一节
31、讨论这两种类型。静态网络中的批处理方式批处理方式可以用adapt或train函数来实现,虽然由于由于采用了更高效的学习算法,train通常是最好的选择。增加方式只能用adapt来实现,train函数只能用于批处理方式。让我们用前面用过的静态网络的例子开始,学习速率设置为0.1。net = newlin(-1 1;-1 1,1,0,0.1);net.IW1,1 = 0 0;net.b1 = 0;用adapt函数实现静态网络的批处理方式,输入向量必须用同步向量矩阵的方式放置:P = 1 2 2 3; 2 1 3 1;T = 4 5 7 7;当我们调用adapt时将触发adaptwb函数,这是缺省的
32、线性网络调整函数。learnwh是缺 省的权重和偏置学习函数。因此, Widrow-Hoff 学习法将会被使用:net,a,e,pf = adapt(net,P,T);a = 0 0 0 0e = 4 5 7 7注意网络的输出全部为 0,因为在所有要训练的数据提交前权重没有被更新,如果我们 显示权重,我们就会发现:>>net.IW1,1ans = 4.9000 4.1000>>net.b1ans =2.3000经过了用adapt函数的批处理方式调整,这就和原来不一样了。现在用 train 函数来实现批处理方式。由于 Widrow-Hoff 规则能够在增加方式和批处理 方
33、式中应用,它可以通过adapt和train触发。我们有好几种算法只能用于批处理方式(特别是 Levenberg-Marquardt 算法),所以这些算法只能用 train 触发。网络用相同的方法建立:net = newlin(-1 1;-1 1,1,0,0.1);net.IW1,1 = 0 0;net.b1 = 0;在这种情况下输入向量即能用同步向量矩阵表示也能用异步向量细胞数组表示。用 train函数, 任何异步向量细胞数组都会转换成同步向量矩阵。 这是因为网络是静态的, 并且因为 train 总是在批处理方式中使用。因为 MATLAB 实现同步模式效率更高,所以只要可能总是 采用同步模式处
34、理。P = 1 2 2 3; 2 1 3 1;T = 4 5 7 7;现在我们开始训练网络。由于我们只用了一次adapt,我们这里训练它一次。缺省的线性网络训练函数是 trainwb 。 learnwh 是缺省的权重和偏置学习函数。因此,我们应该和前面 缺省调整函数是 adaptwb 的例子得到同样的结果。net.inputWeights1,1.learnParam.lr = 0.1; net.biases1.learnParam.lr = 0.1;net.trainParam.epochs = 1;net = train(net,P,T); 经过一次训练后,我们显示权重发现:>>
35、net.IW1,1ans = 4.9000 4.1000>>net.b1ans =2.3000 这和用adapt训练出来的结果是一样的。在静态网络中,adapt函数能够根据输入数据格式的不同应用于增加方式和批处理方式。 如果数据用同步向量矩阵方式输入就用批处理方 式训练;如果数据用异步方式输入就用增加方式。但这对于train 函数行不通,无论输入格式如何,它总是采用批处理方式。动态网络中的增加方式训练静态网络相对要简单一些。如果我们用 train 训练网络,即使输入是异步向量细胞 数组,它也是转变成同步向量矩阵而采用批处理方式。如果我们用adapt。输入格式决定着网络训练方式。 如
36、果传递的是序列, 网络用增加方式, 如果传递的是同步向量就采用批处理 方式。在动态网络中,批处理方式只能用 train 完成,特别是当仅有一个训练序列存在时。为 了说明清楚, 让我们重新考虑那个带延迟的线性网络。 我们把学习速率设为 0.02(当我们采 用梯度下降算法时, 我们要用比增加方式更小的学习速率, 应为所有的分立的梯度都要在决 定权重改变步进之前求和)net = newlin(-1 1,1,0 1,0.02);net.IW1,1=0 0;net.biasConnect=0;net.trainParam.epochs = 1;Pi = 1;P = 2 3 4;T = 3 5 6;我们用
37、以前增加方式训练过的那组数据训练, 但是这一次我们希望只有在所有数据都提 交后才更新权重(批处理方式) 。因为输入是一个序列,网络将用异步模式模拟。但是权重 将用批处理方式更新。net=train(net,P,T,Pi);经过一次训练后,权重值为:>>net.IW1,1ans = 0.9000 0.6200 这里的权重值和我们用增加方式得到的不同。 在增加方式中, 通过训练设置, 一次训练 可以更新权重三次。在批处理方式中,每次训练只能更新一次。第三章反向传播网络(BP网络)1概述前面介绍了神经网络的结构和模型,在实际应用中,我们用的最广泛的是反向传播网络(BP网络)。下面就介绍一
38、下 BP网络的结构和应用。BP网络是采用Widrow-Hoff学习算法和非线性可微转移函数的多层网络。一个典型的BP网络采用的是梯度下降算法,也就是Widrow-Hoff算法所规定的。backpropagation就是指的为非线性多层网络计算梯度的方法。现在有许多基本的优化算法,例如变尺度算法和牛顿算法。神经网络工具箱提供了许多这样的算法。这一章我们将讨论使用这些规则和这些算法的优缺点。一个经过训练的BP网络能够根据输入给出合适的结果,虽然这个输入并没有被训练过。 这个特性使得 BP网络很适合采用输入/目标对进行训练,而且并不需要把所有可能的输入/目标对都训练过。为了提高网络的适用性,神经网络
39、工具箱提供了两个特性-规则化和早期停止。这两个特性和用途我们将在这一章的后面讨论。这一章还将讨论网络的预处理和后处理技术以提高网络训练效率。2.基础网络结构神经网络的结构前一章已详细讨论过,前馈型BP网络的结构结构和它基本相同,这里就不再详细论述了,这里着重说明以下几点:1. 常用的前馈型 BP网络的转移函数有logsig , tansig,有时也会用至U线性函数purelin。当网络的最后一层采用曲线函数时,输出被限制在一个很小的范围内,如果采用线性函数则输出可为任意值。以上三个函数是BP网络中最常用到的函数,但是如果需要的话你也可以创建其他可微的转移函数。2. 在BP网络中,转移函数可求导
40、是非常重要的,tan sig、logsig和purelin都有对应 的导函数dtansig、dlogsig和dpurelin。为了得到更多转移函数的导函数, 你可以带字符"deriv" 的转移函数:tan sig('deriv')ans = dta nsig网络构建和初始化训练前馈网络的第一步是建立网络对象。函数newff建立一个可训练的前馈网络。这需要4个输入参数。第一个参数是一个Rx2的矩阵以定义 R个输入向量的最小值和最大值。第二个参数是一个颟顸每层神经元个数的数组。第三个参数是包含每层用到的转移函数名称的细胞数组。最后一个参数是用到的训练函数的名称。
41、举个例子,下面命令将创建一个二层网络,其网络模型如下图所示。输入隐层輸出层它的输入是两个元素的向量,第一层有三个神经元,第二层有一个神经元。第一层的转移函数是tan-sigmoid ,输出层的转移函数是linear。输入向量的第一个元素的范围是-1到2,输入向量的第二个元素的范围是0 到 5,训练函数是 traingd 。net=newff(-1 2; 0 5,3,1,'tansig','purelin','traingd'); 这个命令建立了网络对象并且初始化了网络权重和偏置,因此网络就可以进行训练了。 我们可能要多次重新初始化权重或者进行自定
42、义的初始化。下面就是初始化的详细步骤。在训练前馈网络之前,权重和偏置必须被初始化。初始化权重和偏置的工作用命令 init 来实现。 这个函数接收网络对象并初始化权重和偏置后返回网络对象。 下面就是网络如何初 始化的:net = init(net);我们可以通过设定网络参数 net.initFcn 和 net.layeri.initFcn 这一技巧来初始化一个给 定的网络。 net. initFcn 用来决定整个网络的初始化函数。前馈网络的缺省值为 initlay ,它 允许每一层用单独的初始化函数。设定了 net.initFcn ,那么参数 net.layeri.initFcn 也要设 定用来
43、决定每一层的初始化函数。对前馈网络来说,有两种不同的初始化方式经常被用到: initwb 和 initnw 。 initwb 函数 根据每一层自己的初始化参数 (net.inputWeightsi,j.initFcn) 初始化权重矩阵和偏置。前馈网 络的初始化权重通常设为ran ds,它使权重在-1到1之间随机取值。这种方式经常用在转换函数是线性函数时。 initnw 通常用于转换函数是曲线函数。 它根据 Nguyen 和 WidrowNgWi90 为层产生初始权重和偏置值, 使得每层神经元的活动区域能大致平坦的分布在输入空间。它比起单纯的给权重和偏置随机赋值有以下优点: (1)减少神经元的浪
44、费 (因为所有神经元的 活动区域都在输入空间内) 。(2)有更快的训练速度(因为输入空间的每个区域都在活动的 神经元范围中) 。初始化函数被 newff 所调用。因此当网络创建时,它根据缺省的参数自动初始化。init不需要单独的调用。 可是我们可能要重新初始化权重和偏置或者进行自定义的初始化。例如,我们用 newff 创建的网络,它缺省用 initnw 来初始化第一层。如果我们想要用 rands 重新初 始化第一层的权重和偏置,我们用以下命令:net.layers1.initFcn = 'initwb'net.inputWeights1,1.initFcn = 'ran
45、ds'net.biases1,1.initFcn = 'rands'net.biases2,1.initFcn = 'rands'net = init(net);网络模拟 (SIM)函数sim模拟一个网络。sim接收网络输入 p,网络对象net,返回网络输出 a,这里 是 simuff 用来模拟上面建立的带一个输入向量的网络。p = 1;2;a = sim(net,p)a =-0.1011(用这段代码得到的输出是不一样的,这是因为网络初始化是随机的。)下面调用 sim 来计算一个同步输入 3 向量网络的输出:p = 1 3 2;2 4 1;a=sim(n
46、et,p)a =-0.1011 -0.2308 0.4955网络训练一旦网络加权和偏差被初始化, 网络就可以开始训练了。 我们能够训练网络来做函数近似(非线性 后退),模式结合,或者模式分类。训练处理需要一套适当的网络操作的例子 - 网络输入p和目标输出t。在训 练期间网络的加权和 偏差 不断的把网 络性能函数 net.performFcn 减少到最小。 前馈网络的缺省性能函数是均方误差mse-网络输出和目标输出t 之间的均方误差。这章的余项将描述几个对前馈网络来说不同的训练算法。所有这些算法 都用性能函数的梯度来决定怎样把权重调整到最佳。 梯度由叫做反向传播的技术决定, 它要 通过网络实现反
47、向计算。 反向传播计算源自使用微积分的链规则。 基本的反向传播算法的权 重沿着梯度的负方向移动, 这将在下一节讲述。 以后的章节将讲述更复杂的算法以提高收敛 速度。反向传播算法反向传播算法中有许多变量, 这一章将讨论其中的一些。 反向传播学习算法最简单的应 用是沿着性能函数最速增加的方向-梯度的负方向更新权重和偏置。这种递归算法可以写成:xk+1 = xk- a k g k这里xk是当前权重和偏置向量,g k是当前梯度,a k是学习速率。有两种不同的办法 实现梯度下降算法: 增加模式和批处理模式。 在增加模式中, 网络输入每提交一次,梯度计 算一次并更新权重。 在批处理模式中, 当所有的输入都
48、被提交后网络才被更新。 下面两节将 讨论增加模式和批处理模式。增加模式训练法( ADAPT )函数adapt用来训练增加模式的网络,它从训练设置中接受网络对象、网络输入和目标 输入,返回训练过的网络对象、用最后的权重和偏置得到的输出和误差。这里有几个网络参数必须被设置,第一个是n et.adaptFcn,它决定使用哪一种增加模式函数,缺省值为adaptwb,这个值允许每一个权重和偏置都指定它自己的函数,这些单个的 学 习 函 数 由 参 数 net.biasesi,j.learnFcn 、 net.inputWeightsi,j.learnFcn 、 net.layerWeightsi,j.l
49、earnFcn 和 Gradient Descent (LEARDGD) 来决定。对于基本的梯度最速 下降算法, 权重和偏置沿着性能函数的梯度的负方向移动。 在这种算法中, 单个的权重和偏 置的学习函数设定为"learngd"。下面的命令演示了怎样设置前面建立的前馈函数参数:net.biases1,1.learnFcn = 'learngd'net.biases2,1.learnFcn = 'learngd'net.layerWeights2,1.learnFcn = 'learngd'net.inputWeights1,1.
50、learnFcn = 'learngd'函数learngd有一个相关的参数-学习速率lr。权重和偏置的变化通过梯度的负数乘上学 习速率倍数得到。学习速率越大,步进越大。 如果学习速率太大算法就会变得不稳定。 如果 学习速率太小,算法就需要很长的时间才能收敛。当 learnFcn 设置为 learngd 时,就为每一 个权重和偏置设置了学习速率参数的缺省值, 如上面的代码所示, 当然你也可以自己按照意 愿改变它。下面的代码演示了把层权重的学习速率设置为0.2。我们也可以为权重和偏置单独的设置学习速率。net.layerWeights2,1.learnParam.lr= 0.2;为
51、有序训练设置的最后一个参数是net.adaptParam.passes它决定在训练过程中训练值重复的次数。这里设置重复次数为 200net.adaptParam.passes = 200; 现在我们就可以开始训练网络了。当然我们要指定输入值和目标值如下所示: p = -1 -1 2 2;0 5 0 5;t = -1 -1 1 1;如果我们要在每一次提交输入后都更新权重, 那么我们需要将输入矩阵和目标矩阵转变 为细胞数组。每一个细胞都是一个输入或者目标向量。p = num2cell(p,1);t = num2cell(t,1);现在就可以用 adapt 来实现增加方式训练了 :net,a,e=a
52、dapt(net,p,t); 训练结束以后,我们就可以模拟网络输出来检验训练质量了。a = sim(net,p)a =-0.9995 -1.0000 1.0001 1.0000带动力的梯度下降法 (LEARDGDM)除了 learngd 以外,还有一种增加方式算法常被用到,它能提供更快的收敛速度 -learngdm, 带动量的最速下降法。 动力允许网络不但根据当前梯度而且还能根据误差曲面最 近的趋势响应。 就像一个低通滤波器一样, 动量允许网络忽略误差曲面的小特性。 没有动量, 网络又可能在一个局部最小中被卡住。 有了动量网络就能够平滑这样的最小。 动量能够通过 把权重变得与上次权重变化的部分
53、和由算法规则得到的新变化的和相同而加入到网络学习 中去。上一次权重变化对动量的影响由一个动量常数来决定, 它能够设为 0 到 1 之间的任意 值。当动量常数为 0 时, 权重变化之根据梯度得到。 当动量常数为 1 时新的权重变化等于上 次的权重变化,梯度值被忽略了。Learngdm 函数有上面所示的 learngd 函数触发,除非 mc 和 lr 学习参数都被设置了。由 于每一个权重和偏置有它自己的学习参数,每一个权重和偏置都可以用不同的参数。下面的命令将用 lerangdm 为前面建立的用增加方式训练的网络设置缺省的学习参数: net.biases1,1.learnFcn = 'le
54、arngdm'net.biases2,1.learnFcn = 'learngdm'net.layerWeights2,1.learnFcn = 'learngdm'net.inputWeights1,1.learnFcn = 'learngdm'net,a,e=adapt(net,p,t);批处理训练方式训练的另一种方式是批处理方式,它由函数 train 触发。在批处理方式中,当整个训练 设置被应用到网络后权重和偏置才被更新。 在每一个训练例子中的计算的梯度加在一起来决 定权重和偏置的变化。批处理梯度下降法 (TRAINGD)与增加方式
55、的学习函数 learngd 等价的函数是 traingd ,它是批处理形式中标准的最速下 降学习函数。 权重和偏置沿着性能函数的梯度的负方向更新。 如果你希望用批处理最速下降 法训练函数,你要设置网络的 trainFcn 为 traingd ,并调用 train 函数。不像以前章节的学习 函数,它们要单独设置权重矩阵和偏置向量,这一次给定的网络只有一个学习函数。Traingd 有几个训练参数: epochs,show,goal,time,min_grad,max_fail 和 lr 。这里的学习速 率和 lerangd 的意义是一样的。训练状态将每隔 show 次显示一次。其他参数决定训练什么 时候结束。如果训练次数超过epochs性能函数低于goal,梯度值低于mingrad或者训练时间超过time,训练就会结束。下面的代码将重建我们以前的网络,然后用批处理最速下降法训练网络。(注意用批处理方式训练的话所有的输入要设置为矩阵方式) net=newff(-1 2; 0 5,3,1,'tansig'
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗资源的浪费对策
- 主题8工业区位课件中华地图版高中地理必修二
- 年产xx产业园项目建议书
- 直接纱项目可行性研究报告
- 年产xxx超级不织布轮项目可行性研究报告(立项备案)
- 年产xx塑料糊墙品项目建议书
- 年产xx模具修补堆焊项目可行性研究报告(项目规划)
- 树铭商学院职业心态培训
- 2024年钢增强塑料项目资金申请报告代可行性研究报告
- 5.2自然环境的地域差异性 课件高二上学期地理人教版(2019)选择性必修1
- 中考命题作文预测及导写:“一步一步往前走”
- 口腔消毒灭菌知识培训课件
- 针刺治疗颈椎病
- 室内设计大学生职业生涯规划模板
- 工程人员服务意识培训课件
- 儿童视力保护培训课件
- 玻璃制品行业员工转正汇报
- 科学人教鄂教版六年级上册全册分层练习含答案
- 新时代十年生态文明建设成就
- 末梢采血护理课件
- 《疼痛的规范化治疗》课件
评论
0/150
提交评论