版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 单层前向网络及LMS算法1、单层感知器2、单层感知器的学习算法3、自适应线性神经元4、LMS学习算法5、仿真实例神经网络原理1感知器是由美国学者F.Rosenblatt在1957年首次提出的神经网络模型。LMS算法是由Widrow和Hoff在1960年提出的高效率易实现的自适应滤波算法。LMS(Least-Mean-Square)算法,可称为最小均方误差算法或梯度算法,也称为Delta规则。本章首先介绍单层感知器及其学习算法,然后介绍自适应线性元件及LMS算法,最后给出典型算法的仿真实例。2.1 单层感知器*感知器是神经网络用来进行模式识别的一种最简单模型。*单层感知器只能用来实现线性
2、可分的两类模式的识别。*单层感知器模型与MP模型的不同之处是其神经元的突触权值是可调的,这样就可以进行学习。*感知器模型在神经网络研究中具有重要的意义和地位。2.1.1 单层感知器模型感知器神经元模型如图2.1所示。I/O关系: 图2.1感知器模型单层感知器模型如图2.2定义加权系数wij为第i个神经元到第j个输入之间的连接值。 图2.2 单层感知器感知器包括一个线性累加器和一个二值阈值元件,同时还有一个外部偏差b。线性累加器的输出作为二值阈值元件的输入。二值阈值元件的输入为正数时,神经元输出 -1或0 。单层感知器可实现两类目标的识别,当感知器输出为+1时,我们认为输入模式为一类;当感知器输
3、出为-1时,我们认为输入模式为另一类。在m维信号空间,单层感知器进行模式识别的判决超平面由下式决定:图2.3 给出了一种只有两个输入 和 的判决超平面的情况,它的判决边界是直线 图2.3 两类模式识别的判定2.1.2单层感知器的学习算法单层感知器的学习算法是基于叠代的思想,通常是采用纠错学习规则的学习算法。为方便,将偏差b 作为权向量的一个分量加到权值向量中去,对应的输入向量也增加一项,可设输入向量的第一个分量固定为+1,则输入向量和权值向量可写成如下形式: 其中,变量n为叠代次数,b(n)可用 表示,则二值阈值元件的输入(激活值)可重新写为: 令上式等于零,即可得在m信号空间的单层感知器的判
4、决超平面。 学习算法如下:第一步 设置变量和参量: b(n)为偏差。 y(n)为实际输出。 d(n)为期望输出。 为学习速率。 n为迭代次数。第六步 判断是否满足条件,若满足算法结束,若不 满足则n值增加1,转到第三步重新执行。注意:在第六步判断的条件可以是:误差小于设定值,即 ;权值的变化量已很小,即 迭代次数大于N在感知器学习算法中,重要的是引入了一个量化的期望输出d(n),其定义为: 采用纠错学习规则对权向量进行逐步修正,对于线性可分的两类模式,可以证明单层感知器的学习算法是收敛的。2.1.3 matlab工具箱应用该函数返回一个新的感知器网络。2. Sim 神经网络仿真函数sim用于仿
5、真一个神经网络,调用格式为:Y, Pf, Af= sim (net, P, Pi, Ai)其中:net 神经网络;P 网络的输入;Pi 初始输入延迟,缺省值为0;Ai 初始的层延迟,缺省值为0。该函数返回 Y 网络的输出;Pf 最终输出延迟;Af 最终的层延迟。3. init 神经网络初始化调用格式为:net=init(net)init函数调用NET.initFcn函数,根据NET,initParam设定的参数对网络的权值和阈值进行初始化。 4. adapt 神经网络的自适应格式:net,Y,E,Pf,Af=adapt (NET, P, T, Pi, Ai )其中:NET 一个神经网络;P 网
6、络的输入;Pi 初始输入延迟,缺省值为0;Ai 初始的层延迟,缺省值为0。返回一个具有适应功能NET.adaptFcn及适应参数NET.adaptParam的结果:net 修正后的网络;Y 网络的输出;E网络的误差;Pf最终输出延迟;Af最终的层延迟。而参数T仅对需要目标的网络是必须的,而且是可任选的。5. train 神经网络的训练函数格式:net,tr=train(NET, P, T, Pi, Ai)train函数是按照NET.trainFcn和NET.trainParam训练网络NET的。其中:NET 神经网络;P 网络的输入;T 网络的目标,默认值为0;Pi 初始输入延迟,默认值为0;
7、Ai 初始的层延迟,默认值为0。返回:net 修正后的网络;TR 训练的纪录(训练步数和性能 epoch and perf ).而参数T仅对需要目标的网络是必须的,而且是可任选的。Pi 和Ai仅用于具有输入或层间的延迟的网络,而且也是可以任选的。6.learnp 感知器的权值/阈值学习函数格式: dW,LS=learnp(W,P,Z,N,A,T,E,gW,gA,D,LP,LS)db,LS=learnp(b,ones(1,Q),Z,N,A,T,E,gW,gA,D, LP,LS)info = learnp (code)W SR维的权值矩阵(或S1维的阈值向量);P Q组R维的输入向量(或Q组单个输
8、入);Z Q组R维的权值输入向量;N Q组R维的网络输入向量;A Q组R维的输出向量;T Q组R维的目标向量;E Q组R维的误差向量;gW SR维的性能参数的梯度;gA Q组R维的性能参数的输出梯度;LP 学习参数,若没有学习参数,LP=;LS 学习状态,初始值为。函数返回以下参数:dW SR维的权值(或阈值)变化阵;LS 新的学习状态;learnp(code) 对于每一个code 代码返回相应的有 用的信息:pnames 返回学习参数的名称;pdefaults 返回默认的学习参数;needg 如果该函数使用gW或gA,则返回值 为1。即:输入矢量:P=-0.5 0.5 0.3 0.0; -0
9、.5 0.5 -0.5 1.0目标矢量:T=1.0 1.0 0.0 0.0输入矢量可以用图来描述,对应于目标值0.0的输入矢量用符号表示,对应于目标值1.0的输入矢量符号+表示。输入矢量图 为解决这个问题,首先用函数newp构造一个输入向量均在-1,1之间的单个神经元感知器: net=newp(-1 1;-1 1,1); 用init 对网络进行初始化: net=init(net); 利用函数adapt调整网络的权值和阈值,直到误差为0时结束训练: net,Y,E=adapt(net,P,T); 训练结束后可得到下图所示的分类曲线,由图可见分类线将两类输入向量正确地分类:感知器神经网络在取不同的
10、初始条件时,其训练的结果不同,即用感知器求解分类问题可得到多个解。当网络训练完成之后,其权值和阈值就不再改变,这是就可利用训练好的感知器神经网络来解决实际的分类问题,对任意的输入矢量进行分类。例如:p=0.7;1.2;a=sim (net, p);得到的分类结果如图所示:可见感知器网络能对输入向量进行正确的分类,同时验证了网络的正确性。(源程序见附录1中的例2.1)感知器应用结果讨论局限性1)由于激活函数为阈值函数,输出矢量只能取0、1,所以仅可以解决简单的分类问题;2)输入矢量线性可分时,学习在有限次数内收敛;3)输入矢量的奇异性导致较慢的收敛。比如当输入/输出矢量分别为: P=-0.5 0
11、.5 +0.3 0.1 80 -0.5 +0.5 0.5 +1.0 100; T=1 1 0 0 1; 时,必然导致训练的困难;4)异或问题不可解。2.2自适应线性神经元自适应线性神经元Adaline模型如图2.4所示: 图2.4 自适应线性神经元模型 LMS算法模拟输出二值输出它实际上是一个连续时间线性阀值逻辑器件。神经元的输入向量的各分量被权向量加权( 连接单位输入 ,来控制阀值电平),得到模拟输出和二值输出。模拟输出为:二值输出为:其中: 为符号函数,当单个神经元具有n个二进制输入,共有 个可能的输入模式,具有一个模拟输出和一个二值输出。单个神经元只能实现线性可分函数。自适应线性神经元采
12、用LMS学习算法。 假定只有两个输入 和 ,则自适应线性神经元的模拟输出为: 调整临界阀值条件,可令y输出为零,有 该直线方程为自适应线性神经元实现线性可分函数。如图2.5所示,通过学习总是可以得到一条直线将空心小园和实心小园分开。 图2.5 线性可分模式空间 用自适应线性神经元实现非线性可分函数的方法有两种,一是对神经元施加非线性输入函数,如图2.6所示。 图2.6 两个非线性输入的Adaline神经元若令Y=0,上式为曲线方程,通过选择W,可实现非线性函数,使得自适应线性神经元具有非线性可分性。如图2.7所示: 图2.7 自适应线性元件的非线性可分性 另一种实现非线性函数可分的方法是由多个
13、自适应线性神经元和AND逻辑器件构成的,所谓Madalines网络,如图2.8所示。 图2.8 两输入Madalines 模型 AND 其原理是实现多个线性函数,对线性不可非区域进行划分。如图2.9所示:图2.9 Madalines的非线性划分2.3 LMS学习算法LMS算法也称为Widrow-Hoff算法或Delta算法,由于容易实现而很快得到了广泛的应用,成为自适应滤波的标准算法。Adaline和Madalines模型所采用的就是LMS算法。该方法通过调整单个神经元的权值,使神经元的实际输出与理想输出之差为最小。LMS算法采用了误差最速下降准则,使用的误差测度函数为均方误差MSE。即权值的
14、调整是按均方误差函数负梯度变化。即有其中 是当前权值, 是下一步权值, 是学习率, 是MES曲面上对应于 的梯度值。 设MSE测度函数(误差平方和)为其中, 为在j 输出单元的期望输出;第j 单元的实际输出为改写上式为:其中, 为当前模式输入向量。定义瞬时梯度为:则有注意,上式采用的是瞬时梯度下降来训练网络的权值,因此,LMS算法实际上偏离了E真正的梯度下降方向,是一种近似的梯度下降。但当学习率很小时,这种偏离是可以忽略的。当学习率 比较小时,LMS算法自适应过程较慢, 但这时可记忆更多的过去数据,从而结果更精确。也可以说,学习率的倒数表示了LMS算法的记忆容量。 若要实现全局误差函数E上的梯
15、度下降,则的变化应正比于负平均梯度,即: 之所以采用瞬时梯度,是因为它可以直接从单个样本数据求得。此外,要计算所有训练模式的平均梯度是很费时的,因而在实际中很少用。 当用式(2.2)来训练网络,为获得全局误差最小的最优权值,需要无限次的迭代运算。有限次迭代得到的解只是近似解,这是LMS学习算法的一个不足之处。 可以看出,LMS算法与感知器的误差修正算法在形式上是一样的,但他们有本质上的差别。差别在于:感知器学习的数学基础是模式空间超平面位置的调整;LMS算法学习的数学基础是误差曲面上的梯度下降。LMS算法步骤初始化 。选择一输入样本 。计算实际输出 。如果误差 则结束训练。计算 ,更新 。返回
16、 2网络应用设计举例 对线性神经元进行训练设计一个简单的单层线性神经元,使其实现从输入到输出的变换关系。 P=+1.0 1.2 T=+0.5 +1.0给出权值和阈值的范围并绘制误差曲面及误差等高线, w_range = -1:0.1:1; b_range = -1:0.1:1; ES = errsurf(P,T,w_range,purelin); plotes(w_range,b_range,ES);误差曲面及误差等高线误差曲面及误差等高线如下图所示。学习速率问题 在网络设计中,学习速率的选取是影响收敛速 度以及训练结果的一个很重要的因素。只要学 习速率足够小,采用Widrow-Hoff学习规
17、则的 线性网络总可以训练出一个最小的输出误差。 但是当学习速率较大时,可导致训练过程的不 稳定。Matlab工具箱给出了一个正确求解学习 率的函数maxlinlr。下面我们用maxlinlr求得 的学习率大的值训练网络。举例 学习速率过大输入和目标与上例相同,但学习率是原来的1.5倍。本例选取的学习率为 maxlr = maxlinlr(P,bias);训练次数为 net.trainParam.epochs= 20;建立一个学习率为原来的1.5倍的线性网络:net = newlin( -2 2,1,0,maxlr*2.25) 该程序的仿真结果为: a= 66.2114 1.误差曲面及误差等高线 2.训练过程的误差曲线 当学习率选取较大时,误差越来越大 ,网络不收敛。如图所示。举例 自适应噪声消除 设计一个自适应线性网络,使其对输入信号进行预测。程序如下:time = 1:0.01:2.5;X = sin(sin(time).*time*10);P = con2seq(X);T = con2seq(2*0 X(1:(end-1) + X);plot(time,cat(2,P:),time,cat(2,T:),-);title(Input and Ta
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年美容院国际市场拓展与合作合同
- 2024年铁塔租赁与智慧城市建设合同3篇
- 2025版“塑料销售合同”英文修订版3篇
- 2024年润滑油生产销售运输合同
- 2025版人工智能技术合作开发合同中知识产权归属及风险分担条款2篇
- 二零二五年度二手房买卖合同公证操作规范与行业规范解读6篇
- 2024文化娱乐场所设计与装修合同
- 2025年度ROHS环保产品认证及市场推广服务合同3篇
- 二零二五年度中小企业科技成果转化贷款合同范本3篇
- 2025版劳动合同法与员工绩效管理机制相结合的合同范本3篇
- 信息化工程建设项目可行性研究报告编制要求
- 床旁教学方法
- 2024湖南株洲攸县城关国家粮食储备库员工招聘2人历年高频难、易错点500题模拟试题附带答案详解
- 尘埃粒子95%置信上限UCL计算公式
- 2023年某公司综合部业务流程纲要
- Python试题库(附参考答案)
- DB34∕T 4638-2023 创新型智慧园区建设与管理规范
- 巴渝文化探究课程设计
- 江苏省南京市2025届高三第一次调研考试(一模)英语试题含解析
- 无人机配送行业市场机遇分析
- 数据库原理-期末考试复习题及答案
评论
0/150
提交评论