版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、人工神经元模拟生物神经元的一阶特性。输入:X=(x1,x2,xn)联接权:W=(w1,w2,wn)T网络输入:net=xiwi向量形式:net=XW2022/8/41人工神经元的基本构成 xn wnx1 w1x2 w2net=XW第1页,共72页。激活函数执行对该神经元所获得的网络输入的变换,也可以称为激励函数、活化函数: o=f(net) 1、线性函数(Liner Function) f(net)=k*net+c 2022/8/42 激活函数(Activation Function) netooc第2页,共72页。 if netf(net)= k*netif |net|0为一常数,被称为饱和
2、值,为该神经元的最大输出。 2022/8/432、非线性斜面函数(Ramp Function)第3页,共72页。2022/8/442、非线性斜面函数(Ramp Function) - - net o 第4页,共72页。if netf(net)=-if net 、均为非负实数,为阈值二值形式:1if netf(net)=0if net 双极形式:1if netf(net)=-1if net 2022/8/453、阈值函数(Threshold Function)阶跃函数第5页,共72页。 2022/8/463、阈值函数(Threshold Function)阶跃函数-onet0第6页,共72页。压
3、缩函数(Squashing Function)和逻辑斯特函数(Logistic Function)。f(net)=a+b/(1+exp(-d*net)a,b,d为常数。它的饱和值为a和a+b。最简单形式为:f(net)= 1/(1+exp(-d*net) 函数的饱和值为0和1。S形函数有较好的增益控制 2022/8/474、S形函数 第7页,共72页。2022/8/484、S形函数 a+b o(0,c)netac=a+b/2第8页,共72页。生物神经网六个基本特征神经元及其联接、信号传递、训练、刺激与抑制、累积效果、 阈值。人工神经元的基本构成2022/8/49课内容回顾xn wnx1 w1x
4、2 w2net=XW第9页,共72页。激活函数与M-P模型 线性函数、非线性斜面函数、阈值函数 S形函数 M-P模型2022/8/410上次课内容回顾x2 w2fo=f(net)xn wnnet=XWx1 w1第10页,共72页。2022/8/411简单单级网x1x2xno1o2omwnmw11w1mw2mwn1输出层输入层第11页,共72页。W=(wij)输出层的第j个神经元的网络输入记为netj:netj=x1w1j+x2w2j+xnwnj其中, 1 j m。取NET=(net1,net2,netm)NET=XWO=F(NET)2022/8/412简单单级网第12页,共72页。2022/8
5、/413单级横向反馈网输出层x1o1w11w1mx2o2w2mxnomwn1输入层V第13页,共72页。V=(vij)NET=XW+OVO=F(NET)时间参数神经元的状态在主时钟的控制下同步变化考虑X总加在网上的情况NET(t+1)=X(t)W+O(t)VO(t+1)=F(NET(t+1)O(0)=0考虑仅在t=0时加X的情况。 稳定性判定2022/8/414单级横向反馈网 第14页,共72页。2022/8/415多级网输出层隐藏层输入层o1o2omx1x2xn第15页,共72页。层次划分 信号只被允许从较低层流向较高层。层号确定层的高低:层号较小者,层次较低,层号较大者,层次较高。输入层:
6、被记作第0层。该层负责接收来自网络外部的信息2022/8/416输出层隐藏层输入层o1o2omx1x2xn第16页,共72页。第j层:第j-1层的直接后继层(j0),它直接接受第j-1层的输出。输出层:它是网络的最后一层,具有该网络的最大层号,负责输出网络的计算结果。隐藏层:除输入层和输出层以外的其它各层叫隐藏层。隐藏层不直接接受外界的信号,也不直接向外界发送信号2022/8/417输出层隐藏层输入层o1o2omx1x2xn第17页,共72页。约定 :输出层的层号为该网络的层数:n层网络,或n级网络。第j-1层到第j层的联接矩阵为第j层联接矩阵,输出层对应的矩阵叫输出层联接矩阵。今后,在需要的
7、时候,一般我们用W(j)表示第j层矩阵。2022/8/418输出层隐藏层输入层o1o2omx1x2xnW(1)W(2)W(3)W(h)第18页,共72页。2022/8/419多级网 层网络输出层隐藏层输入层o1o2omx1x2xnW(1)W(2)W(3)W(h)第19页,共72页。非线性激活函数 F(X)=kX+CF3(F2(F1(XW(1)W(2)W(3)2022/8/420多级网第20页,共72页。2022/8/421循环网x1o1输出层隐藏层输入层x2o2omxn第21页,共72页。如果将输出信号反馈到输入端,就可构成一个多层的循环网络。输入的原始信号被逐步地加强、被修复。大脑的短期记忆
8、特征:看到的东西不是一下子就从脑海里消失的。稳定:反馈信号会引起网络输出的不断变化。我们希望这种变化逐渐减小,并且最后能消失。当变化最后消失时,网络达到了平衡状态。如果这种变化不能消失,则称该网络是不稳定的。 2022/8/422循环网 第22页,共72页。人工神经网络最具有吸引力的特点是它的学习能力。1962年,Rosenblatt给出了人工神经网络著名的学习定理:人工神经网络可以学会它可以表达的任何东西。人工神经网络的表达能力大大地限制了它的学习能力。人工神经网络的学习过程就是对它的训练过程2022/8/423人工神经网络的训练 第23页,共72页。无导师学习(Unsupervised L
9、earning)与无导师训练(Unsupervised Training)相对应 抽取样本集合中蕴含的统计特性,并以神经元之间的联接权的形式存于网络中。2022/8/424无导师学习 第24页,共72页。有导师学习(Supervised Learning)与有导师训练(Supervised Training)相对应。输入向量与其对应的输出向量构成一训练。有导师学习的训练算法的主要步骤包括:1) 从样本集合中取一个样本(Ai,Bi);2) 计算出网络的实际输出O; 3) 求D=Bi-O;4) 根据D调整权矩阵W; 5) 对每个样本重复上述过程,直到对整个样本集来说,误差不超过规定范围。 2022
10、/8/425 有导师学习 第25页,共72页。Widrow和Hoff的写法:Wij(t+1)=Wij(t)+(yj- aj(t)oi(t)也可以写成:Wij(t+1)=Wij(t)+Wij(t)Wij(t)=joi(t)j=yj- aj(t)Grossberg的写法为: Wij(t)=ai(t)(oj(t)-Wij(t)更一般的Delta规则为: Wij(t)=g(ai(t),yj,oj(t),Wij(t)2022/8/426Delta规则 第26页,共72页。1 概述 2 基本BP算法 3 算法的改进 4 算法的实现 5 算法的理论基础 6 几个问题的讨论 2022/8/427BP网络第27
11、页,共72页。1、BP算法的出现非循环多级网络的训练算法UCSD PDP小组的Rumelhart、Hinton和Williams1986年独立地给出了BP算法清楚而简单的描述1982年,Paker就完成了相似的工作1974年,Werbos已提出了该方法2、弱点:训练速度非常慢、局部极小点的逃离问题、算法不一定收敛。3、优点:广泛的适应性和有效性。2022/8/428一 概述 第28页,共72页。4、BP网络主要用于1)函数逼近:用输入向量和相应的输出向量训练一个网络逼近一个函数。2)模式识别:用一个特定的输出向量将它与输入向量联系起来。3)分类:把输入向量 以所定义的合适方式进行分类。4)数据
12、压缩:减少输出向量维数以便于传输或存储。2022/8/429概述第29页,共72页。1 网络的构成 神经元的网络输入:neti=x1w1i+x2w2i+xnwni神经元的输出:2022/8/430二 基本BP算法 第30页,共72页。应该将net的值尽量控制在收敛比较快的范围内可以用其它的函数作为激活函数,只要该函数是处处可导的2022/8/431输出函数分析0.5f (net)0.25o0 11(0,0.5)net(0,0)o第31页,共72页。2022/8/432网络的拓扑结构x1o1输出层隐藏层输入层x2o2omxnW(1)W(2)W(3)W(L)第32页,共72页。BP网的结构输入向量
13、、输出向量的维数、网络隐藏层的层数和各个隐藏层神经元的个数的决定实验:增加隐藏层的层数和隐藏层神经元个数不一定总能够提高网络精度和表达能力。BP网一般都选用二级网络。2022/8/433网络的拓扑结构 第33页,共72页。2022/8/434网络的拓扑结构x1o1输出层隐藏层输入层x2o2omxnWV第34页,共72页。样本:(输入向量,理想输出向量)权初始化:小随机数与饱和状态;不同保证网络可以学。1、向前传播阶段:(1)从样本集中取一个样本(Xp,Yp),将Xp输入网络;(2)计算相应的实际输出Op:Op=Fl(F2(F1(XpW(1)W(2)W(L)2022/8/4352 训练过程概述
14、第35页,共72页。2、向后传播阶段 误差传播阶段:(1)计算实际输出Op与相应的理想输出Yp的差;(2)按极小化误差的方式调整权矩阵。(3)网络关于第p个样本的误差测度:2022/8/4362 训练过程概述 (4) 网络关于整个样本集的误差测度:第36页,共72页。2022/8/4373 误差传播分析 1、输出层权的调整wpq= wpq+wpqwpq=qop=fn (netq)(yq-oq)op=oq(1-oq) (yq-oq)op wpqANpANq第L-1层第L层wpq第37页,共72页。2022/8/4382、隐藏层权的调整 ANpANqANhvhppk-11kwp1wpqqkwpmm
15、k第k-2层第k层第k-1层第38页,共72页。2022/8/4392、隐藏层权的调整pk-1的值和1k,2k, ,mk 有关不妨认为pk-1通过权wp1对1k做出贡献,通过权wp2对2k做出贡献,通过权wpm对mk做出贡献。pk-1= fk-1(netp) (wp11k+ wp22k+ wpmm k)第39页,共72页。vhp=vhp+vhp vhp=pk-1ohk-2 =fk-1 (netp)( wp11k+ wp22k+ + wpmmk)ohk-2=opk-1(1-opk-1)( wp11k+ wp22k+ + wpmmk)ohk-22022/8/4402、隐藏层权的调整ANpANqAN
16、hvhppk-11kwp1wpmqkwpqmk第k-2层第k层第k-1层第40页,共72页。基本BP算法neti=x1w1i+x2w2i+ +xnwni2022/8/441内容回顾第41页,共72页。2022/8/442内容回顾x1o1输出层隐藏层输入层x2o2omxnWV第42页,共72页。样本权初始化向前传播阶段Op=Fn(F2(F1(XpW(1)W(2)W(n)误差测度2022/8/443内容回顾第43页,共72页。向后传播阶段 误差传播阶段输出层权的调整wpq= qop =fn (netq)(yq-oq)op =oq(1-oq) (yq-oq)op隐藏层权的调整2022/8/444内容
17、回顾ANpANqANhvhppk-11kwp1wpqqkwpmmkvhp =opk-1(1-opk-1)( wp11k+ wp22k+ + wpmmk)ohk-2第44页,共72页。样本集:S=(X1,Y1),(X2,Y2),(Xs,Ys) 基本思想 :逐一地根据样本集中的样本(Xk,Yk)计算出实际输出Ok和误差测度E1,对W(1) ,W(2) ,W(L)各做一次调整,重复这个循环,直到Ep do 4.1 E=0; 2022/8/446基本BP算法 第46页,共72页。 4.2 对S中的每一个样本(Xp,Yp): 4.2.1 计算出Xp对应的实际输出Op; 4.2.2 计算出Ep; 4.2.
18、3 E=E+Ep; 4.2.4 根据相应式子调整W(L); 4.2.5 k=L-1; 4.2.6 while k0 do 4.2.6.1 根据相应式子调整W(k); 4.2.6.2 k=k-1 4.3 E=E/2.0 2022/8/447基本BP算法第47页,共72页。1、BP网络接受样本的顺序对训练结果有较大影响。它更偏爱较后出现的样本2、给集中的样本安排一个适当的顺序,是非常困难的。3、样本顺序影响结果的原因:分别依次4、用(X1,Y1),(X2,Y2), ,(Xs,Ys)的总效果修改W(1) ,W(2) , ,W(L)。w(k)ij=p w(k)ij2022/8/448算法的改进 第48
19、页,共72页。1 for k=1 to L do1.1 初始化W(k);2 初始化精度控制参数;3 E=+1;4 while E do 4.1 E=0;4.2 对所有的i,j,k: w (k)ij=0; 2022/8/449消除样本顺序影响的BP算法 第49页,共72页。4.3 对S中的每一个样本(Xp,Yp):4.3.1 计算出Xp对应的实际输出Op;4.3.2 计算出Ep;4.3.3 E=E+Ep;4.3.4 对所有i,j根据相应式子计算p w (L)ij;4.3.5 对所有i,j: w (L)ij= w (L)ij+p w (L)ij;4.3.6 k=L-1;4.3.7 while k0
20、 do4.3.7.1 对所有i,j根据相应式子计算p w (k)ij;4.3.7.2 对所有i,j: w (k)ij= w (k)ij+p w (k)ij;4.3.7.3 k=k-1 4.4 对所有i,j,k:w (k)ij= w (k)ij+ w (k)ij;4.5 E=E/2.0 2022/8/450第50页,共72页。较好地解决了因样本的顺序引起的精度问题和训练的抖动问题 收敛速度:比较慢偏移量:给每一个神经元增加一个偏移量来加快收敛速度 冲量:联接权的本次修改要考虑上次修改的影响,以减少抖动问题 2022/8/451算法分析 第51页,共72页。主要数据结构WH,m 输出层的权矩阵;V
21、n,H 输入(隐藏)层的权矩阵;m输出层各联接权的修改量组成的向量;H隐藏层各联接权的修改量组成的向量;O1隐藏层的输出向量;O2输出层的输出向量;(X,Y)一个样本。 2022/8/452 算法的实现 第52页,共72页。用不同的小伪随机数初始化W,V;初始化精度控制参数;学习率 ; 循环控制参数E=+1;循环最大次数M;循环次数控制参数N=0; while E & N0,此时wij0取E0wij第59页,共72页。2022/8/460最速下降法,要求E的极小点而其中的 所以, 第60页,共72页。2022/8/461最速下降法,要求E的极小点令所以wij=joi为学习率第61页,共72页。oj=f(netj) 容易得到 2022/8/462ANj为输出层神经元 从而 第62页,共72页。2022/8/463ANj
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑工程合同评审方案
- 技术转让合同范例
- 2025年小麦种植户联合销售合同协议
- 2024年武威职业学院单招职业倾向性测试模拟测试卷附答案解析
- 2025年福建生物工程职业技术学院单招综合素质考试模拟测试卷附答案解析
- 2023年浙江经贸职业技术学院单招职业倾向性考试模拟测试卷附答案解析
- 2025中国人民大学商学院招聘历年真题汇编及答案解析(夺冠)
- 2024年皖北卫生职业学院单招职业倾向性考试模拟测试卷附答案解析
- 2024年云南旅游职业学院单招综合素质考试题库附答案解析
- 2024年廊坊燕京职业技术学院单招职业倾向性测试题库附答案解析
- 2025黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解(3卷)
- 2025年下半年贵州遵义市市直事业单位选调56人笔试考试备考试题及答案解析
- 2025年烟草笔试真题题库及答案
- 2025年新版动物防疫员考试题及答案
- 2025山西大地环境投资控股有限公司招聘116人备考笔试试题及答案解析
- QGDW11447-202410kV-500kV输变电设备交接试验规程
- 500千伏输电线路工程项目管理实施规划
- 哪吒主题课件模板文档
- 2024年客运资格证考试试题及答案解析
- JTS+155-1-2019码头岸电设施检测技术规范
- DL-T-1946-2018气体绝缘金属封闭开关设备X射线透视成像现场检测技术导则
评论
0/150
提交评论