绝对经典RBF神经网络课件_第1页
绝对经典RBF神经网络课件_第2页
绝对经典RBF神经网络课件_第3页
绝对经典RBF神经网络课件_第4页
绝对经典RBF神经网络课件_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

RBF网络特点只有一个隐层,且隐层神经元与输出层神经元的模型不同。隐层节点激活函数为径向基函数,输出层节点激活函数为线性函数。隐层节点激活函数的净输入是输入向量与节点中心的距离(范数)而非向量内积,且节点中心不可调。隐层节点参数确定后,输出权值可通过解线性方程组得到。隐层节点的非线性变换把线性不可分问题转化为线性可分问题。局部逼近网络(MLP是全局逼近网络),这意味着逼近一个输入输出映射时,在相同逼近精度要求下,RBF所需的时间要比MLP少。具有唯一最佳逼近的特性,无局部极小。合适的隐层节点数、节点中心和宽度不易确定。RBF网络特点只有一个隐层,且隐层神经元与输出层神经元的模型1.Gauss(高斯)函数:2.反演S型函数:3.拟多二次函数:σ

称为基函数的扩展常数或宽度,σ越小,径向基函数的宽度越小,基函数就越有选择性。径向基函数(RBF)1.Gauss(高斯)函数:2.反演S型函数:3.拟多全局逼近和局部逼近全局逼近网络局部逼近网络当神经网络的一个或多个可调参数(权值和阈值)对任何一个输出都有影响,则称该神经网络为全局逼近网络。对网络输入空间的某个局部区域只有少数几个连接权影响网络的输出,则称该网络为局部逼近网络学习速度很慢,无法满足实时性要求的应用学习速度快,有可能满足有实时性要求的应用全局逼近和局部逼近全局逼近网络局部逼近网络当神经网络的一个或RBF网络的工作原理函数逼近:以任意精度逼近任一连续函数。一般函数都可表示成一组基函数的线性组合,RBF网络相当于用隐层单元的输出构成一组基函数,然后用输出层来进行线性组合,以完成逼近功能。分类:解决非线性可分问题。RBF网络用隐层单元先将非线性可分的输入空间设法变换到线性可分的特征空间(通常是高维空间),然后用输出层来进行线性划分,完成分类功能。RBF网络的工作原理函数逼近:分类:RBF神经网络两种模型正规化网络RN广义网络GN通用逼近器模式分类基本思想:通过加入一个含有解的先验知识的约束来控制映射函数的光滑性,若输入一输出映射函数是光滑的,则重建问题的解是连续的,意味着相似的输入对应着相似的输出。基本思想:用径向基函数作为隐单元的“基”,构成隐含层空间。隐含层对输入向量进行变换,将低维空间的模式变换到高维空间内,使得在低维空间内的线性不可分问题在高维空间内线性可分。RBF神经网络两种模型正规化网络RN广义网络GN通用逼近器模两种模型的比较隐节点=输入样本数隐节点<输入样本数

所有输入样本设为径向基函数的中心径向基函数的中心由训练算法确定径向基函数取统一的扩展常数径向基函数的扩展常数不再统一由训练算法确定没有设置阈值输出函数的线性中包含阈值参数,用于补偿基函数在样本集上的平均值与目标值之平均值之间的差别。RNGN两种模型的比较隐节点=输入样本数隐节点<输入样本数所有输入函数逼近问题(内插值)

一般函数都可表示成一组基函数的线性组合,RBF网络相当于用隐层单元的输出构成一组基函数,然后用输出层来进行线性组合,以完成逼近功能。①给定样本数据

②寻找函数,使其满足:函数逼近问题(内插值)一般函数都可表示成一组基函数的线1.网络隐层使用Q个隐节点。2.把所有Q个样本输入分别作为Q个隐节点的中心。3.各基函数取相同的扩展常数。4.确定权值可解线性方程组:设第j

个隐节点在第i个样本的输出为:可矩阵表示:,若R可逆,则解为 根据Micchelli定理可得,如果隐节点激活函数采用径向基函数,且各不相同,则线性方程组有唯一解。

RBF网络输出1.网络隐层使用Q个隐节点。RBF网络输出举例:RBF网络实现函数逼近

1.问题的提出:假设如下的输入输出样本,输入向量为[-11]区间上等间隔的数组成的向量P,相应的期望值向量为T。P=-1:0.1:1;T=[-0.9602-0.5770-0.07290.37710.64050.66000.46090.1336-0.2013-0.4344-0.5000-0.3930-0.16470.09880.30720.39600.34490.1816-0.0312-0.2189-0.3201];%以输入向量为横坐标,期望值为纵坐标,绘制训练用样本的数据点。figure;plot(P,T,'+')title('训练样本')xlabel('输入矢量P')ylabel('目标矢量T')gridon%目的是找到一个函数能够满足这21个数据点的输入/输出关系,其中一个方法是通过构建径向基函数网络来进行曲线拟合举例:RBF网络实现函数逼近1.问题的提出:假设如下的输入2.网络设计:设计一个径向基函数网络,网络有两层,隐含层为径向基神经元,输出层为线性神经元。

p=-3:0.1:3;

a=radbas(p);

figure;

plot(p,a)

title('径向基传递函数')

xlabel('输入p')

ylabel('输出a')gridon%每一层神经元的权值和阈值都与径向基函数的位置和宽度有关系,输出层的线性神经元将这些径向基函数的权值相加。如果隐含层神经元的数目足够,每一层的权值和阈值正确,那么径向基函数网络就完全能够精确的逼近任意函数。

a2=radbas(p-1.5);

a3=radbas(p+2);

a4=a+a2*1+a3*0.5;

figure;

plot(p,a,'b-',p,a2,'b-',p,a3,'b-',p,a4,'m--');

title('径向基传递函数之和')

xlabel('输入p')

ylabel('输出a')gridon%应用newb()函数可以快速构建一个径向基神经网络,并且网络自动根据输入向量和期望值进行调整,从而进行函数逼近,预先设定均方差精度为eg以及散布常数sc。

eg=0.02;

sc=1;

net=newrb(P,T,eg,sc);2.网络设计:设计一个径向基函数网络,网络有两层,隐含层为径3.网络测试:将网络输出和期望值随输入向量变化的曲线绘制在一张图上,就可以看出网络设计是否能够做到函数逼近。

figure;

plot(P,T,'+');

xlabel('输入');

X=-1:0.01:1;

Y=sim(net,X);

holdon;

plot(X,Y);

holdoff;

legend('目标','输出')

gridon

3.网络测试:将网络输出和期望值随输入向量变化的曲线绘制在一分类问题低维空间:线性不可分高维空间:线性可分

空间转换关于对单层感知器的讨论可知,若N维输入样本空间的样本模式是线性可分的,总存在一个用线性方程描述的超平面,使两类线性可分样本截然分开。若两类样本是非线性可分的,则不存在一个这样的分类超平面。但根据Cover定理,非线性可分问题可能通过非线性变换获得解决。Cover定理可以定性地表述为:将复杂的模式分类问题非线性地投射到高维空间将比投射到低维空间更可能是线性可分的分类问题空间转换关于对单层感知器的讨论可知,若N维输入样本空Φ1(x)∑X2X1Φ2(x)w11w11Outputy举例:逻辑运算异或的分类X1X2X1X2000011101110XOR异或空间变换前Φ1(x)∑X2X1Φ2(x)w11w11OutputyX1X2000.13531010.36790.3679100.36790.36791110.1353基函数空间变换后X1X2000.13531010.36790.3679100RBF学习算法RBF学习的三个参数:①基函数的中心②方差(扩展常数)③隐含层与输出层间的权值当采用正归化RBF网络结构时,隐节点数即样本数,基函数的数据中心即为样本本身,参数设计只需考虑扩展常数和输出节点的权值。当采用广义RBF网络结构时,RBF网络的学习算法应该解决的问题包括:如何确定网络隐节点数,如何确定各径向基函数的数据中心及扩展常数,以及如何修正输出权值。RBF学习算法RBF学习的三个参数:①基函数的中心当采用正归两种方法中心的选取1.中心从样本输入中选取2.中心自组织选取常采用各种动态聚类算法对数据中心进行自组织选择,在学习过程中需对数据中心的位置进行动态调节。常用的方法是K-means聚类,其优点是能根据各聚类中心之间的距离确定各隐节点的扩展常数。由于RBF网的隐节点数对其泛化能力有极大的影响,所以寻找能确定聚类数目的合理方法,是聚类方法设计RBF网时需首先解决的问题。除聚类算法外,还有梯度训练方法、资源分配网络(RAN)等一般来说,样本密集的地方中心点可以适当多些,样本稀疏的地方中心点可以少些;若数据本身是均匀分布的,中心点也可以均匀分布。总之,选出的数据中心应具有代表性。径向基函数的扩展常数是根据数据中心的散布而确定的,为了避免每个径向基函数太尖或太平,一种选择方法是将所有径向基函数的扩展常数设为两种方法中心的选取1.中心从样本输入中选取2.中心自组织选取一.自组织中心选取法

1989年,Moody和Darken提出了一种由两个阶段组成的混合学习过程的思路。两个步骤:①无监督的自组织学习阶段

②有监督学习阶段

其任务是用自组织聚类方法为隐层节点的径向基函数确定合适的数据中心,并根据各中心之间的距离确定隐节点的扩展常数。一般采用Duda和Hart1973年提出的k-means聚类算法。其任务是用有监督学习算法训练输出层权值,一般采用梯度法进行训练。一.自组织中心选取法1989年,Moody和D

在聚类确定数据中心的位置之前,需要先估计中心的个数(从而确定了隐节点数),一般需要通过试验来决定。由于聚类得到的数据中心不是样本数据本身,因此用表示第n次迭代时的中心。应用K-means聚类算法确定数据中心的过程如下。(1)初始化。选择个互不相同的向量作为初始聚类中心(2)计算输入空间各样本点与聚类中心点的欧式距离1.中心学习在聚类确定数据中心的位置之前,需要先估计中心的(3)相似匹配。令代表竞争获胜隐节点的下标,对每一个输入样本根据其与聚类中心的最小欧式距离确定其归类,即当时,被归为第类,从而将全部样本划分为个子集每个子集构成一个以聚类中心为典型代表的聚类域。(3)相似匹配。令代表竞争获胜隐节点的下标,对每一个(4)更新各类的聚类中心。采用竞争学习规则进行调整将n值加1,转到第(2)步。重复上述过程直到。其他(4)更新各类的聚类中心。采用竞争学习规则进行调整其他2.确定扩展常数各聚类中心确定后,可根据各中心之间的距离确定对应径向基函数的扩展常数。令则扩展常数可取为为重叠系数2.确定扩展常数各聚类中心确定后,可根据各中心之间的距为重叠3.学习权值权值的学习可以用LMS学习算法注意:①LMS算法的输入为RBF网络隐含层的输出②RBF网络输出层的神经元只是对隐含层神经元的输出加权和。因此RBF网络的实际输出为其中用LMS方法求解用伪逆方法求解为期望响应是矩阵的伪逆伪逆的求法奇异矩阵或非方阵的矩阵不存在逆矩阵,若XAX=A,AXA=X则X称为A的伪逆阵。在matlab中用pinv(A)求伪逆3.学习权值权值的学习可以用LMS学习算法为期望响应绝对经典RBF神经网络课件二.有监督选取中心算法RBF中心以及网络的其他自由参数都是通过有监督的学习来确定,以单输出的RBF为例定义目标函数误差信号寻求网络的自由参数(与中心有关)使目标函数达到最小

N是训练样本的个数二.有监督选取中心算法RBF中心以及网络的其他自由参数都是通1.输出层权值2.隐含层RBF中心1.输出层权值2.隐含层RBF中心3.隐含层RBF的扩展其中是的导数3.隐含层RBF的扩展其中是绝对经典RBF神经网络课件三.随机选取中心法条件:典型的训练样本,隐含单元的中心是随机的在输入样本中选取,且中心固定。因此此算法学习的参数只有两个:方差和权值四.OLS学习算法

RBF神经网络的性能严重依赖于所选择的中心数目和位置是否合适实际中,人们一般是随机地从输入模式中选择中心,或用某种聚类算法(如:K均值算法)选择出确定数目的中心,这样通常导致所设计的网络性能不是很差就是规模过大,甚至造成数值病态问题.Chen,Cowan,Grant(1992)提出的OLS(正交最小二乘)前向选择算法将RBF中心的选择归结为线性回归中子模型的选择问题这种算法能自动地避免网络规模过大和随机选择中心带来的数值病态问题,是一种有效的自动选择中心的算法。三.随机选取中心法条件:典型的训练样本,隐含单元的中心是随谢谢谢谢RBF网络特点只有一个隐层,且隐层神经元与输出层神经元的模型不同。隐层节点激活函数为径向基函数,输出层节点激活函数为线性函数。隐层节点激活函数的净输入是输入向量与节点中心的距离(范数)而非向量内积,且节点中心不可调。隐层节点参数确定后,输出权值可通过解线性方程组得到。隐层节点的非线性变换把线性不可分问题转化为线性可分问题。局部逼近网络(MLP是全局逼近网络),这意味着逼近一个输入输出映射时,在相同逼近精度要求下,RBF所需的时间要比MLP少。具有唯一最佳逼近的特性,无局部极小。合适的隐层节点数、节点中心和宽度不易确定。RBF网络特点只有一个隐层,且隐层神经元与输出层神经元的模型1.Gauss(高斯)函数:2.反演S型函数:3.拟多二次函数:σ

称为基函数的扩展常数或宽度,σ越小,径向基函数的宽度越小,基函数就越有选择性。径向基函数(RBF)1.Gauss(高斯)函数:2.反演S型函数:3.拟多全局逼近和局部逼近全局逼近网络局部逼近网络当神经网络的一个或多个可调参数(权值和阈值)对任何一个输出都有影响,则称该神经网络为全局逼近网络。对网络输入空间的某个局部区域只有少数几个连接权影响网络的输出,则称该网络为局部逼近网络学习速度很慢,无法满足实时性要求的应用学习速度快,有可能满足有实时性要求的应用全局逼近和局部逼近全局逼近网络局部逼近网络当神经网络的一个或RBF网络的工作原理函数逼近:以任意精度逼近任一连续函数。一般函数都可表示成一组基函数的线性组合,RBF网络相当于用隐层单元的输出构成一组基函数,然后用输出层来进行线性组合,以完成逼近功能。分类:解决非线性可分问题。RBF网络用隐层单元先将非线性可分的输入空间设法变换到线性可分的特征空间(通常是高维空间),然后用输出层来进行线性划分,完成分类功能。RBF网络的工作原理函数逼近:分类:RBF神经网络两种模型正规化网络RN广义网络GN通用逼近器模式分类基本思想:通过加入一个含有解的先验知识的约束来控制映射函数的光滑性,若输入一输出映射函数是光滑的,则重建问题的解是连续的,意味着相似的输入对应着相似的输出。基本思想:用径向基函数作为隐单元的“基”,构成隐含层空间。隐含层对输入向量进行变换,将低维空间的模式变换到高维空间内,使得在低维空间内的线性不可分问题在高维空间内线性可分。RBF神经网络两种模型正规化网络RN广义网络GN通用逼近器模两种模型的比较隐节点=输入样本数隐节点<输入样本数

所有输入样本设为径向基函数的中心径向基函数的中心由训练算法确定径向基函数取统一的扩展常数径向基函数的扩展常数不再统一由训练算法确定没有设置阈值输出函数的线性中包含阈值参数,用于补偿基函数在样本集上的平均值与目标值之平均值之间的差别。RNGN两种模型的比较隐节点=输入样本数隐节点<输入样本数所有输入函数逼近问题(内插值)

一般函数都可表示成一组基函数的线性组合,RBF网络相当于用隐层单元的输出构成一组基函数,然后用输出层来进行线性组合,以完成逼近功能。①给定样本数据

②寻找函数,使其满足:函数逼近问题(内插值)一般函数都可表示成一组基函数的线1.网络隐层使用Q个隐节点。2.把所有Q个样本输入分别作为Q个隐节点的中心。3.各基函数取相同的扩展常数。4.确定权值可解线性方程组:设第j

个隐节点在第i个样本的输出为:可矩阵表示:,若R可逆,则解为 根据Micchelli定理可得,如果隐节点激活函数采用径向基函数,且各不相同,则线性方程组有唯一解。

RBF网络输出1.网络隐层使用Q个隐节点。RBF网络输出举例:RBF网络实现函数逼近

1.问题的提出:假设如下的输入输出样本,输入向量为[-11]区间上等间隔的数组成的向量P,相应的期望值向量为T。P=-1:0.1:1;T=[-0.9602-0.5770-0.07290.37710.64050.66000.46090.1336-0.2013-0.4344-0.5000-0.3930-0.16470.09880.30720.39600.34490.1816-0.0312-0.2189-0.3201];%以输入向量为横坐标,期望值为纵坐标,绘制训练用样本的数据点。figure;plot(P,T,'+')title('训练样本')xlabel('输入矢量P')ylabel('目标矢量T')gridon%目的是找到一个函数能够满足这21个数据点的输入/输出关系,其中一个方法是通过构建径向基函数网络来进行曲线拟合举例:RBF网络实现函数逼近1.问题的提出:假设如下的输入2.网络设计:设计一个径向基函数网络,网络有两层,隐含层为径向基神经元,输出层为线性神经元。

p=-3:0.1:3;

a=radbas(p);

figure;

plot(p,a)

title('径向基传递函数')

xlabel('输入p')

ylabel('输出a')gridon%每一层神经元的权值和阈值都与径向基函数的位置和宽度有关系,输出层的线性神经元将这些径向基函数的权值相加。如果隐含层神经元的数目足够,每一层的权值和阈值正确,那么径向基函数网络就完全能够精确的逼近任意函数。

a2=radbas(p-1.5);

a3=radbas(p+2);

a4=a+a2*1+a3*0.5;

figure;

plot(p,a,'b-',p,a2,'b-',p,a3,'b-',p,a4,'m--');

title('径向基传递函数之和')

xlabel('输入p')

ylabel('输出a')gridon%应用newb()函数可以快速构建一个径向基神经网络,并且网络自动根据输入向量和期望值进行调整,从而进行函数逼近,预先设定均方差精度为eg以及散布常数sc。

eg=0.02;

sc=1;

net=newrb(P,T,eg,sc);2.网络设计:设计一个径向基函数网络,网络有两层,隐含层为径3.网络测试:将网络输出和期望值随输入向量变化的曲线绘制在一张图上,就可以看出网络设计是否能够做到函数逼近。

figure;

plot(P,T,'+');

xlabel('输入');

X=-1:0.01:1;

Y=sim(net,X);

holdon;

plot(X,Y);

holdoff;

legend('目标','输出')

gridon

3.网络测试:将网络输出和期望值随输入向量变化的曲线绘制在一分类问题低维空间:线性不可分高维空间:线性可分

空间转换关于对单层感知器的讨论可知,若N维输入样本空间的样本模式是线性可分的,总存在一个用线性方程描述的超平面,使两类线性可分样本截然分开。若两类样本是非线性可分的,则不存在一个这样的分类超平面。但根据Cover定理,非线性可分问题可能通过非线性变换获得解决。Cover定理可以定性地表述为:将复杂的模式分类问题非线性地投射到高维空间将比投射到低维空间更可能是线性可分的分类问题空间转换关于对单层感知器的讨论可知,若N维输入样本空Φ1(x)∑X2X1Φ2(x)w11w11Outputy举例:逻辑运算异或的分类X1X2X1X2000011101110XOR异或空间变换前Φ1(x)∑X2X1Φ2(x)w11w11OutputyX1X2000.13531010.36790.3679100.36790.36791110.1353基函数空间变换后X1X2000.13531010.36790.3679100RBF学习算法RBF学习的三个参数:①基函数的中心②方差(扩展常数)③隐含层与输出层间的权值当采用正归化RBF网络结构时,隐节点数即样本数,基函数的数据中心即为样本本身,参数设计只需考虑扩展常数和输出节点的权值。当采用广义RBF网络结构时,RBF网络的学习算法应该解决的问题包括:如何确定网络隐节点数,如何确定各径向基函数的数据中心及扩展常数,以及如何修正输出权值。RBF学习算法RBF学习的三个参数:①基函数的中心当采用正归两种方法中心的选取1.中心从样本输入中选取2.中心自组织选取常采用各种动态聚类算法对数据中心进行自组织选择,在学习过程中需对数据中心的位置进行动态调节。常用的方法是K-means聚类,其优点是能根据各聚类中心之间的距离确定各隐节点的扩展常数。由于RBF网的隐节点数对其泛化能力有极大的影响,所以寻找能确定聚类数目的合理方法,是聚类方法设计RBF网时需首先解决的问题。除聚类算法外,还有梯度训练方法、资源分配网络(RAN)等一般来说,样本密集的地方中心点可以适当多些,样本稀疏的地方中心点可以少些;若数据本身是均匀分布的,中心点也可以均匀分布。总之,选出的数据中心应具有代表性。径向基函数的扩展常数是根据数据中心的散布而确定的,为了避免每个径向基函数太尖或太平,一种选择方法是将所有径向基函数的扩展常数设为两种方法中心的选取1.中心从样本输入中选取2.中心自组织选取一.自组织中心选取法

1989年,Moody和Darken提出了一种由两个阶段组成的混合学习过程的思路。两个步骤:①无监督的自组织学习阶段

②有监督学习阶段

其任务是用自组织聚类方法为隐层节点的径向基函数确定合适的数据中心,并根据各中心之间的距离确定隐节点的扩展常数。一般采用Duda和Hart1973年提出的k-means聚类算法。其任务是用有监督学习算法训练输出层权值,一般采用梯度法进行训练。一.自组织中心选取法1989年,Moody和D

在聚类确定数据中心的位置之前,需要先估计中心的个数(从而确定了隐节点数),一般需要通过试验来决定。由于聚类得到的数据中心不是样本数据本身,因此用表示第n次迭代时的中心。应用K-means聚类算法确定数据中心的过程如下。(1)初始化。选择个互不相同的向量作为初始聚类中心(2)计算输入空间各样本点与聚类中心点的欧式距离1.中心学习在聚类确定数据中心的位置之前,需要先估计中心的(3)相似匹配。令代表竞争获胜隐节点的下标,对每一个输入样本根据其与聚类中心的最小欧式距离确定其归类,即当时,被归为第类,从而将全部样本划分为个子集每个子集构成一个以聚类中心为典型代表的聚

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论