




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第3章章 人工神经元网络控制论人工神经元网络控制论控制基础控制基础智能控制基础智能控制基础2/683.1 引言引言3.2 前向神经网络模型前向神经网络模型3.6 神经网络控制基础神经网络控制基础3.7 非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识3.8 神经网络控制的学习机制神经网络控制的学习机制3.9 神经网络控制器的设计神经网络控制器的设计3.3 动态神经网络模型动态神经网络模型 3.10 单一神经元控制法单一神经元控制法目录目录3/683.6.1 引言引言v神经网络控制的优越性神经网络控制的优越性v神经网络控制器的分类神经网络控制器的分类v神经网络的逼近能力神经网络的逼近能
2、力神经网络是一种具有高度神经网络是一种具有高度非线性非线性的连续时间动力系统,的连续时间动力系统,它有着很强的它有着很强的自学习自学习功能和对非线性系统的强大映射功能和对非线性系统的强大映射能力,已广泛应用于复杂对象的控制中。神经网络所能力,已广泛应用于复杂对象的控制中。神经网络所具有的大规模并行性、冗余性、容错性、本质的非线具有的大规模并行性、冗余性、容错性、本质的非线性及自组织、自学习、自适应能力,给不断面临挑战性及自组织、自学习、自适应能力,给不断面临挑战的控制理论带来生机。的控制理论带来生机。4/68神经网络控制的优越性神经网络控制的优越性 1神经网络可以处理那些难以用模型或规则描述的
3、过程或系统难以用模型或规则描述的过程或系统2神经网络采用并行分布式信息处理并行分布式信息处理,具有很强的容错性。 3神经网络是本质的非线性系统非线性系统,可以实现任意非线性映射。4很强的信息综合能信息综合能力,能够同时处理大量不同类型的输入,能够很好地解决输入信息之间的互补性和冗余性问题;5神经网络的硬件实现愈趋方便硬件实现愈趋方便,大规模集成电路技术的发展为神经网络的硬件实现提供了技术手段研究重点研究重点5/68 v 神经网络神经网络的的稳定性与收敛性稳定性与收敛性问题;问题;v神经网络神经网络控制系统的稳定性与收敛性问题控制系统的稳定性与收敛性问题;v 神经网络学习算法的神经网络学习算法的
4、实时性实时性;v 神经网络神经网络控制器和辨识器控制器和辨识器的模型和结构;的模型和结构;6/68v 根据神经网络在控制器中的作用不同,神经网根据神经网络在控制器中的作用不同,神经网络控制器可分为两类,一类为络控制器可分为两类,一类为神经控制神经控制,它是以,它是以神经网络为基础而形成的独立智能控制系统;另神经网络为基础而形成的独立智能控制系统;另一类为一类为混合神经网络控制混合神经网络控制,它是指利用神经网络,它是指利用神经网络学习和优化能力来改善传统控制的智能控制方法,学习和优化能力来改善传统控制的智能控制方法,如自适应神经网络控制等。如自适应神经网络控制等。v 综合目前的各种分类方法,可
5、将神经网络控制综合目前的各种分类方法,可将神经网络控制的结构归结为以下六类。的结构归结为以下六类。神经网络控制器的分类神经网络控制器的分类 7/68神经网络控制器的分类神经网络控制器的分类 逆控制器逆控制器 自适应网络控制器自适应网络控制器 前馈控制结构前馈控制结构 自适应评价网络自适应评价网络 混合控制系统混合控制系统 神经网络控制器8/68(1) 导师指导下的控制器导师指导下的控制器XUY专家经验控制器动力学系统动力学系统神经网络UYX利用专家经验图3-2-1 导师指导下的神经控制结构图动力学系统神经网络YYUd动力学系统UYYdF-1Y=FU图3-2-2 逆控制器的结构图网络控制器N神经
6、网络N参考模型非线性系统ryecipmceecpyyiu+-图3-2-3自适应网络控制结构图v学习样本取自于专家经验学习样本取自于专家经验v输入来自传感器,输出为控制信号输入来自传感器,输出为控制信号v缺点是静态过程缺乏在线学习机制缺点是静态过程缺乏在线学习机制 系统为根据视觉信息对机械手臂进行控系统为根据视觉信息对机械手臂进行控制,使其能够准确地对不规则形状物体进制,使其能够准确地对不规则形状物体进行抓举。行抓举。v系统组成:系统组成:v(1)神经网络控制器)神经网络控制器NC为一块嵌入式为一块嵌入式DSP处处理器,神经网络算法根据上述原理由程序实现理器,神经网络算法根据上述原理由程序实现。
7、v(2)对象)对象P为被控对象机械臂,其各关节驱动为被控对象机械臂,其各关节驱动电机的信号线与电机的信号线与NC输出端相连,作为神经网络输出端相连,作为神经网络的输出。的输出。(1) 导师指导下的控制器导师指导下的控制器v(3)系统的输入为机器视觉信息经转化后的数)系统的输入为机器视觉信息经转化后的数字信号(多维),其中包含了物体的位置和形字信号(多维),其中包含了物体的位置和形状信息;输出为机械臂各部分的位置电信号及状信息;输出为机械臂各部分的位置电信号及传感器信号(多维)。传感器信号(多维)。v(4)NC包含训练引脚,其与有人手控制的机包含训练引脚,其与有人手控制的机械臂的驱动信号相连。该
8、信号作为以人为导师械臂的驱动信号相连。该信号作为以人为导师的导师值训练信号。的导师值训练信号。(1) 导师指导下的控制器导师指导下的控制器(1) 导师指导下的控制器导师指导下的控制器12/68(2) 逆控制器逆控制器 XUY专家经验控制器动力学系统动力学系统神经网络UYX利用专家经验图3-2-1 导师指导下的神经控制结构图动力学系统神经网络YYUd动力学系统UYYdF-1Y=FU图3-2-2 逆控制器的结构图网络控制器N神经网络N参考模型非线性系统ryecipmceecpyyiu+-图3-2-3自适应网络控制结构图v神经网络的训练目的是逼近系统的神经网络的训练目的是逼近系统的逆动力学模型逆动力
9、学模型,Yd期望输出作为神经网络输入期望输出作为神经网络输入v以便使期望输出与对象实际输出之间的传递函数以便使期望输出与对象实际输出之间的传递函数为为1,则被控对象的输出为期望输出。,则被控对象的输出为期望输出。13/68(3) 自适应网络控制器自适应网络控制器 v模型参考自适应网络控制器模型参考自适应网络控制器 XUY专家经验控制器动力学系统动力学系统神经网络UYX利用专家经验图3-2-1 导师指导下的神经控制结构图动力学系统神经网络YYUd动力学系统UYYdF-1Y=FU图3-2-2 逆控制器的结构图网络控制器N神经网络N参考模型非线性系统ryecipmceecpyyiu+-图3-2-3自
10、适应网络控制结构图v利用神经网络代替线性系统中的线性处理单元利用神经网络代替线性系统中的线性处理单元v控制误差反馈到控制器进行修改使误差最小控制误差反馈到控制器进行修改使误差最小14/68(4) 前馈控制结构前馈控制结构v基于鲁棒性问题提出基于鲁棒性问题提出v反馈的目的在于提高抗随机扰动的能力反馈的目的在于提高抗随机扰动的能力v非线性成分由网络控制器完成非线性成分由网络控制器完成v难点是如何在系统模型未知条件下找到有效的学难点是如何在系统模型未知条件下找到有效的学习方法习方法15/68(4) 前馈控制结构前馈控制结构16/68(4) 前馈控制结构前馈控制结构17/68(4) 前馈控制结构前馈控
11、制结构18/68(4) 前馈控制结构前馈控制结构19/68(4) 前馈控制结构前馈控制结构20/68(4) 前馈控制结构前馈控制结构 (5) 神经网络自适应评价控制神经网络自适应评价控制 通常由两个单元组成:搜索单元和自适应评价单元。通常由两个单元组成:搜索单元和自适应评价单元。自适应评判网络通过不断的奖励、惩罚等再励学习,使自适应评判网络通过不断的奖励、惩罚等再励学习,使自己逐渐成为一个合格的自己逐渐成为一个合格的“教师教师”,学习完成后,根据,学习完成后,根据系统目前的状态和外部激励反馈信号产生一个内部再励系统目前的状态和外部激励反馈信号产生一个内部再励信号,以对目前的控制效果作出评价。信
12、号,以对目前的控制效果作出评价。 (6) 神经网络混合控制神经网络混合控制 该控制方法是集成人工智能各分支的优点,由神该控制方法是集成人工智能各分支的优点,由神经网络技术与模糊控制、专家系统等相结合而形成的经网络技术与模糊控制、专家系统等相结合而形成的一种具有很强学习能力的智能控制系统。一种具有很强学习能力的智能控制系统。 由神经网络和模糊控制相结合构成模糊神经网络,由神经网络和模糊控制相结合构成模糊神经网络,由神经网络和专家系统相结合构成神经网络专家系统。由神经网络和专家系统相结合构成神经网络专家系统。神经网络混合控制可使控制系统同时具有学习、推理神经网络混合控制可使控制系统同时具有学习、推
13、理和决策能力。和决策能力。 23/683.6.2 神经网络的逼近能力神经网络的逼近能力 v相关结论:相关结论:含含一个隐层以上一个隐层以上的多层前向传播神经网络不的多层前向传播神经网络不仅可以以仅可以以任意精度任意精度逼近逼近连续函数本身连续函数本身,还可,还可以逼近函数的以逼近函数的导数项导数项。 24/683.1 引言引言3.2 前向神经网络模型前向神经网络模型3.6 神经网络控制基础神经网络控制基础3.7 非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识3.8 神经网络控制的学习机制神经网络控制的学习机制3.9 神经网络控制器的设计神经网络控制器的设计3.3 动态神经网络模型动态
14、神经网络模型 3.10 单一神经元控制法单一神经元控制法目录目录25/683.7.1 辨识基础辨识基础3.7.2 神经网络辨识模型的结构神经网络辨识模型的结构 3.7.3 非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识3.7 非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识 26/68vL.A.Zadeh曾经下过这样的定义:曾经下过这样的定义:“辨识是辨识是在输入和输出数据的基础上,从一组给定的在输入和输出数据的基础上,从一组给定的模型中,确定一个与所测系统等价的模型模型中,确定一个与所测系统等价的模型”。v使用非线性系统的输入输出数据来训练神经使用非线性系统的输入输出数据来
15、训练神经网络可认为是网络可认为是非线性函数的逼近问题非线性函数的逼近问题。v多层前向传播网络能够逼近任意多层前向传播网络能够逼近任意L2非线性函非线性函数。数。(双隐层比单隐层具有更高的逼近精度)(双隐层比单隐层具有更高的逼近精度)3.7.1辨识基础辨识基础v输入输出数据输入输出数据能够测量到的输入输出能够测量到的输入输出v模型类模型类系统的结构系统的结构 v等价准则等价准则辨识的优化目标辨识的优化目标27/68辨识的基本要素辨识的基本要素v模型的选择模型的选择 隐含层数和节点数的选择隐含层数和节点数的选择多次仿真实验多次仿真实验得到(兼顾精确性和复杂性)得到(兼顾精确性和复杂性)v输入信号的
16、选择输入信号的选择 时域:激励系统的所有模态时域:激励系统的所有模态 频域:足以覆盖系统的频谱(白噪声或伪随频域:足以覆盖系统的频谱(白噪声或伪随机信号)机信号)v误差准则的选择误差准则的选择 28/68k)k( e (f)W(E)k(e)k( e 神经网络辨识的特点神经网络辨识的特点v不要求建立实际系统的辨识格式不要求建立实际系统的辨识格式v可以对本质非线性系统进行辨识,非算法式可以对本质非线性系统进行辨识,非算法式v收敛速度不依赖于待辨识系统的维数,只与收敛速度不依赖于待辨识系统的维数,只与神经网络本身即其学习算法有关神经网络本身即其学习算法有关v权值在辨识中对应于的模型参数权值在辨识中对
17、应于的模型参数v可以用于在线控制可以用于在线控制29/30/683.7.1 辨识基础辨识基础3.7.2 神经网络辨识模型的结构神经网络辨识模型的结构 3.7.3 非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识3.7 非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识 31/683.7.2 神经网络辨识模型的结构神经网络辨识模型的结构 逆模型法逆模型法 前向建模法前向建模法32/68前向建模法前向建模法v所谓前向建模法是利用神经网络来逼近非线所谓前向建模法是利用神经网络来逼近非线性系统的前向动力学模型性系统的前向动力学模型 。v 动态系统的建模:一个办法是对神经网络本身引入动态动
18、态系统的建模:一个办法是对神经网络本身引入动态环节,如动态回归网络和动态神经元模型。环节,如动态回归网络和动态神经元模型。v 另一个办法是将输入输出的另一个办法是将输入输出的滞后信号滞后信号加到多层前向网络加到多层前向网络中形成动态关系。中形成动态关系。前向建模法前向建模法33/68 1)m-u(ku(k),.,1),n-y(k(y(k),.,f1)(kyN34/68逆模型法逆模型法v直接法:直接法:v 待辨识系统的输出作为神经网络的输入,神经网络的输待辨识系统的输出作为神经网络的输入,神经网络的输出与动态系统的输入进行比较,相应的输入误差用来训出与动态系统的输入进行比较,相应的输入误差用来训
19、练神经网络练神经网络35/68存在的问题存在的问题v存在的问题存在的问题n学习过程不一定是目标最优的。 (学习样本)n一旦非线性系统对应关系不是一对一的,那么不准确的逆模型可能会被建立。 v克服方法克服方法增加使用已建模的神经网络正向模型增加使用已建模的神经网络正向模型36/683.7.1 辨识基础辨识基础3.7.2 神经网络辨识模型的结构神经网络辨识模型的结构 3.7.3 非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识3.7 非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识 非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识v前向神经网络具有良好的学习性能前向神经网络
20、具有良好的学习性能v利用利用静态静态神经网络描述神经网络描述动态动态系统系统v误差反向传播是一般误差反向传播是一般BP学习算法的精髓学习算法的精髓v动态反向传播的关键是找到反映该动态过程动态反向传播的关键是找到反映该动态过程的关系式的关系式v带时滞的多层感知器网络带时滞的多层感知器网络+动态误差反向回动态误差反向回归学习算法归学习算法37/38/68并行结构并行结构)1(),.,1(),(),1( ),.,1( ),( ) 1( mkukukunkykykyNky串行结构串行结构)1(),.,1(),(),1(),.,1(),() 1( mkukukunkykykyNky串行结构更稳定根据可分
21、离性和线性性,有4种结构。辨识的两种结构辨识的两种结构39/68含线性部分的辨识问题(模型含线性部分的辨识问题(模型1、2)模型模型1)1mk(u),.,1k(u),k(ug) ik(y) 1k(y1n0ii模型模型2) ik(u)1nk(y),.,1k(y),k(y f) 1k(40/68线性部分的参数已知线性部分的参数已知 41/68线性部分的参数未知线性部分的参数未知 42/68线性部分学习方法线性部分学习方法v最小二乘法最小二乘法v其中其中v初始条件完全未知时,可取初始条件完全未知时,可取)( ) 1() 1()(1()( ) 1( 2lllylKllT)()1() 1() 1(lPl
22、lKIlPT1)1()() 1() 1()1()() 1(llPllllPlKTIP)0(; 0)0( )1(),.,1(),() 1(43/68非线性部分学习方法非线性部分学习方法vBP学习学习) l (wo) l (w) 1l (wjipipjjijiLayerHidden)Net()w(LayerOutput)Net()ot (44/68例例38v考虑以下模型:考虑以下模型:y(k+1)=ay(k)+by(k-1)+g(u)其中其中a=0.3,b=0.6g(u)=u3+0.3u2-0.4uv试辨识该系统试辨识该系统45/68解解v线性部分,采用递推最小二乘学习法线性部分,采用递推最小二乘
23、学习法v非线性部分采用前向传播多层神经网络来逼非线性部分采用前向传播多层神经网络来逼近。近。选择神经网络结构为选择神经网络结构为)l () 1l () 1l (y)(1l (K) l () 1l (T21T)1l () l (P) 1l () 1l ()1l () l (P) 1l (K) l (P)1l () 1l (KI ) 1l (PT00ba)0(100010)0( ,1,8,4,1 0 ,46/68辨识效果辨识效果v校验输入信号校验输入信号 :100.2 , 1 , 01002sin)(47/68非线性可分离系统(模型非线性可分离系统(模型3))1(),.,1(),()1(),.,1
24、(),() 1(48/68BP学习学习pjLpjpjLpjLpjLpjLpjpjLpjLpjLtoooNettoofNet112111211( )( )( )( )( )( )( )( )()()()pjLpjpjLpjLpjLtoofNet21222( )( )( )( )()()pjrpjrpkrkkjrfNetw1111111( )( )()()()pjrpjrpkrkkjrfNetw2222121( )( )()()()49/68例例3- 9v考虑如下非线性离散系统:考虑如下非线性离散系统:v求:采用双模型法解决该系统的辨识问题。求:采用双模型法解决该系统的辨识问题。)()(1)()
25、1(50/68两种方法的学习曲线两种方法的学习曲线v单一模型网络:单一模型网络:v两模型网络:两模型网络: 2,20,10,1 2,2,6,51/68两模型法的辨识效果两模型法的辨识效果52/683.1 引言引言3.2 前向神经网络模型前向神经网络模型3.6 神经网络控制基础神经网络控制基础3.7 非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识3.8 神经网络控制的学习机制神经网络控制的学习机制3.9 神经网络控制器的设计神经网络控制器的设计3.3 动态神经网络模型动态神经网络模型 3.10 单一神经元控制法单一神经元控制法目录目录53/683.8 神经网络控制的学习机制神经网络控制
26、的学习机制 v神经元控制器的目的在于如何设计一个有效神经元控制器的目的在于如何设计一个有效的神经元网络去完成代替传统控制器的作用,的神经元网络去完成代替传统控制器的作用,使得系统的输出跟随系统的期望输出。为了使得系统的输出跟随系统的期望输出。为了达到这个目的,神经网络的学习方法就是寻达到这个目的,神经网络的学习方法就是寻找一种有效的途径进行网络连接权阵或网络找一种有效的途径进行网络连接权阵或网络结构的修改,从而结构的修改,从而使得网络控制器输出的控使得网络控制器输出的控制信号能够保证系统输出跟随系统的期望输制信号能够保证系统输出跟随系统的期望输出出。 54/68分类分类v3.8.1 监督式学习
27、监督式学习n离线学习法n在线学习法n反馈误差学习法n多网络学习法v3.8.2 增强式学习增强式学习55/681. 离线学习法离线学习法 系统的逆模型系统的逆模型样本空间应尽量遍及整个控制域样本空间应尽量遍及整个控制域适合适合静态静态环境环境56/682. 在线学习法在线学习法 学习只能在期望输出学习只能在期望输出yd值域内进行值域内进行适合适合模型已知模型已知的动态环境的动态环境57/68学习方法学习方法v采用最速下降法采用最速下降法)()()()()()()()()()()()()() 1(kwkukukykykykwkwkykykykwwEkwkwjidjijidjijipjiji假设系统
28、的假设系统的Jacobian矩阵已知矩阵已知58/683. 反馈误差学习法反馈误差学习法 反馈控制的输出作为网络的训练误差信号反馈控制的输出作为网络的训练误差信号反馈控制保持系统稳定并消除误差;前馈反馈控制保持系统稳定并消除误差;前馈控制加快速度,并逐渐占主导地位控制加快速度,并逐渐占主导地位适用于非线性系统适用于非线性系统线性绝对占优线性绝对占优条件下的条件下的网络学习网络学习 59/684. 多神经网络学习法多神经网络学习法1 v前向建模多网络控制前向建模多网络控制v建立位置非线性动态系统的前向模型建立位置非线性动态系统的前向模型v利用此前向模型实现利用此前向模型实现误差反向传播误差反向传
29、播完成网络完成网络控制的权阵学习控制的权阵学习 60/68多神经网络学习法多神经网络学习法2 v逆模型建模的多网络控制结构图逆模型建模的多网络控制结构图v建立逆模型建立逆模型vyd为逆模型输入信号由此产生期望的控制信号为逆模型输入信号由此产生期望的控制信号udvud与与u比较产生的误差作为比较产生的误差作为Nc的学习信号的学习信号 非线性系统神線网络控制器Nc+-yyu图3-2-23 前向建模多网络控制结构图神经网络控制器Nc非线性系统+-yyu图3-2-24 逆模型建模的多网络控制结构图神经网络辨识器NiyM神经网络逆模型 辨识器Nyu-61/683.8.2 增强式学习增强式学习 v当某些被
30、控系统的导师信号无法获得时当某些被控系统的导师信号无法获得时v利用利用当前控制是否成功当前控制是否成功来决定下一次控制该来决定下一次控制该如何走的学习方式。如何走的学习方式。 v修正的办法是对某一成功的行为进行修正的办法是对某一成功的行为进行鼓励鼓励,而对不成功的行为进行而对不成功的行为进行惩罚惩罚。 v用神经网络来实现时,用神经网络来实现时, 则可在权值空间进行则可在权值空间进行调整。调整。62/683.1 引言引言3.2 前向神经网络模型前向神经网络模型3.6 神经网络控制基础神经网络控制基础3.7 非线性动态系统的神经网络辨识非线性动态系统的神经网络辨识3.8 神经网络控制的学习机制神经
31、网络控制的学习机制3.9 神经网络控制器的设计神经网络控制器的设计3.3 动态神经网络模型动态神经网络模型 3.10 单一神经元控制法单一神经元控制法目录目录63/683.9.1 直接逆模型控制法直接逆模型控制法 3.9.2 直接网络控制法直接网络控制法 3.9.3 多网络自学习控制法多网络自学习控制法 3.9 神经网络控制器的设计神经网络控制器的设计 64/683.9.1 直接逆模型控制法直接逆模型控制法 训练结构示意图 逆模型训练完毕后直接投入控制系统的运行逆模型训练完毕后直接投入控制系统的运行 65/68直接逆模型控制的结构示意图直接逆模型控制的结构示意图 不进行在线学习,运行于静态参数
32、环境不进行在线学习,运行于静态参数环境缺乏鲁棒性,可在外环增加一个反馈控制缺乏鲁棒性,可在外环增加一个反馈控制66/683.9.1 直接逆模型控制法直接逆模型控制法 3.9.2 直接网络控制法直接网络控制法 3.9.3 多网络自学习控制法多网络自学习控制法 3.9 神经网络控制器的设计神经网络控制器的设计 67/683.9.2 直接网络控制法直接网络控制法 在网络的输入端引入系统的状态信号在网络的输入端引入系统的状态信号(带时滞的多层前向网络)(带时滞的多层前向网络)将学习机制(将学习机制(BP算法)实时在线用于网络控制器的调整算法)实时在线用于网络控制器的调整68/68例例3-10v考虑被控
33、系统考虑被控系统 假设动力学逆模型成立假设动力学逆模型成立 ,为,为v试用直接网络控制法控制。试用直接网络控制法控制。n=3,m=2y ky k y ky ku ky ku kykyk()( ) () () ()( ()( )()()11211111222 1)-u(k2),-y(k1),-y(ky(k),1),gy(ku(k)69/68解解v构造神经网络结构为构造神经网络结构为5,25,12,1。v输出单元层的神经元的激励函数为线性单元输出单元层的神经元的激励函数为线性单元v其余层的神经元为其余层的神经元为Sigmoid激励元。激励元。v取取=0.05v期望输出为:期望输出为:ykkkd(
34、)sin. sin21000 70/68学习公式学习公式wkwkoijijpjpi()( )1pjddyky kdy kdu kyky kykyk( )( )( )( )( )( )()()112322pjpjpjpllljoow()1输出层 隐含层 71/68学习结果学习结果100次次直接网络控制法远远优于直接逆模型控制法直接网络控制法远远优于直接逆模型控制法72/681摄动法 2符号函数法 3前向神经网络方针模型法(前向建模)4多网络自学习控制法 ( 逆模型)Jacobian矩阵的替代矩阵的替代当系统未知时,当系统未知时,Jacobian矩阵(矩阵(dy/du)无法直接求得)无法直接求得)
35、/sgn(uyuy /73/683.9.1 直接逆模型控制法直接逆模型控制法 3.9.2 直接网络控制法直接网络控制法 3.9.3 多网络自学习控制法多网络自学习控制法 3.9 神经网络控制器的设计神经网络控制器的设计 74/683.9.3多网络自学习控制法多网络自学习控制法v模型未知的情况模型未知的情况v基本思想是利用逆动力学模型和系统的期望基本思想是利用逆动力学模型和系统的期望输出输出yd(k+1)去构造一个期望的控制量去构造一个期望的控制量ud(k),从而解决了神经控制器从而解决了神经控制器Nc在系统模型未知情在系统模型未知情况下的学习问题。况下的学习问题。v神经网络辨识和神经网络控制神
36、经网络辨识和神经网络控制75/68u( k)u ( k)iZZZZ- 1- 1- n+1- m神 经 网 络辨 识 器 N+Z神 经 网 络控 制 器 N对 象u( k)y( k+1)y( k+1)d- 1- 1ZZZ- n+1- m图 3- 2- 35 多 网 络 自 学 习 控 制 结 构 图y ( k+1)d+dci多网络自学习控制法多网络自学习控制法 神经网络辨识器精确逼近逆模型才能保证神经网络辨识器精确逼近逆模型才能保证Nc导师信号的可靠性导师信号的可靠性76/68例例3-11 v考虑非线性系统考虑非线性系统 v求:试用多神经自学习网络控制方法来设计求:试用多神经自学习网络控制方法来设计此系统的非线性控制器,要求系统的期望输此系统的非线性控制器,要求系统的期望输出为:出为:y ky k y ky ku ky ku kykyk()( ) () () ()( ()( )()()11212111222ykkkd( )sin, ,.21000 77/68解解v假设被控对象的逆动力学模型存在,即有:假设被控对象的逆动力学模型存在,即有:神经网络辨识器神经网络辨识器Ni的结构为的结构为;神经网络控制器神经网络控制器Nc的网络结构为的网络结构为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国有土地开发建设合同范文
- 国际商标使用权转让合同标准格式
- 合资成立分公司合同书
- 成都市房屋租赁简易合同模板
- 项目出资合同模板
- 水产养殖基地建设承包合同范本
- 建筑工程施工合同样本(律师审核版)
- 诉讼离婚合同范本
- 广播电视设备智能生物药品临床应用技术考核试卷
- 信息技术创新与数字化转型考核试卷
- 湖北省黄冈市2023-2024学年五年级上学期数学期中试卷(含答案)
- 小组合作学习组内分工及职责
- GB/T 44351-2024退化林修复技术规程
- ××管业分销市场操作方案
- 《ISO 41001-2018 设施管理- 管理体系 要求及使用指南》专业解读与应用指导材料之15:“7支持-7.6 组织知识”(雷泽佳编制-2024)
- 2024年建设工程质量检测人员-建设工程质量检测人员(主体结构工程)考试近5年真题集锦(频考类试题)带答案
- 《向量共线定理》同步课件
- 小学数学学习经验交流课件
- 2024年第二批政府专职消防员招录报名表
- 2024年初级消防员职业技能鉴定考试复习题库(单选、多选题)
- 2024年《多媒体技术与应用》 考试题库及答案
评论
0/150
提交评论