版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、人工神经网络应用于伺服控制系统Yuan Kang, Min-Hwei Chu and Min-Chou Chen 中原大学台湾机械工程系、东南科技大学台湾机械工程系 摘要本章讲述了根本的神经网络控制器。 介绍了有专门学习结构的神经控制。 讨论和模拟了 带有近似雅可比的直接神经控制。 提出了使用多重神经网络的自适应控制, 其中包括直接神 经控制器, 神经模拟器和神经调谐器。 神经模拟器是用来近似雅克比值。 误差以及误差的微 分的线性组合是用来近似权值更新的反向传播误差。 神经协调器是一种可在线调整线性组合 中关键参数的在线神经网络。 关键词:直接神经网络,伺服控制,专门学习结构,多重神经网络,神
2、经协调器1. 介绍近年来, 神经控制因其在线学习能力和自适应能力应用于多种领域,有许多神经网络的学习策略被提出并应用于一些具体的非线性控制系统,以克服未知模型和参数的变化问题。 一般学习结构和专门学习结构在早期的神经控制开展中被提出和研究 1 。一般学习结构如 图 19.1 所示,用神经网络学习被控对象的逆动态,将训练好的神经网络应用于前馈控制器。 在这个例子中, 一般过程因为其神经网络需要在一个超过实际需要的操作范围上学习被控对 象的的响应, 效率较低。 一个可能解决这一问题的方法就是将一般过程的方法与专门过程结 合。在本章中,将介绍带有专门学习结构的直接神经控制器应用于伺服控制系统。19.
3、3 专门学习结构的直接控制这种专门的学习结构如图 19.2 表示,训练专门的神经网络控制器仅作用于特定的范围。 训练需要用期望的响应映作为神经网络的输入。 训练这个网络用于找出可驱动被控对象输出 理想命令的输入。 这是用期望和实际被控对象响应之间的误差以一个最速下降的过程来调整 网络的权值。 权值在递归迭代中不断地调整以减小误差。 这个过程需要知道被控对象的雅可 比值。有两种策略可促进专业学习, 一种是直接控制, 如图 19.2;一种是间接控制, 如图 19.3。 前者,被控对象被看作是神经网络中不可调整的附加层,图 19.2 中的虚线图表示权值的更 新需要被控对象的信息; 后者, 已经有过很
4、多应用,它是一个两重过程,包括被控对象动态 特性的鉴定和控制。在间接控制策略中,一个子网模拟器需要在控制阶段之前被训练,模拟器训练的 质量对于控制性能非常重要。 因此训练模拟器时送入的数据必须覆盖足够大范围的输入和输 出数据对,但如果这些用于训练模拟器的数值在输入值范围之外,模拟器的反向传播失败, 将造成不好的,甚至不稳定的控制性能。如果先知道被控对象的定性知识或者被控对象雅可比值被控对象输入关于输出的偏 微分,直接控制策略可以防止这个问题。但通常很难近似得到一台未知被控对象的雅可比 值。在本章中,将介绍获得用于直接神经网络的近似雅可比值的方法。使用了近似方法的 直接控制策略已经成功应用于伺服
5、控制系统,相应的性能已经被调研和讨论。2. 直接神经控制器一个三层的直接神经控制器,如 19.4 所示。被控对象的定性知识或者被控对象的雅可比值,一个带有隐藏层的三层神经网络可以计算出输出值的任意判别边界 6 。尽管有 两个隐藏层的神经网络在一些专门问题上能获得更好的近似值,但也更容易陷入局部极小7 ,需要更多的 CPU 时间。在下面一节中, 将考虑带有一个隐藏层的反向传播网络BPN 。此外,还将考虑一个隐藏曾里面包含的正确单元的数目。李普曼8 提供了全面的几何论据以及推理来证明为什么一个单隐藏层中单元的最大数目等于MN+1 ,其中 M 是输出单元的数目, N 为输入单元的数目。张等人 2 已
6、经测试了一个传播跟踪控制系统上单隐含 层的不同数目单元的数目。 最终发现, 一个带有三至五个隐藏层的网络足够给出一个满意的 结果。2.1 直接神经控制器的算法这里提出的直接神经控制器是有两个输入单元, 一个输出单元, 假设干隐含单元的三层神经网络。Xr , X和Xp分别代表需要的命令输入,参考模型的输出和被控对象的输出。网络的两个输入是误差以及它关于 X R 和 X P 的微分。参考模型可以按照标准二阶传递函数设计,阻尼比和固有频率可以按照被控对象的物 理特性定义。直接控制器的算法和权值更新方程如图表 19.4 并由下述方程表述。这里的直接神经控制器有隐含层下标j,输出层下标 k和输入层下标i
7、.为了标准化为-1和+1,输入信号在输入层被乘以增益Ki和K2。切线双曲函数作为隐含层和目等于K。隐含层中j节点的输入为:n etjWji Oij i=1 , 2 I, j=1 , 2 J19.1节点j的输出为:O j f netjtanhn etj19.2其中B >0,在输出层,节点k的输入为:netk(WkjOj)k j=1,2,J,k=1,2,K(19.3)节点k的输出为:Okf(netjtanh(n etk)(19.4)输出层中节点k的输出Ok被认为是单输入单输出系统的控制输入up。方程中,Wji代表j和k分别代表输入层和隐含层之间的连接权,Wkj代表隐含层和输出层之间的连接权。
8、隐含层和输出层的偏值。第N个样本作用时,误差方程被定义为:En 丄(Xn Xpn)221 2eN2(19.5)Xn和Xpn分别代表参考模型的输出和被控被控对象在第N次样本作用时的输出,在从N次改变到N+1次的时间间隙,权值矩阵得到更新。WnWn 1WnEn(19.6)其中n为指学习速率,a为动量项因子。En关于权系数Wkj的梯度变化为:EnWkjEn netk netk Wkk Oj(19.7)定义 k:EnnetkEN X P up Onn Xp up On netkE NONNOn netkEn n ONOk2(19.8)n=1,2,K这里upP定义为被控对象的雅克比值。同样的,En关于权
9、系数 Wji梯度变化,Wji由下式决定:EnWjiEN 罟 jOinetj(19.9)这里:EnnetjEn n etk°mm n etkOmnetjkWkm12Oj m=1,2,J(19.10)输出层和隐含层的权系数修正公式为:Wkj,NEnWkj,Nk OjWkj ,N 119.11Wji ,nEnWTNWji ,NjOiWji ,N 119.12这里j和k可以由公式19.2119.24得到。神经网络中的连接权在从样本NWji ,n 1Wji ,NWji ,N19.14切线双曲函数作为激活函数,使得神经网络控制器输出0k up 19.4是介于-1和到样本N+1改变的过程中得到更新
10、。Wkj,N 119.13+1之间的值,再乘以尺度因子Ko作为被控对象的输入。初始化置权值和偏值为+0.5到-0.5之间的最小随机数。根据公式19.13和19.14更新数值。2.2在线调节的自适应神经控制器根据公式19.8,被控对象的雅克比值需要预先知道。然而,因为被控对象的动 态特性,确切的 Xp up很难决定。用微分近似的方法,在很小的的范围内改变被控 对象的每个输入,并测量输出的变化,雅克比是指:X P Xp up up Xp up19.15upup或者,将微分关系的变量的变化与之前迭代的值比拟,微分可以由以下关系近似:Xp Nup NXP N XP N -1up N up N 1早些的
11、报告2中指出,当被控制被控对象惯性大或者有干扰时,使用公式19.5或者19.6丨近似时经常造成模棱两可的情况。这种情况说明神经控制器在输入和输出 之间建立了一种因果关系。这是与期望的情形相违背的。一个简单的正负号函数由张等人提出用来近似被控对象的雅克比值2。被称为是工业跟踪控制应用的在线训练自适应神经控制器。因此,用XP N和upN的变化率来近似 Xp N . up N。Xp N . up N被他们的符号函数代替。因此根据公式19.8:清楚地了解控制信号EnEn .c*iptn .XpupOnkn etksignnX pupOnnetkup N如何影响被控对象的输出19.17XP N可以提供需
12、要的符号信息。因此,当 XP N . up N 0时,得:sign XP N/up N1当 XP N up N 0,得:sign Xp N/up N1用公式19.17丨和由公式19.18和19.19丨得到的给定的微分的符号,神经控制19.1819.19器将根据被控对象的输出误差e(N),有效地输出正确方向的控制信号。3. 雅克比近似值准确地跟踪响应需要增加收敛速度。然而,对于一个单输入单输出的控制系统,误差en关于网络输出Ok的灵敏度可以根据3适应法那么9被近似,将误差和误差的微分线性组合,如下:OkK3e K4 dtC 19.20这里K3和K4都是正常数,因此公式19.8可化为以下形式:de
13、OnK4 -dtnetk19.5所示。假定伺服放大En巨卫A &enetkn Xp up On netkn例 19.1 :一个应用于直流速度伺服控制系统的直接神经控制器如图表器的电压增益是单位1。速度传感器的增益为0.001V/rpm。直流伺服电机的一阶动态模型为:19.22一 c 10000 M SS 1应用了 3适应法那么的 直接神经控制器 由三个层,五个神经元组成,如图表19.6所示,用于控制和调节电机速度。学习速率n=0.1,采样时间为0.0001s , K1K30.6,K2 K40.05,分配给模拟阶段的为1V 1000rpm,模拟结果如图表19.7,19.8 ,19.9所示
14、。模拟结果说明,连接权将收敛。up的时域响应说明神经网络保持着一个适当的电压信号输出以克服旋转电枢产生的速度电压。同样的,神经控制器可以提供克服 扭矩载荷和摩擦的输出。这与PI控制器类似,但神经控制器可以加强自适应调节能力以及改善控制系统的性能。该 MATLA仿真程序包在附录列出。用正负号函数接近雅克比的在线训练神经控制器也被应用于这个控制系统。仿真结果如图表19.10 , 19.11和19.12所示,该仿真结果说明,在线训练的方法需要较长的收敛时间。图19.5使用直接神经控制器的直流速度伺服控制系统图19.6使用3适应法那么的直接神经控制器图19.7直流伺服电机的速度响应图19.8控制输入的
15、时域响应图19.9所有连接权值在0.4s后收敛图19.10直流伺服电机的速度响应图19.11直流伺服电机的时域响应图19.12所有连接权在0.6s后收敛用3适应法那么的 直接神经控制器可以比在线训练方法提供更好的控制性能。3适应法那么使用误差的微分增加了误差收敛过程的阻尼,改善了权值更新算法的稳定性和收敛速 度。没有提出专门的方法决定参数K3和K4的适宜的值,这些参数只能在尝试和误差中调整。4. 用神经协调器训练参数K3和K4应用3适应法那么提高了连接权更新的在线学习速率。然而,没有专门的方法在线确 定参数K 3和K 4.参数仅在尝试和误差中调整。这很难计算出适宜的参数值。参数K1和K2可以很
16、容易地由输入信号的边界决定。输入信号在输入层与参数K1和K2相乘,使之以-1和+1的形式表示。近期有人证明,神经网络可以调节PID控制器的参数10。在这一节,将为伺服控制系统介绍一种使用多重神经网络的模式跟随自适应调节控制。直接神经控制系统包括一个传统的直接神经控制器,神经模拟器和神经调谐器。它用误差和误差微分的线性组合来近似反向 误差 En.; Ok。参数调节器用于在线调节线性组合中的参数。神经模拟器预先训练用于 近似被控对象的雅克比值。这三种不同的网络和参考模型融入了自适应调节算法。多重神经网络自适应控制系统MNNAC假设:传统的直接神经控制器有5个隐含的神经元,神经模拟器和神经协调器均有
17、 8个隐含的神经元,以及一台非线性的三阶被控对象可用。一个非线性的三阶被控对象是用于证明:X»n fup n 1 ,up n 2 ,up n 3 ,Xp n 1 , Xp n 2 , Xp n 3这里的n是指第n次采样,up是被控对象的输入,Xp是被控对象的输出以及 f是一个非 线性函数可用神经网络 N2描述。非线性三阶被控对象的模拟图表如 19.13所示。带有一 个隐含层和8个隐含神经元的BP神经网络N2如图表19.14所示,它需要被预先训练以及 适应被控对象输入输出关系的模型。N 2的输入早输入神经元中被标准化为 -1和+1。N2 的输出与一个常数增益 K b相乘来近似作为被控对
18、象的电压。这可以合成来近似目标位图19.13离线训练的被控设备模拟器的结构图图19.14神经模拟器结构带有训练好的权值的神经网络 N2作为模拟器在控制阶段近似雅克比值。此外,被控对 象的动态性能在实际控制过程中可能改变, 以至于神经模拟器需要在线训练来改善近似被控 对象雅克比值时的精度。4.1多重神经网络的自适应控制应用于伺服控制的模型跟踪多重神经网络自适应控制系统MNNACS,包括神经控制器N1,神经模拟器 N2和神经协调器 N3,如图表19.15所示。其算法是根据李雅普诺夫定理保证收敛而设计的。它可以执行所期望的动一个带有期望性能指标的二阶线性传递函数被定义为参考模型。态响应即一个闭环控制
19、系统的理想输出。参考模型如下:XrXr2ns22 nS(19.23)这里Xr和Xr分别为参考模型的输入和输出,S是拉普拉斯算子,z为阻尼,n为自振角频率。两参数可由需要的性能指标建立时间,上升时间和最大超调量决定。三个神经网络被用于控制系统;图表 19.14 , 19.16和19.17分别为神经模拟器,神经控制器和神经协调器。 每个网络有三层,包括一个输入层下标为i,一个隐含层下标为j和一个输出层下标为 k。N1和N2的隐含层和输出层都应用了双曲正切函数,Sigmoid函数和单位阶跃函数分别作为 N3隐含层节点和输出层节点的激活函数。神经网络是一个两输入一输出带有 5个隐含节点的的直接神经控制
20、器,两个输入分别 为误差e和误差的微分e。这个误差e是命令和输出Xp之差。输入信号被乘以K1和K 2后标准化为-1和+1.神经控制器的输出up乘以比例因子Kh作为被控对象的输入。N1的权值更新取决于BPE BPE由误差ei和误差的微分ei线性组合乘以参数 K3和K4近似而得。误差 e为参考模型输入Xr和输出Xp之差。因此,适宜的K3和K4值可以加快反向传播的收敛速率和稳定性。图19.15模型跟踪多重神经网络自适应控制系统MNNAC结构图图19.16神经控制器结构图19.17参数协调器结构神经网络N3如图表19.6所示,在隐含层有8个节点,N3的两个输出被定义为参数K3和K4的适宜值。六个输入为
21、Xp n 1, Xp n 2 ,Xp n 3 ,up n 1 ,up n 2和n与 被控对象的输出,输入和指令信号有关,该输出,输入和命令信号被|?1? J?和1?3标准化。三个神经网络的变量和参数在一下分析中使用下标“',“-和“ A表示N1,N2和N3。4.2神经协调器的权值更新N1和N2的两个算法已经在第一节中表述。神经协调器的算法和 N1,N?不同。因此,在这一节中将对 N2的算法有一个详细的表述。输出层和隐含层,隐含层和输入层之间的加权系数修正公式分别为:Wj nE? nW?kj nk=3,4,j=18(19.24)E? nV?ji ni=16,j=18(19.25)这里的误
22、差能量函数 总n为:E? n1 21XRn XPn0n22 2(19.26)E? n关于V?j n的梯度变化:E? n Wq i0 nnetk nnnetk nV?kj nk n (?j nnetjk=3,4(19.27)这里f为激活函数,? n代表E? nnetkn,因此:E?nnetk nn XP nup nXpup n3k nC?k n netk neiXP n up n 1 up nKkk=3,4 (19.28)这里 Ok nnetk。激活函数和输出神经元是统一的。被控对象的雅克比值:f n etk nI Kb 8up nj 1netk nWkjnf net j n n etjWiK1
23、 n(19.29)这里的K B是神经网络N 2的增益,Ki是输入网络N 2的标准化增益。根据3适应法那么9,一个单输入单输出控制系统,BP却E关于网络输出Ok的敏敢性可由误差和其微分的线性组合所近似,神经网络N1的输出层的第n-1次权值更新为:K3 e n 1 K4 e n 1 f netk n 1netk n 1Oj(19.30)这里K3和K4为正常数。第N次的更新的权值关于 K3 ,K4的微分分别为:WkjnK3Wkjn 1K3f netk n 1netk n 1Oj(19.31)WkjnWkjn 1e1 nf netk n 1netk n 1Oj(19.32)以及被控对象输入关于 K3和
24、K4的微分分别为:up nup nOk nnetk nKkOk nnetk nWkjnWkjn Kknnetk nf netkOjWkjnKkk=3,4 (19.33)再将?和彳带入公式19.27,可以得到N2网络的E?关于V?ji的梯度下降:这里?被定义为:?nE? n net j因此,权值E? nW?ji nE? nn§tj nnetj nW?ji nO? n(19.34)4 E?nk 3 netk n和 V?jinW?ji n权值将在N2在线训练的过程收敛,netkO?j n netj nf netk nnetj n(19.35)可以在N次到N+1次改变时决定:W?j nWkj
25、 n k=3,4 j=1Wjj nW?ji n i=16j=1(19.36)(19.37)参数K3和K4将收敛到适当的值。MNNAC可以为传统DNCS提供适宜的参数。5. 总结传统的简单结构的直接神经控制器可以容易地执行,节省更多的CPU寸间。但是被控对象的雅克比值不容易知道。传统的在线训练神经控制器使用正负号函数近似雅克比值还缺乏 以用于伺服控制系统。3适应法那么可以有效提高收敛速率,但是适宜的参数取决于尝试和误差,获得适宜的参数不容易。这里提出的MNNAC可以为传统的直接神经控制 DNC提供合适的参数。带有被MNNAC训练好参数的DN可以提高自适应能力以及改善非线性控制系统的 控制性能。参
26、考资料1 Psaltis, D., Sideris, A. and Yamamura, A. A.: A Multilayered Neural Network Con troller. IEEE Control System Magazine, v. 8, 1988, pp. 17 -212 Zha ng, Y., Sen, Pand Hearn, G. E.: An On-line Trai ned Adaptive Neural Con troller. IEEE Control System Magazine, v. 15, 1995, pp. 67 53 Weerasooriya,
27、S. and EI-Sharkawi, M. A.: Identification and Control of a DC Motor Using Back-propagation Neural Networks. IEEE Transactions on Energy Conversion, v. 6, 1991, pp.663 -6694 Rubai, A. and Kotaru, R.: Online Identification and Control of a DC Motor Using Learning Adaptation of Neural Networks. IEEE Transactions on Industry Applications, v. 36, n. 3, 20005 Weerasooriya, S. and EI-Sharkawi, M. A.: Laboratory Implementation of A Neural Network Trajectory Controller for A DC Motor.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024股权质押借款合同范本2
- 信用贷款合同模板
- 2024年国际买卖合同中英文
- 2024年建筑外墙节能保温技术服务合同
- 2024规范的电子配件购销合同模板
- 三轮摩托购车合同范本2024年
- 教育机构合作契约
- 2024停车场场地协议书范文
- 网络证券交易平台服务协议
- 经营托管合同范本
- 中国介入医学白皮书(2021 版)
- 2024中华人民共和国农村集体经济组织法详细解读课件
- 代运营合作服务协议
- 婚内财产协议书(2024版)
- 有限空间作业应急管理制度
- 2024全国普法知识考试题库及答案
- 化工企业中试阶段及试生产期间的产品能否对外销售
- 篮球智慧树知到期末考试答案章节答案2024年浙江大学
- 国开作业《公共关系学》实训项目1:公关三要素分析(六选一)参考552
- 碳排放核算与报告要求 第XX部分:铅冶炼企业
- 物业及物业管理:提升旅游景区品质
评论
0/150
提交评论