机器人神经网络控制汇总_第1页
机器人神经网络控制汇总_第2页
机器人神经网络控制汇总_第3页
机器人神经网络控制汇总_第4页
机器人神经网络控制汇总_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一部分机器人手臂的自适应神经网络控制机器人是一具有高度非线性和不确定性的复杂系统,近年来各研究单位对机器人智能控制的研究非常热门,并已取得相当丰富的成果。机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩,使得机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样,当机器人的结构及其机械参数确定后,其动态特性将由动力学方程即数学模型来描述。因此,可采用经典控制理论的设计方法一一基于数学模型的方法设计机器人控制器。但是在实际工程中,由于机器人模型的不确定性,使得研究工作者很难得到机器人精确的数学模型。采用自适应神经网络,可实现对机器人动力学方程中未知部分的精确逼近,从而实

2、现无需建模的控制。下面将讨论如何利用自适应神经网络和李雅普诺夫(Lyapunov)方法设计机器人手臂跟踪控制的问题。1、控制对象描述:选二关节机器人力臂系统(图1),其动力学模型为:图1二关节机器人力臂系统物理模型M(q)举V(q,q)& G(q) F & q p其中PlP2M(q)2 P3 cosq2P2 P3cosq2P2P3cosq2P2P3q2 s1nq2 ,V(q,q)q .P3&sinq2P3(& (&)sin q20P4gcosqip5gcosqq2)tG(q),F&0.02sgn&,e0.2sint0.2sint。P5gcosqiq2)其中,q为关节转动角度向量,Mq为2乘2维

3、正定惯性矩阵,Vq碌为2乘2维向心哥氏力矩,Gq为2维惯性矩阵,F/为2维摩擦力矩阵,R为未知有界的外加干扰,为各个关节运动的转矩向量,即控制输入。已知机器人动力学系统具有如下动力学特性:特性1:惯量矩阵M(q)是对称正定阵且有界;特性2:矩阵Vq屏有界;特性3:Mq2Cq,&是一个斜对称矩阵,即对任意向量有T己Mq2Cq,0(2)特性4:未知外加干扰。满足II4bd,bd为正常数。2我们取PR,P2,P3,P4,P52.9,0.76,0.87,3.04,0.87kgm,两个关节的位置指令分别为qid0.1sint,q2d0.1cost,即设计控制器驱动两关节电机使对应的手臂段角度分别跟踪这两

4、个位置指令。2、传统控制器的设计及分析:定义跟踪误差为:etqdtqt(3)定义误差函数为:r/e(4)其中T0。则/r媪eMr&M&dq&M碉 TOC o 1-5 h z &Vq&GFq&VrV我eVrrfrd其中,f为包含机器人模型信息的非线性函数。f表示为f x M ed& Vqd e G F在实际工程中, M q , Vq,&, G q和F &往往很难得到精确的结果,导致模型不确定项f x为未知。为了设计控制器,需要对不确定项f x进行逼近,假设?为的逼近值设计控制律为r f Kvr将控制律式(7)代入式(5),得Mr& Vr ? K vrf qKv V r f% rdKv V r ?

5、o其中为针对f的逼近误差,% f ?, ?。% q如果定义Lyapunov函数1 TL r Mr2则0T1ToT1ToT_& r Mr& r Mr r Kvrr 擀 2V r r ?。22& rT?o rTK vr这说明在Kv固定条件下,控制系统的稳定依赖于?。,即?对f的逼近精度及干扰0的大小。3、基于RBF神经网络逼近的机器人手臂控制).基于RBF网络的逼近算法已经证明,采用RBF网络可以实现对任意连续函数的精确逼近。因此,可以采用RBF网络实现对不确定项f的逼近。在RBF网络结构中,取Xx1,X2,.XnT为网络的输入向量。设RBF网络的径向基向量h加,,hmT,其中hj为高斯基函数:|

6、X-Cj|2hjexp(-2n),j1,2,Lm.(10)2bj其中网络第j个结点的中心矢量为CjCji,,Cjn,i1,2,n。假设存在权值W,逼近函数fx的理想RBF网络输出为:(11)fWhxx其中W网络的权向量,hh1,h2Lhn,ex为逼近误差,exqNxo考虑式(6),针对fx中包含的信息,逼近函数fx的RBF网络输入取: TOC o 1-5 h z XeT&qT端扁(12).基于RBF网络的控制器和自适应律设计定义RBF神经网络的实际输出为:?xV?Thx(13)取V%WV?(14)控制律和自适应律设计为:弋V?ThxKvrv(15)WFhxrT(16)其中F为对称正定阵,FFT

7、00将式(11)、式(13)和式(15)代入式(5),得Mr&KvVmr脩飞xeqvKvVmr?1(17)其中?1 WThxe e V, v为用于克服神经网络逼近误差e和干扰id的鲁棒项。将鲁棒项v设计为:V N bd sgn r 其中sgn为符号函数。1r 0sgn r 0r 01 r 03 ).稳定性及收敛性分析针对n个关节的神经网络控制,定义Lyapunov函数为:L rTMr 1tr WTF 1W0其中tr为矩阵的迹,其定义为:设A是n阶方阵,则称A的主对角元素的和为A的迹,记作trA。则&rTMr&1rTMtrWTF1脩2将式(17)代入上式,得1&rTKvr-rT麻2VmrtrW%

8、TF1脩hrTrTrdv(21)2将式(2)和式(16)代入上式,得I&rTKvrrTcTdv下面分两种情况进行讨论。(1)不考虑鲁棒项,取v0,则&rTKvrrTeqKvmin|r|2nbd|r|如果要使l&0,则需要满足:|r|Nbd/Kvmin(22)如果满足!&0,由于L0,且M(q)有界,则由L表达式可知,rt、W%和V?都有界。由rt有界可知,跟踪误差et及其导数&t都有界,从而q和&有界,且跟踪误差et及其导数&t的收敛值随神经网络逼近误差上界n和干扰上界bd的增大而增大,并可通过增大Kv的值达到任意小。(2)考虑鲁棒项,v取式(18),则rTeqvrTeqrTvrTeq|r|n

9、bd01&rTKvr0由于L0,且M(q)有界,则rt、W%和W为有界。由于&2rTKv&,又由于式(17)的右边信号都有界,则&有界,&W界,则根据Barbalat引理,&趋近于零,即rt趋近于零,从而可得出et和&t趋近于零。4、SIMULINK仿真验证仿真图如下:inputS-FunctiorS-Function3OClockTo WorkspacesanglalTg WorkspaceanglesTo Workspacelnon funcTo Workspace?f 口ctrl_value1ctr value2S-Fu nction2Scope由于系统比较复杂,直接采用模块搭建比较麻烦

10、,所以本设计中采用S_function动态函数来实现前面推导的算法公式,实现了三个动态函数:input.m产生输入、ctrl.m为控制器实现、plant.m表示控制对象:其中控制器实现函数ctrl.m中RBF神经网络的中心矢量及近似标准差分别设置为:1*-1.5-1-0.500.511.3; TOC o 1-5 h z 15-1-0.500,51L5:1.510.500*511.5;k51-Oi50Q*511.5;1.510.500.51L.5b=0420;这两个值的取值对神经网络控制的作用很重要,如果参数取值不合适,将使高斯基函数无法得到有效的映射,从而导致RBF网络无效。网络输入取z=e&

11、qdq&d&d,初始状态设置为零,控制参数取Kvdiag50,50,Fdiag25,25。高斯基函数的m语言实现如下:2-e;de;dqd;ddqd;forj=l:nod*hl.(j)=exp(-rtorw.(z(l)-c(:jj)2/);(-norm(z(2)-cC:Aj)2/(b*b):endF=2S*eye(2);fohi=L:Iinodesys(i)=?(1,1)thl(1)r(l):sys(i+nodeF(2,*r(2);endRBF网络逼近效果如下图,由图可以看出开始阶段拟合误差较大,但随着时间的增大,能够较好地拟合原函数,即使原函数很复杂,通过调整参数,逼近效果会更好。数函的近一

12、、rr与数函原5045403530252015105 0 , . 一 二 / . .V原函数RBF逼近函数I1 r 1051015202530时间(s)对两个关节的位置指令分别为4d0.1sint,q2d0.1cost跟踪效果如下图所示,开始时有一定的误差,但稳定后能无静差跟踪,效果很好。XJlnTsn。一一q踪跟置位1节关位置指令,跟踪曲线f/k4/T/上.*f三*iT/f/r/r/f/7ffV/f-0.1524101214516O5c510-00oO-fsonxlo=Q踪跟置算节关68时间(s)-0.20第二部分对自适应神经网络的理解与体会本门课程是继线性系统后的一门比较理论的关于控制理论

13、的课程,与线性系统不同的是自适应神经网络控制研究的对象更多的是非线性、参数未知、模型未知的复杂系统,经典的控制方法在面对这样的系统时显得非常乏力,于是,自适应控制、学习控制、智能控制如神经网络遗传算法等就大有用武之地了。通过本门课程的学习我学到了backstepping方法,神经网络控制方法,通过严格的公式推导出神经网络的控制思想还是挺有趣味与吸引力的,循序渐进的过程让我懂得了虚拟控制、匹配条件、延迟参数设计等概念,不管以后自己是否走理论研究这条道路,我感觉在这么短的时间内学到的这些知识还是很有价值的。下面对我学到的一些知识进行简要的总结:自适应控制的研究对象是具有不确定性的系统,这里所指的“

14、不确定性”是指被控对象及其环境的数学模型不是完全确定的。对于具有较强不确定性的被控系统,如何设计一个满意的控制器,就是自适应控制所要研究的问题。参照在日常主活中生物能够通过自觉调整自身参数改变自己的习性,以适应新的环境特性,从而提出了自适应控制器的设想。自适应控制器应能够及时修正自己的特性以适应对象和扰动的动态特性变化,使整个控制系统始终获得满意的性能。因此,自适应控制方法就是依靠不断采集的控制过程信息,确定被控对象的当前实际工作状态,根据一定的性能准则,产生合适的自适应控制规律,从而实时地调整控制器结构或参数,使系统始终自动地工作在最优或次最优的运行状态下。自适应控制是现代控制的重要组成都分

15、,它同一般反馈控制相比具有如下特点:一般反馈控制主要适用于确定性对象或可以预知的对象,而自适应控制主要研究具有不确定性的对象或难以确知的对象。一般反馈控制具有较强的抗干扰能力,能够消除状态扰动所引起的系统误差;而自适应控制由于具有辨识对象和在线修改参数的能力,因而不仅能消除状态扰动引起的系统误差,而且还能消除系统结构扰动引起的系统误差。一般反馈控制系统的设计必须依赖系统特性的数学模型及其环境变化状况,而自适应控制系统设计则对数学模型的依赖很小,仅需要较少的验前知识,但自适应控制的实现往往更多地依靠计算机技术。(4)自适应控制是较为复杂的反馈控制,它在一般反馈控制的基础上增加了自适应控制环节或系

16、统参数辨识器,另外还附加了一个可调系统。Backstepping设计方法是针对不确定性系统的一种系统化的控制器综合方法,是将Lyapunov函数的选取与控制器的设计相结合的一种回归设计方法。在处理线性和某些非线性系统时,该方法在改善过渡过程品质方面展现出较大的潜力,应用在机器人控制、电机控制、液压控制、船舶控制等许多控制领域。Backstepping的具体的基本设计思想是将复杂的非线性系统分解成不超过系统阶数的子系统,然后单独设计每个子系统的部分Lyapunov函数,在保证子系统具有一定收敛性的基础上获得子系统的虚拟控制律,在下一个子系统的设计中,将上一个子系统的虚拟控制律作为这个子系统的跟踪

17、目标。相似于上个子系统的设计,获得该子系统的虚拟控制律;以此类推,最终获得整个闭环系统的实际控制律,且结合Lyapunov稳定性分析方法来保证闭环系统的收敛性。Backstepping可用来设计控制方案以满足三角结构单输入单输出非线性系统的匹配条件。Backstepping设计方法之所以受到国内外学者的极大关注,主要原因为该方法取消了系统不确定性满足匹配条件的约束,从而解决了相对复杂的非线性系统的控制问题。在现实世界中,存在大量非线性系统具有(或者可以经过微分同胚变换成)严格反馈等规范型;该方法为复杂非线系统的Lyapunov函数设计提供了较为简单的结构化、系统化方法,解决了一直以来具有严格反

18、馈等结构的非线性系统稳定性分析和控制器设计的难题。自适应backstepping设计方法发展的初级阶段,要求系统不确定性能够线性参数化。随着神经网络与模糊系统等智能控制技术的不断发展,很好地取消了自适应backstepping设计所需的该约束条件,从而使得backstepping技术获得了很大的发展空间。特别是神经网络和自适应技术的引入,极大地推广了backstepping方法的应用。人工神经网络利用物理器件来模拟生物神经网络的某些结构和功能。下图是最典型的人工神经元模型,它是大多数神经网络模型的基础Wji-代表神经元i与神经元j之间的连接强度(模拟生物神经元之间突触连接强度),称之为连接权;

19、Ui-代表神经元i的活跃值,即神经元状态;vi-代表神经元j的输出,即是神经元i的一个输入;i-代表神经元的阐值。函数f表达了神经元的输入输出特性。1,UiVi f(Ui)0,u在M-P模型中,f定义为阶跳函数00人工神经网络是一个并行与分布式的信息处理网络结构,该网络结构一般由许多个神经元组成,每个神经元由一个单一的输出,它可以连接到许多其他的神经元,其输出有多个连接通路,每个连接通路对应一个连接权系数。严格来说,神经网络是一个具有如下性质的有向图。(1)对于每个结点有一个状态变量Xj;(2)结点i到结点j有一个连接权系数Wji;(3)对于每个结点有一个阈值j;(4)对于每个结点定义一个变换

20、函数fix,Wji,j(ij),最常见的情形为f(WjiXij)。下图表示了一个典型的前馈神经网络结构。输入以 除含层 输出屎神经网络的应用已经涉及到各个领域,且取得了很大的进展。机器人控制:对机器人轨道控制,操作机器人眼手系统,用于机械手的故障诊断及排除,智能自适应移动机器人的导航,视觉系统。自动控制领域:主要有系统建模和辨识,参数整定,极点配置,内模控制,优化设计,预测控制,最优控制,滤波与预测容错控制等。处理组合优化问题:成功解决了旅行商问题,另外还有最大匹配问题,装箱问题和作业调度问题。模式识别:手写字符,汽车牌照,指纹和声音识别,还可用于目标的自动识别,目标跟踪,机器人传感器图像识别及地震信号的鉴别。第三部分对研究的认识和感想麻省理工大学人工智能实验室关于做研究的看法告诉我们如何做研究,为我们提供的对做研究本身(阅读、写作和程序设计)、理解研究过程以及开始热爱研究(方法论、选题、选导师和情感因素)建议都很有参考意义的。想想自己的学习研究方法,颇感差距与惋惜。我将自己的研究方向定位为应用型研究,认为阅读参考文献、写作不那么重要,但真的是这样的吗!现在不培养好

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论