一类高阶非线性系统的混合自适应重复学习控制_第1页
一类高阶非线性系统的混合自适应重复学习控制_第2页
一类高阶非线性系统的混合自适应重复学习控制_第3页
一类高阶非线性系统的混合自适应重复学习控制_第4页
一类高阶非线性系统的混合自适应重复学习控制_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2007年11月系统工程理论与实践第11期文章编号:100026788(2007)1120104207一类高阶非线性系统的混合自适应重复学习控制孙云平,李俊民,王元亮(西安电子科技大学理学院,西安710071)摘要:针对含有时变和时不变未知参数的高阶非线性系统,应重复学习控制方法,该方法结合了反馈线性化,性系统,通过引进微分-差分参数自适应律,范数意义下渐近收敛于零,通过构造.实例仿真结.关键词:;Lyapunov函数:ARepetitiveLearningControlforaClassofHighOrderNonlinearTime2VaryingSystemswithMixedParam

2、etersSUNYun2ping,LIJun2min,WANGYuan2liang(SchoolofScience,XidianUniversity,Xian710071,China)Keywords:mixedparametric;nonlinearsystem;adaptivecontrol;repetitivelearningcontrol;Lyapunovfunction1引言自适应控制可以有效地处理线性和非线性系统中含有常值参数或慢时变参数的不确定性,而对含有14时变参数的不确定系统,实施自适应控制还是一个公开的难题.文献5解决了含有慢时变参数不确2的参数周期自适应律,解决了一阶混合

3、参数不确定性系统的周期自适应控制问题;使得跟踪误差在LT2范数意义下渐近收敛,但其仅对不确定参数满足匹配条件的情况作了研究;文献11针对不确定非线性系统,基于观测器给出了一种自适应重复学习控制方法,需要系统参数为时间的周期函数;文献12针对一收稿日期:2006209215资助项目:国家自然科学基金(60374015)作者简介:孙云平(1966-),男,四川江津人,博士研究生,研究方向是学习控制,自适应控制和鲁棒控制;李俊民(1965-),男,陕西岐山人,教授,博士生导师,研究方向是自适应控制与学习控制,最优控制与算法,混合系统理论和网络化控制等;王元亮(1983-),男,福建莆田人,硕士研究生

4、,研究方向是自适应控制,神经网络与模糊控制.第11期一类高阶非线性系统的混合自适应重复学习控制105类含非参数化不确定的非线性系统,提出了一种重复学习控制方法,但要求目标轨线是周期函数;文献13对具有周期和拟周期时变参数不确定系统,利用Backstepping方法给出了鲁棒学习控制策略;文献14对一类既有完全未知的虚拟控制系数又有时变参数不确定性的不匹配的非线性系统,给出一种自适应鲁棒重复学习控制策略,把Nussbaum2type函数与Backstepping方法相结合,能够保证系统状态一致最终有界;文献15针对含有时变和时不变未知参数的二阶非线性系统,结合Backstepping方法,提出了

5、一种新的自适应重复学习控制方法,使跟踪误差平方在一个周期上的积分范数渐近收敛于零.本文在文献10的基础上,研究了含有时变和时不变参数化高阶非线性系统,提出了微分2,利用反馈线性2化方法,通过构造Lyapunov函数,设计了混合自适应控制律T敛于零,并给出了闭环系统稳定的充分条件.在本文中,函数f(s)的LT2范数,st-T=X(t).2t-t),其中T为有限正常数.记X2:(m)0T01T1x-(t)(X,t)-()(X,t)=bu(t)X(0)=X0,()(1)m-1Tm其中x1=x,x2= x,xm=x,X(t)=(x1(t),x2(t),xm(t)R是可测的系统状态,X(0)=X00是系

6、统的初值,u(t)R是系统的控制输入,b是符号已知的未知输入增益,不失一般性,设b>0,(t)00T111T0=(是未知连续的时变参数向量,=(是未知的时不变参数向量,(X,t)1(t),p(t)1,n)00T111T=(,(X,t)=(分别是已知的向量值函数.Xr(t)=(xr1(X,t),p(X,t)1(X,t),n(X,t)m-1(t), (t)TRm表示参考模型的状态,目标轨线为xr(t).在本文中,系统(1)及目标轨线xr(t),xr()xr(t)满足下列假设:(t)是周期为T的连续向量函数,(t)=(t-T),且在某个紧集内变化,即存在一个正假设1000(t)数M,使得M.j

7、j(X,t)(j=0,1)关于X是李普希茨连续,关于t是分段连续,即对X1,X2Rm,使得假设2j(X1,t)-(X2,t)ljX1-X2,lj(j=0,1)是未知李普希茨常数.000假设3目标轨线xr(t)和它的一阶到m-1阶导数均在LT2范数意义是有界的.即2t-Tt(xrk()2d<(k=0,1,m-1).()注1假设1限定了快速时变参数是周期性的,并且在一个未知紧集内变化.需要注意的是,连续函00数在左闭右开的区间上不一定有界,因此该假设中只要求这样的紧集存在,即存在M即可,而M可以未知.注2假设2以及(t)是连续向量函数,确保了系统方程(1)的解存在惟一并连续;假设3是为了保2

8、证系统的所有信号均在LT2范数意义下是有界的而给出的.m0定义广义跟踪误差(t)=xr(i-1)i=1ce(t),(ciim=1),ci(i=1,m)是霍尔维茨多项式系数,其中ei(t)(t)-xi(t).2控制目标是在周期自适应控制机理下,保证广义跟踪误差(t)在LT2范数意义下渐近收敛于零,并且确保闭环系统所有信号均在LT2范数意义下有界.3控制律和周期自适应律的构造(t)关于t的导数为:m-1(t)= i=1ciei+1(t)+xr(m)001T1(t)-(t)T(X,t)-()(X,t)-bu(t)(2)106系统工程理论与实践2007年11月根据高阶非线性系统(1)式和(2)式的特点

9、,构造的学习控制律为:T0T(t)-u(t)=K(t)(X,t)-(t)(X,t)(3)TT-10l其中K>0是反馈增益,(t)=(1(t),p(t)是(t)=(的估计量,1(t),p(t)l(t)=bTT-1(t),(l=1,p),(t)=(0(t),1(t),n(t)是=(0,1,n)的估计量,0=-b,j-11=bj(j=1,n),m-1(X,t)=i=1ciei+1(t)+xr(m)111(t),1(X,t),2(X,t),n(X,t)TTT注3显然(t)=(是周期为T(0,n)是1(t),p(t)未知的时不变参数向量.时变参数周期校正律为:t)=,t),-T)-0t)(X,t)

10、(t),)tT,t0,T)(4)t)=0,t-T,0)其中,Q=diag(q1,q2,qp)>0是正定对角的常数增益矩阵;对任意t0,T),Q0(t)=diag(q1(t),qp(t)的对角线上每个元素qs(t)是严格单调增加的连续函数,满足qs(0)=0,qs(T)=qs,(s=1,p),Q(t)的这样选取,是为了保证(4)式中(t)的连续性,t=kT,kZ+=0,1,2,.00时不变参数校正律为:(X,t)(t)(t)=-R(5)这里,R是正定对称矩阵.注4(4)式中增益矩阵选择为正定对角矩阵,并且满足在第一个周期内Q0(t)的对角元素是严格单调增加的连续函数,而在第二个周期以后Q0

11、(t)的对角元素变为常数,并且该常数就是对角元素在第一个)上的连续性,进而保证了我们构造的Lyapunov函数周期末的值.增益矩阵这样选择,确保了(t)在0,)处的连续性就可以了,在一个周期内的有界性.为了说明这一点,我们只需明确(t)在kT(k=0,1,2,在T处的连续性是显然的,而在2T处的连续性可从以下的式子中得出:0(X(t),t)(t)lim(t)=lim(t-T)-Qt2T-t2T-00(X(t),t)(t)=lim-(-Q0(t-T)(X(t-T),t-T)(t-T)-Qt2T(X(2T),2T)(2T)=-Q(T)(X(T),T)(T)-Qt2T00(X(t),t)(t)lim

12、+(t)=lim(t-T)-Q+t2T00(X(t-T),t-T)(t-T)-Q(X(t),t)(t)=lim+(t-2T)-Qt2T(X(T),T)(T)-Q(X(2T),2T)(2T)=-Q)处的连续性类似地可因此,lim-(t)=lim(t),从而得到(t)在2T处是连续的,而在kT(k=1,2,+t2Tt2T00以得出.把(3)式代入(2)式:(t)=b(-K(t)-<T(t)(X,t)-T(t)(X,t)其中,<(t)=(t)-(t),(t)=-(t).(6)4收敛性分析)定理1系统(1)在假设1假设3条件下,学习控制律(3)式,周期校正律(4)式和(5)式保证了:(广义

13、跟踪误差(t)在LT2范数意义下渐近收敛于零,即lim2tt-Tt2()d=0.()闭环系统所有信号均在第11期一类高阶非线性系统的混合自适应重复学习控制107LT2范数意义下有界.2证明构造的Lyapunov函数为:-12E(t)=b(t)+22t-tT)Q-1<()d+T(t)R-1(t)<(2T(7)其中,Q,R分别是正定对角矩阵,正定对称矩阵.1)对tT,E(t)在一个周期t-T,t)内的差分为:E(t)=E(t)-E(t-T)-122=b(t)-(t-T)+22+t-Tt(<T()-1<()<T(-T)d(8)T(t)R-1(t)-T(t-T)-1T2利

14、用以下关系:-12(tT(<()Q<()-<(-T)Q<(-T)d2)(X,)()d-=<(2(X,)Q(X,)()d(t)R(t)-(t-T)R(t-T)=()(X,)()d2=t-Tt20K()-<T()(X,)()-T()(X,)()d(9)tT-1T-1t-TtT0t0T02t-Tt-T(10)(11)T-1T-1tTt-T注5(9)式,(10)式和(11)式的证明类似于文献10.把(9)式,(10)式和(11)式分别代入(8)式,得:tt0202E(t)=()d-(X,)TQ(X,)()d-Kt-Tt-T2()d<0-Kt2t-T(12),显

15、然当t2)收敛性:对tiT,(i+1)T,记t=iT+t0,t00,T),(i=1,2,时,有i,i-1重复利用(8)式,得E(t)=E(t0)+j=0E(t-t0,TjT),当t00,T)时,两端取极限,又利用(12),得:limE(t)<tmax)E(t0)-Klimij=1i-1t-jTt-(j+1)T2()d.2因为E(t)0,若E(t0)在区间0,T)有界,依据级数收敛性定理,由上式可得,广义跟踪误差(t)在LT2范数意义下渐近收敛于0,即limt0,Ttt-Tt2()d=0.3)以下证明max)E(t0)的有限性.在区间0,T)内,因为(t)=-Q0(t)(X,t)(t)是连

16、续的,而系统(1)关于自变量X是李普希茨连续的,根据微分方程解的存在性定理,在区间0,T1)<0,T)上,系统(1)有唯一连续解,其中T1>0是有限正常数.因此只需证明当tT1,T)时,maxE(t0)的有限性.)t0,T0因为Q=diag(q1,q2,qp)>0是正定对角的常数增益矩阵,Q0(t)=diag(q1(t),qp(t)的对角000线上的每个元素qs(t)是严格单调增加的连续函数,满足qs(0)=0,qs(T)=qs,(s=1,p).因而可得Q00-1-1Q0(t)Q0(T1)>0,进一步得到2QQ0(t)>0,因此,P(t)=Q0(t)-Q>0

17、是正定对角矩阵,对2tT1,T),由(4)式,(5)式和(6)式知,TT-1-1-1T-1(t)+(t) E(t)=(t)b <(t)Q<(t)-<(t-T)Q<(t-T)+(t)R22108系统工程理论与实践2-1(t)-<T(t)Q0-1(t)<(t)+<T(t)Q0(t)(t)+=-K2007年11月T-1<(t)Q<(t)2-T-1<(t-T)Q<(t-T)2(13)Tyy(c>0)对(13)式的交叉项进行放大,从而消去交叉项,得4c2(t)+<T(t)Q0-1(t)(t)-<T(t)P(t)<(

18、t)=-K利用Youngs不等式xycxx+TTTT-1T-12<(t)Q0(t)(t)c<(t)<(t)+(t)0(t).4T2(t)-<T(t)(P(t)-cI)<(t)(t0-1()2(tP(t)>0,再进一步所以, E(t)-Kc假定P(t)-cI>0, E(t.T因为(t),maxt0,T)M=(M1,MP)MS=Ss=1,PTTT-1-1(t),使得(t0,T,所以,(t)2(t)2(t),由QQ0MMM(Q0M(t)(Q04c4cT-1(t)Q0(T1)>0可知,(T1)2M(Q0M为正常数,因而在区域4c(t),<(t)T2

19、M(Q0-1(T)2(t)+<T(t)(P(t)-cI)<(t)MK4c的外部, E(t)是负定的.从而,E(t)在有限区间T1,T)是有界的.由E(t)的有界性和定义(7),可以知道2(t)在L2T2范数意义下是有界的.由E(t)的有界性可得(t)在LT2范数意义下是有界的.由(3)可知,控制输入u(t)在LT2范数意义下是有界.由假设3以及(1),(5)易得其它信号在LT2范数意义下的有界性.225实例仿真考虑如下:一个关节的机器人操作臂方程:x1x=001x1x0+ml+2(u-glcosx1+1)23其中x1是关节角度,x2是角速度,m是质量,l是长度,I是惯性矩,u是关节

20、输入,t)是外1=5x1sin(5部干扰.在仿真中,取b=ml+I2>0为时不变参数时,系统参数是m=3kg,l=1m,I=015kgm,参考轨迹T2xr(t)=2sin2t,系统的初始条件为:x1(0)=0,x2(0)=0.系统的不确定性能表示为(t)(X,t)+()(X,t),其中(t)=1T103t)-5sin(015sup,=1-glb0,(X,t)=x1,(X,t)=1cosx1,广义跟踪误差(t)=3e1+e2,用|i|表示在第i个周期广义跟踪误差的最大绝对值.利用本文设计的周期自Q,K=650,R=70.利用MATLAB编程仿真,T适应控制律,周期T=4s,Q=011I(I

21、为单位矩阵),Q0(t)=得到仿真结果如图所示.图1说明了第i个周期广义跟踪误差的最大绝对值,图2表明第50个周期广义误差(t)曲线已经小于2%,由图3图4可以看出,控制曲线u(t)是有界的,由图4进一步看出控制曲线是令人满意的;图5图8说明了时变参数的估计曲线(t)和时不变参数的估计曲线(t)的有界性,这与理论分析结果是相符的.以上仿真结果表明所提的方法是可行的.6结论针对一类混合型参数的高阶非线性系统,利用反馈线性化方法,引进微分2差分参数周期自适应律,设计了一种周期自适应控制策略.通过构造Lyapunov函数,证明了广义跟踪误差在LT2范数意义下渐近收敛2第11期一类高阶非线性系统的混合

22、自适应重复学习控制109于零,实例仿真结果说明了该方法的可行性.图1|i图2第50个周期广义误差曲线(t)图3控制曲线u(t)图4第50个周期控制曲线u(t)图5时变参数的估计曲线1(t)图6时变参数的估计曲线2(t)图7时不变参数的估计曲线0(t)图8时不变参数的估计曲线1(t)110参考文献:系统工程理论与实践2007年11月1NarendraKS,AnnaswamyAM.StableAdaptiveSystemsM.EnglewoodCliffs,NJ:Prentice2Hall,1989.2KokotovicPV.FoundationsofAdaptiveControlM.NewYor

23、k:Springer2Verlag,1991.3SastrySS,BostonM.AdaptiveControl:Stability,ConvergenceandRobustnessM.UpperSaddleRiver,NJ:Prentice2Hall,1989.4IoannouPA,SunJ.RobustAdaptiveControlM.UpperSaddleRiver,NJ:Prentice2Hall,1996.5MiddletonRH,GoodwinGGC.Adaptivecontroloftime2varyinglinearsystemsJ.IEEETransactionsContro

24、l,1988,33(2):150-155.6TsakalisKS,IoannouPA.LinearTime2VaryingSystems2Control,:Prentice2Hall,1993.7MarinoR,TomeiP.Adaptivecontroloflineartime2,394):651-659.8HaraS,YamamotoY,OmataT,et:servosystemforperiodicexogenoussignalsJ.IEEETransactionson,)-9DixonWonDRepetitiveleaningcontrol:Alyapunov2basedapproachJ.IEEETransactionsonCircuits,ManandCybernetics2partB,2002,32(4):538-545.10XuJianxin.newadaptivecontrolapproachfortime2varyingparameterswithknownperiodicityJ.IEEETransactionsonAutomaticControl,2004,49(4):579-583.11XuJianxin,XuJing.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论