




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
迭代学习控制系统典型问题研究 专业: 模式识别与智能系统 硕士生:王荣辉 指导老师:李晓东副教授 摘要 迭代学习控制技术适用于固定时间段上具有严格重复运动性质的被控系统, 是目前国内外控制界的研究热点之一,它以系统前次重复的跟踪偏差信号来修正 系统不理想的控制信号,使得系统在有限时间段上的跟踪性能不断随重复次数得 以提高。其主要优点是不要求系统模型的精确知识。本文在对迭代学习控制系统 全面分析归纳的基础上,选择迭代学习控制领域的几个典型问题,进行了较详细 的讨论研究。 一个实际运行的迭代学习控制系统除了存在初始状态偏移外,还多少存在状 态扰动和测量噪声等各种干扰。此外,时滞广泛存在于工业过程中,成为不可忽 视的因素。本文第二章分别对带有多状态时滞的线性离散时变系统和带有多输入 时滞的线性离散时变系统设计了迭代学习控制器,在所构造的2 d 线性不等式的 基础上,利用数学归纳法对该迭代学习控制系统的鲁棒性和收敛性给予了证明, 并通过m a t l a b 进行了仿真验证。 目前大部分迭代学习控制系统收敛性的证明都是利用a 范数进行的,但允范 数的证明却无法判断迭代学习控制系统是否在s u p 范数意义上单调收敛,本文第 四章首先对允范数在迭代学习控制系统收敛性证明方面存在的问题从理论和仿 真两个方面进行了说明。随后,通过对常用的迭代学习控制律进行改进,提出并 证明了有别于传统的迭代学习控制算法,使设计的迭代学习控制系统在s u p 范数 意义上具有单调收敛性。 关键词:迭代学习控制,线性离散时变系统,时滞,鲁棒性,收敛性。 s t u d y f o rt y p i c a lp r o b l e m so fi t e r a t i v e l e a r n i n gc o n t r o ls y s t e m s m a j o r :p a t t e r nr e c o g n i t i o na n di n t e l l i g e n ts y s t e m s n a m e : r o n g h u iw a n g s u p e r v i s o r :a s s o c i a t ep r o f x i a o d o n gl i a bs t r a c t i t e r a t i v el e a r n i n gc o n t r o l ( i l c ) i sa p p l i e dt os y s t e m sw h i c ht r a c kd e s i r e do u t p u t t r a j e c t o r i e sr e p e t i t i v e l yo v e raf i x e dt i m ei n t e r v a l i th a sb e e no n eo fr e s e a r c hf o c u s e s i nc o n t r o lf i e l d s i l ct e c h n i q u ec a l lm o d i f ya nu n s a t i s f a c t o r yc o n t r o li n p u ts i g n a l b a s e do nt h et r a c k i n ge r r o r si np r e v i o u so p e r a t i o n so ft h es a m et a s ks u c ht h a tt h e t r a c k i n gp e r f o r m a n c eo ft h ec o n t r o l l e ds y s t e m sc a nh ei m p r o v e dp r o g r e s s i n g l y o n e o ft h em o s ta t t r a c t i v ef e a t u r e so fl l ci st h a ti tr e q u i r e sl e s sap r i o r ik n o w l e d g ea b o u t t h ec o n t r o l l e ds y s t e m si nt h ec o n t r o l l e rd e s i g np h a s e b a s e do nf u l l ya n a l y s i sa n d s u m m a r i z i n gt oi l cs y s t e m s ,t h i st h e s i sh a ss t u d i e dd e t a i l e d l yaf e wt y p i c a lp r o b l e m s i nt h ef i e l do f i l c b e s i d e si n i t i a li t e r a t i v es t a t ee r r o r s ,ap r a c t i c a li l cs y s t e mi sa f f e c t e db ys t a t e d i s t u r b a n c e sa n do u t p u tn o i s e s a n dt h et i m ed e l a y sa r eo f t e ne x i s t e di nm a n y i n d u s t r i a lp r o c e s s e s i nc h a p t e r o ft h i st h e s i s ,i l cc o n t r o l l e r sa r ed e s i g n e df o r l i n e a rd i s c r e t et i m e - v a r y i n gs y s t e m sw i t hm u l t i p l es t a t ed e l a y s ,a n df o rl i n e a rd i s c r e t e t i m e v a r y i n gs y s t e m sw i t hm u l t i p l em p u td e l a y s ,r e s p e c t i v e l y b a s e d o nt h e c o n s t i t u t i n g2 一dl i n e a ri n e q u a l i t i e s ,t h er o b u s t n e s sa n dc o n v e r g e n c eo ft h ep r o p o s e d i l cc o n t r o l l e r sa r ep r o v e db ym a t h e m a t i c a li n d u c t i o n a l s o ,t h er o b u s t n e s sa n d c o n v e r g e n c eo f t h ep r o p o s e di l c c o n t r o l l e r sa r ei l l u s t r a t e db ys i m u l a t i o ne x a m p l e s a tp r e s e n t ,t h ec o n v e r g e n c eo fm o s ti l cs y s t e m si sp r o v e db yu s i n gt h el a m d a n o r m h o w e v e r ,t h ec o n v e r g e n c ep r o v e db yu s i n gt h el a m d an o r mi sp o s s i b l y n o n - m o n o t o n i ci nt h es e n s eo fs u pn o r m i nc h a p t e ri vo ft h i st h e s i s ,t h eu n d e r l y i n g p r o b l e mo fl a m d an o r mi np r o v i n gt h ec o n v e r g e n c eo fi l ci sf n s td e s c r i b e d 丘o m t h e o r ya n ds i m u l a t i o n s u b s e q u e n t l y , b yv i r t u eo fi m p r o v i n gt h ec o m m o n l y u s e di l c r u l e ,an o v e li l ct e c h n i q u ei sp r o p o s e d ,w h i c hc a l lr n a k et h ed e s i g n e di l cs y s t e mt o b em o n o t o n i c a l l yc o n v e r g e n ti nt h es e n s eo fs u pn o r n l k e y w o r d s :i t e r a t i v el e a r n i n gc o n t r o l , l i n e a r d i s c r e t et i m e v a r y i n gs y s t e m s ,t i m e d e l a y s ,r o b u s t n e s s ,c o n v e r g e n c e u i 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究 工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人 或集体已经发表或撰写过的作品成果。对本文的研究作出重要贡献的个人和集 体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名:五象辫 嗍丫年s 月万日 学位论文使用授权声明 本人完全了解中山大学有关保留、使用学位论文的规定,即:学校有权保 留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版,有权将 学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆、院系资料室被 查阅,有权将学位论文的内容编入有关数据库进行检索,可以采用复印、缩印或 其他方法保存学位论文。 学位论文作者签名:王蔗埠 日期:f 朋确 导师签名: 日期: 李睡东 o 脊支旯哒日 第一章绪论 调节闷题和跟踪问题是控制系统设计中的两类主要问题1 1 - 2 。一般而言,控 制系统的主要任务是寻找合适的控制信号u ( t ) ,使得输出信号y ( t ) 达到所期望 的形式。铡如,一种控制任务是使输出信号y ( t ) 尽可能墟接近某个平衡点,另 一种控制任务是使输出误差尽量小,前者被称为调节问题,后者被称为跟踪问题 f n 。显然,调节问题可以看成跟踪闯题的特殊情况【h 。目前,绝大多数对于跟踪 闻题所提供的控制技术都是渐近地实现跟踪饪务的【2 1 3 】。为了实现被控系统对期 望轨迹零误差完全跟踪,需要采取些不同于传统控制技术的控制方法,迭代学 习控制就是在这种背景下被提出来的1 4 j 。 迭代学习控制技术适用予固定时间段上具有严格重复运动性质的被控系统 ( 如工业生产上的机械手,数控机床,半导体晶片生产等) 2 】,是目前国内外控 制界的研究热点之一,它以系统前次重复的跟踪偏差信号来修正系统不理想的控 制信号,使得系统在有限时间段上的跟踪性能不断随重复次数得以提高韬羽。萁 主要优点是不要求系统模型的精确知识,只需利用系统的输入输出信息就可以设 计控制器。迭代学习控制的研究,对具有较强的非线性耦合、较高的位置重复精 度、高精度轨迹跟踪、难以建模的动力学系统有着十分重要的意义 2 1 。 1 1 迭代学习控制系统基本原理 迭代学习控制过程其实与人类的学习过程有着惊人的相似,通过设计一种控 制器,让控制器本身具有某神智能,使它在控制过程中不断地完善自己,也就是 不断地训练控制器,以使控制效果越来越好 5 1 。当我们重复完成某一控制任务的 时候,我们从过去的控制输入和跟踪误差数据中获得的额外的信息,我们把这种 信息当作一种关于动态过程模型的经验知识。利用这种经验知识,我们降低了对 过程模型的依赖,并且提供了改进跟踪控制性能的可能性1 4 - 瓤。 为了更严谨、更精准地表达迭代学习控制的基本原理与思想,f = 面借助数学 语言进行接述。 为了不失一般性,我们考虑在时间区间f 【o ,r 】上重复运行的动态系统: 靠o ) = g 七o l u 七o ) ,) ( 1 一l a ) y k ( t ) = g ( x k ( t ) ,琢( 爹) ,) ( 薹一王b ) 其中毪,y k 和分别为系统在第七次重复中的状态,输出和输入向量。厂( ) ,g ( ) 为有着对应维数的向量函数,其参数与结构均来知。记第k 次重复时系统的跟踪 误差为e k o ) = y a 章) 一n ) ,则基本的迭代学习控制律可表示为 z k + l ( ,) = 0 。o l p 。o ”( 1 - 2 ) 传统迭代学习控制的设计就是要对予系统( 1 - 1 ) ,找到合适的控制律( 1 - 2 ) ,使得 l 堡m l l e k 删= o ,f 毫【0 ,丁】 ( 1 3 ) 即有 i m y a t ) = 耽( ) t 琶多,t 】 ( 1 4 ) 膏 一 此时,在( 卜2 ) 学习控制律的作用下,通过对期望轨j f f y a ( t ) 的多次跟踪学习, 就可以达到较高精度的控制效果吼 以上就是迭代学习控制的基本思想,迭代学习控制的算法流程可以总结为如 下5 个步骤【1 】【5 】: ( 董) 给定并储存期望轨迹船 ,选取第一次运行时酶控制向量嘞( 0 g 一,】。 ( 2 ) 进行初始定位操作,使系统的初始状态为( 0 ) ,系统初始输出为欺( o ) 。 ( 3 ) 对被控对象施加控制输入峻( t ) t ,r 】,开始重复操作。采样并存储输盘 此( t ) f 【0 ,4 ( 4 ) 重复操作结束时,计算输患误差e ) = y a o ) 一y ;0 ) ,f ,f 】。 利用迭 代学习控制律( 1 2 ) 计算并储存新的控制输入+ 。( f ) f 【o ,丁】。 ( 5 ) 检验迭代停止条件:l 虼( f ) 一乩( f ) l s ,尹【o ,z 】,其中艿为给定的允许跟踪 精度。如果条件满足就停l 芝运行,否购,置k = k + l ,转到步骤( 2 ) 。 2 迭代学习控制过程可以用图1 - 1 来表示。 图1 - 1 迭代学习控制过程的算法流程图 我们称( 1 - 4 ) 成立时迭代学习控制( 1 - 2 ) 是收敛的。收敛性问题是迭代学习控 制中最重要的问题,只有迭代学习过程是收敛的,迭代学习控制才有实际应用意 义翻。 为了达成以上收敛性控制目标,在传统的迭代学习控制研究中,总是假定下 述假设条件满足 2 1 : 1 系统每次运行时间间隔是有限的固定间隔,即f t o ,t o + 明; 2 系统的动态结构在每次运行中保持不变,即动态方程不变; 3 系统的初始条件重复,即每次运行前,系统的初始状态蕞( 0 ) 都相同; 4 系统的期望轨迹总是预先给定且已知的,即妁( r ) 固定且已知; 5 系统每次运行的输出雎( f ) 可测; 1 2 迭代学习控制的主要研究内容 欲前节的分析中不难看到,迭代学习控制律的设计是迭代学习控制研究的 重点【5 1 。具体说来,就是在保证系统稳定性与收敛性前提下,确定迭代学习律 ( ( 卜3 ) 中函数三( 嗨( f ) ,唆( ,) ) 的具体形式和参数。除此之外,迭代学习控制的初 值闯题、学习控制过程的鲁棒性、学习速度、学习算法的稳定性和收敛性、迭代 学习控制的分析方法( 时域,频域,连续系统,离散系统,2 - d 分析方法) 以及 迭代学习控制的应用推广都是这一领域的研究热点1 2 l 。当然,该学科中各研究方 向是相互融合、相互贯穿的有机体,丽非相互独立的一条条分支 5 1 。为了表述方 便,我们从以下几个方面进行探讨。 1 2 1 迭代学习控制算法的设计 迭代学习控制算法的设计是迭代学习控制的基础,同时也是迭代学习控制中 研究最广,成果最为丰富的研究领域。1 9 8 4 年,迭代学习控制创始者a r i m o t o 等人6 1 首先构造了d 型学习算法:+ 。( f ) :u k ( f ) + rd e f ( t ) ,并给出了系统稳定性 “l 及学习收敛性条件,随后a r i m o t o 以及其他学者相继研究了p 型、p d 型、p i 型 及p i d 型学习律( 可统称为p i d 型学习律) 【5 】,以及沿时间轴方向和沿学习迭代方 向的学习算法或其组合形式的学习算法1 4 1 。还有研究不同的学习系统的结构形 式,即被控系统与学习控制器的构成形式,如开环学习和闭环学习,开闭环结合 算法,以及其它形式的学习算法【4 】。目前,在学习律的研究中,针对特殊系统提 出的控制律占了主导地位【4 】。 近几年,先进的控制技术越来越多地与迭代学习控制相结合,由此产生了各 种新算法。例如,模糊控制、优化理论及神经网络,还有一些针对特殊系统提出 的控制律,如具有学习能力的综合预测控制,应用于无仿射型系统研究的新算法, 非线性系统的稳态逆变换法等【7 1 。 总之,对学习算法的研究与改进,尽管成果不菲,但迄今为止仍是迭代学习 控制研究的重点与热点。 1 2 2 收敛性和稳定性 迭代学习控制能够运行的前提是学习算法必须具有稳定性和收敛性,稳定性 保证随着迭代次数的增加,系统不会发散,而收敛性是迭代学习控制理论的核心 问题 2 】。只有迭代学习过程是收敛的,迭代学习控制才有实际应用意义,学习算 法具备收敛性后才能使控制系统经过数次迭代学习后逐渐收敛到定值,从而保证 了系统的输出为期望输出,所得到的控制为某种意义下的最优控制【i 训。我们讨 论学习算法的稳定性与收敛性主要是研究当学习控制律与被控系统在满足什么 条件时才能保证迭代学习控制过程的稳定或收敛。在目前的研究中,对算法收敛 性的证明中所使用的数学工具主要有李雅普诺夫理论,2 一d 理论,算子理论,以 及微积分不等式等【2 】。 4 1 2 3 初值问题 目前融提毒的大多数迭代学习控制算法对被控系统的初始条件的要求可分 为: ( 1 ) x k ( o ) - - x a 0 ) k = o ,l ,2 ,o oo , oo9 即初态严格重复o 】 ( 2 椎( 0 ) = c ( 常数) ,蠢, p v j 态重复泌1 2 】 其实,以上两种假设初始条件,就是初态固定,它已经被传统的迭代学习控 制研究确定为一个基本的假设。然而,初态固定的要求在很多实际的迭代学习控 制应用中是缀难满足的,每一次重复运动中的初始定位操作常常会导致迭代初始 状态相对于期望初始状态不规律的偏移。 对此,许多学者进行了讨论与改进。目前有关初值问题的结论可以归纳为如 下谣类: 1 x 。( o ) 围绕x d ( o ) 不断波动时,传统的迭代学习控制通常把这类问题归结为学习 控制的鲁棒性问题研究 1 3 1 4 ,所设计的迭代学习控制方法能保证系统在交迭 代初始误差情况下的跟踪误差有界,即:l l m l l e t 】| g ,【o ,r 】,但这个界g 不能 被控制作用调节到较小的程度。 2 。x a o ) = e ( 常数) ,如孙臻轩等黔1 6 l 给出的具有初始缨偏功能的迭代学习控制器 仅仅适用于迭代初始误差固定的情形。 3 ;i m x ( o ) = ( o ) ,x k ( 0 ) 通过学 - j 控制律的调节最终变成类似规定初值的情 形,任雪梅等f 狞给出了任意初始状态下的迭代学习控制,通过对系统的控制输入 和初始状态同时学习: 牧“( f ) = u k ( t ) + l e k ( t ) ,后= o ,l ,2 , x 榭( 0 ) = ( o ) + b l e k ( o ) ,k = 0 ,l ,2 , 来实现对系统的完全跟踪,该方法在学习过程开始对初态没有要求,即不需要假 设在每次迭代过程中系统的初始条件和麓望跟踪轨迹的初始状态都相等,在一定 程度上能够解决任意初始条件下学习控制系统的跟踪问题豳。 4 x t ( o ) 有界 ( i ) c h e n 1 8 】等针对线性系统帮非线性系统,利用相关控制策略,讨论了迭代 学习控制问题,得到了跟踪误差的已知有界性,且跟踪误差的界只与系统的不确 5 定项和扰动项有关,而与初始误差无关。 ( 2 ) f a n g 和c h o w 1 9 1 基于二维线性系统理论,对线性离散系统设计了一种迭代学 习控制器。德这种控制器在理论上只麓保证距初始点j 常远的时闻点跟踪误差 的收敛性。 ( 3 ) 在非线性系统的迭代学习控制方面,x u 和y a n 2 0 】幂0 用李亚普诺夫理论设计自 适应学习控制器来实现初始时间段外对变迭代初始误差的纠偏作用。 ( 4 ) w a n g 和c h i e n 等2 1 以2 1 利用模糊和神经网络理论建立了自适应学习控制算法 来处理变迭代初始误差,从而使初始时间段外的跟踪误差能够被控制到一个可调 节的界内。 以上所有这些关于迭代初始误差纠偏的结果都是在期望轨迹不变的假设下取 得的,相对于变迭代初始误差的普遍性和复杂性,显然这些有关迭代初始误差的 研究是远远不够的。 1 2 4 鲁棒性及鲁棒迭代学习控制 传统的迭代学习控制不仅对初始状态x ,( o ) 有着非常严格酶要求,同时也对系 统动力学模型和实际工程中存在的环境干扰有着重复性的要求,否则系统的控制 精度甚至系统的稳定性都褥不到保证【5 】。 两实际系统中,一些不具可重复性的状态扰动和输入扰动,量测噪声等各种 干扰以及初始条件偏差,期望轨迹变动和学习区间偏移等通常是存在的【l 】【5 1 。此 时,我们仍然希望能够很好地跟踪期望轨迹,于是,我们要求迭代学习控制系统 具有很强的鲁棒性。 系统具有鲁棒性,指的是该系统在各种有界干扰的影响下,其迭代轨迹能收 敛到期望轨迹的邻域内,丽当这些干扰消除时,迭代轨迹会收敛到期望轨迹【l 卅。 鲁棒性问题是由a r i m o t o 针对线性系统首先提融来的,接着h e i n z i n g e r 等人 【2 3 】对非线性系统,分析了带遗忘因子的d 型学习控制的鲁棒性。研究结果暖4 五5 】 表明:迭代学习控制方法本身具有一定的鲁棒性,在存在有界状态扰动和输入扰 动,量测噪声的情况下,系统输出通常能在一定条件下有界收敛,收敛界的大小 与相邻两次迭代运行中干扰的界大小有关,通过合理选择学习控制律的学习系数 可使系统输出处于期望轨迹的一个较小邻域内,从两保证了系统的稳定性 2 1 。 随着鲁棒控制近些年来的迅速发展,将迭代学习控制与鲁棒控制相结合以提 6 高系统的鲁棒性已成为一个新的研究方向5 1 。从系统性能上来看,迭代学习控制 可以保证控制系统在重复运行方向k 的收敛性,而鲁棒控制可以保证控制系统在 时间轴方翻t 的收敛性 4 1 。 1 2 5 迭代学习控制算法的收敛速度 一个好的迭代学习控制算法,不仅在每次控制于系统后,能使系统的输出误 差变小,还需要有较快的收敛速度来保证算法的实用性【2 1 。 一般情况下,在相同的迭代学习律作用下,学习步长越大,迭代学习控制的 收敛速度越快。但此时收敛性条件较严格,控制系统对参数变化敏感,容易造成 不收敛、不稳定的现象【5 1 。 从目前发表的文章来看,提高迭代学习控制算法的收敛速度一般有】以下几种 方法:优化学习算法、赢阶学习算法、带遗忘因子的学习算法、基于几何分析的 快速算法等【2 】【2 6 。2 7 1 。 1 。3 本文的主要研究内容及研究意义 1 3 1 本文的主要研究内容 本文在对迭代学习控制系统进行分析归纳的基础上,选择迭代学习控制领域 的几个典型问题,进行了较详细的讨论研究。 本文首先讨论了带有多状态时滞的线性离散系统和多输入时滞的线性离散系 统的迭代学习控制的鲁棒性问题,为带有状态扰动和量测嗓声以及初始状态偏移 的多状态时滞线性离散系统和多输入时滞的线性离散系统设计了迭代学习控制 器,并对其簧棒性和收敛性应用二维线性不等式和数学归纳法进行了证明,遴过 m a t l a b 仿真验证了在一定的收敛条件下,所设计的迭代学习控制系统具有鲁棒 性,当初始偏移逐渐趋于零和干扰收敛到某个定值时,系统具有收敛性。 嚣前大部分迭代学习控制系统收敛性的证明都是利用元范数或a 范数进行 的,但旯范数或口范数却无法判断系统是否在s u p 范数下单调收敛。本论文选择 常用的迭代学习控制器,对系统的输入变量进行分段处理,让其时间段 0 ,t ) 的 输入量受上一次输入量和学习控制律的修正,时间段( t ,1 的输入量与上一次的 输入量一致,通过逐步地对输入变量的调整,使其输出轨迹逐渐逼近期望轨迹, 7 从而保证了系统在s u p 范数意义下的单调收敛。本文给出了所设计的迭代学习控 制系统收敛的充分条件以及系统单调收敛性证明。 1 3 2 本文的研究意义 传统的迭代学习控制不仅对初始状态x 。( o ) 有着非常严格的要求,同时也对系 统动力学模型和实际工程中存在的环境干扰有着重复性的要求,否则系统的控制 精度甚至系统的稳定性都得不到保证【l 训。而实际系统中,一些不具可重复性的 状态扰动和输入扰动,量测噪声等各种干扰以及初始条件偏差,期望轨迹变动和 学习区间偏移等通常是存在的【1 l 。如果在这样的情况下我们仍然希望能够很好地 跟踪期望轨迹,则这个迭代学习控制系统必须具有很强的鲁棒性。因此,研究系 统的鲁棒性是非常具有现实意义的。 此外,实际工程领域中广泛存在时滞现象,时滞已成为不可忽视的因素之一 2 8 1 ,从严格意义上讲,客观事物中“时滞通常是不可避免的【2 9 1 。事实上,随 着科学技术的进步与发展,在许多学科中提出了大量关于时滞动力学系统的问 题,如自动控制、遗传、人i :1 理论、经济周期危机、交通运输等【2 8 】,因此,对含 有时滞的迭代学习控制系统的研究是具有实际意义的。 然而,目前大部分关于迭代学习控制的成果都是针对于无时滞动态系统。因 此,研究同时带有干扰和时滞的时变系统迭代学习控制设计,具有十分重要的理 论意义和实际应用价值。 第二章时滞系统的鲁棒迭代学习控制 本章首先为带有多状态时滞的线性离散时变系统设计了p 型迭代学习控制器, 在存在状态扰动,量测噪声以及初始状态偏移的条件下,运用二维线性不等式和 数学归类法对所设计的迭代学习控制系统的鲁棒性和收敛性进行了证明,随后, 对多输入时滞线性离教醚变系统迭代学习控制的鲁棒性霹收敛性也进行了摇述 和证明。 2 1 多状态时滞的线性离散时变系统迭代学习控制的鲁棒性 研究 我们考虑如下进行迭代学习控制的多状态时滞线性离散时交系统: x ( t + 1 ,危) = a ( t ) x ( t ,彪) 十芝:4 ( t ) x ( t - - f ,尼) + b ( ,) 扰( f ,后) + 矿( ,后) ( 2 一l a ) i = 1 y ( t ,耄) = c ( t ) x ( t ,露) + 矿p ,露) ( 2 一l b ) 其中k 表示系统沿迭代方向运行的次数,f ,f = 1 ,2 ,i ,表示状态时延,且有 o t f 2 t - 3 控制系统是收敛的。 收敛性问题是迭代学习控制中最重要的问题,只有迭代学习过程是收敛的, 1 0 迭代学习控制才有实际应用意义。 下面我们通过定理给出迭代学习控制系统( 2 - 1 ) 具备鲁棒性和收敛性的条件。 定理一:如果多状态时滞的线性离散时变系统( 2 - 1 ) 满足假设( 1 ) 一( 5 ) ,给定可 以实现的期望轨迹虼o ) r 7 ( f = t o ,t o + 1 9o - 9 t o + 丁) ,在时间区间 t o , t o + 丁】上, 采用迭代学习控制律( 2 - 2 ) 如果满足条件 l i - c ( t ) b ( t - 1 ) p ( t ) 忙p 1 ( t = t o ,t o + 1 ,t o + 丁) 则输出误差是有界的,即! 觋忙( f ,后) 0 6 ,t = t o ,t o + 1 90 9 t o + t ,其中6 为一个比 较小的正实数。 如果满足 0 1 - c ( t ) b ( t - 1 ) p ( t ) i i p 1 上 o = t o ,t o + l ,t o + 丁) ( 2 ) l i m x ( f ,尼) = x a t ) ,f t o , 1 i m w ( t ,k ) = w ( f ) , j i my o ,七) = v o ) ,( r = 气,岛+ 1 ,+ r ) , 则当k 趋于无穷时,p ( f ,k ) 7 e e t = t o ,t o + l ,f o + 丁上趋于0 ,即! 骢0 ( f ) 0 = o 。 证明:我们令 r ( t ,后) = x ( t 一1 ,七+ 1 ) 一x ( t 一1 ,i ) ( 2 7 ) 由( 2 - 1 a ) 可知 r ( t + 1 ,后) = x ( t ,k + 1 ) - x ( t ,七) = a ( t - 1 ) x ( t - 1 ,后+ 1 ) + a , ( t - 1 ) x ( t - - , r f - 1 ,后+ 1 ) + b ( t - 1 ) u ( t - 1 ,k + 1 ) + w ( t 一1 ,k + 1 ) - ia ( t - 1 ) x ( t - 1 + 圭a , ( t - 1 ) x ( t - - r - 1 t = 1) ,七) + , ,尼) l lj - b ( t - 1 ) u ( t - 1 ,k ) + w ( t - 1 ,七) 】 因为 = a ( t - 1 ) r ( t ,七) + 4 ( 卜1 ) ? 7 1 ,的 + b 0 - 1 ) a u ( t - 1 ,露) + w ( t - 1 ,露+ 1 ) 一矽一l ,露) = a ( t - 1 ) r l ( t ,七) + a i ( 卜1 ) 叼 叫,j i ) + 霄一1 ) p ( t ) e ( t ,霓) + 矽p l ,露+ 1 ) 一矽p l ,露) 露,露) = y d ( t ) 一y ( t ,露) 故有 e ( t ,k + 1 ) = y d ( t ) - y ( t ,k + 1 ) 2 e ( t ,k ) y ( 毫,k ) - y ( t ,露+ 1 ) 2 e ( t ,k ) - c ( t ) x ( t ,k + 1 ) - x ( t ,后) 一【矿p ,后+ 1 ) 一v ( t ,七) 】 2 e ( t ,k ) 一c ( t ) r l ( t + 1 ,k ) - v ( t ,k + 1 ) - v ( t ,纠 2 e ( t ,k ) 一c o , 彳一t ) 叩,露,+ 喜4 p t ) 叩q ,意) 一c ( t ) b ( t - 1 ) p ( t ) e ( t ,k ) + a w ( t - 1 ,意) 】一【矿,k + 1 ) - v ( t ,露) 】 = 【j e ) 艿一1 ) p ) 】e ( t ,k ) 叫喜a , ( t - 1 ) r ( t - r ,k ) + a ( t - 1 ) r ( t 一c 9 ) l , ,露) i lf 篇lj ( 2 - 8 ) - c ( t ) w ( t - 1 ,k + 1 ) - w ( t - 1 ,忌) 卜【y ,k + 1 ) - v ( t ,詹) 】 ( 2 9 ) 对( 2 - 8 ) ,( 2 - 9 ) 用矩阵形式表示,令 么( f ) = a ( t 一1 ) 0 a l 一1 ) 0 4 一1 9 一1 ) 0a j 0 一1 ) o o o o o 1 2 oo oo oo oo lq o o o o o o , 一o o o 一 一 一 o o o o o , 0 o o o o ( t ,七) = a w ( t ) = o ( t ,后) r t ( t 一1 ,后) r l ( t 一 c 1k ) r t ( t f 2 ,j | ) r l ( t - r i - 1 ) k ) r l ( t f j ,七) w ( t - 1 ,k + 1 ) 一p 一1 ,尼) 0 o 0 0 o b ( f ) = c ( r ) = b ( t 一1 ) 尸( f ) 0 0 o o 0 - c ( t ) a ( t 一1 ) o c ( t ) a 1 0 一1 ) 一c ( t ) 4 0 一1 ) 一c ( t ) 4 一。o 一1 ) - c ( t ) a 1 0 一1 ) 等式( 2 8 ) ,( 2 9 ) 司以变换成: o ( t + l ,尼) = a ( t ) o ( t ,尼) + 否石( r ,七) + 万彳石( 2 - 1 0 ) e ( t ,后+ 1 ) = c o 渺( f ,k ) + i - c ( t ) b ( t 一1 ) p ( f ) 】e ( f ,k ) - c ( t ) w ( t - 1 ,k + 1 ) - w ( t - 1 ,七) 】 - v ( t ,k + 1 ) - v ( t ,后) 】 ( 2 1 1 ) 根据( 2 8 ) f f l o ( t ,七) 的定义可知归( 岛+ 1 ,七) 0 是有界的。另外,由前面的假设 ( 2 4 ) 可推导出- c ( t ) w ( t - 1 ,k + 1 ) - w ( t - 1 ,后) 】- v ( t ,k + 1 ) - v ( t ,七) 】也是有界 的。在迭代开始前,因为状态x ( t ,o ) 和输入u ( t ,0 ) 都是有界的,由前面的假设( 2 ) 和( 4 ) 可推出输出y ( t ,0 ) 有界,根据e ( t ,0 ) = y a ( t ) - y ( t ,0 ) 可推导e ( t ,0 ) 有界。在 得出等式( 2 1 0 ) ,( 2 - i1 ) 后,如果没有干扰存在,就可以直接利用2 - d 理论,得 出它的收敛性,现在在两个等式中均有干扰量,我们选择数学归纳法对其鲁棒性 进行证明。 1 当f = t o + 1 时,对于( 2 1 1 ) p ( 岛+ 1 ,后+ 1 ) = 云i 丽( + 1 ,| j ) + ,一c ( t o + 1 ) b ( t o ) p ( t o + 1 ) e ( t o + 1 ,k ) - c ( t o + 1 ) 矿( 岛,k + 1 ) - w ( t o ,| j ) 】 - 【y ( + 1 ,k + 1 ) - v ( t o + 1 ,七) 】 两边取范数,根据范数理论怕+ 驯- - a + ib i i 可知: i l e ( o + 1 ,尼+ 1 ) 0 i l _ 天丽( + l ,尼) 0 + i l ,一c ( t o + 1 ) b ( t o ) p ( t o + 1 ) e ( t o + 1 ,k ) l l + 1 1 一c ( t o + 1 ) w ( t o ,k + o - w ( t o ,k ) - v ( t o + 1 ,尼+ 1 ) 一v ( t o + 1 ,后) 】l | - i c ( t o + 1 ) o ( t o + 1 ,k ) l l + i i c ( t o + 1 ) b ( t o ) p ( t o + 1 ) 】i i l i e ( t o + 1 ,k ) l l + l l c ( , o + 1 ) w ( t o ,七+ 1 ) 一w ( t o ,足) 】i i + l l y ( + 1 ,k + 1 ) - v ( t o + 1 ,七) 】l i 其中0 l - c ( t o + 1 ) b ( t o ) p ( t o + 1 ) 忙p 1 ,0 0 ( t o + 1 ,k ) l i 有界。 令 d ( t o + 1 ) = 吣( i l 瓦确瓴+ 1 1 1 + i c ( , o + a ) w ( t o ,k + 1 ) 一w ( t o 删) + s u p i v ( t o + 1 ,k + 1 ) - v ( t o + l ,k ) l l 由 0 c ( t o + 1 ) 0 ( t o + 1 ,尼) l l 有界, i i c ( , o + 1 ) 形( 气,k + 1 ) - w ( t o ,尼) 训有界, l l 【矿( + 1 ,k + 1 ) - v ( t o + 1 ,k ) l i 有界, 可以推导出d ( t o + 1 ) 也是有界的。由e ( t ,o ) 有界可以得出e ( t o + 1 ,0 ) 有界。 上面不等式可写为 l i p ( f o + 1 ,尼) 0 j d le ( , o + 1 ,o ) l + z p 。一一d ( t o + 1 ) 稍,o ) l i + 等 ( 2 - 1 5 ) 所以s u p 。l l e ( + l ,k ) 0 是有界的。 1 4 又因为归( f 0 + 1 ,酬i 也是有界的,故有s u p l j l i i a e ( ( t o + + l l , ,k k ) | ) | ) 是有界的。 2 假设当,= ,时( f o + 1 ,f o + r 1 ) ,s u p :i i i o q l , q k ) ”l i 是有界的。 3 当f = “1 时,令 a q + 1 ) = s 刚丽面( 川,小i i c ( z + 1 ) 【渺“,) 一形】l i ) + s u 。p i l v ( 1 + 1 ,k + 1 ) 一y u + 1 ,k ) l l k - ! l l e ( 1 + l ,) 1 1 - p l i e ( + 1 ,o ) 1 1 + p q d ( z + 1 j = o 小川,0 ) i l + 等 ( 2 _ 1 6 ) 根据步骤2 的假设,当,= ,时( 岛+ z 岛+ 丁一- ) ,s u p l 归l l e ( ( 1 l , k k ) ) l i l l ) 有界和 o ( t ,k ) 的定义,可推导出0 ( 1 + 1 ,k ) 有界。由前面的假设( 2 4 ) 和9 ( ,+ l ,k ) 有界 可以推出d ( ,+ 1 ) 有界,由e ( t ,o ) 有界可以得出e ( 1 + l ,0 ) 有界。因此, s u p l l e ( z + 1 ,k + 1 ) i l 是有界的。 即对于,= 岛,岛+ ,岛+ r ,有s u p 础三甚二2 剖i 是有界的。鲁棒性得证。 另外,当! i mw ( t ,k ) = 形( f ) ,! i mv ( t ,k ) = v o ) ,( f = 气,+ 1 ,f o + r ) 时,令 膏 耳,w v 1 = c ( t ) w ( t - 1 ,k + 1 ) - w ( t - 1 ,尼) 】+ 【y o ,k + 1 ) - v ( t ,后) 】,等式两边取极限可推得 l i m h = 。l i m 。c ( f ) 【形。一1 ,尼+ 1 ) 一矿。一1 ,后) 】+ ! 骢【y o ,七+ 1 ) 一v ( t ,后) 】20k-,-,oo 一 七 七 。 一 当1 i m x ( t ,后) = 勤0 ) ,f t o 时, 茁- - - k o o ! i m 7 ( t + 1 ,七) = j i m ( x ( t ,k + 1 ) 一x ( t ,后) ) = 0 7 w _ ,w 由前面关于日( f ,k ) 的定义可推导出 憋o ( t ,七) = 【o o 】7 t , 膏 一一 e ( t ,七十1 ) = 研( f ,七) “,一c ( t ) b ( t - 1 ) p ( t ) e ( t ,k ) - c ( t ) w ( t - 1 ,k + 1 ) - w ( t - 1 ,k ) l _ y ( ,k + 1 ) - v ( t ,七) 】 两边取范数,根据范数理论怕+ 矧- - l l a l l + l i b i i 可知: i l e ( t ,k + 1 ) l l _ l l c ( o o ( , ,k ) l + i - c ( t ) b ( t 一1 ) p ( l l e ( ,k ) l i + - c ( t ) w ( t - 1 ,k + 1 ) - w ( t - 1 ,尼) 卜 y o ,七+ 1 ) 一v ( t ,后) 】i 对不等式两边取极限可推得 ! 鳃,尼+ 1 ) 0 l i m i c ( t ) b ( t 一1 ) 尸( 训k ) l + 舰l l 瓦酏后) j i + :| h m 州vl = 。l i m 。1 i c ( t ) b ( t 一1 ) p o ) 川et ,k ) l l 因为i l ,一c o ) 召。一1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 静脉采血操作课件
- 河道砂石分离方案范本
- 桥梁墩柱修复施工方案
- 电焊专项安全培训
- 廊坊燕京职业技术学院《数字技术综合应用》2023-2024学年第一学期期末试卷
- 重庆幼儿师范高等专科学校《现代食品营养与安全自科类》2023-2024学年第一学期期末试卷
- 西藏大学《课件设计含几何画板》2023-2024学年第二学期期末试卷
- 医院收费监管方案范本
- 长春职业技术学院《油藏工程》2023-2024学年第二学期期末试卷
- 牡丹江医学院《计算机组成原理与系统结构》2023-2024学年第二学期期末试卷
- 考古调查勘探辅助工程方案投标文件(技术方案)
- 2025年法学本科毕业论文评审标准分析
- 电位滴定法课件
- 历年计算机二级MS-Office考试真题题库大全-下(500题)
- 2025年中国防爆型插入式超声波流量计市场调查研究报告
- 污水处理厂运营委托合同
- 鹦鹉可行性研究报告
- 泌尿外科护理新进展
- 环卫保洁服务应急预案
- 2025年广东佛山市高三一模高考政治试卷试题(含答案详解)
- 2024年中国藏语系高级佛学院招聘考试真题
评论
0/150
提交评论