13章迭代学习控制解析

上传人：快*** IP属地：江西上传时间：2022-05-04 格式：PPT 页数：61 大小：1.76MB 积分：12 举报 版权申诉

已阅读5页，还剩56页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、LOGO智能控制理论及应用智能控制理论及应用-第十三章迭代学习控制第十三章迭代学习控制主讲：尚振东主讲：尚振东河南科技大学机电工程学院河南科技大学机电工程学院汇报提纲汇报提纲基本原理基本原理1基本迭代学习控制算法基本迭代学习控制算法2迭代学习控制的关键技术迭代学习控制的关键技术3机械手轨迹跟踪迭代学习控制仿真实例机械手轨迹跟踪迭代学习控制仿真实例4线性时变连续系统迭代学习控制线性时变连续系统迭代学习控制5移动机器人轨迹跟踪迭代学移动机器人轨迹跟踪迭代学习控制习控制6第第11章章迭代学习控制迭代学习控制实际控制中存在一类轨迹跟踪问题，它的控制任务是寻找控制律，使得被控对象输出在有限时间

2、上沿着整个期望轨迹实现零误差轨迹跟踪。这列跟踪问题是具有挑战性的控制问题。人们在处理实际场合中的重复操作任务时，往往依据对象的可重复动态行为与期望行为的差距来调整决策。通过重复操作，使得对象行为与期望行为的配合达到要求。这时，衡量动态行为的指标是某种满意指标。 u t y t0,T 迭代学习控制（迭代学习控制（ILC,Iterative Learning Control）的思）的思想最初由日本学者想最初由日本学者Uchiyama于于1978年提出年提出23，于，于1984年年由由Arimoto等人等人24做出了开创性的研究。这些学者借鉴人们做出了开创性的研究。这些学者借鉴人们在重复过程中追求

3、满意指标达到期望行为的简单原理，成功在重复过程中追求满意指标达到期望行为的简单原理，成功地使得具有强耦合非线性多变量的工业机器人快速高精度地地使得具有强耦合非线性多变量的工业机器人快速高精度地执行轨迹跟踪任务。其基本做法是对于一个在有限时间区间执行轨迹跟踪任务。其基本做法是对于一个在有限时间区间上执行轨迹跟踪任务的机器人，利用前一次或前几次操作时上执行轨迹跟踪任务的机器人，利用前一次或前几次操作时测得的误差信息修正控制输入，使得该重复任务在下一次操测得的误差信息修正控制输入，使得该重复任务在下一次操作过程中做得更好。如此不断重复，直至在整个时间区间上作过程中做得更好。如此不断重复，直至在整个时

4、间区间上输出轨迹跟踪上期望轨迹。输出轨迹跟踪上期望轨迹。迭代学习控制适合于具有重复运动性质的被控对象，迭代学习控制适合于具有重复运动性质的被控对象，通过迭代修正达到某种控制目标的改善。迭代学习控制方通过迭代修正达到某种控制目标的改善。迭代学习控制方法不依赖于系统的精确数学模型，能在给定的时间范围内法不依赖于系统的精确数学模型，能在给定的时间范围内,以非常简单的算法实现不确定性高的非线性强耦合动态系以非常简单的算法实现不确定性高的非线性强耦合动态系统的控制，并高精度跟踪给定期望轨迹，因而一经推出，统的控制，并高精度跟踪给定期望轨迹，因而一经推出，就在运动控制领域得到了广泛的运用。就在运动控制领

5、域得到了广泛的运用。迭代学习控制方法具有很强的工程背景，这些背景包迭代学习控制方法具有很强的工程背景，这些背景包括：执行诸如焊接、喷涂、装配、搬运等重复任务的工业括：执行诸如焊接、喷涂、装配、搬运等重复任务的工业机器人；指令信号为周期函数的伺服系统；数控机床；磁机器人；指令信号为周期函数的伺服系统；数控机床；磁盘光盘驱动系统；机械制造中使用的坐标测量机等。盘光盘驱动系统；机械制造中使用的坐标测量机等。由于迭代学习控制模拟了人脑学习和自我调节的功能，因而由于迭代学习控制模拟了人脑学习和自我调节的功能，因而是一种典型的智能控制方法是一种典型的智能控制方法25。经历了三十多年的发展，迭代。经历了

6、三十多年的发展，迭代学习控制已成为智能控制中具有严格数学描述的一个分支。目前学习控制已成为智能控制中具有严格数学描述的一个分支。目前,迭代学习控制在学习算法、收敛性、鲁棒性、学习速度及工程应迭代学习控制在学习算法、收敛性、鲁棒性、学习速度及工程应用研究上取得了很大的进展。用研究上取得了很大的进展。 11.1 基本原理基本原理设被控对象的动态过程为设被控对象的动态过程为， (11.1)( )( ( ), ( ), )tftt txxu( )( ( ), ( ), )tgtt tyxu 式中，式中，、、分别为系统的状态，输出和输入分别为系统的状态，输出和输入变量，变量，、为适当维数的

7、向量函数，其结构与参数均未知。为适当维数的向量函数，其结构与参数均未知。若期望控制若期望控制存在存在,则迭代学习控制的目标为：给定期望输出则迭代学习控制的目标为：给定期望输出和每次运行的初始状态和每次运行的初始状态 ,要求在给定的时间要求在给定的时间内内,按照按照一定的学习控制算法通过多次重复的运行一定的学习控制算法通过多次重复的运行,使控制输使控制输入入，而系统输出，而系统输出第第k 次运行时，式次运行时，式(11.1) 表示为：表示为： (11.2) 跟踪误差为跟踪误差为 (11.3) nxRmyRruR( )f( )gd( ) tud( ) ty(0)kx0,tTd( )( )

8、kttuud( )( )kttyy( )( ),( ), )kkktftt txxu( )( ),( ), )kkktgtt tyxud( )( )( )kkttteyy 迭代学习控制可分为开环学习和闭环学习。开环学习控制的方法是：第k+1次的控制等于第k次控制再加上第k次输出误差的校正项，即 (11.4) 闭环学习策略是：取第K+1次运行的误差作为学习的修正项，即 (11.5) 式中，L为线性或非线性算子。1( )L( ),( )kkktttuue11( )L( ),( )kkktttuue 11.2 基本迭代学习控制算法基本迭代学习控制算法 Arimoto 等首先给出了线性时变连续系统的

9、等首先给出了线性时变连续系统的D型迭代学习控制型迭代学习控制律律24 (11.6) 式中，式中，为常数增益矩阵。在为常数增益矩阵。在D 型算法的基础上，相继出现了型算法的基础上，相继出现了P 型、型、PI 型、型、PD 型迭代学习控制律。从一般意义来看它们都型迭代学习控制律。从一般意义来看它们都是是PID型迭代学习控制律的特殊形式，型迭代学习控制律的特殊形式，PID迭代学习控制律表示迭代学习控制律表示为为 (11.7) 式中式中, 、、为学习增益矩阵。算法中的误差信息使用称为为学习增益矩阵。算法中的误差信息使用称为开环迭代学习控制，如果使用开环迭代学习控制，如果使用则称为闭环迭代学习控

10、制，如果则称为闭环迭代学习控制，如果同时使用和则称为开闭环迭代学习控制。同时使用和则称为开闭环迭代学习控制。1( )( )( )kkktttuue 1d( )( )( )( )( )tkkkkktttt0uueee 此外，还有高阶迭代学习控制算法、最优迭代学习控制算法、遗忘因此外，还有高阶迭代学习控制算法、最优迭代学习控制算法、遗忘因子迭代学习控制算法和反馈子迭代学习控制算法和反馈-前馈迭代学习控制算法等。前馈迭代学习控制算法等。 11.3 迭代学习控制的关键技术迭代学习控制的关键技术 11.3.1 学习算法的稳定性和收敛性学习算法的稳定性和收敛性稳定性与收敛性问题是研究当学习律与被控系统满

11、足什么条件时，迭稳定性与收敛性问题是研究当学习律与被控系统满足什么条件时，迭代学习控制过程才是稳定收敛的。算法的稳定性保证了随着学习次数的增代学习控制过程才是稳定收敛的。算法的稳定性保证了随着学习次数的增加，控制系统不发散，但是，对于学习控制系统而言，仅仅稳定是没有实加，控制系统不发散，但是，对于学习控制系统而言，仅仅稳定是没有实际意义的，只有使学习过程收敛到真值，才能保证得到的控制为某种意义际意义的，只有使学习过程收敛到真值，才能保证得到的控制为某种意义下最优的控制。收敛是对学习控制的最基本的要求，多数学者在提出新的下最优的控制。收敛是对学习控制的最基本的要求，多数学者在提出新的学习律的同时

12、，基于被控对象的一些假设，给出了收敛的条件。例如，学习律的同时，基于被控对象的一些假设，给出了收敛的条件。例如，Arimoto在最初提出在最初提出PID型学习控制律时，仅针对线性系统在型学习控制律时，仅针对线性系统在D型学习律型学习律下的稳定性和收敛条件作了证明下的稳定性和收敛条件作了证明 11.3.2 初始值问题初始值问题运用迭代学习控制技术设计控制器时，只需要通过重复操作运用迭代学习控制技术设计控制器时，只需要通过重复操作获得的受控对象的误差或误差导数信号。在这种控制技术中，迭获得的受控对象的误差或误差导数信号。在这种控制技术中，迭代学习总要从某初始点开始，初始点指初始状态或初始输出。几

13、代学习总要从某初始点开始，初始点指初始状态或初始输出。几乎所有的收敛性证明都要求初始条件是相同的，解决迭代学习控乎所有的收敛性证明都要求初始条件是相同的，解决迭代学习控制理论中的初始条件问题一直是人们追求的目标之一。目前已提制理论中的初始条件问题一直是人们追求的目标之一。目前已提出的迭代学习控制算法大多数要求被控系统每次运行时的初始状出的迭代学习控制算法大多数要求被控系统每次运行时的初始状态在期望轨迹对应的初始状态上，即满足初始条件：态在期望轨迹对应的初始状态上，即满足初始条件：（11.8）当系统的初始状态不在期望轨迹上，而在期望轨迹某一很小当系统的初始状态不在期望轨迹上，而在期望轨迹某一

14、很小邻域内时，通常把这类问题归结为学习控制的鲁棒性问题研究。邻域内时，通常把这类问题归结为学习控制的鲁棒性问题研究。d(0)(0),0,1,2,kxxk 11.3.3 学习速度问题学习速度问题在迭代学习算法研究中，其收敛条件基本上都是在学习次数在迭代学习算法研究中，其收敛条件基本上都是在学习次数下给出的。而在实际应用场合，学习次数下给出的。而在实际应用场合，学习次数显然是没有显然是没有任何实际意义的。因此，如何使迭代学习过程更快地收敛于期望任何实际意义的。因此，如何使迭代学习过程更快地收敛于期望值是迭代学习控制研究中的另一个重要问题。值是迭代学习控制研究中的另一个重要问题。迭代学习控制

15、本质上是一种前馈控制技术，大部分学习律尽迭代学习控制本质上是一种前馈控制技术，大部分学习律尽管证明了学习收敛的充分条件，但收敛速度还是很慢。可利用多管证明了学习收敛的充分条件，但收敛速度还是很慢。可利用多次学习过程中得到的知识来改进后续学习过程的速度，例如，采次学习过程中得到的知识来改进后续学习过程的速度，例如，采用高阶迭代控制算法、带遗忘因子的学习律、利用当前项或反馈用高阶迭代控制算法、带遗忘因子的学习律、利用当前项或反馈配置等方法来构造学习律，可使收敛速度大大加快。配置等方法来构造学习律，可使收敛速度大大加快。k k 11.3.4 鲁棒性问题鲁棒性问题迭代学习控制理论的提出有浓厚的工程背

16、景，因此仅仅在迭代学习控制理论的提出有浓厚的工程背景，因此仅仅在无干扰条件下讨论收敛性问题是不够的，还应讨论存在各种干无干扰条件下讨论收敛性问题是不够的，还应讨论存在各种干扰的情形下系统的跟踪性能。一个实际运行的迭代学习控制系扰的情形下系统的跟踪性能。一个实际运行的迭代学习控制系统除了存在初始偏移外，还或多或少存在状态扰动、测量噪声、统除了存在初始偏移外，还或多或少存在状态扰动、测量噪声、输入扰动等各种干扰。鲁棒性问题讨论存在各种干扰时迭代学输入扰动等各种干扰。鲁棒性问题讨论存在各种干扰时迭代学习控制系统的跟踪性能。具体地说，一个迭代学习控制系统是习控制系统的跟踪性能。具体地说，一个迭代学习控

17、制系统是鲁棒的，是指系统在各种有界干扰的影响下，其迭代轨迹能收鲁棒的，是指系统在各种有界干扰的影响下，其迭代轨迹能收敛到期望轨迹的邻域内，而当这些干扰消除时，迭代轨迹会收敛到期望轨迹的邻域内，而当这些干扰消除时，迭代轨迹会收敛到期望轨迹。敛到期望轨迹。 11.4 机械手轨迹跟踪迭代学习控制仿真实例机械手轨迹跟踪迭代学习控制仿真实例 11.4.1控制器设计控制器设计考虑一个关节的机器人，其动态性能可以由以下二阶非线性考虑一个关节的机器人，其动态性能可以由以下二阶非线性微分方程描述：微分方程描述：（11.9）式中：式中：为关节角位移量，为关节角位移量，为机器人的惯性矩阵为机器人的惯性矩阵

18、表示离心力和哥氏力，表示离心力和哥氏力，为重力项，为重力项，为控制力矩，为控制力矩，为各种误差和扰动。为各种误差和扰动。设系统所要跟踪的期望轨迹为设系统所要跟踪的期望轨迹为，。系统第。系统第i次输出次输出为为令令。 d, D q qC q q qG qnqR n nD qR,nC q qR nG qRnRdnR dty0,tT ity diittteyy 在学习开始时，系统的初始状态为在学习开始时，系统的初始状态为。学习控制的任务为。学习控制的任务为通过学习控制律设计通过学习控制律设计，使第，使第次运动误差次运动误差减少。减少。采用三种基于反馈的迭代学习控制律：采用

19、三种基于反馈的迭代学习控制律：（1）闭环）闭环D型型（11.10）（2）闭环）闭环PD型：型：（11.11）（3）指数变增益）指数变增益D型：型：（11.12） 00 x 1uit1i 1eit 1dd1kkkttttuuKqq 1pd1dd1kkkkttttttuuKqqKqq 1pd1dd1kkkkttttttuuKqqKqq 11.4.2 仿真实例仿真实例针对二关节机械手，介绍一种机器人针对二关节机械手，介绍一种机器人PD型反型反馈迭代学习控制的仿真设计方法。针对二关节机馈迭代学习控制的仿真设计方法。针对二关节机器人控制系统式（器人控制系统式（11.9），各项表示为：），各

20、项表示为： 2 2ijdD2221111212122122coscccdd ldlll lqII21221221222cosccdddll lql222222cdd lI2 2ijcC112chq1212chqhq211chq 220c2 122sinchm l lq T12GGG 干扰项为干扰项为机器人系统参数为机器人系统参数为，，，采用三种闭环迭代学习控制律，其中采用三种闭环迭代学习控制律，其中为为D型迭代学习控制，型迭代学习控制，为为PD型迭代学习控制，型迭代学习控制，为变增益指数为变增益指数D型迭代学习控制。型迭代学习控制。两个关节的位置指令分别为两个关节的位置指令分

21、别为和和，为了保证被控对象，为了保证被控对象初始输出与指令初值一致，取被控对象的初始状态初始输出与指令初值一致，取被控对象的初始状态为为。取。取PD型迭代学习控制，即型迭代学习控制，即，仿真结，仿真结果如图果如图11-1至图至图11-3所示。所示。1112 112212gcosgcosccGd ld lqd lqq22212gcoscGd lqqTd0.3sin0.1 1 ett121 kgdd120.5mll120.25mccll2120.1 kg mII29.81 m/sg 1M 2M 3M sin(3 ) tcos(3 ) t T00310 x3M 图图1111-1 20 20次

22、迭代学习的次迭代学习的跟踪过程跟踪过程图图11-2 第第20次迭代学习次迭代学习的位置跟踪的位置跟踪图图1111-3 20 20次迭代过程中误差范次迭代过程中误差范数的收敛过程数的收敛过程 11.5 线性时变连续系统迭代学习控制线性时变连续系统迭代学习控制 11.5.1 系统描述系统描述 Arimoto等等24给出了线性时变连续系统给出了线性时变连续系统（11.13）的开环的开环PID型迭代学习控制律：型迭代学习控制律：（11.14）其中其中，，为学习增益矩阵。为学习增益矩阵。 ttttttttxAxBuyCx 1dddkkktttttuuLeL 11.5.2 控制器设计及收敛性

23、分析控制器设计及收敛性分析定理定理1 若由式（若由式（11.13）和式（）和式（11.14）式描述的系统满足如下条）式描述的系统满足如下条件件24：（1）；（2）每次迭代初始条件一致，即）每次迭代初始条件一致，即则当则当时，有时，有，。证明：证明：由式（由式（11.13）及条件式（）及条件式（2）得）得则则，即系统满足初始条件。，即系统满足初始条件。 1tttICB 00d01,2,3,00 xxyykkk dyyktt0,tT 110000yCxCxykkkk 000,1,2,kke 非齐次一阶线性微分方程非齐次一阶线性微分方程的的解为：解为：取取，则，则由于由于

24、，，则，则 tttttxAxBu 000000expdexpdexpd dexpexpexpdexpexpdtttttttttt xCAABuACAABuACAABu,expttA 110,dtkkkktttxxBuu deyykkttt 1d1eyykkttt 11110,deeyyCxxCBuukkkkkktkkttttttttt 即将PID型控制律式（11.14）代入上式，则第k+1次输出的误差为：（11.15）利用分部积分公式，令，有（11.16）将式（11.16）代入式（11.15），得（11.17） 110,deeCBuutkkkktttt 100,ddeeCBeL

25、eetkkkkktttt ,GCBtt 0000d,d,dtttkkktkktttttCBeGeGeCBeGe 1000 0,d,d,d deI CBeGeCBLeCBetkkkttkktttttttttt 将式（11.17）两端取范数，有（11.18）式中根据范数的定义可知，函数范数为。将式（11.18）两端同乘以，，并考虑到有 1000 01200 0,d,d,d ddd deI CBeGeCBLeCBeI CBeeetkkkttkkttkkkttttttttttttttbb 1,0,0,maxsup, sup,tTtTbtttGCBL 2,0,sup,CBtTbtt:

26、0,nfTR 0supett Tff t expt00exp1expdtt （11.19）根据根据范数的定义，函数范数的定义，函数的范数的范数为：为：由于由于，，，则有，则有。将式（将式（11.19）的结果应用于下式，得：）的结果应用于下式，得： 1110001111expdexpexpexpdexpexpd1 expexp1expexpexp11 exptttkkkkkkktbtbbtttbbtttbTbeeeeeee: 0,nfTR 0suptt Tff te 0,tT 0,t 0, kkee其中。即（11.20） 22000020202022expd dexpexpe

27、xpd d1 expexpexpd1 expexpexpd1 expexpexpd1 expexp1exp1 exp1 exttkktktktkkktbtbTtbTbtTbtTtbtTb eeeeeee 22p1 expktTbe1 exp1 exp0tT 222001 expexpd dtkkTtbb ee 则（则（11.19）和（）和（11.20）代入（）代入（11.18），得），得（11.21）其中其中。由于。由于，则当，则当取足够大取足够大时，可以时，可以使使。因此因此。定理得证。定理得证。如果将控制律式（如果将控制律式（11.14）中的）中的改为改为，则为闭环

28、，则为闭环PID型迭代学习控制律。同定理型迭代学习控制律。同定理1的证明过程，可证明闭环的证明过程，可证明闭环PID迭代迭代学习控制律。学习控制律。1eekk 2121 exp1 expTTbb11lim0ekk e k1e k 11.5.3 仿真实例仿真实例考虑考虑2输入输入2输出线性系统：输出线性系统：期望跟踪轨迹为期望跟踪轨迹为 11122223111101x tx tu txtxtut 11222001y tx tytxt 1d2dsin(3 )cos(3 )ytttyt0,1t 由于由于，取，取，可满足定理，可满足定理1中的条中的条件（件（1），在控制律式（），在控制律式（1

29、1.14）中）中取取，，系统的初始状态为，系统的初始状态为。在在chap11_2sim.mdl程序中，选择程序中，选择Simulink的的Manual Switch开关，将开关向下，取开关，将开关向下，取PD型开环型开环迭代学习控制律，仿真结果见图迭代学习控制律，仿真结果见图11-4至至11-6所示。所示。将开关向上，采用将开关向上，采用PD型闭环迭代学习控制律，仿型闭环迭代学习控制律，仿真结果见图真结果见图11-7至至11-9所示。可见，闭环收敛速所示。可见，闭环收敛速度好于开环收敛速度。度好于开环收敛速度。2201CB0.95000.952.0002.0L0 1 02 00010

30、xx 图图11-4 30次迭代学习的跟踪过次迭代学习的跟踪过程程（开环（开环PD控制）控制）图图11-5 第第30次迭代学习次迭代学习的位置跟踪（开环的位置跟踪（开环PD控控制制）图图11-6 30次迭代过程中误次迭代过程中误差最大绝对值的收敛过程差最大绝对值的收敛过程（开环（开环PD控制）控制）图图11-7 30次迭代学习的次迭代学习的跟踪过程（闭环跟踪过程（闭环PD控制）控制）图图11-8 第第30次迭代学习次迭代学习的位置跟踪（闭环的位置跟踪（闭环PD控控制）制）图图11-9 30次迭代过程中误次迭代过程中误差最大绝对值的收敛过程差最大绝对值的收敛过程（闭环（闭环PD控制）控制） 11.

31、6 移动机器人轨迹跟踪迭代学习控制移动机器人轨迹跟踪迭代学习控制移动机器人是一种在复杂的环境下工作的具有自规划、自移动机器人是一种在复杂的环境下工作的具有自规划、自组织、自适应能力的机器人。在移动机器人的相关技术研究中，组织、自适应能力的机器人。在移动机器人的相关技术研究中，控制技术是其核心技术，也是其实现真正的智能化和完全的自控制技术是其核心技术，也是其实现真正的智能化和完全的自主移动的关键技术。移动机器人具有时变、强耦合和非线性的主移动的关键技术。移动机器人具有时变、强耦合和非线性的动力学特征，由于测量和建模的不精确，加上负载的变化以及动力学特征，由于测量和建模的不精确，加上负载的变化以

32、及外部扰动的影响，实际上无法得到移动机器人精确、完整的运外部扰动的影响，实际上无法得到移动机器人精确、完整的运动模型。动模型。v 通过对文通过对文27的控制方法进行详细推导及仿真分析，研究一类的控制方法进行详细推导及仿真分析，研究一类移动机器人迭代学习离散控制的设计及仿真方法。移动机器人迭代学习离散控制的设计及仿真方法。 11.6.1 数学基础数学基础代表代表N维欧氏空间，定义向量范数为：维欧氏空间，定义向量范数为：（11.22) 其中其中为为( )阶实数矩阵，定义矩阵范数为：阶实数矩阵，定义矩阵范数为：（11.23) 其中其中为矩阵的最大特征值。为矩阵的最大特征值。取取， , ，

33、定义范数为：，定义范数为：（11.2411.24)nR1/2Tzz znRzp mRCpmT|maxCC C max1,Nndizzz, ,zq u y 1| ( ), 1supkk Nkzz:z NR 11.6.2 系统描述系统描述图图11-10为移动机器人运动模型，它在同一根轴上有两为移动机器人运动模型，它在同一根轴上有两个独立的推进轮，机器人在二维空间移动，点代表机器个独立的推进轮，机器人在二维空间移动，点代表机器人的当前位置，广义坐标定义为，和为直角坐标系下的人的当前位置，广义坐标定义为，和为直角坐标系下的坐标，为机器人的方位角。当机器人的标定方向为地理坐标，为机器人的方位角。当机

34、器人的标定方向为地理坐标系的横轴正半轴时，定义为坐标系的横轴正半轴时，定义为0。移动机器人受不完。移动机器人受不完全约束的影响而只能在驱动轮轴的方向运动，点的线速全约束的影响而只能在驱动轮轴的方向运动，点的线速度和角速度定义为和。度和角速度定义为和。图图11-10 移动机器人运移动机器人运动模型动模型根据图根据图11-10，针对，针对P点，移动机器人的离散运动学方程可由下式点，移动机器人的离散运动学方程可由下式描述描述v （11.25）其中其中为采样时间，机器人状态向量为为采样时间，机器人状态向量为，速度向量为速度向量为。式（式（11.25）可写为：）可写为：（11.26）其

35、中其中v （11.27）pppppppppp(1)( )cos( )0( )(1)( )sin( )0( )(1)( )01x kx kkv ky ky kTkkkkTTppp( )( ),( ),( )kx ky kkqTppp( )( ),( )kv kkup(1)( )( ( ), )( )kkkkkqqB qupppcos( )0( ), )sin( )001kk kTk B q 如图如图11-10所示，期望轨迹为所示，期望轨迹为。运。运动轨迹跟踪的控制问题就是为确定动轨迹跟踪的控制问题就是为确定，使，使跟跟踪踪。线速度和角速度误差分别为：线速度和角速度误差分别为：（11.

36、28）（11.29）移动机器人迭代学习控制系统结构如图移动机器人迭代学习控制系统结构如图11-11所示。所示。dddd( )( ),( ),( ) , 1kx ky kkknpT( )( ),( )kv kku( )P kd( )P k pv kvkv kp( )( )( )kkk 图图11-11 移动机器人迭代学习控制系统结构移动机器人迭代学习控制系统结构移动机器人离散运动学方程可描述如下：移动机器人离散运动学方程可描述如下：（11.30) （11.31)(1)( )( ( ), ) ( )( ),kkkkkkqqB qu( )( )( )kkkyq其中其中为状态干扰，为状态干扰，

37、为输出测量噪声，为输出测量噪声，为为系统输出，系统输出，。考虑迭代过程，由（考虑迭代过程，由（11.30）和（）和（11.31）可得：）可得：（11.32）（11.33）其中其中为迭代次数，为迭代次数，为离散时间，为离散时间，。，分别代表第分别代表第次迭代的状态、输入、输出、状态干扰和输出噪声。次迭代的状态、输入、输出、状态干扰和输出噪声。机器人运动方程（机器人运动方程（11.32）和（）和（11.33）满足下列性质和假设：）满足下列性质和假设：性质性质1：考虑理想情况，取：考虑理想情况，取均为零，均为零，，则期望轨迹的，则期望轨迹的方程可写为方程可写为（11.

38、34）（11.35）( )k( )kT( )( ), ( ), ( )kx ky kky( )( ),( )kv kkTu(1)( )( ), )( )( ),iiiiikkk kkkqqB qu( )( )( )iiikkkyqik1,kn( )ikq( ),( ),( ),( )iiiikkkkuyi( ),( )iikkkNdddd(1)( )(q ( ), )( ),kkk kkqqBudd( )( ),kkyq 性质性质2：矩阵函数满足：矩阵函数满足Lipschitz条件：条件：，，为正常数为正常数（11.36）性质性质3：矩阵：矩阵是有界的是有界的 , ,为正常数，矩

39、为正常数，矩阵阵为为的满秩矩阵。的满秩矩阵。假设假设1: ；假设假设2：干扰和噪声有界：干扰和噪声有界（11.37）其中其中，为正常数。为正常数。假设假设3：在每一次迭代中，轨迹都是从：在每一次迭代中，轨迹都是从的邻域开始，即的邻域开始，即，，。12B12|(, )(, )|kkcB qB qqqkNBc( ( ), )iq k kBB|( ), )|ik kbB q( ), )ik kB q( ), )ik kqddu1max |( )|k nkb u11 k n11 k nmax max |( )| ,max max |( )|iiiikbkb bbd(0)q0d

40、q|(0)(0)|ibqq0q0b1i 11.6.3 控制律设计及收敛性分析控制律设计及收敛性分析迭代学习控制律设计为：迭代学习控制律设计为：（11.38）对于第对于第i次迭代，跟踪误差信号为次迭代，跟踪误差信号为，和和为学习的增益矩阵，满为学习的增益矩阵，满足足，，，，。通过控制律（通过控制律（11.38），使状态变量），使状态变量、控制输入、控制输入、系、系统输出统输出分别收敛于期望值。分别收敛于期望值。1121( )( )( ) (1)( )( )iiiikkkkkkuuLeLed( )( )( )iikkkeyy1( )kL2( )kL11L|( )|kb

41、L22L|( )|kbLkN1L0b2L0b( )ikq( )iku( )iky 定理定理 1：考虑离散系统（：考虑离散系统（11.32）和（）和（11.33），满足假设），满足假设1-3，采用控制律（采用控制律（11.38），则），则（11.39）对于所有对于所有都成立。如果忽略状态干扰，输出噪声和都成立。如果忽略状态干扰，输出噪声和初始状态误差（即初始状态误差（即），则分别收敛于期望值。如果），则分别收敛于期望值。如果考虑干扰、噪声和误差的存在，则考虑干扰、噪声和误差的存在，则，，有界，且收敛于有界，且收敛于的函数。的函数。证明：证明：由式由式（11.3411.34）和）

42、和（11.3211.32）得：）得： 1|( ) (, )|1ikkILB q(, )nikRNq0q0bbbd|( )( )|ikkuud|( )( )|ikkqqd|( )( )|ikkyy0q,b b b （11.40）考虑性质考虑性质2和和3及假设及假设1和和2，得，得令令，则，则对上式进行递推并考虑假设对上式进行递推并考虑假设3，得：，得：（11.41） dddddddddd111,iiiiiiiiiiiiiiikkkkkkkkkkkkkkkkq kkkkkkkkkkkkkkkkqqqqB quqB quqB quBuuuqB qB quB qu dBuB1iiiikkc

43、bkbkbqqqud2Bu1hc b 2B1iiikhkbkbqqu 0112B2q0kkjkiijkhbjbh b quv由（11.38）式得：1d1d1211d2d11d2d111dd( )( )( )( )( )( ) (1)( )( )( )( )(1)(1)( )( )( )( )( )(1)(1)(1)( )( )( )( )( )( )( )( ), )iiiiiiiiiiiiiikkkkkkkkkkkkkkkkkkkkkkkkkkkkk kuuuuuLeLeuLyyLyyuLqqLqquLqB qud121111dddd112111( )( )( ), )( ) ( )( )(

44、1)( )( )(1)( )( )( )( )( ), )( )( ), )( )( )( ) ( )( )( )( )( )(1)( )(iiiiiiiiiiiiiiiikkk kkkkkkkkkkkkk kkk kkkkkkkkkkkkqB quLLquLqLB quB quuuLLquL11dd211121111dd211)( )( ) ( ), )( )( )( ), )( ( ), )( ) ( )( )( )( )( )( )( )( ) ( ), )( )( )( )( )( ), )( ), )( ) ( )( )( )iiiiiiiiiiiiikkk kkkk kq k kk

45、kkkkkkkkk kkkkkk kk kkkkkqLB quLB qBuLqLLILB quLqLB qB quLqL121( )( )( )( )iiikkkkL 利用性质2和假设2，得v 令，，则将（11.39）和（11.41）代入上式，得11d21211LLBuL1LL( )( ) ( ), )( )( )( )( )()iiiiiikkk kkbkb c bkbkbbbb buILB quqqq1d11LBuL2(1)hbc bb h121LL()bbbbb b2111L11( )( ) ( ), )( )( )( )iiiiikkk kkhkbkbuILB quqq02011

46、112B2011L2B12q10( )( )( )( )kkjkiiiqjkkjkijkkhhbjbh bbhbjbh bb uuuu 因此上式两端同乘，取范数，得20211112112B011L2B10( )( )( )( )kkkjiiLqijkkjijkkhbh bbhhbjbbhbjb uuuu202211Lq11121B011L2B1011( )( )()111( )11( )kkkiikjkjjkijkjjkijhkkhbbhhbbjbbhbjb uuuujv取，得2max 1,h202202111211q1B011L2B10121q1B2L2B1()()1/()()1/()kjkiiLijkjkijniLinihhhbbbbbbhbbhhhbbbbbhbhbb uuuuuuu2202222B 1BL11Lq1221L221/1/|()1/nniinhhhb hb bhbbbhhbhbhhuu 即（11.42）v 其中，根据等比数列有（11.43）v 。22

人人文库> 全部分类> 教育资料 > 课设设计

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

13章迭代学习控制解析

文档简介

温馨提示

最新文档

评论

13章迭代学习控制解析

文档简介

温馨提示

最新文档

评论

相关文档