(运筹学与控制论专业论文)满足一致lipschitz条件的最优反馈控制问题.pdf_第1页
(运筹学与控制论专业论文)满足一致lipschitz条件的最优反馈控制问题.pdf_第2页
(运筹学与控制论专业论文)满足一致lipschitz条件的最优反馈控制问题.pdf_第3页
(运筹学与控制论专业论文)满足一致lipschitz条件的最优反馈控制问题.pdf_第4页
(运筹学与控制论专业论文)满足一致lipschitz条件的最优反馈控制问题.pdf_第5页
已阅读5页,还剩69页未读 继续免费阅读

(运筹学与控制论专业论文)满足一致lipschitz条件的最优反馈控制问题.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

满足一致l i p s c h i t z 条件的最优反馈控制问题 摘 要 本文研究满足一致l i p s c h i t z 条件的最优反馈控制问题在控制理论中,通常 将控制类分成开环控制和闭环控制两个大类对于开环控制的研究,在最优控制理 论中已经有了p o n t r y a g i n 最大值原理这个有效的工具,它提供了最优开环控制的一 个必要条件即,在最优开环控制作用下的最优轨线与其共轭变量之间的存在某种 联系,据此我们可以刻画最优开环控制( 或是筛选出可能的最优开环控制) 相对而 言,闭环控制多运用于对控制系统的能稳性研究,而在最优控制理论的研究就比较 少究其原因,闭环的最优控制问题要求找一个闭环控制,使得这个闭环控制对于 任意在给定区域内的初始条件( 即初始时刻及初始状态) 下的控制系统是一致最优 的通俗地讲,开环的最优控制问题是个单目标问题,而闭环的最优控制问题则是 个多目标问题特别地,对于带约束的闭环控制集,如何去讨论其值函数,进而求 出闭环的最优控制,在这方面我们还没有足够的认识为此,我们先研究一类特殊 的闭环控制;反馈控制( 控制只是时间与状态的函数) 根据常微分方程的理论,为 了保证受控系统方程解的存在唯一性,自然要求反馈控制关于状态变量是l i p s c h i t z 的本文就讨论满足一致l i p s c h i t z 条件的最优反馈控制问题 文章在线性二次控制问题的框架下,由开环控制与闭环控制之间的联系,用夹 逼准则得出了满足k - l i p s c h i t z 条件的反馈控制问题的值函数,它有别于通常开环最 优控制问题的值函数通过对这个值函数的讨论,我们给出了满足一致l i p s c h i t z 条 件的最优反馈控制存在的一个必要条件,即最优反馈控制必为线性反馈再通过对 带约束的线性最优反馈控制问题的讨论,得到满足一致l i p s c h i t z 条件的最优反馈控 制存在的充分必要条件,并给出了最优反馈控制具体的表达式最后在一个更广的 反馈控制集: 川兰h 中得到非线性最优反馈控制问题解的存在唯一性 关键词:反馈控制,最优控制,l i p s c h i t z 条件,线性二次问题,状态控制约束 中图分类号;0 2 3 2 u n i f o r m l yl i p s c h i t zo p t i m a lf e e d b a c k c o n t r o lp r o b l e m s a b s t r a c t t h ep r e s e n tp h d d i s s e r t a t i o ni sc o n c e r n e dw i t hu n i f o r m l yl i p s c h i t zo p t i m a lf e e d - b a c kc o n t r o lp r o b l e m s i nm a t h e m a t i c a lc o n t r o lt h e o r y , t h e r ea r et w ok i n d so fc o n t r o l l a w s :o p e n - l o o pc o n t r o l sa n dc l o s e d l o o pc o n t r o l s i nt h es t u d yo fo p e n - l o o po p t i m a l c o n t r o lp r o b l e m s ,au s e f u lt o o ti st h es o - c a l l e d “p o n t r y a g i n sm a x i m u m p r i n c i p l e w h i c h g i v e sas e to fn e c e s s a r yc o n d i t i o n st oo p t i m a io p e n - l o o pc o n t r o l s m o r ep r e c i s e l y , i tr e - v e a l sar e l a t i o n s h i pa m o n gt h eo p t i m a lc o n t r o l ,t h ec o r r e s p o n d i n go p t i m a lt r a j e c t o r ya n d i t sa d j o i n tv a r i a b l e ,b yw h i c ho n ec a l lo b t a i nar e p r e s e n t a t i o no fo p t i m a lo p e n l o o pc o n t r o i si ns o m es e n s e o nt h eo t h e rh a n d ,c l o s e d l o o pc o n t r o l sa r eu s u a l l yu s e dt os t u d y t h es t a b i l i z a b i l i t yo ft h eg i v e nc o n t r o l l e ds y s t e m ,a n dn o tv e r yo f t e nt ob eu s e di nt h e o p t i m a lc o n t r o lt h e o r y t h i si sb e c a u s et h a tt h eg i v e no p t i m a lc l o s e d l o o pc o n t r o lm u s t b eu n i f o r m l yo p t i m a lf o ra n yi n i t i a lc o n d i t i o n ( i n i t i a lt i m ea n di n i t i a ls t a t e ) b e l o n g i n g t oag i v e nr e g i o n h e n c e ,r o u g h l ys p e a k i n g ,a no p e n - l o o po p t i m a lc o n t r o lp r o b l e mi so f s i n g l e - o b j e c t i v e ,w h i l eac l o s e d - l o o po p t i m a lc o n t r o lp r o b l e mi so fm u l t i o b j e c t i v et oo u r b e s tk n o w l e d g e ,t h ei n v e s t i g a t i o no nh o wt od e s c r i b et h ec o r r e s p o n d i n gv a l u ef u n c t i o na n d h o wt oo b t a i no p t i m a lf e e d b a c kc o n t r o l sa r ef a rf r o mc o m p l e t e i nt h i st h e s i s w es t u d ya s p e c i a lc a s eo fc l o s e d - l o o pc o n t r o l s :f e e d b a c kc o n t r o l ,w h i c hi saf u n c t i o nj u s td e p e n d i n g o nt h et i m ev a r i a b l ea n dt h ec u r r e n ts t a t ev a r i a b l e t oe n s u r et h ee x i s t e n c ea n du n i q u e - n e s so ft h es t a t et r a j e c t o r yt ot h ec o n t r o l l e ds y s t e m i ti su s u a l l yr e q u i r e dt h a taf e e d b a c k c o n t r o li su n i f o r m l yl i p s c h i t zw i t hr e s p e c tt ot h es t a t ev a r i a b l e t h e r e f o r e ,t h i st h e s i si s d e v o t e dt os t u d yu n i f o r m l yl i p s c h i t zo p t i m a lf e e d b a c kc o n t r o lp r o b l e m s t h ep r o b l e mi sd i s c u s s e di nal i n e a r q u a d r a t i cf r a m e w o r k b yt h er e l a t i o n s h i pb e - t w e e no p e n - l o o pc o n t r o lp r o b l e ma n df e e d b a c kc o n t r o lp r o b l e m ,w eo b t a i nt h ev a l u ef u n c - t i o no ft h ec o n s i d e r e do p t i m a lc o n t r o lp r o b l e m ,w h i c hi sd i f f e r e n tf r o mt h a to ft h ec l a s s i c a l o p e n l o o po p t i m a lc o n t r o lp r o b l e m f u r t h e r ,w ed e r i v ean e c e s s a r yc o n d i t i o nt ot h ee x i s t e n c eo fo p t i m a ls o l u t i o n s :o p t i m a lf e e d b a c kc o n t r o l sm u s tb el i n e a r t h u st h eo r 蟛n a l p r o b l e ml e a d st oal i n e a ro p t i m a lf e e d b a c kc o n t r o lp r o b l e mw i t hc o n s t r a i n e df e e d b a c k m a t r i xb y s o l v i n gt h i sp r o b l e m w ep r e s e n tas 1 2 m c i e n ta n dn e c e s s a r yc o n d i t i o nt ot h ee x - i s t e n c eo fa no p t i m a ll i n e a rf e e d b a c k f i n a l l y , t h er e s u l t sa r ea l s oo b t a i n e di na ne x t e n d e d f e e d b a c kc o n t r o ls e tl u i k 蚓 k e y w o r d s : f e e d b a c kc o n t r o l ,o p t i m a lc o n t r o l ,l i p s c h i t zc o n d i t i o n ,l i n e a rq u a d r a t i c p r o b l e m ,s t a t e - c o n t o lc o n s t r a i n t s c h i n e s el i b r a r yc l a s s i f i c a t i o n :0 2 3 2 o 第一章绪论 1 1无约束线性二次反馈最优控制问题的回顾 我们先回顾经典的线性二次最优控制问题( 简记为l q 问题) 考虑以下的受 控系统 雪s ? = a ( 5 ) 掣( 8 ) + b ( 5 ) u ( 5 ) ,8 p ,t 】,( 1 1 1 ) iy ( t ) = z , 、 其中( ) 是取值于r “的状态变量,。酣是初始状态,t f o ,t ) 是初始时 刻,u ( ) 是取值于l 2 ( t ,t ;r ”) ( 即为在 t ,t i 上取值于r m 的平方可积函数) 的 控制变量,a ( ) g ( 0 t 1 ;r “) ( 即为在【o ,t 】上取值于r “。“的连续函数) 且 口( ) g ( o ,卅;r ) 性能指标定义为 j ( t ,。;“( ) ) = 【( q ( s ) ( s ) ,g ( s ) ) + ( r ( s ) u ( s ) ,“( s ) ) 】d s + ( m y ( t ) ,g ( t ) ) , ( 1 1 2 ) 这里q ( ) = q ( ) t e ( o ,t 】;r “。“) ,r ( ) = r ( ) t g ( 【o ,卅;r m 。m ) 且m = m 7 形“则经典的线性二次最优控制问题是 问题( l q ) 对于给定的( ,z ) 0 ,t ) 舯,我,。( ) l 2 ( t ,t ;r ”) 使得 m 。矿( ) ) _ 非珊i n f t ;r 。) j ( t , x 川) ! 砘z ) , ( 11 3 ) 成立,称满足( 1 1 3 ) 的彳,。( ) l 2 ( t ,t ;r ,) 是一个开环最优控制称由( 1 1 3 ) 给出 的函数v : 0 ,卅r “一r 是问题( l q ) 的开环值函数,此处我们定义 v ( t ,z ) = ( m z ,茁) , v 。r ” 这里需要说明的是开环最优控制n t t , x ( ) 是依赖于初始条件( t ,z ) 的 线性二次最优控制理论已经发展成熟( 【1 【2 0 】) ,在工程和其它多个领域都有着 广泛的应用经典的线性二次最优控制理论表明:如果下述条件满足, q ( s ) 0 ,n ( s ) 5 i ,v s 【0 ,卅,m 0 ,( 1 14 ) ip b ) + p ( s ) a ( s ) + ( s ) 7 p 扣) + 日( s ) 一1 p ( 5 ) b ( 5 ) 矗扣) 一1 丑( ,) 7 尸( # ) = 0 , s ( 0 ,列, t 1l5 ) lp ( t ) = m , 鳓。荆一1 刖7 荆,85 7 、 垂。= 9 ( 口) = a ( s ) y l ( ) 。( ,t ;n ) ,( s ,) l o ,即x 群。 蜘) 刊巾) ( s ) 刖蹴难心习t( 1 1 9 ) lg ( ) = 。, ”7 7 ( 。,邓( ,) 卜z 恻8 m 8 ) 口( 5 ) ) + ( 剐8 ) ( 咖o ) ,耳训如f 1 1 1 0 1 2 m 。肌,) ) - “i n 膨f j ( ,。;毗) ) 5 眦。) ,v ( 。,。) 6 】。舯,( 1 1 1 1 ) 定义的函数矿: o ,t 】r “一r 称为线性反馈问题( l q ) 。的闭环值函数 数矿( ,) 满足如下的h a m i l t o n j a c o b i - b e l l m a n n 方程( 简称h j b 方程) , p 甸意鬟r 巩( t ) 坤k x 群k x 0 吣t 北旧t 1 嘲 1 + ( q ( ) z ,z ) + ( , ) = ,v ( ,z ) 【o ,】畔, 【1 1 1 2 ) lv ( t ,$ ) = ( m x ,z ) p ( t ,z ) = v ( t ,z ) = ( p ( t ) z ,z ) ,v ( t ,z ) h t 】r “ ( t ,z ) 三 膏r ? 。“l( 1 7 。( t ,。) ,以( t ) + b ( t ) k x ) + ( q ( t ) z ,。) + ( r ( t ) 膏。,膏z ) ( 瓦( ,。) ,a ( t ) + b ( t ) k x ) ( 1 1 1 3 ) u ( t ,z ) = k ( t ) xl ( t ) k ( ,z ) 对每个t 0 ,卅,从集值函数苊( ,) 中选取唯一的 霄( t ) = 一只( t ) 一1 b t ( ) p ( t ) ( t ,z ) ,v ( t ,z ) 0 ,明r ”, 3 命题1 1 设条件( 1 1 4 ) 成立则r i c c a t i 方程( 1 1 5 ) 存在唯一解p ( ) ,且对于 任意的( ,z ) 0 ,t 】r “,问题( l q ) 存在唯一的最优控制i 抽( ) ,并由此提供了一个 闭环表示( 1 1 6 ) 如果我们定义 乒( s ,y ) = - n ( s ) _ 1 b ( s ) ip ( s ) y ,( s ,y ) o ,卅,( 1 1 1 4 ) 那么事( ,) 西。且它是问题( l q ) 。的一个最优控制并且, ( s ,y ) = i 5 “( s ) ,v ( s ,) 0 ,卅酣( 1 11 5 ) 进一步,( 1 1 1 4 ) 是问题( l q ) 。唯一的最优控制 上面的结果告诉我们开环最优控制存在一个闭环表示,且由它可以导出一个闭 环最优控制相反,任意的闭环线性反馈最优控制可以由它导出一个开环最优控制 1 2满足k - l i p s c h i t z 条件的最优反馈控制问题的提出 现在我们引入满足k - l i p s c h i t z 条件的反馈控制集- - 吼l 反馈控制妒( ,) - - 吼l 当 且仅当妒( ,) : o ,司p r t “满足 j 妒( s ,z ) 一妒( s ,掣) l 七i z 一i s 【0 ,t 】,x ,y r “,( 1 2 1 ) 且对于任意的z ,函数妒( ,z ) 是l e b e s g u e 可测的上述类型控制的提出基于如 下理由人们在设计自动控制装置时,往往希望它呈状态反馈形式由于实际控制 装置的能力是有限的,因此,对于( 观测) 状态的增量,控制至多能作出成比例的反 应增量因此,假定反馈控制关于状态的相应l i p s c h i t z 常数有界是自然的另外一 方面,从数学角度讲,这样的条件自然地保证了状态方程解的存在唯一性,以便进 一步讨论控制问题这样的考虑与k r a s o v s k i i 和s u b b o t i n 的所谓“位置微分对策” ( p o s i t i o n a ld i f f e r e n t i a lg a m e s ) 有异曲同工之处( 【2 1 ) 不过后者为了定义状态方程的 解,称之为“运动”( m o t i o n ) ,人们不得不引入时滞使得状态方程有唯一解,然后 再令时滞趋于0 ,获得( 不具唯一陛的) 运动显然,我们的方式更自然一些,数学 上的处理也更便利一些我们注意到,除了k r a s o v s k i i 和s u b b o t i n 的“位置微分对 策”,现有关于微分对策的文献中,几乎都只能讨论博弈者对策集不平等的情形( 由 于这不平等导致数学上处理的便利) ( 【3 8 ) 而唯一讨论对策集平等的k r a s o v s k i i 和 s u b b o t i n 的。位置微分对策”,由于对于运动定义的繁琐和不唯一陛,使得深入的 4 讨论难以开展我们这里引入的控制集合有希望在闭环微分对策理论中产生重要影 响,b a r r o n ,e v a n s ,和j e n s e n 就是利用开环的一致l i p s c h i t z 控制来研究开环的微分 对策问题( 【4 - 【6 ) 进一步的讨论将会在以后的研究中展开 现在考虑受控系统 j = a ( 3 ) ( 8 ) + b ( 8 ) 妒( s ,g ( s ) ) ,8 5i t , 卅, ( 1 删 l 掣( t ) = z 而定义性能指标为 j ( t ,z ;妒( ,) ) = ,1 ( q ( s ) g ( s ) ,y ( s ) ) + ( 妒( s ,9 ( s ) ) ,兄( s ) 妒( s ,9 ( s ) ) ) d s( 12 3 ) + ( m y ( t ) ,”( r ) ) 对于任意的妒( ) - - 吼l ,状态方程( 1 22 ) 在此反馈控制作用下的解是存在且唯一的 ( 2 1 ) ,而性能指标j 也是适定的 若令 k 。= s u pi l r 一1 ( t ) b ( t ) 7 e ( t ) l l ,( 1 2 4 ) t 6 p ,卅 则当k ( 0 ,k 。) 时,由( 1 11 4 ) 给出的线性反馈控制9 ( ,) 不再属于磁所以,当 k ( 0 ,k 。) 时,满足k - l i p s c h i t z 最优反馈控制问题的研究决不是平凡的 注意到初始状态为0 时,开环控制i ( ) = 0 是唯一达到性能指标的下确界0 的控制,从而是唯一的最优控制所以,我们可以对控制集磁再加一个约束条件 妒( - ,0 ) = 0 即我们要讨论的是如下满足k - l i p s c h i t z 条件的反馈控制集 圣 = 妒( ,) - - 虫l kl 妒( s ,o ) = o ,vs i o , t 1 ) ( 1 2 5 ) 我们现在提出满足k - l i p s c h i t z 条件的最优反馈控制问题 问题( l l 对于任意给定的k ( 0 ,k ) ,找出反馈控制庐( ,) 由 ,使得 j ( t ,。;事( ,) ) =i n f ,j ( t ,z ;妒( ,) ) jv 0 ,z ) ,v ( t ,z ) 【0 ,t i r “ ( 1 2 6 ) f ( ,) o 称由( 1 2 6 ) 定义的函数伊( ,) 为问题( l q ) 的值函数为了记号的方便,以 后我们仅考虑r = j 的情形 在线性二次框架下,带约束的开环控制有逐段常值约束( 2 6 ) ,能量约束( 【1 2 ) , 控制的线性约束( 【8 1 ) ,状态约束( 【1 5 ,【16 1 ) ,路径约束( ( 2 4 1 , 3 3 1 ) ,状态与控制的线性不 5 等式约束( 【1 l 】,1 1 9 ,1 3 2 ) ,二次约束( 【2 5 ) 等等而对于带约束的最优反馈控制问题的 研究就比较少,通常用所谓的“综合方法”将一族对应于不同初始条件的最优开环 控制来生成一个最优的反馈控制对于现在研究的问题( l q ) l ,如何构造一族对应 于不同初始条件的最优开环控制问题,使得由最优开环控制族生成的反馈控制满足 一致l i p s c h i t z 条件则是主要的困难在一类特定的随机受控系统中,h a u s s m a n n 讨 论过最优反馈控制问题的最大值原理( 【1 8 】) 但在我们的问题中,用这种方法对于给 定初始条件的最优反馈控制的研究与通常最优开环控制的研究是等效的,所以也不 适用 由上一节知,在线性二次框架下的无约束最优线性反馈控制问题( l q ) 。是可 以解到底的我们将依照问题( l q ) o 的求解思路,开展对满足k - l i p s c h i t z 条件的最 优反馈控制问题( l q ) 的讨论,但存在如下困难: 1 由动态规划方法可以得出开环值函数满足的h j b 方程但对于反馈控制,该如 何得到值函数满足的方程? 2 通常值函数满足的是一阶非线性的偏微分方程如何求值函数的显式表达式? 3 由值函数的表达式构造集值函数“( ,) ,其中u ( t ,z ) r m ,v ( t ,z ) 【0 ,列r ” 对于给定的t 【0 ,t 】,如何在集值函数u ( t ,) 选取满足k - l i p s c h i t z 条件的最优反 馈控制9 ( t ,) u ( t ,) ? 通常对集值函数存在l i p s c h i t z 选择最起码的一个条件就 是集值函数的下半连续性( 3 】) ,但是对于给定的连续h a m i l t o n 函数日及控制区 域u ,关于变量x 的集值函数 u ( t ,z ) ! i u i h ( t ,z ,i ) s h ( t ,x ,u ) ,v “u 往往得不到下半连续性 本文作如下具体安排;第二章讨论问题( l q ) l 的值函数所满足的方程第三章 给出问题( l l 最优反馈控制满足的必要条件第四章给出问题( l q ) l 最优反馈控 制存在的充分必要条件第五章则在一个更为宽广的反馈控制集中讨论最优反馈控 制的存在唯一性 6 第二章k - l i p s c h i t z 最优反馈控制问题的值函数 闭环控制并不似开环控制可以直接由动态规划方法导出值函数满足的h j b 方 程对于k - l i p s c h i t z 最优反馈控制问题的值函数,我们将先建立开环控制与闭环控 制之间的联系,然后用夹逼的方法得到问题( l q ) 的值函数所满足的方程,此外还 将给出值函数关于参数k 的严格单调性以下我们给定( 0 ,k o o ) 2 1 开环控制与闭环控制的联系 在这一节中我们将要讨论开环控制与闭环控制的联系我们先引入一类比反馈 控制集垂 范围更广的带约束反馈控制集圣f 可测函数妒: 0 ,卅r “一r 一属于 圣f ,当且仅当妒( ,) 满足如下约束 i i 妒( s ,y ) l | k l l ! ,l l ,( s ,y ) 【0 ,t 】r “, ( 2 1 1 ) 且对于任意的( t ,z ) o ,卅r ”,状态方程( 1 2 2 ) 在上述反馈控制作用下存在唯一 解 在线性二次框架下考虑如下的单点最优反馈控制问题( l q ) f ( t ,z ) 以及全局最 优反馈控制问题( l q ) k f 问题( l q ) f ( t ,z ) 对于给定的( t ,z ) 1 0 ,卅x 孵,找乒( ,) 西f ,使得 地。乩) ) _ m i n 蝌f j ( t , x 眺+ ) ) 3 时( t :x ) ( 2 问题( l q ) f 找事( ,) 壬f ,使得对所有( ,z ) 【o ,t 】r “,( 2 1 2 ) 成立 在这里我们强调问题( l q ) f ( t ,z ) 的解庐( ,) 一般依赖于( ,z ) ,但是问题( l q ) k f 的解庐( ,) 则与( t ,z ) 【o ,卅p 无关所以,称满足( 2 1 2 ) 的事( ,) 壬 为问 题( l q ) k g ( t ,。) 的一个最优反馈控制,或称为问题( l q ) f 的一个单点最优反馈控制 相应地,问题( l q ) f 的解驴( ,) 称为问题( l q ) f 的个全局最优反馈控制我们称 噔( ,) 为问题( l q ) f 的值函数 为了得到开环控制问题与闭环控制问题的联系,我们还将提出一个带约束的开 环l q 问题为此,对于任意给定的( t ,z ) 0 ,t ) 舻,令壬:。是所有满足 ( s ) | | 圳矿2 ( s ) | | , ne8 t ,卅, ( 2 1 3 ) 7 的开环控制( ) l 2 ( t ,t ;r ? ) 的集合,其中y t , x ( ) 是在此开环控制作用下( 1 11 ) 的 状态轨线如果我们令皿( ,) 是a ( ) 转移矩阵,即, 爰m ( t ,s ) = a ( t ) 皿( t ,s ) , 皿( s ,s ) = l 那么 ,s y t , x ( s ) = 皿( s ,t ) z + 皿( s ,r ) b ( r ) u ( r ) d r ,vs 【t ,t 1 j t 因此,( 2 1 3 ) 与下式等价: ,s i i u ( s ) | | k l l q ( s ,t ) x + 皿( s ,r ) b ( r ) u ( r ) d r 忆 n l e s t ,t j j t 我们知道这个约束是非凸的因此,不难看到集合西2 。也是非凸的所以,壬2 。 必定是l 2 ( t ,? ;r “) 的一个真子集另一方面,我们可知垂2 2 是强闭的( 【2 3 】) ,且由 g r o n w a i l 不等式可得圣2 。又是有界的下面我们给出一个有用的结论 命题2 1 1 设( t ,z ) 0 ,t ) 酣令“( ) 西2 。,且v 扣( ) 是相应的状态轨线, 则下面三个条件等价: ( i ) 对于任意的s 【t ,卅, y t , x ( s ) = 0 ( 2 1 4 ) ( i i ) 对于某个s 【t ,习,( 2 1 4 ) 成立 ( i i i ) z = 0 证明 由于 ,r y t , x ( r ) = 皿( ns ) 掣,。( s ) + 皿( r ,r ) b ( f ) u ( r ) 打,v ts 亡,t 1 j s 因此, l l y , x ( r ) | | o i l y “。( s ) 0 + c k l | b ( r ) i g 啦( r ) l l d r , ,r j s 此处( 并且以后也如此) 我们用c 表示一个绝对常数由g r o n w a l l 不等式,我们有 l i v t , 。( r ) | i c t , x ( s ) m v r ,s 【t ,t i 于是( i ) 一( i i i ) 的等价性是显然的 我们现在给出如下定义 8 口 定义2 1 2 给定初始条件( t ,x ) 0 ,t ) x * p 和一个反馈控制妒圣f , ( i ) 称开环控制u ( ) 是与反馈控制妒( ,) 圣f 在( t ,z ) 处相当的一个开环控制, 如果 “( ) 一妒( ,y t , x ( ) ) ,8 t ,t l( 2 1 5 ) 成立,其中y 抽是在反馈控制妒作用下的状态轨线 ( i i ) 称集合a 圣2 。是与反馈控制集廖西f 在( t ,z ) 处相当的一个开环控制 集,如果4 是所有与8 中某个反馈控制在( t ,x ) 处相当的开环控制的集合我们记 a = b ( t ,。) 特别地,壬f ( t ,z ) 是与西f 在( t ,x ) 处相当的开环控制集 在这里我们需要指出,由定义2 1 2 中( i ) 给出的变换妒( y ) 一u ( ) 不是一一对 应的换句话说,不同的反馈控制可能会导致相同的开环控制从而,一个开环控 制集合4 圣2 。可能有不止一个反馈控制集8 垂f 与之在( t ,z ) 处相当下面的 结论给出了圣f ( t ,。) 与中:。之间的联系 引理2 1 3 令( t ,z ) 【0 ,t ) 酣则西妒等于壬f ( t ,z ) 证明根据壬f 的定义,对于任意的妒( ,) 圣参,与妒( ,) 相当的开环控制“( ) 属于圣:。这样得到了西参( t ,z ) 圣曩另一方面,对于任意的开环控制n ( ) 西2 。, 我们将找出一个反馈控制妒( ,) 使得n ( ) 与之相当事实上,由命题2 11 可得,对 于任意s f ,丁】,y t , x ( s ) 0 当且仅当x 0 现在假设初始状态z = 0 ,那么 怕( s ) _ | k l l y t ) x ( s ) i i = 0 ,8 【t ,卅, 是西2 。中的唯一元素显然,n ( s ) ;0 是与如下反馈控制 妒( ,) = 0 ,( 8 ,y ) 0 ,卅xr ” ( 2 1 6 ) 相当的开环控制如果x 0 ,我们取如下满足( 2 1 1 ) 的线性反馈控制妒( ,) : 川砷删嵩筹9 ,北【0 卅酣, ( 2 1 7 ) 考虑到在上述反馈控制作用下的系统方程( 1 2 2 ) 存在一个唯一解且妒垂f ,则n ( ) 是与妒( ,) 相当的开环控制这样就证明了我们的结论 口 现在我们提出带约束的开环l q 问题 9 问题( l q ) :。给定( t ,z ) 【0 ,丁) r ”,找i ( ) 垂2 。,使得 m 。川) _ 非i n m f t , x ;u ( ) ) 5 咖。) ( 21 8 ) 我们称噔( t ,z ) 为问题( l q ) 2 。的值由于每个反馈控制妒( ,) 西参跟与其相当 的开环控制有相同的性能指标,则由引理2 1 3 可得:对于任意的( t ,z ) 0 ,卅p 毗z ) 非i n f t , x ;u ( + ) ) - 小i n 孵f m 。;“) ) 5 毗。) ,( 2 成立这表明问题( l q ) f 与问题( l q ) :。在( ,z ) 处有相同的值除此之外,开环控 制问题与反馈控制问题之间还有如下联系 命题2 1 4 ( i ) 对于任意给定的初始条件( ,z ) ,如果反馈控制事( ,) 蛋f 满足 j ( 。,。;) = ,哪) ,p l ,9 那么与9 ( ,) 相当的开环控制f i ( ) 是问题( l q ) 2 。的解 ( i i ) 令( t ,z ) 0 ,t ) 酣如果开环控制问题( l q ) 2 。存在一个解,那么存在一 个庐( ,) 圣f 满足 j ( t ,z i 庐( ,) ) = i n f ,z ;妒( ,) ) ()_j(t 2 1 1 0 p ( ,j t o 。f 证明( i ) 假定开环控制日( ) 对于问题( l q ) :。不是最优的则存在o ( ) 圣2 。使 得 j ( t ,z ;n ( ) ) j ( t ,z ;i ( ) ) 由引理2 13 ,存在反馈控制妒( ,) 圣参使得开环控制n ( ) 与之相当但是 j ( t ,z ;p ( ,) ) = j ( t ,d ( ) ) j ( t ,z ;6 ( ) ) = j ( t ,e 9 ( ,) ) , 这与庐( ,) 的最优性矛盾 ( i i ) 令i ( ) 是问题( l q ) 2 。的解如引理2 1 3 中的证明那样,对于。= 0 或。0 的情形,我们分别按( 2 1 6 ) 或( 2 , 1 7 ) 构建一个反馈控制庐( ,) 圣f 由于开环控制 i ( ) 与反馈控制乒( ,) 有相同的性能指标,由( 2 1 9 ) 可得 j ( t ,z ;9 ( ,) ) = j ( t ,。;面( ) ) = v 参( t ,z ) = y ,( ,z ) ( 2 1 1 1 ) 这就使得( 2 1 1 0 ) 成立 口 1 0 1 2 2 值函数满足的h j b 方程的导出 在这一节我们先给出一类比反馈控制集圣 范围小的带约束线性反馈控制集 西誊记 咒k t ,t 1 = ( ) l 。( ,t ;r m 黼) i i k ( s ) l i k ,vs t ,卅) , ( 2 2 1 ) 由此定义带约束线性反馈控制集 圣f = 妒( ,) i 妒( s ,可) = k ( s ) y ,( s ,) 【o ,t 】r ”,k ( ) 尼 o ,卅)( 2 2 2 ) 我们现在提出如下问题 问题( l q ) x ( t ,z ) 对于给定的( t ,z ) 【o ,t 】xr “,找9 ( ,) c x ,使得 j ( t ,z ;庐) = i n f ,。j ( t ,。;) j 喈( t ,。) ( 2 2 3 ) p ( ,) 壬毒 这样,我们就可以引入带约束的最优线性反馈l q 问题 问题( l q ) x 找一个庐( ,) 圣誊,使得对于所有( t ,z ) 【o ,t 】”,等式( 2 2 3 ) 恒成立 称由( 2 2 3 ) 定义的函数喈( ,) 为问题( l q ) x 的值函数注意到在引理2 1 3 及 命题2 1 4 的证明中,构造的反馈控制( 2 1 6 ) 与( 2 1 7 ) 都是西誊中的元素,则我们 有如下类似于引理2 13 及命题2 1 4 的结论具体可以描述如下 引理2 2 1 令( t ,z ) 【0 ,丁) ,则圣:。是与反馈控制集垂在( ,。) 处相当 的开环控制集 由上述结论我们立即得到, v 2 ( t ,t ) = 噔( t ,。) = 时( t ,z ) ,v ( t ,z ) f 0 ,卅舯( 2 2 4 ) 进一步,我们有 命题2 2 2 ( i ) 对于任意的( t ,z ) ,如果反馈控制庐( ,) 圣誊满足 j ( 。,。;庐) _ f 7 ( t , x ;妒) ,p h 斥9 f 那么与事( ,) 相当的开环控制n ( ) 是问题( l q ) 2 。的解 ( i i ) 令( t ,z ) 0 ,r ) 舯如果开环控制问题( l q ) 2 。存在一个解,那么存在一 个乒( ,) 壬誊满足 。( 。,。;n ) ) _ 面! 。( 2 ,州( ,) ) ( 2 p l ,j o f 需要强调的是问题( l q ) 2 。与问题( l q ) x ( t ,z ) 有着相同的可解性 下面我们给出k - l i p s c h i t z 最优反馈控制问题的值函数满足的方程 定理2 2 3 如果( 1 1 4 ) 成立,则问题( l q ) k l 的值函数v ( ,) 满足如下方程 i 噔( 沁) + m 帅i n | | ( 嘭( f 咄) z + 即) u ) + ( ) 叩) + ( u ,u ) ) = o ,( t ,z ) 【0 ,t i r “: ( 2 驯 i 伊( t ,z ) = ( m x ,z ) 证明对于f 问题( 上q ) :( ,z ) i ( t ,。) 【o ,t i r n ) ,如果将( ) h 0 ,卅看作 控制变量,则由动态规划方法可得,其值函数喈( ,) 满足如下h j b 方程 f ( 喈) c ( ) + m i ! n 女 ( ( 嗜) 出,咄) z + 础) 酬+ ( ) 叩) 1+ ( z ,) = 0 ,( ,z ) 0 ,卅r ”, l ( 喈) z ) = ( m x ,z ) 经整理,可得喈满足( 2 2 6 ) 注意到三类反馈控制集存在如下关系, 圣誊西 圣f 则, v 2 ( t ,z ) v ( ,z ) v t ( t ,z ) ,( ,z ) 【t ,t 】耐 结合( 2 24 ) ,可得v 2 ( - ,_ ) = 喈( r ) = 噔( ,) = 喈( ,) 所以问题( l q ) 的值函数 伊( ,) 也满足( 2 26 ) 口 此后,我们将问题( l q ) z ,问题( l l ,问题( l q ) k ,问题( l q ) f 的值函数,统一 记为伊( ,) ,而问题( l q ) 2 。的值则为v 。( t ,z ) 需要指出的是,由方程( 2 2 6 ) 表示的值函数伊( ,) 通常不是状态变量z 的二 次函数( 见下例) 因此,r i c c a t i 方程的技巧( 通常用于无约束的l q 问题) 在这里就 不再适用,也就无法直接给出值函数的显式表达式 1 9 o 例2 2 4 令n = 2 ,m = 1 ,a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论