线性最优状态调节器学习教案_第1页
线性最优状态调节器学习教案_第2页
线性最优状态调节器学习教案_第3页
线性最优状态调节器学习教案_第4页
线性最优状态调节器学习教案_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1第一页,共91页。7.1 线性二次型问题线性二次型问题(wnt)设线性时变系统的动态设线性时变系统的动态(dngti)方程方程为为)()()()(),()()()()(00txtCtyxtxtutBtxtAtx(7-1)式中式中 为为 维状态向量,维状态向量, 为为 维控制向量,维控制向量, 为为 维输出向量;维输出向量; 为维数适当的时变为维数适当的时变矩阵,其各元分段连续且有界,在特殊情况下可以矩阵,其各元分段连续且有界,在特殊情况下可以是常阵是常阵 。假定。假定 ,且,且 不受不受约束。约束。)(txn)(tulm)(ty)(),(),(tCtBtACBA,nml0)(tu第1页

2、/共90页第二页,共91页。若令若令 表示表示 维希望输出维希望输出(shch)向量,则向量,则l)(tyl)()()(tytytel(7-2)称为称为(chn wi)误差向量。要求确定最优控制误差向量。要求确定最优控制 ,是下列二次型性能指标极小:是下列二次型性能指标极小:)(*tu(7-3)dttutRtutetQtetFeteJfttTTffT0)()()()()()(21)()(21式中式中 为为 维对称非负定常阵,维对称非负定常阵, 为为 维对称维对称非负定时变矩阵,非负定时变矩阵, 为为 维对称正定时变矩阵,维对称正定时变矩阵,初始时刻初始时刻 和末端时刻和末端时刻 固定。固定。F

3、ll)(tQ)(tRmmll0tft第2页/共90页第三页,共91页。 在二次型性能指标(在二次型性能指标(7-3)中,其各项都有明确的物)中,其各项都有明确的物理理(wl)含义。含义。(1)末值项)末值项)()(21)(ffTftFetete(7-4) 不失不失(b sh)一般性,取一般性,取 ,表示对末态误差要求的,表示对末态误差要求的各元等加权,则有各元等加权,则有IF fttlfffTeeetetete 2222212|)(|)()( 此时,末值项表示此时,末值项表示 时刻时刻(shk)的跟踪误差,即的跟踪误差,即末态误差向量末态误差向量 与希望的零向量之间的距离平方和。与希望的零向量

4、之间的距离平方和。ft)(fte第3页/共90页第四页,共91页。当当 时,表示对末态跟踪误差的各元有不同时,表示对末态跟踪误差的各元有不同(b tn)的要求。的要求。0F若取若取0,21 lfffdiagF则式(则式(7-4)可以)可以(ky)表示为表示为)(21)(12fliiiftefte 此时,末值项表示此时,末值项表示(biosh)末态跟踪误差向量末态跟踪误差向量 与希望与希望的零向量之间的距离加权平方和。的零向量之间的距离加权平方和。)(fte 如果对末态跟踪误差不必限制,则可取如果对末态跟踪误差不必限制,则可取 。此。此时性能指标时性能指标 变为积分型。变为积分型。0FJ第4页/

5、共90页第五页,共91页。(2)第一)第一(dy)过过程项程项ffttTttedttetQtedtL00)()()(21(7-5)若取若取0)(,),(),()(21 tqtqtqdiagtQl则有则有0)()(21)()()(2112liiiTetetqtetQteL于是于是(ysh),式(,式(7-5)可以表示为)可以表示为dttetqdtLffttliiitte 0012)()(21 上式表明,第一过程项表示在系统控制过程中,对动态跟踪上式表明,第一过程项表示在系统控制过程中,对动态跟踪误差加权平均误差加权平均(pngjn)和的积分要求,是系统在运动过程中动态和的积分要求,是系统在运动过

6、程中动态跟踪误差的总度量。跟踪误差的总度量。第5页/共90页第六页,共91页。(3)第二)第二(d r)过程项过程项ffttTttudttutRtudtL00)()()(21(7-6)若取若取0)(,),(),()(21 trtrtrdiagtRm于是,式(于是,式(7-6)可以)可以(ky)表示为表示为dttutrdtLffttmiiittu 0012)()(21则有则有0)()(21)()()(2112miiiTututrtutRtuL 上式表明,第二上式表明,第二(d r)过程项表示在系统控制过程中,对加过程项表示在系统控制过程中,对加权后的控制能量消耗的总度量。权后的控制能量消耗的总度

7、量。第6页/共90页第七页,共91页。 因此,二次型性能指标(因此,二次型性能指标(7-3)的物理意义是:是系统)的物理意义是:是系统在控制过程中的动态误差与能力消耗,以及在控制过程中的动态误差与能力消耗,以及(yj)控制结束控制结束时的系统稳态误差综合最优。时的系统稳态误差综合最优。二次型性能指标有如下二次型性能指标有如下(rxi)几种重要的特殊情形。几种重要的特殊情形。(1)状态)状态(zhungti)调调节器的问题节器的问题在系统方程(在系统方程(7-1)和误差向量()和误差向量(7-2)中,如果)中,如果0)(,)(tyItCl则有则有)()()(txtyte从而,性能指标(从而,性能

8、指标(7-3)演变为)演变为dttutRtutxtQtxtFxtxJfttTTffT0)()()()()()(21)()(21(7-7)第7页/共90页第八页,共91页。dttutRtutxtQtxtFxtxJfttTTffT0)()()()()()(21)()(21(7-7) 这时,线性二次型问题归结为:当系统这时,线性二次型问题归结为:当系统(xtng)受扰偏离原平衡零状态时,要求系统受扰偏离原平衡零状态时,要求系统(xtng)产生一控产生一控制向量,使性能指标(制向量,使性能指标(7-7)极小,即使得系统)极小,即使得系统(xtng)状态状态 始终保持在零平衡状态附近。始终保持在零平衡状

9、态附近。)(tx(7-8)(2)输出)输出(shch)调节器调节器的问题的问题 在误差在误差(wch)向量(向量(7-2)中,)中,如果如果0)(tyl则有则有)()(tyte从而,性能指标(从而,性能指标(7-3)演变为)演变为dttutRtutytQtytFytyJfttTTffT0)()()()()()(21)()(21第8页/共90页第九页,共91页。(7-8)dttutRtutytQtytFytyJfttTTffT0)()()()()()(21)()(21 这时,线性二次型问题这时,线性二次型问题(wnt)归结为:当系统受扰偏离归结为:当系统受扰偏离原平衡状态时,要求系统产生一控制向

10、量,使性能指标(原平衡状态时,要求系统产生一控制向量,使性能指标(7-8)极小,即使得系统输出极小,即使得系统输出 始终保持在零平衡状态附近。始终保持在零平衡状态附近。)(ty(3)跟踪系统)跟踪系统(xtng)问题问题 如果如果 , 式(式(7-2)成立,性能指标保)成立,性能指标保持式(持式(7-3)的形式不变,则线性二次型问题归结为:)的形式不变,则线性二次型问题归结为:当希望输出量当希望输出量 作用于系统时,要求系统产生一作用于系统时,要求系统产生一控制向量,使性能指标(控制向量,使性能指标(7-3)极小,即使得系统的)极小,即使得系统的实际输出实际输出 始终跟随始终跟随 的变化。的变

11、化。0)(tyl)(tyl)(tyl)(ty第9页/共90页第十页,共91页。7.2 状态状态(zhungti)调节器调节器 所谓状态调节器问题,就是要求系统的状态保持所谓状态调节器问题,就是要求系统的状态保持(boch)在平衡状态附近。在平衡状态附近。7.2.1 有限有限(yuxin)时间状态调时间状态调节器节器问题问题 7.1 设线性时变系统状态方程为设线性时变系统状态方程为00)(),()()()()(xtxtutBtxtAtx(7-9))(tA 式中式中 无约束;矩阵无约束;矩阵 与与 维数适当,其各元连续且有界。要求确定最优维数适当,其各元连续且有界。要求确定最优控制控制 ,使下列性

12、能指标极小:,使下列性能指标极小: )(;)(;)()(tuRtuRtxtxmn)(tB)(*tudttutRtutxtQtxtFxtxJfttTTffT0)()()()()()(21)()(21(7-10) 式中权矩阵式中权矩阵 其各其各元均连续有界;末端时刻元均连续有界;末端时刻 固定且为有限值。固定且为有限值。0)()(, 0)()(, 0tRtRtQtQFFTTTft第10页/共90页第十一页,共91页。(1) 最优解的充分最优解的充分(chngfn)必要条件必要条件 定理定理7-1 对于最优调节器问题对于最优调节器问题(wnt)7-1,最优控制,最优控制的充分必要条件的充分必要条件)

13、()()()()(1*txtPtBtRtuT(7-11)最优性能指标最优性能指标(zhbio)为为)()()(21000*txtPtxJT(7-12) 式中式中 维对称非负矩阵维对称非负矩阵 满足黎卡提矩满足黎卡提矩阵微分方程阵微分方程nn)(tP)()()()()()()()()()()(1tQtPtBtRtBtPtPtAtAtPtPTT(7-13)其边界条件为其边界条件为FtPf)(而最优轨线而最优轨线 ,则是下列线性向量微分方程的解:,则是下列线性向量微分方程的解:)(*tx(7-14)001)(),()()()()()()(xtxtxtPtBtRtBtAtxT(7-15)第11页/共9

14、0页第十二页,共91页。证明证明(zhngmng):必要性:证必要性:证(5-14)表示表示(biosh)的的u*确为最优,取确为最优,取H函数为:函数为:1( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )2TTTTHxt Q t x tut R t u tt A t x tt B t u t根据根据(gnj)最优控制的控制方程:最优控制的控制方程:( ) ( )( ) ( )0THR t u tBttu可得:可得:1*( )( )( ) ( )TutRt Btt 因为:因为:22( )0HR tu故故u*为使哈密顿函数取极小控制。为使哈密顿函数取极小控

15、制。因末态自由,横截条件为:因末态自由,横截条件为:1()()()()() 2TffffftxtFx tFx tx t(见(见P50定理定理3-1)由正则方程,得:由正则方程,得:1( )( ) ( )( )( )( ) ( )THx tA t x tB t Rt Btt( )( ) ( )( ) ( )THtQ t x tAttx (7-19)第12页/共90页第十三页,共91页。设协态方程设协态方程(fngchng)的解为的解为0( )( ) ( ),ftP t x ttt t 则状态方程为则状态方程为11( )( ) ( )( )( ) ( ) ( )( )( )( ) ( )( )TT

16、x tA t x tB t R Bt P t x tA tB t R Bt P tx t(7-23)解此方程,可得最优轨线:解此方程,可得最优轨线:00*( ),*( )xtxtx11( )( ) ( )( )( )( )( ) ( )( )( )( ) ( )( ) ( )( ) ( )( )TTtP t x tP tA tB t R Bt P tx tP tP t A tP t B t R Bt P tx t( )( ) ( )( ) ( )tP t x tP t x t此外:此外:将将(7-23)代入:代入:与与(7-19)式)式( )( ) ( )( ) ( )THtQ t x tAt

17、tx ( )( ) ( )( ) ( ) ( )( ) ( )( ) ( )( )TTtQ t x tAt P t x tQ t x tAt P tx t 比较可得比较可得:)()()()()()()()()()()(1tQtPtBtRtBtPtPtAtAtPtPTT第13页/共90页第十四页,共91页。)()()()()()()()()()()(1tQtPtBtRtBtPtPtAtAtPtPTT该方程该方程(fngchng)称为黎卡提(称为黎卡提(Riccati )矩阵微分方程矩阵微分方程(fngchng)由由()() ()ffftP tx t和和1()()()()() 2Tffffftxt

18、Fx tFx tx t可知黎卡提微分方程的边界条件为:可知黎卡提微分方程的边界条件为:()fP tF因此,得最优控制的必要条件为:因此,得最优控制的必要条件为:1*( )( )( ) ( ) ( )TutRt Bt P t x t 必要性得证。必要性得证。充分性:若上式充分性:若上式 u* 中中P(t)为黎卡提方程满足边界条件的解,我为黎卡提方程满足边界条件的解,我们能证明它满足哈密顿们能证明它满足哈密顿-雅可比方程,则根据雅可比方程,则根据(gnj)连续系统动连续系统动态规划,充分性成立。态规划,充分性成立。第14页/共90页第十五页,共91页。1( , , )( ) ( ) ( )( )

19、( ) ( )2TTL x u txt Q t x tut R t u t令令( , , )( ) ( )( ) ( )f x u tA t x tB t u t*( , , )( , , )11*( ) ( ) ( )( ) ( ) ( )( ) ( )( ) ( )22TTTTTJHL x u tf x u txJJxt Q t x tut R t u tA t x tB t u txx哈密顿哈密顿-雅可比方程为雅可比方程为( )*( , )11min( ) ( ) ( )( ) ( ) ( )22*( ) ( )( ) ( )0TTu tTTJx txt Q t x tut R t u

20、ttJJA t x tB t u txx由于由于 u(t) 无约束,令无约束,令*( , )( ) ( )( )0THJx tR t u tBtux第15页/共90页第十六页,共91页。解得:解得:1*( , )*( )( )( )TJx tutRt Btx 将该式与将该式与1*( )( )( ) ( ) ( )TutRt Bt P t x t 对照,可使对照,可使1*( , )( ) ( ) ( )2TJx txt P t x t*( , )( ) ( )Jx tP t x tx从而可得从而可得*( , )1( ) ( ) ( )2TJx txt P t x tt代入哈密顿代入哈密顿-雅可比

21、方程雅可比方程(fngchng),得,得11( )( )( ) ( )( ) ( )( ) ( )( )( ) ( )( )( )02TTTxtP tP t A tAt P tP t B t Rt Bt P tQ tx t( )*( , )11*min( ) ( ) ( )( ) ( ) ( )( ) ( )( ) ( )022TTTTu tJx tJJxt Q t x tut R t u tA t x tB t u ttxx1111110222TTTTTTTTx Pxx QxR B PxRR B Pxx PAxx PBR B Px注意到注意到12TTTTTx PAxx A PxxPAA P

22、x可以得到可以得到第16页/共90页第十七页,共91页。11( )( )( ) ( )( ) ( )( ) ( )( )( ) ( )( )( )02TTTxtP tP t A tAt P tP t B t Rt Bt P tQ tx t若若P(t)满足黎卡提方程则满足黎卡提方程则用用1*( )( )( ) ( ) ( )TutRt Bt P t x t 描述的控制描述的控制u*(t)对于任何对于任何x(t)均均满足哈密顿满足哈密顿-雅可比方程雅可比方程而如此(rc)表述的1*(),() () ()2TfffffJx ttxtP tx t 故当上述(shngsh)黎卡提方程的边界条件为:()f

23、P tF对照(duzho)性能指标的终端项1(),()()2Tffffx ttxtFx t 则有1*(),()()2TffffJx ttxtFx t 充分性得证。充分性得证。1*( , )( ) ( ) ( )2TJx txt P t x t由由取取00, ( )( )tt x tx t可可得得0001*( ) ( ) ( )2TJxt P tx t第17页/共90页第十八页,共91页。(2)黎卡提方程解的若干)黎卡提方程解的若干(rugn)性质性质 由定理由定理7-1可知,问题可知,问题7-1的最优控制是状态的的最优控制是状态的 线性反馈形式线性反馈形式)()()(*txtKtu(7-16)

24、式中式中)()()()(1tPtBtRtKT(7-17)为反馈增益矩阵。由于式(为反馈增益矩阵。由于式(7-17)中矩阵)中矩阵 和和 是已知的,因此闭环系统的性质取决于黎卡提方程是已知的,因此闭环系统的性质取决于黎卡提方程的解的解 。)(tR)(tB)(tP 是唯一的。是唯一的。)(tP 是对称的。是对称的。)(tP第18页/共90页第十九页,共91页。命题命题7-1 若矩阵若矩阵 是黎卡提方程(是黎卡提方程(7-13)及其边)及其边界条件(界条件(7-14)的唯一解,则必为对称矩阵,即)的唯一解,则必为对称矩阵,即)(tP)()(tPtPT(7-18)证明证明(zhngmng):由黎卡提方

25、程及边界条件:由黎卡提方程及边界条件:)()()()()()()()()()()(1tQtPtBtRtBtPtPtAtAtPtPTT()fP tF考虑到考虑到 F、R、Q 均为对称均为对称(duchn)阵,将上式转阵,将上式转置:置:1( )( )( )( ) ( )( ) ( )( )( )( )( )TTTTTTTPtAt PtPt A tPt B t Rt Bt PtQ t()TfPtF可见上述两个可见上述两个(lin )矩阵微分方程和其边界条件矩阵微分方程和其边界条件完全相同。完全相同。由由 P(t) 解的惟一性,可知解的惟一性,可知( )( )TPtP t第19页/共90页第二十页,

26、共91页。 是非负的。是非负的。)(tP命题命题(mng t)7-2 对于性能指标(对于性能指标(7-10)0)(, 0)(, 0tRtQFdttutRtutxtQtxtFxtxJfttTTffT0)()()()()()(21)()(21如果对有所的如果对有所的 ,有,有fttt,00),(),(ttutxJ则对于任意的则对于任意的 和相应的和相应的 ,总有,总有)(tu)(tx命题命题7-3 若矩阵若矩阵 是黎卡提方程(是黎卡提方程(7-13)及其边界)及其边界条件(条件(7-14)的唯一)的唯一(wi y)解,则其在区间解,则其在区间 上上必为非负矩阵。必为非负矩阵。)(tP0 ,ft t

27、第20页/共90页第二十一页,共91页。(3)最优控制解的存在)最优控制解的存在(cnzi)性与唯一性性与唯一性 定理定理7-2 对于最优调节器问题对于最优调节器问题7-1,若,若 有限,有限,则式(则式(7-11)给出的最优控制)给出的最优控制 存在且唯一。存在且唯一。ft)(*tuP170P172 的两个例题的两个例题(lt)给出了如何应用给出了如何应用黎卡提方程来解最优控制的例子。黎卡提方程来解最优控制的例子。 第21页/共90页第二十二页,共91页。7.2.2 无限时间无限时间(shjin)状态调状态调节器节器 对既有最优性要求,又有稳定性要求的问题只能用无限对既有最优性要求,又有稳定

28、性要求的问题只能用无限时间调节器理论时间调节器理论(lln)去解决。去解决。(1)无限时间时变)无限时间时变(sh bin)状状态调节器态调节器问题问题 7-2 设线性时变系统状态方程为设线性时变系统状态方程为00)(),()()()()(xtxtutBtxtAtx(7-19)dttutRtutxtQtxJfttTT0)()()()()()(21性能指标性能指标(7-20)式中向量式中向量 及矩阵及矩阵 的假定的假定同问题同问题7-1,控制,控制 不受约束。要求确定最优控不受约束。要求确定最优控制制 ,使性能指标(,使性能指标(5-20)极小。)极小。)(),(tutx)(),(),(),(t

29、RtQtBtA)(*tu)(tu第22页/共90页第二十三页,共91页。定理定理7-3 对于无限时间时变状态调节器问题对于无限时间时变状态调节器问题7-2,若阵对若阵对 完全完全(wnqun)可控,则存在唯一的最优控制可控,则存在唯一的最优控制)()()()()(1*txtPtBtRtuT)(),(tBtA0)(ftP(7-21)最优性能指标最优性能指标(zhbio)为为)()()(21000*txtPtxJT(7-22)式中式中)()(tPlimtPft(7-23)是对称是对称(duchn)、非负的,而、非负的,而 是如下黎卡提是如下黎卡提方程:方程:)(tP(7-24)及其边界条件及其边界

30、条件的唯一解。的唯一解。(7-25)()()()()()()()()()()(1tQtPtBtRtBtPtPtAtAtPtPTT第23页/共90页第二十四页,共91页。 关于定理关于定理7-3,有如下有如下(rxi)几点标记几点标记. 1)对系统提出的完全可控性要求,是为了)对系统提出的完全可控性要求,是为了(wi le)保证最优解的存在。保证最优解的存在。例例 : 设系统设系统(xtng)状态方程及初始条件为状态方程及初始条件为0)0(),()()(1)0(),()(2211xtutxtxxtxtx性能指标性能指标dttutxtxJT02)()()(21试求最优控制试求最优控制 及最优性能指

31、标及最优性能指标 。)(*tu*J第24页/共90页第二十五页,共91页。解解状态状态(zhungti) 不可控。不可控。本例为线性定常系统本例为线性定常系统(xtng),其可控性判据,其可控性判据)(1tx00211rank bAbrank故系统故系统(xtng)不可控。不可控。不可控状态不可控状态 不稳定。不稳定。)(1tx系统矩阵系统矩阵1001A状态转移矩阵状态转移矩阵1100tAtteeLsIAe故系统的零输入响应为故系统的零输入响应为0)0()()(21tAtexetxtx显然显然tttelimtxlim)(1第25页/共90页第二十六页,共91页。 不稳定不稳定(wndng)且不

32、可控状态且不可控状态 包含于性能包含于性能指标之中。无论指标之中。无论 取何值取何值 时,性能指标时,性能指标)(1tx( )u tdttxtxdttxtxJT022210)()(21)()(21因而本例不存在使因而本例不存在使 的最优控制的最优控制minJ )(*tu 实际上,本例为线性定常系统,性能指标中的权矩阵实际上,本例为线性定常系统,性能指标中的权矩阵亦为常阵。因此,即使对于无限时间定常状态调节器问题,亦为常阵。因此,即使对于无限时间定常状态调节器问题,为了保证最优解存在为了保证最优解存在(cnzi),也必须要求系统完全可控。,也必须要求系统完全可控。第26页/共90页第二十七页,共

33、91页。3) 对于无限时间时变状态调节器,由于黎卡提方对于无限时间时变状态调节器,由于黎卡提方程(程(7-24)在边界调节()在边界调节(7-25)下的稳态解)下的稳态解 仍为时变矩阵,因而最优控制律是时变的,不便仍为时变矩阵,因而最优控制律是时变的,不便于工程应用。于工程应用。)(tP2) 对于无限时间状态调节器,通常在性能指标中不对于无限时间状态调节器,通常在性能指标中不考虑终点指标,取权阵考虑终点指标,取权阵 。其原因有二:一是希。其原因有二:一是希望望 ,即要求稳态误差为零,因而性,即要求稳态误差为零,因而性能指标中不必加入体现终点指标的末值项;二是工能指标中不必加入体现终点指标的末值

34、项;二是工程上仅考虑在有限时间内系统的响应,因而程上仅考虑在有限时间内系统的响应,因而 时的终点指标将失去工程意义。时的终点指标将失去工程意义。0F0)(ftxt,t第27页/共90页第二十八页,共91页。(2)无限)无限(wxin)时间定常状态调节器时间定常状态调节器问题问题 7-3 设线性定常系统状态方程为设线性定常系统状态方程为0)0(),()()()()(xxtutBtxtAtx(7-26)性能指标性能指标dttRututQxtxJTT0)()()()(21(7-27) 式中式中 无约束;矩阵无约束;矩阵 和和 是维数适当的常数矩阵。并且,是维数适当的常数矩阵。并且, 和和 分别为分别

35、为非负定和正定对称矩阵。要求确定最优控制非负定和正定对称矩阵。要求确定最优控制 ,使性能指标(使性能指标(7-27)极小。)极小。)(;)(;)()(tuRtuRtxtxmn)(*tuRQBA,QR第28页/共90页第二十九页,共91页。 定理定理 7-4 对于系统(对于系统(7-26)和性能指标()和性能指标(7-27),),若对于任意矩阵若对于任意矩阵(j zhn) ,有,有 ,且,且 是是如下黎卡提矩阵如下黎卡提矩阵(j zhn)代数方程:代数方程:DQDDTP01QPBBRPPAAPTT7-28的解,则阵对的解,则阵对 完全可观的充分必要条件是完全可观的充分必要条件是 为对称正定矩阵为

36、对称正定矩阵DA,P第29页/共90页第三十页,共91页。 定理定理 7-5 对于无限时间定常状态调节器问题对于无限时间定常状态调节器问题(wnt)7-3,若阵对若阵对 完全可控,阵对完全可控,阵对 完全可观,完全可观,其中其中 ,且,且 任意,则存在唯一的最优控制任意,则存在唯一的最优控制DA,QDDTD)()(1*txPBRtuT(7-29)最优性能指标最优性能指标(zhbio)为为BA,00*21xPxJT(7-30)01QPBBRPPAAPTT 式中式中 为对称正定常阵,是下列黎卡提矩阵代为对称正定常阵,是下列黎卡提矩阵代数方程的唯一解数方程的唯一解P(7-31)第30页/共90页第三

37、十一页,共91页。7.2.3 最优调节系统最优调节系统(xtng)的渐进稳定性的渐进稳定性 按定常调节器问题进行综合按定常调节器问题进行综合(zngh),可得最优调节系,可得最优调节系统,其闭环系统方程为统,其闭环系统方程为(7-32)01)0(),()(xxtxPBBRAtxT研究该最优调节系统渐进稳定研究该最优调节系统渐进稳定(wndng)的必要条件。的必要条件。定理定理 7-6 设线性定常系统设线性定常系统0)0(),()()(xxtButAxtx(7-33)性能指标性能指标dttRututQxtxJTT0)()()()(21(7-34)第31页/共90页第三十二页,共91页。01)0(

38、),()(xxtxPBBRAtxT7-35为渐进稳定的最优调节系统,为渐进稳定的最优调节系统, 为一个李雅普为一个李雅普诺夫函数。其中,诺夫函数。其中, 为对称正定常阵,是黎卡提矩阵为对称正定常阵,是黎卡提矩阵代数方程代数方程7-31的唯一解。的唯一解。)()(txPtxTP 式中式中 无约束;矩阵无约束;矩阵 和和 是维数适当的常数矩阵。并且,是维数适当的常数矩阵。并且, 和和 分别为分别为非负定和正定对称矩阵。若阵对非负定和正定对称矩阵。若阵对 完全可控,完全可控,阵对阵对 完全可观,其中完全可观,其中 ,而,而 任意,任意,则闭环系统则闭环系统)(;)(;)()(tuRtuRtxtxmn

39、QDDTRQBA,QBA,DA,DR第32页/共90页第三十三页,共91页。命题命题(mng t) 7-4 对于系统(对于系统(7-33)和性能指标()和性能指标(7-34),已知阵对已知阵对 可控,且系统(可控,且系统(7-33)的可控标准形为)的可控标准形为BA,11121022( )( )( ),(0)00AABx tx tu txxA式中式中 为可控对。为可控对。假定假定 不可观不可观(kgun),其,其中中 。 111,BADA,22,0,TTTDDQ DD如如果果22A的特征值均具有负实部,则最优闭环系统是的特征值均具有负实部,则最优闭环系统是渐进稳定的。渐进稳定的。第33页/共9

40、0页第三十四页,共91页。7.3 具有给定具有给定(i dn)稳定度的状态调节器稳定度的状态调节器问题问题(wnt)7-4 设线性定常系统状态方程设线性定常系统状态方程0)0()(),()(xxtButAxtx(7-36)性能指标性能指标dttRututQxtxeJTTat02)()()()(21(7-37) 式中式中 无约束;矩阵无约束;矩阵 和和 是维数适当的常数矩阵。并且,是维数适当的常数矩阵。并且, 和和 分别为分别为非负定和正定对称矩阵。非负定和正定对称矩阵。 ,为已知值。要求,为已知值。要求确定最优控制确定最优控制 ,使性能指标,使性能指标7-37极小,并使极小,并使最优闭环系统渐

41、进稳定,其特征值实部小于最优闭环系统渐进稳定,其特征值实部小于)(;)(;)()(tuRtuRtxtxmnQBA,Q)(*tuR0R第34页/共90页第三十五页,共91页。7.3.1 修正修正(xizhng)调节器问题的调节器问题的最优解最优解设在问题设在问题7-4 完全可控,完全可控, 完全可观,其完全可观,其中为任一使中为任一使 的矩阵。可控及可观的要求,对的矩阵。可控及可观的要求,对确保无限时间问题有解以及确定对闭环系统确保无限时间问题有解以及确定对闭环系统(xtng)的稳定度约束使必需的。的稳定度约束使必需的。BA,DA,QDDT通过变换方法通过变换方法(fngf),可将问题,可将问题

42、7-4 化为无限问化为无限问题定常调节器问题,定义题定常调节器问题,定义)()( )()( tuetutxetxatat(7-38)(7-39)考查考查)()()( )()()( tBuetAxetxatxetxaetxatatatat(7-40)第35页/共90页第三十六页,共91页。)0()( ),( )( )()()( xtxtuBtxaIAtxetxaetxatat(7-41) 将式(将式(7-38)和式()和式(7-39)代入上式,得修正)代入上式,得修正(xizhng)调节器性能指标调节器性能指标dttuRtutxQtxJTT0)( )()( )(21(7-42)式中式中 与与 仍

43、然分别为非负和正定对称矩阵。仍然分别为非负和正定对称矩阵。RQ对于系统(对于系统(7-41)和性能指标()和性能指标(7-42),如果没有),如果没有(mi yu)可控性和稳定性的附加约束,则这一最小化问题可能无解。可控性和稳定性的附加约束,则这一最小化问题可能无解。)()()( )()()( tBuetAxetxatxetxaetxatatatat( )( )atu te u t( )( )atx te x t第36页/共90页第三十七页,共91页。根据线性系统理论,如下根据线性系统理论,如下(rxi)四种提法完全等四种提法完全等价价是完全可控的。是完全可控的。BA,是完全可控的。是完全可控

44、的。BaIA,对于定常向量对于定常向量 和所有的和所有的 意味着意味着 。 w0,ewtT0w对于定常向量对于定常向量 和所有的和所有的 意味着意味着 。 w0,)(BewBeewtaIATatT0w 由于已设由于已设 完全可控,因此完全可控,因此 完全可完全可控,根据对偶性原理,控,根据对偶性原理, 完全可观等价于完全可观等价于BA,DaIA,DA,BaIA,完全可观。完全可观。第37页/共90页第三十八页,共91页。根据定理根据定理7-5 ,修正调节器问题存在,修正调节器问题存在(cnzi)唯一的唯一的最优控制最优控制)( )( )(1*txKtxPBRtuT(7-43)最优性能指标最优性

45、能指标(zhbio)0( )0(21xPxJT(7-46)式中式中 为正定对称常阵,满足下列黎卡提矩阵代为正定对称常阵,满足下列黎卡提矩阵代数方程数方程P01QPBBRPPaIAaIAPTT(7-45)根据定理根据定理(dngl)7-5,最优闭环系统最优闭环系统)0()0( ),( 1xxtxPBBRaIAxT是渐进稳定的。是渐进稳定的。(7-44)第38页/共90页第三十九页,共91页。7.3.2 具有给定具有给定(i dn)稳定度的调节器问题的最优稳定度的调节器问题的最优解解将式(将式(7-38)和式()和式(7-39)分别)分别(fnbi)代入式(代入式(7-43)、)、式(式(7-44

46、)、式()、式(7-46),可得最优控制),可得最优控制)()()( 1*2txPBRtuetuTat(7-47)最优性能指标最优性能指标(zhbio)0()0(21)()(21002*0 xPxtxPtxeJTTat(7-48)最优闭环系统最优闭环系统01)0(),()(xxtxPBBRAtxT渐进稳定。其中渐进稳定。其中 满足式(满足式(7-45)。)。P(7-49)第39页/共90页第四十页,共91页。为了证明关于稳定度的规定,由渐进为了证明关于稳定度的规定,由渐进(jinjn)稳定得式稳定得式(7-46),有),有0)( txlimt0)(txelimatt(7-50)将式(将式(7-

47、38)代入式()代入式(7-50),可得),可得(7-51)当当 时,最优闭环系统(时,最优闭环系统(7-49)的状态)的状态 至少以至少以 的速度趋于零,完全满足给定稳定度的速度趋于零,完全满足给定稳定度 的要求。的要求。 越大,越大, 收于零的速度越快。通常将收于零的速度越快。通常将 称为闭环系统的最小稳定度。称为闭环系统的最小稳定度。t)(txateaa)(txa第40页/共90页第四十一页,共91页。定理定理(dngl)7-7 设线性定常系统状态方设线性定常系统状态方程程0)0()(),()(xxtButAxtx(7-52)性能指标性能指标dttRututQxtxeJTTat02)()

48、()()(21(7-53) 式中式中 无约束;矩阵无约束;矩阵 和和 是维数适当的常阵。并且,是维数适当的常阵。并且, 和和 分别为非负分别为非负定和正定对称矩阵。定和正定对称矩阵。 为给定的正常数。为给定的正常数。)(;)(;)()(tuRtuRtxtxmnQBA,QRR若阵对若阵对 完全可控,阵对完全可控,阵对 完全可观,其中完全可观,其中 为任一为任一使使 的矩阵,则存在的矩阵,则存在(cnzi)唯一最优控制唯一最优控制BA,DA,DQDDT)()(1*txPBRtuT(7-54)第41页/共90页第四十二页,共91页。)()(21002*0txPtxeJTt最优性能指标最优性能指标(z

49、hbio)7-5501QPBBRPPaIAaIAPTT 式中式中 为对称正定常阵,是下列黎卡提矩阵代数为对称正定常阵,是下列黎卡提矩阵代数方程:方程:P7-56的唯一的唯一(wi y)解。最优闭环系统解。最优闭环系统001)(),()(xtxtxPBBRAtxT7-57是渐进稳定是渐进稳定(wndng)的,且稳定的,且稳定(wndng)度至少为度至少为 。第42页/共90页第四十三页,共91页。 7.4 逆最优调节器逆最优调节器 逆最优调节器问题,是指已知某个具有未知定常扰动逆最优调节器问题,是指已知某个具有未知定常扰动的线性定常系统,在规定的线性定常系统,在规定(gudng)稳定度要求下,寻

50、求某稳定度要求下,寻求某个二次型性能指标,使得由规定个二次型性能指标,使得由规定(gudng)稳定要求确定的稳定要求确定的线性状态反馈控制律线性状态反馈控制律 ,对所构造的性能指标,对所构造的性能指标来说是最优的。来说是最优的。 逆最优调节器的实质:最优调节器的极值点配置问题。逆最优调节器的实质:最优调节器的极值点配置问题。)()(tKxtu第43页/共90页第四十四页,共91页。7.4.1 逆调节器问题逆调节器问题(wnt)设完全设完全(wnqun)可控系统状态方可控系统状态方程程EwtuBtxAtx)( )( )( (7-58)式中式中 为为 维状态向量;维状态向量; 为为 维控制向量,维

51、控制向量,且无约束;且无约束; 为为 维常值未知扰动向量;维常值未知扰动向量; ; 和和 为维数适当的常数矩阵。为维数适当的常数矩阵。)( txn)( tumwmnm BA,E假设假设(jish):矩阵矩阵 列满秩列满秩B值域空间值域空间 。)()(BE规定稳定度要求规定稳定度要求 。10 , 0arcsin0ImRe第44页/共90页第四十五页,共91页。若令若令wMwwtutz1)( )(7-59)(7-60)则逆最优调节器问题则逆最优调节器问题(wnt)为:寻求二次型为:寻求二次型性能指标性能指标dttuStutzRtztxQtxeJTTTat02)( )()()()( )(21(7-6

52、1) 使得由使得由 和和 确定的控制律确定的控制律 ,对性能指标,对性能指标(7-61)是最优的。其中,)是最优的。其中, 为非负对称常阵,为非负对称常阵, 和和 为正定对称常阵。为正定对称常阵。)( tuQRS第45页/共90页第四十六页,共91页。由假设由假设 ,能够选取一个,能够选取一个(y )矩阵矩阵 ,使得,使得1M1MBE 将式(将式(7-62)代入状态方程()代入状态方程(7-58),并考虑),并考虑(kol)式(式(7-59)和式()和式(7-60),可得),可得(7-62)()( )( tzBtxAtx(7-63)定义定义(dngy)()( )(tztutu)()( )(tz

53、txtx(7-64)(7-65)第46页/共90页第四十七页,共91页。则系统则系统(xtng)方程(方程(7-63)和()和(7-64),以及性能指标(),以及性能指标(7-61)可以写为)可以写为)()()(tButAxtxdttRututQxtxeJTTt02)()()()(21(7-66)(7-67)式中式中SRRQQIBBAA,00,0,00和和 是维数适当的常阵是维数适当的常阵,且且 和和 分别为非负分别为非负QBA,R和正定对称矩阵和正定对称矩阵QR第47页/共90页第四十八页,共91页。经上述矩阵经上述矩阵(j zhn)增广后,逆最优调节器问题转化为:增广后,逆最优调节器问题转

54、化为:对于给定的线性定常系统(对于给定的线性定常系统(7-66)和给定稳定度约)和给定稳定度约束束 和和 ,寻求状态反馈阵,寻求状态反馈阵 和权阵和权阵 与与 ,使,使得得 满足满足 和和 约束成为最优控制,约束成为最优控制,并使性能指(并使性能指(7-67)极小。)极小。KQR)()(tKxtu7.4.2 状态状态(zhungti)反馈阵的表反馈阵的表达式达式 一个完全可控的一个完全可控的 阶连续系统,对其给定稳阶连续系统,对其给定稳定度的一种评价规则是所有闭环极点的实部和幅角定度的一种评价规则是所有闭环极点的实部和幅角有要求的上限。若用有要求的上限。若用 表示期望极点区域,易见表示期望极点

55、区域,易见 为图为图7-1中的阴影区。中的阴影区。nrSrS第48页/共90页第四十九页,共91页。11lmRCarcSinrS图图 7-1 期望极点区域期望极点区域引理引理7-1 定常齐次动态定常齐次动态(dngti)方程方程)()(tAxtx其零解渐进稳定的充要其零解渐进稳定的充要条件是:对给定的任一条件是:对给定的任一正定对称阵正定对称阵 ,都存,都存在唯一的正定对称在唯一的正定对称阵阵 ,使得,使得MNNMAMAT第49页/共90页第五十页,共91页。引理引理7-2 对于完全对于完全(wnqun)可控的可控的 阶连续系统阶连续系统n)()()(tButAxtx如果如果(rgu)111A

56、Ii必有必有 即即, 2 , 1,)(niSAri 1)(AReiniAi, 2 , 1,1)( 式中式中 表示特征值,表示特征值, 表示实部。表示实部。 )()(Re第50页/共90页第五十一页,共91页。引理引理7-3 对于任意给定的对于任意给定的 正定对称矩阵正定对称矩阵 ,以及任意正数以及任意正数 和和 ,矩阵方程,矩阵方程nnN) 10(NIAMMIAT1111(7-68)有正定有正定(zhn dn)对称解的充分必要条对称解的充分必要条件是件是niIAi, 2 , 1, 111 第51页/共90页第五十二页,共91页。定理定理7-8 设系统(设系统(7-66)完全可控,给定正定对称矩

57、)完全可控,给定正定对称矩阵阵 。若。若 为正定对称矩阵,则必存在为正定对称矩阵,则必存在(cnzi)满满足下式的状态反馈阵足下式的状态反馈阵 :NKMIAMMIANMBKMBKTT11(7-69)使得使得(sh de)闭环系统特征闭环系统特征值值 。riSBKA)(第52页/共90页第五十三页,共91页。7.4.3 状态状态(zhungti)反馈阵与性能指标的反馈阵与性能指标的关系关系YKKBRKPT1(7-70)的一般解。式中的一般解。式中 ,满足,满足TYY 0BY若若 非奇异,则有非奇异,则有KBYRKRKBRKPT(7-71)引理引理7-4 对于完全可控系统(对于完全可控系统(7-6

58、6),若),若 列满列满秩,秩, 对称非负,对称非负, 渐进稳定,则存在对渐进稳定,则存在对称正定矩阵称正定矩阵 和状态反馈阵和状态反馈阵 ,其中,其中 为对称非负矩阵,是如下方程为对称非负矩阵,是如下方程BRPBRKT1KBAPKB第53页/共90页第五十四页,共91页。定理定理(dngl)7-9 考虑完全可控(考虑完全可控(7-66),), 列满秩,列满秩,若若B。niSBKAri, 2 , 1,)( KB为对称非负矩阵。为对称非负矩阵。IAYRKRKBRKT1YRKRKBRKIAT1对称非负,其对称非负,其中中0,YBYYTT第54页/共90页第五十五页,共91页。则当则当 正定对称时,

59、必存在非负对称的正定对称时,必存在非负对称的 和和 ,满足满足RPQYRKBRKPTRKKPIAIAPQTT1111(7-72)(7-73)式中式中。10 , 0第55页/共90页第五十六页,共91页。推论推论 在定理在定理7-9中,若取中,若取 为单位阵,则必存在为单位阵,则必存在(cnzi)非负对称得非负对称得 和和 ,满足,满足PQRYKKBKPTKKPIAIAPQTT1111(7-74)(7-75)第56页/共90页第五十七页,共91页。7.4.4 逆最优调节器的设计逆最优调节器的设计(shj)步骤步骤逆最优调节器的设计,可按如下逆最优调节器的设计,可按如下(rxi)步骤进步骤进行:行

60、:给定正定给定正定(zhn dn)对称矩阵对称矩阵 ,一般可取一般可取N。IN 由式(由式(7-69)求出使)求出使 为对称正定矩阵为对称正定矩阵 的的取值范围取值范围KM由定理由定理7-9 检验所取检验所取 阵是否满足条件阵是否满足条件 和和 ,不满足则返回至,不满足则返回至 ,重取,重取 阵,直至条件满足。阵,直至条件满足。KK第57页/共90页第五十八页,共91页。取取 ,按式(,按式(7-72)和式)和式 (7-73)分别)分别计算计算 和和 。IR PQ取取 为对角块阵,可得使为对角块阵,可得使 成为最优反成为最优反馈增益阵的性能指标(馈增益阵的性能指标(7-67)。)。QK由由 和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论