线性最优控制

上传人：石*** IP属地：广东上传时间：2023-06-13 格式：PPT 页数：165 大小：6.26MB 积分：30 举报 版权申诉

已阅读5页，还剩160页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

线性最优控制第一页，共一百六十五页，编辑于2023年，星期三

一、线性调节器

这一节讨论一般线性调节器，即有限时间调节器问题。首先讨论状态调节器，然后讨论输出调节器，再讨论有补偿输入的态调节器。1．状态调节器给定受控系统状态方程 (4·1—1)

和性能指标

(4·l—2)第二页，共一百六十五页，编辑于2023年，星期三其中：x(t)是n维状态矢量u(t)是m维控制矢量；A(t)、B(t)分别是n×n、n×m阶时变矩阵，它们的元在时间区间都是t的分段连续函数；是n×n阶半正定对称定常矩阵；Q(t)是n×n阶半正定对称时变矩阵；R(t)是m×m阶正定对称时变矩阵；端点时间和固定。这个性能指标的物理含意是很清楚的，第一项表示对终端误差的限制，积分号下第一项表示在控制过程中对误差的限制；第二项表示在控制过程中对消耗的能量的限制。假设u(t)不受限制，—要求寻找最优控制u*(t)，使性能指标J取极小。这样的最优控制问题称为状态调节器问题。下面，我们利用极小值原理来求解这个问题。容易看出，关于方程(4·1—1)和(4．1—4)的哈米尔登函数是第三页，共一百六十五页，编辑于2023年，星期三伴随方程是 (4．1—3)已知u(t)不受限制，利用极小值原理，得到控制方程为

已知R(t)正定，因此，存在，求解上式，得到最优控制，即

(4。1—4)又由于

是一正定矩阵，因此，式(4·1—4)表示的控制的确使哈米尔登函数H取极小。第四页，共一百六十五页，编辑于2023年，星期三

式(4。1—4)指出，最优控制u*(t)是的线性函数。要求出u*(t)必需计算。但是，我们的目的是要建立闭环控制，这就需要把u*(t)表示成状态x(t)的函数。下面，我们来寻找，并把它表示成x(t)的函数，这样求出的最优控制是线性时变反馈的形式。在这里求最优反馈控制有3种方法：1)转移矩阵法，2)扫掠法；3）s-域法。这里只介绍第—种方法。将式(4．1—4)代入式(4．1—4)，再同式(4．1—3)联立，得到规范方程

或

(4。1—5)这个问题的横截条件是第五页，共一百六十五页，编辑于2023年，星期三

(4·1—6)下面用表示线性时变系统(4。3—5)的状态转移矩阵。于是，齐次状态方程(4·1—5)的解可以表示为

式中是协状态矢量的初始值。在终端时间，有

利用状态转移矩阵的性质

因此有

第六页，共一百六十五页，编辑于2023年，星期三 (4·1—7)将2n×2n阶矩阵分解成4个n×n阶子矩阵，即

再将方程(4。1—7)展开，得到下面两个方程： (4·1—8) (4·1—9)将方程(4·l—9)的两边分别减方程(4．1—8)前乘以矩阵F后的方程的两边，并利用横截条件(4·1—6)，可得

令 (4·1—20)第七页，共一百六十五页，编辑于2023年，星期三得到 (4·1—11)式中P(t)是一n×n阶时变矩阵，它与终端时间以及矩阵F有关。当t＝时，上式变成

将它同方程(4·1—6)相比较，得到

将式(4·1—11)代入式(4·1—4)，得令 (4·1—12) 方程(4·1—12)变成 (4·1—13)上式表明：我们求出的最优控制是状态矢量的线性函数。其中K(t)是一m×n阶时变矩阵、叫做增益矩阵。由方程(4·1—1)和(4·1—13)可建立线性最优调节器由环控制系统结构图，如图4—1所示。第八页，共一百六十五页，编辑于2023年，星期三第九页，共一百六十五页，编辑于2023年，星期三

图4—1总结以上分析容易看出：设计最优调节器在于确定增益矩阵K(6)，要确定K(t)需要计算矩阵P(t)。但是，如果直接利用方程(4·1—10)来计算，是很麻烦的，也不便于更深一步地研究最优调节器的性质。因此，有必要寻找另外计算P(t)的方法。把方程(4·1—11)代入规范方程(4·1—5)，得 (4·1—14)

(4。1—15)对方程(4·1—1I)两边求导。得 (4·1—16)将方程(4·1—14)、(4·1—15)代入方程(4·1—16)，整理以后可得

上式左边对任意：x(t)都等于零，因此，方括弧内的矩阵必等于零。于是得到 (4·1—17)这是一个非线性时变矩阵微分方程，称为黎卡提(Reccati)方程第十页，共一百六十五页，编辑于2023年，星期三它的边界条件是 (4·1—18)这样一来，设计最优调节器问题就变成求解黎卡提方程。黎卡提方程包括个—阶非线性时变微分方程。下面，我们来证明矩阵P(门是对称矩阵，利用它的对称性质，就只需要解n(n+1)／2个方程。将方程(4·1—17)两边转置，考虑到Q(t)、R(t)都是对称矩阵，可得 (4·1一19)再对式(4。1—18)两边取转置，并注意到F是对称矩阵，可得 (4·1—20)比较方程(4·1—17)、(4·1—1同方程(4·1—19)、(4．1—20)，容易看出，矩阵P(t)和满足完全相同的微分方程式和完全相同的边界条件。根据微分方程解的唯一性，得到

即矩阵P(t)是对称矩阵。回忆最优调节器(4·1—12)的推导过程，可知它是根据必要条第十一页，共一百六十五页，编辑于2023年，星期三件得出的。下面我们来证明这个结果也是充分的，并且性能指标的最小值为

由矩阵和向量求导法则，有

将方程(4·1—1)积(4·1—17)代入上式，再加、减项，进行配方，并注意到P(t)的对称性，经过整理以后，可得

对上式两边积分，得到第十二页，共一百六十五页，编辑于2023年，星期三将上式两边分别除以2，再利用方程(4·1—2)和(4·1—18)，可得

由于R(t)正定，因此，上式右边的积分必大于或等于零。只有当

时积分值为零，且J达到极小。这就证明了最优调节器(4·1—12)的充分性。同时，得到性能指标的极小值为

上式表明，J*是初始状态和初始时间的函数，因此，可以写成：

第十三页，共一百六十五页，编辑于2023年，星期三

小结

总结以上讨论，得到如下结果，线性最优调节器的最优控制律是状态矢量的线性函数，即

式中

它是m×n阶时变增益矩阵；P(t)是n×n阶对称时变矩阵，它是黎卡提方程

(4·l—21)和边界条件 (4·3—22)的解。最优轨线是方程

和初始条件

的解。最优性能指标为

第十四页，共一百六十五页，编辑于2023年，星期三例4·1—1给定受控系统状态方程

和性能指标

式中，q＞0，r＞0，试求最优控制u*(t)和最优轨线x*(t)。

解：在这个例题中

A(t)＝a，B(t)＝1，F＝f，Q(t)=q，R(t)＝r因此，最优控制为

其中p(t)满足黎卡提方程

和边界条件

整理上述黎卡提方程，可得

第十五页，共一百六十五页，编辑于2023年，星期三对上式两边积分，得

于是，可得

(4·1—23)其中

由此得最优控制第十六页，共一百六十五页，编辑于2023年，星期三最优轨线x*(t)满足微分方程

和初始条件

于是有

对上式两边积分，可得

因此，得到最优轨线

式中函数p(t)由式（4。1—23）给出。式（4。1—23）指出，函数p(t)是时间t的，同时又依赖于终端时间。因此，通常把它记为。在这个例题中，如果取

a=-1，q＝r＝1，f＝0或1取分别为1，3，5，10，那么，由式（4。1—23）可以算出相应的，如图4-2所示。这一族曲线说明，随着的增长，函数趋近于同一个“反时间方向的稳态值”，而与终端条件无关，

图4—2第十七页，共一百六十五页，编辑于2023年，星期三第十八页，共一百六十五页，编辑于2023年，星期三由方程(4·1—23)可以得到 (4·1—24)即当的为一常数。我们把这个常数记为p。如果将a=-1，q＝r＝1代入方程(4·1—23)，得到

这里p＝0．414正是图4—2中的“反时间方向的稳态值”。例4。1—2给定受控系统状态方程

第十九页，共一百六十五页，编辑于2023年，星期三和性能指标

试求最优控制u*(t)。解：在这个例题中

将它们代入方程(4·1—21)和(4·1—22)，得到这个问题的黎卡提方程，即第二十页，共一百六十五页，编辑于2023年，星期三和边界条件

于是得到下面3个非线性一阶微分方程：

解上面3个微分方程，可求出，再将它们代入方程(4·1—11)，使得到最优控制

第二十一页，共一百六十五页，编辑于2023年，星期三容易看出，即使这样简单的问题，，要解出黎卡提力程也是很复杂的。黎卡提方程代表一组非线性(定常或时变)常微分方程，一般得不到闭合形式的解析解，而不得不借助于数字计算机求它的近似解。下面简单地介绍一种近似地计算矩阵P(t)的方法。矩阵P(t)或满足黎卡提方程(4．1—21)和边界条件(4·1—22)。利用

黎卡提方程可以近似地表示成 (4·1—25)依据这个公式，可以按反时间方向求解黎卡提方程。具体方法是；把时间区间分成N段，每段长，即

第二十二页，共一百六十五页，编辑于2023年，星期三已知，把它代入方程(4·l—25)，得

出此算出，再由

算出。按照类似的方法依次计算·下去，直至求出为止。显然，如果N选得大，则结果就愈精确。应注意到矩阵只依赖于矩阵A(t)、B(t)、Q(t)、R(t)、F和端点时间与，而与状态x(t)无关，因此，可以预先离线算出。第二十三页，共一百六十五页，编辑于2023年，星期三线性输出调节器问题12第二十四页，共一百六十五页，编辑于2023年，星期三达到极小。其小F和Q(t)都是n×n阶半正定对称矩阵，R(t)是m×m阶正定对称矩阵，端点固定。将y=C(t)x(t)代入方程(4。1—27)，得到

(4。1—28)比较方程(4。1—2)和(4·1—28)，容易看出：它们的结构形式完全相同，仅仅把方程(4·l—2)中矩阵F、和Q(t)在方程(4·1—28)中换成了和。因此，只要我们能够证明当F和Q(t)是半正定对称矩阵时，和也都是半正定对称矩阵，那么，输出调节器问题就转化成等效的状态调节器问题。于是，关于状态调节器的一切分析结果都可以应用到输出调节器中来。已知F和Q(t)都是对称矩阵，因此有

第二十五页，共一百六十五页，编辑于2023年，星期三和

即矩阵和都是对称矩阵。又因为系统(4。1—26)完全可观测，因此矩阵

的秩为n。这就意味着：对一切，。如果Q(t)是半正定的，则对所有y(t)必有

把y(t)＝C(t)x(t)代入上式，则对所有：(f)有

这就证明了，当Q(t)半正定时，也是半正定的。同理可证明，当F是半正定对称矩阵时，矩阵也是半正定对称矩阵。第二十六页，共一百六十五页，编辑于2023年，星期三

小结总结以上讨论，得到如下结果：给出线性完全可现测系统

和性能指标 (4·1—29)端点时间固定，F和Q(t)都是半正定对称矩阵，R(t)是正定对称矩阵。如果u(t)不受限制，则使性能指标(4·1—29)取极小的最优控制是

其中第二十七页，共一百六十五页，编辑于2023年，星期三n×n阶矩阵P(t)黎卡提方程

和边界条件

的解。最优轨线是微分方程

初始条件

的解。图4—3是线性最优输出调节器的结构图。图4—3第二十八页，共一百六十五页，编辑于2023年，星期三第二十九页，共一百六十五页，编辑于2023年，星期三

3．有补偿输入的线性调节器前面介绍的有限时间(即性能指标积分上限为有限值的)线性调节器的解是状态的线性时变反馈形式，由此构成的系统在终端时刻时有误差，即不为零。如果要使终端时刻误差尽可能小，就要求在接近终端时刻的反馈增益非常大。如果要求这个误差为零，则要求这时的增益矩阵为无限大。因此，使终端时刻误差为零的反馈控制难以实现。这一小节介绍一种求解有限终端时间控制问题的新方法。它的解是带有补偿输入曲线性状态反馈形式，利用这样的控制可以做到终端时刻误差为零而反馈增益矩阵仍为有限值。给出完全可控系统

第三十页，共一百六十五页，编辑于2023年，星期三式中A(t)是，n×n阶时变矩阵，B(t)是，n×m阶时变矩阵。要求系统从某个初始状态以有限时间转移到零状态，并且使性能指取极小。式中Q(t)是n×n阶半正定对称矩阵R(t)是m×m阶正定对称矩阵。由前面的分析可知，最优控制的一个必要条件是满足下列规范方程： (4．1—30)在这里，边界条件是，，＝0

利用极小值原理可求出最优控制u(t)与协状态变量入(t)之间有下列关系：第三十一页，共一百六十五页，编辑于2023年，星期三

现在，我们定义一个新的协状态变量q(t) (4。1—31)其中P(t)假设为一对称称n×n阶矩阵，满足黎卡提方程 (4。1—32)利用式(4．1—30)、(4·1—31)和(4．1—32)，可得出新的规范方程，即 (4·l—33)式中n×n阶矩陈F(t)定义为

边界条件：，＝0保持不变。将式(4，1—31)代入u*(t)的表达式，可得 (4·1—34)其中第三十二页，共一百六十五页，编辑于2023年，星期三

(4·1—35)我们把v(t)叫做补偿输入。式(4·1—34)指出，新的最优控制包括两部分：状态反馈和补偿输入。应当指出的是，因为系统的终端状态规定为＝0，因此，终端时刻入(t)未规定，式(4．1—31)未提供确定P(t)的终值的信息。这样，应注意在规定黎卡提方程(4·1—32)中P(t)的边界条件时，有一定的自由度。为了容易实现，假定条件为＝0

在这个边界条件下求解黎卡提方程(4．1—32)，可得最优控制表达式中的待定矩阵P(t)。

要确定最忧控制中的待定函数v(t)，必须求出新的协状态变q(t)。利用分块矩阵，方程(4·1—33)的解可表示为第三十三页，共一百六十五页，编辑于2023年，星期三协状态变量的初值1(lo)可以这样来确定：令终端状态为零，则当t＝时方程(4·1—36)的第一式变成

已知系统可控，转移矩阵一般为非奇异。因此，由上式可以求出为 (4·l一37)由式(4·1—35)、(4·l—36)、(4·1—37)可得补偿输入为

总结以上讨论，可作出有补偿输入的线性最优调节器结构图，如图4—4所示。

图4—4第三十四页，共一百六十五页，编辑于2023年，星期三第三十五页，共一百六十五页，编辑于2023年，星期三

问题4·1—1给定系统方程，和性能指标

试用线性调节器理论求最优控制u*(t)和t＝4时的状态x(4)。

问题4·1—2给定系统方程 ,和性能指标

试求使J取极小的闭环最优控制u*[x(t)]。问题4·1—3给定系统方程

和性能指标

第三十六页，共一百六十五页，编辑于2023年，星期三试求：1)为有限值时的闭环最优控制；2)时的闭环最优控制。问题4·1—4，给定系统方程．

和性能指标

试写出相应的黎卡提方程，并求最优控制。问题4·1—5给定系统方程

和性能指标

试求反馈增益矩阵。第三十七页，共一百六十五页，编辑于2023年，星期三

二、定常线性调节器上一节讨论的最优调节器是线性反馈形式的，最优控制u*(t)是状态变量的线性因数。但是，增益矩阵K(t)是时变的，要在工程上实现仍不方便。如果能建立起定常的，即其增益矩阵K(t)是常数矩阵的调节器，那么，调节器的结构以及设计计算都会得到简化，在工程上也更容易实现。增益矩阵为常数的最优调节器称为定常调节器。在这二节里，我们研究定常调节器综合方法及其稳定性问题。

1．定常调节器在研究定常调节器以前，自然首先要问：上一节求出的增益矩阵为什么是时变的呢?这是由于以下两种原因造成的：

l)在系统方程和性能指标中矩阵A(t)、B(t)、Q(t)、R(t)是时变的；2)终端时间是有限的。

例4。1—1指出，即使矩阵A(t)、B(t)、Q(t)、R(t)都是常数矩阵，如果有限，短阵是时变的，因而取K(t)仍然是时变的。但是，方程(4·1—23)和图4·1—2指出，对于A(t)、B(t)、Q(t)、R(t)都为常数的线性二次型问题，当很大时，随着t逐渐减小，将达到某个稳态值P，愈大，稳态值的时间区

间也愈长。当时，这个稳态值区间也将趋于无穷大。

第三十八页，共一百六十五页，编辑于2023年，星期三可以证明：如果矩阵A(t)、B(G)、Q(t)、R(t)都是常数矩阵，F=0，系统

完全可控，则存在、唯一，且等于常数矩阵P，即

矩阵P是n×n阶正定对称矩阵，满足代数黎卡提方程，即

容易看出，定常调节器问题是前一节研究的一般调节器问题的特殊情况，即矩阵A、B、Q、R为常数矩阵，F＝0，且的情况。因此，关于定常调节器问题可以叙述如下：给定完全可控线性定常系统 (4.2—1)和性能指标 (4.2—2)第三十九页，共一百六十五页，编辑于2023年，星期三其中：x(t)是n维状态矢量；u(t)是m维控制矢量；A、B分别为n×n和n×m阶常数矩阵；Q、R分别是n×n和m×m阶半正定和正定对称常数矩阵。假设u(t)不受限制，则最优控制存在、唯—，且为

u*(t)＝一Kx(t)(4·2—3)其中 (4·2—4)是n×n阶正定对称常数矩阵，满足下列非线性矩阵代数方程，即代数黎卡提方程 (4·2—5)相应的最优性能指标是 (4·2—6)最优轨线(t)是线性定常齐次方程 (4·2—7)第四十页，共一百六十五页，编辑于2023年，星期三和初始条件 (4·2—8)的解。图4—5是线性最优定常调节器的结构图。图4—5应注意到，在一般(有限时间)调节器问题中不要求受控系统全可控，而在定常(无限时间)调节器问题中则要求受控系院全可控。为了说明这一区别，请看例子，给定受控系统

第四十一页，共一百六十五页，编辑于2023年，星期三第四十二页，共一百六十五页，编辑于2023年，星期三和性能指标

或改写成

在这个例子中，状态不可控，且。上式右边第一项为无限大，而第二项永远大于或等于零。如果取u(t)＝0，则，J达到极小，它的极小值为

即最优性能指标为无限大。这就意味着无论选择什么样的u(t)，J都为，因而无从比较其优劣。本例说明无限时间调节器问题不一定存在有意义的解。第四十三页，共一百六十五页，编辑于2023年，星期三

如果受控系统完全可控，那么，一定存在某个控制在有限时间间隔内把它从任意一个初始状态转移到职态空间原点(即零状态)，从而使得性能指标是有限的，这样，无限时间调节器的解是有意义的。对有限时间调节器而言，由于控制区间有限，不可控状态对性能指标的影响也有限。因此，—从这个意义上说，不必要求受控系统完全可控。

例4·2—1给定受控系统

和性能指标

其中q＞0，r＞0，试求最优控制u*(t)，使J达到极小。解：在这个问题中，

A＝0，B＝1，Q＝q，R＝r第四十四页，共一百六十五页，编辑于2023年，星期三容易验证这个系统完全可控，因此，最优控制存在，并且为

P是代数黎卡提方程，即

的正定解，因此得

这正是例4·1—1中式(4。1—23)当时的结果。把它代入最优控制的表达式，得到

第四十五页，共一百六十五页，编辑于2023年，星期三

2。定常调节器的稳定性方程(4·2—7)是定常调节构成的闭环系统方程。那么，这个闭环系统是否一定稳定呢?为了回答这个问题，首先看一个例子。假设系统方程和性能指标分别为

和

不难看出，这个问题的最优控制是u*(t)＝0，相应的闭环系统方程是。显然，这个系统不稳定。由此可见，定常调节器并不总是稳定的。那么，在什么条件下闭环系统(4·2—7)是渐近稳定的呢？下面将证明：如果矩阵[A,D]完全可观测，这里D是任一使成立的矩阵，那么，闭环系统(4.2—7)一定渐近稳定。现在这样来证明：首先证明如果[A,D]完全可观测，则矩阵正定，因而是一个正定函数；然后，证明函数是半负定的；再证明函数沿着最优轨线不恒等于零。从而证明是一个李雅普诺夫函第四十六页，共一百六十五页，编辑于2023年，星期三数。这样，便证明了闭环系统(4.2—7)是渐近稳定的。阵对[A，D]完全可观测，意味着如果对一切t有方程：

则一定是

利用这个关系便可以证明矩阵P是正定矩阵。方程(4·2，2)和(4·2—6)．表明：对于所有，一定大于或等于零。如果对某一非零矢量有，那么，方程(4·2—2)右边的被积函数一定恒为零。又因为矩阵及为正定，这就要求对一切6，最优控制u(t)恒为零。在这种情况下，最优轨线是方程(4·2—7)，当u(t)＝0时的解，即

第四十七页，共一百六十五页，编辑于2023年，星期三由此得出

进而得出，对一切已知，于是得出了同阵对[A，D]完全可观测相矛盾的结果。这就证明了不能等于零，而只能大于零。从而证明矩阵P是正定矩阵，函数：是一个正定函数。由方程(4．2—1)、(4。2—3)和(4。2—4)可导出：

将方程(4。2—5)入上式，可得第四十八页，共一百六十五页，编辑于2023年，星期三

(4·2—9)令

为某一矢量，则式(4·2—9)可写成

已知R正定，Q半正定，从而证明了函数是半负定的。最后，我们来证明函数沿着最优轨线不恒等于零。假设该因数沿着从某一非零初始状态出发的轨线恒等于零，则，由于矩阵R正定，因此，，又由此得出，闭环系统状态轨线与开环系统状态轨线相同，即

第四十九页，共一百六十五页，编辑于2023年，星期三同时，要使还要求；从而得出

已知，又得出了与阵对[A，D]完全可观测相矛盾的结果。因此，函数沿任一非零解的轨线不恒等于零。

小结

总结以上讨论，得到如下结果：如果阵对[A,D]完全可观测，而D是满足的任一矩阵，则函数正定，半负定且沿任一最优轨线不恒等于零。因此，是一个李雅普诺夫函数，闭环系统

渐近稳定。

第五十页，共一百六十五页，编辑于2023年，星期三

例4·2—2某机电系统用下列状态方程描述

其结构图如图4—6所示。如果把看作运动体的位置，是速度，那么，u可以看作是外力或力矩。给定性能指标

试设计一个最优调节器。

图4—6解：在这个例题中，，由给定矩阵可知

rank[B：AB]＝2因此，阵对完全可控，最优控制存在且唯一。再取＝[01]，可知，而且

因此，阵对[A，D]完全可观测，闭环最优调节系统渐近稳定。这个问题的代数黎卡提方程是第五十一页，共一百六十五页，编辑于2023年，星期三第五十二页，共一百六十五页，编辑于2023年，星期三展开以后得到下面3个方程：

其数值解为，0.1706，0.3162，0.8556由方程(4，2—3)和(4·2—4)，得到最优控制

图4—7是由控制对象和最优调节器千起构成的闭环系统结构图。第五十三页，共一百六十五页，编辑于2023年，星期三第五十四页，共一百六十五页，编辑于2023年，星期三例2·4—3

约定受控系统控制变量受不等式

约束，试求最优控制和轨线，使性能指标

取极小。假设终端状态未规定。第五十五页，共一百六十五页，编辑于2023年，星期三

解：这个问题的哈米尔登函数

伴随方程是

运用极小值原理可得第五十六页，共一百六十五页，编辑于2023年，星期三第五十七页，共一百六十五页，编辑于2023年，星期三在临界点充分小的邻域内，有第五十八页，共一百六十五页，编辑于2023年，星期三满足上式的有由伴随方程可知连续，故则有，因为如果与矛盾第五十九页，共一百六十五页，编辑于2023年，星期三因此有同理可证因此有第六十页，共一百六十五页，编辑于2023年，星期三第六十一页，共一百六十五页，编辑于2023年，星期三习题

约定受控系统控制变量受不等式

约束，试求最优控制和轨线，使性能指标

取极小。假设终端状态未规定。求q趋近无限大时的最优控制第六十二页，共一百六十五页，编辑于2023年，星期三自动调节系统广泛应用于过程控制等工业领域第六十三页，共一百六十五页，编辑于2023年，星期三第六十四页，共一百六十五页，编辑于2023年，星期三Honeywell

Honeywellproducesabroadportfoliooffrequencyconverters,heating

controlvalves,compressedairvalvesandwatercontrolproducts.

第六十五页，共一百六十五页，编辑于2023年，星期三第六十六页，共一百六十五页，编辑于2023年，星期三第六十七页，共一百六十五页，编辑于2023年，星期三

第六十八页，共一百六十五页，编辑于2023年，星期三问题4·2—1给定受控系统

和性能指标

试求最优反馈控制律，并证明闭环系统渐近稳定。问题4·2—2给定系统方程

和性能指标

试求最优反馈控制。

问题4·2—l

给定系统方程

和性能指标

试写出相应的黎卡提方程，并求最优控制u*。第六十九页，共一百六十五页，编辑于2023年，星期三

三、有扰动输入的线性调节器前两节讨论的最优调节器，适用于系统状态偏离了零状态或存在脉冲型扰动时，以某种最优方式把它转移到零状态的问题。但是，如果存在非脉冲型扰动，比如阶跃扰动，前面的调节器就不能使系统保持所要求的状态。这就是说，闭环系统是有静差的。在这一节里，主要针对恒值扰动和斜坡扰动来研究无静差节器的综合问题。考虑完全可控系统 (4·3—1)式中是某一恒值扰动矢量。我们的任务是设计一种线性最优调节器，使得当时间t趋于无限长时，状态矢量x(t)及其导数都趋近于零。显然，这意味着要求 (4·3—2)第七十页，共一百六十五页，编辑于2023年，星期三

如果存在一个矩阵M，使B2＝B1M，那么，我们就可以选取使条件(4·3—2)得到满足。现假设存在这样一个M矩阵。于是，方程(4·3—1)可以写成 (4·3—3)其中x(t)是n维状态矢量；u(t)是m维控制矢量；是m维扰动矢量，它的每一个分量都是阶跃函数；A是n×n阶常数矩阵，B＝B1是秩为m的n×m阶常数矩阵，且阵对[A，B]完全可控。选择性能指标 (4·3—4)式中Q和R分别是n×n和m×m阶半正定对称常数矩阵；S是m×m阶正定对称常数矩阵。第七十一页，共一百六十五页，编辑于2023年，星期三

现在的问题是在系统方程(4·3—3)的约束下，寻找最优控制u*(t)，使性能指标(4·3—4)取极小。令 (4·3—5)已知w(t)的每一分量都是阶跃函数，因此

于是 (4·3—6)定义新的状态矢量 (4·3—7)新的控制矢量 (4·3—8)和新矩阵 (4·3—9)第七十二页，共一百六十五页，编辑于2023年，星期三其中I是m×m阶单位矩阵，由方程(4·3—3)一(4·3—9)可建立增广系统 (4·3—10)和性能指标 (4·3—11)原系统状态矢量x(t)同输入矢量u(t)+w(t)组成增广系统状态矢量。v(t)是增广系统控制矢量。图4—8是增广系统结构图，它由系统(4·3—1)在输入端加入一个积分器组成。

图4—8这样一来，就可以把前两节的分析结果应用到，由增广系统(4·3—10)和性能指标(4·3—11)表示的最优调节器问题上。假设阵对完全可控，那么，基于系统(4·3—10)和性能指标(4·3—11)的最优控制存在、唯一，且为

第七十三页，共一百六十五页，编辑于2023年，星期三第七十四页，共一百六十五页，编辑于2023年，星期三或

(4，3—12)其中矩阵

是代数黎卡提方程 (4·3—13)的解，令，则式(4·l—12)可写成 (4·3—14)第七十五页，共一百六十五页，编辑于2023年，星期三再令

如果对于任一满足的D11和的D22，阵对完全可观测，那么，闭环系统

图4—9第七十六页，共一百六十五页，编辑于2023年，星期三第七十七页，共一百六十五页，编辑于2023年，星期三是渐近稳定的。因此有

在这里假设初始条件x(t。)＝0和u(t。)＝0，是为了突出扰动w对系统的影响。如果必要，x(t。)和u(t。)也可以不为零。由图4—8和方程(4·3—14)，可建立存在阶跃扰动时由最优调节器构成的闭环系统结构图，如图4—9所示。下面，对这个系统做进一步分析。利用方程(4。3—3)，输入u(t)十w(t)可以利用状态矢量x(t)及其导数表示成 (4。3—16)已知矩阵的秩为m，所以的秩为m，即满秩，因此，存在。第七十八页，共一百六十五页，编辑于2023年，星期三

将式(4。3—I6)代入式(4。3—14)，得到

令 (4·3—17)将它们代入上式，可很

对上式两边积分，得到

上式表示，最优控制可用一比例加积分状态反馈控制律来实现，用它构成的闭环系统结构图如图4—10所示。

图14—10第七十九页，共一百六十五页，编辑于2023年，星期三第八十页，共一百六十五页，编辑于2023年，星期三

w＝d＝常数和性能指标

试用本节讨论的方法设计线性最优调节器。解：对于这个例题，有

第八十一页，共一百六十五页，编辑于2023年，星期三容易验证，阵对完全可控，阵对完全可观测。因此，最优控制存在、唯一，并且闭环最优控制系统渐近稳定。将相应的矩阵代入黎卡提方程(4。3—13)，然后求解，可得

于是有

把它们代入方程组(4。3—17)，得到第八十二页，共一百六十五页，编辑于2023年，星期三

参照图4—10可建立无稳态误差的线性最优调节器闭环系统，如图4—11所示。利用方块图等效变换，图4—11可以变换成图4—12。图4—12表示这个系统的最优控制器相当于经典控制理论中的PJD控制器。图4—11图4—12图4—13图4—13表示初姑条件为，时的响应。实线是用本节讨论的方法设计的闭环系统的响应，虚线是用上一节介绍的设计方法设计的闭环系统的响应。图4。14是用上一节的方法设计的最优反馈控积系统结构队这个系统的控制器相当于经典控制理论中的PD控制器，如图4—15所示。

图4—14

图4—15第八十三页，共一百六十五页，编辑于2023年，星期三第八十四页，共一百六十五页，编辑于2023年，星期三第八十五页，共一百六十五页，编辑于2023年，星期三

例4·3—2给定完全可观测系统

其中为n维状态矢量；和分别是m维控制矢量和扰动矢量。假设的每—个分量都是斜坡函数，要求使扰动引起的稳态误差为零，试设计线性定常温优调节器。解：已知为斜坡函数，因此

令于是有第八十六页，共一百六十五页，编辑于2023年，星期三定义新的状态矢量和新的控制矢量u为和得到增广系统 (4·3—18)其中

选择性能指标

利用线性定常最优调节联军合方法，由方程(4。3—18)和(4·3—1g

可得第八十七页，共一百六十五页，编辑于2023年，星期三这里K＝[K1K2K3]是增益矩阵。图4—16表示在斜坡扰动作用下稳态误差为零的线性定常调节器构成的闭环系统结构图。这个结构图指出，增广系统包含了两个积分环节，这两个积分环节的数学模型正好是斜坡函数的数学模型。

问题4·3—1试将图4—16所示的斜坡扰动作用下无稳态误差的调节器，转换成控制矢量只与状态矢量有关的调节器。

问题4·3—2给定受控对象

其中x(t)为n维状态矢量；u(t)和w(t)是m维控制矢量和扰动矢量：A、B是具有适当维的定常矩阵。如果采用定常线性调节器对它实行控制，那么，1)扰动w(t)为阶跃加斜坡函数时要使稳态误差为零，最优调节器应具有什么样的结构?2)扰动为抛物线函数时，无稳态误差的调节器应具有什么样的结构?3)扰动为正弦函数时，利用线性调节器理论能综合出元稳态误差的调节器吗?为什么?第八十八页，共一百六十五页，编辑于2023年，星期三第八十九页，共一百六十五页，编辑于2023年，星期三

四、线性伺服系统（跟踪控制系统）前面三节讨论了几种线性最优调节器综合方法，这一节研究线性伺服系统综合方法。显然；如果伺服系统的参考输入恒为零，那么，伺服系统问题便退化成调节器问题。因此，调节器问题可以看作伺服系统问题的特殊情况，伺服系统问题则是调节器问题的一般化。在这一节里首先介绍线性伺服系统一般综合方法然后介绍一个实例。1．线性伺服系统给定线性时变系统

(4·4—1) (4·4—2)第九十页，共一百六十五页，编辑于2023年，星期三其中x(t)是n维状态矢量；u(t)是m维控制矢量；y(t)是l维输出矢量；A(t)、B(t)、C(t)分别是，n×n、n×m、l×n阶时变矩阵，它们的元都是时间的连续函数。性能指标为 (4·4—3)其中F、Q(t)是半正定对称矩阵；R(t)是正定对称矩阵；Q(t)和R(t)的元都是时间的连续函数；e(t)表示误差，即

e(t)＝z(t)—y(t)式中l维矢量；z(t)是指令输入，即参考输入。假设终端时间固定，u(t)不受限制。要求寻找最优控制u*(t)，使性能指标(4·4—3)取极小。第九十一页，共一百六十五页，编辑于2023年，星期三

既然伺服问题是调节器问题的一般化，那么，就可以来用同求解调节器问题类似的方法求解伺服问题。这个问题的哈米尔登函数是

应用极小值原理，由必要条件，可得控制方程为

R(t)u(t)十B(t)入(t)＝0于是，得到最优控制 (4·4—4)这个问题的伴随方程是

第九十二页，共一百六十五页，编辑于2023年，星期三

(4·4—5)方程(4·4—4)代入(4·4—1)，得到 (4·4—6)分析方便，令 (4·4—7)方程组(4。4—7)代入式(4·4—5)和(4·4—6)得到规范方程

(4·4—8)调节器问题的规范方程相比，这盟增加了够导右边的第二项。一项是由于指令输入z(t)引起的。第九十三页，共一百六十五页，编辑于2023年，星期三规范方程代表2n个一阶线性时变微分方程，求解规范方程需2n个边界条件，其中n个初始条件：

另外n个条件是终端横截条件： (4·4—9)用

表示系统(4·4—8)的状态转移矩阵，则

第九十四页，共一百六十五页，编辑于2023年，星期三

把上式展开，得到

(4·4—10) (4·4—11)式中

将式(4·4—10)代入(4·4—9)，得到 (4·4—12)由方程(4·4—11)和(4·4—12)消去，可得第九十五页，共一百六十五页，编辑于2023年，星期三 (4·4—13)式中 (4·4—14) (4·4—15)将式(4·4—13)代入(4·4—4)，得到最优控制

于是，求最优控制u(t)转化成求n×n阶距阵P(t)和n维矢量函数g(t)。但是，直接利用方程(4·4二14)和(4·4—15)来计算它们是很麻烦的。因此，应当考虑另外的求法。对方程(4·4—13)两边求导，得 (4·4—16)将方程(4·4—13)代入规范方程(4·4—8)的第一式，得列第九十六页，共一百六十五页，编辑于2023年，星期三

(4·4—17)将式(4·4—17)代入(4·4—16)，得

(4·4—18)再将式(4·4—33)入规范方程(4·4—8)的第二式，得到 (4·4—19)由方程(4·4—J18)和(4·4—19)消去入(t)。可得

上式对任意x(t)都成立，特别当x(t)＝0时也成立。因此，等号左边第二个方括弧内的项必等于零。由此又得出第一项也等于零。而墓(t)可任意，因此，上式左边第一项方括弧内的矩阵必等于零。于是，得到下面两个重要的方程：第九十七页，共一百六十五页，编辑于2023年，星期三

(4·4。—20)和

(4·4—21)方程(4·4—20)和(4·4—21)分别代表，n×n个非线性时变一阶微分方程和n个线性时变一阶微分方程。它们的边界条件可用下述方法求得，即由方程(4·4—13)当时，有 (4·4—22)由方程(4·4—9)和(4，4—22)消去，可得

由于上式对任意都成立，由此可求出方程(4·4—20)和(4·4—21)的边界条件：第九十八页，共一百六十五页，编辑于2023年，星期三

小结总结以上分析，得到如下结果：给定线性时变系统

其中x(t)是n维状态矢量；u(t)是m维控制矢量；y(t)是l维输出矢量；A(t)、B(t)、C(t)分别是，n×n、n×m、l×n阶时变矩阵。性能指标为

其中F、Q(t)是l×l阶半正定对称矩阵；R(t)是m×m阶正定对称矩阵e(t)=z(t)—y(t)是l维误差矢量；z(t)是1维输入矢量，终端时间固定。第九十九页，共一百六十五页，编辑于2023年，星期三

如果u(t)不受限制，则使性能指标J取极小的最优控制是

其中n×n阶时变矩阵P(t)是黎卡提方程和边界条件

的解。n维矢量函数g(t)是矢量微分方程

和边界条件

第一百页，共一百六十五页，编辑于2023年，星期三的解。最优轨线是矢量微分方程

和初始条件

的解。

例4·4—1给定受控系统

和性能指标

第一百零一页，共一百六十五页，编辑于2023年，星期三试设计线性最优伺服系统。解：在这个例题中

把它们代入相应的方程，得到最优控制 (4·4—23)相应的黎卡提方程和边界条件是

第一百零二页，共一百六十五页，编辑于2023年，星期三和

把黎卡提方程展开，得到下面3个一阶非线性微分方程

当时，得到上述方程组的稳态解，即

将代入方程(4·4—23)，得 (4·4—24)矢量函数是矢量微分方程第一百零三页，共一百六十五页，编辑于2023年，星期三

和边界条件

的解。当时把的稳态解代入上面的方程，经过化简以后，得到

要求出和必须知道函数z(t)。假设，则可解出上述方程组当时的极限解：第一百零四页，共一百六十五页，编辑于2023年，星期三

把它代入方程(4·4—24)，得到时的最优控制为

由于

因此得到

这就是已知参考输入函数为时最优伺服系统控制器方程。由控制对象方程和控制器方程，可作出线性最优伺服系统结构图，如图4—17所示。第一百零五页，共一百六十五页，编辑于2023年，星期三第一百零六页，共一百六十五页，编辑于2023年，星期三跟踪控制系统广泛应用于武器瞄准，制导，探测系统；飞行器、机器人导航控制系统；机动目标跟踪第一百零七页，共一百六十五页，编辑于2023年，星期三"密集阵"近程防御武器系统（CIWS美国“密集阵”舰载近程防御武器系统（CIWS第一百零八页，共一百六十五页，编辑于2023年，星期三俄罗斯日炙反舰导弹第一百零九页，共一百六十五页，编辑于2023年，星期三舰载雷达系统第一百一十页，共一百六十五页，编辑于2023年，星期三美国“铺路爪”远程预警雷达系统预警雷达可监控3000公里外的导弹第一百一十一页，共一百六十五页，编辑于2023年，星期三第一百一十二页，共一百六十五页，编辑于2023年，星期三美军新一代制空战斗机——F—22“猛禽”已在爱德华兹空军基地开始进行正式装备部队前的首次战斗飞行测试。第一百一十三页，共一百六十五页，编辑于2023年，星期三

2．线性伺服系统设计举例前面介绍了线性伺服系统的一般设计方法。但是，要设计出一个实用的最优伺服系统，设计人员采用的具体方法不尽相同。下面，以一种高精度直流伺服系统的设计为例，介绍一种实际的最优伺服系统设计方法。(1)控制对象状态方程对于直流伺服系统，带负载的直流伺服电机是控制对象。根据控制对象应满足的物理规律，可列出电压平衡方程：第一百一十四页，共一百六十五页，编辑于2023年，星期三 (4·4—25)力矩平衡方程， (4·4—26)和

(4·4—27)式中越是加在电枢两端的电压；是电枢电流；是电枢回路总电阻；L是总电感；Ke、Km是电，机常数；是角位置；是角速度；J是电机轴上的总转动惯量；表示摩擦力矩，它同角速度之间的关系如图4—18所示。第一百一十五页，共一百六十五页，编辑于2023年，星期三第一百一十六页，共一百六十五页，编辑于2023年，星期三

图4—18

假设电枢电感忽略不计，由式(4·4—25)一(4·4—27)，可得

或

定义

为一组状态变量，可列出状态方程：

其中第一百一十七页，共一百六十五页，编辑于2023年，星期三

考虑到补偿摩擦力矩的影响，降低系统对参数变化的灵敏度，引入二个新的状态变量。即

注意到，因此有 (4·4—29)令将方程(4·4—28)同(4·4—29)联立，得到增广系统 (4·4—30)其中

容易验证：第一百一十八页，共一百六十五页，编辑于2023年，星期三系统满足完全能控的充分必要条件。(2)指令信号发生器状态方程假设z(t)是指令信号，为一阶跃加斜坡加抛物线函数：

因此，有

选择

作为一组状态变量，可建立指令信号发生器状态方程 (4·4—31)其中第一百一十九页，共一百六十五页，编辑于2023年，星期三

指令信号发生器状态矢量是直接可观测的。(3)综合最优控制由式(4·4—30)、(4·4—31)可建立带有指令信号发生器的广义控制对象状态方程，即

其中

取二次型性能指标

其小Q和r分别是给定权矩阵和权系数。性能指标(4·4—32)可写成：

第一百二十页，共一百六十五页，编辑于2023年，星期三式中

使上述性能指标取极小的最优控制为 (4·4—33)其中为增益矩阵。矩阵

是黎卡提方程

第一百二十一页，共一百六十五页，编辑于2023年，星期三的解。将式(4。4—33)展开，可得

(4·4—35)其中

由增广系统状态方程(4·4—30)和最优控制器方程(4。4—35)，可建立最优伺服系统结构图，如图4-19所示。

第一百二十二页，共一百六十五页，编辑于2023年，星期三第一百二十三页，共一百六十五页，编辑于2023年，星期三

图4—19将黎卡提方程(4·4—34)展开，得到关于状态变量的黎卡提方程为 (4·4—36)式中

将有关的矩阵代入方程(4。4—36)，再求解，便可求出矩阵P。

将r、B及P的表达式代入方程(4·4—35)右边第一项，可得第一百二十四页，共一百六十五页，编辑于2023年，星期三

因此

注意到

于是得到

如果初始条件，则

(4·4—37)第一百二十五页，共一百六十五页，编辑于2023年，星期三

关于状态变量的黎卡提方程为 (4·4—38)其中

将矩阵Q、Az、B以及前面求出的P代入式(4。3—38)，再求解，便可求出矩阵。将r、B及，的表达式代入方程(4·4—35)右边第二项，可求出第一百二十六页，共一百六十五页，编辑于2023年，星期三

和 (4·4—39)由方程(4·4—28)、(4·4—35)、(4·4—37)和(4·4—39)可建立最优伺服系统结构图，如图4—20所示。图4—21是相应的机电原理图，图中计算机部分可用高精度运算放大器构成。

图4—20

图4—21第一百二十七页，共一百六十五页，编辑于2023年，星期三第一百二十八页，共一百六十

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

线性最优控制

文档简介

温馨提示

最新文档

评论

线性最优控制

文档简介

温馨提示

最新文档

评论

相关文档