第6章最优控制的基本理论及应用

上传人：唯*** IP属地：河北上传时间：2024-10-16 格式：PDF 页数：144 大小：18.36MB 积分：12 举报 版权申诉

已阅读5页，还剩139页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

,孑工常出版u

JSHINGHOUSEOFELECTRONICStNDUSTRV

第6章最优控制的基本理论及应用

6.1引言

6.2最优控制问题的提出及数学描述

6・3变分法

6・4极小值原理

6・5动态规戈ll法

6.6二次型最优调节器

6.7最小时间控制

6.8应用MATLAB解二次型最优控制问题

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

6.1引言

最优控制理论是现代控制理论的核心。

从数学的观点看,最优控制研究的问题是求解一

类带有约束条件的泛函极值问题,本质上是一个变分

学问题。变分法是数学的一个古老的分支,起源于17

世纪。经典变分理论只能解决控制无约束即容许控制

属于开集的一类最优控制问题,但实际上遇到更多的

却是容许控制为闭集的一类最优控制问题。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

针对经典变分法的局限性,美国学者贝尔曼在

1953〜1957年间创立了“动态规划”，发展了变分学

中的哈密顿-雅可比理论,解决了控制有闭集约束的

变分问题；而前苏联学者庞特里亚金等则在1956〜

1958年间创立了极小值原理，也发展了经典变分原

理,成为处理控制有闭集约束的变分问题的强有力工

具。

八本章在介绍解决最优控制问题3种基本方法（变分

法、极小值原理和动态规划）的基础上，阐述两类典

型最优反馈系统的设计，即线性二次型最优控制和最

小时间控制。

,孑工常出版u

JSHINGHOUSEOFELECTRONICStNDUSTRV

6.2最优控制问题的提出及数学描述

6.2.1最优控制问题实例

1.最速升降问题

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

设有一物体M,作垂直升降

运动，如图6T所示，这里M

可以理解为一架直升飞机或

矿井中的升降机。假定在M

内部装有一个控制器，它可

以产生一个作用力〃⑺，从

而控制物体M的上下运动，

由于作用力的大小有限，所

以应满足不等式,")|工友，图6-1最速升降问题示意图

其中人是常数。设已知四在:/

时，离地面的高度为x«o),垂直运动的速度为交4),

问题是寻找作用力"(力的变化规律，使Af最快到达

地面，并使其到达地面时的速度为零。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

令物体M的质量为加，用x⑺表示"离地面的高度,

其方向规定为地面上x⑺为正，在地面下x⑺为负。作

用力”⑺是向上为正，向下为负，则物体M的运动方程

为

dx(Z)

........-=a3-mg

式中,加g为物体所受重力,g为重力加速度。

_dY__

令"iQ)="Q)表示物体的高度，⑺=一表示

物体的升降速度，则上式可写成状态方程

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

x｝。)=x2Q)

x2(t)=u(J)—mg

其初始条件是/。0)=/0，工2。0)=X20。现需寻找

一个能使物体以最短时间从初态(乙。.2。)到达终态

(0,0)的控制〃⑺。定义系统的性能指标为

J~=tf-"。

式中，％。为起始时刻，G为终止时刻。要求时间最短,

即使性能指标/最小，这样求得的控制即为最优控制

“*⑺。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

2.搅拌槽问题

设有一盛放液体的连续

搅拌槽，如图6-2所示。槽内

装有不停转动着的搅拌器S,

使液体经常处于完全混合状

态，槽中原放。七的液体。

现需将其温度升高，为此在

入口处送进一定量的液体，

其温度为〃（力，出口处流出图6-2搅拌槽问题示意图

等量的液体，以保持槽内液

面恒定。试寻找"（方）的变化规律，使槽中液体温度

经1小时后上升到40℃,并要求散失的热量最小。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

因假定槽中液体处于完全混合状态，故可用X⑺

表示其温度。由热力学知，槽中液体温度的变化率与

温差［"0—XQ)］成正比，为简便计算，令比例系数为1,

于是有

dx(/)

----="Q)—x(t)x(0)=0

dt--------------------'

在1小时内散失的热量为

/9o

JQ)=fYqx(Z)+ru(Z)］d/

式中,都是正的常数，%=。，G=1O因此该最优控

制问题是：寻找〃⑺的变化规律，使槽中液体经1小时

后从0。。上升到40。5并要求散失的热量最小，即/(〃)

取最小值。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

6.2.2最优控制问题的数学描述

综观以上实例，构成最优控制问题必须具备以下

几个基本条件：

1.被控系统的数学模型，即动态系统的状态方程

状态方程在最优控制中为等式约束条件。

2.控制变量的约束条件（容许控制）

任何实际物理系统，控制变量总是受约束的，一

般可写成

u（t）^u（6-3）

式中，。表示一个封闭的点集合，称为控制域。此时称

"⑺为容许控制。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

3.状态方程的边界条件（初始状态和终值状态）

在最优控制问题中，"L时的初态通常是已知的，

即

X«O）=Xo（6-4）

而终值状态可以是状态空间中一个确定的点，也可以

是状态空间中某一个点集（目标集）中的任一点。到

达终端的时间」和终值状态X。/因问题而异。就终端

时间前来说，它可以是固定的，也可以是变动的或自

由的。最通常的终值边界条件是

x(tf.)=xf.(6-5)

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

但有时并不这样简单，如用导弹攻击运动的目标,

终值是可能运动轨迹上的一个点，此时终值状态是受

运动轨迹约束的，一般地约束可表示为

g.(xrtf)=O,i=l,2…，/(Z<n)(6-6)

4.性能指标，也称性能泛函或目标函数

性能指标是衡量系统在任一容许控制作用下性能

好坏的尺度,在最优控制中其代替了传统的设计指标

（如超调、调节时间、幅值裕度和相角裕度等）。

1)积分型性能泛函

J=广L(x(t),u(t),t)At(6-7)

J"o

2)终值型性能泛函

J=(6-8)

3)复合型性能泛函

—

J=①[xQ/)"/]+『7L[xQ),M(Z),Z]d/(69)

国甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

最优控制问题，就是从可供选择的容许控制集

。中，寻求一个控制向量"（方），使被控系统在时间

域瓦4］内，从初态转移到终态x（tf）或目标集

Wtf）eCf时，性能泛函/取最小（大）值。

6.3.2亦A

633

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

6.3.1变分法的基本概念

1.泛函

泛函是函数概念的一种扩充。如果对于某一类函

数集合相⑺｝中的每一个函数、（方），因变量J都有一个

确定的值与之对应，则称因变量，为这个宗量函数X⑺

的泛函数，简称泛函，记作」=小（勿。可见,若一个

因变量的宗量不是独立自变量,而是另一些独立自变

量的函数，该因变量则为这个宗量函数的泛函，因此

泛函可理解为“函数的函数”，其值由宗量函数的选

取而定。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

与多元函数的宗量（自变量）多于一个相类似，

多元泛函的宗量函数则多于一个,这些宗量函数可以

表示为一个向量。例如，在控制系统中，〃维状态向

量X⑺为时间，的函数,若取如下形式的积分型性能指

标

J=广L\^x(t)x(t),Z]dZ

“()f(6-11)

则/的数值取决于〃维向量函数工⑺，故式（6-n）为

（多元）泛函。

2.泛函的连续与线性泛函

(1)若对任给的£＞。，存在3＞。，使得当

卜一45时，就有

«7[%(0]-J[x*(0]＜£(6-12)

则称泛函在函数X*Q)处是连续的。

(2)连续泛函人灯若满足以下条件

J\kx\—kJ\x\(6-13)

4均+X/=(6-14)

则称JE是线性泛函。式中左是实数,乙，为为函数空间

中的函数。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

3.泛函的变分

宗量函数变分的定义设为连续泛函，则

宗量函数x⑺的变分为属于同一函数类中两个函数

X⑺，“。0)之差，即

<5x(r)=xQ)-%Q)(6-17)

泛函变分的定义设J[xQ)]为〃维线性赋范空

间R"上的连续泛函，若其增量可表示为

A7[x]=J[x(t)+3xQ)]-(6—]8)

=3x(jy\+SxQty]

式中,以⑺为宗量函数X⑺的变分，区(次是以⑺

的线性连续泛函,。[xQ),取⑺]是关于&Q)的高阶无穷

小,则定义泛函增量的线性主部

3J=乙[x(t),<5"«)](6-19)

为泛函J[xQ)]的变分，记作“o若泛函有变分，则

称该泛函可微。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

与函数的微分等于函数的导数与自变量的微分之

乘积相对应，泛函变分也可利用求导的方法来计算,即

a/J

3J=--(J[x(，)+£<ivQ)])o<£<i(6-20)

de2=0

【例6-1】求泛函J=J'%2⑺d.的变分，其中，工⑺

为标量函数。

解由式(6-20)得

d,、td2

——(y[x(0+g&Q)])—[x(0+g&Q)]2dt\1

8J=VZ7——[%«)+£&(，)]

口c00

de£1=0de£*=0

=/，2[x(?)+£&(，)]&(，)dt=「/2jr(Z)<Sx(?)d?

"oe=0zo

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

4.泛函的极值与泛函极值的必要条件

如果泛函在任何一条与X*⑺接近的曲线上

所取的值不小于,即

A7=J[xQ)-J[x*(Z)]>0(6-21)

则称泛函4xQ)］在曲线“*Q)上达到极小值。反之,

若

A7=-J[x*(/)]<0(6-22)

则称泛函J［x(z)］在曲线X*⑺上达到极大值。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

定理6-1（泛函极值定理）若可微泛函4x（列在

工=%*«）上达至口极值,贝1JJ[xQ）]在x=x*Q）上的变

分等于零，即

6J=0（6-23）

定理6-1表明，泛函一次变分为零,是泛函达到极

值的必要条件。

综上可见,变分在泛函研究中的作用，相当于微

分在函数研究中的作用。事实上，求泛函极大（小）值

问题称为变分问题,求泛函极值的方法称为变分法

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

6.3.2用变分法求解无约束条件的泛函极值问题

设积分型性能泛函为

J=「/L^x(t)x(t)t^t(6-24)

%ff

在区间上0，。］上，被积函数4xQ),工Q"二次连续可微，

轨线工⑺有连续的二阶导数，双…",对工⑺没有任何

约束。要求确定极值轨迹x*Q),使泛函/为极值。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

1.始端时刻和终端时刻固定时的泛函极值问题

首先讨论不仅初始时刻L、终端时刻）固定，而

且初始状态x（t°）=~、终端状态必斗）=壬固定这一最

简单情况下无约束条件的泛函极值向题（营优控制的

基本问题）。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

定理6-2设初始时刻L和初始状态x(t0)=x。

固定，且终端时刻的和终端状态xQf)=z固定，贝I]

使性能泛函式(6-24)取极值的必要条件是：x⑺

为二阶微分方程

手-"(欧拉方程)(6-25)

OXCitox

Ttf

(dL、

J取=°(横截条件)(6-26)

，0

的解。其中在区间及上，"x«)，工Q"二次连续可微，

了⑺有连续的二阶导数，xQ)e7T,对工⑺没有任何约

束。

证明设X*(t)是使两极小值J*的最佳轨迹曲线,

现在X*(t)邻近作一^微小摄动,并令

xQ)=x*Q)+卬Q)(6-27)

式中房是一个很小的参数，为任意选定的连续可微〃

维向量函数且满足

，("o)=，Q/)=〃(6-28)

将x(t)=%*«)+£〃(t)和=，*«)+切Q)代入式

(6-24)可得

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

tdJc

J(£)=J，L[x(z)+刁Q),x(Z)+丽Q)"]d才

取泛函增量

A7(&)=J(&)—J(0)=j/Z[xQ)+切Q),\Q)+切Q),4d,—j/N[xQt),x(/),Qdt

将上式在2=0的邻域内展开成泰勒(Taylor)

级数，则

t「dL,~\

所(%)+夫

23=%!二切⑺+|dz(6-29)

dxyJ

式中，夫表示泰勒（Taylor）级数展开式中的高阶项。

国甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

如果定义X⑺和Wt)的一阶变分为

dx=£"Q),dx=£力3(6-30)

由泛函变分的定义，泛函的一阶变分为

(dL\(6-31)

3x+----Sx|d.

^dxy

对上式积分中第二项作分部积分后可得

t(3LdazV

6J=\f——Sxdt+----Sx(6-32)

%(Sxdtdx)

由定理6-1，泛函取极值的必要条件为其一次变分

为零,故令＜v=o,并考虑到式(6-32)中必是任意的,

即可证得定理6-2的结论式(6-25)和式(6-26)。

在to、0、x(t0)=、x«f)=Xf均固定的情况

下，有)=〃和…)=。，这时定理6-2中的横截条件

式(6-26)退化为已知的两点边界值*3)=%和x«f)=壬,

即求解欧拉方程的边界条件为x(t0)=X。，x«f)=壬。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

在讨论固定端点问题的基础上，讨论自由端点问

题。若小」均固定但有一个端点[x(t0)或xQf)]

或两个端点自由时，没有约束条件的泛函式(6-24)

极值仍应满足式(6-25)所示的欧拉方程及式(6-26)

所示的横截条件,求解欧拉方程所欠缺的边界条件则

应由横截条件补足。例如，若小小x(t0)=x。均固

定，终端x(")自由，这时有3x(10)=0)彳)力0，则

由横截条件式(6-26)有

叱=0(6-35)

"t=tf

式(6-35)和已知的始点边界值~合起来构成该

情况下的边界条件。

【例6-2】设泛函为

一22

J=]*/(文I+x2+2x1x2)dt

边界条件为项(0)=x2(0)=0，x1(一)=x2(—)=1,

求/为极值时的曲线x*Q)。

解本例泛函为二元泛函，即“=卜与『，被积函数

为

L—xx+x2+2X}X2

「"1「"1厂.「厂1

IJllJ”T2x2naL1^1「2兄]色匹

SxIILIJ派II\_2X2\dxdt[_2X2J|_2戈2_

1_"2」[质2」

dLddL

代入欧拉方程..------=0

dxdtdx

「2与1「2%~|_「01

得_2xJ[2又2」—[。_

展开并联立方程组为

X1--

X-x2

xlO

其通解为

国甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

/、t一t.

Xj{t}=cxe+%e+c3sint+oncost

f-z

x2(Z)==c}e+c2e—c3sint—c4cost

代入已知的两点边界值，求出

111

/，C2=/，CC。

q―产-产2sh5小〜2sh5m34

*sh/

故极值曲线为X]Q)=%2Q)=/

sh(7r/2)

2.终端时刻未给定的泛函极值问题（可变端点问题）

若始端时刻前给定，始端状态x（t。）固定或沿规定

的边界曲线移动，而终端时刻」自由，终端状态x（tf）

自由或沿规定的边界曲线移动，则这类最优控制问题

称之为未给定终端时刻的泛函极值问题。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

定理6-3设轨线x⑺从固定始端工3)=%到达给

定终端曲线”f)=C(tf)上，使性能泛函

J=jz>(xQ),文«),，)力彳(6~36)

取极值的必要条件是：轨迹满足下列方程

匹—色2=0(欧拉方程)(6-37)

dxdtdx

G+[C(t)-土Q)]—1=0(终端横截条件)(6-38)

I"Jt=tf

式中,x(。应具有连续的二阶导数，£至少应二次连续可

微，。⑺应具有连续的一阶导数。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

关于定理6-3的说明:

(1)定理6-3适用于始端时刻t。、始端状态x(t°)=%

给定,终端时刻tf自由但终态应落在端点约束

x(tf)

曲线。⑺上(即终端约束方程为xQQ=CQ/))的情况，

这时仅已知始点％(%)=%，而终点未知，因止匕,求解欧

拉方程所欠缺的边界条件应由终端横截条件式(6-38)

补足。式(6-38)确立了在终端处右⑺和及Q)之间的

关系，并影响着x*(t)和终端约束曲线。⑺在9时刻

的交点。

国甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

（2）可将定理6-3对x⑺是标量函数时所得到的公式

推广到x⑺、。⑺是〃维向量函数的情况，即可得向量形

式的泛函极值必要条件

匹—色匹=〃（欧拉方程）（6-39）

dxdtdx

L+[c（t）-x{ty]T—i=o（终端横截条件）（6-40）

6.3.3有约束条件的泛函极值问题

求泛函在等式约束下的极值，称为条件泛函极

值问题。应用拉格朗日乘子法，可将这类条件泛函极

值问题转化为无约束条件的泛函极值问题。

国甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

最优控制问题中的性能泛函为

J=①[xQ/）工尸]+j[〃xQ）,（6-41）

JJ"%

式中,泛函」所依赖的宗量函数”⑺、〃⑺受被控系统的

状态方程约束，即

£。）=/[%。）,〃（。订（6-42）

工I中9xwR"，"三R',/[*（，）,“（，）,，]（，）、〃（%）才口t

的〃维连续向量函数。最优控制问题是寻求最优控制

，⑴及最优状态轨迹-⑴，使系统式（6-42）从初始状

态xQ0）=x0转移到终端状态”（不），并使/取极值。

若初始时刻，。及始端状态x«o）=Xo给定，按照

终端状态边界条件，讨论以下几种情况。

■给定，终端xQ/）自由

■G给定，终端xQQ约束

■自由，终端xQ/）约束

国甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

1.1尸给定，终端x(%/)自由

将状态方程式(6-42)写成约束方程形式

/[xQ),w(/)9Z]-x(t)=0(6-43)

仿照求函数条件极值的拉格朗日乘子法，将等式约束

式(6-43)和原有的指标泛函结合成增广泛函

J'=中[x(0)""+£'{L[xQ),〃Q)"]+：7(，){/[XQ),x(t)}}dt

/J"o

(6-44)

式中,：(t)w”，为待定拉格朗日乘子向量函数。显然，

不论:⑴取何种函数，只要工⑺、〃⑺满足等式约束(6-

43),即满足系统的状态方程式(6-42),则/与/总是等价

的。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

定义标量函数

T(6-45)

/Z[x,W,=Z[AT,U„t\-\-X/[x,

为哈密顿(Hamilton)函数，则增广泛函式(6-44)可

写为

J=①[xQ/),品]十f/z{7/[x(Z),o(Z),2(Z),t2—Ar«)，")}(1%(6-46)

对式(4-46)右边最后一项进行分部积分，即

『一人也=『,「Xd,_:丁X'/(6-47)

%%?0

故增广泛函式(6-44)可写为

J'=/),，/]一2/(才)x(才)+j[{//[x(Z),«(/),2Q)"]+)7«)x(才)}d/

(6-48)

设xO),〃⑺相对于最优值x*Q),〃*«)的变分分

别为必和(5〃,且注意到xQo)="0，则以(，0)=。，故式

(6-48)所示/的一阶变分为

丁T,「dHdH丁.

"=(------)区(乙)一：区Q/)+「(——)T取+(——)堤+：T取dz

&rQ/.)Z°dxdu_

(6-49)

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

令犷=0，因为以、以巴)及前任意，则得增广泛

函/取极值的必要条件，再由约束方程式(6-43)及定义

的哈密顿函数式(6-45),得在t0及始端状态xQo)=X。给

定、弓给定、终端xQ/)自由情况下，满足状态方程式

(6-42(的泛函式(6-41)取极值的必要条件为同时满足

X—---=f(X,U,(状态方程)(6-50)

dH(协态方程)(6-51)

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

dH（控制方程）(6-52)

------=0

S①（横截条件）(6-53)

：(tf)=

dx(tf)

)=X。（始端边界条件）(6-54)

式（6-50）、式（6-51）和式（6-52）相当于前面的欧拉方程,

式（6-53）为横截条件。式（6-50）为系统状态方程，其与式（6-

51）的右端均为哈密顿函数的适当偏导数,故式（6-50）和式

（6-51）合称为哈密顿正则方程，简称为正则方程。式（6-51）

则称为伴随方程或协态方程，相应的拉格朗日乘子向量幺又

称为伴随向量或协态向量。式（6-52）表明，最优控制"*«）使

哈密顿函数取驻值，故式（6-52）称为控制方程。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

2.，/给定，终端x(G)约束

设终端状态应满足如下目标集等式约束条件

2V[x(G),品.]=°(6-55)

式中,.£巾，即终端状态x(i)沿规定的边界曲线移

动。现在存在状态方程约束式(6-43)和终端边界约束

式(6-55)这两种类型的等式约束,为此除了引入待定的

〃维拉格朗日乘子向量函数：⑴，再引入一个待定的乘

子向量分，且加R“，构造增广泛函

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

J'=中[x(G),0]+tfN.f)"/]+J,«(/),/]+A7M(O,d-£«)}}dz

=①[x«/),o]+B'N'x*»tf]+£：(a(x«),w(r),-乃⑺士⑺拉

=①[x(G),弓]+"7V[x(")"/]—/Q/)x«/)+JTa)xQ°)+J；(H(x()«(/),2(r),Z)+乃《)xQ)拉

(6~56)

式中，哈密顿函数R[x,〃,入口仍由式(6-45淀义。

同样，设工⑺，〃⑺相对于最优值x*«),"*Q)的变

分分别为必和3"，且注意到〃Qo)=。,故式(6-56)所

示了的一阶变分为

T、

s0dNT।t(OHQH丁

6J'=--+-------------fi~7。/.)取Q/.)++ASx+(-----)3uxi/

皿的)Sx(J)J°ISx)du

(6-57)

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

令犷=0，并由式(6-42)、式(6-55)及式(6-45),得

当“0及始端状态x«o)=*0给定、才/给定、终端状态

xQf)受目标集等式约束式(6-55)情况下，满足状态方程

式(6-42)的泛函式(6-41)取极值的必要条件为同时满足

正则方程.更x=-----=(6-58)

dx52

控制方程------=0(6-59)

边界条件与横截条件

xQo)=Xo，7V[x(i)"/]=0(6-60)

S①[xQ/),Z/]dNT[AT(Z/]

=--------+------——P(6-61)

dx(t)dx^t.)

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

3.自由，终端x(G约束

在这一类问题中，终端时刻，/为待求的变量，且终

端状态又受式(6-55)所示的目标集等式约束。显然，终

端时刻G自由时所讨论的问题,除了)自由之外，其余

与终端时刻给定时所讨论的内容相同。

和弓给定时终端状态受约束的最优控制问题一样,

引入待定的拉格朗日乘子向量:⑴右内和"尺"构造

增广泛函(参见式(6-56))

「=①[X。/),G)"/]T7(弓)x(G)+/Q0)xQ0)+

J(2/(AT(Z),〃Q),2Q)")+尸Q)xQ))dZ

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

式中，哈密顿函数］仍按式(6-45)定义。但与

6给定情况不同的是，现在的也是需要进行最优选择

的变量。设工⑺、〃⑺、的相对于其最优值x*Q)、以*Q)、

了的变分分别为取>Su、拉，即

x«)=x*Q)+c5xQ),w(Z)=w*(t)+(5w(z),Zz.=Z*.+3tf(6-62)

且有如下近似关系式

dx(tz)=<5x(Z*)+文Q；)<5，/(6-63)

考虑到取Qo)=。，则由必、以(如)、du、3tf产生

的增广泛函J'的一次变分为

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

aoTdN

6J'=+P-------+H[x{t),u{t..),A(Z.),/z]

dt,---------dt,

\Jfy(6-64)

d①dNe\(dHdH下

++p~:(jf)——+6x+(--)---3u

Sx(t)dx{t)kdx7du

―/ff-/_**

令”=0,因为以、—Q/)、3"及为任意,则得增

广泛函/取极值的必要条件，并由式(6-42)、式(6-55)及

式(6-45),得当%。及始端状态xQo)=x0给定、的自由、

终端状态x(G)受式(6-55)约束情况下,满足式(6-42)的

泛函式(6-41)取极值的必要条件为同时满足

正贝ll方程一色-，x==(6-65)

dxaz

控制方程—(6-66)

边界条件与横截条件

(6-67)

xQo)=〜，N[x(Jf)"/]=〃

S①[xQ]S7V丁

：(6•)=------------+----------------—一P(6-68)

dxQ,)dvQ/)

aa>[x(Z),/]S2V[xQ),/]

H[xQ),“Q),：«)"]+------------------—+p------------------—=0(6-69)

dtfdtf

式中,〃[x（o.）,吟）,“）,金.]为哈密顿函数H在最优

轨迹终端处的值。

【例6-3】设被控系统的状态方程为

「。11「01

±Q)=xQ)+w(Z)

0oj|_1_

设初始状态为x(0)=。，终端状态约束曲线为

X,(l)+X2(l)-l=0,求使目标函数J=取极小

2°

时的最优控制"*(,)和最优轨迹『⑺o

解构造哈密顿函数

H=L/f=—〃2+义“+九"

J1NN

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

正则方程为

dH.dH（协态方程）

A,———---------=0,A:

2=—4

dxxg

dHdH（状态方程）

X।2------=u

叫弘

控制方程------=u+义2=0

它们的通解为

义1=,义2

U——

1312

Xj=一Ct——C+C^t+C7,x

{42一G2-、+G

622

边界条件与横截条件

3(0)=0,、2(°)=。

X1(1)+%2⑴T=0

dNdN

刈(1)=------P=P乙(D=-------

dx](1)dx2(1)

代入通解，得G=/3,c2=2/3,c3=0,C4=o=—1

则最优控制〃*Q)=一一,+—

最优轨迹x/co=-—t3+—t2,%2*Q)=——J+-,

147147

6.4极小值原理

在用经典变分法求解最优控制问题时，假定控制

变量〃⑺不受任何限制，即容许控制集合可以看成整

个「维控制空间开集，控制变分"是任意的，同时还

要求哈密顿函数H对“连续可微，在这种情况下，应用

变分法求解最优控制问题是行之有效的。

但是在大多数情况下，控制量的大小总是受限制

的，即

u\<a,（2=1,2,…，尸）（6-70）

这时容许控制"⑺的集合是一个升维有界闭集。一般总

可用如下不等式表示容许控制〃⑺的闭集约束条件，即

国甯孑工学出版4出

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

>0(6-71)

当容许控制集合"⑺属于有界闭集时，控制变分0"

在容许控制集合边界上不能任意，最优控制的必要条

件=〃亦不满足，则不能用经典变分法处理。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

针对经典变分法应用条件过严的局限性,前苏联

学者庞特里亚金等发展了经典变分原理,在1956〜

1958年间创立了极小值原理。极小值原理由变分法引

伸而来，它的结论与经典变分法的结论有许多相似之

处，这一方法当控制变量"⑺受闭集约束时是行之有

效的，并且不要求哈密顿函数网"⑺连续可微，是

控制变量"⑺受限制时求解最优控制问题的有力工具,

而且极小值原理也可用于解决控制不受约束的最优控

制问题，因此其是解决最优控制问题的更一般的方法。

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

定理6-4(极小值原理)设系统状态方程为

土(t)=w(t),z](6-73)

初始条件为xQ0)=~固定，6固定(6-74)

控制约束为w(/)eU,g[x(t),〃(t)"]N0(6~75)

终端约束为，弓自由(6-76)

式中x(t)为〃维状态向量;控制〃(t)属于「维空间中的有

界闭集。，受不等式(6-75)约束;g为/维连续可微向量函

数，/w〃;N为g维连续可微向量函数o

性能泛函为

J=中[x(金)"/]+『w(t),/]d/(6-77)

宣甯孑工学出版制・

PU0USHINGHOUSEOFELECTRONICSINDUSTRY

式中，①和L为连续可微的标量函数

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第6章最优控制的基本理论及应用

文档简介

温馨提示

最新文档

评论

第6章 最优控制的基本理论及应用

文档简介

温馨提示

最新文档

评论

相关文档

第6章最优控制的基本理论及应用