变分法与最优控制.ppt

上传人：y*** IP属地：广东上传时间：2020-01-18 格式：PPT 页数：85 大小：2.03MB 积分：30 举报 版权申诉

已阅读5页，还剩80页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第二讲变分法与最优控制主要内容 2 1变分法概述2 2无约束最优化问题无约束固定端点泛函极值必要条件无约束自由端点泛函极值必要条件2 3等式约束最优化问题2 4变分法求解最优控制问题引入哈密顿函数求解拉格朗日问题求解综合型波尔扎问题 2 1变分法概述1 泛函定义2 泛函的连续性3 泛函的极值4 线性泛函5 泛函的变分6 泛函变分的求法7 泛函变分的规则8 泛函极值的条件 2 1变分法概述 1 泛函定义定义如果变量y对于某一函数类中的每一个函数x t 都有一个确定的值与之对应那么就称变量y为依赖于函数x t 的泛函记为 y J x t 说明由于函数的值是由自变量的选取而确定的而泛函的值是由自变量的函数的选取而确定的所以将泛函理解为函数的函数例2 1 是一个泛函变量J的值是由函数x t 的选取而确定当时有当时有例2 2 曲线的弧长求平面上连接给定两点A x0 y0 和B x1 y1 的曲线的弧长J A B两点间的曲线方程为 y f x A B两点间的弧长为泛函的上述概念可以推广到含有几个函数的泛函的情况例如求一般函数极值微分法求泛函极值变分法 2 泛函的连续性函数相近零阶相近当函数x t 与x0 t 之差的绝对值即 x t x0 t t1 t t2对于x t 的定义域中的一切t t1 t t2 都很小时称函数x t 与函数x0 t 是相近的也称为零阶相近一阶相近当函数x t 与x0 t 之差的绝对值以及它们的一阶导数和之差的绝对值即t1 t t2都很小称函数x t 与函数x0 t 是一阶相近的注意一阶相近的两个函数必然是零阶相近反之不成立 K阶相近当t1 t t2都很小时称函数x t 与函数x0 t 是k阶相近的函数间距离在不同的函数空间函数间的距离定义也不同在函数空间C a b 在区间 a b 上连续的函数的全体构成的函数空间中通常采用下式定义距离在函数空间Ck a b 在区间 a b 上连续且具有连续的k阶导数的函数的全体构成的函数空间中任意两个函数间的距离定义为显然式 2 1 定量地表示两个函数之间的零阶相近度而式 2 1 定量地表示两个函数之间的k阶相近度 2 1 2 2 零阶距离零阶距离函数间距离在不同的函数空间函数间的距离定义也不同在函数空间C a b 在区间 a b 上连续的函数的全体构成的函数空间中通常采用下式定义距离在函数空间Ck a b 在区间 a b 上连续且具有连续的k阶导数的函数的全体构成的函数空间中任意两个函数间的距离定义为 2 1 函数间距离在不同的函数空间函数间的距离定义也不同在函数空间C a b 在区间 a b 上连续的函数的全体构成的函数空间中通常采用下式定义距离在函数空间Ck a b 在区间 a b 上连续且具有连续的k阶导数的函数的全体构成的函数空间中任意两个函数间的距离定义为函数间距离在不同的函数空间函数间的距离定义也不同在函数空间C a b 在区间 a b 上连续的函数的全体构成的函数空间中通常采用下式定义距离在函数空间Ck a b 在区间 a b 上连续且具有连续的k阶导数的函数的全体构成的函数空间中任意两个函数间的距离定义为函数间距离在不同的函数空间函数间的距离定义也不同在函数空间C a b 在区间 a b 上连续的函数的全体构成的函数空间中通常采用下式定义距离在函数空间Ck a b 在区间 a b 上连续且具有连续的k阶导数的函数的全体构成的函数空间中任意两个函数间的距离定义为函数间距离在不同的函数空间函数间的距离定义也不同在函数空间C a b 在区间 a b 上连续的函数的全体构成的函数空间中通常采用下式定义距离在函数空间Ck a b 在区间 a b 上连续且具有连续的k阶导数的函数的全体构成的函数空间中任意两个函数间的距离定义为函数间距离在不同的函数空间函数间的距离定义也不同在函数空间C a b 在区间 a b 上连续的函数的全体构成的函数空间中通常采用下式定义距离在函数空间Ck a b 在区间 a b 上连续且具有连续的k阶导数的函数的全体构成的函数空间中任意两个函数间的距离定义为函数间距离在不同的函数空间函数间的距离定义也不同在函数空间C a b 在区间 a b 上连续的函数的全体构成的函数空间中通常采用下式定义距离在函数空间Ck a b 在区间 a b 上连续且具有连续的k阶导数的函数的全体构成的函数空间中任意两个函数间的距离定义为函数间距离在不同的函数空间函数间的距离定义也不同在函数空间C a b 在区间 a b 上连续的函数的全体构成的函数空间中通常采用下式定义距离在函数空间Ck a b 在区间 a b 上连续且具有连续的k阶导数的函数的全体构成的函数空间中任意两个函数间的距离定义为零阶距离零阶距离函数间距离在不同的函数空间函数间的距离定义也不同在函数空间C a b 在区间 a b 上连续的函数的全体构成的函数空间中通常采用下式定义距离在函数空间Ck a b 在区间 a b 上连续且具有连续的k阶导数的函数的全体构成的函数空间中任意两个函数间的距离定义为泛函的连续性如果对于任意给定的正数可以找到这样一个 0 当d x t x0 t 时存在 J x t J x0 t 那么就说泛函J在点x0 t 处是连续的根据所采用的函数之间距离定义的不同对应的泛函分别称为零阶连续泛函 2 1 或k阶连续泛函 2 2 3 泛函的极值如果是在与仅仅具有零阶接近度的曲线的泛函中比较得出的极值称为强极值如果是在与具有一阶或一阶以上接近度的曲线的泛函中比较得出的极值则称为弱极值 4 线性泛函连续泛函如果满足下列条件 1 叠加原理 J x1 t x2 t J x1 t J x2 t 2 齐次性 J cx t cJ x t 其中 c是任意常数就称为线性泛函例如都满足上述两个条件故均为线性泛函 5 泛函的变分宗量的变分若函数x t 是变量J的自变量函数则称x t 为泛函J x t 的宗量函数宗量的变分是指在同一函数类中的两个宗量函数间的差也就是说泛函的变分是泛函增量的线性主部当一个泛函具有变分时称该泛函是可微的泛函的变分当宗量x t 有变分时泛函的增量可以表示为其中 L x t x t 是关于 x t 的线性连续泛函 r x t x t 是关于 x t 的高阶无穷小 L x t x t 称为泛函的变分记为线性主部 6 泛函变分的求法定理2 1连续泛函J x 的变分等于泛函对的导数在 0时的值即定理2 2连续泛函J x 的二次变分定义为证明略证明略 7 泛函变分的规则求泛函的变分例2 3 8 泛函极值的条件泛函极值的必要条件定理2 3连续可微泛函J x 在x0 t 上达到极值的必要条件为 J x 在x x0处必有泛函极值的充要条件定理2 4设可微泛函J x 存在二次变分则在x x0处达到极小值的充要条件为同理设可微泛函J x 存在二次变分则在x x0处达到极大值的充要条件为主要内容 2 1变分法概述2 2无约束最优化问题无约束固定端点泛函极值必要条件无约束自由端点泛函极值必要条件2 3等式约束最优化问题2 4变分法求解最优控制问题引入哈密顿函数求解拉格朗日问题求解综合型波尔扎问题 2 2无约束最优化问题 1 无约束固定端点泛函极值必要条件问题2 1 无约束固定终端泛函极值问题为其中及x t 在 t0 tf 上连续可微 t0及tf固定求满足上式的极值轨线x t x t0 x0 x tf xf 定理2 5若给定曲线x t 的始端x t0 x0和终端x tf xf 则泛函达到极值的必要条件是曲线x t 满足欧拉方程其中x t 应有连续的二阶导数则至少应是二次连续可微的欧拉 Euler 方程证明略边界条件或欧拉方程的全导数形式在中第二项为全导数令得欧拉方程的全导数形式或例2 4 求泛函在边界条件下的极值曲线及极值几种特殊的欧拉方程可以得到封闭形式的解被积函数L不依赖于即被积函数L不依赖于x 即被积函数L不依赖于t 即在这种情况下欧拉方程的首次积分为其中c是待定的积分常数实际上将上式左边对t求全导数有被积函数L线性地依赖于即例2 5 最速降线又称捷线问题设在竖直平面内有两点A和B 它们不在同一条铅垂线上现有一质点受重力的作用自较高的A点向较低的B点滑动如果不考虑各种阻力的影响问应取怎样的路径才能使所经历的时间最短在A B两点所在的竖直平面内选择一坐标系如上图所示 A点为坐标原点水平线为x轴铅垂线为y轴结论最速降线是一条圆滚线对于向量空间的泛函也存在着欧拉方程不过是欧拉方程组即向量欧拉方程定理2 6在n维函数空间中若极值曲线X t x1 t x2 t xn t T的始端X t0 x1 t0 x2 t0 xn t0 T和终端X tf x1 tf x2 tf xn tf T是给定的则泛函达到极值的必要条件是曲线X t 满足向量欧拉方程其中X t 应有连续的二阶导数而则至少应是二次连续可微的向量欧拉方程或向量欧拉方程向量欧拉方程可写成标量方程组例2 6 求泛函满足边界条件的极值函数思考能否利用MATLAB符号工具箱求解微分方程组当极值曲线x t 的端点变化时要使泛函达到极小值 x t 首先应当满足欧拉方程若端点固定可以利用端点条件确定欧拉方程中的两个待定的积分常数问题若端点可变如何确定这两个积分常数 2 2无约束最优化问题 2 无约束自由端点泛函极值必要条件横截条件图形分析都固定图a 即即固定自由图b 即因为自由所以终端仅在上滑动求出最优许多状态轨线自由固定图c则横截条件变为始端仅在上滑动端点变动的情况自由端点无约束条件的变分如图始点在曲线上变动终点在曲线上变动问题描述假定极值曲线的始端A t0 x0 是固定的而终端B tf xf 是可变的并沿着给定的曲线现在的问题是需要确定一条从给定的点A t0 x0 到给定的曲线上的某一点B tf xf 的连续可微的曲线x t 使得泛函达到极小值变动如右下图所示横截条件定理2 7若曲线x t 由一给定的点 t0 x0 到给定的曲线x tf tf 上的某一点 tf xf 则泛函达到极值的必要条件是 x t 满足欧拉方程和横截条件其中x t 应有连续的二阶导数则至少应是二次连续可微的而 t 则应有连续的一阶导数证明略若极值曲线的始端不是固定的并沿着曲线变动则同样可以推导出始端的横截条件定理2 7扩展根据定理2 7和上式可得到端点可变时 Lagrange问题的解除有欧拉方程外还有横截条件 1 始端终端可变即x t0 t0 x tf tf 则横截条件为 2 当t0 tf可变而x t0 与x tf 固定时则横截条件为 3 当t0 tf固定而x t0 与x tf 可变时即始端与终端分别在t t0 t tf上滑动则横截条件为横截条件总结定理2 7和以上几种情况的横截条件都可以将其推广到n维函数向量X t x1 t x2 t xn t T的泛函的情形定理2 8在n维函数空间中若曲线X t x1 t x2 t xn t T的始端X t0 x1 t0 x2 t0 xn t0 T是固定的而终端X tf x1 tf x2 tf xn tf T是可变的且在曲面X tf tf 上变动则泛函达到极值的必要条件是曲线X t 满足向量欧拉方程和横截条件若曲线X t x1 t x2 t xn t T的始端不是固定的而是可变的并在给定的曲面上变动其中则同样可以推导出始端的横截条件为例2 7 泛函求极值若x 0 与x 2 任意求极值曲线x 及极值J x 例2 8 求固定点A 0 1 到给定直线的弧长最短的曲线方程主要内容 2 1变分法概述2 2无约束最优化问题无约束固定端点泛函极值必要条件无约束自由端点泛函极值必要条件2 3等式约束最优化问题2 4变分法求解最优控制问题引入哈密顿函数求解拉格朗日问题求解综合型波尔扎问题回顾等式约束条件下函数极值问题的解法设有函数 2 2 现在需要求函数Z在以下约束条件下的极值 2 1 1 消元法从约束条件 2 2 中将y解出来用x表示y 即y y x 然后将y x 代入g x y 中得到Z g x y x 2 3 这样函数Z只含有一个自变量x 等式 2 2 约束条件下的函数 2 1 极值问题无约束条件的函数 2 3 极值问题存在两个问题从方程 2 2 中将y解出来往往很困难对x和y这两个自变量未能平等看待 2 拉格朗日乘子法 Lagrangefactor 步骤如下作一个辅助函数F g x y f x y 式中是待定常数称为拉格朗日乘子 2 4 联立求解方程 2 2 和 2 4 求出驻点 x0 y0 和待定常数值判断 x0 y0 是否是函数g x y 的极值点 2 2 约束条件求辅助函数F的无条件极值即令 Lagrange函数等式约束条件下的函数极值问题无约束条件的函数极值问题 2 拉格朗日乘子法 Lagrangefactor 扩展 1 拉格朗日乘子法对于求n元函数Z g x1 x2 xn 在约束条件下的极值问题同样适用 2 拉格朗日乘子法对于求在多个约束方程fi x1 x2 xm 0 i 1 2 m 下的极值问题同样适用 3 m n是必要的向量函数向量方程约束 2 3等式约束最优化问题 1 等式约束固定终端泛函极值必要条件问题2 2 等式约束固定端点泛函极值问题为情况下的极值轨线X t 2 5 求泛函在约束方程为和端点条件为 2 6 解决方法引入拉格朗日向量乘子将等式约束泛函极值问题转化为无约束泛函极值问题步骤如下 1 构造辅助泛函其中 t 1 t 2 t m t T是m维待定向量乘子 2 7 无约束条件的泛函 2 7 极值问题有约束条件 2 6 的泛函 2 5 极值问题 2 令写出欧拉方程 3 联立求解欧拉方程 2 8 和约束方程 2 6 可以得到n维向量函数X t 和m维向量乘子 t 4 利用端点条件确定欧拉方程解中的2n个积分常数得到候选函数X t 5 检验候选函数X t 是否使泛函 2 7 达到极值以及是极大值还是极小值 2 8 定理2 9如果n维向量函数X t x1 t x2 t xn t T能使泛函在等式约束条件下达到极值这里f是m维向量函数 m n 必存在适当的m维向量函数 t 1 t 2 t m t T使泛函达到无条件极值即函数X t 是上述泛函J0的欧拉方程的解其中而X t 和 t 由欧拉方程和约束方程共同确定无约束条件的泛函J0极值问题有约束条件的泛函J极值问题等价证明取极小值给定的边界条件为例2 9已知受控系统的动态结构如图所示求最优控制u t 及最优轨线x t 使目标泛函 2 3等式约束最优化问题 2 等式约束自由端点泛函极值必要条件如何求解主要内容 2 1变分法概述2 2无约束最优化问题无约束固定端点泛函极值必要条件无约束自由端点泛函极值必要条件2 3等式约束最优化问题2 4变分法求解最优控制问题引入哈密顿函数求解拉格朗日问题求解综合型波尔扎问题 2 4变分法求解最优控制问题当状态变量和控制变量均不受约束即X t Rn U t Rm时最优控制问题是个在等式约束条件下求泛函极值的变分问题因此可以利用在上一节中介绍的拉格朗日乘子法来求解在这一节中利用拉格朗日乘子法求解最优控制问题时将引入哈密顿 Hamilton 函数推导出几种典型的最优控制问题应满足的必要条件 2 4变分法求解最优控制问题 1 引入哈密顿函数求解拉格朗日问题 2 10 初始条件 2 9 终端条件 tf固定 X tf 自由和性能泛函 2 11 给定系统状态方程要求从容许控制U t Rm中确定最优控制U t 使系统 2 9 从给定的初态X t0 转移到某个终态X tf 并使性能泛函 2 11 达到极小值这是拉格朗日问题又称为积分型最优控制问题问题2 3 解将状态方程 2 9 改写为 2 12 最优控制问题微分方程 2 12 在约束条件下求泛函极值的变分问题利用拉格朗日乘子法引入n维拉格朗日乘子向量 t 1 t 2 t n t T t 称为协态变量以便与状态变量相对应 2 13 求泛函在等式约束条件下的极值问题求泛函 2 13 J0的无约束条件的极值问题构造辅助泛函定义哈密顿 Hamilton 函数为辅助泛函标量函数哈密顿函数与辅助函数之间关系为将代入欧拉方程得协态方程共轭方程状态方程规范方程正则方程控制方程利用变分法写出辅助泛函的欧拉方程初始状态为由于终端时刻tf固定终端状态X tf 自由所以横截条件为得联立求解规范方程可以得到两个未知函数X t 和 t 由边界条件确定积分常量混合边界问题或两点边界值问题求解两点边值问题步骤由控制方程求得U U X t t t 将上式代入规范方程消去其中的U t 得到利用边界条件联立求解方程以上方程可得唯一确定的解X t 和 t 将所求得的X t 和 t 代入U U X t t t 求得相应的U t 说明利用引入哈密顿函数的方法求解拉格朗日型最优控制问题是将求泛函在等式约束条件下对控制函数U t 的条件极值问题转化为求哈密顿函数H对控制变量U t 的无条件极值问题这种方法称为哈密顿方法定理2 10设系统的状态方程为为将系统从给定的初态转移到终端时刻tf固定终端状态X tf 自由的某个终态并使性能泛函达到极小值的最优控制应满足的必要条件是 1 设U t 是最优控制 X t 是对应于U t 的最优轨线则必存在一与U t 和X t 相对应的n维协态变量 t 使得X t 与 t 满足规范方程其中 2 边界条件为 3 哈密顿函数H对控制变量U t t0 t tf 取极值即沿着最优控制和最优轨线哈密顿函数H对时间t求全导数得若H不显含t时则有H t 常数t t0 tf 也就是说当H不显含t时哈密顿函数H是不依赖于t的常数取极小值给定的边界条件为解法2 哈密顿方法例2 9已知受控系统的动态结构如图所示求最优控制u t 及最优轨线x t 使目标泛函取极小值给定的边界条件为自由例2 10已知受控系统的动态结构如图所示求最优控制u t 及最优轨线x t 使目标泛函由例2 9哈密顿方法由协态方程得由控制方程得由状态方程得例2 11已知系统方程和边界条件为 1 求使性能泛函为极小值的最优控制函数与最优轨线可以利用MATLAB符号工具箱求解微分方程 2 若终端条件为x1 1 0 x2 1 自由求该最优控制问题 2 4变分法求解最优控制问题 2 求解综合型波尔扎问题 2 10 初始条件 2 9 和性能泛函 2 14 给定系统状态方程要求从容许控制U t Rm中确定最优控制U t 使系统 2 9 从给定的初态X t0 转移到某个终态X tf 并使性能泛函 2 14 达到极小值这是波尔扎问题又称为复合型最优控制问题问题2 4 注意给定的端点条件不同上述最优控制问题的解将不同 1 终端时刻tf固定终端状态X tf 自由的情况构造辅助泛函为若令哈密顿函数为 2 15 2 16 并对式 2 15 积分号内第三项进行分部积分则辅助泛函变为 2 17 求上式对状态变量X t 和控制变量U t 的变分得 2 19 由于泛函J0达到极值的必要条件为 2 18 由于 X t0 0 X tf 0 X t 0 U t 0 则由式 2 18 和 2 19 可得上述波尔扎型最优控制问题的解应终端时刻tf固定终端状态X tf 自由的波尔扎型最优控制问题的解应满足的必要条件为这些关系与拉格朗日型最优控制问题的完全相同所不同的只是横截条件即协态变量的终端值 2 终端时刻tf固定终端状态X tf 受约束的情况设终端状态受到如下等式的约束 2 20 其中为r 当L 0 r n 1 当L 0 r n 维向量即这时终端状态X tf 即不是固定的也不是完全自由的只能在终端流型 2 20 上变动在构造辅助泛函时应考虑终端约束条件 2 20 为此需要引入待定的拉格朗日乘子向量考虑到哈密顿函数为 2 21 并对式 2 21 积分号内第三项进行分部积分则辅助泛函变为构造的辅助泛函为求J0对状态变量X t 和控制变量U t 的变分得考虑

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

变分法与最优控制.ppt

文档简介

温馨提示

最新文档

评论

变分法与最优控制.ppt

文档简介

温馨提示

最新文档

评论

相关文档