第10 章 使用导数的最优化方法_第1页
第10 章 使用导数的最优化方法_第2页
第10 章 使用导数的最优化方法_第3页
第10 章 使用导数的最优化方法_第4页
第10 章 使用导数的最优化方法_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选课件第第10章章 使用导数的最优化方法使用导数的最优化方法 无约束最优化问题无约束最优化问题2. 最速下降法最速下降法4.共轭梯度法共轭梯度法5.拟牛顿法拟牛顿法3. 牛顿法牛顿法精选课件一一. 无约束最优化问题无约束最优化问题无约束最优化问题无约束最优化问题nRxtsxf .)(min有有一一阶阶连连续续偏偏导导数数。其其中中)(xf 无约束非线性规划问题的求解方法分为解析法和直接法两类。解析法解析法 需要计算函数的梯度,利用函数的解析性质构造迭代公式使之收敛到最优解。本节介绍最速下降法、共轭梯度法、牛顿法、变尺度法等解析方法 直接法直接法 仅通过比较目标函数值的大小来移动迭代点。下一章

2、主要介绍模式搜索法等直接方法。精选课件 无约束非线性规划问题的求解方法分为解析法和直接法两类。 一般来说,无约束非线性规划问题的求解是通过一系列一维搜索来实现。因此,如何选择搜索方向是解无约束非线性规划问题的核心问题,搜索方向的不同选择,形成不同的求解方法。本章主要介绍解析法;另一类只用到目标函数值,不必计算导数,通常称为直接方法直接方法,放在第11章讨论.精选课件nExxf)(min本章考虑如下的下降算法:本章考虑如下的下降算法:; 1,) 1 ()1()1(kdx令选定搜索方向给定初始点)()(min)()()2()()(0)()(kkkkdxfdxf,求一维搜索问题令:.k得到解为步;转

3、第令处的搜索方向否则,选取在是最优解,停;若令:2, 1,)3()1()1()1()()()1(kkdxxdxxkkkkkkk算法。选取不同,得到不同的搜索方向)(kd主要介绍最速下降法、牛顿法,共轭梯度法,拟牛顿法等精选课件10.1 最速下降法最速下降法 10.1.1 最速下降方向最速下降方向 考虑无约束问题nExxf)(min(6.1.2)其中函数 具有一阶连续偏导数. 人们在处理这类问题时,总希望从某一点出发,选择一个目标函数值下降最快的方向,以利于尽快达到极小点.正是基于这样一种愿望,早在1847年法国著名数学家Cauchy提出了最速下降法最速下降法.后来,Curry等人作了进一步的研

4、究.现在最速下降法已经成为众所周知的一种最基本的算法,它对其他算法的研究也很有启发作用,因此在最优化方法中占有重要地位.下面我们先来讨论怎样选择最最速下降方向速下降方向. )(xf精选课件 人们在处理这类问题时,总希望从某一点出发,选择一个目标函数值下降最快的方向,以利于尽快达到极小点.正是基于这样一种愿望,早在1847年法国著名数学家Cauchy提出了最速下降法最速下降法.后来,Curry等人作了进一步的研究.现在最速下降法已经成为众所周知的一种最基本的算法,它对其他算法的研究也很有启发作用,因此在最优化方法中占有重要地位.下面我们先来讨论怎样选择最最速下降方向速下降方向. 我们知道,函数

5、在点 处沿方向 的变化率可用方向导数来表达,对于可微函数,方向导数等于梯度与方向的内积,即)(xfxddxfdxDfT)();(6.1.2)因此,求函数 在点 处的下降最快的方向,可归结为求解下列非线性规划:)(xfx1.)(mindtsdxfT(6.1.3)精选课件根据Schwartz不等式,有)()()(xfdxfdxfT去掉绝对值符号,可以得到)()(xfdxfT(6.1.4)由上式可知,当)()(xfxfd(6.1.5)时等号成立.因此,在点 处沿(6.1.5)所定义的方向变化率最小,即负梯度方向为最速下降方向负梯度方向为最速下降方向. 这里要特别指出,在不同尺度下最速下降方向是不同的

6、.前面定义的最速下降方向,是在向量 的殴氏范数 不大于1的限制得到的,属于殴氏度量意义下的最速下降方向.如果改用其他度量,比xd2d精选课件如,设 为对称正定矩阵,在向量 的 范数 不大于1的限制下,极小化 ,则得到的最速下降方向与前者不同.AdA21)(AdddTAdxfT)( 10.1.2 最速下降算法最速下降算法 最速下降法的迭代公式是)()() 1(kkkkdxx(10.1.6)其中 是从 出发的搜索方向,这里取在点 处的最速下降方向,即)()()(kkxfd)(kd)(kx 是从 出发沿方向 进行一维搜索的步长,即 满足k)(kx)(kdk)(min)()()(0)()(kkkkkd

7、xfdxf(10.1.11)(kx精选课件 计算步骤计算步骤如下: 1.给定初点 ,允许误差 ,置 .nEx) 1 (01k 2.计算搜索方向)()()(kkxfd 3.若 ,则停止计算;否则,从 出发,沿 进行一维搜索,求 ,使)(kd)(kx)(kdk)(min)()()(0)()(kkkkkdxfdxf 4.令 ,置 ,转步2.)()() 1(kkkkdxx1: kk 例例10.1.1 用最速下降法解下列问题:22212)(minxxxf.101,) 1 , 1 () 1 (Tx初点精选课件解:解:,)2,4()(21Txxxf.)2,4()()1(1Txfd.)21 ,41()1()1

8、(Tdx,令22)1()1()21()41 (2)()(dxf)(min求解0)21(4)41(16)(令1851Tdxx)94,91()1(1)1()2(22212)(minxxxf) 1 , 1 ()1(x第二次迭代:.)9/8,9/4()()2()2(Txfd1 . 0789. 15/54)9/8()9/4(22)2(dTdx984941)2()2(,令81)21 (1681)41(2)()(22)2()2(dxf精选课件Tdx984941)2()2(,令81)21 (1681)41(2)()(22)2()2(dxf)(min求解,令081)21 (6481)41(16)(1252Tdx

9、x11272)2(2)2()3(第三次迭代:.)27/4,27/8()()3()3(Txfd1 . 03313. 027/54)27/4()27/8(22)3(d进行一维搜索:沿从)3()3(dx)()(min)3()3(dxf求解21412721227411272)3()3(dx精选课件21412721227411272)3()3(dx,令2222)3()3(27)21 (427)41(8)()(dxf22212)(xxxf,027)21 (1627)41(64)(2218528880341243241912721227418511272)3(3)3()4(dxx212438842432)(

10、)4(xf,)2,4()(21Txxxf0736. 052438)()4(xf412432x似解满足精度要求,得到近00*x精确解精选课件)()(min)()(kkdxf求解在最速下降法的一位搜素中0)()()(T)()(kkkddxf由k解得步长满足:故步长k0)()(T)()(kkkkddxf)()()1(kkkkdxx0)()(T)1(kkdxf)()()(kkxfd其中0)(T)1(kkdd即在最速下降法中相邻两次搜索方向是正交的。精选课件)()(min)()(kkdxf对于一维搜索cxbAxxxfTT21)(对于二次严格凸函数其中A为n维对称正定矩阵可以求出步长因子k)()()(kk

11、xfd其中满足:由步长k0)()(T)()(kkkkddxfbAx)(xf由0)()()()(kTkkkdbdxA解得:)()()()()()()()()()()(kTkkTkkTkkTkkAdddxfAdddbAx)()()1( kkxfxf)()()(2)()()()()(21kTkkTkAddxfxf(本章习题7)精选课件锯齿现象锯齿现象 最速下降法的迭代点在向极小点靠近的过程中,走的是曲折的路线:后一次搜索方向d(k+1)与前一次搜索方向 d(k)总是相互垂直的,称它为锯齿现象锯齿现象。这一点在前面的例题中已得到验证。除极特殊的目标函数(如等值面为球面的函数)和极特殊的初始点外,这种现

12、象一般都要发生。 最速下降法的收敛性精选课件 从直观上可以看到,在远离极小点的地方,每次迭代都有可能使目标函数值有较多的下降,但在接近极小点的地方,由于锯齿现象,每次迭代行进的距离开始逐渐变小。因而收敛速度不快。 已有结论表明,最速下降法对于正定二次函数关于任意初始点都是收敛的(定理10.1.2),而且恰好是线性收敛的。精选课件锯齿现象锯齿现象,其其等等值值面面近近似似数数可可以以用用二二次次函函数数近近似似在在极极小小点点附附近近,目目标标函函椭球面。椭球面。1x*x2x3x它它只只是是。标标函函数数的的一一种种局局部部性性质质最最速速下下降降方方向向反反映映了了目目快快的的方方向向。局局部

13、部目目标标函函数数值值下下降降最最注注的的算算法法。最最速速下下降降法法是是线线性性收收敛敛精选课件精选课件10.2 牛顿法牛顿法 6.2.1 牛顿法牛顿法 设 是二次可微实函数, .又设 是 的极小点的一个估计,我们把 在 展成Taylor级数,并取二阶近似:)(xfnEx)(kx)(xf)(xf)(kx)()(21)()()()()()()(2)()()()(kkTkkTkkxxxfxxxxxfxfxxf其中 是 在 处的Hessian矩阵.为求 的平稳点,令)()(2kxf)(xf)(kx)(x0)(x0)()()()(2)(kkkxxxfxf即(10.2.1)精选课件设 可逆,有(10

14、.2.1)得到牛顿法的迭代公式)()(2kxf)()()(1)(2)()1(kkkkxfxfxx(10.2.2)其中 是Hessian矩阵 的逆矩阵. 这样, 知道 后,算出在这一点处目标函数的梯度和Hessian矩阵的逆,代人(10.2.2),便得到后继点 ,用 代替 ,再用(10.2.2)计算,又得到 的后继点.依此类推,产生序列 .在适当的条件下,这个序列收敛.1)(2)(kxf)()(2kxf)(kx)1( kx1kk)1( kx)(kx 精选课件22112)()()(. 2)(. 1kxxxxxfxfxfkxf则牛顿法产生的序列收敛于 .x 实际上,当牛顿法收敛时,有下列关系:2)(

15、)1(xxcxxkk其中 C 是某个常数.因此,牛顿法至少2级收敛,参看文献19.可见牛顿法的收敛速率是很快的.精选课件例例10.2.1 用牛顿法解下列问题:2241) 1(minxx.) 1 , 0()1(Tx 我们取初点解:)()()(1)(2)()1(kkkkxfxfxx2312) 1(4)(xxxf24)()1(xf200) 1(12)(212xxf20012)(2xf)()()1(1)1(2)1()2(xfxfxx242/10012/11003/113/110第2次迭代:027/32)()2(xf2009/48)()2(2xf精选课件第2次迭代:027/32)()2(xf2009/4

16、8)()2(2xf)()()2(1)2(2)2()3(xfxfxx027/322/10048/903/103/1)2(x09/5继续迭代,得到,.081/65,027/19)5()4(xx最终收敛到最优解x*=(1,0)T精选课件我们先用极值条件求解.令0)(bAxxf下面用牛顿法求解. 任取初始点x(1) , 根据牛顿法的迭代公式:特别地,对于二次凸函数,用牛顿法求解,经1次迭代即达极小点.设有二次凸函数cxbAxxxfTT21)(其中A是对称正定矩阵。)()()(1)(2)()1(kkkkxfxfxx求迭代点x(2) bAx1得到是最小值点吗?bAx1为什么?xbAbAxAxxfAxx1)

17、1(1)1()1(1)1()2()()(即1次迭代达到极小点.精选课件)()(12xfxfd不一定是下降方向,经迭代,目标函数值可能上升.此外,即使目标函数值下降,得到的点 也不一定是沿牛顿方向的最好点或极小点.因此,人们对牛顿法进行修正,提出了阻尼牛顿法. 值得注意,当初始点远离极小点时,牛顿法可能不收敛.原因之一,牛顿方向 以后还会遇到一些算法,把它们用于二次凸函数时,类似于牛顿法,经有限次迭代必达到极小点.这种性质称为二次终止性二次终止性. )1( kx对于二次凸函数,用牛顿法求解,经1次迭代即达极小点精选课件 10.2.2 阻尼牛顿法阻尼牛顿法 阻尼牛顿法与原始牛顿法的区别在于增加了沿

18、牛顿方向的一维搜索,其迭代公式是)()()1(kkkkdxx(6.2.6)其中 为牛顿方向, 是由一维搜索得到的步长,即满足)(min)()()()()(kkkkkdxfdxfk)()()(1)(2)(kkkxfxfd 阻尼牛顿法的计算步骤计算步骤如下: 1.给定初始点 ,允许误差 ,置 . 2.计算 )1 (x01k1)(2)()(),(kkxfxf精选课件 3.若 ,则停止迭代;否则,令)()(kxf)()()(1)(2)(kkkxfxfd 4.从 出发,沿方向 作一维搜索:)(kx)(kd)()(min)()()()(kkkkkdxfdxf令 .)()()1(kkkkdxx 5.置 ,转

19、步2.1: kk 由于阻尼牛顿法含有一维搜索,因此每次迭代目标函数值一般有所下降(决不会上升).可以证明,阻尼牛顿法在适当的条件下具有全局收敛性,且为2级收敛.精选课件10.310.3、共轭梯度法、共轭梯度法精选课件10.3.1 共轭方向法共轭方向法1. 共轭方向和共轭方向法共轭方向和共轭方向法定义定义共轭。共轭。关于关于和和,则称,则称若有若有AddAddT21210 ARdddnk它它们们两两两两关关于于中中一一组组非非零零向向量量,如如果果是是设设,21。共共轭轭,即即kjijiAddjTi,2,1,0 共轭方向。共轭方向。组组共轭的,也称它们是一共轭的,也称它们是一则称这组方向是关于则

20、称这组方向是关于AA注:注:002121 dddIdTT21dd 共轭是正交的推广。共轭是正交的推广。,和和中中的的两两个个非非零零向向量量的的对对称称正正定定矩矩阵阵,对对于于是是设设21ddRnnAn 是是单单位位矩矩阵阵,则则如如果果 A精选课件几何意义几何意义设有二次函数设有二次函数)()(21)(xxAxxxfT 对对称称正正定定矩矩阵阵,是是其其中中nnA 是一个定点。是一个定点。x的的等等值值面面则则函函数数)(xfcxxAxxT )()(21为中心的椭球面。为中心的椭球面。是以是以 x由于由于,0)()( xxAxf,0)(2 AxfA所所以以正正定定,因因为为的的极极小小点点

21、。是是因因此此)(xfxx,)(2Axf 而而精选课件几何意义几何意义设有二次函数设有二次函数)()(21)(xxAxxxfT 对对称称正正定定矩矩阵阵,是是其其中中nnA 是一个定点。是一个定点。x的的等等值值面面则则函函数数)(xfcxxAxxT )()(21为中心的椭球面。为中心的椭球面。是以是以 x由于由于,0)()( xxAxf,0)(2 AxfA所所以以正正定定,因因为为的的极极小小点点。是是因因此此)(xfxx,)(2Axf 而而精选课件点,点,是在某个等值面上的一是在某个等值面上的一设设)0(x处的法向量为处的法向量为该等值面在点该等值面在点)1(x. )()()1()1(xx

22、Axf o1x2xx)1(d)0(x中的一个方向,中的一个方向,是是nRd)1(。以以最最优优步步长长搜搜索索得得到到点点沿沿着着)1()1()0(xdx所所在在等等值值面面的的切切向向量量。是是点点则则)1()1(xd正交,正交,与与则则)()1()1(xfd , 0)()1()1( xfdT即即,)1()2(xxd 令令)1(x所以所以, 0)2()1( AddT共共轭轭。小小点点的的向向量量关关于于向向量量与与由由这这一一点点指指向向极极即即等等值值面面上上一一点点处处的的切切A)2(dcxxAxxxfT)()(21)(精选课件共共轭轭的的非非零零个个是是阶阶对对称称正正定定矩矩阵阵,是

23、是设设AkdddnAk,21性无关。性无关。向量,则这个向量组线向量,则这个向量组线. 1 . 3 .10定理证明证明,使得,使得设存在实数设存在实数k ,21,01 kiiid ,则则有有上上式式两两边边同同时时左左乘乘AdTj,01 kiiTjiAdd 可化简为可化简为共轭的向量,所以上式共轭的向量,所以上式个个是是因为因为Akdddk,21.0 jTjjAdd ,是正定矩阵,所以是正定矩阵,所以而而因为因为0,0 jTjjAddAd所以所以。kjj,2,1,0 线线性性无无关关。因因此此kddd,21精选课件2 . 3 .10定理,设设有有函函数数cxbAxxxfTT 21)(共轭向量。

24、共轭向量。一组一组是是阶对称正定矩阵。阶对称正定矩阵。是是其中其中AdddnAk)()2()1(,进行搜索,进行搜索,为初始点,依次沿为初始点,依次沿以任意的以任意的)()2()1()1(,kndddRx 上上的的在在是是函函数数则则得得到到点点kkkBxxfxxxx )1()1()1()3()2()(,极小点,其中极小点,其中,|1)(RdxxBikiiik 是是时,时,当当,生成的子空间。特别地生成的子空间。特别地是由是由)1()()2()1(, nkxnkddd上上的的唯唯一一极极小小点点。在在nRxf)(推论推论有有在上述定理条件下,必在上述定理条件下,必。kidxfiTk,2,1,0

25、)()()1( 精选课件)(*)1(*1)1(*1)1()(*)1(*1)1()(*)()1(.kkkkkkkkkkkkkdddxddxdxx), 1()(*)()1(kidxxiiii证:设), 1 , 0(0)()()1(kidxfiTk若上的极小点。在是函数要证kkBxxfx)1()1()(,|1)(RdxxBikiiik ,)1(kBxx对于)()1(1)1 (1)1 (kkkkdddxx)()()1( kxfxf要证)()()()()1()1()1(kTkkxxxfxfxf)(1)1(*)1()()()(ikiTkiikdxfxf则必有)()()1( kxfxf,)1(kBxx对于)

26、, 1 , 0(0)()()1(kidxfiTk下证精选课件), 1 , 0(0)()()1(kidxfiTk下用归纳法证的极小点,沿方向在为由), 1 , 0()()()()1(kidxxfxiii为问题中的即*)(*)()1(iiiiidxx的解。)()(min)()(iidxf0)()(T)(*)(iiiiddxf.,.,2 , 1, 0)()(T)1(kidxfii显然成立。时当0)(,1)()1(kTkdxfk. 1,.,2 , 1,0)(,)()(midxfnmkiTm成立有时假设当.,.,2 , 1,0)(,1)()1(midxfmkiTm成立证时则当)(*)()1()1()(m

27、kmmmAdbAxbAxxf)(*)()(mkmAdxf)()(*)()()(T)1()()()(iTmkiTmimAdddxfdxfmi时,故当,由归纳假设,0)()()(iTmdxf0)()()(iTmAdd又, 0)()(T)1(imdxfmi时,故当0)()(T)1(mmdxf而.,.,2 , 1,0)()()1(midxfiTm成立故精选课件,设设有有函函数数cxbAxxxfTT 21)(共轭向量。共轭向量。一组一组是是阶对称正定矩阵。阶对称正定矩阵。是是其中其中AdddnAk)()2()1(,推论:进行搜索,进行搜索,为初始点,依次沿为初始点,依次沿以任意的以任意的)()2()1(

28、)1(,kndddRx 上上的的在在是是函函数数则则得得到到点点kkkBxxfxxxx )1()1()1()3()2()(,|1)(RdxxBikiiik 上上的的唯唯一一极极小小点点。在在nRxf)(nkkidxfiTk,且有), 1 , 0(0)()()1(0)()1(nxf时,当,特别地nk 极小点,其中极小点,其中点。经有限次迭代必得极小沿一组共轭方向搜索,即对于二次凸函数,若精选课件共轭方向法对于极小化问题对于极小化问题:法法为为共共轭轭方方向向法法是是正正定定矩矩阵阵,称称下下述述算算其其中中 A,21)(mincxbAxxxfTT ;共共轭轭方方向向取取定定一一组组)()2()1

29、(,)1(ndddA,)2()1()()1( kkxxx确确定定点点依依次次按按照照下下式式由由任任取取初初始始点点 )(min)()()()()()()()1(kkkkkkkkkdxfdxfdxx 。满足满足直到某个直到某个0)()()( kkxfx注注至多经过至多经过求解上述极小化问题,求解上述极小化问题,可知,利用共轭方向法可知,利用共轭方向法由定理由定理2。次次迭迭代代必必可可得得到到最最优优解解n精选课件 )(min)()()()()()()()1(kkkkkkkkkdxfdxfdxx ;共轭方向取定一组)()2()1(,ndddA对于上述正交方向法,它是下降算法吗?不难得到:, 0

30、)()(T)1(kkdxf由)()()()()()(kTkkTkkAdddxfcxbAxxxfTT21)()()(21)()()()(yxAyxyxyfyfxfTT由)()(21)()()()()()1()()1()()1()()1(kkTkkkkTkkkxxAxxxxxfxfxf)()()(2)()()()(21kTkkTkAdddxf, 0)()()1(kkxfxf)(,若0)()()(kTkdxf).()()1( kkxfxf)(则故正交方向法,它是下降算法。精选课件?共轭方向如何构造一组)()2()1(,ndddA可由一组线性无关向量组,类似于schmidt正交化过程,。共轭方向构造一

31、组)()2()1(,ndddA.13具体步骤见本章习题共轭方向的方法。下一节介绍另一种构造cxbAxxxfTT21)(min化问题对于二次凸函数的极小精选课件精选课件10.3 共轭梯度法共轭梯度法 10.3.2 共轭梯度法共轭梯度法 共轭梯度法最初由Hesteness和Stiefel于1952年为求解线性方程组而提出.后来,人们把这种方法用于求解无约束最优化问题,使之成为一种重要的最优化方法. 下面,重点介绍Fletcher-Reeves共轭梯度法共轭梯度法,简称FR法法. 共轭梯度法的基本思想基本思想是把共轭性与最速下降方法相结合,利用已知点处的梯度构造一组共轭方向,并沿这组方向进行搜索,求

32、出目标函数的极小点.根据共轭方向的基本性质,这种方法具有二次终止性. 我们先讨论对于二次凸函数的共轭梯度法,然后再把这种方法推广到极小化一般函数的情形.精选课件10.3.2. 共轭梯度法 如何选取一组共轭方向?如何选取一组共轭方向?:共轭梯度法共轭梯度法eevesRFletcher 代点代点向相结合,利用已知迭向相结合,利用已知迭将共轭性和最速下降方将共轭性和最速下降方基本思想:基本思想:进行搜索,求出进行搜索,求出共轭方向,并沿此方向共轭方向,并沿此方向处的梯度方向构造一组处的梯度方向构造一组函数的极小点。函数的极小点。以下分析算法的具体步骤。以下分析算法的具体步骤。cxbAxxxfTT 2

33、1)(min是是常常数数。,是是对对称称正正定定矩矩阵阵,其其中中cRbARxnn ,我们先讨论对于二次凸函数的共轭梯度法,然后再把这种方法推广到极小化一般函数的情形精选课件;,第一个搜索方向取为,第一个搜索方向取为任取初始点任取初始点)()1()1()1()1(xfdx ,令令,若若,设设已已求求得得点点)(0)()2()1(1)1()1( kkkkxfgxfx:)1(按按如如下下方方式式确确定定则则下下一一个个搜搜索索方方向向 kd)1()(1)1(kkkkdgd 令令共轭。共轭。关于关于和和要求要求Addkk)()1( ?如如何何确确定定k ,得,得)式两边同时左乘)式两边同时左乘则在(

34、则在(AdTk)(1)()(1)()1()(0kTkkkTkkTkdAdAgdAdd )2()()(1)(kTkkTkkdAdgAd 解解得得cxbAxxxfTT 21)(min初始搜索方向为最速下降方向精选课件:)3(搜搜索索步步长长的的确确定定,步步长长利利用用一一维维搜搜索索确确定定最最优优和和搜搜索索方方向向已已知知迭迭代代点点kkkdx ,)()(。即求解即求解)(min)()(kkdxf , )()()()(kkdxf 记记,令令0)()()()()( kTkkddxf ,即即有有0)()()()( kTkkdbdxA ,则则有有令令bAxxfgkkk )()()(,0)()( k

35、TkkdAdg )3()()()(kTkkTkkAdddg 解解得得精选课件3 . 3 .10定理次次算法在算法在,对于正定二次函数对于正定二次函数nmFRcxbAxxxfTT 21)(),下下列列关关系系成成立立(且且对对所所有有的的一一维维搜搜索索后后即即终终止止,并并mii 1;1,2,1,0)1()()( ijAddjTi;1,2,1,0)2( ijggjTi。iTiiTiggdg )()3(注注共共轭轭的的。是是可可知知搜搜索索方方向向)由由定定理理(Adddm)()2()1(,31则则构构造造的的搜搜索索必必须须取取负负梯梯度度方方向向,否否算算法法中中第第一一个个搜搜索索方方向向

36、)2(方方向向不不能能保保证证共共轭轭性性。)可可知知,的的(由由定定理理33)3(,0|2)( iiTiiTigggdg处处的的下下降降方方向向。是是迭迭代代点点所所以以)()(iixd精选课件的的计计算算公公式式可可以以简简化化。算算法法中中,由由定定理理iFR 3)4()()(1)(iTiiTiiAddgAd )()()(1iTiiTiAdddAg / )( / )( )()1()()()1(1iiiTiiiiTixxAdxxAg .)()()(bxAxfgiii )()(1)(11iiTiiiTiiggdggg iTiigdg)(21| )4(|221iigg )1964,Re(|22

37、1evesFletcherggiii精选课件)1964,Re(|221evesFletcherggiii式:外,还有下列等价表达除表达式有多个等价式,定理中,对于二次凸规划,上述221|iiiigg)1972,()()(1)(11wolfeseensenggdgggiiTiiiTii)1967,()()()(1DanielAddAdgiTiiTii)()(11dixongdggiTiiTii)1969,()()(11PPRgggggiTiiiTii常用两个公式:著名的FR和PPR公式精选课件算算法法步步骤骤:FR。,令,令精度要求精度要求,任取初始点任取初始点1. 1)1( kx 为为所所求求

38、极极小小点点;停停止止,若若令令)1(1)1(1,|, )(. 2xgxfg 。令令,)计计算算利利用用公公式式(否否则则,令令)1(1)1()2(11)1(3,dxxgd 为所求极小点;为所求极小点;停止,停止,若若令令)1(1)1(1,|, )(. 3 kkkkxgxfg )计计算算。用用公公式式(其其中中否否则则,令令4,)(1)1(kkkkkdgd 。转转,令,令)计算)计算利用公式(利用公式(3,3. 4)()()1(kkkkkdxx 。令令1: kk)3()()()(kTkkTkkAdddg)4(|221iiiggcxbAxxxfTT21)(min求解二次凸规划的FR 共轭梯度法求

39、解二次凸规划的FR 共轭梯度法迭代多少次才可以达到最优解?精选课件算算法法求求解解下下述述问问题题:用用例例FR22212)(minxxxf 。初初始始点点取取为为Tx)2,2()1( 解:解:.)2,4()(21Txxxf 次迭代:次迭代:第第1,)4,8(1)1(Tgd 令令)1()1()1(11AdddgTT ,2004),(21)(2121 xxxxxf.2004 A而而 482004)4,8(48)4,8(185 .2004A,或利用0)()()()()(kTkkddxfk求出, )()()()(kkdxf 记记精选课件)1(1)1()2(dxx 所以所以TT)4,8(185)2,2

40、( T)98,92( 次迭代:次迭代:第第 2.)916,98(2Tg 21221|gg .81448)916()98(2222 )1(12)2(dgdTT)4,8(814)916,98( T)4,1(8140 .)2,4()(21Txxxf ,)4,8(1)1(Tgd)1(12)2(dgd精选课件)2()2()2(22AdddgTT 412004)4,1()8140(41)916,98(81402209 )2(2)2()3(dxx TT)4,1(8140209)98,92( T)0,0( Tg)0,0(3 即即为为所所求求极极小小点点。)3(x精选课件10.3.3. 用于一般函数的共轭梯度法

41、nRxtsxf .)(min共轭梯度法进行修改:共轭梯度法进行修改:对用于正定二次函数的对用于正定二次函数的确确定定。)计计算算,需需由由一一维维搜搜索索不不能能利利用用公公式式(搜搜索索步步长长3)2(i 。速下降方向,即第一个搜索方向仍取最)() 1 ()1()1(xfd算算:其其它它搜搜索索方方向向按按下下式式计计,)()()1()1(iiiidxfd 。其其中中2)(2)1(|)(|)(|iiixfxf )3()()()(kTkkTkkAdddg精选课件)计算。用公式(其中令4, 1)(1)1(kkkkkdgdk10.3.3. 用于一般函数的共轭梯度法nRxtsxf .)(min。速下

42、降方向,即第一个搜索方向仍取最)() 1 ()1()1(xfd)4(|221iiigg)(min)2()()(kkdxf但求解一维搜索问题确定。)计算,需由一维搜索不能利用公式(搜索步长3i)3()()()(kTkkTkkAdddg精选课件此此时时可可采采取取一一定定能能满满足足停停止止条条件件,算算法法在在有有限限步步迭迭代代后后不不)3(如如下下措措施施:没没有有求求成成一一轮轮搜搜索索后后,如如果果还还次次迭迭代代为为一一轮轮,每每次次完完以以n新的初始点,新的初始点,的最后一个迭代点作为的最后一个迭代点作为得极小点,则以上一轮得极小点,则以上一轮一轮搜索。一轮搜索。一个搜索方向,开始下

43、一个搜索方向,开始下取最速下降方向作为第取最速下降方向作为第注注,如如算算采采用用其其它它形形式式的的公公式式计计在在共共轭轭梯梯度度法法中中,也也可可i 。)共轭梯度法共轭梯度法PRPgggggiTiiiTii()(11 精选课件10.3 共轭梯度法共轭梯度法 10.3.2 共轭梯度法共轭梯度法 共轭梯度法最初由Hesteness和Stiefel于1952年为求解线性方程组而提出.后来,人们把这种方法用于求解无约束最优化问题,使之成为一种重要的最优化方法. 下面,重点介绍Fletcher-Reeves共轭梯度法共轭梯度法,简称FR法法. 共轭梯度法的基本思想基本思想是把共轭性与最速下降方法相

44、结合,利用已知点处的梯度构造一组共轭方向,并沿这组方向进行搜索,求出目标函数的极小点.根据共轭方向的基本性质,这种方法具有二次终止性. 我们先讨论对于二次凸函数的共轭梯度法,然后再把这种方法推广到极小化一般函数的情形. 考虑问题精选课件cxbAxxxfTT21)(min其中 , 是对称正定矩阵, 是常数.nExAc 具体求解方法如下: 首先,任意给定一个初始点 ,计算出目标函数 在这点的梯度,若 ,则停止计算;否则,令)1(x)(xf01g1)1()1()(gxfd(10.3.12)沿方向 搜索,得到点 .计算在 处的梯度,若 ,则利用 和 构造第2个搜索方向 ,再沿 搜索.)1(d)2(x)

45、2(x02g2g)1(d)2(d)2(d 一般地,若已知点 和搜索方向 ,则从 出发,沿 进行搜索,得到)(kx)(kd)(kx)(kd)()()1(kkkkdxx(10.3.14)精选课件其中步长 满足k)(min)()()()()(kkkkkdxfdxf我们可以求出 的显式表达.令k)()()()(kkdxf求 的极小点,令)(0)()()()1(kTkdxf(10.3.15)根据二次函数的梯度的表达式,(6.3.15)即00(0)()()()()()()()1(kTkkkkTkkkkTkdAdgdbdxAdbAx(10.3.16)精选课件由(6.3.16)得到)()()(kTkkTkkA

46、dddg(10.3.17) 计算 在 处的梯度.若 ,则停止计算;否则,用共轭.按此设想,令)(xf)1( kx01kgAddddgkkkkk关于和,并使构造下一个搜索方向和)()1()1()(1)(1)1(kkkkdgd(10.3.18)上式两端左乘 ,并令0)()(1)()1()(kTkkkTkkTkAddAgdAdd由此得到AdTk)()()(1)(kTkkTkkAddAgd(10.3.19)精选课件 再从 出发,沿方向 搜索.)1( kx)1( kd综上分析,在第个搜索方向取负梯度的前提下, 重复使用公式(10.3.14),(10.3.17),(10.3.18)和(10.3.19),就

47、能伴随计算点的增加,构造出一组搜索方向.下面将要证明,这组方向是关于 共轭的.因此,上述方法具有二次终止性.A 定理定理10.3.3 对于正定二次函数(10.3.12),具有精确一维搜索的Fletcher-Reeves法在 次一维搜索后即终止,并且对所有 ,下列关系成立:nm )1 (mii)0(. 31, 2 , 10. 21, 2 , 10. 1)()()(iiTiiTijTijTidggdgijggijAdd蕴涵精选课件 例例6.3.1 考虑下列问题:2322212121minxxx 取初始点和初始搜索方向分别为021111)1()1(dx和 在FR法中,初始搜索方向必须取最速下降方向初

48、始搜索方向必须取最速下降方向,这一点绝不可忽视。 对于二次凸函数,FR法的计算步骤计算步骤如下: 1.给定初始点 ,置 .)1(x1k精选课件 2.计算 ,若 ,则停止计算,得点 ;否则,进行下一步.)()(kkxfg0kg)(kxx 3.构造搜索方向,令)1(1)(kkkkdgd其中,当 时, ,当 时,按公式 1k01k1k)0, 1(221iiiigigg计算因子 .1k 4.令)()()1(kkkkdxx其中按公式(6.3.17)计算步长k精选课件 5.若 ,则停止计算,得点 ;否则,置 ,返回步2.nk )1( kxx1: kk 由精选课件10.4 拟牛顿法拟牛顿法 6.4.1 拟牛顿条件拟牛顿条件前面介绍了牛顿法,它的突出优点是收敛很快.但是,运用牛顿法需要计算二阶便导数,而且目标函数的Hessian矩阵可能非正定.为了克服牛顿法的缺点,人们提出了拟牛顿法.它的基本思想基本思想是用不包含二阶导数的矩阵近似牛顿法中的Hessian矩阵的逆矩阵.精选课件 Newton法的优缺点都很突出。 优点:高收敛速度(二阶收敛); 缺点:对初始点、目标函数要求高,计算量、存储量大(需要计算、存储Hesse矩阵及其逆)。 拟Newton法是模拟Newton法给出的一个保优去劣的算法 拟Newton法是效果很好的一大类方法。它当中的DFP算法和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论