运筹学与最优化方法-第5章无约束最优化课件_第1页
运筹学与最优化方法-第5章无约束最优化课件_第2页
运筹学与最优化方法-第5章无约束最优化课件_第3页
运筹学与最优化方法-第5章无约束最优化课件_第4页
运筹学与最优化方法-第5章无约束最优化课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章无约束最优化方法2020/12/21第五章无约束最优化(f)minf(x)f:Rn→R

5.1最优性条件

设f连续可微必要条件:若x*-l.opt.则▽f(x*)=0(驻点)。当f凸时,x*-l.opt.←→▽f(x*)=0

注意:f(x)≥f(x*)+▽Tf(x*)(x-x*),x.

故f(x*)≤f(x),x.(由于▽Tf(x*)=0)5.2最速下降法在迭代点x(k)取方向d(k)=-▽f(x(k)

)精确一维搜索

最速下降法:梯度方向函数值变化最快的方向2020/12/22第五章无约束最优化5.2最速下降法(续)x(1),ε>0,k=1||▽f(x(k)

)

||<ε?Yesstop.x(k)–解

Nod(k)=-▽f(x(k)

)解minf(x(k)+λd(k))s.t.λ>0得x(k+1)=x(k)+λkd(k)k=k+12020/12/23第五章无约束最优化5.2最速下降法(续)特点:全局收敛,线性收敛,易产生扭摆现象而造成早停。(当x(k)距最优点较远时,速度快,而接近最优点时,速度下降)原因:f(x)=f(x(k))+▽Tf(x(k))(x-x(k))+o||x-x(k)||

当x(k)接近l.opt.时▽f(x(k)

)→0,于是高阶项o||x-x(k)||的影响可能超过▽Tf(x(k))(x-x(k))。5.3Newton法及其修正一、Newton法:

设f(x)二阶可微,取f(x)在x(k)点附近的二阶Taylor近似函数:

qk(x)=f(x(k))+▽Tf(x(k))(x-x(k))+1/2(x-x(k))T▽2f(x(k))(x-x(k))

求驻点:

▽qk(x)=▽f(x(k))+▽2f(x(k))(x-x(k))=02020/12/24第五章无约束最优化Newton法:(续)

当▽2f(x(k))正定时,有极小点:

x(k+1)=x(k)-[▽2f(x(k))]-1▽f(x(k))——Newton迭代公式实用中常用▽2f(x(k))S=-▽f(x(k))解得s(k)x(k+1)=x(k)+s(k)x(1),ε>0,k=1▽2f(x(k))S=-▽f(x(k))

得s(k),x(k+1)=x(k)+s(k)||s(k)||<ε?STOP.x(k+1)—l.optYesNok=k+1实用中,判断若▽2f(x(k))

非正定时进行相应处理2020/12/25第五章无约束最优化Newton法:(续)特点:二阶收敛,局部收敛。(当x(k)充分接近x*时,局部函数可用正定二次函数很好地近似,故收敛很快)二次终结性:当f(x)为正定二次函数时,从任意初始点可一步迭代达到最优解。

设f(x)=1/2xTQx+PTx+r,Qn×n对称正定,P∈Rn,r∈R.x(1),▽f(x(1))=Qx(1)+P▽2f(x(1))=Q

迭代:x(2)

=x(1)-Q–1(Qx(1)+P)=-Q–1P(驻点即opt.)主要缺点:(1)局部收敛(2)用到二阶Hesse阵,且要求正定(3)需计算Hesse阵逆或解n阶线性方程组,计算量大2020/12/26第五章无约束最优化5.3Newton法及其修正二、Newton法的改进:(1)为减小工作量,取m(正整数),使每m次迭代使用同一个Hesse阵,迭代公式变为:

x(km+j+1)=x(km+j)-[▽2f(x(km))]-1▽f(x(km+j))j=0,1,2,…,m-1,k=0,1,2,…

特点:收敛速度随m的增大而下降

m=1时即Newton法,m→∞即线性收敛。(2)带线性搜索的Newton法:在Newton迭代中,取d(k)=-[▽2f(x(k))]-1▽f(x(k)),

加入线性搜索:minf(x(k)+λkd(k))

求得λk,x(k+1)=x(k)+λkd(k)

特点:可改善局部收敛性,当d(k)为函数上升方向时,可向负方向搜索,但可能出现±d(k)均非下降方向的情况。2020/12/27第五章无约束最优化5.3Newton法及其修正二、Newton法的改进:(续)(3)Goldstein-Price方法(G-P法):取d(k)=-[▽2f(x(k))]-1▽f(x(k)),▽2f(x(k))正定-▽f(x(k)),否则采用下列精确一维搜索:求λk,使其中δ

∈(0,1/2)1°f(x(k)+λk

d(k))≤f(x(k))+δ

▽f(x(k))

Td(k)λk2°f(x(k)+λkd(k))≥f(x(k))+(1-δ)▽f(x(k))

Td(k)λk特点:在一定条件下,G-P法全局收敛。但当▽2f(x(k))非正定情况较多时,收敛速度降为接近线性。2020/12/28第五章无约束最优化5.3Newton法及其修正二、Newton法的改进:(续)(4)Levenberg-Marguardt法(L-M法):主要思想:用[▽2f(x(k))+μI]

取代▽2f(x(k))进行迭代,其中I为单位矩阵。μ>0使[▽2f(x(k))+μI]

正定,μ尽量小。特点:全局二阶收敛。2020/12/29无约束最优化----共轭梯度法一、共轭梯度法的方向:

设f(x)=(1/2)xTGx+bTx+cGn×n对称正定,b∈Rn,从最速下降方向开始,构造一组共轭方向:设初始点x(1),取d(1)=-▽f(x(1))……①(最速下降方向)设k≥1,已得到k个相互共轭的方向d(1),d(2),…,d(k),以及,由x(1)开始依次沿上述方向精确一维搜索得到点x(2),…,x(k),x(k+1).即有下式:

x(i+1)=x(i)+αid(i),i=1,2,…,k……②

精确一维搜索保证方向导数为0:▽fT(x(i+1))d(i)=0,i=1,2,…,k……③

在x(i+1)点构造新方向d(k+1)为-▽f(x(k+1))与d(1),d(2),…,d(k)的组合:④2020/12/210共轭梯度法一、共轭梯度法的方向:(续)使d(k+1)与d(1),d(2),…,d(k)都共轭:

d(k+1)

TGd(j)=0,j=1,2,…,k……⑤Gram-Schmidt过程:i,

j=1,2,…,k记y(j)=▽f(x(j+1))-▽f(x(j))=G(x(j+1)-x(j))=αjGd(j)…….⑥

根据⑥式,有d(i)Ty(j)=αjd(i)TGd(j)=0,i≠j……⑦根据④,⑤,⑥有

d(k+1)

T

y(j)=αjd(k+1)TGd(j)=0,j=1,2,…,k……⑧⑧′这里的j应为i2020/12/211共轭梯度法一、共轭梯度法的方向:(续)

j≤k,i<j有▽f(x(j+1))Td(i)=0……⑨由⑥式

由⑨式

▽f(x(j+1))T▽f(x(i))=0

i<j≤k……⑩(由④式

)根据⑧及⑥得:j=1,2,…,k-1-▽f(x(k+1))T[▽f(x(j+1))

-▽f(x(j))]+βj(k)d(j)Ty(j)=02020/12/212共轭梯度法一、共轭梯度法的方向:(续)上式中由⑩式有:-▽f(x(k+1))T

▽f(x(j+1))

=0由⑥式有:βj(k)d(j)Ty(j)=βj(k)αjd(j)TGd(j)于是βj(k)

=0故④式中只有βk(k)

≠0,记βk=βk(k)

可得到公式:

d(k+1)=-▽f(x(k+1))+βk

d(k)

当j=k时,由⑧′,⑥式得:(11)注意:2020/12/213无约束最优化2020/12/214二、算法流程图x(1),ε>0d(1)=-▽f(x(1)),k=1k=k+1k=1||▽f(x(k))||<ε?Stop.x(k)—解解minf(x(k)+λd(k))s.t.λ>0得λk

x(k+1)=x(k)+λkd(k)

k=n?x(1)=x(n+1)d(1)=-▽f(x(1)),k=1求βkd(k+1)=-▽f(x(k+1))+βkd(k)yNyN重新开始2020/12/2155.4共轭梯度法三、算法特点:1、全局收敛(下降算法);线性收敛;2、每步迭代只需存储若干向量(适用于大规模问题);3、有二次终结性(对于正定二次函数,至多n次迭代可达opt.)

注:对不同的βk公式,对于正定二次函数是相等的,对非正定二次函数,有不同的效果,经验上PRP效果较好。2020/12/216变尺度法一、变尺度法的基本思路:(f)minf(x),f:Rn→R1、基本思想:用对称正定矩阵H(k)近似▽2f(x(k)),而H(k)的产生从给定H(1)开始逐步修整得到。2、算法框图:x(1),H(1)对称ε>0,k=1d(k)=-H(k)▽f(x(k))一维搜索得λkx(k+1)=x(k)+λkd(k)||x(k+1)-x(k)||<ε?修正H(k)产生H(k+1)Stop.x(k+1)----解k=k+1yN2020/12/217变尺度法一、变尺度法的基本思路:(续)3、拟Newton方程:记:s(k)=x(k+1)-x(k),y(k)=▽f(x(k+1))-▽f(x(k))

当f为二次函数时:f(x)=1∕2xTBx+cTx+b

▽f=Bx+c

有y(k)=Bs(k)

或s(k)=B-1y(k)

称Hy=S或y=BS为拟Newton方程。显然当H正定时,B-1=H.4、”近似”:对于f(x)的二阶Taylor展式,舍去高阶项,有y(k)≈▽2f(x(k))s(k)

或s(k)≈(▽2f

(x(k)))-1y(k)用矩阵B(k)或H(K)分别取代▽2f(x(k))或者(▽2f

(x(k)))-1使拟Newton方程成立,可看作是对▽2f(x(k))或(▽2f

(x(k)))-1的一种近似。此种近似H或B不唯一。2020/12/218变尺度法一、变尺度法的基本思路:(续)5、变尺度法的主要特点:⑴只需用到函数的一阶梯度;(Newton法用到二阶Hesse阵)⑵下降算法,故全局收敛;⑶不需求矩阵逆;(计算量小)⑷一般可达到超线性收敛;(速度快)⑸有二次终结性。二、DFP(Davidon(1959),FletcherandPowell(1963))法和

BFGS(Broyden(1970),Fletcher(1970),Goldfarb(1970),Schanno(1970))法:1、DFP法:

以下省去各量上标,x,s,y,H

表示第k

步的量,等表示第k+1步的量。2020/12/219变尺度法二、DFP法和BFGS法:1、DFP法:(续)2020/12/220二、1、DFP法:(续)Ex.用DFP法求解10x12+x22解:取初始点x(1)=(1∕10,1)T,H(1)=I(单位矩阵)得到如下结果:(计算过程见下页)2020/12/221二、1、DFP法:(续)计算过程:2020/12/222二、1、DFP法:(续)2020/12/223二、1、DFP法:(续)定理:设H对称正定,sTy>0那么DFP法产生的对称正定。注:下列各情况下有sTy>0:

1ºf(x)为正定二次函数;2º精确一维搜索时;3º前章介绍的不精确一维搜索时。可以证明:DFP法在精确一维搜索前提下,超线性收敛。2、BFGS法若把前面的推导,平行地用在y=Bs公式上,可得到2020/12/224二、2、BFGS法(续)用此公式求方向时,需用到矩阵求逆或解方程:

d=-B-1▽f(x)或Bd=-▽f(x)由于每次只有秩2的变换,这里的计算量仍可以降下来。为了得到H-公式,可对上面求逆(推导得):BFGS法有变尺度法的全部优点,并且在一定条件下可以证明在BFGS法中使用前文中介绍的不精确一维搜索有全局收敛性。

2020/12/225三、Broyden族

当在秩2公式中,α、β

任意选取时可得到不同的公式,经过理论推导,可得到下列结果:2020/12/226三、Broyden族(续)2020/12/227直接算法

minf(x)一、单纯形法及可变多面体算法1、单纯形法基本思路:设x(0),x(1),…,x(n)是Rn中n+1个点构成的一个当前的单纯形。比较各点的函数值得到:x

max,x

min使

f(x

max)=max{f(x(0)),f(x(1)),…,f(x(n))}

f(x

min)=min{f(x(0)),f(x(1)),…,f(x(n))}

取单纯形中除去x

max点外,其他各点的形心:去掉x

max,加入x(n+1)得到新的单纯形。重复上述过程。2020/12/228一、1、单纯形法基本思路:(续)几点注意:⑴当x(n+1)又是新单纯形的最大值点时,取次大值点进行反射;⑵若某一个点x′出现在连续m个单纯形中的时候,取各点与x′连线的中点(n个)与x′点构成新的单纯形,继续进行。经验上取m≥1.65n+0.05n2

例如:n=2时,可取m≥1.65×2+0.05×4=3.5可取m=4.123457891061112132020/12/229一、1、单纯形法基本思路:(续)优点:不需求导数,不需要一维搜索。缺点:无法加速,收敛慢,效果差。2、改进单纯形法:(可变多面体算法)

设第k步迭代得到n+1个点:x(0),x(1),…,x(n),得到x

max,x

min及通过下列4步操作选新迭代点:1º反射:取反射系数α>0,(单纯形法中α=1)

2º扩展:给定扩展系数γ>1,计算。(加速)2020/12/230一、

2、改进单纯形法:(续)

若f(y(1))<f(x

min),则若f(y(1))>f(y(2)),那么y(2)取代x

max;否则,y(1)取代x

max。若max{f(x(i))|x(i)≠x

max}≥f(y(1))≥f(x

min),y(1)取代x

max。3°收缩:若f(x

max)>f(y(1))>f(x(i)),x(i)≠x

max,计算,以y(3)取代x

max

。4°减半:若f(y(1))>f(x

max),重新取各点,使

x(i)=xmin+1∕2(x(i)-x

min)得到新单纯形。经验上:α=1,0.4≤β≤0.6,2.3≤γ≤3.0.有人建议:α=1,β=0.5,γ=2。算法停机准则取:2020/12/231二、模式搜索法:Hooke&Jeeves19611、基本思想与主要过程:△利用两类移动(探测性移动和模式性移动)进行一步迭代:

探测性移动的目的:探求一个沿各坐标方向的新点并得到一个“有前途”的方向;模式性移动的目的:沿上述“有前途”方向加速移动。△主要过程:第k步迭代,设已得到x(k)1°探测性移动:给定步长αk,设通过模式性移动得到y(0),

依次沿各坐标方向e(i)=(0,…,1,0,…,0)T

i

移动αk步长:i=0,1,…,n-1,=y(i)+e(i+1)

若f()<f(y(i)),则y(i+1)=2020/12/232二、1、基本思想与主要过程:(续)

否则取=y(i)+e(i+1)

若f()<f(y(i)),则y(i+1)=否则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论