无约束最优化方法全文-毕业论文-_第1页
无约束最优化方法全文-毕业论文-_第2页
无约束最优化方法全文-毕业论文-_第3页
无约束最优化方法全文-毕业论文-_第4页
无约束最优化方法全文-毕业论文-_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

5

章无约束最优化方法第5章无约束最优化方法(f)

Min

f(x)

f

:

Rn→R5.1最优性条件设f

连续可微必要条件:若x*-l.opt.,则▽f(x*)=0(驻点)。当f

凸时,x*-l.opt.←→▽f(x*)=0注意:

f(x)

≥f(x*)+

▽f

T

(x*)(x-x*),

x故

f(x*)

≤f(x),

x

由于▽f

T

(x*)

=0)。在迭代点x(k)2.2最速下降法取方向

d(k)=

-▽f(x(k)

)精确一维搜索最速下降法:梯度方向函数值变化最快的方向。5.2最速下降法Y||

▽f(x(k)

)

||<

ε?stop.x(k)–解Nd(k)=

-▽f(x(k)

)得解 min

f(x(k)+λ

d(k))s.t.

λ

>0x(k+1)=x(k)+λkd(k)x(1),

ε

>0,

k=1k=k+15.2最速下降法特点:全局收敛,线性收敛,易产生扭摆现象而造成早停。(当x(k)距最优点较远时,速度快,而接近最优点时,速度下降)原因:f(x)=f(x(k))+▽f

T

(x(k))(x-x(k))+o||x-x(k)||当x(k)接近l.opt.时,▽f(x(k))→0,于是高阶项o||x-x(k)||的影响可能超过▽Tf(x(k))(x-x(k))。5.3

牛顿法及其修正1.牛顿法设f(x)二阶可微,取f(x)在x(k)点附近的二阶Taylor近似函数qk(x)=f(x(k))+▽f

T

(x(k))(x-x(k))+(1/2

)(x-x(k))T▽2f(x(k)求驻点▽

qk(x)=

▽f(x(k))+

▽2f(x(k))

(x

x(k))=05.3

牛顿法及其修正当▽2f(x(k))正定时,有极小点:x(k+1)=x(k)-[▽2f(x(k))]-1

▽f(x(k))——Newton迭代公式实用中常用解得s(k)▽2f(x(k))

S=

▽f(x(k))x(k+1)=x(k)+s(k)x(1),

ε

>0,

k=1▽2f(x(k))

S=

▽f(x(k))得s(k),x(k+1)=x(k)+s(k)||

s(k)

||<

ε?STOP;x(k+1)—l.opt.YNk=k+1实用中,判断若▽2f(x(k))非正定时进行相应处理5.3

牛顿法及其修正特点:二阶收敛,局部收敛。(当x(k)充分接近x*时,局部函数可用正定二次函数很好地近似,故收敛很快)二次终结性:当f(x)为正定二次函数时,从任意初始点可一步迭代达到最优解。设f(x)=(1/2)xTQx+PTx+r,Qn×n对称正定,P∈Rn,r∈R。x(1),▽f(x(1))=Q

x(1)

+P

▽2f(x(1))=Q(驻点即opt.)迭代:x(2)=x(1)-Q

-1(Qx(1)+P)=-Q

–1

P主要缺点:(1)局部收敛;用到二阶Hesse矩阵,且要求正定;需计算Hesse矩阵逆或解n阶线性方程组,计算量大。5.3

牛顿法及其修正(1)为减小工作量,取m(正整数),使每m次迭代使用同一个

Hesse矩阵,迭代公式变为x(km+j+1)=x(km+j)-[▽2f(x(km))]-1

▽f(x(km+j))j=0,1,2,

…,m

1

, k=0,1,2,

…特点:收敛速度随m的增大而下降。当m=1时即Newton法,当m→∞时即线性收敛。(2)带线性搜索的Newton法(阻尼牛顿法,阻尼因子λk):在Newton迭代中,取d(k)=

-[▽2f(x(k))

]

1

▽f(x(k))

,加入线min

f(x(k)+λk

d(k))求得λk

,

x(k+1)=x(k)+λkd(k)特点:可改善局部收敛性,当d(k)为函数上升方向时,可向负方向搜索,但可能出现±d(k)均非下降方向的情况。5.3

牛顿法及其修正(3)Goldstein-Price方法(G-P法)取d(k)=-[▽2f(x(k))]-1

▽f(x(k)),▽2f(x(k))正定—▽f(x(k)),

否则采用下列精确一维搜索:求λk,使其中δ

∈(0,1/2)1°

f(x(k)+λk

d(k))

f(x(k))+

δ

▽f

T

(x(k))

d(k)

λk2°

f(x(k)+λk

d(k))

f(x(k))+

(1-δ)

▽f

T

(x(k))

d(k)

λ特点:在一定条件下,G-P法全局收敛。但当▽2f(x(k))非正定情况较多时,收敛速度降为接近线性。5.3

牛顿法及其修正

(4)Levenberg-Marguardt法(L-M法)主要思想:用[▽2f(x(k))+μ

E

]取代▽2f(x(k))进迭代,其中E

为单位矩阵。μ>0

使[▽2f(x(k))+μ

E

]正定,μ尽量小。特点:全局二阶收敛。5.4共轭梯度法1.共轭梯度法的方向设f(x)=(1/2)xTGx+bTx+c

,其中Gn×n对称正定,b∈Rn,从最速下降方向开始,构造一组共轭方向:设初始点x(1),取d(1)=-▽f(x(1))(最速下降方向)①设k≥1,已得到k个相互共轭的方向d(1),d(2),…,d(k),以及由x(1始依次沿上述方向精确一维搜索得到点x(2),…,x(k),x(k+1)。即有下式:②x(i+1)=x(i)+αid(i)

,

i=1,2,

…,k精确一维搜索保证方向导数为0:▽fT(x(i+1))d(i)=0,i=1,2,

…,k③在x(i+1)点构造新方向d(k+1)为-▽f(x(k+1))与d(1),d(2),…,d(k)的5.4共轭梯度法使d(k+1)与d(1),d(2),…,d(k)都共轭:d(k+1)

TG

d(j)

=0

,j=

1,2,

…,kGram-Schmidt过程:i,j=1,2,…,k记y(j)=▽f(x(j+1))-▽f(x(j))=G(x(j+1)-x(j))=αjGd(j)d(i)T

y(j)

=

αj

d(i)T

G

d(j)=0

,i≠j⑦根据式⑥,有根据式④~式⑥有d(k+1)

T

y(j)

=

αj

d(k+1)T

G

d(j)=0,

j=

1,2,

…,k⑧⑧′5.4共轭梯度法⑨j≤k,i<j有▽f

T(x(j+1))d(i)=0由式⑥由式⑨▽f

T(x(j+1))

▽f(x(i))=0i<j≤k⑩(由式④)j根据式⑧及式⑥得-▽f(x(k+1))T

[▽f(x(j+1))

-▽

f(x(j))]+β

(k)d(j)T

y(j)=0,j=1,2,5.4共轭梯度法上式中由式⑩有-▽f

T

(x(k+1))▽f(x(j+1))=0由式⑥有j

j

(k)d(j)Ty(j)=

β

(k)α

d(j)TGd(j)于是

β

(k)

=0,故式④中只有

β

(k)

≠0,

记β

=

β

(k)j

k

k

k可得到公式d(k+1)=

▽f(x(k+1))+

βk

d(k)当j=k时,由式⑧′、式⑥得注意:5.4共轭梯度法5.4

共轭梯度法2.算法流程图x(1),

ε

>0d(1)=▽

f(x(1)),k=1k=k+1k=1||▽

f(x(k))||<

ε?Stop.x(k)—解k=n?x(1)=x(n+1)d(1)=-▽

f(x(1)),k=1求β

kd(k+1)=-▽

f(x(k+1))+β

kd(k)YN解

Min

f(x(k)+λ

d(k))s.t.

λ

>0得

λkx(k+1)=x(k)+λk

d(k)YN重新开始5.4共轭梯度法算法特点全局收敛(下降算法),线性收敛。每步迭代只需存储若干向量(适用于大规模问题)。有二次终结性(对于正定二次函数,至多n次迭代可达opt.)。注:对不同的β

k公式,对于正定二次函数是相等的,对非正定二次函数,有不同的效果,经验上PRP效果较好。5.5变尺度法f:

Rn→

R1.变尺度法的基本思路:(f)Min

f(x),(1)基本思想||x(k+1)-x(k)||<

ε?修正H(k)产生H(k+1)Stop.x(k+1)—解用对称正定矩阵H(k)近似▽2f(x(k)),而H(k)的产生从给定H(1)开始逐步修正得到。(2)算法框图x(1),H(1)对称ε>0,

k=1k=k+1d(k)=-H(k)▽f(x(k))一维搜索得λkx(k+1)=x(k)+λk

d(k)YN5.5变尺度法(3)拟Newton方程记s(k)=x(k+1)-x(k)

,

y(k)=▽

f(x(k+1))

f(x(k))当f

为二次函数时:f(x)=(1∕2)xTBx+c

T

x+b▽

f=

B

x+cy(k)=Bs(k)

或s(k)=B-1

y(k)有称

H

y=S

y=BS或 为拟Newton方程。显然当H

正定时,B-1

=H.(4)“近似”对于f(x)的二阶Taylor展式,舍去高阶项,有或y(k)

2f(x(k))s(k)

s(k)

(▽

2f

(x(k)))

1

y(k)用矩阵B(k)或H(K)分别取代▽2f(x(k))或者(▽2f

(x(k)))-1使拟Newton方程成立,可看做是对▽2f

(x(k))或(▽2f

(x(k)))-1的种近似。此种近似H

或B

不唯一。5.5变尺度法(5)变尺度法的主要特点只需用到函数的一阶梯度(Newton法用到二阶Hesse矩阵);下降算法,故全局收敛;不需求矩阵逆(计算量小);一般可达到超线性收敛(速度快);有二次终结性。2.DFP(Davidon(1959),Fletcher

and

Powell(1963))法和

BFGS(Broyden(1970),Fletcher(1970),Goldfarb(1970),Schanno(1970))法(1)DFP法以下省去各量上标,x,s,y,H

表示第k

步的量,等表示第k+1步的量。5.5变尺度法5.5变尺度法Ex.用DFP法求解10x1

+x22

2解:取初始点x(1)=(1∕10,1)T,H(1)=E

(单位矩阵)得到如下结果:(计算过程见下页)5.5变尺度法计算过程5.5变尺度法5.5变尺度法对称正定。定理:设H对称正定,sTy>0那么DFP法产生的注:下列各情况下有sTy>0:1º

f(x)为正定二次函数;2º精确一维搜索时;3º前章介绍的不精确一维搜索时。可以证明:DFP法在精确一维搜索前提下,超线性收敛。(2)BFGS法若把前面的推导平行地用在y=Bs公式上,可得到5.5变尺度法用此公式求方向时,需用到矩阵求逆或解方程:d=

-B-1▽

f(x)

Bd=-▽

f(x)由于每次只有秩2的变换,这里的计算量仍可以降下来。为了得到H-公式,可对上面 求逆(推导得):BFGS法有变尺度法的全部优点,并且在一定条件下可以证明在BFGS法中使用前文中介绍的不精确一维搜索有全局收敛性。5.5变尺度法3.Broyden族当在秩2公式中,α、β任意选取时可得到不同的公式,经过理论推导,可得到下列结果:5.5变尺度法5.6直接算法Min

f(x)1.单纯形法及可变多面体算法(1)单纯形法基本思路设x(0),x(1),…,x(n)是Rn中n+1个点构成的一个当前的单纯形。比较各点的函数值得到:x

max,x

min使f(

xmax)=max{f(x(0)),f(x(1)),

…,

f(x(n))}f(xmin)=min{f(x(0)),f(x(1)),…,f(x(n))}取单纯形中除去xmax点外,其他各点的形心去掉xmax,加入x(n+1)得到新的单纯形。重复上述过程。5.6直接算法1234578几点注意:⑴当x(n+1)又是新单纯形的最大值点时,取次大值点进行反射;⑵若某一个点x′出现在连续m个单纯形中的时候,取各点与x′线的中点(n个)与x′点构成新的单纯形,继续进行。经验上取m≥1.65n+0.05n2例如:n=2时,可取m≥1.65×2+0.05×4

=3.5可取m=4。10961112135.6直接算法优点:不需要求导数,不需要一维搜索。缺点:无法加速,收敛慢,效果差。(2)改进单纯形法(可变多面体算法)设第k步迭代得到n+1个点:x(0),x(1),…,x(n),得到x

max,x

min及通过下列4步操作选新迭代点:1º反射:取反射系数α

>0(单纯形法中α

=1)2º扩展:给定扩展系数γ

>1,计算(加速)5.6直接算法若f(y(1))<f(min),则若f(y(1))>f(y(2)),那么y(2)取代xmax;否则取代xmax

。若max{f(x(i))|

x(i)≠xmax

}≥f(y(1))≥f(x

min),y(x

max

。3°收缩:若f(xmax

)>f(y(1))>f(x(i)),x(i)≠xmax

,计算以y(3)取代x

max

。4°减半:若f(y(1))>f(xmax

),重新取各点,使x(i)=xmin

+1∕2(x(i)-x

min

)得到新单纯形。经验上:α=1,0.4≤β≤0.6,2.3≤γ≤3.0。有人建议:α=1,β=0.5,γ=2。算法停机准则取:5.6直接算法2.模式搜索法:Hooke

&

Jeeves

(1961)(1)基本思想与主要过程△利用两类移动(探测性移动和模式性移动)进行一步迭代:探测性移动的目的:探求一个沿各坐标方向的新点并得到一个“有前途”的方向;模式性移动的目的:沿上述“有前途”方向加速移动。△主要过程:第k步迭代,设已得到x(k)1°探测性移动:给定步长αk

,设通过模式性移动得到y(0),依次沿各坐标方向e(i)=(0,…,1,0,…,0)Ti移动αk步长:i=0,1,…,n-1,=y(i)+

αk

e(i+1)若f(

)<f(y(i)),

则y(i+1)

=5.6直接算法否则取 =y(i)-αk

e(i+1)若f(

)<f(y(i)),

则y(i+1)

=否则y(i+1)=y(i)最后得到y(n)。若f(y(n))<f(x(k)),令x(k+1)=y(n)。2°模式性移动x(k+1)-x(k)为一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论