版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
5.3.4惩罚函数法惩罚函数法简介总结2021/6/271惩罚函数法简介
惩罚函数法是一种使用很广泛、很有效的间接法。基本原理:把约束优化问题转化成无约束优化问题来求解。两个前提条件:一是不破坏原约束的约束条件二是最优解必须归结到原约束问题的最优解上去按照惩罚函数的构成方式,惩罚函数法分为三种:外点法、内点法、混合法2021/6/272惩罚项r(k)、m(k)-----罚因子惩罚函数2021/6/2735.3.4.1内点法㈠引例设有一维不等式约束优化问题的数学模型S.T.:2021/6/274由图可见,目标函数的可行域为x≥b,在可行域内目标函数单调上升,它的最优解显然是x*=b,F*=ab2021/6/275对引例的惩罚函数进行分析,以对内点法有初步认识:⑴本问题是不等式约束优化问题,故只有一项惩罚项,一个罚因子⑵规定罚因子为某一正数,当迭代点是在可行域内时,则惩罚项的值必为正值,因此必有2021/6/276而且,当x越趋近于约束边界时,由于惩罚项增大,所以罚函数的值越大。当x←b时,罚函数的值将趋近于+∞。因此,当初始点取在可行域内,求函数的极小值时,只要适当控制搜索步长,防止迭代点跨入非可行域,则所搜索到的无约束极小点x*必可保持在可行域内。⑶若对于罚因子的取值由初始的逐渐变小时,惩罚函数愈逼近于原目标函数F(x),罚函数曲线越来越接近于原F(x)=ax直线,如图所示,对应罚函数的最优点列不断趋近于原约束优化问题的最优点x*=b2021/6/277小结
由以上可见,如果选择一个可行点作初始点,令其罚因子由大变小,通过求罚函数的一系列最优点,显见,无约束最优点序列将逐渐趋近于原约束优化问题的最优点x*。2021/6/278㈡内点罚数法的形式及特点⑴具有不等式约束的优化问题的数学模型u=1,2……,p⑵构造如下形式的内点罚函数S.T.:2021/6/279关于惩罚因子规定为正,即。且在优化过程中是减小的,为确保为递减数列,取常数C0<C<1称系数C为罚因子降低系数=0或关于惩罚项,由于在可行域内有,且永远取正值,故在可行域内惩罚项永为正。的值越小则惩罚项的值越小。2021/6/2710
由于在约束边界上有,因此,当设计点趋于边界时,惩罚项的值将趋于无穷大。由此可知,在可行域内,始终有。
当时,却有,所以整个最优化的实质就是用罚函数去逼近原目标函数F(x);
当设计点逐渐由内部趋近于边界时,由于惩罚项无穷增大,则罚函数也将无穷增大。
从函数图形上来看,犹如在可行域的边界上筑起一道陡峭的高墙,使迭代点自动保持在可行域内,用此办法来保证搜索过程自始至终不离开可行域。所以,内点法也常称为围墙函数法。2021/6/2711⑶内点罚函数法的求解过程
为了用惩罚函数去逼近原目标函数F(x),则要用F(x)及构造一个无约束优化问题的数学模型
选取初始点(原约束优化问题的内点),初始罚因子,罚因子降低系数C。用无约束优化方法求上式无约束优化问题的最优解。2021/6/2712所得解为;当k在增大的过程中,得到惩罚函数的无约束最优点列为点列中各点均在可行域内部,随着k→∞的过程,点列将趋近于原约束问题的最优解x*。即=x*由此可知,内点法的序列无约束最优点是在可行域内部且趋近于约束最优点x*的。内点罚函数还可以按如下形式构成2021/6/2713㈢初始点x(0)的选取
由于内点法的搜索是在可行域内进行,显然初始点必须是域内可行点。须满足确定初始点常用如下两种方法⑴自定法即根据设计者的经验或已有的计算资料自行决定某一可行点作为初始点。⑵搜索法任选一个设计点为初始点。通过对初始点约束函数值的检验,按其对每个约束的不满足程度加以调整,将点逐步引入到可行域内,成为可行初始点,这就是搜索法。2021/6/2714㈣关于几个参数的选择⑴初始罚因子r(0)的选取
如果值选得太大,则在一开始罚函数的惩罚项的值将远远超出原目标函数的值,因此,它的第一次无约束极小点将远离原问题的约束最优点。在以后的迭代中,需要很长时间的搜索才能使序列无约束极小点逐渐向约束最优点逼近。
如果值选得太小,则在一开始惩罚项的作用甚小,而在可行域内部惩罚函数与原目标函数F(x)很相近,只在约束边界附近罚函数值才突然增高。这样,使其罚函数在在约束边界附近出现深沟谷地,罚函数的性态变得恶劣。2021/6/2715如下图,对于有深沟谷地性态差的函数,不仅搜索所需的时间长,而且很难使迭代点进入最优的邻域,以致极易使迭代点落入非可行域而导致计算的失败。r(0)=1~50或2021/6/2716⑵递减系数C的选择
罚因子递减系数C的选择,一般认为对算法的成败影响不大。规定0<C<1。
若C值选得较小,罚因子下降快,可以减少无约束优化的次数,但因前后两次无约束最优点之间的距离较远,有可能使后一次无约束优化本身的迭代次数增多,而且使序列最优点的间隔加大,对约束最优点的逼近不利。相反,若C值取得较大,则无约束优化次数就要增多。通常建议取C=0.1--0.52021/6/2717㈤终止准则
随着罚因子的值不断减小,罚函数的序列无约束最优点将越来越趋近于原约束优化问题的最优点。
设惩罚函数的无约束最优点列为对应的罚函数值为2021/6/2718终止准则可用下述两者之一⑴相邻两次惩罚函数无约束最优点之间的距离已足够的小。设ε1为收敛精度,一般取ε1=10-4-10-5,则需要满足⑵相邻两次惩罚函数值的相对变化量已足够小。设ε2为收敛精度,一般取ε2=10-3-10-4,则需要满足2021/6/2719㈥算法步骤⑴构造内点惩罚函数⑵选择可行初始点,初始罚因子,罚因子降低系数C,收敛精度与,置k←0⑶求无约束优化问题,有最优点。⑷当k=0时转步骤⑸,否则转步骤⑹⑸置k←k+1,,并转步骤⑶⑹由终止准则,若满足则转步骤⑺,否则转⑸⑺,输出最优解(x*,F*)2021/6/2720内点法流程图给定:x(0)∈D,r(0),C,ε1,ε2k←0K=0?入口用无约束优化方法求罚函数的优化点出口++--2021/6/2721㈦内点罚函数的特点
内点法只适用于解不等式约束优化问题。由于内点法需要在可行域内部进行搜索,所以初始点必须在可行域内部选取可行设计点。内点法的突出优点在于每个迭代点都是可行点因此,当迭代达到一定阶段时,尽管尚没有达到最优点,但也可以被接受为一个较好的近似解。2021/6/27225.3.4.2外点法外点法可以解不等式约束优化问题或等式约束优化问题㈠引例设有一维不等式优化问题的数学模型用外点法构造惩罚函数,具体构造形式如下x≥bx<bS.T.:2021/6/2723写成另一种形式2021/6/2724
如上图,此处的惩罚函数也是由原目标函数F(x)与惩罚项而组成。惩罚项中包含有可调整的参数r(k)与约束函数。
由惩罚项的构造可知,若迭代点在可行域的内部,惩罚项的值为0,惩罚函数值与原目标函数值相等;而若在非可行域(即可行域的外部),惩罚项是以约束函数的平方加大的,即迭代点违反约束越严重,惩罚项的值增加的越大。因此,在非可行域内,必有且罚因子r(k)越大,惩罚作用越明显。
由图,对于某r(k)值,求出惩罚函数的最优点当取罚因子为递增数列,随k的增加,罚函数的无约束最优点序列为2021/6/2725
该序列将趋近与原约束问题的最优点x*,x*=b。值得注意的是,尽管增加直至趋于无穷大,但最终的近似最优点x*仍在可行域的外部。
即外点法构造的罚函数是使迭代点从可行域的外部逐渐逼近约束最优点,这正是外点法名称的由来。2021/6/2726㈡外点罚函数法的形式及特点先讨论解不等式约束优化问题设有不等式约束优化问题u=1,2……,p构造外点法惩罚函数的常见形式取正递增S.T.:2021/6/2727引入罚因子递增系数C>1,并令=∞惩罚项的含义可用另一形式表示当gu(x)≥0(x∈D)当gu(x)<0(x∈D)在可行域内(包括边界)在非可行域,为递增函数2021/6/2728外点罚函数的求解过程
用外点罚函数去逼近原目标函数F(x),构造一个无约束优化问题模型x∈Rn任选初始点x(0),初始法罚因子r(0)>0,罚因子递增系数C>1
对于r(k)为某一值,同过对惩罚函数的无约束求优,可得最优点。随着k的增大,得无约束最优点列2021/6/2729在k←∞的过程中,点列将趋近于原问题的最优点实线为原目标函数等值线虚线为罚函数等值线2021/6/2730总结
由上图可见,两种等值线在可行域内部及边界上是重合的;而在非可行域中,罚函数的等值线升高了。即只有在可行域外部惩罚项才起到惩罚的作用。r(k)值越大,惩罚作用越大。
由上b图可知,在起作用约束边界处罚函数等值线变得越密集和越陡峭。随r(k)的增大,最优点列将越接近于原约束优化问题的最优点x*。但须注意,近似的最优点是落在边界处非可行域一侧。2021/6/2731㈢对几个问题的讨论(1)初始点x(0)的选取在可行域及非可行域内均可。(2)初始罚因子r(0)和递增系数C的选取外点法中,这两者的选择对算法的成败和计算速度有显著的影响。2021/6/2732
选取过小,则序贯无约束求解的次数就增多,收敛速度慢;反之,则在非可行域中,发函数比原目标函数要大得多,特别在起作用约束边界处产生尖点,函数性态变坏,从而限制了某些无约束优化方法的使用,致使计算失败。C的选取影响不大,通常C=5-102021/6/2733(3)约束容差带
最优点在非可行域内,是一个非可行点,这对某些工程是不允许的。因此,可在约束边界可行域一侧加一条容差带。相当于将约束条件改为是容差量,通常2021/6/2734㈣终止准则
随着罚因子的值不断增大,罚函数的序列无约束最优点将越来越趋近于原约束优化问题的最优点。
设惩罚函数的无约束最优点列为对应的罚函数值为2021/6/2735终止准则可用下述两者之一⑴相邻两次惩罚函数无约束最优点之间的距离已足够的小。设ε1为收敛精度,一般取ε1=10-4-10-5,则需要满足⑵相邻两次惩罚函数值的相对变化量已足够小。设ε2为收敛精度,一般取ε2=10-3-10-4,则需要满足2021/6/2736外点法流程图给定:x(0)∈R,r(0),C,ε1,ε2k←0k=0?入口用无约束优化方法求罚函数的优化点出口++--㈣算法步骤与流程图2021/6/2737⑶求,得最优点⑷当k=0时转步骤⑸,否则转步骤⑹⑸置k←k+1,,并转步骤⑶⑹由终止准则,若满足则转步骤⑺,否则转⑸⑺,输出最优解(x*,F*),停止计算。算法步骤⑴在n维空间任取初始点x(0)⑵选取初始罚因子r(0),递增系数C,并置k←02021/6/2738㈤用外点罚函数法解等式约束优化问题设有二维约束优化问题h1(x)=x1+x2-10=0如右图,h1(x)为该约束问题的可行域,这条直线以外的整个x1ox2平面为非可行域。目标函数等值线与该直线的切点为最优点最优点S.T.:2021/6/2739按外点法的基本思想,构造惩罚函数x∈Dx∈D
在可行域上,惩罚项的值为零,惩罚函数值与原目标函数值相同;在非可行域上,惩罚函数的值恒为正,罚函数大于原目标函数,即在可行域外惩罚项起到了惩罚作用。在k←∞的过程中,点列将趋近于原问题的最优点
对于m(k),随着k的增大,得无约束最优点列2021/6/2740推广到具有一般的等式约束优化问题首先构造如下形式的外点惩罚函数惩罚因子m(k)规定取正,m(0)<m(1)<……。即罚因子递增系数C>1在可行域上值为零,非可行域上,值恒大于零S.T.:2021/6/27415.3.4.3混合法
用罚函数法解决有等式约束和不等式约束的一般约束(GP型)优化问题的方法,把它称为混合惩罚函数法,简称混合法。1混合法惩罚函数的形式及特点一般约束问题的优化模型S.T.:2021/6/2742用惩罚函数法将其转化为无约束优化问题
惩罚函数是由原目标函数及包含约束函数的惩罚项组成。由于该问题的约束条件包含不等式约束与等式约束两部分。因此,惩罚项也应由对应的两部分组成。对应等式约束部分的只有外点法一种形式,而对应不等式的约束部分有内点法或外点法两种形式。因此按照对不等式约束处理的方法不同,混合法惩罚函数也具有两种形式。2021/6/2743⑴内点形式的混合法
不等式约束部分按内点法形式处理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 路基路面排水课程设计
- 鲁奇气化课程设计
- 2024铁路货运合同能源消耗量化管理协议3篇
- 2025年度建筑安全施工安全事故处理合同协议3篇
- 中小企业2024年专兼职工作人员劳动协议模板一
- 二零二五年度钢铁项目投资担保协议3篇
- 税收筹划小组课程设计
- 二零二五年度绿色建筑项目合作协议范本2篇
- 二零二五年度环保检测设备全国巡展运输合同3篇
- 2025年度销售合同:高端智能手机销售代理协议5篇
- GB/T 18029.1-2024轮椅车第1部分:静态稳定性的测定
- 自适应噪声抵消技术的研究
- 湖南省建筑工程定额
- 山东省临沂市罗庄区2024届中考联考化学试题含解析
- DIALux-4.7软件使用培训
- JJG 512-2021 白度计行业标准
- (2024年)《处方管理办法》培训课件
- 我国乡镇小学高年级学生课外阅读现状调查与研究
- 道路交通安全隐患排查整治方案
- 企业事业部制的绩效评估与考核
- GB/T 43544-2023口腔清洁护理用品牙膏对牙结石抑制率的实验室测试方法
评论
0/150
提交评论