已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 摘要:随机最优控制是现代控制理论的一个重要分支。近几十年来被广泛应 用于工程、经济、金融、生物、管理等领域。随机最优控制模型的研究适于二十 世纪六十年代,在随后盼二十多年中得到了很大发展,各种模型被相继提出,在 研究中形成了一套系统的理论。 本文研究了两类最优控制问题。一方面,在对一类比例再保险模型进行分析 的过程中,不但把保险公司与再保公司在交易过程中需支付的交易费用考虑进去, 而且还考虑了公司的分红过程,以此为基础建立了一种新的模型,为使公司获得 最大的风险回报,针对不同的市场参数,对此新模型进行了详尽的技术分析,给 出了不同情况下所应采取的最优控制策略,得出了相应的最大风险回报函数;另 一方面,考虑在随机环境下运行的带有负债和交易费用的股份有限公司的最佳融 资问题,以最大化公司价值的方式找到随时间变化的保留盈余和增发普通股的最 佳融资组合,以变分不等式的形式把此问题描述为扩散过程的奇异型随机控制问 题,并给出其显式解。 论文分为四章: 第一章,主要介绍了现代控制理论的发展情况及一些常用的随机控制模型; 第二章,研究了带有分红和交易费用的比例在保险最优控制模型; 第三章,推广了带有负债和交易费用的股份有限公司的最佳融资模型; 第四章,给出了本文主要结论以及有待进一步解决的问题。 关键词:准备金;分红过程;交易费用;最优控制策略;风险回报;变分不等式 分类号:0 2 1 1 1 ;0 2 1 1 9 a bs t r a c t a b s t r a c t :s t o c h a s t i co p t i m a lc o n t r o li sa ni m p o r t a n tb r a n c ho fc o n t r o lt h e r o yi n r e c e n td e c a d e s ,s t o c h a s t i co p t i m a lc o n t r o li sw i d e l ya p p l i e di nm a n yf i e l d ss u c ha s e n g i n e e r i n g , e c o n o m i c s ,f i n a n c e ,b i o l o g y , m a n a g e m e n t a n ds oo n t h er e s e a r c ho f s t o c h a s t i cc o n t r o lm o d e l si sc o m m e n c e di n19 6 0 s ,a n dl a r g e l yd e v e l o p e di nt w od e c a d e s s u b s e q u e n t l y , m a n ym o d e l sa r ep u tf o r w a r d ,a n das e r i e so ft h e o r i e sa r ef o r m e di n r e s e a r c h t h i sp a p e rs t u d i e st w ok i n d so fs t o c h a s t i cc o n t r o lm o d e l s ,o nt h eo n eh a n d , w h e n w ed i s c u s sac l a s so fp r o p o r t i o n a lr e i n s u r a n c em o d e l ,w en o t o n l yc o n s i d e rt h e t r a n s a c t i o nc o s t st h a tm u s tb ep a i df o rt h er e i n s u r a n c ec o m p a n yb yt h ei n s u r a n c e c o m p a n y , b u ta l s oc o n s i d e rt h ed i v i d e n dp r o c e s s o nt h eb a s i so ft h e s e ,w ec o n s t r u c ta n e wm o d e l f u r t h e r m o r e ,i no r d e rt oa c h i e v et h em a x i m a lr i s kr e t u m , w ea n a l y z et h e d i f f e r e n tm a r k e tp a r a m e t e r si nd e t a i l c o r r e s p o n d i n gt ot h ed i f f e r e n tp a r a m e t e r s ,w ea l s o p r o v i d et 1 1 e i ro p t i m a lp o l i c i e sa n dm a x i m a lr i s kr e t l f f n s o nt h eo t h e rh a n d ,w ec o n s i d e r t h ep r o b l e mo ff i n d i n ga no p t i m a lf i n a n c i n gm i xo fr e t a i n e de a r n i n g sa n de x t e r n a l e q u i t yf o rm a x i m i z i n gt h ev a l u eo fa ni n c o r p o r a t e df i n nw i t had e b tl i a b i l i t ya n dt h e t r a n s a c t i o nc o s t si nas t o c h a s t i ce n v i r o m m e n t w ef o r m u l a t et h ep r o b l e ma sas i n g u l a r s t o c h a s t i cc o n t r o lf o rad i f f u s i o np r o c e s sb ym e a n so fv a r i a t i o n a li n e q u a l i t i e sa n do b t a i n a ne x p l i c i ts o l u t i o n t h i sp a p e ri n c l u d e sf o u rc h a p t e r s :t h ef i r s tc h a p t e rm a i n l yi n v o l v e st h er e c e n t w o r k sa n ds o m em o r m a lo p t i m a ls t o c h a s t i cm o d e l s t h es e c o n dc h a p t e rs t u d i e st h e o p t i m a lc o n t r o lm o d e lf o rp r o p o r t i n a lr e i n s u r a n c ew i t l ld i v i d e n dp r o c e s sa n dt r a n s a c t i o n c o s t s t h en l i r dc h a p t e re x t e n d st h eo p t i m a lf i n a n c i n gp o l i c i e so f i n c o r p o r a t e df i r mw i t h d e b tl i a b i l i t ya n dt r a n s a c t i o nc o s t s t h ef o u r t hc h a p t e rg i v e st h em a i nc o n c l u s i o n so ft h i s p a p e ra n d t h ep r o b l e m sw h i c hn e e dt ob er e s e a r c h e df u r t h e r k e y w o r d s :t h e r e s e r v e ;d i v i d e n dp r o c e s s ;t r a n s a c t i o nc o s t s ;o p t i m a l c o n t r o l p o l i c y ;r i s kr e t u r n ;v a r i a t i o n a li n e q u a l i t l y c l a s s n o :0 2 1 1 1 ;0 2 1 1 9 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 学位论文作者签廖参一签字日期:渺善年,月止日 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:多是萱弘 签字日期:挪孑年i 月1 2e l 导师签名:训叶今 i 签字日期:讪万年t 月谚日 致谢 本论文的工作是在我的导师刘坤会教授的悉心指导下完成的,刘坤会教授严 谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢刘坤会 老师对我的关心和指导,感谢师母汪玮老师对我生活上的关心和帮助,在次,谨向刘 老师和汪老师表示深深的敬意和衷心的感谢。 我要感谢学院的各位老师对我的指导和帮助,在校期间,我得到学院诸位老 师给予的帮助与指导,正是由于他们的贡献使我不断进步,在此,向他们表示我 最衷心的感谢。 感谢我的同学,尤其是我的同f - j i ) 币兄师姐,共同的学习、探讨与合作使我收 获颇多。 最后感谢我的家人,正是由于他们的默默贡献使我能够在学校专心完成我的 学业。 1 1 现代控制理论发展简介 1 绪论 现代控制理论的奠基人是美国科学家维纳m w i e n e r , 18 9 4 1 9 6 4 ) 自从二十世纪 五十年代以来,由于计算机、航空、航天等技术的飞速发展,控制理论得到了广 泛的应用,同时其本身也获得了很大的发展它主要包括:线性系统理论,最优控制, 自适应控锘! i 等 在对实际控制问题的研究中,由于某些不确定因素的干扰,影响控制系统的 随机因素时有发生于是,随机控制理论得到了应用和发展同时随机控制理论的发 展与随机过程理论的发展是密切相关的 随机过程论产生于2 0 世纪初期。是为适应物理学、生物学通信与控制管理科 学等方面的需要而逐步发展起来的。最初在布朗运动,电话信息量和电子管的散 粒效应,噪声等问题的研究中取得了成果1 9 3 1 年,科尔莫哥洛夫奠定了随机过程 的数学理论,1 9 5 3 年杜布的著作s t o c h a s t i cp r o c e s s 论述了随机过程的数学理论, 1 9 5 1 年伊藤发表了o ns t o c h a s t i cd i f f e r e n t i a le q u a t i o n ( m e r e a m e r m a t h s o c 4 ,1 9 5 1 ,1 5 1 ) 一文,使得对随机微分方程的研究受到了广泛重视,并渗透到很多领域,为随 机控制的发展提供了理论基础 在控制论方面,1 9 5 6 年庞德里亚金提出的极大值原理,1 9 5 7 年贝尔曼提出的 动态规划原理以及卡尔曼提出的滤波理论,标志着现代控制理论的产生,这些理 论与随机控制直接有关随机控制主要包括:最小方差控伟如滤波,随机最优控制 目前滤波向非线性方向发展,随机最优控制向分布参数系统方向发展目前解决最 优控制的方法主要有三种,即:古典变分法,庞德里亚金的极大值( r 小伺原理,贝 尔曼的动态规划原理 随机最优控制是随机控制理论的一重要分支,主要是求一状态反馈,使目标 达到最优该状态反馈称为最优控制策略随机最优控制的研究主要基于贝尔曼动 态规划原理r e b e l l m a n 在其著作d y n a m i c a lp r o g r a m m i n g ( 1 9 5 7 ) 中把动态规划原 理表述如下: a no p t i m a lp o l i c yh a st h ep r o p e r t yt h a tw h a t e v e rt h ei n i t i a lc o n d i t i o n sa r et h e r e m a i n i n gd e c i s i o nm u s tc o n s t i t u t ea no p t i m a lp o l i c yw i t l lr e g a r dt ot h es t a t er e s u l t i n g f r o mt h ef i r s td e c i s i o n 即一个最优策略具有这样的性质:不管初始状态或策略如何,相对于初始策略 6 产生的状态来说,其后的策略必须构成最优策略概括为,每个最优策略只能由最 优子策略组成由此通常得到b e l l m a n 动态规划方程,而这个方程在很多情形下不可 解,一般地需要借助以下两种方法: 1 解变分不等式方法,由a b e n s o u s s a na n dj l l i o n s 提出,通常是求一个控 制区间,再给出相应的最优控制策略它常用于一维问题,侧重于随机分析本文第 二章就用到这种方法 2 粘性解方法,由m g cr a n d a l la n dp l l i o n s 在研究随机控制间题时提出, 其中的方法不只对随机控制的研究起到推动作用,也对微分方程的研究起到巨大 的推动作用这种方法侧重于方程,也适用于多维问题,在金融数学的研究中常常 用到 1 2 几种常见的随机控制模型 本节介绍目前常见的几类随机最优控制模型,需要指出的是这几类模型的提 出都是在对实际问题的分析中产生的,具有很强的应用背景 1 2 1 奇异型随机控制 自八十年代初,奇异型随机控制问题开始引起人们的关注,后来的十多年发 展较快,是一种比较实用的模型 设形是概率空间( q ,歹,聊上的标准布朗运动,彳= c y ( 形:s f ) ,房表示茸 适应的零初值左连续的有限变差过程全体,对任意的参= 毒够有正规分解 孝= 善+ 一善一,称专= 菇+ f 为其全变差,其中孝+ 、善一均为房中单调非降过程通常 研究以下两种问题: 1 折扣费用问题 对口 0 、x r 、f 房,定义目标费用为: mv j ( x ,孝) = e 【p 咧阶( ) 出- i - d 专】 其中状态过程= x + 彬+ 参; ( ) 一般为非负二次连续可导凸函数,目标为求 最优随机控制房,使得: j ( x ,善) = m i n j ( x ,孝) 目前对奇异型折扣费用问题的研究已有许多工作【1 【1 1 】【1 8 】,进一步的结果见 2 0 2 平均期望成本问题 在状态方程为= x + 彬+ 专的条件下,对z r 、善够定义目标费用为: 7 j ( x ,孝) = l i m i n f e 【h ( x , ) a t + d 专】 。- - 0 0棚 目标为求最优随机控制f 够使得: ,( 毛善) = m i n j ( x , 善) 关于这一问题的深入研究见【1 刁 关于奇异型随机控制问题,k a r a t z a s i 的工作 1 l 】是开创性的,有重要的理论价 值,但其决策控制是即时的和连续调节的,这在实际中往往难于实施,特别是在 控制时域为无穷时,所以决策者选择一列停时瓴,乞,) 和脉冲 磊,岛,) 对系统实 施控制( 参见【2 】【2 5 】) 来得到精确解 1 2 2 脉冲控制 脉冲控制由于其应用上的可操作性,最先受到重视最初由b e i l s 0 1 塔s 锄a n d l i o n s 提出后来r i c h a r d 将其推广至i j 无限时域上( 参见【2 9 】) 设彬是概率空间( q ,歹,d 上的标准布朗运动,彳= 仃( 彬:s s f ) ,一个控制是 指一列上升的停时序列 ,r 2 ,) 及可测随机变量列辑,受, ,表示为 v = ( t ,专) :f 1 ) ,令矿表示所有可能的控制集全体i 可样分两种情况: 1 折扣费用问题 对于z r 、v y ,定义目标费用为: _ 厂( z ,d = 研f e - p t h ( x t ) d t + p 一朋曰( 当) 】 i = l 其中状态过程= x + z t + 专七一、f l o 、办( ) 和b ( ) 满足某些特定条件, 目标为求一个控制v v 使得: j ( x ,1 ,) = i n f ,j ( x , 脉冲控制模型对于有跳变控制的问题具有广泛的应用,相应的文献见 2 2 2 3 1 2 平均期望成本问题 对x r 、v v ,令目标费用函数为: j ( x ,f ) = 专研f 办( ) 出+ 曰( 磊) 其中状态方程满足分段随机微分方程也= a c x , ) a w , ,t ( t ,钆。】,t ? = + 磊, 五( ) 和b ( ) 满足某些特定条件,目标为求一个常数五 0 ,对坛r ,寻找控制 1 ,= ( ,等) :f 1 ,使得 7 l i m ,( 毛,) = 拈i 倒n f l i m 7 i 。n f j ( x ,y ) 对脉冲控制的深入研究可参见 1 6 】【2 1 】 2 8 】 8 1 2 3 控韦i j 状态无奇异项的情形 设( q ,歹,再p ) 是一个概率空间,形为其上的标准布朗运动,状态过程满足 随机微分方程: 豇= 厂( ,u , ) d t + 盯( 薯,) d 形, 其中:控制过程咋循序客厕,控制空间为u ,f 、盯满足通常l i p s c h i t z 条件 及多项式增长条件,目标函数为 j ( x ,甜) = eep 一肛| j l ( 薯,u t ) d t + e - # t g ( 而,乃 求最优随机控制“使得 ,( x ) - m i n j ( x ,“) 现令 j ( x , u ,s ) = e 卜卅卜5 j j l ( 玉,u , ) d t + e - 印叶g ( 而,乃 其中= x ,则由贝尔曼动态规划原理可知:j ( x ,j ) = m i ,n ,j ( x ,“,s ) 满足下面的 带有边值条件的微分方程 o j i ( x 一, s ) + m i ,n , a “,( 工,s ) + 办( 而甜) 卜p j ( x , s ) :0 , - ,( 而,r ) = g ( x r ,乃 其中= i o f ( x , u ) + 圭堡笋型为扩散过程的最小生成元这样随机控制问题 化为解该定常方程问题需要注意的是这类问题不含控制成本值得一提的是,这种 模型在金融控制中经常用到,投资组合问题通常考虑一个无风险资产和多个风险 资产在确定利率下的投资组合 9 1 3 本论文的工作简介 本文研究了带有分红和交易费用的比例再保险模型的最优控制问题和带有负 债和交易费用的最佳融资问题 带有分红过程的比例再保险模型的最优控制问题,最初是由h ( i ) j g a a r d b 和 t a k s a r , m 于1 9 9 7 年提出其基本模型为: 设( q ,歹,磊p ) 为一完备的概率空间,彳为滤子,表示t 时刻所获得的所有 信息,决策者以此为基础寻找最优随机控制策略,准备金r 的变化过程为 i 皿= a ( t ) k t d t + a ( t ) o r d w t - d e , t r = 了 o 其中:形为关于珂适应的标准w i e n e r 过程,参数 0 、o r 0 ,控制策略 万= 忙( f ) ,毒) 同时满足: ( 1 ) 口( f ) 【0 ,l 】为并循序可测过程; ( 2 ) 毒为0 初值,左连续,单调非降非负的彳循序可测过程 其中:缶表示分红过程,即到达t 时刻的分红累计量;口( f ) 表示t 时刻的自留 比侈! i 记n 为满足上述条件的允许控制策略全体对任意万h 定义风险回报函数 ( 即保险公司的收益) 为 圪( x ) = e 【p 一加d 参 这里停时靠= i n f t o :r o 表示公司的破产事件, 0 为贴现因子 目标是寻找最优控制策略刀= 口。( f ) ,等) 使得 “x ) = 叱( 功= s u p 圪( 石) 称1 ,( 工) 为最大风险回报函数 该模型提出来以后,一些文献对该问题进行了深入的研究( 参见文献【3 】、 【4 1 、【5 】、【1 0 、 2 4 】) 2 0 0 4 年杨瑞成在此基础上把交易费用这一因素考虑进去, 构造了一新的包括分红过程和交易费用的比例再保险模型( 参见文献 3 4 】) : 设( q ,歹,。筇尸) 为一完备的概率空间,彳为滤子,表示t 时刻所获得的所有 信息,决策者以此为基础寻找最优随机控制策略,准备金r 满足如下微分方程: d r , = ( 口o ) 一( 1 一a ( t ) ) t c ) ) d t + a ( t ) c r d w t d 戋 其中x ( 1 一口( f ) ) 为t 时刻的交易费率令r = 名一其中五 0 则准备金r 。的变 化过程为: l 皿= ( 一( 1 一a ( t ) ) a ) d t + a ( t ) o r d w t ,一d 缶 t r = x 其中:形为关于彳适应的标准w i e n e r 过程,参数允 0 、o r 0 ,控制策 略7 1 = 扣( f ) ,缶) 使得r 0 同时满足: l o ( 1 ) 口( f ) 瞅1 】为耳循序可测过程; ( 2 ) 毒为0 初值,左连续,单调非降非负的彳循序可测过程 其中:缶表示分红过程,即到达t 时刻的分红累计量;a c t ) 表示t 时刻的自留 比例 记n 为满足上述条件的允许控制策略的全体,对v 刀i - i ,定义风险回报函数 匕( 功= 研 e - p t d 毒t + 矿肛用 这里停时o = i n f t 0 :r 0 ) 为公司破产时间;p o 表示破产时的补偿值:e 表示数学期望; 0 表示贴现因子 目标是寻找一最优控制策略刀量 矿:f o ) = ( 口( f ) ,占) :t o ) i - 1 ,使得 “x ) = o ( x ) = s u p 匕( 曲 称,( x ) 为最大风险回报函数 本文在第二章中将上述模型中的费用函数推广为: 圪( 对= 研f :。p 堆g ( 尽矽专+ p 一肛尸】 其中:g ( ) 满足一定条件 最佳融资问题最初的研究( 参见文献【3 s 】) 均为涉及负债项目,2 0 0 5 袁继红在 文献 3 6 】中加入了负债项目的考虑,其模型为: 设( q ,歹,p ) 为一概率空间,置表示股份有限公司( 以下简称公司) 在t 时刻 的资产,初始资产为x 0 ,该公司每年有固定的负债需要偿还( 如上交总公司的 利润、债务摊销、兑付债券等) ,年偿债额为6 设公司资产z 的动态变化方程为 d x , = ,( 置) a t + 盯( t ) d 形+ c d e , 一r i d , 一万出, x o _ = z 0 ,x o 2 工 其中靠= x 0 为股份有限公司在o 时刻有非零资产得出,形为一维标准布 朗运动,表示市场的随机波动且。彳= o r ( 彬,o ;,- ( ) 表示回报函数,r ( y ) 代 表置= y 时的平均回报假定厂( ) 二次可导,且满足:厂( o ) = 0 、,。( ) s0 且存在 ( o ,佃) 使得,( ) = p ,其中p 为股东要求的回报率;仃( ) 是递增的可微函数, 满足仃( o ) = 0 、盯( 0 ) = 7 0 、盯( x ) o 、a ( t ) 【o ,1 】为自留比例,w 为一维标准b m 在此基础上产生了一系 列的研究成果,并能很好的运用到实际操作过程中,从而为保险公司获得最大风 险回报提供了技术基础借助于标准w i e n e r 过程,用随机分析的方法研究保险问题 已成为近年来的一大热点 本章在带有分红过程和交易费用的比例再保险基本模型的基础上将风险回报 函数进行了推广 2 2 模型介绍 由于保险公司与再保公司在进行交易的过程中,一般需要保险公司支付给再 保公司一定的交易费用本章在考虑分红过程的同时,考虑了这种交易费用,即保 险公司除了拿出比例为l 一口( f ) 的保费外,另外需要支付一定的交易费用,实际上 保险公司支付给再保公司的金额要高于本身所获得保费的相应部分假设t 时刻的 交易费率为茁( 1 一口( f ) ) ( 这里常数r 0 ) ,毒为保险公司在t 时刻的分红累计量( 称 之为分红过程) ,于是保险公司的准备金服从下列随机微分方程: 矗r = ( 口o ) 一( 1 - a ( t ) ) i c ) ) d t + a ( t ) c r d w t d 戋 令石= 名一a ,其中允 0 则 矗r f = ( 一( 1 一a ( t ) ) a ) d t + a ( t ) c r d w t j 毒 在此基础上考虑公司的风险回报问题,下面给出数学描述: 1 3 设( q ,夕,昂一为一完备概率空阎,滤子 彳) 表示t 时刻获得的所有信息, 决策者以此为基础寻找最优控铝l j 策略,准备金r 的变化过程为 i d r = ( - ( 1 - a ( t ) ) a ) d t + a ( t ) o d w t d 磊 【r - - - - x 其中x o ,w 关于彳适应,控制僚略刀暑 万,:f 0 ) = ( 口( f ) ,磊) :f o ) 满足: ( 1 ) 口( f ) 【0 ,l 】为巧循序可测过程; ( 2 ) 参为左连续、非负、单调非降的珂循序可测过程,且磊= o 记兀为满足上述条件的允许控制策略的全体,对v 万n ,定义风险回报函数 匕= 研l :e - p g ( r , ) c l 考, + p 一肛尸】 这里停时f ,= i n f t 0 :r o ) 为公司破产时间;p o 表示破产时的补偿值;层 表示数学期望; o 表示贴现因子;g ( x ) 为【o ,) 上的连续函数,且当x f o , b 】时 ( b 由力、p 、唯一决定) o g ( 工) l ,当x 6 ,) 时,g ( x ) = 1 目标是寻找一最优控制策略刀三 矿:f o = ( 口。( f ) ,等 :t o ) h ,使得 1 ,( 砂= v 。( x ) = s u p 圪( 功 称,( 工) 为最大风险回报函数 2 3 主要定理及证明 2 3 1 预备知识 命题1 对v o 0 x 0 ,0 】,若存在常数k 0 ,使得i 伊( 石) 一缈( y ) i + l 盯( z ) 一a ( y ) l kix - yl ,即矽( x ) 盯( x ) 满足l i p s c h i t z 条件,则下述随机微分方程 存在唯一解: ( 1 ) 耳= x + f 伊( g ) 以+ f 仃( ) 机- 考1 0 ; ( 2 ) f 耳。印d 等= o ,这里) 为示性函数; ( 3 当x z o ,护 时,等为连续过程 证明令等= m a x o ,m 。a ,s ,x x + r 缈( 足) 凼+ r 仃( 足) 批一田 ,证明过程同文献【6 , 7 1 2 3 2 最优控制策略及最大回报函数的技术分析 下面分允2 p 和i t 允2 两类来讨论最优控制策略万及最大风险回报函 数1 ,( 工) 0 名2 t 1 4 i o p 等的情形 p 引理1 记y ( 力= 字,。( 工) + 一( 卜口) 允p ( 力一p v ( x ) ,若o s p 芳, 则存在唯一的实数6 o 及v ( x ) c 2 【o ,佃) 满足以下变分方程: ( 1 吠0 ) = 尸;( 6 ) = 1 ;v 。( 6 ) = o ;且当x o ,佃) 时,( x ) 0 ;, ( 2 m a x l v ( x ) = o z 【0 ; a e o ,1 1 ( 3 m a x l v ( x ) o ; 工【6 ,+ 叫 a e o ,l 】 证明 ,i o r 2 为方程仃2 ,2 + 2 p r 一2 = 0 的两根( ,i 2 o , 则方程c ( p p p 秘) 一尸= 0 在 ( o ,三l n ( 王) ) 内存在唯一解d ,i r 2,; f c p l 肿们一e r 2 抖以) , x ( j 令 “炉卜+ 芳, 州玩删 其中6 暑三1 1 1 ( 刍一d ,则可以验证引理1 中的( 1 ) 成立 ,i r 2,i 由于当x 卜d ,6 ) 时,( 一事軎净= 孑2 百r :忑2 ( r 石l - 丽r 2 = ) 2 孑e ( , 研- x = + a “ 。 且一言軎暑舅= 去 l ,因此当皿州时,加( 功取到最大值,从而引理1 中( 2 ) 成立 当工【6 ,删时,由( 功= okv ( x ) = 1 ,因此依然当口= 1 时,l v ( x ) 取到最大 值,引理i 中( 3 湿然成立 定理i当o p 笔时,存在最优随机控制刀,使得 p v ( x ) = 咯( x ) = 哩匕( x ) 石e l i 其中:v ( x ) 如引理1 中所述 证明第一步证明对v x o ,佃) ,v n f i ,( x ) 匕( x ) 对任意固定的丁 0 ,利用推广的i t o 公式得 p 一卢( 卧。) 1 ,( 辟。) 一v ( 功= r “。口一肛【! 夸。( 置) + ( 一( 1 一口) 力) ,( r ) 一y ( r ) 】出 + re - p r y ( r ) 批一r p 一廖1 ,( 足) d 缶 + p 一肛 v ( 足+ ) 一v ( r ) 一1 ,( r ) ( r + 一r ) ) 其中: 表示取最小值 由引理i 知,当x o ,佃) 时v - ( z ) 0 ,所以上式右边最后一项非正且 1 5 矿刀 r - “弓,、h ) 一v ( 力r p 一肛( r ) 批一j c r e 一肛v ( r 矽专 又因为f r e - 肛1 ,( r ) 批为平方可积鞅( 其期望值为零) ,对上式两边取期望 得: “工 猫rp 一所( r ) 必+ e e 叫m v ( 岛f 1 ) e f 惕矿厨g ( r ) d 专+ e e - 烈卧。v ( 吗,、。) e f f e - 肛g ( r ) d 专+ 尸眈一声r f l 由缶的连续性知,( 碍。) v ( 0 ) = 尸,根据单调收敛定理及控制收敛定理,令 丁专佃得 “茗) 研r p 一廖g ( r ) 嫣+ p 一声p 】= 匕( 功 第2 步构造最有随机控制策略万,使得v ( x ) = 匕( 功 当初值z o 明时,令口( f ) = 1 ,由命题1 知,存在连续过程占使得 o s 群6 ,取万= 矿:f = ( 口( f ) ,占) :f 0 n ,那么对任意固定的丁 0 ,有 p - 卢( t a 。1 ,( 群,、,) 一v ( 砂 :r “。矿皿【鱼垫穹堡监矿( 耳) + ( 一( 1 一z ( 群) m ) v ( 碍) 一伊( 碍) 】出 + r “。e 一廖v ( 耳) 批一f 。e 一加v ( 耳) d 占 对上式两边取期望得: e e 叩m f ,1 ,( 群,) 一1 ,( 功= 一er 。p 一肪1 ,( 耳) d f = 一e l f ; e - a t v ( r :) l 辟曲j d e :+ r “。矿加y ( 耳) 耳删d 等】 。= 一研r “。矿肛g ( 碍) j 耳。一占+ r “。矿肛g ( 耳) j 霹曲等】 = 一e r e - 霸g 峨、) d 爱 。 即 “力:ea 。e - f i t 扒。、* ,“5 r * + 屁- - f l ( t a f | ”1 ,( 群 f ) 令丁专佃得 “z ) = e rp - - f i t 扒q * ,“与f $ + p 一以+ 尸】 所以刀+ 为最优控制策略且引理1 中的y ( x ) 为相应得最大回报函数 当初值x b 时,依然取口+ ( f ) = l ,令占= ( 6 ) + ( z 一6 ) 厶舢,即辟在0 时刻即时 跳至6 点,然后参照第2 步的证明过程,以初值6 构造最优随机控制占( 6 ) ,取 矿= ( 口( f ) ,占) 则 研re 啦g ( 耳) d 等+ e 叩。尸】= x - - 6 + 髻= v ( 功 故存在万为最有随机控制策略且引理1 中的1 ,( 工) 为相应的最大回报函数 1 6 i i 尸等的情形 p 定理2 若p 筹,令6 = o ,v ( 以= x + 尸口( f ) = 1 ,等= 吐,堋,则 刀= 矿:f 吣= ( 口( f ) ,等) :f o ) n 为最优随机控铝垂,心) 为最大风险回报函数 证明注意到v 。( 功+ ( x ) 一f l y ( x ) 。 眨依然 ( 1 ) 一等等砌叫怕) 一眦) _ o ( 2 m ( 。) = 0 ;q ( 6 0 ) = 一事毛;当x ( o ,栅) 时访( 力 。; 一证昵: 令x o ) = q z 一万褊 c 2 ,其中z 叭 q :群m 删。: e = 器+ 刮h c - 2 万砑丽+ 万丽五丽m q + ;墨:! 墨;丝;了l n ! 坐型垡笠 。2 0 2 ( + 名2 ( 2 盯2 ) ) 2 ( 五一) 贝i j 一寺z 2 ( 矿( 等+ f 1 ) z x t ) m 以) _ o “) 由x ( z ) 的定义知,当z 从0 递增到佃时,x ( z ) 从佃递减到,故x ( z ) 可 逆,定义m ( 功= r x 一1 ( y ) 咖( 这里工r ) ,则 q ( 酢”w ( 酢) ) = 南 1 7 即卜吾等等m 卅_ ( 俐一砖( 酢”, 由式( 1 ) 知对v z o ,f 。( z ) = 0 考察函数厂( z ) 誊一乏z 2 x ( z ) + ( z - 1 ) z ,觋厂( z ) 二佃, 当z ( o ,佃) 时,f ( z ) 0 ,使得 允2 1 x ( + ( 一:0 2 一0 2z o z 【z o ) + 【- x ) z o 2 u 容易验证 l i m 厂( z ) = 蝴, , 佃 ( 2 ) x ( z o ) = 0 ( 3 ) 结合式( 2 ) 、式( 3 ) 及h ( x ( z o ) = u ( o ) = 0 得 ,( z ) = f ( z o ) = 一三 - j z 0 2 a 1 一( ) + ( 一名) z o 一嵋( x ( z ”= o 故 一吾锩学m 叫杷( z ”一f l v , ( x ( 砌- 0 , 由x ( z ) 的定义知,当z 从0 递增到佃时,x ( z ) 从佃递减到哪,因此对于 坛( 哪 佃) ,存在唯一的z ( 0 ,佃) ,使得工= x ( z ) ,所以 一番等m 卅相一帅) = 0 因此引理2 中条件( 1 ) 满足 由m ( x ) 的定义知m ( 吩= 0 ,据x ( z ) 的定义显然有x 。( z ) 屹( ) = 昂;呓( ) = z 1 = t ( ) ;呓( 6 0 ) = 一号z l = w ( ) ( 3 ) 屹慨) = 等;也( 6 1 ) = 1 ;呓( 岛) = o ;当x 【6 0 ,6 1 ) 时,e ( x ) o 且单调不减 证明州垆一篇r 2 矿”+ 揣r 2 铲m ,显躺l 理3 蝴( 2 ) ,i 【一 jl ,i 一吒j 满足 1 8 由条件 2 p 吣一学 一萼 _ o ,i r 2 ,i 一眨 。 取岛= + i 与i n t 、1 1 + + 2 ( ( 仃c r :2 f i ) ) ,, i ,可文验证呓( 岛) = 。,当x 6 0 ,6 1 ) 时, 呓( x ) 0 ( 利用反证法) 由6 0 = x ( 毛) 知只需要说明x ( 毛) o 据m ( 力= f x ( y ) d y ,由引理2 及引理 3 知,m ( ) = 吃( ) 若o ,m ( 工 = r x 一( y ) d y ,由于x - 1 ( ) o ,则m ( ) o , 而m ( 6 0 ) = 屹( 6 0 ) = 昂 0 ,得出矛盾,因此 0 令 v ( 功= h ( z ) , 屹( 力, x 一2 5 i + 芳, x 【o ,b o ) x 拿【6 0 ,6 1 ) x 6 l ,删 由弓f 理2 及引理3 知当x o ,岛) 时,一善兰盟非负、单调不减且一乓兰盟 仃? y ( x ) 1 ,( b o ) = 1 ,故: 如果i e 【o ,) ,则当口:一之兰盟时,三虱x ) 取得最大值,所以由引理2 得 0 v ( 曲 引理4 中条件( 1 ) 满足: 如果x f a o ,岛) ,则当a = l 时,三v ( 功取得最大值,所以由引理3 知引理4 中 条件( 2 ) 满足: 1 9 如果x 晒,删,由于1 ,( 力= 1 ,v ) = 0 ,且允,财当a = i 时,z , v ( x ) 取 得最大值,所以m a x l v ( x ) = i - p v ( x ) 0 ,即弓 理4 中的条件( 3 ) 满足; a g l u 。l l 利用引理2 及引理3 容易验证引理4 中其他结论成立 下面分3 种情形讨论最优控制策略及最大回报函数问题 i 0 p 昂的情形( e o 如引理3 所述) 引理5 若0 p 当x t o a o ,包一d o 酐f ,。m 。【a 。,x 。j l l ,( 功= c = z r - v ( x ) + ( 功一p v ( x ) = 0 ; ( 3 ) 当x 融一d o ,扣d ) 时, 口【m a 。1 1 x l ,( 功2 矿( 力+ ( 力一p v ( x ) 1 ,( 0 ) = 尸; - , t o ) = 1 ;当x “o ,岛一成) 时,v ( x ) 0 ;当x 晒一如,佃) 时,扩( 力= 0 其中:三“功的形式同弓f 理1 所述 证明当0 p 1 ,故存在唯一的磊【o ,t , o ) 使得m ( 磊) = 尸, f m ( x + 磊) x 【o t , o a o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论