版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章动态分析的数学基础木草主要介绍与Romer的高级宏观经济学克接相关的数学基础,主耍包括 动态系统、动态绘优化原理。第一节动态系统基本理论一、基本概念(-)基本概念变量为导数的方程称为微分方程:如果方程只有一个变量,则被称为常微 分方程(ODE),否则,称为偏微分方程'ODE的阶是方程中最高阶导数的阶数, 如一个ODE的最高阶导数为阶,则称它是一个畀阶ODE。当方程的函数关系 是线性时,就称为线性ODE。如果方程涉及到多个变量的微分方程组,并且被 解释变量为时间,我们称该方程组为动态系统:经济学中大就的问题涉及的都是 经济现象在时间上的演变特征,动态系统成为分析这类问题的有力匸具。
2、此时,微分方程都涉及到变量对时间的导数。如:勺 y + a2 )(0 + X0 =o(1)方程中和冬是常数,x(f)为己知的关J:时间的换数,描述了变最在不 同时点的状态,称为状态变届,若y(/)是向啟则为状态向壯。由丁和是常 数,称方程为常系数一阶线性方程。假定方程(1)屮变就关时间是连续的,称为连续时间微分方程或连续系 统(CS):如果变瓏对时间的关系不是连续的,而是用离散时间來描述,称为离 散方程或离散系统(DS),相应地与(1)相对应的离散系统表示为:'出+冬乳+兀=0(2)微分方程根据是否显含时间分为自控方程和非自控的两种类型。如果微分 方程不显含时间变量,则称微分方程是自控
3、的,否则称为非自控的。方程(1)屮,若x(t) = a,为一常数,则(1)就是H控的,经济学中涉及到的宏观动态系统基本上主要是这类自控模型。进一步,若x(/) =0,则方程(1) 称为齐次方程,简称齐次的。动态微分方程研究的主要问题是解的存在性和如何具体求出具体的动态路 径。不是所有的微分方程都能求解,本节主耍讨论的是可求解的常微分方程。通过方程的解确定的的动态路径,称为方程或系统的流(Flow)o鬥观上,系统的流是与系统的初始值(简称初值)和参数是相关的。对离散方程(2),我们很容易验证这一点。假定:),(/ + 1)y(/)人 a )两边减去y(t),得到:M) =)'(/ +1)
4、 一 y(0 =A j(0 J, a )一 y(0M)衡磺了 y(/)在每一步的移动情况,箭头表示y在每一步的移动方向,沿着箭头的方向,就可以构造出系统的轨道。3图2离散时间的解轨道图3连续时间的解轨道动态方程或动态系统一般都有无数的解,所有这些解的集合称为系统的通 解。通解中每个特解对应状态变暈(向量)在空间中的不同轨道,而我们往往对 其中的若干特解感兴趣,因此,需耍对通解加上适当的附加条件,也就是通常的 初始条件(Initial Condition)«显然,每个轨道都依赖初值和开始移动的时间。y(o)= y°有了初值条件,就可以确定一条具体的解的轨道。当然,初值条件不是
5、确定 动态系统解的唯一方法,更一般的是利用所谓的边界条件:(3)M。)= y°來确定状态向量y,其在(0, +s)时刻的取值为给定点但几不一定等 于Oo动态系统加边界条件一起称为边值问题,通常边值问题有唯一解。需要指出的是,在经济学中将初值问题和其它类熨的边值条件分开是必耍 的,因为对许多经济变锻选择其最原始的初始边界可能是毫无意义的,同时在进 行经济分析与决策时,有时我们希與边界条件能反映所需的期黒信息和相关的均 衡选择。(二) 稳态性质微分方程一般都有无数个解,这些解的动态性质是收敛的或是发散的,对解 释经济现象是非常重耍的,有一类特殊的解一常数解在分析动态系统的渐近行为 时具有
6、重耍的作用。我们给出相关的定义。定义111定常状态或定态(不动点、休止点或均衡) 动态系统的常数解称为系统的定态(Stationary State)o在离散系统中,y(t +1) =g( y(t),若y w 丫 是g()的不动点(Fixed Point),即若存在y=g(y),则称点亍为定态。对于连续系 统,yg),若存在yeY满足/(y)=o,则称点y为定态。给定状态向量或变最的定态,I然就耍涉及到定态点的稳定性,也就是当系 统在休止点附近受到冲击时,系统能否回到均衡点。正式地:定义1丄2稳定性 令y是系统(CS) yV(y啲非孤立的定常状态,若对任意给定£A0,存在某个实数5w(
7、0,£,若对某个t0, |xr0)-y|5=>Vr>/0, IW)-刃 Y“ 则称y是系统(CS) 的稳定均衡。若对在某点进入比(刃的任意解),(/)有,lmiy(O = y>则称y是渐近稳定。下而我们结合图4对泄常状态的稳定性进行11观说明。显然,图4有3个定常状态牙、齐和久,对牙,当y 2 丁附近右侧时,y yO, y递减,使得y不断从右侧向靠拢。相反,当y位于附近左侧时,y递 增,同样使得y不断从左侧向片靠拢。最终都将收敛丁片。对凡,当y位丁附 近右侧时,y >0, y递增,使得y不断从右侧远离。相反,当y位丁附近左 侧时,y Y0,y递减,同样使得y不
8、断从左侧远离齐。最终都将远离丁凡。对齐, 同样可以分析具有与久的性质,是系统的局部稳定点。由此有如下定理:定理1.1.3稳态定理纯量方程j =f(y)的定常状态是稳定的充要条件是: 若存在某个5a(),使得y属于以亍为中心的某个邻域,即有:4若存在某个5»o,使得对(y5,y+5)中所有y,有:则y是不稳定的。定理114线性展开的局部稳定性 假设/是一阶连续可微函数,令亍是 方程(CS) yg)的定常解,且厂(刃",若广(刃Y0,则是渐近稳定的;若 广(刃ao,则y是不稳定的。定理1.1.4隐含的含义是:若厂(刃工0,则任定常状态某个邻域内y与厂(刃 保号。证明思路:心)在
9、歹线性展开,并利用定理1.1.3证明。(三)求解方法下面我们讨论微分方程的求解问题,求解方法主要包括图形法、解析法和数 值分析,数值分析一般雯借助熟悉软件,如Matlab,这里主要讨论前两种方法。1、图形法考虑一个如下形式的IH控微分方程:XO=AXO)其中/是已知函数,既可以是线性的,也可以不是线性的。为了利用图形求解,我们将/看作是关于y的函数,并以横轴表示y的大小, 纵轴则代表人)和八 由丁T是y关丁时间的导数,所以当时,y值是递增 的;当JyO时,y值则递减。为了说明这一点,考虑一个简单的线性形式:M)=Ay(/)=dy(/)J其中G和都是常数。若gaO,几)的图形是一条具有正斜率的氏
10、线,且在y* =b/a处与横轴相交, 如图5m若在某个时刻t= tQ, y(r0) = y *处/稳态水平,则y(/)=0,所以,y(f)不随时间的变化而变化,山此推断y永远停留在,上,即达到稳态。但是,若y(/。)不处于稳态值上,耍么Wo) Ay*,或者y (厶)y y*。若y(tQ) > y* ,则y(/°)处丁J*的右侧,j(O >0, y(/。)随时间推移而不断增长; 若Wo) y厂,则y(f。)处丁的左侧,j(/) yO, y(f。)随时间推移而不断减小。总之,只耍初始值0)工)“,y(f)将远离稳态。yyy若“yO,可进行类似的分析,此时,/()的图形是一条具
11、有负斜率的H线, 且在y* =b/a处与横轴相交,如图5.b。同样,若在某个时亥9 t=tQ, y(/0) = y 处 丁稳态水平,则W) =o, y(/)也不随时间的变化而变化,M)永远停留在尸上, 即达到稳态。但是,若y(/°)不处丁稳态值上,若NA) Ry*,yUo)处T* y 的右侧, y(/)YO, y(o)随时间推移而趋于减小;若y(o)Yy*,则y(/°)处Fy*的左侧, y(f)»O, ya。)随时间推移而不断增加,这样,只耍初始值y(tQ) # y* , y(/)总 是向y*靠近。图5.c描述的是非线性函数的动态,该函数有两个稳态,可以分析其卩一
12、个 是稳定的,一个是不稳定的。上述从儿何的角度对稳态稳定性的判断虽然很鬥观,但是如果应用稳态定理 1.13,则更为简单。对情形g,容易判断在y*的某个邻域,有:因此,是不稳定的。同样,对情形b,也存在以)*为中心的某个邻域,有:(yy*)/(y)YO因此,是稳定的。对情形5.c,邻域分析法更为合适一些,如在原点的某个邻域有:Cv y * )/lv) a0,而在尸的某个邻域则是:(y-y)/b)YO,因此,前者是不稳定的,后者则 是稳定的。2. 解析解:常系数一阶线性微分方程微分方程除了线性情形,一般不能够得出微分方程的闭式解,所以微分方程 的屮心任务是讨论解的存在性和解的性质。这里,我们主要关
13、心的是线性微分方 程的求解问题,对丁各种情形的常微分方程的求解,动态经济学方法(龚八堂) 提供了一个简洁全面的介绍,下而主耍以一个例子讨论常微分方程的求解问题。常系数一阶线性ODE的一般形式为:$+ ay(/) + x( 0 = 0其中“是一个常数,x(/)是一己知的时间函数,对这一方程的最简单解法步 骤如下。第一,把所有涉及y及其导数的项放在方程的一边,把其余项放在另一边:y(0 + a X0 =- AO第二,两边同乘以严并积分:j e"y(t) + ay(t)dt =- J eal x(t)dt严项被称为积分因子。之所以乘上积分因子原I大1是这样左边积分号内的项就变成了严)0)对
14、时间的导数:(d/d/)ea,y(t)+ b0= ea, y(t)十 ay(t)(4)其中代是一任意常数。注意(4)式左边的积分是某个函数的导数的积分,因而它就等丁这个函数本身°因此该式左边的项的原函数等丁严,(/)+九°第三,计算(4)式右边的积分,记住耍加上另一个常数项切。注意这个积分 是一个f的函数,我们仍用表示。由丁是一个己知的时间函数,所以 x(/)也是一个已知的时间函数。第四,两边同乘以以得到),(/):y(t)=-e'a,x(t)+bea,(5)其中b =bb。是一任意常数。(5)式就是ODE的通解。考虑微分方程:y(t)- v(/)- 1=0(6)为
15、解这个方程,我们遵循以上勾画出的步骤。首先,把所有涉及(/)及其导数的项放到方程的左边,所有其他项放到右边。然后两边同乘以并枳分:上式左边积分号内的项是ey(t)+bQ的时间导数,I大此左边的积分就等于e' y(t )+/?0 o右边等丁因此,(6)式的解为:y(t)= l+he'(7)其中b=bb。是一任意常数。(7)式中的结果是(6)的通解:为了得到特解或精确解,我们还必须具体说明 积分的任意常数儿为r确定在无限多条可能路径中哪一条适用,我们需要知道 至少一个时点上的y(f)值。这一边界条件将确定出微分方程的惟一解。图6表示了对以(7)式为例的ODE的一组解。为在其中进行选
16、择,假定我 们已知当匸0时,y(0=0,此时的边界条件也就是初始条件。将匸0时,y(0)=0 代入(7)式中得到,(0)= 1+b护=0,这意味着b=l,因此方程的特解为:如果我们不知道函数的初始值,而是知道它在某一终结时期的值,也就是说 我们可以有终端条件,同样可以得到一个具体路径。3、可变系数的一阶线性微分方程对于微分方程y(t) + a(t)y( /)+ x( t) = 0(8)如果。(/)不再是一个常数,而是一个己知的时间函数。我们仍可采用前而的 步骤。区別在丁现在的积分因子是e',)dv,所以左边变成了 y( /) eV)Jv的导数。同样当我们对函数的导数积分时,我们还是冋到
17、了原函数。利用这一信息,我们 发现ODE的解:y( /)=/仙用卜认性(M +阳仏皿(9)其屮b是一个任意的积分常数。为了找着特解或楷确解,我们还要利用边界 条件。二、高维情形:常线性动态系统非齐次常线性动态系统具有如下的形式:连续系统:4 / yi=(1)V n /1.离散系统:。卫 + 1)、4勺y(/ + l)=Ay(/)+bo'"U + 1力二、儿丿+ 1(2)对r与非齐次线性系统对应的齐次线性系统:y =Av 或 y(/ +1) =A y(/)(3)可以证明,如果得到齐次系统的通解,只耍再求出非齐次系统的一个特解, 如平稳解或定常状态,两者之和就是非齐次系统的通解。
18、基丁非齐次线性系统和齐次线性系统2间的密切联系,我们主耍讨论齐次系 统,求解的思路是:利用对角系统是可以氏接求解的性质,通过适当变换,将原 來系统变换为对角系统,然后再通过对角变换的逆变换得出原系统的解。(-)相位图:对角系统与非对角系统1、对角系统A是一个2x2对角矩阵,而且假定方程是齐次的,这一系统可表示为:ji(O = «n Ji(Oy2(f) = 22 y:(0(4)式中不同的下标表示不同的分最或变最,s和冬,是实数。耍描述上述系统的动态有很多种方法,对于上述的2x2系统,首先采用儿 何的方法來描述该系统的动态行为。由丁系统包含了时间维度,需要用三维空间 表述,为了更加简洁,
19、将时间作为隐禽的变量,变最的变化用随时间变动的方向 來代表,这样就可以用二维图形來反映。这种方法就是所谓的相位图法。定义115相位图:是把由两个微分方程所隐含的动态转换为一个在坐标 系中描述的经济随时间演进的定性行为的方向系统。N观上,如果将儿和儿理解为距离,相位图可解释为个质点按照系 统(4)在平而上的运行轨迹。对系统(4),我们考虑下面三种情形。情形1,且冬相位图构造的思路是很简单的。首先,在图7.a中価出所有久等于0的点的轨迹,称为久=0,对应于纵轴:其次,对久=0线所 生成的两个区域的动态分别进行分析。由Tt7n>0,当儿处丁纵轴的右侧,当 XAO,有aO,儿递増,箭头向右。对于
20、左侧的动态依理可以同样画出。同样,在图7.b中画出所有刃等于0的点的轨迹,即横轴。对=0线所生 成的两个区域的动态是,a22 >0,当儿处于横轴的上方,儿0,有y2 >0, y2 递增,箭头朝北。对丁横轴下方,类似可得到相反的结果。现在把这两个图结合在图8中研究系统的“质点”运动特征。这两条线把空 间分成4个区域,在这个简单的例了中,恰巧这些区域正好对应丁 4个象限,在 第一象限中,一个箭头指向东,另一个指向北。我们把这两个箭头介并为一个指 向东北的箭头。这一构造意味着如果经济在这个区域内,那么儿和儿递增。在 第二、三、四彖限中合并后的箭头分别指向西北,西南和东南,即代表当系统处
21、于该位置时,分别朝该方向向外移动。最后在原点(儿,儿尸(0,0),久和几都等于 0,因此,如果经济恰好位丁原点,则它会永远停留在那儿,这一点即是稳态。 但是,这个系统是不稳定的,因为如果初始位置在任何方向上偏离开原点一个微 小数额后,系统的动态(箭头)都会使其远离稳态。最后,我们利用边界条件來确定图中所拠出的许多条路径之中到底哪一条构 成了粘:确解。例如,假定在0时,的值为1,刃的值为2,然后“质点”开始由此点开始运动。如图7。情形2 syO且GmYO。与前面的分析类似,儿=0线仍是纵轴,几=。线 仍为横轴。沿用与前而相同的步骤我们得出图9,其中第一彖限箭头指向西南, 第二象限中指向东南,第三
22、彖限东北,第四象限西北。稳态位丁原点,而且是稳 定的:即对于任何不在原点的初始值,系统最终都逼近稳态。情形3, an -<0且a22 >0(或dAO且a22 -<0)o如同前面的情形一样,>=0 线仍是纵轴,久=0线仍为横轴。然而,如图10中所示的,这第三种情形的动态 却比前而的更复杂。在笫一彖限中箭头指向西北,笫二象限指向东北,笫三彖限 东南,第四象限西南。箭头沿着横轴指向原点,而沿着纵轴则远离原点。原点再 一次成为稳态。原点依然是这个系统的稳态,但这个系统稳态的稳定性质比较奇特,一方 而,它既是稳定的,另一方而,它乂是不稳定的,稳定性表现在,如果它沿着横 轴开始,则
23、系统的动态会使其返回到稳态。但是,如果系统H横轴以外的任何一 点开始,不管它离横轴有多近,动态都会使其远离稳态,亦趋丁无穷的意义上说 系统会爆炸。13图10鞍点路径稳定情形中的相位图稳态的这种特征就是著名的鞍点均衡(极大极小原理),相应丁横轴的路径 称为鞍点稳定路径,经过稳态对应纵轴路径为不稳定路彳包前者称为稳定臂, 后者称为不稳定臂。鞍点得名源ITJ:和一粒放在马鞍顶上的弹子的类比,马鞍上 有这么一点,当弹子被放上去之后就再也不动了,这一点对应丁稳态,而在经过 鞍点的路径中,只有唯一一条路径使弹子回到稳态。本质上,鞍点是不稳定的,数学上也将鞍点视为不稳定点,但在经济学中鞍 点均衡被作为稳定均
24、衡看待,并在经济学的分析屮扮演了重要的作用,经济学的 道理是简单的但同时乂是有力的:由丁鞍点路径通常为经济的最优均衡路径,人 的理性必然导向鞍点路径和鞍点均衡。2. 非对角系统非对角系统的相位图的构造与对角系统完全类似。首先根据稳态轨迹求解稳态,然后判断稳态的稳定性。为具体说明相位图的构造,我们举一个具体的例子。久(/)=0_06几(。儿(f)+1.4=-0.004 十0.04边界条件为儿(0)=1和悭严匕=0首先求稳态轨迹:X(f)=o,儿=1.4+0.06 儿几(。=°,儿“°由此得到稳态解为:yf =10,=2o对T*(/)=0,位丁轨迹右边的任意一点,有X(/)a0
25、,导致兀增加,比增 加乂进一步导致久(/)增加,由此该区域箭头向东。同理,对Vy(t)=0的左侧,由丁儿较大,(/)yO,使得箭头向西。对于久()=0,其轨迹为一条垂H线,位于轨迹右边的任意一点,有必yo,导致儿减小,图11具有鞍点路径稳定性的非对角系统的相位图15这两条轨迹把空间分成四个区域,稳态是两条轨迹相交的点(10, 2),图 11给出了各个箭头的指向。为了评价系统的稳定性质,我们的问题是这4个区 域有多少个可以容许系统向其稳态运动。答案是显然的:只有两个。H观上可以 想像,在区域(1), “质点”的运动在向右和向下的两般力最的作用下恰巧有一 个稳定的路径到达稳态点。实际上,这个路径是
26、存在的,而且是该系统的鞍点路径,贯穿丁这(1)、(3)区域中,并且穿过稳态,称为彳定臂除此之外,系统还有另外一条路径穿过稳态,贯穿丁这(2). (4)区域中,但是不稳定的路径,称为不稳定臂边界条件lim严°6”儿(/) = 0确保当(0)=1时,”(0)也在稳稳定痔上,否 r->x"则,儿不会趋向一个常数,趋向稳态,而是趋于无穷大。系统演化的精确路径依赖于边界条件。如果初始点位丁鞍点路径,如所给出 的初始条件,则系统会收敛丁稳态。否则,系统将持续地偏离稳态向位于(2) 和(4)区域的不稳定臂靠近。对丁非线性情形可作类似的分析。(二)解析法:对角化求解1、对角化求解对角
27、系统求解比较简单,如一个由/个一阶微分方程组成的线性系统:乙=乞ZjOz2(t) = a2 z2(t)2”(/)=匕】z(f)(5)其解的形式为乙=切护",其中每个切都是一个由边界条件所决定的积分 常数。假定A表示第i个对角元素为产的对角矩阵,b表示由切组成的列向暈, 则上述方程组解向最可表示为:Z(f)=Ab(6)在一般情形中j(t)=A y(/), A不是对角矩阵,但是由代数知识我们知道,若 没有重复的特征根,则特征向量勺,-线性无关,并且矩阵E=勺,心可以 将力对角化,也就是,ElAE=A,其中A= diag(右,,&)是对角矩阵。利用这个结论,当A没有重复的特征根时,
28、我们可以得到(DS)的通解的 表达式。对j(t)=Ay(/),两边同时乘以特征向量矩阵E的逆矩阵,得:Ey (t)= ElA y=(E“A E)(El y(t)由 VE'lAE = A,有:旷 y(t)=A(),(/)令x(f) = El y(t),上式可重新表示为:f (t)= A x(t)人F如上面所分析的,这个对角方程的通解W)很容易求出,由此,我们可得 Hi)(/)的通解:y(t) =Ex(t)(7)对上面的结果我们给出如下定理:定理1.1.6令A是一个没有重复特征根的HXH的实数矩阵,则系统y 的通解的第丿个分量可以表示为:儿(/,C)= Xi-1 C>eu exP(A
29、O(8)其中是对应于特征值人的特征向量耳的第/个分量。根据公式(7),结论是显然的。对于离散系统,有类似的结论,即:定理117令A是一个没有重复特征根的nxn的实数矩阵,则系统j(r+l)=Aj的通解的第j个分量可以表示为:(9)其中是对应于特征值人的特征向量耳的第j个分量,q是任意常数。儿二工:"几;为什么矩阵4的特征値和特征向量能够刻画动态系统的解的特征,下而作 一直观说明。先假定系统y=A.v具有如下形式的解:y(t) = ea,zZ是向量,a是常数。既然y(t) = eu,z是系统的解,则必须满足系统即:y =aea,z =Ay=Aea, z整理得:(A al) z = 0显
30、然,此时的a和z就是矩阵A特征值和对应的特征向最。对微分方程,经常用一通解表达式來表示微分方程的解,对系统y=Ay,其 通解-般都是一个空间,称为解空间,并称生成解空间的任何一组线性无关的解 称为皋础解系,简称基。假若用y'(f)(匸1,)表示系统严Ay由特征向最&决 定的第i个基,则V可表示为:y,(t) = expax , j=l,2,,n ,且耳是对应于特征值&的特征向出这样,系统)uAy的通解可表示为所有个基础解系的线性组介:M,c)=工:£ expax(10)2、虚特征根在动态系统中,矩阵A的特征根并不都是实值解,若系统有一些复特 征根,通解仍然成立
31、。推导是类似的。首先,若A是实数矩阵,则A的特征值和特征向量都是共辘成对出现的, 所以,若V=exp(A,r)e, = u(t) + i v(t)是系统的解,则"() = "(/) /叩)也是 系统的解,而且,可以证明实函数M)和叩)本身也是系统的解。为r简便起见,假设系统矩阵的前而两个特征值人和厶是复数,其余的特征值都是实数,因为矩阵A是实数阵,则召和儿是共辘的,UP:右=a + % 和&丄=a /对应的特征向量也是共純的,即:S = d + if 和冬=d其中d和/都是/r中的向M:。对N的某木解是换数:)(/) = exp(21r)e1 和 yt) = exp
32、(22r)e2进一步,我们将特征值和特征根代入对应的基木解,得:yl(t) = exp(如)q = “aw"(d + if )= ea, (cos(/iT) +/ sm(/zr)(d + if )=ea! (Jcos(/T)十 iea, Jcos(M)十dsm(/)同理可得:y2(t) = exp(A2t)e2 = eat (Jcos(/)ea (f'cos(pt) +Jsin(/)令 u(t) = ea, (d cos(/4)和 v(t) =(fcos(pt) +d sin(/#)则基本解可表示为:)(/)= u(t)+/v(r)和 y2(t)=u(t)- iv(t)(11
33、)公式(11)因为带有复数,不方便实用,为此,把复数基本解转换为实数表 达的基础解。显然,"=丄(),(/) +y'(/)、叩)=丄()"(/) “),"(/) 22i和W0不线性相关,二者均为基础解°这样系统的通解y(/,巧为:y(/,c) = C “(/) + c2 " + 匚c, expax(12)公式(12)屮“(/)和叩)的存在意味看系统的通解y(/,c)是振荡的,任满足 一定的条件下,它也是循环的。最后,我们就齐次线性方程组j =A.v或,(/ + l)=A),(/)的通解(10),对稳态 的稳定性给出一个直观的结论。定理1
34、18令A是特征值都不为0的的实数矩阵,则系统(CS)唯 一的稳态状态元="稳定的充要条件是:系数矩阵的所有特征根的实部都小 于0;丘不稳定的充要条件是至少有一特征根的实部大于0。对系统有复特征根和重复特征根有类似的结论,就不再赘述。3、动态系统若干有用的结论下面的分析上要针对在经济学的分析屮经常遇到的二维线性系统情形。 对2x2矩阵4,容易证明,矩阵4的特征方程为:= A-Al=A2 - (trA)A + det A =0假定人和人是其特征值,则人满足2亍Ak + A2=uA (矩阵的迹)人厶=detA (矩阵的行列式)根据一元二次方程解的判别式4 = /rz-4det即可判断根的性
35、质,从而对系 统解的性质提供肖观判断。(1)两个特征值都是正实数。在这种情况下系统是不稳定的。(2)两个特征值都是负实数。在这种悄况下系统是稳定的。(3)两个特征值是实数但异号。在这种情况下系统是鞍点路径稳定的。(4)当系统是鞍点路径稳定时,稳定骨对应丁与负特征值相关的特征向 暈;不稳定臂对应丁与正特征值相关的特征向暈。(5)当系统是对角时,与对角矩阵的负分量相关的轴是稳定臂,与正分量 相关的轴是不稳定臂。(6)两个特征值是有负实部的复数。在这种情况下系统以一种振荡方式收 敛到稳态。(7)两个特征值是冇正实部的复数。与图13振荡方向相反,系统是不稳 定且振荡的。(8)两个特征值是有零实部的复数
36、。其轨迹是环绕着稳态运动的椭【员I。(9)两个特征值相等。在这种情况下特征向量矩阵不可逆。所以前而概括 的解析解法不适用,此时解的形式为:X(f)=(b“ + b,2 W其中乞和/是积分常数和A中系数的函数,a是惟一的特征值。若 a y 0,解是稳定的,若a >0»解是彳、稳定的。(10)根据系数矩阵血接判断°deS=4Y0,则系数的特征值是符号和反 的实数,有一个鞍点;detA=/lM,A0,若岛=人十/1"0,特征根或 实部均为负,系统都是稳定的;若trA=A + >0,特征根或实部均 为正,系统都是不稳定的。(11)更高维系统的稳定性性质也一样。
37、如果所有的特征值都为止,则系统 是不稳定的;如果所有的特征值都为负,则系统稳定。如果特征值异 号,则系统是鞍点路径稳定的。同样像前面所说的一样,稳定臂对应 于与负特征值相关的特征向最,那么稳定臂的维数就是负特征值的个 数。例如在有一个负特征值的3x3系统中,稳定臂是一条通过稳态 且对应丁这一负特征向最的H线。如果有两个负特征值,则稳定流形 是一个通过稳态的平而,这一平而由这两个负特征值生成。在一个 nxn系统中,稳定臂(有时被称为稳定流形)是由相关特征向帚:生成 的一个超平面,其维数等于负特征根的个数。第二节动态最优化导论一、动态规划的基本原理(-)最优化原理考虑一个随时间展开的系统,经济的或
38、者其他方面的,至少部分由决策者的 行动來控制。任每个时间点,系统的状态用一个由实变屋组成的向量兀£川表 示,称之为状态向量(State Vector)o在每个阶段决策者选择一个由控制变最或 者决策变斌(Control or Decision Variables)纠成的向M:us e R "。系统当前的状 态和控制变量的选取按照(可能与时间有关)移动定律决定了下一阶段状态向适 的取值,移动定律为:兀+1 =心(兀,心)(1)这样,选择不同的控制变眩系统将产生不同的时间路径。假设决策者更偏好 丁下而定义的时间路径,即时间路径可以用一个时间可加的收益或者目标函数 (Renmi o
39、r Objective Function) 表示:叱=£人(兀")5=/为r简单起见,我们取定观划水平以及状态向量的初始值和终结值。这样, 决策者考虑的问题就是在时间/处事先决定的状态向量兀和规划阶段的终结时状 态向最的值舟,如何选择合适的路径,使得目标收益最大。为规范表述,设S7T=g,S = f,什1,,"1为决策者各种可行的序列,相 应地有转移方程£+1 =叫(乙“)决定的状态向量序列为X说T7 = £ ; $ = 什1,,7。这样,决策者的目标函数可以表示为:w严文人(兀“)(3)显然,极犬化日标函数是关丁参数初始时间、终结时间和状态向
40、量的函数, 记此值函数记为X),它同时等丁目标函数在最优控制路径和得出的状态变量序 列处的函数,表述为:-1V(x,t;xTJ) = niaxWl =工/$(心,心),满足兀乜=加0 给定f,7兀,乃,对每个$有(兀(DP)对规划(DP),若是时间T是有限的,可用拉格郎口泄理或库恩-塔克定理 求解。当丁是无限时,一般情形不可解,但对规划(DP)而言,所隐含的假定 使得问题可解:(1)目标函数的加性可分;(2)简单移动规律结构:阶段收益仅 仅是状态变量和控制变量的当前值的函数。应用:分蛋糕问题假定生活在0, T期的消费者消费一个蛋糕,记匕为t结束时的剩余蛋糕帚:, c;为t期的蛋糕消费呈,为简单
41、起见,假定开始时消费者拥有的蛋糕心=1。问消 费者如何安排冬期的蛋糕消费使得终身的效用最大。假定消费者的瞬时效用函数为对数效用函数lnq,则问题可表述为:Max/T lncft«O消费者各期面临的约束条件为:&£koCoT+l CTZ no将不同时期的消费和蛋糕资产看作是H由变最,构造拉格郎11函数:厶=工0 In q + 0°人(心5讥)+入W (阳c“kt )+人,(&-.也片t=0+ 人 0丫(&q-k“)+ 0Z “ 如由Kuhn-Tukei定理,得到-阶条件:= 0'(l/c -2 尸0, t=0, L 2,T計0WU1,
42、2,,T器=严"切 叽I和松弛条件:石 no, k0-c0-kL =0人no,qR“=o人 no, t-ct-At+1=O“no, =o由最优性条件有人a0, Kq产0, t=0, 1, 2,,T同时有“a0, =0这意味着经济或生命结束时,不会留下蛋糕,这排除了留下遗产的可能性。 由一阶条件,有c;=p ctu , t=l, 2,,T即 c" Co给定期初蛍糕为1的假设,消费者毎期的消费竝为:定理221最优性原理 令Z:产“;,.©是问题(DP)在给定的端点仏兀) 和(Tr)之间的最优解。任意给定点a和山且t<a<b<TA, x;和坨以及Z:
43、是最优状态序列中相应的项和对应的最优解序列,则:b-lu(X; ,a;x;,b)二 max Wt =工 /;(兀心)满足.jj (兀,us)给定abx:,x:,对每个£有(九,匕)(DPM)的解为Z;T = i(:, x;+J的对应部分Z;T o证明是简单的,反证,若在给定的端点(仏坨)和&x;),若存在经过端点的 另一路径使得规划(DP.db)最大,在局部上取此路径而其余的最优路径不变, 由丁效用是可加的,则将使得整体路径上的规划(DP.)忖标函数最大值变得更 大,而这是不可能的。(二)贝尔曼方程最优性原理的重耍含义是最优性在时间上的一致性:即如果不在不确定性 和补充新的信
44、息,决策者今天所做决策确定的绘优路径与明天所作决策的对应路 径是不变的,即决策者不必试图改变计划。这个性质非常巫要,他使得决策者可 以分段地考虑问题:假如今天的选择是对应规划最优的,余下的所有计划留待明 天,而明天的决策依然满足最优性耍求,即最优决策在时间上是保持不变的。下面我们分两步表述该思想,首先,根据目标函数的可加性有:V(x /) = max Wt=巴ax /M”兀)+比+】为简洁,V(xz>/)符号中省去了终点条件(xr,T),代表/+1期的计划 和总收益。其次,根据最优性原理,对丁问题max也的最优解Z:给定x二,余下的解也是气+1的最优解,所以有:V(x/?r)=max W
45、t=max ft(unxt) + max这样,我们就得到著名的贝尔曼(Bellman)方程:V(x/9r)=max Wt=max ft (uf,耳)+ V(x/+1 J +1)满足 j = 、(兀,wj(BE)(BE)方程提供了一个很重耍的结果:将一个动态规划转化为关丁当前控 制变量",的静态故优化问题。假如这个规划是可解的话,当前控制变量的瑕优解 町是关丁-当前状态变最兀的函数,记为町=心(兀),称这个函数为策略函数。 相应地下一期的策略函数陥(兀J可根据明天的状态兀+严“(兀,gQJ)得到, 由此推得以后各期的,他们都是关丁兀函数。贝尔曼方程将一个动态问题转化为原则上可求解的挣态
46、问题,但遗憾的是, 贝尔曼方程屮本身包含了值函数,而值函数的形式是未知的,所以,贝尔曼方程 并末提供一个可求解的函数形式,毫无疑问,它为此类问题提供了一个可求解的 基础。除此之外,假如T是有限的话,贝尔曼方程告诉我们,可通过逆向归纳法。步骤是:首先求解最后一期的最优策略,兰是关J:上一期状态和终结状态的 的函数,U;产gg.i)。9然后,求解倒数第二期的规划,此时的规划不含未知的值函数。V(xt.2,T-2)= max Wt-S汀 T二max 人皿小仏)+ Vg,T-l)u>满足X“ = 也(心="代)这甲.V(g,T-l)二人j(g“(s),x“),它不是未知的,可以解出T-
47、2期的最优 策略:口二二纟一/仕一:)。逐步后推到第一期,它保证后而各期最优条件下,求解第一期最优的眇态规 划,是关r给定初始条件和第一期控制变帚:的函数,所以可利用拉格郎丨1方法直 接求解。对无限规划问题而言,不能通过逆向归纳法求解,但方便之处是,从任何一 点开始的子问题都是相同的,这样,贝尔曼方程可简化为:V (x J = max f, M,兀)+ V (畑)(4)叫由丁从任何一点所开始的子问题都是相同的,所以策略函数具有时间的不变 杵。这样,如果我们能够找到这个策略函数g(xj,给定初始状态兀和转移动态 J =我们就可以求出所有各期的最优控制变暈町。(三)贴现效用或货币的时间价值在动态决
48、策中是車耍的,尽管在规划(DP)中,状 态转移方程乙包=(乙,匕)包含了利率对各期财常的评价影响,但对决策者各期 的效用/;(©,兀)没有进行恰当的评价。为此我们需耍考虑各期效用的贴现问 题。设代表第$期的贴现因子,Fs(xs,us)代表各期实际的收益或效用水平, 这样,人(心,兀)可看成是的贴现,即力血,兀)=匕行(£“)。这时, 决策者面临的问题是:T-1V(忑.0) = max 工 as Fs (兀,nJ相应地,第/后开始的子问题依此可表示为:V(xr,/)=max 工Q兀(兀")S.E 5=/当然,这一值旳数计最的是从/开始的以0时期为基准的总效用水平,0
49、 时期也就是统计屮的基期。如果耍转化成现期/期的堆准衡量的总效用水平 旷(和),只需除以贴现因子,即:一 1 aVf(xr,/) = V(x/,/;xr,7')/a/ = max 工_L()"心 e a,若令0, =/a ,则用当前值表示的贝尔曼方程为:V'(兀,t) = max F, (ut,兀)+ Q W (兀札,/ +1)( 5)W/如果各期的贴现因子相同,并且时期是无限的,则上述贝尔曼方程町简化为:Vf(xf) = max F (ur,兀)+ pVc (x/+1)(6)ul进一步,假如Q代表一个不变的主观贴现率,在离散时间的情况下,石士 代表了/期的贴现因子,
50、这时0 = 丄。若时间是连续的,贝畀期的贴现因子就1+P是0 =严。离散情形原则上是可以H接求解规划的最优解的,做法上分为两步,首先是 判断解的存在性问题,其次求具体的最优解。由于存在性问题需要涉及到算子问 题和床缩映射,这里就不详细介绍。F面主要介绍连续时间条件下的求解方法。(四) 连续时间下的求解方法问题:max f (tx.u)dt +(fr(x(r).T)ut Jo 受约束于:X = g(t,x,u)x(0) = a(7)对T从任意的/。时刻开始的值两数:V(/0,x0) = max f(t,x,u)dt +0(x(T),T)Wf %受约束于:x = g(r,x,u)曲。)=兀(8)显
51、然,V(T,x(T) = x(T)J)基本思路是把该问题转换成静态问题來处理,需耍利用Bellman方程。 考虑到值函数的可加性,可以把它分解成区间/。,/。十事和区间/。十 值函数可表示为:V(/0,x0)=maxr2 f(Z, x, u)dt + 仁 /(/, x, u)dt 十 (x(T)J)由动态规划原理,有:V(/0,-v0) = max ,0 f(t,x,u)dt+ max f(t. x. u)dt +(ft(x(T ).T)tQAi<t<T J/o+A/对丁由时间/。十/开始的子规划,受约束丁:f = g(/,x,“)x(r0 + A/) = x0 +这样,我们得到:
52、V(/0,X。)= max /(/,X.u)dt + V(/o+ A/,x0 + Ax)(9)因为V(ro+Ar,Ao+2kr)是关于初值条件的晌数,在(f°,x。)处展开:yGo + /,X。+ Ax) = v(ro,xo)+v,(r0,x0) A/+ Vx(/0,x0) Ax + h.o.t.同时由中值公式,存在心讥昇。十满足:f/0+Af_f(t,x,u)dt =Jfo因此,v(/o,X。)= max f (/,x(0,u(t)M +V(ro,x0)+ V;(/0,.r0) Af + Vx(r0,x0) Ax + h.oJ.令/ tO,得到Ft/。和:0= max /(/0,x
53、0,w0) + 匕+ V, (/0,x0) x 斗因为r。是任意的,令r0=n考虑到x = (r,x,M),我们就得到如下形式的Hanulton-Jacobi-Bellnian 方程(简称 HJB 方程):0= max + 匕(/,x) + Vr(/,x) g(/,x,“)(10)叫为使上式取得0般大值水平,对控制变最"求导数,我们得到垠优性一 阶条件:0 = fu(/,X,u) + Vx(/,x) g“(/,x,u)(ll)由此条件可以得到“关丁 X的策略函数:u=u(x)如果我们想求出X关于时间t的最优路径,还需耍求出值函数的具体形式, 因为u=u(x)包含了未知的值函数,为此需
54、要将円心)代入(10)式:+ Vt(t9x) + Vx(/,x) g(/,x,“) =0由此方程,我们可求出值函数的具体形式,最后,由可行性条件:x = g(r,x,w)M)=兀求出绘优解。例子考虑问题nun £ er, (av2 + bu2 )dt受约束于:X=lh x(/o)= x°aO解 这个问题的目标函数为f(t.x4i) = e"(ax2 +bir) f g(t,x,u) =uf这样最优控制问题归结为:0 = max (ax2 +hir) + Vt (t.x) + Vx (t, x) u 斗关于"求微分,得到最优化条件:0=2厂仙+匕a,x)解
55、得:u=-Vx(t9x) er, /(2b)把它代入方程:L(X+b,)+匕(/,x) +匕(f,x)“=0,得到:er,(ax2 + V;(t,x) e2r1 /(4b)+ *(f,x)/(2b) =0即:ax2 一 V;(r,x) e2rt /(4b) + ert V,(r,x) =0猜测上而方程的解为V(/,x) = e-"Av:,其中4为待定系数,并代入该方程,31#A2/b +rA-a = 0从而得到:A = -(-r+(r2 + 4a/?)1/2 )b这样,我们有:u=-Ax/b通过方程X =11和X(g) = XoA0,得到:Xo e-At/b二、最优控制最优控制理论是
56、处理动态优化问题的另一种IE耍的方法,其主耍的结论是关 丁一类动态优化问题的一组必要条件,称为庞特雅金最大值原理。我们从连续 时间问题着手讨论,运用前面讨论的动态规划的方法和最大值原理,将连续问题 离散化,考虑当阶段的间隔长度趋向J: 0时的极限就还原为连续问题。和上一节类似的连续时间问题可以表示为:V0 (a0 ,0) = maxw(/),o</<r=(t)Fu(t),x(/),tdt + a(T)Sx(T)满足.v(o)=xo,给定 x(t)= 7|“(r),x(/),/(P. o)和前面一样,x是状态向量,“是控制变最的向最,剩余或残余函数S() 是在规划水平的终点7处(这可能是有限的也可能不是有限的)关于状态的取值。 我们假定对应丁阶段r的贴现因子的形式为:(12)a(/) = exp(-p(s)ds)通常,当贴现率Q关于时间是常数时,贴现因子就简化为宀问题与上而讨论的类似,只要决策者需耍选择个控制轨道函数“(/),根据 移动定律馳)=刨(/),兀(/),/和初值条
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中语文第2单元孟子蚜1王好战请以战喻课件新人教版选修先秦诸子蚜
- 2024年吉林省长春市中考英语试题含解析
- 七年级下心理健康教育教案
- 2024年河北省高考生物试卷真题(含答案解析)
- 2024至2030年中国攻瑰茄行业投资前景及策略咨询研究报告
- 2024至2030年中国手持式多波长稳定光源行业投资前景及策略咨询研究报告
- 2024至2030年中国印花T/C纯棉休闲衬衫行业投资前景及策略咨询研究报告
- 2024年山东省东营市中考语文试题含解析
- 2024年黑龙江省齐齐哈尔市中考语文试题含解析
- 2024年中国钢丝跑道轴承市场调查研究报告
- 人教版数学五年级上册5.1《用字母表示数》说课稿
- CJT 192-2017 内衬不锈钢复合钢管
- 2024男女双方自愿离婚协议书
- TDT 1015.2-2024 地籍数据库 第2部分:自然资源(正式版)
- 窗帘售后服务协议
- 工作室加盟合作合同
- 《国有企业管理人员处分条例》学习解读课件
- 大量收购青苗姜合同
- 2024年中国建筑科学研究院限公司校园招聘【重点基础提升】模拟试题(共500题)附带答案详解
- 2024年农业农村知识考试必背复习题库(浓缩500题)
- 数字资源管理规章制度
评论
0/150
提交评论