序贯决策博弈概论课件_第1页
序贯决策博弈概论课件_第2页
序贯决策博弈概论课件_第3页
序贯决策博弈概论课件_第4页
序贯决策博弈概论课件_第5页
已阅读5页,还剩149页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

序贯决策博弈序贯决策博弈第一部分

同时博弈与序贯博弈第一部分

同时博弈与序贯博弈主要内容本章主要介绍:1、如何用正规型表示和展开型表示来表述同一个博弈。2、博弈论中的两个重要概念:信息集和不完美信息。3、考察包含同时决策行动和序贯决策行动的复合型博弈(混合博弈)的纳什均衡。主要内容本章主要介绍:第一节博弈的正规型表示与展开型表示第二节同时决策与序贯决策的混合博弈

第三节树形博弈的子博弈

第四节子博弈精炼纳什均衡

第五节完美博弈的库恩定理第六节动态博弈的运用

第一节博弈的正规型表示与展开型表示第一节博弈的正规型表示与展开型表示

一、如何将博弈的展开型形式转化为正规型表示案例:“进入障碍”博弈进入者●进入不进●垄断者容忍抵抗●容忍抵抗◆(1,5)(-2,2)◆◆◆(0,10)(0,4)垄断者abc第一节博弈的正规型表示与展开型表示

一、如何将博弈的展开“进入障碍”的矩阵表达1,5-2,2-2,21,50,100,40,100,4进入者垄断者进入不进入{容忍,容忍}{抵抗,抵抗}{抵抗,容忍}{容忍,抵抗}“进入障碍”的矩阵表达1,5-2,2-2,21,50,100小结1、一般我们将先行动者放在行局中人的位置,把后行动者放在列局中人的位置。2、每个局中人的策略必须是一个完整的计划,必须考虑自己在对方每一个行动下的行动。例如:{容忍,容忍}。在本例中,进入者有两个纯策略,而垄断者有四个纯策略。3、每个局中人的决策轮数越多,则他的纯策略选择的数目越多。

思考:如果有三轮博弈,如何写矩阵形式。4、矩阵形式表示的可能的博弈结果比树形表示的结果要多,这是因为有不止一个纯策略可以导致相同的博弈结果。小结1、一般我们将先行动者放在行局中人的位置,把后行动二、如何将正规型的博弈转化为展开型比前面简单,尤其是序贯博弈,但如果是同时博弈,如何表示?信息集案例:情侣博弈2,10,00,01,2足球芭蕾足球芭蕾丈夫妻子夫妻之争二、如何将正规型的博弈转化为展开型比前面简单,尤其是序贯博弈信息集根据同时博弈的定义,每个局中人决策时不知道别人的策略,即每个局中人在做自己的行动选择时,并不知道自己处在哪个决策节点上。例如妻子在选芭蕾时,并不知道丈夫选的是芭蕾还是足球。局中人不能是别人对方“已经”做出的行动或决策,就等于同时行动或决策。此时,我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集。即局中人知道博弈已经进行到他的这个信息集,但不知道博弈究竟进行到这个信息集中的哪个决策节点。信息集根据同时博弈的定义,每个局中人决策时不知道别人的策略,信息集妻子虽然知道博弈已经进行到她的信息集,但不知道进行到信息集中的那个决策点,即她不知道丈夫会选什么,因此是同时博弈。丈夫●足球芭蕾●妻子足球芭蕾●足球芭蕾◆(2,1)(0,0)◆◆◆(-1,-1)(1,2)妻子信息集妻子虽然知道博弈已经进行到她的信息集,但不知道进行到信注意一个信息集罩住的必须是同一个局中人的决策点。必须是同一个局中人在同一个时点的决策节点。ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒这两个虚线罩住的都不是信息集。注意一个信息集罩住的必须是同一个局中人的决策点。ABBA注意同时,即使是同一个人在同一时点进行决策,也不一定构成一个信息集,他还必须满足:在每一个决策点他的行动选择集合必须是相同的。因为局中人在做行动选择时并不知道自己位于哪个决策点,因此,他不可能做出不同的行动选择。●●A●◆◆◆BB◆◆该虚线罩住的不是信息集。其必须满足:同集同注,即从各个决策点出发的策略选择数目相同,名称也相同。注意同时,即使是同一个人在同一时点进行决策,也不一定构成单点集和非单点集我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。因此,每一个决策位置都是一个信息集,只有单点集和非单点集之分。●●A●◆◆BB◆◆●◆非单点集单点集单点集和非单点集我们把不被扁椭圆虚线罩住的每个决策节点也给以完美信息博弈和不完美信息博弈当博弈走到一个单点集的信息集时,面临决策的局中人对于博弈迄今的历史清清楚楚,他清楚了博弈具体走到了他的这个决策节点而不是别的决策点。我们把这种历史清楚的博弈称为完美信息博弈。但是当博弈走到一个非单点集的信息集时,面临决策的局中人对于博弈迄今的历史是不清楚的,他不清楚博弈具体走到了他的这个信息集里面的那个决策点。我们把这种历史不清楚的博弈称为不完美信息博弈。如果一个序贯博弈的每个信息集都是一个单点集,那么该序贯博弈就是完美信息博弈,否则他就是不完美信息博弈。完美信息博弈和不完美信息博弈当博弈走到一个单点集的信息集时,信息集举例信息集举例情爱博弈的扩展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’情爱博弈的扩展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的选择;但不知道A的选择(或A、B同时决策)

房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发序贯决策博弈概论序贯决策博弈概论序贯决策博弈概论第二节同时决策与序贯决策的混合博弈(完全不完美信息的两阶段博弈)我们把包含同时决策行动和序贯决策行动的博弈称为混合博弈。假设有两家计算机公司:方正和联想。彼此对新产品的研发和定价进行博弈竞争。该博弈分为两个阶段:第一阶段,两个公司进行研发投入竞争,每个公司都可以选择“大投入”和“小投入”的研发预算,同时每个公司都不公开公布自己的预算;第二阶段,当产品开发出来并面世以后,厂商会观摩对方研制出来的新产品对自己的新产品定价,每个厂商可以定高价也可以定低价,但定价之前看不到对方的定价。第二节同时决策与序贯决策的混合博弈(完全不完美信息的两阶联想大投入小投入大投入小投入方正高价格低价格5,52,66,24,44,33,42,11,26,63,77,35,53,41,24,32,1高价格高价格高价格高价格高价格高价格高价格低价格低价格低价格低价格低价格低价格低价格联想大投入小投入大投入小投入方正高价格低价格5,52,66,联想大投入小投入大投入小投入方正5,52,66,24,44,33,42,11,23,41,24,32,16,63,77,35,5联想大投入小投入大投入小投入方正5,52,66,24,44,联想大投入小投入大投入小投入4,43,44,35,5方正该博弈的结果为:两个公司都在第一个阶段采取小投入(帕累优势原则),在第二个阶段采取低价格。但纳什均衡有16个(过程略),因为很多策略导致同一个结果。联想大投入小投入大投入小投入4,43,44,35,5方正该博该博弈的展开型表述见P173页该博弈的展开型表述见P173页银行挤兑博弈案例案例情况:

两个投资者每人存入银行一笔存款D,银行已将这些存款投入一个长期项目。如果在该项目到期前银行被迫对投资者变现,共可收回2r,这里D>r>D/2。不过,如果银行允许投资项目到期,则项目共可取得2R,这里R>D。有两个时间,投资者可以从银行提款:在银行的投资项目到期之前或者在到期之后。为使分析简化,假设不存在贴现。银行挤兑博弈案例案例情况:两个投资者的提款日期可以有如下可能:A、两个都提前,都得到rB、一个提前提取另一个不动,则第一人得D,另一人得2r-D.C、两个在到期后提,各得RD、两个都不提,等到投资项目结束,都得到RE、如果一个人在期满后提取,另一人不动则分别得:2R-D,D。如下图所示:两个投资者的提款日期可以有如下可能:序贯决策博弈概论我们使用逆向归纳法分析问题从日期2开始先考虑日期2的标准式博弈,由于明显的R>D,也就是说2R-D>R。我们可以得到这个博弈的纳什均衡(R,R)。由于不存在贴现,我们可以直接带入日期1的博弈矩阵表示式。我们使用逆向归纳法分析问题由于r<D(并且由此可得2r-D<r),这一由两阶段博弈变形得到的单阶段博弈存在两个纯战略纳什均衡:(1)两个投资者都提款,最终收益情况为(r,r);两个投资者都不提款,最终收益为(R,R)。从而,最初的两阶段银行挤提博弈就有2个子博弈精炼解。由于r<D(并且由此可得2r-D<r),这一由两阶段博弈变银行挤兑(1)

王则柯“银行挤兑的成因和预防”两客户在同一银行各存有100元,银行将这200元投资于一个长期项目。如果在项目到期前银行要抽回资金,则只能收回140元;但如果到期后再收回投资,则可收回本息280元。对客户来说,抽回存款的日期也有两种:一是在银行投资项目到期之前,称日期1;一是在到期之后,称日期2。假定如果两客户在日期1要求抽回资金则各得70元;如果只有一个客户在日期1要抽回资金则该客户得100元,另一客户只能得到剩余的40元。如果等到日期2两客户同时要收回资金,则各得140元;如果到日期2还只有一方要求收回资金,则要求收回资金一方得180元,另一方得100元;如果到日期2没有客户要求收回资金,则银行还是分给他们各140元。银行挤兑(1)

王则柯“银行挤兑的成因和预防”两客户在同一银周瑜存不存存不存诸葛亮40,100100,4070,70周瑜存不存存不存诸葛亮40,100100,4070,70周瑜抽回不抽回不诸葛亮40,100100,4070,70周瑜抽回不抽回不诸葛亮40,100100,4070,70银行挤兑(3)日期1周瑜诸葛亮抽回不抽回抽回70,70100,40不抽回40,100140,140银行挤兑(3)日期1周瑜诸葛亮抽回不抽回抽回70,7010035

前一种结果可以解释为对银行的一次挤提。如果投资者1相信投资者2将在日期1提款、则投资者1的最优反应也是去提款,即使他们等到日期2再去提款的话两人的福利都会提高。这里的银行挤提博弈在一个很重要的方面不同于第1章中讨论的囚徒困境:虽然两个博弈都存在一个对整个社会是低效率的纳什均衡;但在囚徒困境中这一均衡是惟一的(并且是参与者的严格占优战略),而在这里还同时存在另一个有效率的均衡。从而,这一模型并不能预侧何时会发生对银行的挤提,但的确显示出挤提会作为一个均衡结果而出现。前一种结果可以解释为对银行的一次挤提。如果投资者1相信投资经典案例之关税竞争在国际争端中,关税与贸易争端最为激烈。由于贸易能增进双方的福利,而关税是阻碍贸易自由的最大障碍。在早期,政府自由选择关税税率时将如何决策?经典案例之关税竞争在国际争端中,关税与贸易争端最为考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),一个政府负责确定关税税率(t1,t2);企业1制造产品h1供给本国,及出口e1;考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),一个政府负责确定关税税率(t1,t2);企业1制造产品h1供给本国,及出口e1;企业制造产品供给本国(h1,h2)及出口(e1,e2);考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);企业制造产品供给本国(h1,h2)及出口(e1,e2);市场1:Q1=h1+e2考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);企业制造产品供给本国(h1,h2)及出口(e1,e2);两个市场:Qi=hi+ej考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);企业制造产品供给本国(h1,h2)及出口(e1,e2);两个市场:Qi=hi+ej,pi(Qi)=a-Qi考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),每个国家有一个政府负责确定关税税率(t1,t2);一个企业制造产品供给本国(h1,h2)及出口(e1,e2);考虑两个完全相同的国家(i=1,2),每个国家有

博弈的时间顺序如下:(1)政府同时选择关税税率t1和t2;(2)企业观察到关税税率,并同时选择其提供国内消费和出口的产量(h1,e1)和(h2,e2);

企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei企业的收益为其利润πi:由于πi(ti,tj,hi,ei,hj*,ej*)可表示为:企业I在市场i的利润+在市场j的利润即πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei也即πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi-chi+[a-(hj+ei)]ei-cei-tjei企业i在市场的最优化问题就可拆为一对问题,在每个市场分别求解由于πi(ti,tj,hi,ei,hj*,ej*)可表示企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi-chi+[a-(hj+ei)]ei-cei-tjei企业i在市场的最优化问题就可拆为一对问题,在每个市场分别求解企业的收益为其利润πi:企业i在市场的最优化问题就可拆为一对hi*须满足:maxhi[a-(hi+ej*)-c],

hi≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi-chi+[a-(hj+ei)]ei-cei-tjei企业的收益为其利润πi:ei*必须满足:maxei[a-(ei+hj*)-c]-tjei

ei≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei企业的收益为其利润πi:hi*须满足:maxhi[a-(hi+ej*)-c],

hi≧0ei*必须满足:maxei[a-(ei+hj*)–c]-tjei

ei≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei企业的收益为其利润πi:hi*须满足:maxhi[a-(hi+ej*)-c],

hi≧0且ei*必须满足:maxei[a-(ei+hj*)-c]-tjei

ei≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei解得hi*=(a-ej*-c)/2ei*=(a-hj*-c-tj)/2

企业的收益为其利润πi:解得hi*=(a-ej*-c)/2同理,若政府给定关税税率t1和t2,则第二个企业j将选择产量(hj*,ej*),即

同理,若政府给定关税税率t1和t2,则第二个企业j将选择产量同理,若政府给定关税税率t1和t2,则第二个企业j将选择产量(hj*,ej*),即

hj*=(a-c+tj)/3

ej*=(a-c-2ti)/3同理,若政府给定关税税率t1和t2,则第二个企业j将选择产量若政府给定关税税率t1和t2,则企业i将选择产量(hi*,ei*),即

hj*=(a-c+tj)/3

ej*=(a-c-2ti)/3

则利润为πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei若政府给定关税税率t1和t2,则企业i将选择产量(hi*,若政府给定关税税率t1和t2,则企业i将选择产量(hi*,ei*),即

hj*=(a-c+tj)/3

ej*=(a-c-2ti)/3

则利润为πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei若政府给定关税税率t1和t2,则企业i将选择产量(hi*,政府的收益回到第一阶段政府的收益回到第一阶段政府的收益则为其本国的总福利wi,它由消费者剩余、企业利润及关税构成,即:

wi(ti,tj,hi,ei,hj,ej)=(hi+ej)2/2+πi(ti,tj,hi,ei,hj,ej)+tiej回到第一阶段政府的收益则为其本国的总福利wi,它由消费者剩余、企业利润及政府的收益则为其本国的总福利wi,它由消费者剩余、企业利润及关税构成,即:

wi(ti,tj,hi,ei,hj,ej)=(hi+ej)2/2+πi(ti,tj,hi,ei,hj,ej)+tiej回到第一阶段把第一阶段的结果代入得政府的收益则为其本国的总福利wi,它由消费者剩余、企业利润及回到第一阶段求解一阶条件回到第一阶段求解一阶条件回到第一阶段求解一阶条件回到第一阶段求解一阶条件回到第一阶段求解一阶条件得回到第一阶段求解一阶条件得有该博弈的子博弈完美纳什均衡:以及对应的纳什均衡结果

在子博弈精炼解中,每个市场上的总量为,。进一步分析我们发现,如果政府选择0关税税率,则每个市场上的总量为,。于是,政府就有动因签订一个相互承诺0关税税率的协定,即自由贸易。有该博弈的子博弈完美纳什均衡:第三节树形博弈的子博弈定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)第三节树形博弈的子博弈定义:由一个动态博弈第一阶段以外的注意1、子博弈不能从第一个阶段开始,因为原来的博弈(母博弈)本身不能称为子博弈,即子博弈集合是一个真子集合。2、子博弈不能分割原来博弈(母博弈)的信息集。●●A●◆◆BC●◆◆●DE●●◆FG●◆H◆◆●◆I◆●◆D、E、F、G点以后都不能构成子博弈.这个博弈有几个子博弈?注意1、子博弈不能从第一个阶段开始,因为原来的博弈(母博弈)第四节子博弈精炼纳什均衡定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。子博弈完美纳什均衡能够排除均衡策略中不可信的威胁(允诺)和承诺,因此是真正稳定的。逆推归纳法(倒推法)是求完美信息动态博弈子博弈完美纳什均衡的基本方法。第四节子博弈精炼纳什均衡定义:如果一个完美信息的动态博弈注意子博弈精炼纳什均衡本身也是纳什均衡,但却比纳什均衡更强的均衡概念。子博弈精炼纳什均衡能够排除不是结果的纳什均衡。例如:情侣博弈中,(足球,{足球,足球})和(芭蕾,{芭蕾,芭蕾})策略不是子博弈精炼纳什均衡,因此不是最终的结果。图见P179。如果一个策略组合的某个策略成分有偏离的激励,我们可以说这个策略组合缺乏局部稳定性,不是子博弈精炼纳什均衡。完美博弈的库恩定理:完美信息的有限序贯博弈都有纳什均衡。注意子博弈精炼纳什均衡本身也是纳什均衡,但却比纳什均衡更强的动态博弈分析中为什么要引进子博弈完美纳什均衡,它与纳什均衡是什么关系?子博弈完美纳什均衡是一种策略组合,它们不仅在整个博弈中构成纳什均衡,而且在所有的子博弈中也构成纳什均衡。在动态博弈分析中,引进子博弈完美纳什均衡的原因在于可以消除不可信的威胁(允诺)和承诺,使得求的纳什均衡更具有稳定性。子博弈完美纳什均衡一定是纳什均衡,但纳什均衡不一定是子博弈完美纳什均衡。动态博弈分析中为什么要引进子博弈完美纳什均衡,它与纳什均衡是(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)Of8strategycombination,3areNash

(1,2)(1,2)(1,2)70不可信的威胁和承诺不可信的威胁和承诺序贯决策博弈概论序贯决策博弈概论序贯决策博弈概论序贯决策博弈概论序贯决策博弈概论序贯决策博弈概论这个博弈有几个纳什均衡?1.用虚线排除确定法得到博弈的纳什均衡甲乙共有四种策略组合,其中第1和第4种策略组合是纳什均衡(给,{不实施,实施})(给,{不实施,不实施})(不给,{不实施,实施})(不给,{不实施,不实施})这个博弈有几个纳什均衡?1.用虚线排除确定法得到博弈的纳什均2.用比较优势划线法,得到博弈的纳什均衡(给,{不实施,实施})(不给,{不实施,不实施})3.用倒推法找到子博弈完美纳什均衡:(不给,{不实施,不实施}),而(给,{不实施,实施})这个策略组合里乙在甲不给情况下实施是个不可信的威胁,所以这个纳什均衡不是子博弈完美纳什均衡,它的稳定性比子博弈完美纳什均衡要差一些.2.用比较优势划线法,得到博弈的纳什均衡序贯决策博弈概论颤抖手均衡(类似一个人用手抓东西时,手一颤抖,他就抓不住他想抓的东西)。颤抖手均衡(类似一个人用手抓东西时,手一颤抖,他就抓不住他想序贯决策博弈概论序贯决策博弈概论序贯决策博弈概论2,111,221,110,02,322,111,221,110,02,32序贯决策博弈序贯决策博弈第一部分

同时博弈与序贯博弈第一部分

同时博弈与序贯博弈主要内容本章主要介绍:1、如何用正规型表示和展开型表示来表述同一个博弈。2、博弈论中的两个重要概念:信息集和不完美信息。3、考察包含同时决策行动和序贯决策行动的复合型博弈(混合博弈)的纳什均衡。主要内容本章主要介绍:第一节博弈的正规型表示与展开型表示第二节同时决策与序贯决策的混合博弈

第三节树形博弈的子博弈

第四节子博弈精炼纳什均衡

第五节完美博弈的库恩定理第六节动态博弈的运用

第一节博弈的正规型表示与展开型表示第一节博弈的正规型表示与展开型表示

一、如何将博弈的展开型形式转化为正规型表示案例:“进入障碍”博弈进入者●进入不进●垄断者容忍抵抗●容忍抵抗◆(1,5)(-2,2)◆◆◆(0,10)(0,4)垄断者abc第一节博弈的正规型表示与展开型表示

一、如何将博弈的展开“进入障碍”的矩阵表达1,5-2,2-2,21,50,100,40,100,4进入者垄断者进入不进入{容忍,容忍}{抵抗,抵抗}{抵抗,容忍}{容忍,抵抗}“进入障碍”的矩阵表达1,5-2,2-2,21,50,100小结1、一般我们将先行动者放在行局中人的位置,把后行动者放在列局中人的位置。2、每个局中人的策略必须是一个完整的计划,必须考虑自己在对方每一个行动下的行动。例如:{容忍,容忍}。在本例中,进入者有两个纯策略,而垄断者有四个纯策略。3、每个局中人的决策轮数越多,则他的纯策略选择的数目越多。

思考:如果有三轮博弈,如何写矩阵形式。4、矩阵形式表示的可能的博弈结果比树形表示的结果要多,这是因为有不止一个纯策略可以导致相同的博弈结果。小结1、一般我们将先行动者放在行局中人的位置,把后行动二、如何将正规型的博弈转化为展开型比前面简单,尤其是序贯博弈,但如果是同时博弈,如何表示?信息集案例:情侣博弈2,10,00,01,2足球芭蕾足球芭蕾丈夫妻子夫妻之争二、如何将正规型的博弈转化为展开型比前面简单,尤其是序贯博弈信息集根据同时博弈的定义,每个局中人决策时不知道别人的策略,即每个局中人在做自己的行动选择时,并不知道自己处在哪个决策节点上。例如妻子在选芭蕾时,并不知道丈夫选的是芭蕾还是足球。局中人不能是别人对方“已经”做出的行动或决策,就等于同时行动或决策。此时,我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集。即局中人知道博弈已经进行到他的这个信息集,但不知道博弈究竟进行到这个信息集中的哪个决策节点。信息集根据同时博弈的定义,每个局中人决策时不知道别人的策略,信息集妻子虽然知道博弈已经进行到她的信息集,但不知道进行到信息集中的那个决策点,即她不知道丈夫会选什么,因此是同时博弈。丈夫●足球芭蕾●妻子足球芭蕾●足球芭蕾◆(2,1)(0,0)◆◆◆(-1,-1)(1,2)妻子信息集妻子虽然知道博弈已经进行到她的信息集,但不知道进行到信注意一个信息集罩住的必须是同一个局中人的决策点。必须是同一个局中人在同一个时点的决策节点。ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒这两个虚线罩住的都不是信息集。注意一个信息集罩住的必须是同一个局中人的决策点。ABBA注意同时,即使是同一个人在同一时点进行决策,也不一定构成一个信息集,他还必须满足:在每一个决策点他的行动选择集合必须是相同的。因为局中人在做行动选择时并不知道自己位于哪个决策点,因此,他不可能做出不同的行动选择。●●A●◆◆◆BB◆◆该虚线罩住的不是信息集。其必须满足:同集同注,即从各个决策点出发的策略选择数目相同,名称也相同。注意同时,即使是同一个人在同一时点进行决策,也不一定构成单点集和非单点集我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。因此,每一个决策位置都是一个信息集,只有单点集和非单点集之分。●●A●◆◆BB◆◆●◆非单点集单点集单点集和非单点集我们把不被扁椭圆虚线罩住的每个决策节点也给以完美信息博弈和不完美信息博弈当博弈走到一个单点集的信息集时,面临决策的局中人对于博弈迄今的历史清清楚楚,他清楚了博弈具体走到了他的这个决策节点而不是别的决策点。我们把这种历史清楚的博弈称为完美信息博弈。但是当博弈走到一个非单点集的信息集时,面临决策的局中人对于博弈迄今的历史是不清楚的,他不清楚博弈具体走到了他的这个信息集里面的那个决策点。我们把这种历史不清楚的博弈称为不完美信息博弈。如果一个序贯博弈的每个信息集都是一个单点集,那么该序贯博弈就是完美信息博弈,否则他就是不完美信息博弈。完美信息博弈和不完美信息博弈当博弈走到一个单点集的信息集时,信息集举例信息集举例情爱博弈的扩展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’情爱博弈的扩展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的选择;但不知道A的选择(或A、B同时决策)

房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发序贯决策博弈概论序贯决策博弈概论序贯决策博弈概论第二节同时决策与序贯决策的混合博弈(完全不完美信息的两阶段博弈)我们把包含同时决策行动和序贯决策行动的博弈称为混合博弈。假设有两家计算机公司:方正和联想。彼此对新产品的研发和定价进行博弈竞争。该博弈分为两个阶段:第一阶段,两个公司进行研发投入竞争,每个公司都可以选择“大投入”和“小投入”的研发预算,同时每个公司都不公开公布自己的预算;第二阶段,当产品开发出来并面世以后,厂商会观摩对方研制出来的新产品对自己的新产品定价,每个厂商可以定高价也可以定低价,但定价之前看不到对方的定价。第二节同时决策与序贯决策的混合博弈(完全不完美信息的两阶联想大投入小投入大投入小投入方正高价格低价格5,52,66,24,44,33,42,11,26,63,77,35,53,41,24,32,1高价格高价格高价格高价格高价格高价格高价格低价格低价格低价格低价格低价格低价格低价格联想大投入小投入大投入小投入方正高价格低价格5,52,66,联想大投入小投入大投入小投入方正5,52,66,24,44,33,42,11,23,41,24,32,16,63,77,35,5联想大投入小投入大投入小投入方正5,52,66,24,44,联想大投入小投入大投入小投入4,43,44,35,5方正该博弈的结果为:两个公司都在第一个阶段采取小投入(帕累优势原则),在第二个阶段采取低价格。但纳什均衡有16个(过程略),因为很多策略导致同一个结果。联想大投入小投入大投入小投入4,43,44,35,5方正该博该博弈的展开型表述见P173页该博弈的展开型表述见P173页银行挤兑博弈案例案例情况:

两个投资者每人存入银行一笔存款D,银行已将这些存款投入一个长期项目。如果在该项目到期前银行被迫对投资者变现,共可收回2r,这里D>r>D/2。不过,如果银行允许投资项目到期,则项目共可取得2R,这里R>D。有两个时间,投资者可以从银行提款:在银行的投资项目到期之前或者在到期之后。为使分析简化,假设不存在贴现。银行挤兑博弈案例案例情况:两个投资者的提款日期可以有如下可能:A、两个都提前,都得到rB、一个提前提取另一个不动,则第一人得D,另一人得2r-D.C、两个在到期后提,各得RD、两个都不提,等到投资项目结束,都得到RE、如果一个人在期满后提取,另一人不动则分别得:2R-D,D。如下图所示:两个投资者的提款日期可以有如下可能:序贯决策博弈概论我们使用逆向归纳法分析问题从日期2开始先考虑日期2的标准式博弈,由于明显的R>D,也就是说2R-D>R。我们可以得到这个博弈的纳什均衡(R,R)。由于不存在贴现,我们可以直接带入日期1的博弈矩阵表示式。我们使用逆向归纳法分析问题由于r<D(并且由此可得2r-D<r),这一由两阶段博弈变形得到的单阶段博弈存在两个纯战略纳什均衡:(1)两个投资者都提款,最终收益情况为(r,r);两个投资者都不提款,最终收益为(R,R)。从而,最初的两阶段银行挤提博弈就有2个子博弈精炼解。由于r<D(并且由此可得2r-D<r),这一由两阶段博弈变银行挤兑(1)

王则柯“银行挤兑的成因和预防”两客户在同一银行各存有100元,银行将这200元投资于一个长期项目。如果在项目到期前银行要抽回资金,则只能收回140元;但如果到期后再收回投资,则可收回本息280元。对客户来说,抽回存款的日期也有两种:一是在银行投资项目到期之前,称日期1;一是在到期之后,称日期2。假定如果两客户在日期1要求抽回资金则各得70元;如果只有一个客户在日期1要抽回资金则该客户得100元,另一客户只能得到剩余的40元。如果等到日期2两客户同时要收回资金,则各得140元;如果到日期2还只有一方要求收回资金,则要求收回资金一方得180元,另一方得100元;如果到日期2没有客户要求收回资金,则银行还是分给他们各140元。银行挤兑(1)

王则柯“银行挤兑的成因和预防”两客户在同一银周瑜存不存存不存诸葛亮40,100100,4070,70周瑜存不存存不存诸葛亮40,100100,4070,70周瑜抽回不抽回不诸葛亮40,100100,4070,70周瑜抽回不抽回不诸葛亮40,100100,4070,70银行挤兑(3)日期1周瑜诸葛亮抽回不抽回抽回70,70100,40不抽回40,100140,140银行挤兑(3)日期1周瑜诸葛亮抽回不抽回抽回70,70100120

前一种结果可以解释为对银行的一次挤提。如果投资者1相信投资者2将在日期1提款、则投资者1的最优反应也是去提款,即使他们等到日期2再去提款的话两人的福利都会提高。这里的银行挤提博弈在一个很重要的方面不同于第1章中讨论的囚徒困境:虽然两个博弈都存在一个对整个社会是低效率的纳什均衡;但在囚徒困境中这一均衡是惟一的(并且是参与者的严格占优战略),而在这里还同时存在另一个有效率的均衡。从而,这一模型并不能预侧何时会发生对银行的挤提,但的确显示出挤提会作为一个均衡结果而出现。前一种结果可以解释为对银行的一次挤提。如果投资者1相信投资经典案例之关税竞争在国际争端中,关税与贸易争端最为激烈。由于贸易能增进双方的福利,而关税是阻碍贸易自由的最大障碍。在早期,政府自由选择关税税率时将如何决策?经典案例之关税竞争在国际争端中,关税与贸易争端最为考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),一个政府负责确定关税税率(t1,t2);企业1制造产品h1供给本国,及出口e1;考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),一个政府负责确定关税税率(t1,t2);企业1制造产品h1供给本国,及出口e1;企业制造产品供给本国(h1,h2)及出口(e1,e2);考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);企业制造产品供给本国(h1,h2)及出口(e1,e2);市场1:Q1=h1+e2考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);企业制造产品供给本国(h1,h2)及出口(e1,e2);两个市场:Qi=hi+ej考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),政府负责确定关税税率(t1,t2);企业制造产品供给本国(h1,h2)及出口(e1,e2);两个市场:Qi=hi+ej,pi(Qi)=a-Qi考虑两个完全相同的国家(i=1,2),考虑两个完全相同的国家(i=1,2),每个国家有一个政府负责确定关税税率(t1,t2);一个企业制造产品供给本国(h1,h2)及出口(e1,e2);考虑两个完全相同的国家(i=1,2),每个国家有

博弈的时间顺序如下:(1)政府同时选择关税税率t1和t2;(2)企业观察到关税税率,并同时选择其提供国内消费和出口的产量(h1,e1)和(h2,e2);

企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei企业的收益为其利润πi:由于πi(ti,tj,hi,ei,hj*,ej*)可表示为:企业I在市场i的利润+在市场j的利润即πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei也即πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi-chi+[a-(hj+ei)]ei-cei-tjei企业i在市场的最优化问题就可拆为一对问题,在每个市场分别求解由于πi(ti,tj,hi,ei,hj*,ej*)可表示企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi-chi+[a-(hj+ei)]ei-cei-tjei企业i在市场的最优化问题就可拆为一对问题,在每个市场分别求解企业的收益为其利润πi:企业i在市场的最优化问题就可拆为一对hi*须满足:maxhi[a-(hi+ej*)-c],

hi≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi-chi+[a-(hj+ei)]ei-cei-tjei企业的收益为其利润πi:ei*必须满足:maxei[a-(ei+hj*)-c]-tjei

ei≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei企业的收益为其利润πi:hi*须满足:maxhi[a-(hi+ej*)-c],

hi≧0ei*必须满足:maxei[a-(ei+hj*)–c]-tjei

ei≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei企业的收益为其利润πi:hi*须满足:maxhi[a-(hi+ej*)-c],

hi≧0且ei*必须满足:maxei[a-(ei+hj*)-c]-tjei

ei≧0企业的收益为其利润πi:πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei解得hi*=(a-ej*-c)/2ei*=(a-hj*-c-tj)/2

企业的收益为其利润πi:解得hi*=(a-ej*-c)/2同理,若政府给定关税税率t1和t2,则第二个企业j将选择产量(hj*,ej*),即

同理,若政府给定关税税率t1和t2,则第二个企业j将选择产量同理,若政府给定关税税率t1和t2,则第二个企业j将选择产量(hj*,ej*),即

hj*=(a-c+tj)/3

ej*=(a-c-2ti)/3同理,若政府给定关税税率t1和t2,则第二个企业j将选择产量若政府给定关税税率t1和t2,则企业i将选择产量(hi*,ei*),即

hj*=(a-c+tj)/3

ej*=(a-c-2ti)/3

则利润为πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei若政府给定关税税率t1和t2,则企业i将选择产量(hi*,若政府给定关税税率t1和t2,则企业i将选择产量(hi*,ei*),即

hj*=(a-c+tj)/3

ej*=(a-c-2ti)/3

则利润为πi(ti,tj,hi,ei,hj,ej)=[a-(hi+ej)]hi+[a-(hj+ei)]ei-c(hi+ei)-tjei若政府给定关税税率t1和t2,则企业i将选择产量(hi*,政府的收益回到第一阶段政府的收益回到第一阶段政府的收益则为其本国的总福利wi,它由消费者剩余、企业利润及关税构成,即:

wi(ti,tj,hi,ei,hj,ej)=(hi+ej)2/2+πi(ti,tj,hi,ei,hj,ej)+tiej回到第一阶段政府的收益则为其本国的总福利wi,它由消费者剩余、企业利润及政府的收益则为其本国的总福利wi,它由消费者剩余、企业利润及关税构成,即:

wi(ti,tj,hi,ei,hj,ej)=(hi+ej)2/2+πi(ti,tj,hi,ei,hj,ej)+tiej回到第一阶段把第一阶段的结果代入得政府的收益则为其本国的总福利wi,它由消费者剩余、企业利润及回到第一阶段求解一阶条件回到第一阶段求解一阶条件回到第一阶段求解一阶条件回到第一阶段求解一阶条件回到第一阶段求解一阶条件得回到第一阶段求解一阶条件得有该博弈的子博弈完美纳什均衡:以及对应的纳什均衡结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论