第二节完全信息动态博弈(22)_第1页
第二节完全信息动态博弈(22)_第2页
第二节完全信息动态博弈(22)_第3页
第二节完全信息动态博弈(22)_第4页
第二节完全信息动态博弈(22)_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题n三 应用举例子博弈精炼纳什均衡n泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。子博弈精炼纳什均衡-不可置信威胁n美国普林斯顿大学古尔教授在1997年的经济学透视里发表文章,提出一个例子说明威胁的可信性问题:n两兄

2、弟为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告状,我都把你们两个关起来,关起来比没有玩具更可怕。现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说:快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因此哥哥对弟弟的警告置之不理。n的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可置信的。子博弈精练纳什均衡A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)

3、(0,0)不开发( (不开发,(开发,开发)不开发,(开发,开发), ,(开发,(不开发,开发开发,(不开发,开发) )), ,(开发(开发, ,(不开发,不开发)(不开发,不开发) 如果A选择开发,B的最优选择是不开发,如果A选择不开发,B的最优选择是开发,A预测到自己的选择对B的影响,因此开发是A的最优选择。子博弈精练纳什均衡结果是:A选择开发,B选择不开发。xx 对于对于( (不开发,(开发,开发),不开发,(开发,开发),这个组合之所以构成纳什均衡,是因这个组合之所以构成纳什均衡,是因为为B B威胁不论威胁不论A A开发还是不开发,他都开发还是不开发,他都将选择开发,将选择开发,A A

4、相信了相信了B B的威胁,不开的威胁,不开发是最优选择,但是发是最优选择,但是A A为什么要相信为什么要相信B B的威胁呢?的威胁呢? 毕竟,如果毕竟,如果A A真开发,真开发,B B选择开发选择开发得得-3-3,不开发得,不开发得0 0,所以,所以B B的最优选择的最优选择是不开发。如果是不开发。如果A A知道知道B B是理性的,是理性的,A A将选择开发,逼迫将选择开发,逼迫B B选择不开发。自选择不开发。自己得己得1 1,B B得得0 0,即纳什均衡,即纳什均衡( (不开发,不开发,(开发,开发)是不可置信的。因(开发,开发)是不可置信的。因为它依赖于为它依赖于B B的一个不可置信的威胁

5、。的一个不可置信的威胁。 同样:同样: (不开发,不开发)也是一(不开发,不开发)也是一个不可置信威胁,纳什均衡(开发个不可置信威胁,纳什均衡(开发, ,(不(不开发,不开发)是不合理的。开发,不开发)是不合理的。子博弈精练纳什均衡n泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。n什么是子博弈,什么是子博弈精练纳什均衡?n有没有更好的方法找到子博弈精练纳什均衡?完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n子博弈:是原博弈的一部分,

6、它本身也可以作为一个独立的博弈进行分析:(1)子博弈必须从一个单结信息点开始:只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结。如果信息集包含两个以上的决策结,则这两个都不可以作为子博弈的初始结(见下页)。(2)子博弈的信息集和支付向量都直接继承自原博弈,即当x和x在原博弈中属于同一信息集时,他们在子博弈中才属于同一信息集;子博弈的支付函数只是原博弈留存在子博弈上的部分。n习惯上,任何博弈的本身称为自身的一个子博弈。子博弈精练纳什均衡1UD22LRLRhh1UD22LRLRhhLLRR2 h2 h(a1,b1) (a2, b2) (a3, b3) (

7、a4 b4)(a1,b1) (a2, b2) (a3, b3) (a4 b4)(a1,b1) (a2, b2) (a3, b3) (a4 b4)子博弈精练纳什均衡n子博弈定义子博弈定义:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足下列条件:n(1)x是一个单结点信息集,即h(x)=x; n(2)对于所有的 ,如果 ,n那么 n条件(1)和(2)意味着子博弈不能切割原博弈的信息集。1( )xT x1()xh x( ).xT xA开发不开发XX大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3

8、,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 参与人X的信息集不能开始一个子博弈,否则的话,参与人B的信息将被切割。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)不开发A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx不开发开发不开发(1,0)(-3,-3)x开发(0,1)(0,0)x子博弈I子博弈II房地产开发博弈A坦白抵赖BB坦白抵赖坦白(-8,-8)(0,-10)(-10,0) (-1,-1)找出房地产开发博弈的子博弈找出房地产开发博弈的子博弈( (不开发,(开发,开发),(开发,(不开发,开发),(开发不开发,(开发,开发),(开发,(

9、不开发,开发),(开发, ,(不开发,不开发)(不开发,不开发)完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n子博弈精练纳什均衡: 扩展式博弈的战略组合是一个子博弈精练纳什均衡,如果:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。简言之,一个战略组合是子博弈精炼纳什均衡,当且仅当在每一个子博弈上都构成一个纳什均衡。A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx(a)房地产开发博弈开发不开发(1,0)(-3,-3)x开发(0,1)(0,0)x子博弈I子博弈II(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发

10、)在c上构成均衡,在b上不构成; 在b和c上都构成 在c上构成均衡,在b上不构成完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)不开发 判断下列均衡结果哪个构成子博弈精练纳什均衡?不开发(b)(c)完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称为“均衡路径”,博弈树上的其他路径称为“非均衡路径”。n纳什均衡只要求均衡战略在均衡路径的决策结上是最优的;n而构成子博弈精练纳什均衡不仅要求在均衡路径上策略是最优的,而且在非均衡路径上的决策结上也是最优的。这是纳什均衡与子博弈精练纳什均衡的实质区别。完

11、全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n战略是参与人行动规则的完备描述,它要告诉参与人在每一种可预见的情况下(即每一个决策结)上选择什么行动,即使这种情况实际上没有发生(甚至参与人并不预期它会发生)。n因此,只有当一个战略规定的行动规则在所有可能的情况下都是最优的,它才是一个合理的可置信的战略,子博弈精练纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发博弈开发不开发(1,0)(-3,-3)x开发(0,1)(0,0)x子博弈I子博弈II完全信息动态博弈-子博弈精练纳什

12、均衡泽尔腾(1965)不开发不开发bca完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n序贯理性:指不论过去发生了什么,参与人应该在博弈的每一个时点上最优化自己的决策。n子博弈精炼纳什均衡要求所有参与者都是序贯理性的。第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题n三 应用举例用逆向归纳法求-子博弈精练纳什均衡1UDL(3,1)(0,0)22,2R 给定博弈达到最后一个决策结,该决策结上行动的参与人有一

13、个最优选择,这个最优选择即该决策结开始的子博弈的纳什均衡 倒数第二个决策结,找倒数第二个的最优选择,这个最优选择与我们在第一步找到的最优选择构成一个纳什均衡。 如此重复直到初始结。每一步都得到对应于子博弈的一个纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的子博弈的纳什均衡,这个过程的最后一步得到整个博弈的纳什均衡完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n用逆向归纳法求子博弈精练纳什均衡 对于有限完美信息博弈,逆向归纳法求解子博弈精练纳什均衡是一个最简便的方法。A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发博弈完全信息动态博弈-子博弈精

14、练纳什均衡泽尔腾(1965)1UDL(1,1)22,0RU(3,0)(0,2)1D 子博弈精练纳什均衡(U,U),L). U和L分别是参与人1和参与人2在非均衡路径上的选择。 逆向归纳法求解子博弈精练纳什均衡的过程,实质上是重复剔除劣战略的过程:从最后一个决策结依次剔除每个子博弈的劣战略,最后生存下来的战略构成精练纳什均衡。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n用逆向归纳法求解的子博弈精练纳什均衡要求“所有的参与人是理性的”是共同知识。n如果博弈由多个阶段组成,则从逆向归纳法得到的均衡可能并不非常令人信服。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)进入者进入不进入

15、(0,300)在位者市场进入阻挠博弈树不可置信威胁支付函数行动合作(40,50)斗争(-10,0)完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)n练习练习: :n参与人1(丈夫)和参与人2(妻子)必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性军委50%,支付函数为:如果只有一人带伞,下雨时带伞者的效用为-2.5,不带伞者的效用为-3不下雨时带伞的效用为-1,不带的效用为0;如两人都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给出下列四种情况下的扩展式及战略式表述:(1)两人出门前都不知道是否会下雨;并且两人同时决定是否带伞(即每一方在决策时都不知道对方的决策);(

16、2)两人在出门前都不知道是否会下雨,但丈夫先决策,妻子观察到丈夫是否带伞后才决定自己是否带伞;(3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策,妻子后决策;(4),同(3),但妻子先决策,丈夫后决策.第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题n三 应用举例承诺行动与子博弈精练纳什均衡n承诺行动与子博弈精练纳什均衡n有些战略之所以不是精练纳什均衡,是因为它包含了不可置信的威胁战略,如果参与人能在博弈

17、之前采取某种行动改变自己的行动空间或支付函数,原来不可置信威胁将变得可置信,博弈的精练纳什均衡也会随之改变.n这些改变博弈结果而采取的措施称为承诺行动.n完全承诺:承诺可以使某项行动完全没有可能(破釜沉舟).n不完全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没有可能.承诺行动与子博弈精练纳什均衡 曹操与袁绍的仓亭之战,曹操召集将领来献破袁之策,程昱献了十面埋伏之计,他让曹操退军河上,诱袁前来追击,到那时“我军无退路,必将死战,可退袁矣”。 曹操采纳此计,令许褚诱袁军军至河上,曹军无退路,操大呼曰:“前无去路,诸军何不死战!”,众军奋力回头反击,袁军大败。承诺行动与子博弈精练纳什均衡A

18、开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发博弈 如果在A决策之前,B与某客户签定了一个合同,规定B若不在特定时期内开发若干面积的写字楼,则将支付违约金3.5,这个合同就是承诺行动.(1,-3.5)承诺行动与子博弈精练纳什均衡P不指控指控PP起诉拒绝接受放弃(a) rxs: rxsrx+d(s-c-p, -s)(rx-c-p, -rx-d)要求sD(-p, 0)(-c, 0)(-c-p, 0)要胁诉讼博弈要胁诉讼博弈承诺行动与子博弈精练纳什均衡P不指控指控PP起诉拒绝接受放弃(c) 赔偿区域赔偿区域rxsc+p成立,rx+(d-y)/2c+p的条件也可

19、能不满足,从而原告将不会指控。 参与人为承诺行动支付的成本称为积淀成本。 有些承诺行动可通过“先下手为强”的办法得到斯坦伯格模型。第二章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题多个参与人的情况蜈蚣博弈n四 重复博弈和无名氏定理n五 应用举例第二章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均

20、衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题多个参与人的情况蜈蚣博弈n四 重复博弈和无名氏定理n五 应用举例逆向归纳法与子搏弈精练纳什均衡的存在问题1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A 逆向归纳法要求“所有参与人是理性的”是所有参与人的共同知识。因此,在有多个参与人有多个参与人或每个参与人有每个参与人有多次行动机会多次行动机会的情况下,逆向归纳法的结果可能并非如此。 如果n很大,逆向归纳法所得子博弈精炼纳什均衡就很值得怀疑.(2,2)如果如果n很小,逆向很小,逆向归纳法的结果归纳法的结果逆向归纳法与子搏弈精练纳什均衡

21、的存在问题n如果n很大,结果又如何呢?1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A多个参与人的情况多个参与人的情况(2,2)如果如果n很大很大 对于参与人1,获得2单位支付前提是所有n-1个参与人都选A,否则就要考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p1,所有n-1个参与人选择A的概率是pn-1,如果n很大,这个值就很小; 另外,即使参与人1确信所有n-1个参与人都选A,他也可能怀疑是否第2个参与人相信所有n-2个参与人都选A。 这个链越长,共同知识的要求就越难满足。第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题多个参与人的情况蜈蚣博弈n四 重复博弈和无名氏定理n五 应用举例逆向归纳法与子搏弈精练纳什均衡的存在问题1D(1,0)A2D(0,2)A2D(0,N)A(N-2,N-1)A1D(N-1,0)A逆向归纳法的结果:逆向归纳法的结果:一开始,就结束!一开始,就结束!1D(3,0)A2D(0,4)A每个参与人有多个行动机会的蜈蚣博弈每个参与人有多个行动机会的蜈蚣博弈 1、2进行游戏决策,如果1在第一轮决策,得1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论