完全信息动态博弈.ppt_第1页
完全信息动态博弈.ppt_第2页
完全信息动态博弈.ppt_第3页
完全信息动态博弈.ppt_第4页
完全信息动态博弈.ppt_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,2.3完全信息动态博弈,本节内容:一个博弈扩展表达式,两个博弈完美纳什均衡,三个应用实例,2,博弈的战略表达式,案例-房地产开发项目-假设有两个开发商,A和B,其市场需求可能大或小:1亿,并假设有两个建筑在市场上出售:当需求大时,每栋建筑售价1.4亿,当需求小时,价格为7000万。如果市场上只有一栋需求很大的建筑,它可以卖1.8亿小时和1.1亿小时。3.游戏策略表达,不开发,开发者甲,开发,不开发,不开发,开发者乙,开发者甲,开发,不开发,开发者乙,小需求,大需求,游戏策略表达,4。游戏扩展表达“扩展”主要是参与者的战略空间。战略表达只是给参与者一些可供选择的策略,而扩展表达应该对每个策略

2、进行动态描述:谁在什么时候行动,每次选择什么具体的行动计划,以及此时应该知道什么策略:如果你这样做了,我会怎么做?5.游戏的扩展表达,元素:参与者的集合,参与者的动作序列,参与者的动作空间,参与者的信息集合,参与者的支付函数,外生事件的概率分布(即“自然”选择),6、A,发展,不发展,N,N,大发展,不发展,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),参与者收集参与者的动作顺序,参与者的动作空间,参与者的信息集合。决策节点是参与者行动的起点,而终点是决策者行动的终点。满足传递性和不对称性的X前所有节点的集合称为X的前集合P(x),X后所有

3、节点的集合称为X的后集合T(x).分支:是从决策节点到其直接后继者的连接线,每个分支代表参与者的动作选择。信息集:每个信息集是决策节点集的子集,它包括满足以下条件的所有决策节点:1。每个决策节点都是同一参与者的决策节点;2.参与者知道游戏进入集合的某个决策节点,但不知道他在哪个决策节点。7.信息集:房地产游戏二,B在做决策时并不确切知道自然选择;B的决策节点从4改为2,8,信息集:房地产游戏三,B知道自然选择;但是我不知道A的选择(或者A和B同时做决定)。9.信息设置:房地产游戏四、10。游戏的扩展表达式,信息集只包含一个决策节点,称为单节点信息集。如果游戏树中的所有信息都是单节点的,这个游戏

4、就叫做完美信息游戏。自然总是被假定为单结的,因为参与者决定之后的自然行为相当于参与者之前的自然行为,但是参与者不能观察自然的行为。不同的游戏树可以代表同一个游戏,但是有一个基本规则:参与者在做决定之前知道的东西必须出现在参与者的决定之前。11,A,B,忏悔,否认,B,B,A,忏悔,否认,忏悔,否认,(-8,-8),(0,-10),等待,小猪,大猪,新闻,等待,新闻,案例2-智能猪游戏,13,动态游戏策略的表达,策略:参与者在给定的信息集下选择行动的规则,它规定了参与者在什么情况下选择什么行动,是他们的“相机行动计划”。在静态游戏中,策略和行动是相同的。作为行动规则,战略必须是完整的。14,性别

5、战争游戏的扩展表达,15,游戏策略的扩展表达,足球,男人的策略:足球,芭蕾选择足球;或者选择芭蕾。女性策略:(足球,芭蕾),(芭蕾,足球),(足球,足球)1。遵循策略:无论他选择什么,我都会选择2。对抗策略:无论他选择什么,我都不会选择什么3。芭蕾策略:不管他选择什么,我都会选择芭蕾;4.足球策略:不管他选择什么,我都会选择足球。战略是一个相机行动计划,如果他选择了什么,我会采取行动。在扩展游戏中,玩家根据摄像机行动,也就是说,他们等待游戏到达他们自己的信息集(包括一个或多个决策节点),然后采取行动计划。16,博弈纳什均衡的扩展表达式,如果甲先行动,乙在知道甲的行动后行动,甲有一个信息集,两个

6、可选行动,战略空间为:(发展,不发展);B有两个信息集,四个可选动作,B有四个纯策略:发展策略:不管A是否发展,我都发展;跟进策略:甲培养我,甲不培养我;对抗战略:我不发展的发展,我不发展的发展;没有发展战略,不管A是否发展,我都不发展,简称为:(发展,发展,不发展),(不发展,发展),(不发展,不发展)。括号中的第一个元素对应于A选择“开发”时B的选择,第二个元素对应于A选择“不开发”时B的选择。玩家的策略是什么?17,扩张,发展,发展,没有发展,没有发展,没有发展,没有发展,没有发展,没有发展,没有发展,开发者B,开发者A,战略,路径在扩张游戏中,所有N个玩家的纯战略组合决定了游戏树上的一

7、条路径。(发展,不发展,发展)决定游戏的路径:A发展B不发展-(1,0)(不发展,发展,发展)决定游戏的路径:在课堂练习:中,参与者1(丈夫)和参与者2(妻子)必须独立决定外出时是否带伞。他们知道下雨和不下雨的概率是50%,支付函数是:如果只有一个人带伞,下雨时带伞的人的效用是-2.5,不带伞的人的效用是-3;不下雨时,带伞的效用为-1,不带伞的效用为0;如果两个人都不带雨伞,下雨时每个人的效用是-5,不下雨时每个人的效用是1;给出了以下四种情况下的扩展表达式和策略表达式。他们俩都不知道出门前会不会下雨;两者同时决定是否带伞(也就是说,双方在做决定时不知道对方的决定);(2)两人都不知道出门前

8、是否会下雨,但丈夫先做决定,妻子先观察丈夫是否带伞,再决定是否带伞;(3)丈夫知道出门前是否会下雨,但妻子不知道,但丈夫先做决定,妻子再做决定;(4)与(3)相同,但妻子先做决定,丈夫再做决定。19岁。完全信息动态博弈子博弈完美纳什均衡泽尔腾(1965),考虑到以下问题:一个博弈可能有多个(甚至无限个)纳什均衡,哪一个更合理?纳什均衡假设每个参与者在选择自己的最优策略时都假设所有其他参与者的策略都是给定的。然而,如果参与者的行动先来后到,后一个参与者的选择空间取决于前一个参与者的选择,前一个参与者不能不考虑他自己的行动对后一个参与者的影响而选择。子博弈中完美纳什均衡的一个重要改进是将“理性纳什

9、均衡”与“非理性纳什均衡”分开。20,完全信息动态博弈子博弈完美纳什均衡(例如),策尔登(1965),进入者,进入者,非进入者(0,300),在职者,合作者(40,50),挣扎者(-10,0),市场进入阻塞博弈承诺行动破釜沉舟最后的立场给定进入者的进入,淘汰(进入,挣扎),(进入,默许)是唯一的子博弈完美纳什均衡,不可思议的威胁,支付功能,行动,21,子博弈完美纳什均衡,一个纳什均衡被称为完美纳什均衡完美的纳什均衡首先必须是纳什均衡,但它不一定是完美的纳什均衡。承诺行动-各方使其威胁策略可信的行动。22,完全信息动态博弈-子博弈完美纳什均衡Zelten (1965),Zelten引入子博弈完美

10、纳什均衡的概念,以从均衡中消除不可思议威胁策略的纳什均衡,从而给出动态博弈的合理预测结果。简而言之,子博弈完美纳什均衡要求均衡策略的行为规则在每个信息集中都是最优的。23岁的美国普林斯顿大学的古尔教授在1997年发表了一篇经济学视角的文章,并提出了一个例子来说明威胁的可信度:两个兄弟总是为玩具争吵,哥哥总是想抢他弟弟的玩具,不耐烦的父亲宣布了一个政策:好好玩,不要打扰我,不管你们中的哪一个向我抱怨,我都会把你们俩关起来,这比没有玩具更可怕。现在,我哥哥抢走了我哥哥的玩具来玩。我哥哥别无选择,只能说:快把我的玩具还给我,否则我就告诉我爸爸。哥哥想,你真的想告诉爸爸,我要倒霉了,但是你不要抱怨,但

11、是没有玩具可以玩,但是如果你告诉爸爸,你会被禁足,而抱怨会让你的情况变得更糟,所以你不会告诉爸爸,所以我哥哥无视他哥哥的警告。的确,如果弟弟是一个能计算自己利益的理性人,在这样的环境下,最好不要抱怨。可以看出,弟弟是一个理性的人,他抱怨的威胁令人难以置信。24,子博弈中的完美纳什均衡,A,发展,不发展,B,B,发展,不发展,发展,(-3,-3),(1,0),(0,1),(0,0),不发展,子博弈中完全纳什均衡的结果是:甲选择发展,乙选择不发展。x,x,代表(不发展,(发展,发展),这种组合构成纳什均衡的原因是因为B威胁到A是否发展,他就会选择发展,A相信B的威胁,而不发展是最好的选择,但是A为

12、什么要相信B的威胁呢?毕竟,如果甲真的开发了,乙选择开发-3而不是开发0,所以乙的最佳选择是不开发。如果甲知道乙是理性的,甲会选择发展,并迫使乙选择不发展。我得到1,B得到0,也就是说,纳什均衡(不发展,(发展,发展)是难以置信的。因为它依赖于来自英国的不可思议的威胁。同样,(没有发展,就没有发展)也是不可思议的威胁,纳什均衡(发展,(没有发展,就没有发展)是不合理的。25,子博弈的完美纳什均衡。泽尔腾引入子博弈的完美纳什均衡概念,旨在从均衡中消除不可置信威胁策略的纳什均衡,从而给出一个合理的动态博弈预测结果。简而言之,子博弈的完美纳什均衡要求均衡策略的行为规则在每个信息集中都是最优的。什么是

13、子博弈,子博弈的完美纳什均衡是什么?在子博弈中有更好的方法找到完美的纳什均衡吗?26,子博弈由一个决策节点x和所有后续节点T(x)(包括末端节点)组成,这满足以下条件:(1)x是单个节点信息集;(2)子游戏不改变原始游戏的信息集和支付向量。子游戏说子游戏必须从单个结信息集开始。即:(1)当且仅当决策者确切地知道游戏已经进入原始游戏中的特定决策节点时,决策节点可以用作子游戏的开始。(2)如果一个信息集包含两个以上的决策节点,它们都不能作为子游戏的初始节点。条件2表示子游戏的信息集和支付向量是直接从原始游戏继承而来的,不会有任何改变。这意味着子游戏不能分割原始游戏的信息集。,27,完全信息动态博弈

14、子博弈完美纳什均衡Zelten (1965),无开发,无开发,房地产开发博弈,找出房地产开发博弈的子博弈,(无开发,(开发,开发),(开发,(无开发,开发),(开发,(无开发,无开发),28,(2)它给出了每个子博弈的纳什均衡。29,a,开发,不开发,B,B,开发,不开发,开发,(1,0),(0,1),(0,0),(-3,-3),x,x,房地产开发博弈B和C都在B上构成均衡,但在C上不构成均衡,完全信息动态博弈子博弈完美纳什均衡Zelten (1965),不开发,判断以下哪一个均衡结果构成子博弈完美纳什均衡?不开发,B,c,30,子博弈精炼纳什均衡,可信度子博弈和逆向归纳子博弈精炼纳什均衡的应

15、用例子是两阶段同时选择的动态博弈,31,可信度:黄金开采博弈,A在开采一个价值4万元的金矿时缺少1万元的资金,而B只有1万元的资金投入。甲方希望乙方能借给自己10000元用于采矿,并承诺在收金后与乙方平分。乙方应该借钱给甲方吗?32,(1,0),33,(2)有法律保障的游戏,34,逆向归纳法,逆向归纳法是从最后阶段或最后子游戏中解决动态游戏的一种方法。35岁,36岁。逆向归纳法求解子博弈的完美纳什均衡也要求“所有参与者都是理性的”是常识。如果游戏由多个阶段组成,通过逆向归纳获得的均衡可能不太令人信服。37,子博弈精炼纳什均衡,和扩展博弈的战略组合s *=(S1 *,si *,sn *)是子博弈

16、精炼纳什均衡,如果:(1)它是原博弈的纳什均衡;(2)给出了每个子博弈的纳什均衡。一个战略组合是一个子游戏精炼纳什均衡,只有当它在每个子游戏中构成纳什均衡,38。子博弈精炼纳什均衡应用实例,斯塔克尔伯格寡头垄断模型,劳资谈判博弈,39。Stackelberg寡头垄断模型中,一个市场中只有两个企业,它们的行为是选择产出,但它们的行为有顺序。企业1(领导者)首先选择输出q10;企业2(跟随者)观察q1,然后选择自己的输出q20。给定Qq1 q2的总产出,两个企业具有相同的不变单位成本c0,并且需求函数P(Q)=a-Q=a-(q1 q2)。问:两个企业应该如何决策?40、库诺模型的均衡结果是Q1 *=Q2 *=1/3(A-C)Q1 * Q2 *=2/3(A-C)1 *=2 *=1/9(A-C)2,而勋伯格模型的均衡结果是Q1 *=工会不仅追求高工资,而且希望拥有大量员工。我不喜欢高工资和高失业率,也不喜欢低工资和低失业率。工会的效用是工资水平和雇员人数的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论