博弈论第四章完全且完美信息动态博弈ppt课件

上传人：陈*** IP属地：广东上传时间：2022-02-03 格式：PPT 页数：106 大小：1.31MB 积分：22 举报 版权申诉

已阅读5页，还剩101页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第四章第四章完全且完美信息动态博弈完全且完美信息动态博弈本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。完全且完美信息动态博弈的主要特点（1行动是顺序发生的，行动是顺序发生的，（2下一步行动选择之前，所有以前的行动都下一步行动选择之前，所有以前的行动都可以被观察到，可以被观察到，（3每个可能的行动组

2、合下局中人的收益是共每个可能的行动组合下局中人的收益是共同知识。同知识。第三章完全且完美信息动态博弈n一博弈扩展式表述n二子博弈完美纳什均衡n三、用逆向归纳法求-子博弈完美纳什均衡n四、完全且完美信息的动态博弈的案例一博弈扩展式表述（一博弈的标准式或战略式、正则式或策略式）女足球芭蕾男足球2，10，0芭蕾0，01，2博弈的标准式战略式）博弈的标准式战略式）40004000，4000400080008000，0 00 0，800080000 0，0 0不开发开发商A开发不开发开发-3000-3000，-3000-300010001000，0 00 0，100010000 0，0 0不开发

3、开发商B开发商A开发不开发开发开发商B需求小的情况需求小的情况需求大的情况需求大的情况（二博弈扩展式表述（二博弈扩展式表述u博弈的扩展式表述包括四个要素博弈的扩展式表述包括四个要素: :u参与人集合参与人集合PlayerPlayer）u每个参与人的战略集合每个参与人的战略集合StrategyStrategy）u博弈的顺序博弈的顺序OrderOrder）u由战略组合决定的每个参与人的支付由战略组合决定的每个参与人的支付PayoffPayoff）扩展式表示的一个例子博弈树始于局中人1 的一个决策结点，这时1要从L和R中作出选择，如果局中人1选择L，其后就到达局中人2 的一个决策结点，这时，局

4、中人2要从L和R中作出选择。类似地，如果局中人1选择R，则将到达局中人2的另一个决策结点。这时局中人2从L和R中选择行动。无论局中人2选择了哪一个，都将到达终结点 (即博弈结束)且两局中人分别得到相应终点节下面的收益。 A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)参与人(A,B,N)战略支付参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布房地产开发博弈结,决策结结,终点结枝结,初始结信息集横向扩展式举例：横向扩展式举

5、例：进入者进入不进入0，300）在位者市场进入阻挠博弈树协作40，50）斗争（-10，0）扩展型扩展型为了让“树描绘博弈，其结点和枝需要满足三条性质： 1单一的出发点。重要的是知道博弈从何处开始，所以必须有一个，也只能有一个出发点。2 无循环。重要的是在博弈运行中，我们不要陷入僵局；树枝循原路折回并造成一个循环一定是不可接受的。3 单方向前进。重要的是，对于博弈如何进行下去不能模棱两可，因此，必定不存在二个或多个枝导向同一个结。为保证这三条性质，在前结点上强加下述限为保证这三条性质，在前结点上强加下述限制：制： 1结点不能是自身的前结点。2前结点的前结点也是前结点：如果结点是的前结点，依次结

6、点是的前结点，那么也是的前结点。3前结点可以排序：假设和都是的前结点，必定是或者是的前结点，或者反过来。4必定存在一个共同的前结点：考虑任意两个结，和，它们之间没有一个是另一个的前结点。那么，必定存在一个结点，它是和双方的前结点。动态博弈的动态博弈的战略战略动态博弈的战略的表述动态博弈的战略的表述战略：参与人在给定信息集的情况下选择行动的规则，它规定参战略：参与人在给定信息集的情况下选择行动的规则，它规定参与人在什么情况下选择什么行动，是参与人的与人在什么情况下选择什么行动，是参与人的“相机行动方案相机行动方案”。个人选择的战略表示第）称为一个战略组合，（维向量战略，个参与人每人选择一个如果

7、战略集合个参与人所有可选择的代表第个参与人的特定战略表示第issssssnnisSisiniiii21在静态博弈中，战略和行动是相同的。作为一种行动规则，战略必须是完备的。足球男足球芭蕾女女芭蕾足球芭蕾(2,1)(0，0)（1，2)(0,0)xxBattle of Sexes if Boy moves first足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx男的策略：足球，芭蕾选择足球；还是选择芭蕾。女的策略：（足球，芭蕾），（芭蕾，足球）（芭蕾，芭蕾），（足球，足球）1、追随策略：他选择什么，我就选择什么2、对抗策略：他选择什么，我就偏不选什么3、芭蕾策略：不

8、管他选什么，我都选芭蕾；4、足球策略：不管他选什么，我都选足球。策略即：如果他选择什么，我就怎样行动的相机行动方案。在扩展式博弈里，参与人是相机行事，即“等待博弈到达一个自己的信息集包含一个或多个决策结后，再采取行动方案。Battle of Sexes if Boy moves first可以写成标准式可以写成标准式(战略式战略式)-3, -3-3, -31, 01, 00, 10, 00, 10, 0足球,足球足球,芭蕾芭蕾, 足球芭蕾,足球足球芭蕾wifewifehusbandhusband标准式标准式(战略式战略式)The strategy combinations.248( B, B,

9、 B ),？在在8个图里找纳什均衡个图里找纳什均衡Of 8 strategy combination, 3 are Nash Three Nash equilibria of Battle of Sexes are: ( B, B, B ), ( S, S, S ), and ( S, B, S );Their corresponding outcomes are all: ( Ballet, Ballet ), ( Soccer, Soccer ), and ( Soccer, Soccer ).BBBSSSBBBSSSBBBSSS不同的纳什均衡可以对应相同的结果一个动态博弈可能有多个甚至无

10、穷多个纳一个动态博弈可能有多个甚至无穷多个纳什均衡，究竟哪个更合理？什均衡，究竟哪个更合理？子博弈完美纳什均衡子博弈完美纳什均衡- -不可置信威胁不可置信威胁l美国普林斯顿大学古尔教授在美国普林斯顿大学古尔教授在20192019年的年的里发表文章，提出一个例子说明威胁的可信性问题：里发表文章，提出一个例子说明威胁的可信性问题：l两兄弟老是为玩具吵架，哥哥老是要抢弟弟的玩具。两兄弟老是为玩具吵架，哥哥老是要抢弟弟的玩具。l不耐烦的父亲宣布政策：好好去玩，不要吵我，不管你们谁向我告状，我都把你们两个关起来，关起来比不耐烦的父亲宣布政策：好好去玩，不要吵我，不管你们谁向我告状，我都把你们两个关起来

11、，关起来比没有玩具更可怕。没有玩具更可怕。l如今，哥哥又把弟弟的玩具抢去玩了，弟弟没有办法，只好说：快把玩具还我，不然我就要去告诉爸爸。如今，哥哥又把弟弟的玩具抢去玩了，弟弟没有办法，只好说：快把玩具还我，不然我就要去告诉爸爸。哥哥想，你真要告诉爸爸，我是要倒霉的，可是你不告状不过没有玩具玩，而告了状却要被关禁闭，告状哥哥想，你真要告诉爸爸，我是要倒霉的，可是你不告状不过没有玩具玩，而告了状却要被关禁闭，告状会使你的境遇变得更坏，所以你不会告状，因此哥哥对弟弟的警告置之不理。会使你的境遇变得更坏，所以你不会告状，因此哥哥对弟弟的警告置之不理。l确实，如果弟弟是会算计自己利益的理性人，在这样的环

12、境下，还是不告状的好。可见，弟弟是理性人，确实，如果弟弟是会算计自己利益的理性人，在这样的环境下，还是不告状的好。可见，弟弟是理性人，他的告状威胁是不可置信的。他的告状威胁是不可置信的。完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾泽尔腾1965）l考虑下列问题：考虑下列问题：l一个博弈可能有多个甚至无穷多个纳什均衡，究竟哪个更合一个博弈可能有多个甚至无穷多个纳什均衡，究竟哪个更合理？理？l纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的，但是如果参与人的行动有先有后，后他参与人

13、的战略是给定的，但是如果参与人的行动有先有后，后行动者的选择空间依赖于前行动者的选择，前行动者在选择时不行动者的选择空间依赖于前行动者的选择，前行动者在选择时不可能不考虑自己的行动对后行动者的影响。可能不考虑自己的行动对后行动者的影响。l子博弈完美纳什均衡的一个重要改进是将子博弈完美纳什均衡的一个重要改进是将“合理纳什均衡合理纳什均衡与与“不合理纳什均衡不合理纳什均衡分开。分开。二、子博弈精炼纳什均衡或子二、子博弈精炼纳什均衡或子博弈完美纳什均衡）博弈完美纳什均衡）l一个纳什均衡称为精炼纳什均衡，当只当参与人的战略在每个子博弈中都构成纳什均衡，也就是说，组成完美纳什均衡的战略必须在每一个子博弈

14、中都是最优的。l一个精炼纳什均衡首先必须是一个纳什均衡，但纳什均衡不一定是精炼纳什均衡。l承诺行动-当事人使自己的威胁战略变得可置信的行动。子博弈完美纳什均衡子博弈完美纳什均衡l泽尔腾引入子博弈完美纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除，从而给出动态博弈的一个合理的预测结果，简单说，子博弈完美纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。l什么是子博弈，什么是子博弈完美纳什均衡？l有没有更好的方法找到子博弈完美纳什均衡？完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾泽尔腾1965）l子博弈? Think of a branch

15、 of a tree as a (smaller) tree.If a branch of a tree representing a game does not divide any information set of the game, then it is a subgame of the game. l王 P175 什么是“支”？不开发A开发不开发BB开发不开发开发(1，0)（0，1)(0,0)(-3,-3)xx房地产开发博弈找出房地产开发博弈的子博弈找出房地产开发博弈的子博弈开发不开发(1，0)(-3,-3)x开发（0，1)(0,0)x子博弈I子博弈IIA开发不开发BB开发不开发开

16、发(1，0)（0，1)(0,0)(-3,-3)xx子博弈动态博弈中的子博弈l虚线框出的部分正是博弈方2在博弈方1选择进时所面临的决策问题，它本身构成博弈方2的一个单人博弈，我们称它为原先来后到博弈的一个“子博弈”。Game and subgames子博弈未标完）子博弈未标完）子博弈定义子博弈定义由一个动态博弈第一阶段以外的某个阶段开始的后续博弈阶段构成，它必须有初始信息集，具备进行博弈所需要的各种信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个“子博弈”。l子博弈不好找！l学完后面的信息集请看P177信息集信息集为了扩展式表述也可用来表述静态博弈，我们为了扩展式表述也可用来表述

17、静态博弈，我们使用虚线圈。如：使用虚线圈。如：情爱博弈的扩展式表述情爱博弈的扩展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xxA开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B在决策时不确切地知道自然的选择; B的决策结由4个变为2个房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8

18、,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的选择;但不知道A的选择(或A、B同时决策) 房地产开发博弈Battle of Sexes againif Boy moves firstBoyGirlBalletBalletBalletSoccerSoccerSoccer( 1, 2)( -1, -1)( 0, 0)( 2, 1)Represent Battle of Sexes as a simultaneous-move game with a tree Information setsBoyGirlBalletBalletBalletSoccerSocc

19、erSoccer( 1, 2)( -1, -1)( 0, 0)( 2, 1)博弈树的结构博弈树的结构包括决策结和终点结。决策结是参包括决策结和终点结。决策结是参与人采取行动的时点；终点结是博与人采取行动的时点；终点结是博弈行动路径的终点。弈行动路径的终点。枝是从一个决策结到它的直接后续枝是从一个决策结到它的直接后续结的连线，每一个枝代表参与人的结的连线，每一个枝代表参与人的一个行动选择。一个行动选择。一个信息集是决策结集合的一个子集一个信息集是决策结集合的一个子集(信息集信息集是由决策结构成的集合是由决策结构成的集合)，该子集包括所有满，该子集包括所有满足下列条件的决策结：足下列条件的决策结：

20、(1)每一个决策结都是同一个参与人的决策结每一个决策结都是同一个参与人的决策结(2)该参与人知道博弈进入该集合的某个决策该参与人知道博弈进入该集合的某个决策结，但不知道自己究竟处于哪一个决策结。结，但不知道自己究竟处于哪一个决策结。l错误信息集示例见书166.l1、一个信息集罩住的首先必须是同一个局中人的决策节点。l2、一个信息集罩住的必须是同一个局中人在同一个时点的决策节点。l3、3、Same-set-same-strategies principle:At any decision node belonging to a specific information set, the play

21、er has same strategies/actions to choose.Thus, no games like this:2.1 博弈的扩展式表述如果博弈树的所有信息集都是单结的，如果博弈树的所有信息集都是单结的，则称为则称为“完美信息博弈完美信息博弈”，没有任何两，没有任何两个决策结是用虚线连起来的个决策结是用虚线连起来的自然信息集总是假设为单结的自然信息集总是假设为单结的博弈树上是否出现连接不同决策结的虚博弈树上是否出现连接不同决策结的虚线取决于如何划决策结的顺序线取决于如何划决策结的顺序有了信息集的概念，扩展式表述也可用有了信息集的概念，扩展式表述也可用来表述静态博弈来

22、表述静态博弈完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾泽尔腾1965）l子博弈：是原博弈的一部分，它本身也可以作为一个独立的博弈进行分析：l（1子博弈必须从一个单结信息点开始：只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时，该决策结才能作为一个子博弈的初始结。如果信息集包含两个以上的决策结，则这两个都不可以作为子博弈的初始结见下页）。l（2子博弈的信息集和支付向量都直接继承自原博弈，即当x和x在原博弈中属于同一信息集时，他们在子博弈中才属于同一信息集。l习惯上，任何博弈的本身称为自身的一个子博弈。l书上的定义175：l1S的博弈树是T的博弈树的一支什

23、么是支？见175）；l2博弈S不能分割博弈T的信息集，具体说，质押博弈T的某个信息集的任何一个决策节点是博弈S的一个决策节点，那么T的这个信息集的每一个决策节点都必须是博弈S的决策节点。l3） lP177l图表514A开发不开发XX大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 参与人X的信息集不能开始一个子博弈，否则的话，参与人B的信息将被切割。完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾泽尔腾1965）l子博弈完美纳什均衡：l 扩展式博弈的战

24、略组合是一个子博弈完美纳什均衡，假设:l（1它是原博弈的纳什均衡；l（2它在每一个子博弈上给出纳什均衡。BBBSSSBBBSSSBBBSSSRestricted to the circled subgames, the Nash are unstable.Thus there is only one subgame-perfect equilibrium.A开发不开发BB开发不开发开发(1，0)（0，1)(0,0)(-3,-3)xx房地产开发博弈开发不开发(1，0)(-3,-3)x开发（0，1)(0,0)x子博弈I子博弈II(不开发，（开发，开发），（开发，（不开发，开发），（开发，（不开发，

25、不开发）在c上构成均衡，在b上不构成；在b和c上都构成在c上构成均衡，在b上不构成完全信息动态博弈-子博弈完美纳什均衡泽尔腾1965）不开发判断下列均衡结果哪个构成子博弈完美纳什均衡？不开发bc完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾泽尔腾1965）l如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，这条路径称为“均衡路径”，博弈树上的其他路径称为“非均衡路径”。l纳什均衡只要求均衡战略在均衡路径的决策结上是最优的；l而构成子博弈完美纳什均衡不仅要求在均衡路径上策略是最优的，而且在非均衡路径上的决策结上也是最优的。这是纳什均衡

26、与子博弈完美纳什均衡的实质区别。BBBSSSBBBSSSBBBSSSRestricted to the circled subgames, the Nash are unstable.Thus there is only one subgame-perfect equilibrium.完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾泽尔腾1965）l战略是参与人行动规则的完备描述，它要告诉参与人在每一种可预见的情况下即每一个决策结上选择什么行动，即使这种情况实际上没有发生甚至参与人并不预期它会发生）。l因此，只有当一个战略规定的行动规则在所有可能的情况下都是最优的，

27、它才是一个合理的可置信的战略，子博弈完美纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾泽尔腾1965）l练习练习: :l参与人参与人1 1丈夫和参与人丈夫和参与人2 2妻子必须独立决定出门时是否带伞。妻子必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性均为他们知道下雨和不下雨的可能性均为50%50%，支付函数为：如果只有一人，支付函数为：如果只有一人带伞，下雨时带伞者的效用为带伞，下雨时带伞者的效用为-2.5-2.5，不带伞者的效用为，不带伞者的效用为-3-3不下雨时带不下雨时带伞

28、的效用为伞的效用为-1,-1,不带的效用为不带的效用为0;0;如两人都不带伞如两人都不带伞, ,下雨时每人的效用为下雨时每人的效用为- -5,5,不下雨时每人的效用为不下雨时每人的效用为1;1;给出下列四种情况下的扩展式及战略式表给出下列四种情况下的扩展式及战略式表述述: :l(1)(1)两人出门前都不知道是否会下雨两人出门前都不知道是否会下雨; ;并且两人同时决定是否带伞并且两人同时决定是否带伞( (即每即每一方在决策时都不知道对方的决策一方在决策时都不知道对方的决策););l(2)(2)两人在出门前都不知道是否会下雨两人在出门前都不知道是否会下雨, ,但丈夫先决策，妻子观察到丈但丈夫先决策

29、，妻子观察到丈夫是否带伞后才决定自己是否带伞夫是否带伞后才决定自己是否带伞; ;l(3)(3)丈夫出门前知道是否会下雨丈夫出门前知道是否会下雨, ,但妻子不知道，但丈夫先决策，妻子但妻子不知道，但丈夫先决策，妻子后决策后决策; ;l(4),(4),同同(3),(3),但妻子先决策，丈夫后决策但妻子先决策，丈夫后决策. .三、用逆向归纳法求三、用逆向归纳法求-子博弈完美纳子博弈完美纳什均衡什均衡微软公司的入门考试题微软公司的入门考试题l强盗分赃向前展望，倒后推理）强盗分赃向前展望，倒后推理）l有有5 5个强盗抢得个强盗抢得100100枚金币，在如何分赃上争论枚金币，在如何分赃上争论不休，于是他们

30、决定：不休，于是他们决定：l（1 1抽签决定个人的号码抽签决定个人的号码1 1，2 2，3 3，4 4，5 5）l（2 2由由1 1号提出分配方案，然后号提出分配方案，然后5 5人表决，如人表决，如果方案超过半数同意就通过，否则他被扔进大果方案超过半数同意就通过，否则他被扔进大海喂鲨鱼；海喂鲨鱼；l（3 31 1号死后，号死后，2 2号提方案，号提方案，4 4人表决，当且仅人表决，当且仅当超过半数同意时方案通过，否则当超过半数同意时方案通过，否则2 2号被扔进号被扔进大海；大海；l（4 4依次类推，知道找到一个每个人都接受依次类推，知道找到一个每个人都接受的方案当然，如果只剩的方案当然，如果只

31、剩5 5号，他独吞）号，他独吞）l结果会如何？结果会如何？强盗1234501001000098011970120强盗1234501001000098011970120970102三、用逆向归纳法求三、用逆向归纳法求-子博弈完美纳什均衡子博弈完美纳什均衡1UDL（3，1)(0,0)22，2R三、用逆向归纳法求三、用逆向归纳法求-子博弈完美纳什均衡子博弈完美纳什均衡1UDL（3，1)(0,0)22，2R 给定博弈达到最后一个决策结，该决策结上行动的参与人有一个最优选择，这个最优选择即该决策结开始的子博弈的纳什均衡倒数第二个决策结，找倒数第二个的最优选择，这个最优选择与我们在第一步找到的最优选择构

32、成一个纳什均衡。如此重复直到初始结。每一步都得到对应于子博弈的一个纳什均衡，并且根据定义，该纳什均衡一定是该子博弈的子博弈纳什均衡，这个过程的最后一步得到整个博弈的纳什均衡完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾泽尔腾1965）1UDL（1，1)22，0RU（3，0)(0,2)1D 子博弈完美纳什均衡子博弈完美纳什均衡（U U，UU），），L L）. . U U和和L L分别是参与人分别是参与人1 1和参与人和参与人2 2在非均衡路径上在非均衡路径上的选择。的选择。逆向归纳法求解子博弈逆向归纳法求解子博弈完美纳什均衡的过程，实质完美纳什均衡的过程，实质上

33、是重复剔除劣战略的过程：上是重复剔除劣战略的过程：从最后一个决策结依次剔除从最后一个决策结依次剔除每个子博弈的劣战略，最后每个子博弈的劣战略，最后生存下来的战略构成完美纳生存下来的战略构成完美纳什均衡。什均衡。122左右ABCD（3,1）（5,6）（4,2）（2,7）h1h12h22122左右BD（5,6）（2,7）h1h12h2212左B（5,6）h1h12完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾泽尔腾1965）l用逆向归纳法求解的子博弈完美纳什均衡也要求“所有的参与人是理性的是共同知识。l如果博弈由多个阶段组成，则从逆向归纳法得到的均衡可能并不非常令人

34、信服。1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A 逆向归纳法要求“所有参与人是理性的是所有参与人的共同知识。因此，在有多个参与人或每个参与人有多次行动机会的情况下，逆向归纳法的结果可能并非如此。多个参与人的情况多个参与人的情况（2,2)如果如果n很小，逆向很小，逆向归纳法的结果归纳法的结果逆向归纳法与子搏弈完美纳什均衡的存在问题逆向归纳法与子搏弈完美纳什均衡的存在问逆向归纳法与子搏弈完美纳什均衡的存在问题题l如果n很大，结果又如何呢？1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A多个参与人的情况多个参与人的

35、情况（2,2)如果如果n很大很大对于参与人1，获得2单位支付前提是所有n-1个参与人都选A，否则就要考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p0; (2)企业2观测到然后选择产量q2 0(3)企业1的收益由下面的利润函数给出：P(Q)l对上面的通过求极值可得：对上面的通过求极值可得：l已知q1 a-c,在前面我们分析同时行动的古诺博弈中，得出的R2(q1)和上式完全一致，两者的不同之处在于这里的R2(q1)是企业2对企业1已观测到的产量的真实反应，而在古诺的分析中， R2(q1)是企业2对假定的企业1的产量的最优反应，且企业1的产量选择是和企业2同时作出的。l 由于

36、企业1也能够像企业2一样解出企业2的最优反应，企业1就可以预测到他如选择q1，企业2将根据R2(q1)选择产量。那么在博弈的第一阶段，企业1的问题就可表示为：解得：解得：l这就是斯塔克尔贝里双头垄断博弈的逆向归纳解。这就是斯塔克尔贝里双头垄断博弈的逆向归纳解。l对斯塔科尔贝里双头垄断博弈的逆向归纳解的评价：对斯塔科尔贝里双头垄断博弈的逆向归纳解的评价：l 回顾在古诺博弈的纳什均衡中，每一企业的产量为回顾在古诺博弈的纳什均衡中，每一企业的产量为(a一一c)/3,也就是说，斯塔克尔贝里博弈中逆向归纳解的总也就是说，斯塔克尔贝里博弈中逆向归纳解的总产量产量3(a-c)/4，比古诺博弈中纳什均衡的总产

37、量，比古诺博弈中纳什均衡的总产量l2(a-c)/3要高，从而斯塔克尔贝里博弈相应的市场出清要高，从而斯塔克尔贝里博弈相应的市场出清价格就比较低。价格就比较低。l不过在斯塔克尔贝里博弈中，企业不过在斯塔克尔贝里博弈中，企业1完全可以选择古诺完全可以选择古诺均衡产量均衡产量(a一一c)/3 ，这时企业，这时企业2的最优反应同样是古诺的最优反应同样是古诺均衡的产量，也就是说在斯塔克尔贝里博弈中，企业均衡的产量，也就是说在斯塔克尔贝里博弈中，企业1完全可以使利润水平达到古诺均衡的水平，而却选择了完全可以使利润水平达到古诺均衡的水平，而却选择了其他产量，其他产量，l那么企业那么企业1在斯塔克尔贝里博弈中

38、的利润一定高于其在在斯塔克尔贝里博弈中的利润一定高于其在古诺博弈中的利润。但斯塔克尔贝里博弈中的市场出清古诺博弈中的利润。但斯塔克尔贝里博弈中的市场出清价格降低了，从而总利润水平也会下降，那么和古诺博价格降低了，从而总利润水平也会下降，那么和古诺博弈的结果相比，在斯塔克尔贝里博弈中，企业弈的结果相比，在斯塔克尔贝里博弈中，企业1利润的利润的增加必定意味着企业增加必定意味着企业2福利的恶化。福利的恶化。l 和古诺博弈相比，斯塔克尔贝里博弈中企业和古诺博弈相比，斯塔克尔贝里博弈中企业2利润水平利润水平的降低，揭示了单人决策问题和多人决策间题的一个重的降低，揭示了单人决策问题和多人决策间题的一个重要

39、不同之处。在单人决策理论中，占有更多的信息决不要不同之处。在单人决策理论中，占有更多的信息决不会对决策制定者带来不利，然而在博弈论中，了解更多会对决策制定者带来不利，然而在博弈论中，了解更多的信息的信息(或更为精确地说，是让其他参加者知道一个人或更为精确地说，是让其他参加者知道一个人掌握更多的信息掌握更多的信息)却可以让一个参与者受损。却可以让一个参与者受损。斯塔科尔贝里博弈中信息进一步的探讨斯塔科尔贝里博弈中信息进一步的探讨l 在斯塔克尔贝里博弈中，存在问题的信息是企业的产量:企业2知道q1,并且(重要的是)企业1知道企业2知道q1。为看清楚这一信息的影响，我们把上面序贯行动的博弈稍作修改，

40、假设企业1先选择q1 ，之后企业2选择q2，但事前并没有观测到q1,如果企业2确信企业1选择了它的斯塔克尔贝里产量(a-c)/2，则企业2的最优反应仍是R2 (q1)=(a-c)/4。l但是，如果企业1预测到企业2将持有这一推断并选择这一产量，企业1就会倾向于它对l(a-c)/4的最优反应的最优反应-即即3(a-c)/8而不愿去选择斯而不愿去选择斯塔克尔贝里产量塔克尔贝里产量(a-c)/2，那么企业，那么企业2就不会相信企就不会相信企业业1选择了斯塔克尔贝里产量。从而这一修改过的选择了斯塔克尔贝里产量。从而这一修改过的序贯行动博弈的惟一纳什均衡，对两个企业都是选序贯行动博弈的惟一纳什均衡，对两

41、个企业都是选择产量择产量(a-c)/3.-这正是古诺博弈中的纳什均衡，这正是古诺博弈中的纳什均衡，其中企业是同时行动的。其中企业是同时行动的。2 2、里昂惕夫的工会模型、里昂惕夫的工会模型l 在里昂惕夫(1946)模型中，讨论了一个企业和一个垄断的工会组织(即作为企业劳动力惟一供给者的工会组织)的相互关系:工会对工资水平说一不二，但企业却可以自主决定就业人数(在更符合现实情况的模型中，企业和工会间就工资水平讨价还价，但企业仍自主决定就业，得到的定性结果与本模型相似)。工会的效用函数为U(W, L)，其中W为工会向企业开出的工资水平，L为就业人数。l假定假定U(W, L)是是W和和L的增函数。企

42、业的利润函数的增函数。企业的利润函数为为，其中，其中R (L)为企业雇佣为企业雇佣L名工名工人可以取得的收入人可以取得的收入(在最优的生产和产品市场决策下在最优的生产和产品市场决策下)，假定假定R (L)是增函数，并且为凹函数。是增函数，并且为凹函数。l 假定博弈的时序为假定博弈的时序为:(1)工会给出需要的工资水平工会给出需要的工资水平W;(2)企业观测到企业观测到(并接受并接受)W，随后选择雇佣人数，随后选择雇佣人数L;(3)收益分收益分别为别为U(W, L)和和。即使没有假定。即使没有假定U(W, L)和和R (L)的具体的表达式，从而无法明确解出该博弈的逆向的具体的表达式，从而无法

43、明确解出该博弈的逆向归纳解，但我们仍可以就解的主要特征进行讨论。归纳解，但我们仍可以就解的主要特征进行讨论。l 首先，对工会在第一阶段任意一个工资水平w，我们能够分析在第二阶段企业最优反应L*(W)的特征。给定w，企业选择L*(W)满足下式:l 一阶条件为：l 为了满足上述一阶条件，假设R(0)=; R()=0.l 下面的图把L *(w)表示为w的函数(但坐标轴经过旋转以便于和以后的数据相比较)，并表示出它和企业每条等利润线交于其最高点。若令L保持不变，lL保持不变，保持不变，w降低时企业的利润就会提高，于是较低降低时企业的利润就会提高，于是较低的等利润曲线代表了较高的利润水平。的等利润曲线代

44、表了较高的利润水平。l这张图描述了工会的无差异曲线，若令这张图描述了工会的无差异曲线，若令L不变，当不变，当w提高时工会的福利就会增加。于是较高的无差异曲线提高时工会的福利就会增加。于是较高的无差异曲线代表了工会较高的效用水平。代表了工会较高的效用水平。l下面我们分析工会在第一阶段的问题，由于工会和企业下面我们分析工会在第一阶段的问题，由于工会和企业同样可以解出企业在第二阶段的问题，工会就可预测到同样可以解出企业在第二阶段的问题，工会就可预测到如果它要求的工资水平为如果它要求的工资水平为w1，企业最优反应的就业人，企业最优反应的就业人数将会是数将会是L*(w1)。那么，工会在第一阶段的问题可以

45、表。那么，工会在第一阶段的问题可以表示为示为:l表现在图中的无差异曲线上就是，工会希望选择一个工表现在图中的无差异曲线上就是，工会希望选择一个工资水平资水平w，由此得到的结果，由此得到的结果(w， L*(w)处于可能达到的处于可能达到的最高的无差异线上。这一最优化间题的解为最高的无差异线上。这一最优化间题的解为w*，这样，这样一个工资要求将使得工会通过一个工资要求将使得工会通过(w*， L*(w*)的无差异曲的无差异曲线与线与L*(w)相切于该点，如下图。从而相切于该点，如下图。从而(w*， L*(w*)就就是这一工资与就业博弈的逆向归纳解。是这一工资与就业博弈的逆向归纳解。l 更进一步我们还可以看出，(w*,L*(w*)是低效率的，在上图中，如果w和L处于图中阴影部分以内，企业和工会的效用水平都会提高。这种低效率对实践中企业对雇佣工人数量保持的绝对控制权提出了质疑。(允许工人和企业就工资相互讨价还价，但企业仍对雇佣工人数量绝对控制，也会得到相似的低效率解)。l埃斯皮诺萨和里埃斯皮诺萨和里(Espi nosa&Rhee, 1989 )基于如下事基于如下事实为这一质疑提

人人文库> 全部分类> 应用文书 > 工作计划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论第四章完全且完美信息动态博弈ppt课件

文档简介

温馨提示

最新文档

评论

博弈论第四章 完全且完美信息动态博弈ppt课件

文档简介

温馨提示

最新文档

评论

相关文档

博弈论第四章完全且完美信息动态博弈ppt课件