版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
博弈论与公共政策刘霖北京大学政府管理学院博弈论与公共政策刘霖1第二讲完全信息动态博弈第二讲完全信息动态博弈2主要内容一、博弈的扩展式表述二、动态博弈的均衡三、子博弈精炼纳什均衡四、颤抖手精炼均衡五、承诺六、重复博弈七、扩展及应用主要内容一、博弈的扩展式表述3博弈实验1海盗分金博弈实验1海盗分金4一、博弈的扩展式表述1、博弈的扩展式表述①参与者②每个参与者在何时行动③每次轮到某一参与者行动时,可供他选择的行动④每次轮到某一参与者行动时,他所了解的信息⑤对应于参与者可能选择的每一行动组合,各个参与者的收益一、博弈的扩展式表述1、博弈的扩展式表述5通常可以用博弈树来描述博弈的扩展式。通常可以用博弈树来描述博弈的扩展式。6例1:简单诉讼博弈甲、乙双方在签订一项合同后,乙方违约。甲方可以选择控告,并索赔8000元,但控告需要花3000元诉讼费;甲方也可以选择忍受,一切维持现状。一旦甲方控告并提出索赔,乙方可以提出和解并赔偿8000元;乙方也可以选择上法庭。如果上法庭,甲方将胜诉,乙方将被判赔偿9000元,且双方各需要支出2000元的诉讼费。甲方应当控告还是忍受?例1:简单诉讼博弈甲、乙双方在签订一项合同后,乙方违约。甲7博弈过程博弈过程8博弈树博弈树9通过引入机会结,我们也可以纳入存在不确定性的情况,如下图:通过引入机会结,我们也可以纳入存在不确定性的情况,如下图:10《博弈论与公共政策》第2讲完全信息动态博弈B课件112、信息集参与者的一个信息集是指满足以下两个条件的决策结的集合:①在此信息集中的每一个结点都轮到该参与者行动。②当博弈的进行达到该信息集中的一个结,应该行动的参与者并不知道达到了信息集中的哪一个结。2、信息集123、策略参与者的一个策略是关于行动的一个完备计划,它明确了在参与者可能遇到的每一种情况下对可行行动的选择。思考:在下面的博弈中,两个参与者各自的策略空间分别是什么?3、策略13例2例2144、扩展式表述与标准式表述任何博弈都既可用标准式表述,又可用扩展式表述。(1)用扩展式表述囚徒困境博弈(第1讲中的例子)4、扩展式表述与标准式表述15第1讲之例1:囚徒困境囚徒2抵赖招认囚徒1抵赖-1,-1-9,0招认0,-9-6,-6第1讲之例1:囚徒困境囚徒2抵赖招认囚徒1抵赖-1,-1-916(2)用标准式表述例2中的博弈(2)用标准式表述例2中的博弈171、利用标准式表述求纳什均衡2、在博弈树上找纳什均衡二、动态博弈的均衡1、利用标准式表述求纳什均衡二、动态博弈的均衡18甲、乙两人商谈如何分配5元钱。谈判可以有无限期,依次由甲、乙轮流出价。只要一方接受另一方的出价,博弈就结束;否则,博弈就进入下一轮。每延迟1期,甲、乙双方的延迟成本分别为0.1元、0.2元。博弈实验2:序贯谈判博弈实验2:序贯谈判193、可置信的威胁与不可置信的威胁一种威胁所规定的行动在事前看来是最优的,但事后看并不是参与者的最优选择,这种威胁就是不可置信的,含有这种威胁的策略就不是一个合理的策略。在例2中,哪是可置信的威胁,哪是不可置信的威胁?3、可置信的威胁与不可置信的威胁20三、子博弈精炼纳什均衡1、子博弈扩展式博弈中的子博弈是指博弈的一部份,要求:①始于博弈树中一个单结信息集的决策结,但不包括博弈的第一个决策结;②包含该决策结之下所有的决策结和终点结;③没有分割任何信息集。三、子博弈精炼纳什均衡1、子博弈212、子博弈精炼纳什均衡如果参与者的策略组合不仅在整个博弈上构成纳什均衡,而且在每一子博弈中都构成纳什均衡,则称该策略组合是子博弈精炼纳什均衡。子博弈精炼纳什均衡排除了不可置信的威胁。参看例2。2、子博弈精炼纳什均衡223、逆向归纳法从最后一个决策结开始,找出该子博弈的纳什均衡;然后再分析倒数第二个决策结,找出相应子博弈的纳什均衡;如此一直到初始决策结,整个博弈及所有子博弈上的最优选择就构成了子博弈精炼纳什均衡。3、逆向归纳法23例3121(2,0)(5,0)(4,2)(1,1)UDRLU’D’例3121(2,0)(5,0)(4,2)(1,1)UDRL24例1:简单诉讼博弈(续)我们将例1中的收益数字做些改动而变为下面的博弈,会出现什么结果?例1:简单诉讼博弈(续)我们将例1中的收益数字做些改动而变25《博弈论与公共政策》第2讲完全信息动态博弈B课件26例4:诉讼博弈对于下面的博弈,如果Y=7千元,原告的最优策略是什么?例4:诉讼博弈对于下面的博弈,如果Y=7千元,原告的最优策略27《博弈论与公共政策》第2讲完全信息动态博弈B课件28例4:诉讼博弈(续)对于下面的博弈,原告的最优策略是什么?例4:诉讼博弈(续)对于下面的博弈,原告的最优策略是什么?29《博弈论与公共政策》第2讲完全信息动态博弈B课件304、均衡、均衡路径与解一个均衡是各参与者的策略组合,而策略又是完备的(即针对所有可能情况的)行动计划。精炼纳什均衡下所经过的决策点和最优选择构成的路径,称为均衡路径。其他的路径是非均衡路径。一个解则指一条均衡路径,即在给定的策略组合下各参与者的实际行动组合。4、均衡、均衡路径与解31例6121(2,0)(5,0)(4,2)(1,1)UDRLU’D’例6121(2,0)(5,0)(4,2)(1,1)UDRL325、逆向归纳法背后的理性假定在例5中,均衡结果依赖于非均衡路径上的选择:参与者1之所以起初就选择U,是因为他预期如果选择D的话,参与者2将选择L;而2之所以选择L,是因为她预期如果选择R的话,参与者1将选择U’。可是,只有在1偏离了博弈的逆向归纳解之后才能轮到2行动,而这时2似乎不能认为1是理性的了,从而2未必就会选L。逆向归纳出问题了?5、逆向归纳法背后的理性假定33应该怎样理解对手出乎意料的行动?这种行动既可能是对手粗心大意的结果,也可能是对手处心积虑的行为,当然也可能源于对手确实非理性。颤抖手精炼均衡(trembling-handperfectequilibrium)从对手粗心犯错的角度出发,提出了一种对子博弈精炼均衡再精炼的方法。四、颤抖手精炼均衡应该怎样理解对手出乎意料的行动?这种行动既可能是对手粗心大意34颤抖手精炼均衡的基本思想是,在任何一个博弈中,每一个参与者都有一定的可能性犯错误(类似于一个人抓东西时,手的颤抖使其发生偏差而抓不住一样),一个策略组合,只有当它在允许所有参与者都可能犯错误时仍是每一个参与者的最优策略的组合时,才构成一个稳定的均衡。颤抖手精炼均衡的基本思想是,在任何一个博弈中,每一个参与者都35例7乙左右甲上10,06,2下10,12,0例7乙左右甲上10,06,2下10,12,036颤抖手精炼均衡的正式定义:在n人策略式表述的博弈中,纳什均衡(σ1,…,σn)是一个颤抖手精炼均衡,如果对于每一个参与者i,存在一个严格混合策略序列,满足下述条件:①②颤抖手精炼均衡的正式定义:37例8例838颤抖手精炼均衡一定是子博弈精炼纳什均衡,但反之未必。换言之,颤抖手精炼均衡是对子博弈精炼均衡的再精炼。颤抖手精炼均衡一定是子博弈精炼纳什均衡,但反之未必。39在很多时候,参与者可以通过承诺行为来将不可置信的威胁变成可置信的威胁:确保威胁不仅是事前最优的,也是事后最优的。承诺意味着通过限制自己的行动自由来提高自己的收益。比如台湾问题:立法还是政府随机应变?五、承诺在很多时候,参与者可以通过承诺行为来将不可置信的威胁变成可置40例9台湾问题例9台湾问题41例10冷战博弈例10冷战博弈42六、重复博弈例11连锁店问题六、重复博弈例11连锁店问题43如果博弈不是一次性的,而是重复进行的,参与者过去行动的历史是可以观察到的,参与者就可以根据对手过去的行动来决定自己的选择,因而有了更多的可选策略,均衡结果可能与一次博弈大不相同。重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释。如果博弈不是一次性的,而是重复进行的,参与者过去行动的历史是441、有限次重复博弈以G(T)表示阶段博弈G重复T次的有限次重复博弈,并且在下一阶段博弈开始之前,所有以前博弈的结果都可被观测到。G(T)的收益为T次阶段博弈收益的简单相加。1、有限次重复博弈45命题一:如果阶段博弈G有唯一的纳什均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,即G的纳什均衡结果在每一阶段重复出现。命题一:46命题二:当阶段博弈G为完全信息动态博弈时,只要G有唯一的逆向归纳解,那么对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,其中每一阶段的结果都是G的逆向归纳解。命题二:47命题三:如果阶段博弈G是一个有多个纳什均衡的完全信息静态博弈,则重复博弈G(T)可以存在这样的子博弈精炼解——除最后那个阶段外,各个阶段的结果都不是G的纳什均衡结果。命题三:48例12两阶段重复博弈考虑下表所示的阶段博弈重复两次,参与者在第二阶段开始前可以观测到第一阶段的结果。我们可以证明在这一重复博弈中存在一个子博弈精炼解,其中第一阶段的行动组合为(M,M)。
例12两阶段重复博弈考虑下表所示的阶段博弈重复两次,参49乙LMR甲L1,15,00,0M0,54,40,0R0,00,03,3乙LMR甲L1,15,00,0M0,54,40,0R0,0050例13两阶段重复博弈乙LMRPQ甲L1,15,00,00,00,0M0,54,40,00,00,0R0,00,03,30,00,0P0,00,00,04,0.50,0Q0,00,00,00,00.5,4例13两阶段重复博弈乙LMRPQ甲L1,15,00512、无限次重复博弈即使阶段博弈G有唯一的纳什均衡,无限次重复博弈中也可以存在这样的子博弈精炼解,其中没有一个阶段的结果是G的纳什均衡结果。2、无限次重复博弈52(1)无限次重复博弈的定义给定一个阶段博弈G,以G(∞,δ)表示相应的无限次重复博弈,其中G将无限次地重复进行,且参与者的贴现因子都为δ。并且在下一次博弈开始之前,所有以前博弈的结果都可被观测到。每个参与者在G(∞,δ)中的收益都是该参与者在无限次的阶段博弈中所得收益的现值。(1)无限次重复博弈的定义53(2)阶段博弈的保留收益与可行收益
(2)阶段博弈的保留收益与可行收益54(3)无名氏定理令G为一个有限的完全信息静态博弈,以(e1,…,en)表示G的一个纳什均衡下的收益,而(x1,…,xn)表示G的其他任何可行收益。如果对每个参与者i都有xi>ei,且δ足够接近于1,则无限次重复博弈G(∞,δ)存在一个子博弈精炼纳什均衡,其平均收益可达到(x1,…,xn)。(3)无名氏定理55(4)不确定性下的适度惩罚在确定的情况下,惩罚越严厉,越有助于合作。由于在均衡中欺骗行为并不发生,所以惩罚实际上是没有成本的。但在不确定的情况下,即使每个参与者都选择合作,“坏结果”也可能会出现。如果坏结果总是触发惩罚,就会冤枉好人,过重的惩罚可能导致不合作;但如果总是原谅,合作也不会发生。(4)不确定性下的适度惩罚56例14阿克谢罗德(Axelrod)竞赛以牙还牙策略例14阿克谢罗德(Axelrod)竞赛以牙还牙策略57例15商场如战场在北京,国美电器、苏宁电器、大中电器是三家主要的家电卖场。在这些卖场里,商家无不承诺,其定价为全市最低,否则,只要顾客拿出可信的证据,商家愿意返还双倍差价。作为顾客,你是否为商家的承诺而感动?例15商场如战场在北京,国美电器、苏宁电器、大中电器58例16“涡轮发电机”阴谋1950年,美国涡轮发电机市场共有三家供应商,形成寡头垄断格局:-通用电气,市场份额为60%;-西屋电气,市场份额为30%;-爱科公司,市场份额为10%。电力公共事业部门都通过招标方式进行采购。例16“涡轮发电机”阴谋1950年,美国涡轮发电机市场共59例17毒气与原子弹第一次世界大战使用了毒气。第二次世界大战没有使用毒气,但使用了原子弹。如何理解这种现象?例17毒气与原子弹第一次世界大战使用了毒气。60毒气博弈德军使用毒气不用毒气盟军使用毒气-8,-83,-10不用毒气-10,30,0毒气博弈德军使用毒气不用毒气盟军使用毒气-8,-83,-1611、应用举例例4:诉讼博弈(续)在例4的诉讼博弈中,原告如何利用承诺以扭转局势?七、扩展及应用1、应用举例七、扩展及应用62例4:诉讼博弈(续)例4:诉讼博弈(续)63三个选民(1、2、3)要就三个备选方案(A、B、C)进行投票。议程为,首先就A和B两个方案进行投票决定优胜者,然后在前面的优胜者与C之间进行投票。各人的偏好顺序如下表所示。以上信息为共同知识。请你分析各人的投票策略,最终哪个方案被选中呢?例18投票问题三个选民(1、2、3)要就三个备选方案(A、B、C)进行投票64第一偏好第二偏好第三偏好选民1ABC选民2BCA选民3CAB第一偏好第二偏好第三偏好选民1ABC选民2BCA选民3CAB65例19斯特尔伯格双头垄断模型例19斯特尔伯格双头垄断模型662、复制动态机制与演化稳定策略2、复制动态机制与演化稳定策略67例20鹰鸽博弈鸟B鹰鸽鸟A鹰-25,-2514,-9鸽-9,145,5例20鹰鸽博弈鸟B鹰鸽鸟A鹰-25,-2514,-9鸽68假设每个生物种群的繁殖速度与其收益成正比,试问,随着鹰与鸽的博弈不断重复进行,各种群数量会如何变化?是否存在演化稳定状态?如果存在,此时各种群大小对比如何?假设每个生物种群的繁殖速度与其收益成正比,试问,随着鹰与鸽的69(1)复制动态(ReplicatorDynamics)机制(1)复制动态(ReplicatorDynamics)机制70(2)演化稳定策略(EvolutionaryStableStrategy)一个策略s*是一个演化稳定策略(ESS),如果对于任何其它策略s’,有(2)演化稳定策略(EvolutionaryStable71通常(但不限于)在对称博弈中考虑ESS。ESS具备这样几个特点:第一,所有参与者在均衡时采取相同的策略。第二,在均衡时,所有参与者的期望收益相等。通常(但不限于)在对称博弈中考虑ESS。72(3)演化稳定策略与纳什均衡之间的关系在双人对称博弈中,如果s*是ESS,那么(s*,s*)是对称均衡集中的孤立纳什均衡,即在其邻域内没有其它纳什均衡;如果(s*,s*)是严格纳什均衡,那么s*是ESS。(3)演化稳定策略与纳什均衡之间的关系73例21污水沟中的博弈埃希氏菌(E.coli)生活于污水之中,具体包括三种细类:第一种菌类会产生一种致命的剧毒和一种避免自身中毒的蛋白解毒剂;第二种菌类只产生解毒剂;第三种菌类两者皆不产生。例21污水沟中的博弈埃希氏菌(E.coli)生活于污74每一种化学物质的产生都会消耗细菌自身的生长能力,降低细菌的繁殖速度。所以,第一种菌类的繁殖速度低于第二种,(在不产生剧毒的情况下)第二种菌类的繁殖速度低于第三种。是否存在演化稳定策略呢?每一种化学物质的产生都会消耗细菌自身的生长能力,降低细菌的繁75科学观察表明,在污水中,这三种细菌的比例总是保持在1比1比1的水平上。它们是否在玩“石头、剪子、布”的游戏呢?科学观察表明,在污水中,这三种细菌的比例总是保持在1比1比176博弈论与公共政策刘霖北京大学政府管理学院博弈论与公共政策刘霖77第二讲完全信息动态博弈第二讲完全信息动态博弈78主要内容一、博弈的扩展式表述二、动态博弈的均衡三、子博弈精炼纳什均衡四、颤抖手精炼均衡五、承诺六、重复博弈七、扩展及应用主要内容一、博弈的扩展式表述79博弈实验1海盗分金博弈实验1海盗分金80一、博弈的扩展式表述1、博弈的扩展式表述①参与者②每个参与者在何时行动③每次轮到某一参与者行动时,可供他选择的行动④每次轮到某一参与者行动时,他所了解的信息⑤对应于参与者可能选择的每一行动组合,各个参与者的收益一、博弈的扩展式表述1、博弈的扩展式表述81通常可以用博弈树来描述博弈的扩展式。通常可以用博弈树来描述博弈的扩展式。82例1:简单诉讼博弈甲、乙双方在签订一项合同后,乙方违约。甲方可以选择控告,并索赔8000元,但控告需要花3000元诉讼费;甲方也可以选择忍受,一切维持现状。一旦甲方控告并提出索赔,乙方可以提出和解并赔偿8000元;乙方也可以选择上法庭。如果上法庭,甲方将胜诉,乙方将被判赔偿9000元,且双方各需要支出2000元的诉讼费。甲方应当控告还是忍受?例1:简单诉讼博弈甲、乙双方在签订一项合同后,乙方违约。甲83博弈过程博弈过程84博弈树博弈树85通过引入机会结,我们也可以纳入存在不确定性的情况,如下图:通过引入机会结,我们也可以纳入存在不确定性的情况,如下图:86《博弈论与公共政策》第2讲完全信息动态博弈B课件872、信息集参与者的一个信息集是指满足以下两个条件的决策结的集合:①在此信息集中的每一个结点都轮到该参与者行动。②当博弈的进行达到该信息集中的一个结,应该行动的参与者并不知道达到了信息集中的哪一个结。2、信息集883、策略参与者的一个策略是关于行动的一个完备计划,它明确了在参与者可能遇到的每一种情况下对可行行动的选择。思考:在下面的博弈中,两个参与者各自的策略空间分别是什么?3、策略89例2例2904、扩展式表述与标准式表述任何博弈都既可用标准式表述,又可用扩展式表述。(1)用扩展式表述囚徒困境博弈(第1讲中的例子)4、扩展式表述与标准式表述91第1讲之例1:囚徒困境囚徒2抵赖招认囚徒1抵赖-1,-1-9,0招认0,-9-6,-6第1讲之例1:囚徒困境囚徒2抵赖招认囚徒1抵赖-1,-1-992(2)用标准式表述例2中的博弈(2)用标准式表述例2中的博弈931、利用标准式表述求纳什均衡2、在博弈树上找纳什均衡二、动态博弈的均衡1、利用标准式表述求纳什均衡二、动态博弈的均衡94甲、乙两人商谈如何分配5元钱。谈判可以有无限期,依次由甲、乙轮流出价。只要一方接受另一方的出价,博弈就结束;否则,博弈就进入下一轮。每延迟1期,甲、乙双方的延迟成本分别为0.1元、0.2元。博弈实验2:序贯谈判博弈实验2:序贯谈判953、可置信的威胁与不可置信的威胁一种威胁所规定的行动在事前看来是最优的,但事后看并不是参与者的最优选择,这种威胁就是不可置信的,含有这种威胁的策略就不是一个合理的策略。在例2中,哪是可置信的威胁,哪是不可置信的威胁?3、可置信的威胁与不可置信的威胁96三、子博弈精炼纳什均衡1、子博弈扩展式博弈中的子博弈是指博弈的一部份,要求:①始于博弈树中一个单结信息集的决策结,但不包括博弈的第一个决策结;②包含该决策结之下所有的决策结和终点结;③没有分割任何信息集。三、子博弈精炼纳什均衡1、子博弈972、子博弈精炼纳什均衡如果参与者的策略组合不仅在整个博弈上构成纳什均衡,而且在每一子博弈中都构成纳什均衡,则称该策略组合是子博弈精炼纳什均衡。子博弈精炼纳什均衡排除了不可置信的威胁。参看例2。2、子博弈精炼纳什均衡983、逆向归纳法从最后一个决策结开始,找出该子博弈的纳什均衡;然后再分析倒数第二个决策结,找出相应子博弈的纳什均衡;如此一直到初始决策结,整个博弈及所有子博弈上的最优选择就构成了子博弈精炼纳什均衡。3、逆向归纳法99例3121(2,0)(5,0)(4,2)(1,1)UDRLU’D’例3121(2,0)(5,0)(4,2)(1,1)UDRL100例1:简单诉讼博弈(续)我们将例1中的收益数字做些改动而变为下面的博弈,会出现什么结果?例1:简单诉讼博弈(续)我们将例1中的收益数字做些改动而变101《博弈论与公共政策》第2讲完全信息动态博弈B课件102例4:诉讼博弈对于下面的博弈,如果Y=7千元,原告的最优策略是什么?例4:诉讼博弈对于下面的博弈,如果Y=7千元,原告的最优策略103《博弈论与公共政策》第2讲完全信息动态博弈B课件104例4:诉讼博弈(续)对于下面的博弈,原告的最优策略是什么?例4:诉讼博弈(续)对于下面的博弈,原告的最优策略是什么?105《博弈论与公共政策》第2讲完全信息动态博弈B课件1064、均衡、均衡路径与解一个均衡是各参与者的策略组合,而策略又是完备的(即针对所有可能情况的)行动计划。精炼纳什均衡下所经过的决策点和最优选择构成的路径,称为均衡路径。其他的路径是非均衡路径。一个解则指一条均衡路径,即在给定的策略组合下各参与者的实际行动组合。4、均衡、均衡路径与解107例6121(2,0)(5,0)(4,2)(1,1)UDRLU’D’例6121(2,0)(5,0)(4,2)(1,1)UDRL1085、逆向归纳法背后的理性假定在例5中,均衡结果依赖于非均衡路径上的选择:参与者1之所以起初就选择U,是因为他预期如果选择D的话,参与者2将选择L;而2之所以选择L,是因为她预期如果选择R的话,参与者1将选择U’。可是,只有在1偏离了博弈的逆向归纳解之后才能轮到2行动,而这时2似乎不能认为1是理性的了,从而2未必就会选L。逆向归纳出问题了?5、逆向归纳法背后的理性假定109应该怎样理解对手出乎意料的行动?这种行动既可能是对手粗心大意的结果,也可能是对手处心积虑的行为,当然也可能源于对手确实非理性。颤抖手精炼均衡(trembling-handperfectequilibrium)从对手粗心犯错的角度出发,提出了一种对子博弈精炼均衡再精炼的方法。四、颤抖手精炼均衡应该怎样理解对手出乎意料的行动?这种行动既可能是对手粗心大意110颤抖手精炼均衡的基本思想是,在任何一个博弈中,每一个参与者都有一定的可能性犯错误(类似于一个人抓东西时,手的颤抖使其发生偏差而抓不住一样),一个策略组合,只有当它在允许所有参与者都可能犯错误时仍是每一个参与者的最优策略的组合时,才构成一个稳定的均衡。颤抖手精炼均衡的基本思想是,在任何一个博弈中,每一个参与者都111例7乙左右甲上10,06,2下10,12,0例7乙左右甲上10,06,2下10,12,0112颤抖手精炼均衡的正式定义:在n人策略式表述的博弈中,纳什均衡(σ1,…,σn)是一个颤抖手精炼均衡,如果对于每一个参与者i,存在一个严格混合策略序列,满足下述条件:①②颤抖手精炼均衡的正式定义:113例8例8114颤抖手精炼均衡一定是子博弈精炼纳什均衡,但反之未必。换言之,颤抖手精炼均衡是对子博弈精炼均衡的再精炼。颤抖手精炼均衡一定是子博弈精炼纳什均衡,但反之未必。115在很多时候,参与者可以通过承诺行为来将不可置信的威胁变成可置信的威胁:确保威胁不仅是事前最优的,也是事后最优的。承诺意味着通过限制自己的行动自由来提高自己的收益。比如台湾问题:立法还是政府随机应变?五、承诺在很多时候,参与者可以通过承诺行为来将不可置信的威胁变成可置116例9台湾问题例9台湾问题117例10冷战博弈例10冷战博弈118六、重复博弈例11连锁店问题六、重复博弈例11连锁店问题119如果博弈不是一次性的,而是重复进行的,参与者过去行动的历史是可以观察到的,参与者就可以根据对手过去的行动来决定自己的选择,因而有了更多的可选策略,均衡结果可能与一次博弈大不相同。重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释。如果博弈不是一次性的,而是重复进行的,参与者过去行动的历史是1201、有限次重复博弈以G(T)表示阶段博弈G重复T次的有限次重复博弈,并且在下一阶段博弈开始之前,所有以前博弈的结果都可被观测到。G(T)的收益为T次阶段博弈收益的简单相加。1、有限次重复博弈121命题一:如果阶段博弈G有唯一的纳什均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,即G的纳什均衡结果在每一阶段重复出现。命题一:122命题二:当阶段博弈G为完全信息动态博弈时,只要G有唯一的逆向归纳解,那么对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,其中每一阶段的结果都是G的逆向归纳解。命题二:123命题三:如果阶段博弈G是一个有多个纳什均衡的完全信息静态博弈,则重复博弈G(T)可以存在这样的子博弈精炼解——除最后那个阶段外,各个阶段的结果都不是G的纳什均衡结果。命题三:124例12两阶段重复博弈考虑下表所示的阶段博弈重复两次,参与者在第二阶段开始前可以观测到第一阶段的结果。我们可以证明在这一重复博弈中存在一个子博弈精炼解,其中第一阶段的行动组合为(M,M)。
例12两阶段重复博弈考虑下表所示的阶段博弈重复两次,参125乙LMR甲L1,15,00,0M0,54,40,0R0,00,03,3乙LMR甲L1,15,00,0M0,54,40,0R0,00126例13两阶段重复博弈乙LMRPQ甲L1,15,00,00,00,0M0,54,40,00,00,0R0,00,03,30,00,0P0,00,00,04,0.50,0Q0,00,00,00,00.5,4例13两阶段重复博弈乙LMRPQ甲L1,15,001272、无限次重复博弈即使阶段博弈G有唯一的纳什均衡,无限次重复博弈中也可以存在这样的子博弈精炼解,其中没有一个阶段的结果是G的纳什均衡结果。2、无限次重复博弈128(1)无限次重复博弈的定义给定一个阶段博弈G,以G(∞,δ)表示相应的无限次重复博弈,其中G将无限次地重复进行,且参与者的贴现因子都为δ。并且在下一次博弈开始之前,所有以前博弈的结果都可被观测到。每个参与者在G(∞,δ)中的收益都是该参与者在无限次的阶段博弈中所得收益的现值。(1)无限次重复博弈的定义129(2)阶段博弈的保留收益与可行收益
(2)阶段博弈的保留收益与可行收益130(3)无名氏定理令G为一个有限的完全信息静态博弈,以(e1,…,en)表示G的一个纳什均衡下的收益,而(x1,…,xn)表示G的其他任何可行收益。如果对每个参与者i都有xi>ei,且δ足够接近于1,则无限次重复博弈G(∞,δ)存在一个子博弈精炼纳什均衡,其平均收益可达到(x1,…,xn)。(3)无名氏定理131(4)不确定性下的适度惩罚在确定的情况下,惩罚越严厉,越有助于合作。由于在均衡中欺骗行为并不发生,所以惩罚实际上是没有成本的。但在不确定的情况下,即使每个参与者都选择合作,“坏结果”也可能会出现。如果坏结果总是触发惩罚,就会冤枉好人,过重的惩罚可能导致不合作;但如果总是原谅,合作也不会发生。(4)不确定性下的适度惩罚132例14阿克谢罗德(Axelrod)竞赛以牙还牙策略例14阿克谢罗德(Axelrod)竞赛以牙还牙策略133例15商场如战场在北京,国美电器、苏宁电器、大中电器是三家主要的家电卖场。在这些卖场里,商家无不承诺,其定价为全市最低,否则,只要顾客拿出可信的证据,商家愿意返还双倍差价。作为顾客,你是否为商家的承诺而感动?例15商场如战场在北京,国美电器、苏宁电器、大中电器134例16“涡轮发电机”阴谋1950年,美国涡轮发电机市场共有三家供应商,形成寡头垄断格局:-通用电气,市场份额为60%;-西屋电气,市场份额为30%;-爱科公司,市场份额为10%。电力公共事业部门都通过招标方式进行采购。例16“涡轮发电机”阴谋1950年,美国涡轮发电机市场共135例17毒气与原子弹第一次世界大战使用了毒气。第二次世界大战没有使用毒气,但使用了原子弹。如何理解这种现象?例17毒气与原子弹第一次世界大战使用了毒气。136毒气博弈德军使用毒气不用毒气盟军使用毒气-8,-83,-10不用毒气-10,30,0毒气博弈德军使用毒气不用毒
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 解密03 动词短语、情态动词、虚拟语气与语法填空(讲义)-【高频考点解密】高考英语二轮复习讲义+分层训练(浙江专用)
- 云南省部分高中学校2024-2025学年高二上学期12月月考化学试题(含答案)
- 福建省宁德市福鼎市第四中学2024-2025学年高一上学期12月月考生物试题
- 医学教材 产褥期疾病妇女的护理学习资料
- 网络经济学案例分析 微软
- 四川省宜宾市重点学校2023-2024学年高三上学期语文2月期末试卷
- 2023年山东省淄博市中考数学模拟试卷
- 2025届四川省绵阳市高三一诊考试英语试题(含答案解析)
- 2024年面向AI大模型的网络使能技术白皮书-6GANA
- 2025年中考英语一轮教材复习 八年级(下) Unit 8-2
- 2024统编版初中八年级语文上册第六单元:大单元整体教学设计
- 顺丰控股财务报表分析报告
- 2024-2025学年四年级科学上册第三单元《运动和力》测试卷(教科版)
- 2024年典型事故案例警示教育手册15例
- 中国传世名画鉴赏智慧树知到期末考试答案2024年
- 20K607 防排烟及暖通防火设计审查与安装
- 2024年中航集团招聘笔试参考题库含答案解析
- 中药学电子版教材
- 凸透镜成像规律flash课件
- 易损件更换管理规范(含表格)
- 澳大利亚新能源产业发展现状与做法和其对我国启示
评论
0/150
提交评论