版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《博弈论与信息经济学》第二章
完全信息静态博弈《博弈论与信息经济学》1
本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。本章介绍完全信息静态博弈。完全信息静态博弈即各博2本章分六节2.1基本分析思路和方法2.2纳什均衡2.3无限策略博弈分析和反应函数2.4混合策略和混合策略纳什均衡2.5纳什均衡的存在性2.6纳什均衡的选择和分析方法扩展本章分六节2.1基本分析思路和方法32.1基本分析思路和方法2.1.1上策均衡2.1.2严格下策反复消去法2.1.3划线法2.1.4箭头法2.1基本分析思路和方法2.1.1上策均衡42.1.1上策均衡上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略囚徒的困境中的“坦白”;双寡头削价中“低价”。上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果上策均衡不是普遍存在的2.1.1上策均衡上策:不管其它博弈方选择什么策略,一博弈5-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白两个罪犯的得益矩阵囚徒2囚徒1-5,-50,-8-8,0-1,-1坦白不坦白坦6
2.1.2严格下策反复消去法严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。严格下策反复消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中2.1.2严格下策反复消去法严格下策:不管其它博弈方的策72.1.3划线法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬币2,10,00,01,3夫妻之争2.1.3划线法1,01,30,10,4082.1.4箭头法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬币2,10,00,01,3夫妻之争2.1.4箭头法1,01,30,10,4098,81,71,37,14,41,3左中右上下2,23,13,1中请分别用不同方法分析此博弈8,81,71,37,14,41,3左中右上下2,23,13102.2纳什均衡2.2.1纳什均衡的定义2.2.2纳什均衡的一致预测性质2.2.3纳什均衡与严格下策反复消去法2.2纳什均衡2.2.1纳什均衡的定义112.2.1纳什均衡的定义策略空间:博弈方的第个策略:博弈方的得益:博弈:纳什均衡:在博弈中,如果由各个博弈方的各一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略的组合的最佳对策,也即对任意都成立,则称为的一个纳什均衡),(**n1ssL),...,,(**1*1*nii1ssss+-L),...,,,(),...,,,(**1*1***1**1*niiji1iniii1isssssusssssu+-+-³LL),(**n1ssL2.2.1纳什均衡的定义策略空间:),(**n1ssL),122.2.2纳什均衡的一致预测性质
一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果。只有纳什均衡才具有一致预测的性质一致预测性是纳什均衡的本质属性一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能2.2.2纳什均衡的一致预测性质
一致预测:如果所有博弈方132.2.3纳什均衡与严格下策反复消去法上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡命题2.1:在n个博弈方的博弈中,如果严格下策反复消去法排除了除之外的所有策略组合,那么一定是该博弈的唯一的纳什均衡。命题2.2:在n个博弈方的博弈中中,如果是的一个纳什均衡,那么严格下策反复消去法一定不会将它消去。
上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的),(**n1ssL),(**n1ssL),(**n1ssL2.2.3纳什均衡与严格下策反复消去法上策均衡肯定是纳什均142.3无限策略分析和反应函数2.3.1古诺的寡头模型2.3.2伯特兰德寡头模型2.3.3公共资源问题2.3.4反应函数的问题和局限性2.3无限策略分析和反应函数2.3.1古诺的寡头模型152.3.1古诺的寡头模型寡头产量竞争——以两厂商产量竞争为例222126qqqq--=2.3.1古诺的寡头模型寡头产量竞争——以两厂商产量竞争为164.5,4.55,3.753.75,54,4不突破突破厂商2不突破突破厂商1以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5两寡头间的囚徒困境博弈4.5,4.55,3.753.75,54,4不突破突破厂商217古诺模型的反应函数(3,0)(6,0)(0,3)(0,6)古诺模型的反应函数图示理性局限和古诺调整古诺模型的反应函数(3,0)(6,0)(0,3)(0,6)古182.3.2伯特兰德寡头模型价格竞争寡头的博弈模型产品无差别,消费者对价格不十分敏感2.3.2伯特兰德寡头模型价格竞争寡头的博弈模型19相同产品的价格竞争假设双寡头面临的市场需求函数:P=30-Q;Q=Q1+Q2假设两厂商的边际成本为:MC1=MC2=3古诺均衡:Q1=Q2=9P=12利润各为81假设这两个双寡头是通过同时选择价格相互竞争。纳什均衡就是完全竞争的均衡:P1=P2=3=MCQ1=Q2=13.5利润为0相同产品的价格竞争假设双寡头面临的市场需求函数:古诺均衡:20差别产品的价格竞争假设两厂商的固定成本为都为20,但没有可变成本。假设双寡头面临的市场需求函数:厂商1的需求:Q1=12-2P1+P2厂商2的需求:Q2=12-2P2+P1厂商1的反应函数:P1=3+0.25P2厂商2的反应函数:P2=3+0.25P1纳什均衡:P1=P2=4利润各为12差别产品的价格竞争假设两厂商的固定成本为都为20,但没有可变212.3.3公共资源问题公共草地养羊问题以三农户为例n=3,c=4,每只羊的产出函数V=100-Q2.3.3公共资源问题公共草地养羊问题以三农户为例22合作:总体利益最大化竞争:个体利益最大化合作:总体利益最大化竞争:个体利益最大化232.3.4反应函数的问题和局限性在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。2.3.4反应函数的问题和局限性在许多博弈中,博弈方的策略242.4混合策略和混合策略纳什均衡2.4.1严格竞争博弈和混合策略的引进2.4.2多重均衡博弈和混合策略2.4.3混合策略和严格下策反复消去法2.4.4混合策略反应函数2.4混合策略和混合策略纳什均衡2.4.1严格竞争博弈和252.4.1严格竞争博弈和混合策略的引进一、猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念2.4.1严格竞争博弈和混合策略的引进一、猜硬币博弈-1,26二、混合策略、混合策略博弈
和混合策略纳什均衡
混合策略:在博弈中,博弈方的策略空间为,则博弈方以概率分布随机在其个可选策略中选择的“策略”,称为一个“混合策略”,其中对都成立,且
混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。
混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。二、混合策略、混合策略博弈
和混合策略纳什均衡27三、一个例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析博弈方1的混合策略博弈方2的混合策略2,35,23,11,5CDAB博弈方2博弈方1
策略得益博弈方1(0.8,0.2)2.6博弈方2(0.8,0.2)2.6三、一个例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析28寻找混合策略纳什均衡概率分布的思路:令各个博弈方随机选择纯策略的概率分布,满足使对方或其他博弈方采用不同策略的期望得益相同。寻找混合策略纳什均衡概率分布的思路:29求此博弈中的混合策略纳什均衡2,10,21,23,0左右博弈方2博弈方1上下求此博弈中的混合策略纳什均衡2,10,21,23,030四、齐威王田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌齐威王得益矩阵四、齐威王田忌赛马3,-31,-11,-11,-1-1,1131五、小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫小偷0-D-D’守卫得益((睡)SPt小偷偷的概率1五、小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷32V,-D-P,00,S0,0睡不睡偷不偷守卫小偷0-P-P’小偷得益(偷)VPg守卫睡的概略1“激励悖论”(政策目标和政策结果之间的意外关系):加重对守卫的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概率。加重对小偷的惩罚在长期中并不能抑制盗窃,最多只能抑制短期的盗窃发生率,它的主要作用是使得守卫可以更多地偷懒。V,-D-P,00,S0,0睡不睡偷不偷守卫小0-P-P332.4.2多重均衡博弈和混合策略一、夫妻之争的混合策略纳什均衡2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡策略得益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.752.4.2多重均衡博弈和混合策略一、夫妻之争的混合策略纳什34二、制式问题1,30,00,02,2ABAB厂商2厂商1制式问题
制式问题混合策略纳什均衡AB得益厂商1:0.40.60.664厂商2:0.670.331.296二、制式问题1,30,00,02,2ABAB厂商2厂35三、市场机会博弈-50,-50100,00,1000,0进不进进不进厂商2厂商1市场机会
进不进得益厂商1:2/31/30厂商2:2/31/30三、市场机会博弈-50,-50100,00,1000,0进不362.4.3混合策略和严格下策反复消去法3,10,20,23,31,31,1LRUMD博弈方2博弈方1博弈方2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用纯策略R时,博弈方1采用混合策略(1/2,1/2,0)的得益2.4.3混合策略和严格下策反复消去法3,10,237结论:(1)任何博弈方都不会采用任何严格下策,不管它们是纯策略还是混合策略;(2)严格下策反复消去法不会消去任何纳什均衡,包括纯策略纳什均衡和混合策略纳什均衡;(3)如果经过反复消去后留下的策略组合是唯一的,那么一定是纳什均衡。
结论:382.4.4混合策略反应函数猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方正面反面猜硬币博弈盖硬币方rq111/21/2(r,1-r):盖硬币方选择正反面的混合策略概率分布(q,1-q):猜硬币方选择正反面的混合策略概率分布2.4.4混合策略反应函数猜硬币博弈-1,11,-1139夫妻之争博弈2,10,00,01,3时装足球丈夫时装足球妻子夫妻之争rq111/31/3(r,1-r):丈夫的混合策略概率分布(q,1-q):妻子的混合策略概率分布夫妻之争博弈2,10,00,01,3时装足球丈夫时装402,11,20,23,0LR2TB12,11,20,23,0LR2TB1412.5纳什均衡的存在性纳什定理:在一个由n个博弈方的博弈中,如果n是有限的,且都是有限集(对),则该博弈至少存在一个纳什均衡,但可能包含混合策略。(每个有限博弈都至少有一个混合策略纳什均衡)主要根据是布鲁威尔和角谷的不动点定理。纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。2.5纳什均衡的存在性纳什定理:在一个由n个博弈方的博弈42混合战略纳什均衡纯战略纳什均衡重复剔除占优均衡占优均衡总结:不同均衡概念之间的关系占优均衡总结:不同均衡概念之间的关系432.6纳什均衡的选择和分析方法扩展2.6.1多重纳什均衡博弈的分析2.6.2共谋和防共谋均衡2.6纳什均衡的选择和分析方法扩展2.6.1多重纳什均衡442.6.1多重纳什均衡博弈的分析帕累托上策均衡风险上策均衡聚点均衡相关均衡2.6.1多重纳什均衡博弈的分析帕累托上策均衡45一、帕累托上策均衡(鹰鸽博弈)这个博弈中有两个纯策略纳什均衡,(战争,战争)和(和平,和平),显然后者帕累托优于前者,所以,(和平,和平)是本博弈的一个帕累托上策均衡。-5,-5-10,88,-1010,10战争和平国家2战争和平国家1战争与和平一、帕累托上策均衡(鹰鸽博弈)-5,-5-10,88,46二、风险上策均衡考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。下面就是两个例子。9,98,00,87,7LR博弈方2UD博弈方1风险上策均衡(D,R)5,53,00,33,3鹿兔子猎人2鹿兔子猎人1猎鹿博弈风险上策均衡(兔子,兔子)二、风险上策均衡考虑、顾忌博弈方、其他博弈方可47三、聚点均衡利用博弈设定以外的信息和依据选择的均衡文化、习惯或者其他各种特征都可能是聚点均衡的依据城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子三、聚点均衡利用博弈设定以外的信息和依据选择的均衡48四、相关均衡5,14,40,01,5LR博弈方2UD博弈方1相关均衡例子三个纳什均衡:(U,L)、(D,R)和混合策略均衡[(1/2,1/2),(1/2,1/2)]结果都不理想,不如(D,L)。可利用聚点均衡(天气,抛硬币),但仍不理想。相关装置:1、各1/3概率A、B、C2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。相关均衡要点:1、构成纳什均衡2、有人忽略不造成问题四、相关均衡5,14,40,01,5LR博弈方2UD49一、多人博弈中的共谋问题本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B)前者帕累托优于后者。博弈的结果会是什么呢?(U,L,A)有共谋(Coalition)问题:博弈方1和2同时偏离。0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方2博弈方1博弈方3——A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方2博弈方1博弈方3——B2.6.2共谋和防共谋均衡一、多人博弈中的共谋问题0,0,10-5,-5,0-5,-550二、防共谋均衡
如果一个博弈的某个策略组合满足下列要求:(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。称为“防共谋均衡”。前面例子中:(D,R,B)是防共谋均衡(U,L,A)不是防共谋均衡二、防共谋均衡如果一个博弈的某个策略组合满足下51《博弈论与信息经济学》第二章
完全信息静态博弈《博弈论与信息经济学》52
本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。本章介绍完全信息静态博弈。完全信息静态博弈即各博53本章分六节2.1基本分析思路和方法2.2纳什均衡2.3无限策略博弈分析和反应函数2.4混合策略和混合策略纳什均衡2.5纳什均衡的存在性2.6纳什均衡的选择和分析方法扩展本章分六节2.1基本分析思路和方法542.1基本分析思路和方法2.1.1上策均衡2.1.2严格下策反复消去法2.1.3划线法2.1.4箭头法2.1基本分析思路和方法2.1.1上策均衡552.1.1上策均衡上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略囚徒的困境中的“坦白”;双寡头削价中“低价”。上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果上策均衡不是普遍存在的2.1.1上策均衡上策:不管其它博弈方选择什么策略,一博弈56-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白两个罪犯的得益矩阵囚徒2囚徒1-5,-50,-8-8,0-1,-1坦白不坦白坦57
2.1.2严格下策反复消去法严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。严格下策反复消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中2.1.2严格下策反复消去法严格下策:不管其它博弈方的策582.1.3划线法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬币2,10,00,01,3夫妻之争2.1.3划线法1,01,30,10,40592.1.4箭头法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬币2,10,00,01,3夫妻之争2.1.4箭头法1,01,30,10,40608,81,71,37,14,41,3左中右上下2,23,13,1中请分别用不同方法分析此博弈8,81,71,37,14,41,3左中右上下2,23,13612.2纳什均衡2.2.1纳什均衡的定义2.2.2纳什均衡的一致预测性质2.2.3纳什均衡与严格下策反复消去法2.2纳什均衡2.2.1纳什均衡的定义622.2.1纳什均衡的定义策略空间:博弈方的第个策略:博弈方的得益:博弈:纳什均衡:在博弈中,如果由各个博弈方的各一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略的组合的最佳对策,也即对任意都成立,则称为的一个纳什均衡),(**n1ssL),...,,(**1*1*nii1ssss+-L),...,,,(),...,,,(**1*1***1**1*niiji1iniii1isssssusssssu+-+-³LL),(**n1ssL2.2.1纳什均衡的定义策略空间:),(**n1ssL),632.2.2纳什均衡的一致预测性质
一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果。只有纳什均衡才具有一致预测的性质一致预测性是纳什均衡的本质属性一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能2.2.2纳什均衡的一致预测性质
一致预测:如果所有博弈方642.2.3纳什均衡与严格下策反复消去法上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡命题2.1:在n个博弈方的博弈中,如果严格下策反复消去法排除了除之外的所有策略组合,那么一定是该博弈的唯一的纳什均衡。命题2.2:在n个博弈方的博弈中中,如果是的一个纳什均衡,那么严格下策反复消去法一定不会将它消去。
上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的),(**n1ssL),(**n1ssL),(**n1ssL2.2.3纳什均衡与严格下策反复消去法上策均衡肯定是纳什均652.3无限策略分析和反应函数2.3.1古诺的寡头模型2.3.2伯特兰德寡头模型2.3.3公共资源问题2.3.4反应函数的问题和局限性2.3无限策略分析和反应函数2.3.1古诺的寡头模型662.3.1古诺的寡头模型寡头产量竞争——以两厂商产量竞争为例222126qqqq--=2.3.1古诺的寡头模型寡头产量竞争——以两厂商产量竞争为674.5,4.55,3.753.75,54,4不突破突破厂商2不突破突破厂商1以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5两寡头间的囚徒困境博弈4.5,4.55,3.753.75,54,4不突破突破厂商268古诺模型的反应函数(3,0)(6,0)(0,3)(0,6)古诺模型的反应函数图示理性局限和古诺调整古诺模型的反应函数(3,0)(6,0)(0,3)(0,6)古692.3.2伯特兰德寡头模型价格竞争寡头的博弈模型产品无差别,消费者对价格不十分敏感2.3.2伯特兰德寡头模型价格竞争寡头的博弈模型70相同产品的价格竞争假设双寡头面临的市场需求函数:P=30-Q;Q=Q1+Q2假设两厂商的边际成本为:MC1=MC2=3古诺均衡:Q1=Q2=9P=12利润各为81假设这两个双寡头是通过同时选择价格相互竞争。纳什均衡就是完全竞争的均衡:P1=P2=3=MCQ1=Q2=13.5利润为0相同产品的价格竞争假设双寡头面临的市场需求函数:古诺均衡:71差别产品的价格竞争假设两厂商的固定成本为都为20,但没有可变成本。假设双寡头面临的市场需求函数:厂商1的需求:Q1=12-2P1+P2厂商2的需求:Q2=12-2P2+P1厂商1的反应函数:P1=3+0.25P2厂商2的反应函数:P2=3+0.25P1纳什均衡:P1=P2=4利润各为12差别产品的价格竞争假设两厂商的固定成本为都为20,但没有可变722.3.3公共资源问题公共草地养羊问题以三农户为例n=3,c=4,每只羊的产出函数V=100-Q2.3.3公共资源问题公共草地养羊问题以三农户为例73合作:总体利益最大化竞争:个体利益最大化合作:总体利益最大化竞争:个体利益最大化742.3.4反应函数的问题和局限性在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。2.3.4反应函数的问题和局限性在许多博弈中,博弈方的策略752.4混合策略和混合策略纳什均衡2.4.1严格竞争博弈和混合策略的引进2.4.2多重均衡博弈和混合策略2.4.3混合策略和严格下策反复消去法2.4.4混合策略反应函数2.4混合策略和混合策略纳什均衡2.4.1严格竞争博弈和762.4.1严格竞争博弈和混合策略的引进一、猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念2.4.1严格竞争博弈和混合策略的引进一、猜硬币博弈-1,77二、混合策略、混合策略博弈
和混合策略纳什均衡
混合策略:在博弈中,博弈方的策略空间为,则博弈方以概率分布随机在其个可选策略中选择的“策略”,称为一个“混合策略”,其中对都成立,且
混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。
混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。二、混合策略、混合策略博弈
和混合策略纳什均衡78三、一个例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析博弈方1的混合策略博弈方2的混合策略2,35,23,11,5CDAB博弈方2博弈方1
策略得益博弈方1(0.8,0.2)2.6博弈方2(0.8,0.2)2.6三、一个例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析79寻找混合策略纳什均衡概率分布的思路:令各个博弈方随机选择纯策略的概率分布,满足使对方或其他博弈方采用不同策略的期望得益相同。寻找混合策略纳什均衡概率分布的思路:80求此博弈中的混合策略纳什均衡2,10,21,23,0左右博弈方2博弈方1上下求此博弈中的混合策略纳什均衡2,10,21,23,081四、齐威王田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌齐威王得益矩阵四、齐威王田忌赛马3,-31,-11,-11,-1-1,1182五、小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫小偷0-D-D’守卫得益((睡)SPt小偷偷的概率1五、小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷83V,-D-P,00,S0,0睡不睡偷不偷守卫小偷0-P-P’小偷得益(偷)VPg守卫睡的概略1“激励悖论”(政策目标和政策结果之间的意外关系):加重对守卫的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概率。加重对小偷的惩罚在长期中并不能抑制盗窃,最多只能抑制短期的盗窃发生率,它的主要作用是使得守卫可以更多地偷懒。V,-D-P,00,S0,0睡不睡偷不偷守卫小0-P-P842.4.2多重均衡博弈和混合策略一、夫妻之争的混合策略纳什均衡2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡策略得益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.752.4.2多重均衡博弈和混合策略一、夫妻之争的混合策略纳什85二、制式问题1,30,00,02,2ABAB厂商2厂商1制式问题
制式问题混合策略纳什均衡AB得益厂商1:0.40.60.664厂商2:0.670.331.296二、制式问题1,30,00,02,2ABAB厂商2厂86三、市场机会博弈-50,-50100,00,1000,0进不进进不进厂商2厂商1市场机会
进不进得益厂商1:2/31/30厂商2:2/31/30三、市场机会博弈-50,-50100,00,1000,0进不872.4.3混合策略和严格下策反复消去法3,10,20,23,31,31,1LRUMD博弈方2博弈方1博弈方2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用纯策略R时,博弈方1采用混合策略(1/2,1/2,0)的得益2.4.3混合策略和严格下策反复消去法3,10,288结论:(1)任何博弈方都不会采用任何严格下策,不管它们是纯策略还是混合策略;(2)严格下策反复消去法不会消去任何纳什均衡,包括纯策略纳什均衡和混合策略纳什均衡;(3)如果经过反复消去后留下的策略组合是唯一的,那么一定是纳什均衡。
结论:892.4.4混合策略反应函数猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方正面反面猜硬币博弈盖硬币方rq111/21/2(r,1-r):盖硬币方选择正反面的混合策略概率分布(q,1-q):猜硬币方选择正反面的混合策略概率分布2.4.4混合策略反应函数猜硬币博弈-1,11,-1190夫妻之争博弈2,10,00,01,3时装足球丈夫时装足球妻子夫妻之争rq111/31/3(r,1-r):丈夫的混合策略概率分布(q,1-q):妻子的混合策略概率分布夫妻之争博弈2,10,00,01,3时装足球丈夫时装912,11,20,23,0LR2TB12,11,20,23,0LR2TB1922.5纳什均衡的存在性纳什定理:在一个由n个博弈方的博弈
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 测量用链项目可行性实施报告
- 漂白碱市场环境与对策分析
- 测量用直角尺相关项目实施方案
- 成都师范学院《仪器分析》2023-2024学年第一学期期末试卷
- 成都师范学院《外国文学(三)》2023-2024学年第一学期期末试卷
- 烘焙小蛋糕用硅胶衬垫市场环境与对策分析
- 晶体硅太阳能电池相关项目建议书
- 眼镜片清洗溶液项目可行性实施报告
- 碗碟晾干架市场环境与对策分析
- DB11-T 1952-2022 地理国情监测技术规程
- 庭中有奇树PPT课件
- 海关学习廉洁自律准则心得体会
- 向导5使用说明书
- 弟子规一张纸打印版
- PSS配置、构成、参数计算及投运试验讲解学习
- 中国传统文化翻译在高中英语课堂的有效运用
- 产业投资概述PPT课件
- 共价键的形成和类型(正式上课)
- 英语课堂游戏:微信视频通话
- 大班自主游戏观察记录
- 第三章3.4抗剪强度参数反算PPT优秀课件
评论
0/150
提交评论