版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 完全信息静态博弈 本章介绍完全信息静态博弈。完全信息静态博弈各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。 1本章分六节2.1基本分析思路和方法2.2纳什均衡2.3无限策略博弈分析和反应函数2.4混合策略和混合策略纳什均衡2.5纳什均衡的存在性2.6纳什均衡的选择和分析方法扩展22.1 基本分析思路和方法2.1.1 上策均衡2.1.2 严格下策反复消去法2.1.3 划线法2.1.4
2、箭头法32.1.1 上策均衡基本分析思路和方法 在某个博弈中,如果不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其他策略,至少不低于其他策略。这时我们不难理解,上述“某个策略”必然是该博弈方愿意选择的策略。例如囚徒困境博弈中的“坦白”就是这样的策略(对两个博弈方都成立)。4Cont我们称这种策略为该博弈方的一个“上策”(Dominant-strategy)。 进一步,如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的果。5Cont我们称这样的策略组合为该博弈的一个“上策均衡”( Domina
3、nt-strategy Equilibrium)。上策均衡是博弈分析中最基本的均衡概念之一,上策均衡分析是最基本的博弈分析方法。囚徒的困境中的(坦白,坦白)实际上就是一个上策均衡“坦白”对该博弈的两个博弈方来说都是上策。62.1.1 上策均衡应用上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略。 囚徒的困境中的“坦白”;双寡头削价中“低价”。-5, -50, -8-8, 0-1, -1坦 白不坦白坦 白不坦白两个罪犯的得益矩阵囚徒 2囚徒17Cont100,10020,105150,2070,70高 价低 价高 价低 价寡头2寡头1
4、双寡头的得益矩阵8上策均衡上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果上策均衡不是普遍存在的9Cont100,10020,105150,2070,70高 价低 价高 价低 价寡头2寡头1双寡头的得益矩阵5,14,49,-10,0按等待按等待小猪大猪智猪博弈的得益矩阵102.1.2基本分析思路和方法- 严格下策反复消去法一、思路和原理 反思上策均衡分析的思路,不难发现上策均衡分析采用的决策思路是一种选择法的思路,是在所有可选择策略中选出最好一种地思路。实际上,选择是指人们在决策活动所运用的一种策略思路而不是全部的决策思路,人们在决策活动中还会采
5、用另外的决策思虑。排除的思路,也就是所谓的排除法,就是其中最常运用的一种。11续排除法与选择法在形式上正好相反,它是通过对可选策略的相互比较,把不可能采用的较差策略排除掉,从而筛选出较好的策略,或者至少缩小候选策略的范围。这种排除法的思路导出了博弈分析中的严格下策反复消去法。 对囚徒的困境博弈中的两个博弈方来说不管对方的策略如何,各自两种可选策略中的“坦白”策略都比“不坦白”策略来得好。12续这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。一般地,如果在一个博弈中,不管其他博弈方的策略如何变化,一个博弈方的某种策略给他带来的得益,总是比另一种策略给他带来的得益要小,那么我
6、们称前一种策略为相对于后一种策略的一个“严格下策”。若对一个博弈运用严格下策反复消去法后,整个博弈方只有唯一的策略幸存下来,那么该策略将是该博弈方的唯一选择,如果该博弈的策略组合中只有唯一一个幸存下来,这个策略组合就是该博弈的结果。如囚徒的困境的博弈中的(坦白,坦白)。13 2.1.2 严格下策反复消去法应用严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略严格下策反复消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中142.1.3 划线法的基本思想博弈方的最终目标都是实现自身的最大得益。在具有策略
7、和利益相互依存性的博弈问题中,各个博弈方的得益既取决于自己选择的策略,还与其他博弈方选择的策略有关,因此,博弈方在决策时必须考虑其他博弈方的存在和策略选择。根据这种思想,科学的决策思路应该是:先找出自己针对其他博弈方每种策略或策略组合配合,给自己带来最大得益的策略(这种相对最佳对策总是存在的,不过不一定惟一),然后在此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。152.1.3 划线法应用1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚徒困境-1, 11, -11, -1-1
8、, 1猜硬币2, 10, 00, 01, 3性别之争162.1.4 箭头法的基本思想与应用1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚徒困境-1, 11, -11, -1-1, 1猜硬币2, 10, 00, 01, 3夫妻之争172.2 纳什均衡2.2.1 纳什均衡的定义2.2.2 纳什均衡的一致预测性质2.2.3 纳什均衡与严格下策反复消去法182.2.1 纳什均衡的定义策略空间:博弈方 的第 个策略:博弈方 的得益:博弈:纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合
9、 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡19纳什均衡:给定你的策略,我的策略是最优的,给定我的策略,你的策略是最优的或者用另外一种形式表示, 是下述最大化问题的解注意到上述定义中,可以取等号,这样的纳什均衡称为弱纳什均衡。如果 则称 是一个强(strict or strong)纳什均衡.也就是说一个纳是均衡什强的,给定其它人的略,每个参与人的最优策略是唯一的。20纳什均衡de具体表述(低价,低价)是纳什均衡100,10020,105150,2070,70高 价低 价高 价低 价寡头2寡头1双寡头的得益矩阵21纳什均衡的直观理解纳什均衡 的每一个策略称为纳什均衡战略 ,那么没
10、有任何一个战略严格优于纳什均衡战略。为了理解纳什均衡,从另一个角度思考:假设在博弈之前n个参与人达成一个协议,规定每一个参与人选择一个特定的策略,令 代表这个协议。我们要问在其他参与人都遵守这个协议,在没有外在强制的情况下是否有任何参与人有积极性不遵守这个协议?显然理性的参与人只有在遵守协议带来的效用大于不遵守协议带来的效用时,一个人才会遵守这个协议。如果没有任何人有积极性不遵守这个协议,那么这个协议是可以22纳什均衡的直观理解(续)自动实施的(self-enforcing),这个协议就构成一个纳什均衡。自动实施的(self-enforcing)在团队中的应用。232.2.2 纳什均衡的一致预
11、测性质一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果只有纳什均衡才具有一致预测的性质一致预测性是纳什均衡的本质属性一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能242.2.3 纳什均衡与严格下策反复消去法上策均衡定是纳什均衡,但纳什均衡不一定是上策均衡命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡命题2.2:在n个博弈方的博弈中 中,如果 是 的 一
12、个纳什均衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的25寻找纳什均衡一个应用模型描述:略纳什均衡:(进入,默许) 强纳什均衡 (不进入,斗争)弱纳什均衡40,50-10,00,3000,300默许斗争进入不进入在位者进入者市场进入博弈262.3 无限策略分析和反应函数2.3.1 古诺的寡头模型2.3.2 反应函数2.3.3 伯特兰德寡头模型2.3.4 公共资源问题2.3.5 反应函数的问题和局限性272.3.1 古诺的寡头模型二企业Cournot模型 (无限策略博弈) 古诺( Cournot ,1838),比纳什(1
13、950)的定义早100年假设条件:在一个寡头市场上两企业生产销售同质产品,市场总产量Q = q1+q2 (两寡头企业就是指这两家企业垄断了某一行业的市场) 市场出清价格 P = 8 - Q生产无固定成本,边际成本 c=c1=c2=2两企业同时独立地决定各自的生产产量(q1, q2)问题:两家企业应如何决策?28古诺的寡头模型分析企业1的利润(得益):u 1 (q1, q2) = Pq1 c1q1 = (8-Q) q1 - 2q1 = 6 q1- q1 q2- q12 企业2的得益:u 2 (q1, q2) = Pq2 c2q2 = (8-Q) q2 - 2q2 = 6 q2- q1 q2- q
14、2229古诺的寡头模型分析(续)设(q1*, q2*)是一纳什均衡,由联立求解: max q1 u 1 (q1, q2*) = max q1 (6 q1- q1 q2*- q12) max q2 u 2 (q1*, q2) = max q2 (6 q2- q1* q2- q22) 有 6- q2*- 2q1* =0 6- q1*- 2q2* =0其静态博弈模型有唯一纳什均衡:(q1*, q2*) =(2, 2)使市场总产量 Q* =q1*+q2*=4,市场出清价格 P*= 8 - Q*得二企业总得益:U *= u 1* + u 2*=4 +4=830古诺的寡头模型分析(续)二企业总得益:U =
15、 QP (Q) - cQ = 6Q- Q2有 6 - 2Q* =0 , 使最大产量Q* =3 , 即(q1*, q2*) =(1.5, 1.5)使二企业最大总得益:U* = u 1* + u 2*=4 .5 + 4.5 = 9 8 结论: 根据总体利益最大化确定的产量效率高于根据企业个体利益最大化确定的产量效率.314.5,4.55,3.753.75,54,4不突破突破厂商2不突破 突破厂商1以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5两寡头间的囚徒困境博弈322.3.2 反应函数古诺模型的反应函数(3,0)(6,0)(0,3
16、)(0,6)古诺模型的反应函数图示理性局限和古诺调整332.3.3 伯特兰德(Bertrand)寡头模型价格竞争寡头的博弈模型产品无差别,消费者对价格不十分敏感342.3.3 伯特兰德(Bertrand)寡头模型(续)解方程组得到纳什均衡:P81也是囚徒困境模型(自己推导)应用(1)家电价格战 (2)失败的彩电高峰会352.3.4 公共资源问题公共草地养羊问题以三农户为例 n=3,c=436合作:总体利益最大化竞争:个体利益最大化372.3.5 反应函数的问题和局限性在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡
17、。即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。382.4 混合策略和混合策略纳什均衡2.4.1 严格竞争博弈和混合策略的引进2.4.2 多重均衡博弈和混合策略2.4.3 混合策略和严格下策反复消去法2.4.4 混合策略反应函数392.4.1 严格竞争博弈和混合策略的引进一、猜硬币博弈-1, 11, -11, -1-1, 1正 面反 面猜硬币方盖硬币方正 面反 面(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念40二、混合策略、混
18、合策略博弈 和混合策略纳什均衡 混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。 混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。41三、一个例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析博弈方1的混合策略博弈方2的混合策略2, 35, 23, 11, 5CDAB博弈方2博弈方1 策略 得益博弈方1 (0.8,0.2) 2.6博弈方2 (0.8,0.2) 2.642四
19、、齐威王田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3pa上中下pb上中下pc上中下pd上中下pe上中下pf上中下pg上中下ph上中下pi上中下pj上中下pk上中下pl上中下田 忌齐威王得益矩阵431、齐威王田忌赛马的博弈分析(Cont )Emperor Qi 的策略由上到下分别称为策略a,b,c,d,e和f, Tian Ji 的策略由左到右分别
20、称为策略g,h,i,j,k和l当齐威王分别以概率pa,pb,pc,pd,pe,pf选择策略a,b,c,d,e和f时,田忌 选择g的期望得益-3pa-pb-pc+pd-pe-pf 选择h的期望得益-pa-3pb+pc-pd-pe-pf 选择i的期望得益-pa-pb-3pc-pd-pe+pf 选择j的期望得益-pa-pb-pc-3pd+pe-pf 选择k的期望得益pa-pb-3pc-pd-3pe-pf 选择l的期望得益-pa+pb-pc-pd-pe-3pf44齐威王田忌赛马的博弈分析(Cont )从这些表达式可以看出:田忌的期望得益是受齐威王选择的概率的影响。所以齐威王希望他选择的概率分布(pa,
21、pb,pc,pd,pe,pf)使田忌选任何策略都无可乘之机。也就是说上面6个期望得益相等。 解之得: pa=pb=pc=pd=pe=pf, 又因为: pa+pb+pc+pd+pe+pf=1 所以: pa=pb=pc=pd=pe=pf =1/6452、田忌赛马结果No Nash equilibrium solution exist From the reward matrix, we can find the probability that Emperor Qi would have won the game is 30/36 = 5/6.The optimal strategy of Emp
22、eror Qi and Tian Ji is (1/6, 1/6, 1/6, 1/6, 1/6, 1/6) respectively46五、小偷和守卫的博弈1996年3月Professor Selten于上海471、小偷和守卫的博弈模型1、模型的描述 如小偷偷窃,守卫睡觉,则小偷偷得脏物V (V0),守卫有负效用D (政府对守卫的惩罚 D0) 如小偷偷窃,守卫不睡觉,则小偷被抓有负效用P (政府对小偷的惩罚 P0), 守卫有效用 如小偷不偷窃,守卫睡觉,则小偷有效用,守卫有正效用S (S0) 如小偷不偷窃,守卫不睡觉,则小偷与守卫各有效用 V,-D-P,00,S0,0睡不睡偷不偷守卫小偷482
23、、小偷和守卫的博弈特征(无纯策略Nash均衡)非对称的零和博弈,因为他们的得益没有猜硬币那样对称,但本质上是一样的,一是在一次性博弈中没有自动实施的纯策略Nash均衡;二是不能让对对方预先猜测到自己的策略。 因此博弈方应该随机的方法来选择策略不能让对方有可乘之机。怎样来随机选择各自的策略呢? 一是:代数方法;二是:图示方法V,-D-P,00,S0,0睡不睡偷不偷守卫小偷493、小偷和守卫的博弈分析一是:代数方法 假设小偷选择“偷”策略的概率为pt ,选择“不偷”策略的概率为1 pt ; 假设守卫选择 “睡” 策略的概率为pg ,选择“不睡”策略的概率为1 pg;50小偷和守卫的博弈分析(代数方
24、法) (续)小偷的期望得益为: U1 = pt pg* V + (1 - pg*) (-P) + (1 - pt) 0守卫的期望得益为: U2 = pg pt* (-D)+ (1 pt*) S + (1 pg) 0由小偷和守卫期望得益最大化的一阶条件:U1/ pt = 0 和 U2/ pg = 0,我们有 pt* = S / (S+D) 和 pg* = P / (V+P) 51小偷和守卫的博弈分析(代数方法一) (续) 偷 pt* = S / (S+D) 和睡 pg* = P / (V+P) 小偷分别以概率pt* = S / (S+D)和 1- pt* = D / (S+D) 选择“偷”与“不
25、偷” 策略, 即( S / (S+D) , D / (S+D) )守卫分别以概率 pg* = P / (V+P)和 1- pg* = V / (V+P) 选择“睡”与“不睡” 策略 即( P / (V+P) ,V / (V+P) )( S / (S+D) , D / (S+D) ), ( P / (V+P) ,V / (V+P) )构成了小偷和守卫博弈的唯一混合策略纳什均衡 52小偷和守卫的博弈分析(代数方法二) (续)小偷选择“偷”策略的概率为pt ,选择“不偷”策略的概率为1 pt ;使得守卫选择睡与不睡无差异,即对 守卫: pt* (-D)+ (1 pt*) S =0整理得: -(D+S
26、) pt* + S =0同样可分析小偷的得益(略)534、小偷和守卫的博弈分析(图示方法)小偷的决策:U守卫睡 = pt (-D)+ (1 pt) S 前面分析时知道:小偷选择“偷”与“不偷”时:U守卫不睡 =0于是:直线与横轴的交点就是小偷的最佳决策pt* 。V,-D-P,00,S0,0睡不睡偷不偷守卫小偷54Cont.0- D- D守卫得益(睡)SPt 小偷偷的概率155小偷的决策(cont.)注意到:如果小偷偷,守卫睡,则守卫有D个单位的惩罚,若D增大到D ,则小偷的最佳决策偷将减少。V,-D-P,00,S0,0睡不睡偷不偷守卫小偷56Cont.0- D- D守卫得益(睡)SPt 小偷偷
27、的概率157小偷和守卫的博弈分析(图示方法)(Cont)守卫的决策: U小偷偷 = pgV + (1 - pg) (-P) 前面分析时知道:守卫选择“睡”与“不”时:U不偷 =0于是:直线与横轴的交点就是守卫的最佳决策pg* 。V,-D-P,00,S0,0睡不睡偷不偷守卫小偷58Cont0- P- P小偷得益(偷)VPg 守卫睡的概略159守卫的决策(cont.)注意到:如果守卫不睡,小偷偷,则小偷被抓住有P个单位的惩罚,若P增大到P ,则守卫的最佳决策睡将增加。V,-D-P,00,S0,0睡不睡偷不偷守卫小偷60Cont0- P- P小偷得益(偷)VPg 守卫睡的概略1615、结果与实践意义
28、激励的悖论 (P97)通过前面的分析,增加对守卫的惩罚作用,可以之犯罪有很好的作用。但小偷的惩罚D由于守卫的收入P无关。为什么守卫不睡呢?实践:(1)黑农江的污染事件(2)矿难62练习1: 社会福利博弈63练习2:监督博弈642.4.2 多重均衡博弈和混合策略一、夫妻之争的混合策略纳什均衡2, 10, 00, 01, 3时 装足 球时装足球丈 夫妻子夫妻之争妻子的混合策略丈夫的混合策略65夫妻之争的混合策略纳什均衡(cont.)夫妻之争博弈的混合策略纳什均衡 博弈方1 (0.75,0.25) 博弈方2 (1/3,2/3)考察在该混合均衡下的双方得益妻子:pw(C)ph(C)*2+ph(F)*0
29、+pw(F)ph(C)*0+ph(F)*1 =3/4*1/3*2+1/4*2/3*1=0.67丈夫: pw(C)ph(C)*1+ph(F)*0+pw(F)ph(C)*0+ph(F)*3 =3/4*1/3*1+1/4*2/3*3=0.75若两人协商选择(时装,时装),(足球,足球)的一个其收益都大于0.67,0.75。沟通的重要性:夫妻,团队,人际关系,一些制式66二、制式问题-不同的原理or技术标准or.实践意义:引进技术、投资、开发产品等决策时,必 须以大局为重,各自为政会导致低效率。例如:重复建设,产品不能相互带动。1, 30, 00, 02, 2ABAB公司2公司1制式问题 制式问题混合
30、策略纳什均衡 A B 得益厂商1: 0.4 0.6 0.664厂商2: 0.67 0.33 1.29667三、市场机会博弈-50,-50100,00,1000,0进不 进进不进厂商2厂商1市场机会 进 不进 得益厂商1: 2/3 1/3 0厂商2: 2/3 1/3 0682.4.3 混合策略和严格下策反复消去法结论:严格下策反复消去法既不会消去纯策略Nash均衡也不会消去混合策略Nash均衡。对博弈方1和博弈方2,都没有严格下策。但是博弈方1采用混合策略(1/2,1/2,0)时,博弈方2采用纯策略L时,博弈方1的得益:U1=1/2*3+1/2*0+0*1=3/23, 10, 20, 23, 3
31、1, 31, 1LRUMD博弈方2博弈方169混合策略和严格下策反复消去法(cont)即使博弈方2也采用混合(q,1-q),博弈方1的得益:U1=1/2*q*3+1/2*(1-q)*0+1/2*q*0+ 1/2*(1-q)*3=3/2表明:策略D是相对于混合策略(1/2,1/2,0)的严格下策。于是删去策略D得到又变得博弈。3, 10, 20, 23, 3LRUM博弈方2博弈方1702.4.4 混合策略de反应函数反应函数一博弈方对另一博弈方每种可能的决策内容的最佳反应决策构成的函数。在混合策略中,博弈方的决策是概率分布,因此反应函数是一方对另一方的概率分布的反应。例1:猜硬币博弈 用(r,1
32、-r)表示盖硬币方 的混合策略,用(q,1-q)表 示盖硬币方的混合策略。 那么反应函数就是r和q的关系-1, 11, -11, -1-1, 1正 面q反 面1-q猜硬币方正面 r反面1-r猜硬币博弈盖硬币方712.4.4 混合策略反应函数 猜硬币博弈rq111/21/2(r,1-r):盖硬币方选择正反面的混合策略概率分布(q,1-q):猜硬币方选择正反面的混合策略概率分布-1, 11, -11, -1-1, 1正 面q反 面1-q猜硬币方正面 r反面1-r猜硬币博弈盖硬币方72例2:夫妻之争博弈2, 10, 00, 01, 3时装q足球1-q丈夫时装r球1-r妻子夫妻之争rq111/31/3
33、(r,1-r):丈夫的混合策略概率分布(q,1-q):妻子的混合策略概率分布732.5 纳什均衡的存在性Nash 定理(1950,Nash的存在性定理1 ): 在一个博弈G =S1, Sn ; u1, un ,如博弈方个数n有限, 博弈方的策略空间Si都为有限集,则该博弈至少存在一个Nash均衡,但可能包含混合策略Nash 定理:每一个有限博弈至少存在一个纯策略的或混合策略的纳什均衡。教材106页证明。主要根据是布鲁威尔和角谷的不动点定理。纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。742.5 纳什均衡的存在性(Cont)纳什均衡的奇数定理 威尔逊(Wilson)
34、在1971年证明,几乎所有有限博弈都有有限奇数个纳什均衡。如果一个博弈有2m(即偶数个)纯策略纳什均衡,则一定存在第2m+1个(即奇数个)混合策略纳什均衡。 752.6 纳什均衡的选择和分析方法扩展2.6.1 多重纳什均衡博弈的分析2.6.2 共谋和防共谋均衡762.6.1 多重纳什均衡博弈的分析帕累托上策均衡风险上策均衡聚点均衡相关均衡77一、帕累托上策均衡有些博弈问题虽然存在着多个Nash均衡,但是所有博弈方明显都对其中一个Nash均衡有相同的偏好,这个均衡称为帕累托上策均衡例1:鹰鸽博弈经典博弈 鹰鸽博弈并不是鹰鸽两种动物之间的博弈,恰恰是同一物种、种群内部竞争和冲突问题。78模型描述:
35、这个博弈中有两个纯策略纳什均衡,(鹰,鹰)和(鸽,鸽)显然后者帕累托优于前者,所以, (鸽,鸽)是本博弈的一个帕累托上策均衡。(v-c/2), (v-c/2)c/3, v/3V/3, c/3v, v鹰鸽博弈方2鹰鸽博弈方1战争与和平79例2:国家之间的战争与和平问题这个博弈中有两个纯策略纳什均衡,(战争,战争)和(和平,和平),显然后者帕累托优于前者,所以,(和平,和平)是本博弈的一个帕累托上策均衡。注意到:实际中, (和平,和平)并不容易实现。-5, -5-10, 88, -1010, 10战争和平国家2战争和平国家1战争与和平80例3:寡头市场的价格竞争价格竞争类似国家的战争与和平的选择。
36、于是人们常说:“价格战”。价格战企业核心竞争力81二、风险上策均衡博弈模型1:纯策略Nash均衡(U,L) and(D,R),且(U,L)为帕累托上策均衡。混合策略Nash均衡(7/8,1/8),( 7/8,1/8 )(求法略)注: (U,L)均衡一定能实现吗?9, 98, 00, 87, 7LR博弈方2UD博弈方1风险上策均衡(D,R)82风险上策均衡的定义:虽然某个Nash均衡帕累托优于另一个Nash均衡,但风险却要高于后者,为了规避风险,博弈方必然趋于选择后一个Nash均衡策略,这个Nash均衡称为“风险上策均衡”(Risk-dominant Equilibrium)例如:上例中(D,R
37、)为“风险上策均衡”83猎鹿博弈(Stag-hunting game)模型描述P112(略)5, 53, 00, 33, 3鹿兔子猎人2鹿兔子猎人1猎鹿博弈风险上策均衡(兔子,兔子)84三、聚点均衡(Focal Points Equilibrium)利用博弈设定以外的信息和依据选择的均衡文化、习惯或者其他各种特征都可能是聚点均衡的依据城市博弈(城市分组相同)时间博弈(报出相同的时间)是聚点均衡的典型例子85四、相关均衡在博弈中遇到多重Nash均衡的难题时,博弈方就应设计某种形式的均衡选择机制,“相关均衡”就是在这种机制下选择出的Nash均衡。86一个例子模型1:纳什均衡:(U,L)、(D,R)
38、得益相差很大,双方都不会妥协选择某一个。聚点均衡(天气,抛硬币),但仍不理想。5, 14, 40, 01, 5LR博弈方2UD博弈方1相关均衡例子三个纳什均衡:(U,L)、(D,R)和混合策略均衡(1/2,1/2),(1/2,1/2)结果都不理想,不如(D,L)。87Cont.同时混合策略也不是理想的结果。因为双方的期望得益只有2.5。由于这3个Nash均衡都不会实现。必须设计一种机制:一是排出较差的组合(U,R),二是希望达到更好的组合(D,L).甑么11111论丛林88Cont.发出“相关信号”的相关装置:1、各以1/3概率选择A、B、C三种信号;2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。5, 14, 40, 01, 5LR博弈方2UD博弈方1相关均衡例子89Cont.该机制具有以下性质:(1)U,R不会同时出现(为什么?)即排出(U,R)(2)(U,L),(D,L),(D,R)各以1/3的概率出现。从而两博弈方的期望得益达到10/3。(3)该装置是一个Nash均衡。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《知识产权前沿问题》课件
- 《支气管哮喘防治》课件
- 地理(河南)-【八省联考】河南、山西、陕西、内蒙古、四川、云南、宁夏、青海八省2025年高考综合改革适应性演练
- 《对标管理咨询》课件
- 人教版八年级上册地理第2章《中国的自然环境》教案
- 小学数学二年级数学加减法练习题
- 一模阅卷语知作文评分说明南京市一模阅卷语知阅读评分细则
- 上杭一中届模拟试卷语文试题
- 宠物用品设计师职位概述
- 促进学生学业成绩提高的班级计划
- 2024年机动车检测站质量手册程序文件记录表格合集(根据补充要求编制)
- 公司未来发展规划及目标制定
- 2023-2024学年上海市普陀区三年级(上)期末数学试卷
- 2024年01月11067知识产权法期末试题答案
- 2025版国家开放大学法律事务专科《民法学(2)》期末纸质考试案例分析题库
- 浙江省杭州市钱塘区2023-2024学年四年级上学期语文期末试卷
- 小班班本课程《吃饭这件小事》
- 中国特色大国外交和推动构建人类命运共同体
- 《风电场项目经济评价规范》(NB-T 31085-2016)
- 巢湖地区地质调查报告 最终版[沐风文苑]
- 生产计划流程内容培训工厂生产线管理工作总结汇报PPT模板
评论
0/150
提交评论