版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章完全信息静态博弈
所谓完全信息静态博弈即各博弈方同时决策,且所有博弈方对博弈中的各种情况下的得益都完全了解的博弈问题纳什均衡无限策略博弈的解和反应函数混合策略纳什均衡的存在性博弈模型的表述(标准式扩展式,补充内容)3.1市场进入的静态博弈B进入不进入A进入–1,–11,0不进入0,10,01.得益矩阵行博弈方列博弈方博弈方1的策略空间策略组合的得益(行博弈方在行策略下的支付,列博弈方在列策略下的支付)列博弈方的策略空间博弈模型的表述(标准式扩展式,补充内容)图3.1市场进入的动态博弈:A先行动A进入不进入进入不进入进入不进入(–1,–1)(1,0)(0,1)(0,0)BB终点结策略组合的得益(先行动博弈方相应策略下的支付,后行动博弈方相应策略下的支付)决策结:博弈方“枝”:一个“行动”扩展式2.1.1上策均衡分析
1上策:在一个博弈问题中,如果不管其他博弈方选择什么策略,能够给一博弈方带来最大得益的策略,称为这个博弈方的一个上策。2上策均衡:所有博弈方的上策组成的策略组合,称为上策均衡。上策均衡分析是最基本的博弈分析方法对于一个博弈问题,上策均衡不一定存在.2.1基本分析思路和方法
2.1.2严格下策反复消去法严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略严格下策反复消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中严格下策反复消去法的使用范围比上策均衡分析宽。对于一个博弈问题,严格下策不一定存在。2.1基本分析思路和方法2.1.3、划线法1、方法:对于其他博弈方每一种策略或者策略组合,找出自己的最佳策略,并在得益上划线。2、应用例1、得益距阵:
博弈方2左中右
上博弈方1
下只有策略组合(上,中)的双方策略对于对方策略的最佳策略1,01,30,40,20,12,02.1.3划线法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬币2,10,00,01,3夫妻之争策略之间的相对优劣关系,而不是绝对优劣关系——划线法。有时,划线也不能解决博弈的最终问题。2.1.4箭头法1、方法
考察在每个策略组合处各个博弈方能否通过提高单独改变自己的策略而增加得益。如果能,用箭头指示得益增加的方向。例1、得益距阵:博弈方2左中右上博弈方1下
只有策略组合(上,中)的得益数组处只有指向的箭头而没有指出的箭头,双方策略对于对方策略的最佳策略1,01,30,10,40,22,02.1.4箭头法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬币2,10,00,01,3夫妻之争与划线法思路有所不同,但效果与划线法相同。主要分析行动的选择过程。稳定稳定两个稳定结果无法语言一次博弈的最终结果2.2.1纳什均衡的定义策略空间:博弈方的第个策略:博弈方的得益:博弈:2、纳什均衡的定义:对于博弈G={S1,…,Sn;u1,…,un},如果某个策略组合(s1*,…,sn*)中任意博弈方i的策略si*都是对其他博弈方策略组合(s1*,…,si-1*,si+1*,…sn*)的最佳策略,即ui(s1*,…,si-1*,si*,si+1*,…sn*)ui(s1*,…,si-1*,sij,si+1*,…sn*)对于任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。纳什均衡的实质:通俗地说,纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。2.2、纳什均衡2.2.2纳什均衡的一致预测性质纳什均衡的特征:在纳什均衡的策略组合中,各个博弈方都不愿意单独改变策略,具有稳定性。纳什均衡具有一致预测性和普遍存在性两个重要性质,体现了纳什均衡1、一致预测性:如果所有的博弈方都预测特定的博弈结果会出现,那么所有博弈方都不会利用该预测方法或者预测能力,选择与预测结果不一致的策略。如果没有一致预测性质的博弈分析,将会出现预测和行为之间的矛盾,甚至自我否定。2、纳什均衡具有一致预测性。任何非纳什均衡都不是具有一致预测性。2.2.3纳什均衡的求解上策均衡一定是纳什均衡,但是上策均衡不一定存在划线法:例:囚徒困境博弈
囚徒2
不坦白坦白
囚不坦白
徒
1坦白
箭头法例:夫妻之争博弈
丈夫时装足球妻时装子足球
-1,-1
-8,0
0,-8
-5,-52,10,00,01,32.2.4严格下策反复消去法与纳什均衡严格下策:对于某一策略,若则称为的严格下策。命题2.1在n个博弈方的博弈中,如果严格下策反复消去法排除了以外的所有策略组合,则一定是G的唯一的纳什均衡。命题2.2在n个博弈方的博弈中,如果是G的一个纳什均衡,则严格下策反复消去法一定不会将它消去。小结纳什均衡点是一种局部均衡点,可以有很多个,也可以不存在。来源于策略组合的策略可能有n!个(离散),也可能无穷多个(连续),那么求解将会十分烦琐。得益对于任一策略(s1,…,sn),其总得益为各博弈方得益之和那么对于具有多个纳什均衡点的博弈,则对应的应有最优纳什均衡的概念,而对应于最优纳什均衡的点为全局最优点。此处最优的含义为稳定性而不是得益之和最大。2.3无限策略的解和反应函数古诺的寡头模型反应函数伯特兰德的寡头模型公共资源问题2.3.1古诺的寡头模型模型:设一市场有1、2两个厂商生产同样的产品。如果厂商1的产量为q1,厂商2的产量为q2,则市场总产量为Q=q1+q2。设市场出清价格是P=P(Q)=8-Q,生产无固定成本,单位变动成本为2,讨论其纳什均衡。
分析:1、个体收益最大化博弈方1利润:博弈方2利润:
2.3.1古诺的寡头模型在本博弈中,的纳什均衡的充分必要条件是和的最大值问题:第一个对q1求导,并将q1*代入,6-q2*-2q1*=0第二个对q2求导,并将q2*代入,6-q1*-2q2*=0解得唯一解2、社会收益最大化:假设总产量为Q,总收益为U=QP(Q)-CQ=Q(8-Q)-2Q=6Q-Q2其最大值为Q*=3,U=9该结果与纳什均衡有较大的差异,这就是纳什均衡是源于各厂商追求自身利益最大化的结果。厂商14.5,4.55,3.753.75,54,4不突破突破厂商2不突破突破以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5两寡头间的囚徒困境博弈当然不难看出该博弈是一个囚徒困境博弈。2.3.2反应函数
反应函数-每个博弈方针对其他博弈方所有策略的最佳反应构成的函数。而各个博弈方反应函数的交点(如果有的话)就是纳什均衡。
在上面讨论的两寡头古诺模型中,对厂商2的任意产量q2,厂商1的最佳对策产量q1,就是使白己在厂商2生产产量q2的情况下利润最大化的产量,即q1是最大化问题:的解。上式对q1求导并令导数等于0由此得:2.3.2反应函数-古诺模型
这样我们得到了对于厂商2的每—个可能的产量,厂商1的最佳对策产量的计算公式,它是厂商2产量的一个连续函数,我们称这个连续函数为厂商1对厂商2产量的一个“反应函数”(ReactionFunction)。q26363q1
由于这两个反应函数都是连续的线性函数,因此可以用坐标平面上的两条直线表示它们,如图:(2,2)同样的方法,我们可再求出厂商2对厂商1产量q1的反应函数:2.3.2反应函数-古诺模型2.3.2反应函数-古诺模型在古诺模型中厂商1和厂商2的反应函数分别为q2q1(0,6)(0,3)R1(q2)R2(q1)(2,2)60(3,0)(6,0)
从左图可以看出,当一方的选择为0时,另一方的最佳反应为3,这正是我们前面所说过的实现总体最大利益的产量,因为一家产量为零,意味着另一家垄断市场。当一方的产量达到6时,另一方则被迫选择0,因为实际上坚持生产已无利可图。
现在我们把反应函数法应用到伯特兰德模型的分析。伯持兰德1883年提出了另一种形式的寡占模型。这种模型与选择产量的古诺模型的区别在于,伯特兰德模型中各厂商所选择的是价格而不是产量。我们用简单的两寡头且产品有一定差别的伯特兰德价格博弈模型进行分析。2.3.3伯特兰德寡头模型
上述产品有一定差别是指两个厂商生产的是同类产品,但在品牌、质量和包装等方面有所不同,因此伯特兰德模型中厂商的产品之间有很强的替代性.但又不是完全可替代,即价格不同时,价格较高的不会完全销不出去。当厂商1和厂商2价格分别为P1和P2时,它们各自的需求函数为:和求出两厂商对对方策略(价格)的反应函数分别为:和
我们直接用反应函数法分析这个博弈。上两式分别对P1和P2求偏导,并令偏导数为0,由此得:
纳什均衡(P1*,P2*)必是两反应函数的交点,即必须满足:求解此方程组即可得到纳什均衡(P1*,P2*):记:具体地,如果进一步假设模型中的参数分别为:
将P1*,P2*代入得益函数则可进一步得到两厂商的均衡得益值。则可以得到:P1*=P2*=20,u1*=u2*=324。2.3.3伯特兰德的寡头模型模型:两个厂商生产的是同类产品,但是在品牌、质量和包装上有不同。产品具有替代性,但是不完全替代。在该模型中厂商选择价格而不是产量厂商1的价格与需求函数:P1,厂商2的价格与需求函数:P2,其中,d1,d2>0为两厂商产品的替代系数。假设两厂商无固定成本,边际成本分别为c1和c2。2.3.3伯特兰德的寡头模型收益:纳什均衡:如果a1=a2=28,b1=b2=1,d1=d2=0.5,c1=c2=2,那么P1*=P2*=20,u1*=u2*=324。与古诺模型一样,其纳什均衡不是协商、合作得到的最佳结果,2.3.4公共资源问题公共资源(1)没有哪个个人、企业或其他经济组织拥有;(2)大家都可以自由利用,具有这样两个特征的自然资源或人类生产的供大众免费使用的设施或财货。比如:地下水、公共道路(没有限制)等。例设某村庄有n个农户,一公共草地,可养羊数为qi(i=1,…,n)为n个农户各自的策略空间,当各户养羊数为q1,…,qn时,总数为Q=q1+…+qn,每只羊的产出为羊的总数Q的减函数V=V(Q)=V(q1+…+qn),假设每只羊的成本为c,则农户i养qi只羊的得益为:ui=qiV(Q)-qic2.3.4公共资源问题-实例
设n=3,V=100-Q=100-(q1+q2+q3),c=4三农户的得益函数和反应函数:u1=q1[100-(q1+q2+q3)]-4q1,q1=R1(q2,q3)=48-0.5q2-0.5q3
u2=q2[100-(q1+q2+q3)]-4q2,q2=R1(q1,q3)=48-0.5q1-0.5q3
u3=q3[100-(q1+q2+q3)]-4q3,q3=R1(q1,q2)=48-0.5q1-0.5q2纳什均衡:q1*=q2*=q3*=24,
u1*=u2*=u3*=576然而:最大总体收益:u*=2304Q*=48由此说明,纳什均衡的解常常是低效率的,而在现实生活中却经常出现。如果采取最佳策略(集体理性),那么个体的贪婪性将会来破坏这一平衡。2.3.5反应函数的问题和局限性在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。当均衡不唯一的情况下,也不一定能找到均衡点2.4混合策略和混合策略纳什均衡2.4.1严格竞争博弈和混合策略的引进2.4.2多重均衡博弈和混合策略2.4.3混合策略和严格下策反复消去法2.4.4混合策略反应函数2.4.1严格竞争博弈和混合策略的引进在前面的例子,如猜硬币,齐威王田忌赛马,夫妻之争等博弈问题不存在纳什均衡策略组合,然而这类问题十分常见。例1.若被对手事先知道出现哪一面,肯定输2.若正面出现的概率为p,负面为1-p,且p>0.5,则猜正面的话赢的几率就比较大。-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面2.4.1严格竞争博弈和混合策略的引进特点:1.自己的选择不能让对手预先知道2.若重复多次,则不让对手发现其中的规律。除非有意输(一种行贿的手段),注意行贿只是一个手段,有意无意间让对手了解自己的策略或规律。混合策略、混合策略博弈和混合策略纳什均衡定义:在博弈G={s1,…,sn;u1,…un}中,博弈方i的策略空间为Si={si1,…,sik},则博弈方i以概率分布pi=(pi1,…,pik)随机选择其k个可选策略称为一个“混合策略”,其中0≤pij≤1对j=1,…,k都成立且pi1+…+pik=1。相对于这种以一定概率分布在一些策略中随机选择的混合策略,确定性的具体的策略我们称为“纯策略”混合策略的原则:自己的策略选择不能被另一方预知或猜到。选择每种策略的概率一定要恰好使对方无机可乘。混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。三、一个例子博弈方1选A、B的概率:pA,pB;博弈方2选C、D的概率:pC,pD。原则应用:博弈方1选A和B的概率pA和pB一定要使博弈方2选C的期望得益和选D的期望得益相等。即pA×
3
+pB×1=pA×
2
+pB×5又由pA+pB=1,可得pA=0.8,pB=0.2,此即博弈方1应选的混合策略。同理可得博弈方2的混合策略为pC=0.8,pD=0.2。纳什均衡:1(0.8,0.2),2(0.8,0.2)期望得益:u1e=pA.pC.u1(A,C)+pA.pD.u1(A,D)+pB.pC.u1(B,C)+pB.pD.u1(B,D)=2.6u2e=2.6单独一次博弈的结果可能是四种状态的如何一种,然而多次独立重复博弈得到如上的结果是可能的。
2,35,23,11,5
2CDA1B四、其它应用混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样可应用于存在多个纯策略纳什均衡的博弈问题。例1夫妻之争该博弈与上一个博弈的不同之处在于每一方所希望对方知道自己的策略选择以达到有利于自己的结果。现实中,这类问题多通过协商解决以免两败俱伤。在此我们假设夫妻双方不可协商,互不通消息。令pw(时),pw(足)分别表示妻子选择时装表演和足球的概率;
ph(时),ph(足)为丈夫选择时装表演和足球的概率。同样的分析方法可得pw(时)=0.75,pw(足)=0.25;ph(时)=1/3,ph(足)=2/3.双方的期望得益分别为uwe=0.67,uhe=0.75。
丈夫时装足球妻时装子足球2,10,00,01,32.齐威王田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田忌齐威王得益矩阵3.小偷和守卫博弈V,-D-P,00,S0,0睡不睡偷不偷守卫小偷一小偷欲偷窃有一守卫看守的仓库,如果小偷偷窃时守卫在睡觉,则小偷就能得手,偷得价值为V的脏物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。设小偷被抓住后要坐牢,负效用为-P,守卫睡觉而未遭偷窃则有S的正效用,因睡觉被窃要被解雇,其负效用为-D。而如果小偷不偷则他既无得也无失,守卫不睡觉意味着出一份力赚一分钱,他也没有得失。2.小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫小偷加重对守卫的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概率0-D-D’守卫得益((睡)SPt小偷偷的概率1Pt*Pt*’守卫睡的期望得益S(1-Pt)+(-D)PtPt1-Pt3.小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫小偷加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒0-P-P’小偷得益(偷)VPg守卫睡的概率1Pg*Pg*’小偷偷的期望得益VPg
+(-P)(1-Pg)Pg1-Pg当我们为减少盗窃率,加重对小偷的惩罚时,最终的结果却带来了守卫的偷懒,形成了一种政策目标和政策结果之间的意外关系,这就被称为“激励的悖论”。小偷偷东西,保安渎职。为了避免这种情况,是加重对小偷的惩罚呢,还是加重对保安的惩罚?由此给我们带来什么启示?执法,监督,等等2.4.2多重均衡博弈和混合策略一、夫妻之争的混合策略纳什均衡2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡策略得益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.75二、制式问题1,30,00,02,2ABAB厂商2厂商1制式问题制式问题混合策略纳什均衡AB得益厂商1:0.40.60.664厂商2:0.670.331.296三、市场机会博弈-50,-50100,00,1000,0进不进进不进厂商2厂商1市场机会进不进得益厂商1:2/31/30厂商2:2/31/302.4.3混合策略和严格下策反复消去法3,10,20,23,31,31,1LRUMD博弈方2博弈方1博弈方2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用纯策略R时,博弈方1采用混合策略(1/2,1/2,0)的得益纳什均衡(M,R),双方得益为(3,3)2.4.4混合策略反应函数-1,11,-11,-1-1,1正面q反面1-q猜硬币方正面r反面1-r猜硬币博弈盖硬币方rq111/21/2(r,1-r):盖硬币方选择正反面的混合策略概率分布(q,1-q):猜硬币方选择正反面的混合策略概率分布夫妻之争博弈2,10,00,01,3时装足球丈夫时装足球妻子夫妻之争rq113/41/3r1-rq1-q(r,1-r):丈夫的混合策略概率分布(q,1-q):妻子的混合策略概率分布2.5纳什均衡的存在性允许采取混合策略的情况下,是否每个博弈都有纳什均衡?纳什定理在一个有n个博弈方的博弈G={s1,…,sn;u1,…un}中,如果n是有限的,且si都是有限集(对i=1,…,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。教材106页证明。主要根据是布鲁威尔和角谷的不动点定理。纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。2.6纳什均衡的选择和分析方法扩展2.6.1多重纳什均衡博弈的分析帕累托上策均衡风险上策均衡聚点均衡相关均衡2.6.2共谋和防共谋均衡多人博弈中的共谋问题防共谋均衡2.6.1多重纳什均衡博弈的分析
一个博弈中存在的纳什均衡不止一个,就是一个多重纳什均衡的博弈问题帕累托上策均衡
概念根据帕累托效率意义上的优劣关系选择出来的纳什均衡,就是帕累托上策均衡。案例:“战争与和平”博弈问题(1)帕累托上策均衡:(和平,和平)(2)实际发生战争的原因:包括决策者考虑短期利益、个人或小集团利益更多,决策者确实缺乏理智和理性,或者局部地区或特定时期战争的利益比上述博弈中所假设的要大。
国家2战争和平国战争家
1和平-5,-58,-10-10,810,102.6.1多重纳什均衡博弈的分析概念
如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略概率相同时,都偏爱其中某一纳什均衡,则该纳什均衡就是风险上策均衡。风险上策均衡案例:猎鹿博弈
(1)(兔子,兔子)是这个猎鹿博弈的一个风险上策均衡,精明的博弈方往往会选择抓兔子而不是抓鹿。(2)博弈方对风险上策的选择倾向,有一种自我强化的机制。博弈方2鹿兔子鹿
兔子5,50,33,03,3博弈方2二、风险上策均衡考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。下面就是两个例子。9,98,00,87,7LR博弈方2UD博弈方1风险上策均衡(D,R)5,53,00,33,3鹿兔子猎人2鹿兔子猎人1猎鹿博弈风险上策均衡(兔子,兔子)(U,L)是帕累托上策均衡帕累托上策均衡并不是有强制力的法则考虑风险因素,(D,R)具有相对优势。称(D,R)是风险上策均衡。2.6.1多重纳什均衡博弈的分析聚点均衡
并不是所有无帕累托优劣关系的多重纳什均衡博弈中,人们的选择都没有规律性。有时人们也会利用博弈规则以外的特定信息来做选择,如博弈方共同的文化背景下的习惯、规范等聚点聚点均衡是指在多重纳什均衡的博弈中,双方同时选择一个聚点构成的纳什均衡。当然聚点均衡首先是纳什均衡,是多重纳什均衡中比较容易被选择的纳什均衡。经典例子城市博弈、夫妻之争博弈聚点均衡2,10,00,01,3时装1/3足球2/3丈夫q时装3/4足球1/4妻子r夫妻之争可以利用规则以外的特定信息,如博弈方共同的文化背景中的习惯或规范,共同的知识,或者具有特定意义事物的特征,某些特殊的数量、位置关系等。例如:报时、城市博弈报时博弈中的“0点”或“12点”这样策略为该博弈的“聚点”。在多重纳什均衡的博弈中,双方同时选择一个聚点构成的纳什均衡称为聚点均衡。利用博弈设定以外的信息和依据选择的均衡文化、习惯或者其他各种特征都可能是聚点均衡的依据城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子聚点均衡来自谢林的《冲突的策略》,这本博弈论的经典之作没有方程,也没有数学符号。在该书中谢林举了很多例子。比如其中一个例子:你和其他参与人均从下面一组数中选择一个数,并画上圈:7,100,13,261,99,666。如果你们选择相同则赢利越多。你会选择哪个数呢?谢林发现选7是最常见的策略,但在一群比较贪婪的人群中,666也有可能成为聚点。如果博弈重复多次,则过去的历史常常就规定了聚点之所在。我所在的学院每到周一下午就会开会,大家在会议室的座位本来是不固定的,但是每学期第一次会议大家所坐的位置,基本上会在这个学期都是他坐的位置,因为每次开会时大家就会习惯性地坐到上次坐过的位置,这种座位配置也如同产生了聚点一样。新婚夫妻的家务分担博弈也是如此,在婚姻初期谁做家务做得多,那就意味着可能这一辈子他/她都会做更多的家务,这也是一个聚点。2.6.1多重纳什均衡博弈的分析相关均衡概念相关均衡是这样的一种均衡选择机制:博弈方主动寻求方法,设计某种形式的均衡选择机制,以解决多重纳什均衡选择问题。如:在夫妻之争博弈中,设计选择机制:如果天气好一起去看足球,否则要求去看时装表演.存在问题在比较复杂的、设定得不是很清楚的现实博弈问题这个中,博弈方是否有能力设计出一种有足够的理解和和相互信任的均衡机制,是有一定疑问的。应用:如社会经济制度创新方面.相关均衡5,14,40,01,5LR博弈方2UD博弈方1相关均衡
两个纯策略纳什均衡利益相差很大,很难达成妥协,聚点均衡不适用。进一步发展,设计“相关装置”,(1)该装置以相同的可能性(各1/3)发出A、B、C三种信号;(2)博弈方1只能看到信号是否A,博弈方2只能看到该信号是否C;(3)博弈方1看到A采用U,否则采用D;博弈方2看到C采用R,否则采用L。它排除(U,R),各以1/3的概率出现(U,L)、(U,D)和(D,R),从而使双方的期望得益为10/3。混合策略纳什均衡[(1/2,1/2),(1/2,1/2)]的期望得益为2.5。均不理想,事前设计均衡选择机制。
如抛一匹硬币,出现正面博弈方1采用U,博弈方2采用L;出现反面博弈方1采用D,博弈方2采用R。
避免(U,R)出现,双方期望得益均为3。
相关均衡概念由博弈论专家奥曼提出。如果博弈的参与人可以根据某个共同观测到的信号选择行动,就可能出现相关均衡
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年腈纶扁平丝项目成效分析报告
- 2024年血液净化产品项目综合评估报告
- 2024至2030年中国金银制品数据监测研究报告
- 2024年轧制、锻造钢坯项目综合评估报告
- 2024至2030年中国碳弧气刨数据监测研究报告
- 2024至2030年中国电动车塑料工具箱数据监测研究报告
- 2024至2030年中国气扳数据监测研究报告
- 2024至2030年中国提升机盘形闸故障及状态检测仪行业投资前景及策略咨询研究报告
- 2024至2030年中国天然贴面板数据监测研究报告
- 2024至2030年中国双室式U型焰加热炉数据监测研究报告
- 中医操作评分表
- 冯晓霞教授的《幼儿学习品质观察评定表》
- 手工焊接作业指导书
- 拱桥悬链线计算表
- 半年分析----住院超过30天患者原因分析及改进措施
- 无公害农产品查询
- 国家公派出国留学经验交流PPT课件
- 研究生课程应用电化学(课堂PPT)
- 六宫数独可直接打印共192题
- 班会:如何克服浮躁心理PPT优秀课件
- Monsters歌词下载,Monsters原唱歌词中文翻译,Monsters简谱KatieSky
评论
0/150
提交评论