博弈论期末复习题(文档)_第1页
博弈论期末复习题(文档)_第2页
博弈论期末复习题(文档)_第3页
博弈论期末复习题(文档)_第4页
博弈论期末复习题(文档)_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、支付矩阵1、试给出下述战略式表述博弈的纳什均衡BLRAU1,32,5D4,16,2解:由划线解得知有一个纯战略均衡(D,R)再看看它可否有混杂战略均衡设B以(,1)玩混杂战略,则有均衡条件:VA(U)12(1)2VA(D)46(1)62262得41,这是不可以能的,故无混杂战略均衡,只有这一个纯战略均衡。2、试将题一中的支付作一更正使其有混杂战略均衡解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混杂战略均衡。BLRAU5,62,5D4,16,2将博弈改成上述模型,则52(1)46(1)23624得5同样,设A的混杂战略为(,1),则161(1)52(1)152312于是混杂战

2、略均衡为1141。2,525二、逆向归纳法1、用逆向归纳法的思路求解下述不圆满信息博弈的子博弈精髓均衡1212(5,8)(6,7)(2,0)(3,4)(1,2)(3,4)解1LR2ab112LRLRcd(5,8)(6,7)(2,0)(3,4)(1,2)(3,4)设在1的第二个信息集上,1以为2选a的概率为P,则1选L的支付5P2(1P)23P1选R的支付6P3(1P)33P23P2故1必选R。给定1在第二个决策结上选R,2在左边决策结上会选a,故子博弈精髓均衡为L,R,(a,d)四、两个厂商生产同样产品在市场进步行竞争性销售。第1个厂商的成本函数为c1q1,其中q1为厂商1的产量。第2个厂商的

3、成本函数为c2cq2,其中q2为厂商2的产量,c为其常数边缘成本。两个厂商的固定成本都为零。厂商2的边缘成本c是1厂商2的“个人信息”,厂商1以为c在2,32上呈平均分布。设市场需求函数为P4q1q2,其中P为价格,两个厂商都以其产量为纯战略,问纯战略贝叶斯均衡为何?解:给定q2,厂商1的问题是max1(P1)q1q1(4q1q21)q1因q2q2(c)。厂商1不知道c,故目标函数为3/2max1(4q1q2(c)1)q1dcq12q123/2max3q1q11q2(c)dcq12一阶条件:3/232q112q2(c)dc0313/2(1)得q121q2(c)dc22厂商2的问题是:max2(

4、Pc)q2q2(4q1q2c)q2(4c)q2q1q2q22一阶条件:(4c)q12q203得q2(c)4cq1(2)2代入式(1):313/24cq1dcq121222313/24q113/2cdc2212412234q11223124822q14得q11代入式(2):3cq2(c)2若c1,则q1q21121c1,则古诺博弈均衡为q1q231,127若信息是完好的且521。25这说明信息不完好带来的高效率。2、圆满信息动向博弈。会用策略式表达、扩展式表达。用方框找纳什均衡,用树找子博弈精髓均衡。讲原由,看例题。该博弈中有三个纳什均衡:不进入,(进入,进入)进入,(不进入,进入)进入,(不进

5、入,不进入)4前两个均衡的结果(进入,不进入),即A进入,B不进入;第二个均衡结果是(不进入,进入),即A不进入,B进入若是理论获取这样的结果,无助于展望博弈参加人的行为。其他,纳什均衡假设,每一个参加人选择的最优战略是在所有其他参加人的战略选择给准时的最优反应,即参与人其实不考虑自己的选择对其他人选择的影响,所以纳什均衡很难说是动向博弈的合理解。必定在多个纳什均衡中剔除不合理的均衡解,即所谓“不可以置信威胁”。子博弈精炼纳什均衡是对纳什均衡看法的最重要的改进。它的目的是把动向博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。正如纳什均衡是完好信息静态博弈解的基本慨念一样,子博弈精髓纳什均衡是

6、完好信息动向博弈解的基本看法。不进入,(进入,进入)进入,(不进入,进入)进入,(不进入,不进入)前边获取的三个纳什均衡中,均衡意味着当A不进入时,B选择进入;而当A选择进入时,B仍选择进入(B威胁无论如何都要进入市场)。显然,当A选择进入时,B仍选择进入是不合理的,若是A进入市场,B选择“不进入”比选择“进入”收益要更大,理性的B不会选择进入,而A知道B是理性的,所以也不会把该战略视为B会选择的战略。所以,B的战略(进入,进入)是不可以置信威胁。不进入,(进入,进入)进入,(不进入,进入)进入,(不进入,不进入)均衡意味着当A进入时,B选择不进入;而5当A选择不进入时,B仍选择进入(B威胁无

7、论如何都不进入市场)。显然,当A选择不进入时,B仍选择不进入是不合理的,B的战略是不可以置信的。只有均衡是合理的:若是A进入,B不进入;若是A不进入,B进入。因为A是先行动者,理性的A会选择“进入”(他知道B是理性的,B不会选择“进入”),而理性的B选择“不进入”。观察博弈树上的三个均衡中,B的不可以置信战略中的反应,在第二阶段B开始行动的两个子博弈中不是最优;而合理的纳什均衡中,B的战略在所有子博弈中都是最优的,与A的第一阶段可能选择的行动构成该子博弈的纳什均衡。五、试给出下述信号博弈的纯战略均衡中的混同均衡和分别均衡(8,1)(1,2)a1发送者a1m2t1m1a20.5a2(2,7)自然

8、N(10,8)接收者接收者(6,5)0.5(4,1)a1a1m2发送者m1a2t2a2(7,3)(3,7)解:有四种可能:混同均衡t1m1,t2m1t1m2,t2m2分别均衡t1m1,t2m2t1m2,t2m1设u(mi)为接收者看见mi时以为发送者是t1的后验概率。看t1m1,t2m1则u(m1)0.5,非均衡路径上u(m2)0,16当接收者看见m1,选a1的支付为0.520.511.5选a2的支付为0.58应选a2。当接收者看见m2,选a1的支付为u(m2)1(1u(m2)554u(m2)选a2的支付为u(m2)7(1u(m2)334u(m2)当t1选m1,接收者会选a2,t1得支付10,

9、要求t1不选m2,对u(m2)无要求,因t1总会选m1。当t2选m1,接收者会选a2,t2得支付3,要求t2不选m2是不可以能的,因t2选m2是占优于选m1的,故此混同均衡t1m1,t2m1不存在。再看混同均衡t1m2,t2m2此时u(m1)0,1为非均衡路径上的后验概率,u(m2)0.5当接收者看见m2,选a1的支付为3选a2的支付为3故接收者必选a2。当接收者看见m1时,选a1的支付为u(m1)2(1u(m1)11u(m1)选a2的支付为u(m1)8(1u(m1)77u(m1)1u(m1)故必选a2。这样,无论发送者发出m1或m2信号,接收者总选a2,给定接收者总是选a2。7t1会选m1,

10、t2会选m2。故t1m2,t2m2不是混同均衡。看分别均衡t1m1,t2m2u(m1)1,u(m2)0接收者看见m1时,必选a2接收者看见m2时,必选a1此时,t1选m1,t2选m2故t1m1,t2m2是一个分别均衡。最后看分别均衡t1m2,t2m1u(m1)0,u(m2)1接收者看见m1时,必选a2接收者看见m2时,必选a2给定接收者总选a2t1m1,t2m2故t1m2,t2m1不是分别均衡。故只有一个纯战略子博弈精髓分别均衡t1m1t2m2鹰-鸽(Hawk-Dove)博弈(1)参加人:争食的两只动物-动物1和动物2。动物1和动物2的行动空间都是同样的,即:Ai=鹰,鸽i=1,2支付矩阵以下

11、:此博弈属于完好信息静态博弈,依照奇数定理知道共有三个纳什均衡,两个纯策略纳什均衡和一个混杂策略纳什均衡。8两个纯策略纳什均衡是:(鹰,鸽)和(鸽,鹰)。混杂策略纳什均衡是:动物1和动物2分别以50%的概率随机地选择鹰(象鹰同样行动)也许鸽(象鸽同样行动)。纯策略纳什均衡可以用划线法或箭头法求解。混杂策略纳什均衡则可依照无差异原则求解概率分布,即:第一,动物1应该以q的概率选择鹰,以1-q的概率选择鸽,使得动物2在鹰也许鸽之间无差异,那么可得q*:由4(1-q)=q+3(1-q)得q*=50%;其次,动物2应该以a的概率选择鹰,以1-a的概率选择鸽,使得动物1在鹰也许鸽之间无差异,那么可得a*

12、:由4(1-a)=a+3(1-a)得a*=50%。此博弈实质就是一个斗鸡博弈,在现实生活好多现象都与此近似,如市场进入、前苏联与美国在世界各地争抢地盘等。七、狩猎博弈此博弈同样是一个完好信息静态博弈,参加人是两个猎人,他们的行动是选择猎鹿也许猎兔。支付矩阵以下:依照划线或箭头法我们可以很简单地知道此博弈有两个纯策略纳什均衡,即:(鹿,鹿)和(兔,兔),也就是两个猎人同时猎鹿或同时猎兔都是纯策略纳什均衡。由于存在两个纯策略纳什均衡,现实中终归哪个均衡会出现就是一个问题,这是多重纳什均衡下的困境。但是,比较两个纳什均衡,很简单发现两人都猎鹿帕累托优于两人都猎兔,所以,对两个猎人而言,都猎鹿是一个“

13、更好”的纳什均衡,所以,在现实中两个人都决定猎鹿的可能性要更大一些。但是,正如卢梭所言,若是一只野兔碰巧经过他们中的一个人周边,那么也许这个人会去猎兔而使猎鹿失败,由于两个人都猎兔也是一个纳什均衡,这就是人的自私性。其他,在多个纳什均衡下,博弈之外的其他因素有助于我们判断哪个均衡会出现。比方,两个猎人是好朋友,经常合作,那么我们几乎可以100%的必定他们都会同时选择猎鹿。若是他们是仇人,那么我们可以必定他们不会合作猎鹿,所以他们都会选择各自猎兔。9本源:考试大-考博考试不完好信息夫妻博弈混杂策略均衡给定妻子分别以q,1-q的概率选择时装、足球,则丈夫选择时装、足球的希望收益相等,即1.q+0.

14、(1-q)=0.q+3.(1-q),解得妻子选择时装、足球的概率分别为(3/4,1/4)给定丈夫分别以p,1-p的概率选择时装、足球,则妻子选择时装、足球的希望收益相等,即2.p+0.(1-p)=0.p+1.(1-p),解得妻子选择时装、足球的概率分别为(1/3,2/3)当妻子以(3/4,1/4)的概率分布随机选择时装表演和足球,丈夫以(1/3,2/3)的概率随机选择时装表演和足球时,双方都无法经过单独改变策略,即单独改变随机选择纯策略的概率分布而提高利益,所以双方的上述概率分布的组合构成一个混杂策略纳什均衡。该混杂策略纳什均衡给妻子和丈夫各自带来的希望收益分别为:q.p.2+q.(1-p).

15、0+(1-q).p.0+(1-q).(1-p).1=2/3;q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4双方的希望收益均小于纯策略时的希望收益。某些静态贝叶斯博弈的例子1、市场进入博弈一个完好垄断企业B正在垄断一个行业市场,另一个潜藏的试图进入该行业的企业A,称A为进入者,B为在位者。A不知道B的成本特色,设B有两种可能的成本,即高成本和低成本。两种成本情况下的博弈矩阵如表6.1。10表6.1市场进入博弈B高成本低成本默认斗争默认斗争进入40,50-10,030,80-10,100A0,3000,3000,400不进入假设B知道进入者A的成本为高成本,

16、且与B为高成本时的成真同样。若是信息是完好的,则当B为高成本时,唯一的精髓纳什均衡为(进入,默认),另一纳什均衡(不进入,斗争)是含有不可以置信的威胁。当B为低成本时,唯一的纳什均衡为(不进入,斗争),即若A进入行业,拥有低成本优势的B将经过降低价格将A逐出市场。由于存行家业进入成本,所以A被逐出市场后将有净的10单位进入成本的损失。当A不知道B的成本情况时,他的选择将依赖于他对B的成本种类的主观概率或先验概率密度。设A对B是高成本的先验概率判断为P,则A以为B为低成本的概率为1P。若是A进入,其希望支付为P(40)(1P)(10)若是1不进入,其希望支付为0。当且仅当P(40)(1P)(10

17、)0或P11时,时,A选择进入;反之,当P55A不进入。于是,贝叶斯均衡为:(进入,默认),高成本,P1;5(进入,斗争),低成本,P1;51(不进入,*),P5其中*表示可以是斗争,也可以是默认。2成本信息不对称的古诺博弈例3.10给出的古诺博弈中,每个厂商的成本函数是共同知识。这里,我们假设每个厂商的成本函数是个人信息,详尽规定以下:两个企业生产同样产品在同一市场进步11行竞争性销售,市场需求函数为QaP,a0,P为产品价格,Q为市场需求量。假设a充分大时总有aP0,企业i的成本函数为Cibiqi,其中Ci为企业i的总成本,qi为其产量,bi为其平均成本,bi为常数且bi0,故bi也是边缘

18、成本。bi是企业i的个人信息,企业j不知道bi但以为bi在d,e上呈平均分布,d0,e0,de。且进一步假设bi在d,e呈平均分布是共同知识,ij,ij1,2。企业i的支付函数是其收益函数iiPqici(aQ)qibiqi因Qq1q2故i(aq1q2)qibiqi设静态贝叶斯均衡为qi*i1,2,则由均衡战略的种类依存性有qi*qi*(bi),i1,2于是i(aq1*(b1)q2*(b2)qi*(bi)biqi*(bi)(bj)的希望支付为uiPi(bj|bi)i(bj)dbjj显然P(bj|b)P(b),由概率分布密度P(b)的归一化条件ijjP(bj)dbj1j及bj在d,e上呈平均分布假

19、设,有P(bj)dbj1j或edP(bj)11即P(bj)de1(aqi)(ed)qj(bj)dbjqibiqi(ed)于是,uiedHj一阶条件:12ui1(ed)qi(aqi)(ed)qj(bj)dbjbi(ed)0qi(ed)Hj(abi)(ed)qjqi2(ed)(6.5)同样由对称性有(abj)(ed)qiqj2(ed)6.6)在上式两端对bj进行积分e2d2a(ed)qiqj226.7)在式(6.5)两端对bi积分e2d2qia(ed)2qj26.8)将式(6.7)代入式(6.8)的右端,得eda2qi(ed)36.9)ed由对称性有qjqia2(ed)3代入式(6.5)得ed(abi)(ed)a2(ed)3*qid)2(eed2a3bi26132a3bjed*2同理有qj6eded2a3b12a3b2于是得静态贝叶斯均衡为(62,62)。当a充分大时,qi*和q*j均为非负数。当b1b2时,q1*q2*;*(P*均衡收益1b1)q1(Pb2)q22,即成本较高的一方收益较低,产量较低。当ed时,博弈退化成完好信息静态博弈的场合。为了与例3.26对照较,进一步设dec,b1b2c,则q1*q2*1(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论