第二讲 完全信息_第1页
第二讲 完全信息_第2页
第二讲 完全信息_第3页
第二讲 完全信息_第4页
第二讲 完全信息_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二讲完全信息静态博弈1博弈的标准式或策略式2占优策略均衡3重复剔除劣策略4纳什均衡1博弈的标准式或策略式

博弈的要素包括博弈方、策略空间、博弈的次序、博弈方的支付、博弈方的信息掌握程度和理性基础。其中博弈的次序、信息和理性基础是构成博弈前提,而要表示一个博弈,只要表出各博弈方及其策略空间和得益就可以了。即:(1)博弈参与者集合:A={1,2,…,n}(2)策略空间:Si,i=1,2,…,n.(3)支付函数:ui(s1,s2,…,sn)定义1:如果一个博弈有n个博弈方,其策略空间分别为S1,S2,…,Sn,支付函数分别为:u1,u2,…,un,则此博弈的标准式表示为:G={S1,S2,…,Sn,;u1,u2,…,un}标准式主要用来表示静态博弈。这种博弈中,参与者是同时选择策略的,但只要每一参与者在行动时不知道其他参与者的选择就可以了。2占优策略均衡参与者选择策略的过程。选择方法无非两种:选优和去劣。一般说来,每个参与者的收益都是所有参与者所选战略的函数,因此,每个参与者选择最优策略时必须考虑其他参与者的选择。但有些特殊的博弈中,某些参与者可能不需要考虑其他参与者的选择,因为无论其他参与者如何选择,他有唯一的最优策略,称为占优策略。对于任一向量s=s(s1,…,sn),将向量(s1,…,si-1,si+1,…,sn)记作s-i,即s中与参与人i无关的部分。参与人i之外所有其他参与人的策略组合参与人i对于其他参与人所选择的策略s-i的最佳应对是使其获得最大支付的策略si即ui(si*,s-i)≥ui(si′,s-i)对于任何si′≠si*如果没有其他策略是同样好的,那么这一最佳应对就是强最佳应对。

第一个重要的均衡概念就是优势策略均衡(dominantstrategyequilibrium)。如果无论其他参与人选择什么策略,策略si*都是参与人i的强最佳应对,那么si*就称为优势策略。这意味着无论别人选择什么策略,si*都使参与人i的支付最大化。从数学上讲ui(si*,s-i)≥ui(si′,s-i)对于任何si′≠si*对于参与人i而言较差的策略称为劣式策略(dominantedstrategy)。优势策略均衡是由每个参与人优势策略所组成的策略组合(s1*,s2*,…,sn*)。优势策略只要求每个参与者是理性的,而不要求每个参与者知道其他参与者是理性的(即不要求“理性”是共同知识)囚徒困境举例囚徒困境列抵赖坦白抵赖(-1,-1)(-10,0)列坦白(0,-10)(-8,-8)每一个参与人都有一个优势策略。以行先生为例,他并不知道列先生选择的是什么行动。但不管列先生选择什么,行先生的优势策略都是坦白。由于支付矩阵是对称的,列先生也是如此。所以优势策略均衡为(坦白,坦白),均衡支付为(-8,-8)囚徒困境看起来既荒谬又不现实(虽然这是对付犯罪的标准工具之一)。如果你实在不能理解,应该意识到,模型的主要用处通常是导出荒谬的结果,引致困惑。困惑是你的模型与你设想的有所不同的标志(你遗漏了对于所期望但却未得到的结果来说必不可少的东西)。此时要么是你的最初想法有问题,要么是你的模型有错误发现此类错误是建模过程中的收获。这种收获虽然痛苦,但却是真实的有益的。拒绝接受出乎意料的结论就是拒绝逻辑。3重复剔除劣策略——“俾斯麦海战”日本海军上将木村要将日本陆军运往新几内亚,有两条航线:较短的北线和较长的南线。美国海军上将肯尼则必须决定将其飞机派往南线还是北线进行搜索轰炸。俾斯麦海战木村北南北(2,-2)(2,-2)肯尼南(1,-1)(3,-3)两个参与人都没有优势策略。但使用弱优势的概念,可以找到一个较为合理的均衡。对参与人i的策略si′来说,如果存在有可能比si′好而绝不会比si′差的另一策略si‘’,即在某些策略组合下si‘’可带来更高支付而绝不会产生更低的支付,那么我们说si′弱劣于si‘’。从数学上讲,若存在这样的si‘’,对于任何s-iui(si‘’,s-i)≥ui(si′,s-i),对于某一s-i,则说si′弱劣于si‘’。弱优势策略均衡(weakdomimantstrategyequilibrium)定义为在剔除了每个参与人的全部弱劣势策略后得到的一个策略组合。但是肯尼没有任一策略是弱劣的。于是要求定义一个重复剔除优势均衡。我们首先从某一个参与人的策略集里剔除一个弱劣策略,再重新考察各个参与人剩下的策略中哪些是弱劣的并剔除其中之一,继续这一过程直到每一个参与人都仅剩下一个策略。这样得到的策略组合就称为这重复剔除优势均衡(iterateddominanceequilibrium)将这一均衡概念应用于俾斯麦海战,则意味着肯尼断定木村会选择策略北,因为它是弱优势的。木村北北(2,-2)肯尼南(1,-1)去掉了一列的情况下,肯尼就有一个强优势策略:选择北。(北,北)就是一个重复剔除优势均衡,这也是1943年真实发生的情况。优势策略均衡和重复剔除策略均衡对参与者的理性要求是不同的。前者只要每个参与者自己是理性的就可以了,而后者要求理性是参与者的共同知识,即,参与者不仅自己是理性的,还需要其他参与者也是理性的,并且还假定所有参与者都知道其他参与者是理性的。重复剔除策略均衡是建立在理性参与者不会选择严格劣策略这一合情推理之上的,但这一方法和严格占优策略均衡一样,有时候找不到严格劣策略。所以,这两种解法虽然简单,但有时不奏效。4纳什均衡对于大多数的博弈而言,重复剔除优势均衡也是不存在的,于是引入纳什均衡(NashEquilibrium)。在一个策略组合si*,在其他参与人都不会改变已有策略的条件下,如果没有参与人有激励去改变自身的策略,则称策略组合si*为纳什均衡,数学表达为,ui(si*,s-i*)≥ui(si′,s-i*)对于任何si′≠si*智猪博弈(boxedpigs)小猪按键等待按键(5,1)→(4,4)大猪↓↑等待(9,-1)→(0,0)策略组合为(按键,等待)是一个纳什均衡。理解纳什均衡就是构造一个策略组合,然后看看每个参与人的策略是否是对其他参与人策略的最好应对。如果大猪选择了按键,那么小猪会选择等待。反过来,如果小猪选择了等待,那么大猪选择按键,这就是印证了(按键,等待)确实是一个纳什均衡。乙左中右上甲中下0,44,05,34,03,50,43,56,65,3性别大战妻子韩剧球赛韩剧2,10,0丈夫球赛0,01,2不存在重复剔除优势均衡。看球赛和看韩剧都是纳什均衡,但分别是针对不同均衡而言。若这对恋人事先不通气,则可能出现误会。性别战中,任一纳什均衡都是帕累托有效的,其他任一策略都不可能在不降低其他参与人支付的条件下提高另一参与人的支付,即不存在帕累托改进。但囚徒困境博弈中纳什均衡并不是帕累托最优的。斗鸡博弈妻子进退进-3,-32,0丈夫退0,20,0市场进入阻挠在位者默许斗争进入40,50-10,0进入者不进入0,3000,300恩爱夫妻博弈妻子活着死了活着2,2-6,0丈夫死了0,-60,0仇恨夫妻博弈妻子活着死了活着0,06,0丈夫死了0,60,0同优势策略均衡一样,纳什均衡也有强弱之分,要定义一个强纳什均衡,只要不等式成立严格成立。也就是说,没有参与人会对是选择均衡策略还是选择其他策略持两可的态度。每一个优势策略均衡都是纳什均衡,但并非每一个纳什均衡都是优势策略均衡。如果某一策略是优势的,那么它对于其他参与人选择的任何策略都是最佳应对从数学上讲(ui(si*,s-i)≥ui(si′,s-i)对于任何si′≠si*),这自然也包括其他参与人的均衡策略。如果某一策略是纳什均衡的组成部分,那么它只需要对其他参与人的均衡策略而言是最佳应对即可。(ui(si*,s-i*)≥ui(si′,s-i*)对于任何si′≠si*)为了说明纳什均衡的这一特点,构造囚徒困境的变形。变形的囚徒困境列抵赖坦白抵赖(0,0)(-10,0)列坦白(0,-10)(-8,-8)变形的囚徒困境没有强优势策略均衡,它仅有一个弱优势策略均衡,坦白仍是一个弱优势策略。(坦白,坦白)是一个重复剔除均衡策略,也是一个强纳什均衡。但是还存在另一个纳什均衡:(抵赖,抵赖)。这是一个弱纳什均衡。虽然这一均衡是弱的而另一均衡是强的,但(抵赖,抵赖)仍然有其自身的优势:它的结果具有帕累托优势,因为(0,0)中二者的支付均大于(-8,-8)。纳什均衡的应用古诺(Cournot)的双寡头垄断模型设q1,q2分别表示企业1,2生产的同样产品的产量,市场中该产品的总供给Q=q1+q2,令P(Q)=a-Q表示市场出清价格(当Q>a时P(Q)=0),设企业i生产qi总成本为cqi,即不考虑固定成本,边际成本为常数c,并且两个企业同时进行产量决策。首先把问题转化为标准式博弈。博弈参与者:企业1、2;博弈参与者的策略空间:设产量是连续变化的,则S1=S2=[0,+∞)。(其实不会产生qi>a的情况)把各自的收益表示成自己和对方所选策略的函数:U1(q1,q2)=q1[P(q1+q2)-c]=q1[a-(q1+q2)-c]U2(q1,q2)=q2[P(q1+q2)-c]=q2[a-(q1+q2)-c]设(q1*,q2*)是纳什均衡,则由(NE)得:u1(q1*,q2*)≥u1(q1,q2*)u2(q1*,q2*)≥u2(q1*

,q2)对所有qi∈Si=[0,+∞)都成立。分别求导得出如果(q1*,q2*)是纳什均衡则必须解得这一均衡在直观上很好理解。每一企业都想成为垄断者,它会选择qi使ui(qi,0)最大化假设a=8,c=2.惟一一组解为q1*=q2*=2,策略组合(2,2)是惟一纳什均衡。市场总产量为4,市场价格为4,双方支付(利润)均为2×(8-4)-2×2=4,利润总和为8。如果从两厂商总利润最大化角度来看,U=Q(8-Q)-2Q=6Q-Q×Q,最大产量为3,最大总利润为9。古诺模型的简单模型:两寡头间的囚徒困境博弈。寡头2不突破突破不突破4.5,4.53.75,5寡头1突破5,3.754,4团队中的道德风险模型假设一个团队中有两个工人,每个人可以工作(si=1)或偷懒(si=0),团队总产出是4(s1+s2),并在两个工人中平均分配。每个人工作要承担私人成本3,偷懒时私人成本为0。工人2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论