版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
博弈论与信息经济学经济学系陶-mail:taoyimiao@博弈论与信息经济学经济学系1参考文献:1.艾里克·拉斯穆森(EricRasmusen),《博弈与信息:博弈论概论》,中国人大出版社第三、四版,。2.克里斯汀·蒙特等(ChristianMontet),《博弈论与经济学》,经济管理出版社2005年版。3.朱·弗登博格和让·梯若尔(DrewFudenbergandJeanTirole),《博弈论》,中国人大出版社2002年版。4.张维迎,《博弈论与信息经济学》,上海人民出版社1996年版。5.谢炽予,《经济博弈论》,复旦大学出版社第三版。参考文献:2第一章导论“正如理性预期学派使宏观经济学发生革命一样,博弈论广泛而深远地改变了经济学家的思维方式。”让·梯若尔(JeanTirole)(和让·雅克·拉丰一起创立图卢兹学派)第一章导论“正如理性预期学派使宏观经济学发生革命一样,博弈3经济学与博弈论的契合20世纪80年代以来,博弈论迅速成为主流经济的重要组成部分,几乎吞没了整个微观经济学,就如同计量经济学吞没了“经验经济学”一样。为什么?博弈论的研究范式:建模者对players规定pay-offfunctions和strategysets,观察当参与人选择策略以最大化其支付时会产生什么结果。经济学与博弈论的契合20世纪80年代以来,博弈论迅速成为主流4原因一,博弈论的研究范式是“MaximizationSubjecttoConstraints”和“NoFreeLunch”经济学思想的结合。原因二,主流经济学对寡头垄断的束手无策。原因一,博弈论的研究范式是“MaximizationSub5博弈论是建模的工具,它依赖于ideas。运用博弈论建模的方式通常称为“无脂建模”(no-fatmodeling)或者实例建模(modelingbyexample)或者实例化理论。Fisher“实例化理论并不告诉我们什么是必将发生的,而只告诉我们什么是可以发生的。”博弈论是建模的工具,它依赖于ideas。6社会的两个基本问题:协调(coordination)协调问题的核心是预测(prediction):预测其他人如何行为;合作(cooperation)合作问题的核心是激励(incentive)个人行为与社会利益的冲突什么是个人的最优选择?什么是社会的最优选择?如何把个人行为与社会利益统一起来?社会的两个基本问题:7“美丽心灵”纳什在1994年诺贝尔经济学奖揭晓的那天下午,普林斯顿大学为纳什举行了一个小型香槟酒会。纳什在会上说,他不习惯发表讲话,但这次他有三件事要说。第一件事就是,他希望获得诺贝尔奖可以改善他的信用评级,因为他实在太需要一张信用卡了;第二件是他更希望自己能够独享诺贝尔奖,因为他太需要那笔钱,他要为自己的住房支付欠款;第三件是他认为自己的博弈论研究是与超弦理论类似的高度智力课题,其实用性也许是次要的或者可疑的“美丽心灵”纳什在1994年诺贝尔经济学奖揭晓的那天下午,普8美国数学家约翰·纳什、约翰·海萨尼、莱因哈德·泽尔腾因在非合作博弈均衡分析理论方面做出了开创性贡献,从而对博弈论和经济学产生了重大影响,而共同获得诺贝尔经济学奖。美国数学家约翰·纳什、约翰·海萨尼、莱因哈德·泽尔腾因在非合9非合作博弈和合作博弈区分的依据:约束力的协议(bindingagreement)内生与外生研究的重点:非合作博弈强调的重点主要在个人行为;合作博弈强调的重点在于参与者联盟会形成什么样的联盟,他们之间如何瓜分合作的收益等。非合作博弈和合作博弈区分的依据:10均衡s*=(s1*,…,sn*)是指由博弈的n个参与人每人选取的最佳策略所组成的一个策略组合。那什么是最佳策略呢?均衡s*=(s1*,…,sn*)是指由博弈的n个参与人每11静态动态完全信息完全信息静态博弈;纳什均衡(NE)Nash(1950-1951)完全信息动态博弈;子博弈精炼纳什均衡(SPE)Selten(1965)不完全信息不完全信息静态博弈;贝叶斯纳什均衡(BNE)Harsanyi(1967-1968)不完全信息动态博弈;精炼贝叶斯纳什均衡(PBE)Kreps,Wilson(1982)Fundenberg,Tirole(1991)静态动态完全信息完全信息静态博弈;完全信息动态博弈;不完全信12纳什均衡的精炼逻辑NEMSNESPEPTHEBNEPBE和SEPTHE∈SE∈PBE∈SPE∈NE
NE的不存在需要对NE扩展NE的多重性需要对NE精炼对SPE“完美”对SPE“序贯”引入不完全信息需要对NE概括MixedstrategynashequilibriumSub-gameperfectequilibirumPerfecttremblinghandequilibirumBayesnashequilibriumSequentialequilibirumPerfectBayesequilibirum精炼纳什均衡的精炼逻辑NE的不存在需要对NE扩展NE的多重性需要13博弈论的关键:
如何预测对方的行动博弈论关注的是意识到其行动将相互影响的决策者们的行为。也就是说博弈论涉及那些真实生活中的情形——当理性的人们彼此相互作用的时候,即当某个人的行动依赖于他人如何行动的时候。博弈论的关键:
如何预测对方的行动博弈论关注的是意识到其行动14一、博弈的要素博弈的要素包括:参与人(players)、行动(actions)、信息(information)、策略(strategies)、支付(payoffs)、结果(outcome)和均衡(equilibrium)。对一个博弈的描述至少必须包括参与人、策略和支付;而行动和信息则是建筑材料。一、博弈的要素博弈的要素包括:参与人(players)、行动151参与人参与人是独立决策和独立承担结果的个人或组织。每个参与人的目标都是通过选择来最大化自身的效用(理性)。假设我们构造一个“OPEC模型Ⅰ”,我们将参与人设定为沙特阿拉伯(S)和其他生产者(O),消费者只是被动的个体不是参与人,只是环境参数。1参与人参与人是独立决策和独立承担结果的个人或组织。每个参与16要理解何种情形适宜用博弈来模型化,考察以下几个例子:1OPEC成员国选择其年产量2GM向USX(美国最大的钢材商)购买钢材3中石油在全国招聘工人4一家电力公司在估计了未来10年对电力的需求后,决定是否购置一套新的发电机组。要理解何种情形适宜用博弈来模型化,考察以下几个例子:171OPEC成员国的产量都会影响世界油价2双方的产量或需求量会影响价格3每个工人对中石油的影响微乎其微4电力公司决策的复杂性并非来自另一个理性的主体如何改变重要的经济变量使3和4转化成博弈?1OPEC成员国的产量都会影响世界油价18自然是一种虚拟的参与人,它在博弈的特定时点上以特定的概率随机选择行动。自然的支付是无差异的。自然是一种虚拟的参与人,它在博弈的特定时点上以特定的概率随机19在“OPEC模型Ⅰ”中,我们用D来表示石油的需求。我们还可以假定需求只分“强”和“弱”。假设前者的概率为70%,后者为30%。一个博弈会因随机变动的结果不同而有着不同的结果。在“OPEC模型Ⅰ”中,我们用D来表示石油的需求。我们还可以202行动参与人i的行动以ai表示,是他能做的某一选择。参与人的行动集(actionset),Ai={ai},是其可以采用的全部行动的集合。一个行动组合(actionprofile)是一个由博弈中的n个参与人每人选择一个行动所组成的有序集,a={ai},i=1,2,…,n2行动参与人i的行动以ai表示,是他能做的某一选择。21除了设定对于参与人来说何种行动是可行的之外,还必须设定何时这种行动是可行的。这就是行动顺序(orderofplay)若石油生产要求提前计划,则一国在博弈之初就选择两年的产量,OPEC模型Ⅰ的行动顺序可以是:除了设定对于参与人来说何种行动是可行的之外,还必须设定何时这22第一步,自然选择需求D,强或弱第二步,S从如下行动集中选择其1998和1999的产量:(Qs,8=L,Qs,9=L),(Qs,8=L,Qs,9=H)(Qs,8=H,Qs,9=L),(Qs,8=H,Qs,9=H)O同时从其相应行动集中选择其产量。博弈论与信息经济经济学系学课件233信息既然博弈的关键是预测行动,信息理所当然是重要的。信息是以信息集的概念来模型化的。可以将参与人的信息集看做是他在特定时点对于不同变量的取值的了解。信息集的要素包括参与人认为可能的不同值。若有很多元素,则表明存在参与人无法排除的许多取值。若只有一个元素,则表明他准确知道这些变量的取值。3信息既然博弈的关键是预测行动,信息理所当然是重要的。24我们假定,在自然行动后,沙特知道世界石油需求是强还是弱,但其他生产者无法排除任何一种可能,因此模型的信息集为:其他生产者:{D=强,D=弱}沙特:{D=强}或{D=弱},视需求而定。参与人的信息集不仅包括如石油需求强度等变量取值的差别,还包括对已采取过什么行动的了解。因此信息集是变化的。我们假定,在自然行动后,沙特知道世界石油需求是强还是弱,但其25博弈的信息
(Information)完美(perfect)或不完美信息的,是指博弈的规则而言:如果参考者在选择自己行动时对于前面发生的情况很清楚,并且假设没有同时的行动,那么就是完美信息;否则就是不完美信息的。完全(complete)或不完全信息,是指博弈进行的环境而言,是指参与者之间对博弈的各个方面相互了解的程度。博弈的信息(Information)完美(perfect)26不完全信息和不完美信息的区别不完全信息指的是参与者的信息特征;不完美信息指的是博弈的信息结构。后面会讲到,经过海萨尼转换,任何不完全信息博弈都可以转化为不完美信息博弈。不完全信息和不完美信息的区别不完全信息指的是参与者的信息特征27什么是“共同知识”(CommonKnowledge)最早出现在哲学领域(DavidLewis),1976年奥曼(Aumann)引入到博弈论中。举例说明。什么是“共同知识”(CommonKnowledge)28理性的共同知识
(commonknowledgeofrationality)(1)Zero-orderCKR:每个人都是理性的,但不知道其他人是否是理性的;(2)first-orderCKR:每个人是理性的,并且知道其他每个人也都是理性的,但并不知道其他人是否知道自己是理性的;(3)second-orderCKR:(1)+(2)+每个人知道(2)nth-orderCKR:R(b)C(b)R(b)……C(b)Risrational,理性的共同知识
(commonknowledgeofr294策略参与人的策略si是如下一项规则:给定其信息集,该策略决定在博弈的每一时点他选择何种行动。参与人的策略集或策略空间Si={si}是其可行策略的集合。策略组合(strategyprofile)s=(s1,…,sn)是由博弈的n个参与人每人选择一个策略组成的策略集。4策略参与人的策略si是如下一项规则:给定其信息集,该策略决30策略与行动的区别
参与人的策略是一个关于其行动程序的完备集合(completeset),它告诉参与人在每一种可预见的情况下选择什么行动,即使参与人并不预期那种情况真的会出现。这一描述的完备性也意味着策略与行动的不同之处在于它是不可观测的,行动是物质上的,但策略仅是意识上的。策略与行动的区别
参与人的策略是一个关于其行动程序的完备集合315支付在所有参与人和自然都选择了各自策略且博弈已经完成之后,参与人i获得的效用或期望效用。在OPEC模型Ⅰ中,可以将沙特和其他生产者的支付设为两个生产年份中石油收入的总和。5支付在所有参与人和自然都选择了各自策略且博弈已经完成之后,326结果一个博弈的结果是指在博弈结束之后,建模者从行动、支付和其他变量的取值中所挑选出来的他感兴趣的要素的集合。结果的定义取决于建模者所感兴趣的是什么。OPEC模型Ⅰ的一个结果是:Qs,8=L,Qs,9=H,Qo,8=H,Qo,9=L,D=L,Rs=100,Ro=80结果可以狭义地定义为仅仅是支付或产量水平的集合。选择何种定义取决于建模者认为对OPEC而言什么是最有意义的。6结果一个博弈的结果是指在博弈结束之后,建模者从行动、支付337均衡均衡s*=(s1*,…,sn*)是指由博弈的n个参与人每人选取的最佳策略所组成的一个策略组合。策略组合是一组策略的集合,而结果指的是感兴趣的一组变量的取值集合。7均衡均衡s*=(s1*,…,sn*)是指由博弈的n个参34不同的策略组合有时会导致不同的结果(Qs,8=L,Qs,9=L,Qo,8=L,Qo,9=L,D=强,Rs=100,Ro=80)这一结果可以由下述任一策略产生。黄金规则:无论如何都选择低产量。沙特:(Qs,8=L,Qs,9=L)其他生产者:(Qo,8=L,Qo,9=L)
不同的策略组合有时会导致不同的结果35白银规则:针锋相对沙特阿拉伯:(Qs,8=L;若Qo,8=L,则Qs,9=L,否则Qs,9=H)其他生产者:(Qo,8=L;若Qs,8=L,则Qo,9=L,否则Qo,9=H)要记住的是:行动与策略、结果与均衡之间是存在严格区别的。白银规则:针锋相对368均衡概念仅仅规定参与人、策略与支付还不足以找到均衡,因为建模者还必须决定“最优策略”到底是什么意思。这一点可以通过定义一个均衡概念来实现。只有几种均衡概念被普遍接受,如优势策略均衡(dominantstrategyequilibrium)和纳什均衡(Nashequilibrium)。8均衡概念仅仅规定参与人、策略与支付还不足以找到均衡,因为建37第二章分散化决策这章考察的是一种完全忽略其他参与者决策的非合作博弈。这种决策无须关于其他决策者的任何知识,因为这里的“环境”ENVIORMENT就是不考虑策略性的不确定性。第二章分散化决策这章考察的是一种完全忽略其他参与者决策的非合38一、优势策略均衡(DominantStrategyEquilibrium)
如果无论其他参与人选择什么策略,策略si*都是参与人i的强最佳应对,那么si*就称为优势策略。这意味着无论别人选择什么策略,si*都使参与人i的支付最大化。从数学上讲ui(si*,s-i)≥ui(si′,s-i)对于任何si′≠si*一、优势策略均衡(DominantStrategyEqu39对于参与人i而言较差的策略称为劣式策略(dominantedstrategy)。优势策略均衡是由每个参与人优势策略所组成的策略组合(s1*,s2*,…,sn*)。优势策略只要求每个参与者是理性的,而不要求每个参与者知道其他参与者是理性的(即不要求“理性”是共同知识)对于参与人i而言较差的策略称为劣式策略(dominanted40如果参与人有优势策略,无需了解他人的偏好,任何关于其他参与者策略决策的信息都是毫无价值的。DSE对信息基本无要求,只要求参与人自己是理性的就足够了。如果参与人有优势策略,无需了解他人的偏好,任何关于其他参与者41囚徒困境举例列抵赖坦白抵赖(-1,-1)(-10,0)行坦白(0,-10)(-8,-8)“困境”的根源不在于“囚徒”之间缺乏沟通,而是缺“动机”(Incentives).囚徒困境举例列42“囚徒困境”一般化到N个参与人,便是“公有地悲剧”,更为一般化的是,公共物品的提供和“搭便车”行为等问题。“囚徒困境”一般化到N个参与人,便是“公有地悲剧”,更为一般43二、重复剔除优势策略(IteratedDominanceEquilibrium))这是建立在“重复”剔除非占优策略的准则之上的。由于每个参与人都知道其他人的偏好,因此每个人都确信其他人不会选择dominatedstrategy(只要他们是理性的);并且由于每个参与人都能同时洞悉其他参与人的非占优策略,那就意味着策略集缩小了,以此类推。(换位思考)也就是说IDE要求理性是共同知识。二、重复剔除优势策略(IteratedDominance44数学上讲,若存在这样的si‘’,对于任何s-iui(si‘’,s-i)≥ui(si′,s-i),对于某一s-i,则说si′弱劣于si‘’。弱优势策略均衡(weakdomimantstrategyequilibrium)定义为在剔除了每个参与人的全部弱劣势策略后得到的一个策略组合。数学上讲,若存在这样的si‘’,对于任何s-iui(si‘45日本海军上将木村要将日本陆军运往新几内亚,有两条航线:较短的北线和较长的南线。美国海军上将肯尼则必须决定将其飞机派往南线还是北线进行搜索轰炸。俾斯麦海战木村北南北(2,-2)(2,-2)肯尼南(1,-1)(3,-3)日本海军上将木村要将日本陆军运往新几内亚,有两条航线:较短的46列左中右上(10,0)(5,1)(4,-200)行下(10,100)(5,0)(0,-100)列左中右上(10,0)(5,1)(4,-200)行下(10,100)(5,0)(0,-100)列47重复剔除与理性共识重复剔除不仅要求每个人是理性的,而且要求每个人知道其他人是理性的,每个人知道每个人知道每个人是理性的,如此等等,即理性是“共同知识”(共识)C1C2C3R1R2R310,41,598,49,90,399,81,980,100100,98这个博弈只要求一阶理性共识就可以预测均衡结果。如果把(下-左)的第一个数字改为11呢?重复剔除与理性共识重复剔除不仅要求每个人是理性的,而且要求每48最优选择这个博弈只要求一阶理性共识就可以预测均衡结果:如果R相信C是理性的,R就知道C不会选择C3,所以R的最优选择是R1;如果C相信R是理性的,C就知道R不会选择R2,所以C的最优选择是C2。但要C预期R不会选择R3,需要二阶理性共识;要R不预期C会选择C1,需要三阶理性共识。最优选择这个博弈只要求一阶理性共识就可以预测均衡结果:49>6767≥Si>4545≥Si>3030≥Si>20……Si=1耶鲁大学的试验结果是平均数为13又1/3。>6750>6767≥Si>4545≥Si>3030≥Si>20……Si=1耶鲁大学的试验结果是平均数为13又1/3。>6751选择越多,对理性共识的要求越高>6767≥Si>4545≥Si>3030≥Si>20……Si=1耶鲁大学的试验结果是平均数为13又1/3。选择越多,对理性共识的要求越高>67521.IDE对理性的要求较高2.IDE可能会因为剔除顺序的不同而不同。(需要强调的是,如果是剔除严格劣策略,则不存在这问题)3.对于大多数的博弈而言,重复剔除优势均衡也是不存在的。1.IDE对理性的要求较高53三、安全策略(最大最小策略)在策略式表述的博弈(X1,X2
…;u1,…un)中,任何策略Xi,如果是下面问题的解:Maxximinx-iui(xi,x-i),则称为安全策略。我们现在考虑的关于参与者信息的无知(ignorance),即“完全忽略”的博弈。三、安全策略(最大最小策略)在策略式表述的博弈(X1,X254列左中右上(2,0)(3,-1)(0,1)[0]行下(2,1)(-1,2)(5,0)-1[0]-1[0]列55列左中右上214[1]行下-106-1
2[1]6列左中右上6-23[-2]行下-454-6
65[4]列56安全策略是针对双人零和博弈(严格竞争的博弈)提出的。有值的严格竞争或者双人零和博弈博弈中,“安全第一”的行为是最优的。均衡是一对最优安全策略组成的。有时也被称为“最大最小均衡”或“最小最大均衡”。安全策略是针对双人零和博弈(严格竞争的博弈)提出的。57安全策略对理性的要求安全策略要求理性必须是共同知识。如果某个参与者怀疑他的对手并非理性地行动,那么安全策略并非是最优的。也就意味着有机会获得高于有保证的最低水平。安全策略对理性的要求安全策略要求理性必须是共同知识。58第三章
纳什均衡(NashEquilibrium)定义1:如果一个博弈有n个博弈方,其策略空间分别为S1,S2,…,Sn,支付函数分别为:u1,u2,…,un,则此博弈的标准式表示为:G={S1,S2,…,Sn,;u1,u2,…,un}第三章
纳什均衡(NashEquilibrium)定义1:59标准式主要用来表示静态博弈。这种博弈中,参与者是“同时”选择策略的,但只要每一参与者在行动时不知道其他参与者的选择就可以了。标准式主要用来表示静态博弈。这种博弈中,参与者是“同时”选60“合理”的结果每个人都认为更可能出现的结果每个人对其他人预期的行动的最佳应对(bestresponds)纳什均衡(Nashequibrium)如果大家都预测特定的纳什均衡会出现,没有哪个参与人有激励单方面偏离(“一致性”预测)数学表达为,ui(si*,s-i*)≥ui(si′,s-i*)对于任何si′≠si*
“合理”的结果每个人都认为更可能出现的结61囚徒困境举例列抵赖坦白抵赖(-1,-1)(-10,0)行坦白(0,-10)(-8,-8)“困境”的根源不在于“囚徒”之间缺乏沟通,而是缺“动机”(Incentives).囚徒困境举例列62智猪博弈(boxedpigs)小猪按键等待按键(5,1)→(4,4)大猪↓↑等待(9,-1)→(0,0)大猪的最佳应对:B1等待/按键,B2按键/等待小猪的最佳应对:L1等待/按键,L2等待/等待智猪博弈(boxedpigs)63小猪的策略等待
按键
按键等待B2,L1(按键,等待)B1(等待,按键)0大猪的策略L2(等待,等待)小猪的策略等待按键按键等待B2,L1(按键,等待)B164性别大战妻子韩剧球赛韩剧2,10,0丈夫球赛0,01,2性别大战65不存在重复剔除优势均衡。看球赛和看韩剧都是纳什均衡,但分别是针对不同均衡而言。若这对恋人事先不通气,则可能出现误会。性别战中,任一纳什均衡都是帕累托有效的,其他任一策略都不可能在不降低其他参与人支付的条件下提高另一参与人的支付,即不存在帕累托改进。但囚徒困境博弈中纳什均衡并不是帕累托最优的。不存在重复剔除优势均衡。看球赛和看韩剧都是纳什均衡,但分别66斗鸡博弈妻子进退进-3,-32,0丈夫退0,20,0斗鸡博弈67市场进入阻挠在位者默许斗争进入40,50-10,0进入者不进入0,3000,300市场进入阻挠68恩爱夫妻博弈妻子活着死了活着2,2-6,0丈夫死了0,-60,0恩爱夫妻博弈69仇恨夫妻博弈妻子活着死了活着0,06,0丈夫死了0,60,0仇恨夫妻博弈70同优势策略均衡一样,纳什均衡也有强弱之分,要定义一个强纳什均衡,只要不等式成立严格成立。也就是说,没有参与人会对是选择均衡策略还是选择其他策略持两可的态度。同优势策略均衡一样,纳什均衡也有强弱之分,要定义一个强纳什均71为了说明纳什均衡的这一特点,构造囚徒困境的变形。变形的囚徒困境列抵赖坦白抵赖(0,0)(-10,0)列坦白(0,-10)(-8,-8)变形的囚徒困境没有强优势策略均衡,它仅有一个弱优势策略均衡,坦白仍是一个弱优势策略。为了说明纳什均衡的这一特点,构造囚徒困境的变形。72在一个策略组合si*,在其他参与人都不会改变已有策略的条件下,如果没有参与人有激励去改变自身的策略,则称策略组合si*为纳什均衡,数学表达为,ui(si*,s-i*)≥ui(si′,s-i*)对于任何si′≠si*博弈论与信息经济经济学系学课件73优势策略均衡、重复剔除的优势均衡与纳什均衡的关系每一个占优策略均衡、重复剔除的占优均衡一定是纳什均衡;但反之不然。纳什均衡一定是在重复剔除严格劣策略过程中没有被剔除掉的策略组合,但没有被剔除的策略组合不一定是纳什均衡,除非它是唯一的。优势策略均衡、重复剔除的优势均衡与纳什均衡的关系每一个占优策74团队中的道德风险模型假设一个团队中有两个工人,每个人可以工作(si=1)或偷懒(si=0),团队总产出是4(s1+s2),并在两个工人中平均分配。每个人工作要承担私人成本3,偷懒时私人成本为0。工人2工作偷懒工作(1,1)(-1,2)工人1偷懒(2,-1)(0,0)团队中的道德风险模型假设一个团队中有两个工人,每个人可以工作75思考题1.下面的博弈问题的结果是什么?乙abca甲bc2,01,14,23,41,25,31,30,23,0思考题1.下面的博弈问题的结果是什么?2,01,14,23,761、players:厂商1和厂商2向市场提供无差异的同质的产品;面临的决策是qi=?qiQ
pui,博弈●1.Cournot模型标准式表述p是市场出清价格,是市场供应量Q的减函数:p=p(Q)=a-Q=a-(qi+qj)1、players:厂商1和厂商2向市场提供无差异的同772、策略:产出水平qi,策略集Si={qi:qi≥0}3、支付函数:ui(si,sj)=ui(qi,qj)=qip–cqi假定两厂商均无固定成本,只有常数边际成本c。=qi[a-(qi+qj)]–cqi=-qi2+(a-c-qj)qi2、策略:产出水平qi,策略集Si={qi:qi≥078●无限策略博弈NE的求解按NE定义的条件,如果策略组合(qi*,qj*)是NE,那么对于qj*,qi*是下列优化问题的解:Maxui(qi,qj*)qi∈Si=Max[-qi2+(a-c-qj*)qi]
qi∈Siduidqi-2qi+(a-c-qj*)
●无限策略博弈NE的求解按NE定义的条件,如果策略组合79令:-2qi+(a-c-qj*)=0得:qi*=(a-c-qj*)/2于是有方程组:q1*=(a-c-q2*)/2q2*=(a-c-q1*)/2q1*=q2*=(a-c)/3此时,u1*=u2*=(a-c)2/9令:-2qi+(a-c-qj*)=0于是有方程组:q180考虑关系式:qi*=(a-c-qj*)/2无论qj是否最优,由qi=(a-c-qj)/2决定的qi总是厂商i针对厂商j产出水平的最优反应;我们称关系式qi=(a-c-qj)/2为厂商i针对厂商j的策略的反应函数,并记为:qi*=Ri(qj)=(a-c-qj)/2.由此NE(qi*,qj*)必须是方程组:q1=(a-c-q2)/2q2=(a-c-q1)/2的解。-------------------------反应函数法考虑关系式:qi*=(a-c-qj*)/2无论qj是否最81q1q2a-c(a-c)2(a-c)/2a-cR2(q1)=(a-c-q1)/2R1(q2)=(a-c-q2)/2(a-c)3(a-c)/3NE0⊙q1q2a-c(a-c)(a-c)/2a-cR2(q1)=(82古诺纳什均衡的调整过程古诺纳什均衡的简单性成为了纳什均衡调整过程的最好应用。内省的办法:要求理性是“共同知识”外推的办法:只要求参与人是理性的古诺纳什均衡的调整过程古诺纳什均衡的简单性成为了纳什均衡调整83q1q2a-cq1mq2ma-cR2(q1)=(a-c-q1)/2R1(q2)=(a-c-q2)/2q12q22NE0⊙q13q23通过内省和演绎预测对手的行为q1q2a-cq1mq2ma-cR2(q1)=(a-c-q84q1≤q1m企业1是理性的,q12≤q1≤q1m企业1知道企业2理性的q12≤q1≤q13企业1知道企业2知道企业1是理性的q14≤q1≤q13……q1=(a-c)/3理性是共同知识q1≤q1m企业85q1q2a-cq1mq2ma-cR2(q1)=(a-c-q1)/2R1(q2)=(a-c-q2)/2q12q22NE0⊙q13q23通过外推引导参与人采用均衡策略,每个参与人的产量是对前一阶段产量的最佳反应。q1q2a-cq1mq2ma-cR2(q1)=(a-c-q86纳什均衡隐含的“信念”关于参与人行为描述的一个问题是参与人认为自己的行动不会直接影响到其他人的行动,也就是说企业1和企业2都认为它的产量不会影响其他企业的产量。数学表达式:dq/dq1=1+dq2/dq1=1只有这个“信念”才能支撑纳什均衡。纳什均衡隐含的“信念”关于参与人行为描述的一个问题是参与人认87对纳什均衡隐含的“信念”的辩护假设存在大批参与人,彼此随机配对进行博弈;则现在配对的参与人不太可能再碰面,那么就不用担心他们当前的选择会如何影响他们未来对手的博弈行动。这一辩护的缺陷在哪里?大批参与人对纳什均衡隐含的“信念”的辩护假设存在大批参与人,彼此随机配882.伯川德模型BertrandModelofDuopoly●标准式表述1、参与人:厂商1与厂商2;他们生产同质产品。2、他们选择价格,Si={pi:pi≥0};3、他们的支付函数就是他们的利润函数:ui=ui(pi,pj)NE将是:P1*=p2*=cBertrandparadox2.伯川德模型BertrandModelofDuop89根据伯川德均衡可以得到两个结论:1.寡头市场的均衡价格为:P=MC;2.寡头的长期经济利润为0。这一与实际不符的结论,被称为伯川德悖论Bertrandparadox根据伯川德均衡可以得到两个结论:90从前面我们得知古诺和伯川德模型并不贴近现实,为什么我们还要用它?建模的最高的目的并不是最贴近现实,简单性永远是建模的最高目的之一。特别是参与人超过两个时,所以这两个模型是更好的模型解决伯川德悖论的两个方法2.1生产能力约束:合理的配给规则从前面我们得知古诺和伯川德模型并不贴近现实,为什么我们还要用912.2异质伯川德模型BertrandModelofDuopoly*两厂商决策的相互影响在于需求函数Di(pi,pj)=a-pi+bpj两厂商的产品具有一定的差异性;b是厂商i的产品对厂商j的产品的替代系数。●标准式表述1、参与人:厂商1与厂商2;他们生产同类但存在一定差异的产品。2.2异质伯川德模型BertrandModelofD922、他们选择价格,Si={pi:pi≥0};3、他们的支付函数就是他们的利润函数:ui=ui(pi,pj)=Di(pi,pj)pi-Di(pi,pj)c=(a-pi+bpj)(pi-c)
假定两厂商均无固定成本,只有常数边际成本c。厂商i的反应函数:Ri(pj)=a+c+bpj22、他们选择价格,Si={pi:pi≥0};3、他们的支付932P1=a+c+bp22P2=a+c+bp1P1*=p2*=(a+c)/(2-b)b﹤22P1=a+c+bp22P2=a+c+bp1P1*=p294聚点选择相同就获得奖励,不同则不能获得。(1)选择下面一个数,并画上圈:7,100,13,261,99,666。(2)你要在湖北经济学院与另一个人见面,但应在何时何地碰头。(3)你和别人一起分蛋糕,你们各自报出欲分得的比例,但所报比例之和超过百分之百,则你们一无所获。聚点选择相同就获得奖励,不同则不能获得。95上述博弈都有许多纳什均衡比如如果我认为你会选择666,而你也认为我会选择666,那么666就是我们共同的选择。但是在这些均衡中,总有一些可能性更大些。这些特定的策略组合就称为聚点,即出于心理上的原因尤为引人注目的那些纳什均衡。要使得某一策略组合成为聚点的缘由正式形式化并非易事,这往往取决于具体的环境。上述博弈都有许多纳什均衡比如如果我认为你会选择666,而你也96ThomasSchelling在《TheStrategyofConflict》中分析了聚点。在例1中谢林发现选择7是最常见的策略,在一群贪得无厌的人中666可能成为聚点。第一次分蛋糕可能是五五开,如果过去分过,过去的经历将影响聚点的形成。ThomasSchelling在《TheStrategy97三、混合策略纳什均衡混合策略的定义:在博弈G={s1,s2,…,sn}中,博弈方i的策略空间为Si=(si1,si2,…,sik),则博弈方以pi=(pi1,pi2,…,pik)随机选择k个可选策略称为一个混合策略。其中,0≤pik≤1,k=1,2,…,k,且pi1+pi2+…+pik=1三、混合策略纳什均衡混合策略的定义:在博弈G={s1,s2,98猜谜游戏(A决定,B来猜;B猜中,奖励;否则,惩罚)B正面反面正面-1,11,-1A反面1,-1-1,1猜谜游戏(A决定,B来猜;B猜中,奖励;否则,惩罚)99猜棋游戏看这样一个问题。甲乙两个人各有一副围棋,游戏规则是,每人同时出一枚棋子,若颜色相同,则甲得1分,乙得-1分;若颜色相反,则甲得-1分,乙得1分。试分析博弈结果。这是一个静态博弈。得益矩阵为乙黑白黑甲白1,-1-1,1-1,11,-1猜棋游戏看这样一个问题。甲乙两个人各有一副围棋,游戏规则是,100
这个博弈没有纯策略纳什均衡。甲在博弈中以概率p出黑棋,以概率1-p出白棋,称为混合策略(p,1-p);同样地,乙的混合策略(q,1-q)。相应地,以概率1(或0)出棋,则称为纯策略。在混合策略下,甲的期望收益是:U甲=pq-p(1-q)-q(1-p)+(1-p)(1-q)=2p(2q-1)+1-2q这个博弈没有纯策略纳什均衡。101
乙的期望收益是:U乙=-1pq+p(1-q)+q(1-p)-(1-p)(1-q)=2q(1-2p)+2p-1看甲的决策,当2q-1>0时,应选p值越大越好,最好取1;当2q-1z<0时,选择p=0好,当2q-1=0时,p可以随便选。即甲的最佳反应(称为反应函数)为:乙的期望收益是:102
同样,乙的反应函数为:以p,q为坐标轴画出它们的图像,则交点就是纳什均衡。同样,乙的反应函数为:103
0.510.51pq0(0.5,0.5)0.510.51pq0(0.5,0.5)104每个参与人都想猜透对方的策略,而每一个参与人又都不能让对方猜透自己的策略,即必须使其他博弈方选择其任何策略的期望即支付相同。(支付均等化原则)每个参与人都想猜透对方的策略,而每一个参与人又都不能让对方猜105小偷与守卫守卫小偷睡(Pg)不睡(1-Pg)偷(Pt)V,-D-P,0不偷(1-Pt)0,S0,0小偷与守卫守卫小偷睡不睡偷V,-D-P,0不偷0,S0,0106MAXU(守卫)=Pg(S-S·Pt-D·Pt),0≤Pg≤11Pt<S/(D+S)Pg=0-1Pt=S/(D+S)0Pt>S/(D+S)MAXU(小偷)=Pt(V·Pg+P·Pg-P),0≤Pt≤10Pg<P/(P+V)Pt=0-1Pg=P/(P+V)1Pg>P/(P+V)MAXU(守卫)=Pg(S-S·Pt-D·Pt),0≤Pg≤107守卫睡的概率Pg小偷偷的概率PtP/(P+V)
1
1
S/(D+S)小偷的反应曲线守卫的反应曲线0守卫睡的概率Pg小偷偷的概率PtP/(P+V)11108小偷偷的概率01守卫睡觉的期望收益S-D-D’Pt*P’t小偷偷的概率01守卫睡觉的期望收益S-D-D’Pt*P’t109守卫睡的概率01小偷偷的期望收益Pg*P’gV-P-P’守卫睡的概率01小偷偷的期望收益Pg*P’gV-P-P’110我们把纳什均衡的概念也作相应的扩大:对一个策略组合,无论它是纯策略还是混合策略,只要满足各博弈方都不想单独偏离它,就称其为纳什均衡我们把纳什均衡的概念也作相应的扩大:对一个策略组合,无论它是111“吉蒂谋杀案”的混合策略博弈分析吉蒂是在纽约被杀的,她的38位邻居都目睹了却无人报警。琼斯旁观β报警1-β旁观β0,010,7史密斯报警1-β7,107,7“吉蒂谋杀案”的混合策略博弈分析吉蒂是在纽约被杀的,她的38112U(报警)=7=U(旁观)=βN-1(0)+(1-βN-1)(10)βN-1=0.3随着N的增加,β增加.无人报警的概率为βN,因为βN-1=0.3,所以βN=0.3β这显然是随着N的增加而增加.当有38个人时,无人报警的概率约为0.29,β=0.97。U(报警)=7=U(旁观)=βN-1(0)+(1-βN113这时混合策略显然不好,所需要某些东西使得一个纯策略纳什均衡成为一个聚点.问题在于责任的分割,某一个参与人必须肩负起报警的责任这时混合策略显然不好,所需要某些东西使得一个纯策略纳什均衡成114四、完全信息动态博弈SPE前面讲述的纳什均衡有三个问题:第一,纳什均衡的多重性,但这并不是纳什均衡最严重的问题;第二,在纳什均衡中,参与人在选择自己的策略时,把其他参与人的策略当作是给定的,不考虑自己的选择如何影响对手的策略。动态博弈时这就有问题了;第三,这由第二个问题引发来,由于不考虑自己选择对别人选择的影响,纳什均衡允许了不可置信威胁的存在。四、完全信息动态博弈SPE前面讲述的纳什均衡有三个问题:115
在位者默许斗争进入40,50-10,0进入者不进入0,3000,300市场进入博弈中,如若进入者真的进入,在位者的最优行动显然是默许而不是斗争,因为默许带来50的利润,所以斗争就是一种不可置信的威胁。但纳什均衡概念承认了这种不可置信的威胁,所以(不进入,斗争)就成为一个纳什均衡。在位者116策略式与结果矩阵表1琼斯大小大2,2-1,-1史密斯小-1,-11,1上述博弈中不仅策略与行动是等价的,而且结果也简单。所以表1的2×2形式就同时完成了将策略组合与支付联系起来和将行动组合与结果联系起来这两项任务。这两项任务的结果分别称为策略式和结果矩阵。策略式与结果矩阵表1117考虑由表1的博弈演变来的博弈。我们称之为跟随领头羊Ⅰ。这一博弈与表1的博弈不同之处在于史密斯首先采取行动,即承诺自己将采用某一种软驱规格而不管琼斯将会先哪种。新的博弈有着与原博弈一样的结果矩阵,但其策略式却大相径庭。考虑由表1的博弈演变来的博弈。我们称之为跟随领头羊Ⅰ。这一博118因为琼斯的策略不再只是单一的行动,琼斯策略集此时有四个元素。(L/L,L/S)(L/L,S/S)(S/L,L/S)(S/L,S/S)(若史密斯选择大则选择大;若其选择小则选择大)(若史密斯选择大则选择大;若其选择小则选择小)(若史密斯选择大则选择小;若其选择小则选择大)(若史密斯选择大则选择小;若其选择小则选择小)因为琼斯的策略不再只是单一的行动,琼斯策略集此时有四个元素。119跟随领头羊Ⅰ表明只要添加一点复杂性,就使得策略式表述变得晦涩难懂,几无用武之地。策略式如下。琼斯
L/L,L/SL/L,S/SS/L,L/SS/L,S/S大2,22,2-1,-1-1,-1史密斯小-1,-11,1-1,-11,1跟随领头羊Ⅰ表明只要添加一点复杂性,就使得策略式表述变得晦涩120均衡策略结果E1大,(L/L,L/S)双方都选择大E2大,(L/L,S/S)双方都选择大E3小,(S/L,S/S)双方都选择小在以后的分析中我们将讨论均衡E1和E3可以被我们通过纳什均衡的精炼所排除。均衡策略121子博弈完美纳什均衡泽尔腾(1965)提出了“子博弈完美纳什均衡”(sub-gameperfectNashequilibrium)概念的目的就是要将那些包含不可置信威胁策略的纳什均衡从均衡中剔除,从而给出动态博弈结果的一个合理预测。子博弈完美纳什均衡泽尔腾(1965)提出了“子博弈完美纳什均122扩展式和博弈树描述一个博弈的另外两种方法就是扩展式和博弈树。结(node)是指博弈中某一参与人或自然采取行动的时点或博弈结束的时点。起点结是指不存在前续结的结。终点结是指不存在后续结的结。枝(branch)指在一个特定结上某一参与人的行动集中的一个行动路径(path)指从起始结到终点结由结和枝所组成的系列。扩展式和博弈树描述一个博弈的另外两种方法就是扩展式和博弈树。123扩展式是对博弈的一种描述,它由下述几点组成:(1)由结和枝所组成的整体结构,即由单个起始结开始直至终点结,中间无闭合的圈。(2)有对哪个结点属于哪个人的说明。(3)在自然作选择的结上,有自然选择不同枝的概率。(4)有划分每个参与人的结的信息集。(5)在每一个终点结上都有对每个参与人的支付博弈树除(5)外与扩展式都一样,在博弈树中(5)变为:在每一个终点结上都有结果。博弈树(gametree)是一个比扩展式更为灵活的术语,如果结果被定义为支付组合,博弈树与扩展式一样扩展式是对博弈的一种描述,它由下述几点组成:124子博弈(subgame)由原博弈中某个决策点(信息集)开始的部分构成一个子博弈。12323原博弈子博弈I子博弈II子博弈(subgame)由原博弈中某个决策点(信息集)开始的125逆向归纳法(backwardinduction)在有限博弈中,我们可以用逆向归纳法求解精炼纳什均衡:从最后一个决策点开始,找出该子博弈的纳什均衡;然后再倒回到倒数第二个决策点,找出决策者的最优决策(假定最后一个决策者的决策是最有的;如此一直到初始决策点,所有子博弈上的最优选择就是精炼纳什均衡。又称“rollback”.逆向归纳法(backwardinduction)在有限博126海盗分金币5个海盗抢到了100颗宝石,每一颗都一样的大小和价值连城,他们决定这分:首先,由1号提出分配方案,然后大家5人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。再由2号提出分配方案,以次类推......条件:1.每个海盗都是极其聪明的人2.每个海盗都是非常残忍的人3.每个海盗都能明确的判断得失然后作出明智的选择问题:第一个海盗提出怎样的分配方案才能够使自己的收益最大化海盗分金币5个海盗抢到了100颗宝石,每一颗都一样的大小和价127如果只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。3号知道这一点,就会提(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票他的方案即可通过。不过,2号推知到3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。不过,2号的方案会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,如果只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞128取石子博弈:小时候的游戏参与者1和2。博弈顺序:一次最多只能取走3块石头,最少一块。支付:拿走最后一块石头的人赢。取石子博弈:小时候的游戏参与者1和2。1290,4,8,12,16,20是死数(targetposition)共有21块石头,所以先拿的赢。0,4,8,12,16,20是死数(targetposit130小(1,1)
小大(-1,-1)小(-1,-1)大大(2,2)图1扩展式下的跟随领头羊ⅠSJ1J2E1大,(L/L,L/S)双方都选择大E2大,(L/L,S/S)双方都选择大E3小,(S/L,S/S)双方都选择小小131均衡路径与子博弈完美纳什均衡121UDLRD′U′(0,2)(0,1)(1,3)(2,0)均衡路径与子博弈完美纳什均衡121UDLRD′U′(0,2)132第三阶段121UDLRD′U′(0,2)(0,1)(1,3)(2,0)第三阶段121UDLRD′U′(0,2)(0,1)(1,3)133第二阶段121UDLRD′U′(0,2)(0,1)(1,3)(2,0)第二阶段121UDLRD′U′(0,2)(0,1)(1,3)134第一阶段121UDLRD′U′(0,2)(0,1)(1,3)(2,0)第一阶段121UDLRD′U′(0,2)(0,1)(1,3)135这样均衡结果和均衡路径是参与人在第一阶段选择U结束。子博弈完美纳什均衡是(﹛U,U′﹜,L)这里的U′和L分别是参与人1和参与人2在非均衡路径上的选择。这样均衡结果和均衡路径是参与人在第一阶段选择U结束。136不可置信威胁精炼纳什均衡剔除了不可置信的威胁,使得我们可以更合理地对博弈中参与人行为的预测;不可置信威胁的根源是事前最优与事后最优不同,导致许多帕累托效率无法实现;不可置信威胁精炼纳什均衡剔除了不可置信的威胁,使得我们可以更137承诺承诺是将不可置信的威胁变成可置信的威胁的行动:威胁不仅是事前最优的,也是事后最优的。承诺意味着限制自己的自由:选择少反而对自己好。如“破釜沉舟”的故事。承诺承诺是将不可置信的威胁变成可置信的威胁的行动:威胁不仅是138承诺举例婚姻中的承诺:彩礼、昂贵的婚礼可以理解为一种对婚姻的承诺;订金、抵押物做为对交易的承诺;“安营扎寨”;固定资产投资可以作为承诺;承诺举例婚姻中的承诺:彩礼、昂贵的婚礼可以理解为一种对婚姻的139要挟诉讼Ⅰ:简单勒索参与人:一个原告和一个被告博弈顺序:1.原告决定是否指控被告。2.原告提出一个无协商余地的赔偿金额s。3.被告决定接受或拒绝原告的要求。4.如果被拒绝,原告将决定是放弃还是告上法庭,这将给自己带来p的成本,原告d的成本。5.如果原告上法庭,将以a的概率胜诉,从而获得赔偿x,否则什么也得不到。要挟诉讼Ⅰ:简单勒索参与人:一个原告和一个被告140支付:令ax<p,这样原告的期望赔偿支付将小于他起诉的边际成本。支付:141要挟诉讼博弈Ⅰ的扩展式原告被告原告不指控指控要求赔偿s接受拒绝上法庭放弃(s-c,-s)(ax-c-p,-ax-d)(-c,0)(0,0)要挟诉讼博弈Ⅰ的扩展式原告被告原告不指控指控要求赔偿s接受拒142要挟诉讼博弈Ⅱ:
原告策略性地运用沉没成本原告可以事先支付他的律师报酬p,即使案子私了也不收回。不能收回律师费对原告是有利的。只要ax>0,他就会上法庭。只要s>ax,原告才会愿意私了。当s<ax+d,被将愿意私了。存在一个有效的私了区域〔ax,ax+d〕,具体的赔偿金额将取决于双方的讨价还价的能力。要挟诉讼博弈Ⅱ:
原告策略性地运用沉没成本原告可以事先支付他143在这里,假定允许原告讨价还价的能力极强。s=ax+d。只要-c-p+ax+d≥0,才有子博弈完美纳什均衡。见下图的扩展式。原告指控是因为他可以勒索到d,而这正好是被告的辩护成本。
在这里,假定允许原告讨价还价的能力极强。s=ax+d。144要挟诉讼博弈Ⅱ的扩展式:原告被告原告不指控指控要求赔偿s接受拒绝上法庭放弃(s-c-p,-s)(ax-c-p,-ax-d)(-c-p,0)(0,0)要挟诉讼博弈Ⅱ的扩展式:原告被告原告不指控指控要求赔偿s接受145要挟诉讼博弈Ⅲ:
被告策略性地运用沉没成本对付被告这种策略的一个办法是:被告在关于私了未进行了之前,甚至在原告决定指控被告之前就支付律师费d。要挟诉讼博弈Ⅲ:
被告策略性地运用沉没成本对付被告这种策略的146要挟诉讼博弈Ⅲ的扩展式:原告被告原告不指控指控要求赔偿s接受拒绝上法庭放弃(s-c-p,-s-d)(ax-c-p,-ax-d)(-c-p,-d)(0,0)要挟诉讼博弈Ⅲ的扩展式:原告被告原告不指控指控要求赔偿s接受147这就是为什么许多大公司除了雇佣按时计酬的外部律师外都雇佣内部律师的原因。如果是这样,就会带来社会损失(浪费律师的时间,花费为D)。这也是为什么一些好战的国家引起的全球军费开支造成了社会损失,即使这些从未发生过战争。这就是为什么许多大公司除了雇佣按时计酬的外部律师外都雇佣内部148画家和政府的苦恼名画的价值取决于数量,画家常为无法承诺而苦恼:谁相信他不会再画呢?这可能是为什么死了画家的画最值钱。政府也有类似的问题。政府经常缺乏承诺:给定投资者进入的情况下,多征税是最优的;但投资者预期到这一点,将不愿意进入。中国许多地方支付有严重的机会主义行为。“坦白从宽,抗拒从严”面临的问题也如此。画家和政府的苦恼名画的价值取决于数量,画家常为无法承诺而苦恼149作为承诺的法律法律改变事后的选择空间或选择成本,所以可以起到承诺的作用;合同的承诺作用(违约的成本增加,使得遵守合同更可能是事后最优的选择);刑法:为什么不能商量?为什么对严重犯罪要执行死刑?台湾问题:立法还是政府随机应变?“法治”(ruleoflaw)是政府的承诺;作为承诺的法律法律改变事后的选择空间或选择成本,所以可以起到150借钱投资问题设甲准备投资开采一个价值4万元的金矿,但缺1万元资金,而乙正好有1万元可以投入。甲向乙借这1万元用于开矿,并承诺收益双方平分。假设金矿的价值经权威探测,是确实的。乙是否应该借钱给甲呢?乙最关心的是甲得到金子后是否履行诺言跟乙平分收益。万一甲采到金子后不分收益,甚至赖账,乙连本钱都收不回来。我们用下面的扩展形的方法分析:借钱投资问题设甲准备投资开采一个价值4万元的金矿,但缺1万151借款投资的扩展形(博弈树)
乙甲借不借分不分(2,2)(0,4)(1,0)借款投资的扩展形(博弈树)152改进本博弈因为甲的不可信的分钱承诺而使甲乙的合作没有成功,开矿带来的3万元的社会效益也没能实现。能否改进措施,使甲的承诺变为可信?我们增加一个对甲的行为的制约。当甲选择分钱时,双方达到最佳结局。当甲选择不分时,让乙通过打官司来保护自己的利益,打官司乙肯定能赢,但要耗费财力物力,假设乙除掉打官司的花费,正好收回1万元投资,而甲的全部采金收入将被没收。这样,就变成了三阶段的动态博弈。改进本博弈因为甲的不可信的分钱承诺而使甲乙的合作没有成功,开153有可信的诺言和威胁时的博弈树乙甲乙不借借分不分打不打(2,2)(1,0)(0,4)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年办公复印机买卖协议详细范本
- 2024年白字黑字无中介借款协议样例
- GF2024年工程设计服务协议
- 2024年初级水产批发销售协议样本
- 2024员工加入协议详细规定
- 2024年架子工承包协议
- 二手摩托车交易协议范本2024
- DB11∕T 1668-2019 轻钢现浇轻质内隔墙技术规程
- 2024年医疗器械试验协议模板
- 2024年企业股权奖励实施细则协议
- 中医学课件 治则与治法
- 关于变压器温控器的讲解课件
- 疼痛的评估方法课件
- 国家开放大学《个人与团队管理》形考任务6参考答案
- 30第六章-抽样方法课件
- 世界咖啡会议
- 电力公司消防知识培训课件
- 人教鄂教版六年级科学上册全册教学设计教案
- 三年级数学趣味竞赛试题课件
- ECMO(体外膜肺氧合)课件
- 《色彩的情感》课件
评论
0/150
提交评论