-第三章完全信息动态博弈_第1页
-第三章完全信息动态博弈_第2页
-第三章完全信息动态博弈_第3页
-第三章完全信息动态博弈_第4页
-第三章完全信息动态博弈_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论与信息经济学

(GameTheoryandInformationEconomics)第3章:完全信息动态博弈

Chapter3:DynamicGameofCompleteInformation完全信息动态博弈动态博弈的扩展式表述完全信息动态博弈的均衡讨价还价博弈纳什均衡的问题——不可置信的威胁完全信息动态博弈的均衡概念——子博弈精炼纳什均衡子博弈精炼纳什均衡的求解——逆向归纳法子博弈精炼纳什均衡举例动态博弈〔序贯行动博弈〕动态博弈(DynamicGames)或序贯行动博弈

Sequential-MoveGames本章讨论完美信息下的动态博弈参与人的行动有先后顺序后行动者能够观察到先行动者都干了什么——完美信息动态博弈例:欺负他人可以获得快乐,你会欺负他人吗?无论何时完成了行动选择,参与人都需要料想他们当前的行动会如何影响未来的行动,包括对手的行动和自己的行动。于是,参与人是在计算未来结果的根底上决定他们当前的行动选择。为了做出最优的行动选择,每个参与人须运用怎样的互动思维?1动态博弈的扩展式表述解放初,美国总是寻找时机来侵犯我国。对此,毛主席提出了“人不犯我、我不犯人,人假设犯我、我必犯人”的战略方针。行动空间:美国“犯我”或“不犯我”,中国“犯人”或“不犯人”行动顺序:美国先行动,我国依美国的行动而后动支付:假设美国“犯我”,中国“犯人”,那么支付向量为(-2,-2);假设美国“犯我”,中国“不犯人”,那么支付向量为(2,-4);假设美国“不犯我”,中国“犯人”,那么支付向量为(3,-5);假设美国“不犯我”,中国“犯人”,那么支付向量为(1,1)。完全信息:对对手的支付情况完全清楚美中军事博弈1动态博弈的扩展式表述博弈树〔gametree〕——有限次博弈的扩展式表述犯人犯人不犯人不犯人犯我不犯我美国我国我国(1,1)(3,-5)(2,-4)(-2,-2)决策结:行动时点枝:任意决策结出发能够选择的行动终点结:对应一个博弈结果,支付向量初始结路径:由不同枝形成的链构造出不同路径,每条路径都通过有限次行动将你带到博弈的某个终点。1动态博弈的扩展式表述例:两房地产商A、B进行房地产开发。市场需求大、小的概率各占50%。投入:1亿。当市场上有两栋楼出售时需求大时,每栋售价1.4亿,需求小时,售价7千万;如果市场上只有一栋楼需求大时,可卖1.8亿需求小时,可卖1.1亿引入一个“自然”的外部参与人,随机性事件被假定为一个称为自然的参与人来控制博弈的随机性特征在博弈树中如何表述?A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)注意:支付向量的顺序与博弈树上行动顺序是对应的!“自然”:虚拟参与人行动顺序:A——自然——B在观察到A的行动和自然的行动后进行决策路径房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B获得的信息有限,无法对集合中的结点进行区分——参与人面临的信息不完美假设:B在不知道N的选择的情形下进行决策,如何用博弈树表示这种信息短缺状态?信息集:决策结的子集——表示参与人都知道些什么房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)假设:B知道N的选择,但不知道A的选择〔或A、B同时决策〕,如何用博弈树表示这种信息短缺状态?房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)假设:B行动前既不知道N的选择,也不知道A的选择,如何用博弈树表示?房地产开发博弈1动态博弈的扩展式表述信息集〔informationset〕是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:

每一个决策结都是同一参与人的决策结;该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。单结信息集:只包含一个决策结的信息集完美〔Perfect〕信息:博弈树的所有信息都是单结的。——博弈中没有任何参与人同时行动,且后行动者能观察到先行动者的行动,且所有参与人观察到N的行动〕静态博弈用扩展式表述1动态博弈的扩展式表述BAA坦白抵赖坦白抵赖坦白抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)A坦白抵赖BB坦白抵赖坦白抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)Q:何为完全信息?囚徒困境博弈练习:丈夫和妻子必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性各为0.5。支付函数如下:如果只有一人带伞,下雨时带伞者支付为-2.5,不带伞者支付为-3;不下雨时带伞者支付为-1,不带伞者支付为0;如果两人都带伞,下雨时每人效用为-2,不下雨时每人的效用为-1;如果两人都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1。给出四种情况下的博弈树:1、每人都出门前不知道是否会下雨,而且两人同时决定是否带伞;2、两人出门前都不知道是否会下雨,但丈夫先决策,妻子在观察到丈夫是否带伞后才决定自己是否带伞;3、丈夫出门前知道是否会下雨,妻子不知道,但丈夫先决策,妻子后决策。但是,参与人可以制定一个行动方案,将每个决策结上的选择都事先规定好,即使这个决策点实际上不会出现。——策略2动态博弈中的策略博弈树中参与人在结点上所选择的单个行动——一步/招

(move)策略:人不犯我、我不犯人;人假设犯我、我必犯人美国中国犯人犯我不犯我不犯人(0,0)(3,-5)犯人不犯人(2,-4)(-2,-2)中国美中军事博弈开发策略:不管A开发不开发,我开发——{开发,开发}追随策略:A开发我开发,A不开发我不开发——{开发,不开发};对抗策略:A开发我不开发,A不开发我开发——{不开发,开发};不开发策略:不管A开发不开发我不开发〕——{不开发,不开发};策略空间为:{开发,开发}、{开发,不开发}、{不开发,开发}〔不开发,不开发}。A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx’A的策略空间为:〔开发,不开发〕;B有2个可选择的行动,但策略空间中的可选策略有?静态博弈中策略=行动2动态博弈中的策略《三国演义》中刘备过江招亲3动态博弈的表述方式比照割耳画不画割耳默认默认小孩父亲父亲(0,0)(-4,-3)(1,-2)(-3,-3){割耳,割耳}{割耳,默认}{默认,割耳}{默认,默认}画-3,-3-3,-31,01,0不画-4,-30,0-4,-30,0小孩父亲威胁博弈4NE的缺陷——不可置信的威胁{割耳,割耳}{割耳,默认}{默认,割耳}{默认,默认}画-3,-3-3,-31,-21,-2不画-4,-30,0-4,-30,0割耳画不画割耳默认默认小孩父亲父亲(0,0)(-4,-3)(1,-2)(-3,-3)三个NE:(不画,{割耳,默认})(画,{默认,割耳})(画,{默认,默认})4NE的缺陷——不可置信的威胁NE(不画,{割耳,默认}):父亲威胁孩子,如果画,那么就割掉耳朵。孩子相信了威胁,那么最好选择不画;如果孩子选择不画,那么父亲选择{割耳,默认}是最优的。如果孩子足够理性,会相信父亲威胁吗?一旦孩子选择了“画”,父亲无疑选择默认,即策略中事先“规定”的“你画我就割你的耳朵”这一行动届时不会发生。——父亲的威胁是不可置信的(notcredible)。(不画,{割耳,默认})不会是该博弈合理的均衡。4NE的缺陷——不可置信的威胁动态中,一个策略是在所有决策结上关于行动选择的规定。NE就是参与人之间这种规定的均衡,但是其中含有一些“不可置信的规定”。这种规定会导致一种时机主义行为,即届时轮到自己行动了,自己会根据当时的情况寻求最优的行动,这种最优选择可能违背事先规定。其他参与人事先知道这一点,会预知到这种时机主义行为,故不会相信含有“不可置信规定”的策略。4NE的缺陷——不可置信的威胁这些包含了不可置信的策略所构成的NE是不能作为模型预测结果的,必须去除。事前〔exante)和事后(expost):一种战略所规定的行动在事前看来是最优的,但事后看并不是当事人的最优选择,这种行动就不可置信,该战略就不是一个合理的战略。5逆向归纳法一个名叫卡门的少女正在决定是否要吸烟。首先,她必须决定究竟要不要试试。如果她决定一试,她就得在将来再决定是否要继续。不抽试着抽继续抽卡门-110不抽单人决策结果:试着抽一下但不持续抽下去。吸烟博弈5逆向归纳法不过,这一分析忽略了吸烟上瘾的问题。一旦卡门尝试过吸烟,她就变成了另外一个人,有不同嗜好,吸烟带给她不同的感受和收益。——决定是否继续吸烟的并不是“今天的卡门”,而是“未来的卡门”。“今天卡门”作出选择时必须预期到其结果并将这一结果纳入基于当前偏好的当前决策的考虑范围换句话说,与抽烟有关决策不是单人在中性环境中的决定,而是一种博弈。“今日卡门”和不同偏好的卡门自己,即“未来卡门”间的博弈。5逆向归纳法不抽试着抽今天的卡门0,0继续抽-1,11,-1不抽未来的卡门两个“卡门”如何行事?未来卡门如何行事?考虑到未来卡门的未来行动,今日卡门今日如何行事?不抽试着抽今天的卡门0继续抽-1,11,-1不抽未来的卡门5逆向归纳法

逆向归纳法从与终点结直接相连的那些决策结开始分析。通过比较其在相关终点结的支付,可以找出参与人在这个节点的最优选择。利用博弈终点的选择来预测前面选择行动的结果,最后一个决策结前面一个节点上的选择就可被确定。然后,依次确定再前面的结点上面的选择5逆向归纳法网络诗歌:我站在未来的山坡上回头看过去和现在如同不再有悬念的平静湖面所有发生的一切都是如此清晰和必然通过沿着博弈树如此的逆向推导,就可以解出整个博弈。沿着贯穿整个博弈树的剩下的唯一路径,就知道了当所有参与人在正确预测了所有的未来后果下做出最优选择时,在博弈中发生了什么。未来卡门这个影子的存在和当今日卡门选择“试着抽”且给她一个行动时机时,她将选择“继续抽”。今日卡门选择最优策略“不抽”正是受控于此。它的虚构的出现和潜在的策略在决定今日卡门的招术时发挥了作用。不抽试着抽今天的卡门0继续抽-1,11,-1不抽未来的卡门Q:均衡结果中,瘾君子未来的卡门根本就不会出现,更没有时机出招。为何还要规定未来卡门最优策略?[-W(E),-W(E)-E]被举发1-P收益[R(E)-W(E),W(E)-E]成功(P)不行贿行贿行贿人受贿不受贿受贿者[R(0),0]不举发收益[R(0),0]举发[-R(0),0]5逆向归纳法作贡献不作贡献Emilya不作贡献作贡献Ninac3,3,3作贡献Tania3,3,4不作贡献Nina作贡献不作贡献bd3,4,3作贡献Tania1,2,2不作贡献e4,3,3作贡献Tania2,1,2不作贡献f2,2,1作贡献Tania2,2,2不作贡献g逆向归纳的结果:Emily不作奉献,Nina选作奉献,Tania选作奉献作贡献不作贡献Emilya不作贡献作贡献Ninac3,3,3作贡献Tania3,3,4不作贡献Nina作贡献不作贡献bd3,4,3作贡献Tania1,2,2不作贡献e4,3,3作贡献Tania2,1,2不作贡献f2,2,1作贡献Tania2,2,2不作贡献gTania均衡路径〔equilibriumpathofplay〕其他路径为非均衡路径5逆向归纳法不过,均衡路径不是均衡的完整表述均衡分析的完整表述是通过说明每个参与者的最优策略得到的。在这一博弈中,策略是什么样子的?它丢掉了大多数的分支和节点。计算一旦到达这些节点时需要采取的最优行动,是决定最终均衡的重要环节。Why?

Emily的策略共2个:C或DNina的策略共4个:CD,CC,DC,DDTania的策略共16个:CCCC,CCCD,……,DDDD5逆向归纳法根据逆向归纳法,策略组合:Emily选择D,Nina选择DC,Tania选择DCCD构成该博弈的均衡。均衡中,Emily获得最正确结果,因为她可以利用自己第一个行动的时机——先动优势先行优势来自于将自己置于有利位置并迫使其他参与人为此进行调整的能力。是否所有博弈都存在先动优势?顺序优势作奉献不作奉献g3,4,3作贡献Tania1,2,2不作贡献e3,3,3Tania3,3,4d4,3,3Tania2,1,2e2,2,1Tania2,2,2作贡献不作贡献Emilya不作贡献作贡献Ninac子博弈1子博弈2子博弈3子博弈4子博弈5子博弈6Ninab子博弈:〔subgame〕由原博弈中某个决策结开始的局部构成一个子博弈。逆向归纳法实际上就是从动态博弈的最后一个子博弈开始,逐步向前倒推以求解动态博弈的方法。3,4,3作贡献Tania1,2,2不作贡献e3,3,3Tania3,3,4d4,3,3Tania2,1,2e2,2,1Tania2,2,2作贡献不作贡献Emilya不作贡献作贡献Ninac子博弈1子博弈2子博弈3子博弈4子博弈5子博弈6Ninab6子博弈精炼纳什均衡子博弈精炼纳什均衡(SubgameperfectNashequilibrium,SPNE)〔Selten〕〔1965〕如果在一个完美信息的动态博弈中,各参与人的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的“子博弈精炼纳什均衡”。在完全信息动态博弈中,逆向归纳法求得的均衡就是子博弈精炼纳什均衡。NE:〔不画,{割,默认}〕NE:〔画,{默认,割}〕NE:〔画,{默认,默认}〕不包含不可置信的行动的策略——子博弈精炼纳什均衡〔能够排除保证实际发生的动态行为与事前规定的策略是一致的,因此是真正稳定的〕。子博弈Ⅱ割耳默认(1,-2)(-3,-3)子博弈Ⅰ小孩画不画父亲割耳默认(0,0)(-4,-3)6子博弈精炼纳什均衡威胁博弈6子博弈精炼纳什均衡例UDLR(2,2)(3,1)(0,0)122,22,23,10,01UDLR2NE〔U,R〕在子博弈上不构成NE;NE〔D,L)在子博弈上构成NE,所以为SPNE;SPNE贯彻了这样一种思想:不管过去发生了什么,参与人在每个决策结上都最优化自己的决策。——“序贯(sequential)理性”

NE:(不画,{割,默认})NE:(画,{默认,割})SPNE:(画,{默认,默认})子博弈Ⅱ割耳默认(1,-2)(-3,-3)子博弈Ⅰ小孩画不画父亲割耳默认(0,0)(-4,-3)6子博弈精炼纳什均衡6子博弈精炼纳什均衡练习:121〔2,0〕〔5,0〕〔4,2〕〔1,1〕UDRLU’D’均衡为〔{U,U’};L〕,均衡结果为1选择U。桌子上有一定数量的火柴,两个人轮流拿火柴,每次可以拿1根或2根,拿到最后1根或2根者胜出,胜者可赢得1块钱,负者那么输掉1块钱。如果你是先行者,应该如何行动?夺宝战nimgame

乙112乙(1,-1)甲(-1,1)112甲1(-1,1)甲1(-1,1)2211(1,-1)乙乙1乙甲2乙21甲21(-1,1)1甲(1,-1)(1,-1)均衡结果:〔2,2,1〕〔2,1,2〕夺宝战nimgame甲必胜,因为他始终在开局拿走2根火柴,剩下3根,不管乙拿1或2根,甲都可获得最后的2根或1根火柴从而获胜。但是,如果假设初始的火柴根数为30根或100根等等,那么结果如何?仍然用逆向归纳法。假设参与人面临最后的1或2根,那么必胜;但假设面临最后的3根,那么必输;当参与人面临的是4根或5根,那么他可以拿走1根或2根,使对手面临3根的局面,那么必胜;如果参与人面临的是6根火柴,那么无论拿1根还是2根都不能使对手面临3根火柴的局面,而对手反而可以使他面临3根火柴的局面,那么对手必胜;假设参与人面临7根或8根火柴,那么他可使对手面临6根火柴而对手必输;假设处于9根,那么将被对手逼迫到6根火柴的位置而自己必输……夺宝战nimgame3、6、9、12……等3的整数倍火柴数量下必定是先动者甲输掉,而4、5、7、8……等非3的整数倍火柴数量下必定是先动者甲赢得。象棋是动态博弈的典范,因而在技术上服从完全的逆向归纳法分析。所有的出招对其他参与者都是可见的没有偶然因素〔比照于打牌〕有限次出招然而,象棋确是一个无比复杂的博弈。夺宝战nimgame完全信息动态博弈中,如果博弈阶段较多,那么画出博弈树很困难,不过逆向归纳法仍然是适用的。5个海盗抢到了100颗宝石,每一颗都有一样的大小和一样贵重的价值,经过商议,他们决定将宝石这样分配:

a抽签决定自己的号码1,2,3,4,5。

b首先,由1号提出分配方案,然后5人进行表决,如果同意这种方案的人到达半数,就按照1号的提案进行分配,否那么,他将被扔入大海喂鲨鱼,然后由接下来的人继续重复提议。假设每个海盗都是绝顶聪明,也不互相合作,而且每个都追求最大限度得到金币宝石1号海盗如何提议?海盗分赃5号海盗:分给自己100枚宝石4号海盗:分给自己100枚宝石并赞成自己;5号海盗被分得0枚,反对无用3号海盗:分给5号海盗1枚并得到5号的同意;分给自己99枚,自己同意;分给4号海盗0枚,4号反对也无用2号海盗:分给4号1枚得到4号的同意;分给自己99枚,自己也同意;3、5号反对无用。1号海盗:分给3、5号海盗各1枚,获得3、5号的同意;分给自己98枚,自己同意;分给2、4号海盗0枚,他们会反对但不起作用。均衡结果是〔98,0,1,0,1〕海盗分赃总结第一步:描述博弈〔语言〕第二步:画出博弈树〔图形〕第三步:逆向归纳法求解均衡〔图形〕第四步:说明均衡〔语言〕求解完全信息动态博弈的四个步骤:7不可置信威胁与承诺默认结婚(-1,1)(0,-2)(1,-1)断绝父女关系断绝恋爱关系文君父亲不可置信的威胁〔空洞威胁,emptythreat)司马相如与卓文君的恋爱精炼纳什均衡剔除了不可置信的威胁,使得我们可以更合理地对博弈中参与人行为的预测Q:为什么存在不可置信威胁?7不可置信威胁与承诺打击进入(0,100)(50,50)(-10,30)默认不进入进入者在位者市场进入博弈不可置信的承诺〔空口承诺〕“圣人”孔子,曾经生活在陈国,后来离开成果时途经蒲地,正好遇到公叔氏在蒲地叛乱,蒲地人将孔子扣留,不允许其离开。在孔子请求下,他们提出条件,如孔子不去卫国,就放孔子离开。孔子还对天发誓不去卫国,于是他们放了孔子,结果一出东门,孔子直奔卫国。到未果后,子贡问孔子“誓言可以背叛吗?”孔子说:“被迫立下的誓言,神灵是不会听的。”圣人都可以背叛空口承诺,何况凡夫俗子。孔子的承诺7不可置信威胁与承诺长达数十年的矛盾积怨一直难以解决看不到和平的曙光。重要原因之一在于双方都无法给对方坚实的承诺。巴方“以土地换和平”的承诺就是廉价的。因为,如果以色列从占领的领地上撤走,而巴方仍然可以继续从事恐怖活动巴以冲突7不可置信威胁与承诺7不可置信威胁与承诺——在位者事前扩大生产能力:维护费用30万,但打击进入者的本钱降低了,扣除维护费用后也可获得30万,如果进入者进入而在位者默认,那么在位者利润为50-30=20万打击进入(70,0)(20,50)(30,-10)默认不进入进入者在位者扩大生产能力在位者如何将不可置信的威胁变成可置信的威胁?——承诺市场进入博弈中的承诺行动7不可置信威胁与承诺项羽破釜沉舟对秦军:最惠条款:生产耐用品的企业经常被“降价预期”所困扰:如果消费者预期企业将降价,他们将会等待,结果,企业只能降价〔如汽车行业〕其他承诺行动的例子:承诺行动:采取承诺行动过后,实施威胁或承诺符合威胁者或承诺者的利益8子博弈精炼纳什均衡:连续性策略企业1为领头企业,首先选择自己的产量;企业2为跟随者,根据企业1的产量选择自己的产量222126qqqq--=逆向归纳法求解SPNE结果。第二阶段企业2的问题为一阶条件,也就是反响函数为Stackelberg寡头竞争模型8子博弈精炼纳什均衡:连续性策略与cournot模型中企业2的反应函数相同企业1会预测到企业2的反响,因此第一阶段的问题为代入企业2的反响函数得q1*=3那么q2*=1.5

产量支付厂商13单位4.5厂商21.5单位2.25古诺博弈均衡:厂商12单位4厂商22单位48子博弈精炼纳什均衡:连续性策略比较stackelberg模型和counot模型结果:stackelberg均衡counot均衡为什么?企业1存在先动优势〔first-moveradvantage〕

产量支付产量支付厂商13单位4.524厂商21.5单位2.2524与cournot模型相比,企业2拥有信息优势反而对自己不利ab(5,3)12(2,4)1cdfe(4,3)(8,5)(3,6)2gh练习9讨价还价〔Bargaining〕博弈讨价还价问题的普遍性儿童在共用玩具和做游戏上夫妇在房屋归属、养育孩子以及彼此事业所做调整买卖双方在价格谈判上劳资双方商议工资国家之间谈判自由贸易政策9讨价还价〔Bargaining〕博弈所有讨价还价问题的共同点:参加谈判各方通过达成协议所能够产生和得到的总收

益应该比他们独立行动所能得到的个人收益之和要大。谈判不是零和博弈。整体大于局部的和,假设不存在超额价值〔“剩余”〕,谈判就没有意义外表看起来是一个零和博弈:当剩余存在时,谈判就是为了瓜分它。每个讨价还价者都试图让自己多得,而留给别人更少。9讨价还价〔Bargaining〕博弈但在这背后隐藏着一个危险,如果协议未能达成,没有人可以得到任何一点剩余。——“双输”这一不利于双方的结果,以及双方都要防止之的愿望,为威胁〔明显的或隐含的〕创造了可能,这就使得讨价还价成为一个策略问题。9讨价还价〔Bargaining〕博弈在博弈论产生之前,一对一的谈判一般被认为是困难的,而且是永无止境的,相似的情况会产生各不相同的结果。对于为什么一方比另一方多得,理论家不能找到一个有条理的解释,只好把这一结果归因于模糊不清的“讨价还价能力”的差异上。即使是简单的纳什均衡理论也不能起作用。9讨价还价〔Bargaining〕博弈分析讨价还价问题的两种研究思路:一种分析途径是把讨价还价看成合作博弈。这里,各方共同寻找和实施一个解决方案,可能找一个中立的第三方来作为执行的仲裁者。——“共同行动”另一种分析途径将讨价还价作为一个非合作博弈,这里,各方独立地选择策略。——“独立行动”9讨价还价〔Bargaining〕博弈最常见的讨价还价方式:轮流出价提议提议谈判结束同意AB同意谈判结束A提议谈判结束B提议谈判结束同意同意A和B两人分1块钱;A先出价,B决定接受还是拒绝;如果接受,按照A提出的方案分配,谈判结束;如果B拒绝,B提出方案,A决定接受还是拒绝;如果接受,按B的方案分配,谈判结束;如果不接受,再由A提出方案;如此等等。9讨价还价〔Bargaining〕博弈可获得的剩余随着每次出价而递减另一个可能是时间是有价值的,不耐烦在此过程中扮演重要角色,因此拖延越久越没有价值。序贯博弈,通过逆向归纳法它的精炼NE。但博弈的终点在哪里?为什么出价和还价的过程会停止,或者,更彻底问,为何会轮流出价〔为什么两位谈判者不坚持他们最初的价格,并拒绝改变意见〕轮流出价过程中会有人让步。让步的原因:一定是继续坚持会造成更大的损失。损失的两种形式:轮流出价模式一:剩余不断递减的情形球迷和黄牛的票价谈判某球迷抵达NBA球赛赛场门口,但是没有门票。他最多愿意付25美元观看每节比赛。场外有票贩倒卖球票。票贩向他提出一个价格,球迷假设不愿意支付此价格那么会转身到附近酒吧看第一节球赛。等该节比赛结束时,他走出酒吧,发现票贩还在那里,于是球迷就会提出另一个价格。假设票贩不同意,继续回到酒吧;第二节结束,再走出酒吧,票贩会再提出一个价格。倘假设球迷还是无法接受,他会再次回到酒吧,并在第三节结束时再向票贩出价提议提议谈判结束同意票贩你同意谈判结束票贩提议谈判结束你提议谈判结束同意同意观看球赛的价值会随着节数减少而衰减。逆向归纳法预测该谈判的结果第三节结束:球迷知道假设他不买球票,那么票贩球票变成废纸一张,所以即使球迷提出价格非常低,票贩也会卖票给他=他几乎可以免费获得球票。第二节结束:票贩出价(握有出价主动权),但是他必须考虑到第三节的情况,且须认清事实——他无法从球迷那里获得剩余两节球赛的完全价值。假设票贩出价高于25元〔球迷对第三节比赛的评价〕,球迷就会拒绝票贩的价格,因为球迷知道他可用几乎0价格观看第四节比赛,故票贩出价最多25元。第一节结束:球迷出价,球迷知道假设他现在不买下球票,那么之后票贩的期望价格为25元,所以球迷只要出价25元就可以获得球票。比赛开始前:票贩出价,考虑到后面的情况会出价50元〔代表球迷对第一节25元的评价与对剩余三节球赛25元的评价〕9讨价还价〔Bargaining〕博弈V=100V=75V=50V=25V=001234球迷〔F〕的支付票贩(S)的支付00025252550255050SFSF/最优出价/0252550====9讨价还价〔Bargaining〕博弈设想100g冰淇淋,每个回合融化10g〔假设A先提议〕,那么均衡是什么?如果谈判进行2个回合:第二回合B先出价,他将把整个冰淇淋(90g)留给自己;第一回合A先出价,此时为了让B不反对,A必须给B至少90g,自己得10g。如果谈判进行3个回合:第三回合A先出价,他将把整个冰淇淋(80g)留给自己;第二回合B出价,此时为了让A不反对,B必须给A至少80g,自己得10g;第一回合A出价,此时为了让B不反对,A必须给B至少10g,自己90g。——十回合九回合回合(提议人)甲乙甲乙可分配克数3(甲)4(乙)2(乙)1(甲)6(乙)5(甲)7(甲)8(乙)9(甲)10(乙)50304050604040304020302030102010200505040504040403030302030202010201010010100908070605040302010轮流讨价还价博弈的抽象:总价值衰减的情形两位谈判者A和B之间瓜分价值为V的剩余,A首先出价。假设B拒绝此价格,那么剩余就减少x1减少到〔V-x1〕;然后B出价。假设A拒绝,那么剩余就减少x2减少到〔V-x1-x2〕;再由A出价。然后再继续出价,一直到最后,假设10个回合博弈就结束,即V-x1-x2…-x10=0。第10回合:只剩下x10,B提出最后价格,他将得到x10。第9回合:剩余x9+x10,A出价:B得到x10,自己得x9。第8回合:剩余x8+x9+x10,B出价:A得到x9,自己得x8+x10。第7回合:剩余x7+x8+x9+x10,A出价:B得到x8+x10,自己得x7+x9。第1回合:A出价:自己得x1+x3+x5+x7+x9,B得到x2+x4+x6+x8+x10。简单的技巧:假定所有的出价都被拒绝〔实际上不会发生〕。然后,加总所有被参与人拒绝的价格,所得到的总数就是真正均衡时,另一参与人得到的剩余。如:当B拒绝了A的出价,可获得的剩余就会减少x1,而x1就会成为博弈均衡时A的可获得剩余的一局部。9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论