




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2完全信息动态博弈扩展型博弈表述扩展型博弈的战略及纳什均衡子博弈精炼纳什均衡子博弈精炼纳什均衡应用举例2完全信息动态博弈扩展型博弈表述12完全信息动态博弈动态博弈:参与人的行动有先后顺序,且后行动者能够观察到先行动者的行动(电信公司、电信用户及资费套餐)。先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做出最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?给定他的应对,什么是我的最优选择?(美女;帅哥)例:欺负他人可以获得快乐,你会欺负他人吗?不会。欺负他人会担心他人的报复,抵消了从欺负他人的行为中获得快乐。——先行动者在选择行动时要考虑自己的选择对后行动者的影响。2完全信息动态博弈动态博弈:参与人的行动有先后顺序,且后行2一、动态博弈的扩展式表述I
如何用扩展式表述(extensiveformrepresentation)来描述动态博弈?
例1,解放初,美国总是寻找各种机会来侵犯我国。对此,毛主席提出了“人不犯我、我不犯人,人若犯我、我必犯人”的战略方针。该动态博弈的战略式表述局中人:美国、中国行动空间:美国“犯我”或“不犯我”,中国“犯人”或“不犯人”行动顺序:美国先行动,我国依美国的行动而后动支付:这样假设支付情况:若美国“犯我”,中国“犯人”,则支付向量为(-2,-2);一、动态博弈的扩展式表述I如何用扩展式表述(3一、动态博弈的扩展式表述Ⅱ
n人有限战略的扩展式表述:博弈树(gametree)犯人犯我不犯我犯人不犯人不犯人美国我国我国(1,1)(3,-5)(2,-4)(-2,-2)若美国“犯我”,中国“不犯人”,则支付向量为(2,-4);若美国“不犯我”,中国“犯人”,则支付向量为(3,-5);若美国“不犯我”,中国“犯人”,则支付向量为(1,1)。2人有限博弈的战略式表述:支付矩阵决策结:行动的时点枝终点结一、动态博弈的扩展式表述Ⅱn人有限战略的扩展式表犯人犯我4参与人集合:,此外,虚拟参与人“自然”;参与人的行动顺序(theorderofmoves):谁在什么时候行动;参与人的行动空间(actionset):在每次行动时,参与人有些什么选择。参与人的信息集(informationset):每次行动时,参与人知道些什么;参与人的支付函数;外生事件(即自然的选择)的概率分布扩展式表述的要素:一、动态博弈的扩展式表述Ⅵ参与人集合:,此外,虚拟参与人“自然5一、动态博弈的扩展式表述Ⅲ例2:两个房地产商A、B进行房地产开发博弈。市场需求大、小的概率各占50%。投入:1亿。假定市场上有两栋楼出售:需求大时,每栋售价1.4亿,需求小时,售价7千万;如果市场上只有一栋楼需求大时,可卖1.8亿需求小时,可卖1.1亿行动顺序:(1)开发商A首先行动,选择开发或不开发;(2)在A决策后,自然选择市场需求的大小;(3)开发商B在观测到A的决策和市场需求后,决定是否开发一、动态博弈的扩展式表述Ⅲ例2:两个房地产商A6A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)房地产开发博弈(图2.1)注意:支付向量的顺序与博弈树上行动顺序是对应的!A开发不开发NN大小1/21/2大小1/21/2BBBB开发7A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)
B在决策时不确切地知道自然的选择;B的信息集由4个变为2个该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结A开发不开发NN大小1/21/2大小1/21/2BBBB开发8A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)
B知道自然的选择;但不知道A的选择(或A、B同时决策)
房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发9信息集(informationset)的概念:是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:每一个决策结都是同一参与人的决策结;该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。只包含一个决策结的信息集称为单结信息集,如果博弈树的所有信息都是单结的,该博弈称为完美信息博弈
。(博弈中没有任何参与人同时行动,且后行动者能观察到先行动者的行动,且所有参与人观察到N的行动)一、动态博弈的扩展式表述Ⅳ信息集(informationset)的概念:是决策结集合10A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)表示B在行动前既观察不到A的行动,也观察不到N的行动房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发11N大小AA开发不开发开发不开发1/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)
不同的博弈树可能代表相同的博弈,但有一个基本准则一个参与人决策之前知道的事情必须出现在该参与人的决策结之前实际上是A先行动>N>B(图2.5)1/2N大小AA开发不开发开发不开发1/2BBBB开发不开发开发不12静态博弈用扩展式表述。例囚徒困境博弈一、动态博弈的扩展式表述ⅤBAA坦白抵赖坦白抵赖坦白抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)A坦白抵赖BB坦白抵赖坦白抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)静态博弈用扩展式表述。例囚徒困境博弈一、动态博弈的扩展式表述13二、动态博弈中的战略令Hi为第i个参与人的信息集的集合,Ai=
hiHiA(hi)为其行动集合,其中A(hi)是在信息集hi的行动集合。参与人i的一个纯战略是从信息集集合Hi到行动集Ai的一个映射,用Si:Hi
Ai表示,其中,对于所有的hi
Hi,Si(hi)A(hi),参与人的纯战略空间Si就是所有的Si的集合,因为每一个纯战略都是从信息集到行动集的一个映射,Si可以表示为每一个信息集hi上的行动空间A(hi)的笛卡尔积:Si=
hiHiA((hi)
二、动态博弈中的战略令Hi为第i个参与人的信息集的集合,A14二、动态博弈中的战略战略是一个完备的行动计划:在博弈开始之前就规定出每一个决策点上的选择,即使这个决策点实际上不会出现。例1:房地产开发博弈(映射关系)
AB开发开发不开发不开发(0,0)(0,1)开发不开发(1,0)(-3,-3)B二、动态博弈中的战略战略是一个完备的行动计划:在博弈开始之前15若A先行动,B在知道A的行动后行动,则A有一个信息集,两个可选择的行动,战略空间为:(开发,不开发);B有两个信息集,2个可选择的行动,B有四个纯战略:开发策略:不论A开发不开发,我开发——{开发,开发}追随策略:A开发我开发,A不开发我不开发——{开发,不开发};反向策略:A开发我不开发,A不开发我开发——{不开发,开发};不开发策略:不论A开发不开发我不开发)——{不开发,不开发};战略空间为:{开发,开发}、{开发,不开发}、{不开发,开发}
(不开发,不开发}。A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx’什么是参与人的战略?若A先行动,B在知道A的行动后行动,则A有一个信息集,两个可16三、战略式表述下的纳什均衡Ⅰ开发不开发AB{开发,开发}-3,-3-3,-31,01,00,10,00,10,0{开发,不开发}{不开发,开发}{不开发,不开发}A(不开发,{开发,开发})三、战略式表述下的纳什均衡Ⅰ开发不开发AB{开发,开发}-17三个纯战略NE:(开发,{不开发,开发});(开发;{不开发,不开发});(不开发,{开发,开发})
问题:哪一个会出现呢?
三个纯战略NE:(开发,{不开发,开发});(开发;{不开发18三、战略式表述下的纳什均衡ⅡNE(不开发,{开发,开发}):B威胁无论A是否开发自己都将开发,A相信了威胁,则最好选择不开发;如果A选择不开发,则B选择{开发,开发}是最优的。A会相信B的威胁吗?如果A选择了开发,B的最好选择不开发。——B的威胁是不可置信的(notcredible):给定A选择了“开发”,“开发”不是B的最优选择。(不开发,{开发,开发})不会是该博弈合理的均衡。为什么?三、战略式表述下的纳什均衡ⅡNE(不开发,{开发,开发}):19三、战略式表述下的纳什均衡Ⅲ纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的,即参与人并不考虑自己的选择对他人的影响。但是如果参与人的行动有先有后,后行动者的选择空间依赖于前行动者的选择,先行动者在选择时不可能不考虑自己的行动对后行动者的影响。NE(开发,{不开发,不开发}):{不开发,不开发}不是B一个合理的战略,因为如果A选择了不开发,B的最优选择是开发而非不开发。NE(开发,{不开发,开发}):若A选择开发,B的最优选择是开发;若A选择不开发,则B选择开发。A预测到自己的选择对B产生的影响,选择开发。三、战略式表述下的纳什均衡Ⅲ纳什均衡假定每一个参与人在选择自20四、子博弈精炼纳什均衡IⅡⅢ不包含不可置信的行动的战略所组成的NE被称为“精炼纳什均衡”(PerfectNashequilibrium);也就是说,不论过去发生了什么,构成精炼纳什均衡的战略,其所规定的行动在每一个决策点上都是最优的;首先必须是“纳什均衡”,但并非所有纳什均衡都是合理的;只有其战略不包含不可置信行动的纳什均衡才是合理的。四、子博弈精炼纳什均衡IⅡⅢ不包含不可置信的行动的战略所组成21子博弈。A
开发不开发
B
B开发不开发开发不开发
(-3,-3)(1,0)(0,1)(0,0)定义:一个扩展式博弈的子博弈G由一个决策结和所有该决策结的后续结T(x)组成,它满足下列条件:1、x是单结信息集,即h(x)=x;2、对于所有的x1T(x),如果x2h(x1),那么x2T(x)子博弈。22有几个子博弈?A
UDB
BLRLR
C
C
C
Clrlrlrlr(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)o
0
有几个子博弈?o023不开发四、子博弈精炼纳什均衡Ⅱ子博弈:由原博弈中某个决策点(信息集)开始的部分构成一个子博弈。原博弈不开发开发
开发不开发(0,0)(0,1)开发(1,0)(-3,-3)BAxx’x子博弈I(-3,-3)(1,0)x’子博弈Ⅱ(0,1)(0,0)开发不开发不开发开发不开发四、子博弈精炼纳什均衡Ⅱ子博弈:由原博弈中某个决策点(24四、子博弈精炼纳什均衡Ⅲ一个纳什均衡是精炼纳什均衡,当只当参与人的战略在每个子博弈中都构成纳什均衡,也就是说,组成精炼纳什均衡的战略必须在每一个子博弈中都是最优的。——泽尔腾(Selten)(1965):子博弈精炼纳什均衡(SubgameperfectNashequilibrium,SPNE)序贯理性(sequentialrationality):不管过去发生什么,参与人在每一个决策结上最优化自己的行动。例,房地产开发博弈:(不开发,{开发,开发})在子博弈Ⅰ上不构成NE;(开发,{不开发,不开发})在子博弈Ⅱ不构成NE;(开发,{不开发,开发})在所有子博弈上都构成NE。四、子博弈精炼纳什均衡Ⅲ一个纳什均衡是精炼纳什均衡,当只当参25四、子博弈精炼纳什均衡Ⅳ例UDLR(2,2)(3,1)(0,0)122,22,23,10,01UDLR2NE(U,R)在子博弈上不构成NE;NE(D,L)在子博弈上构成NE,所以为SPNE;四、子博弈精炼纳什均衡Ⅳ例UDLR(2,2)(3,1)(0,26四、子博弈精炼纳什均衡Ⅵ逆向归纳法(backwardinduction)求解有限博弈的精炼纳什均衡:从最后一个决策点开始,找出该子博弈的纳什均衡;然后再倒回到倒数第二个决策点,找出决策者的最优决策(假定最后一个决策者的决策是最优的;如此一直到初始决策点,所有子博弈上的最优选择就是精炼纳什均衡。又称“rollback”。逆向归纳法只适用于完美信息博弈。四、子博弈精炼纳什均衡Ⅵ逆向归纳法(backwardind27犯人犯我不犯我犯人不犯人不犯人美国我国我国(1,1)(3,-5)(2,-4)(-2,-2)例1:逆向归纳法找中美军事博弈的SPNE均衡为(不犯我,{犯人,不犯人})犯人犯我不犯我犯人不犯人不犯人美国我国我国(1,1)(3,-28例2:121(2,0)(5,0)(4,2)(1,1)UDRLU’D’均衡为({U,U’};L),均衡结果为1选择U。例2:121(2,0)(5,0)(4,2)(1,1)UDRL29四、子博弈精炼纳什均衡Ⅶ特定的纳什均衡下所经过的决策点和最优选择构成的路径,称为均衡路径(equilibriumpath);其他的路径是非均衡路径(off-equilibriumpath);SPNE与NE的实际区别:SPNE要求在每个子博弈上构成纳什均衡=构成SPNE的战略不仅在均衡路径的决策结上最优,而且在非均衡路径的决策结上也是最优的
四、子博弈精炼纳什均衡Ⅶ特定的纳什均衡下所经过的决策点和最优30轮流出价的讨价还价模型两人分一块蛋糕,参与人1先出价,参与人2可以接受或拒绝.如果参与人2接受,博弈结束;如果参与人2拒绝,参与人2出价,参与人1此时必须接受.问此博弈的精炼的纳什均衡?用x表示参与人1的份额,(1-x)表示参与人2的份额,假定参与人1与参与人2的贴现因子分别为
1,
2轮流出价的讨价还价模型两人分一块蛋糕,参与人1先出价,参与人31
乙112乙(1,-1)甲(-1,1)112甲1(-1,1)甲1(-1,1)2211(1,-1)乙乙1乙甲2乙21甲21(-1,1)1甲(1,-1)(1,-1)均衡路径:(2,2,1)(2,1,2)乙112乙(1,-1)甲(-1,132甲必胜,因为他始终在开局拿走2根火柴,剩下3根,不管乙拿1或2根,甲都可获得最后的2根或1根火柴从而获胜。但是,如果假设初始的火柴根数为30根或100根等等,那么结果如何?仍然用逆向归纳法。假设参与人面临最后的1或2根,则必胜;但若面临最后的3根,则必输;当参与人面临的是4根或5根,则他可以拿走1根或2根,使对手面临3根的局面,则必胜;如果参与人面临的是6根火柴,则无论拿1根还是2根都不能使对手面临3根火柴的局面,而对手反而可以使他面临3根火柴的局面,则对手必胜;若参与人面临7根或8根火柴,则他可使对手面临6根火柴而对手必输;若处于9根,则将被对手逼迫到6根火柴的位置而自己必输……甲必胜,因为他始终在开局拿走2根火柴,剩下3根,不管乙33例,最后通牒博弈
张三拾到100块,被李四见到。见者有份,于是2人决定如何分这笔钱。极端地假设他们的谈判只进行一个回合,即由张三提出一个分配比例(最小计算单位为元),然后李四表示接受不接受,如果接受就按照提议分,如果不接受则将钱交到警察局,谁都得不到。张三如何提议?例,最后通牒博弈34最后通牒博弈实验结果:现实生活中提议者给回应者1元钱的话,常常会遭到回应者拒绝;不少被接受的分配方案是分给回应者30-50元,20元以下的分配被拒绝的频率很高。人除了自利偏好还存在公平偏好(FairnessPreferences),即在追求个人收益时还会关注收益分配或行为动机是否公平。“我的收益多过对方太多,我可能会不舒服”——收益公平“知恩图报,以牙还牙”:当别人对你友善时你也对别人友善,当别人对你不善时你也对别人不善,甚至牺牲自己利益去报复——动机公平公平偏好会影响人们的行为决策。最后通牒博弈实验结果:35分析动态博弈的思路:向前展望,向后推理,即面向未来,思考现在,站在未来的立场思考现在的行动方案。网络诗歌我站在未来的山坡上回头看过去和现在如同不再有悬念的平静湖面所有发生的一切都是如此清晰和必然分析动态博弈的思路:向前展望,向后推理,即36甲右下上前后左甲乙(2,0)(1,1)(0,2)(3,0)练习:甲右下上前后左甲乙(2,0)(1,1)(0,2)(3,0)练37右下上前后左五、序贯理性与理性操纵I甲乙甲(2,0)(1,1)(100,0)(0,100)操纵理性的博弈均衡结果为:甲选择下结束博弈右下上前后左五、序贯理性与理性操纵I甲乙甲(2,0)(1,138五、序贯理性与理性操纵Ⅱ
现实中该均衡很可能不会出现。为什么?甲可能会想,如果我选择“上”,即使乙选择了“左”,则我也可以得到1个单位支付;但是,如果乙认为我是傻子,则乙可能会冒险选择一次“右”……而如果我选择前,我就可以获得100个单位的支付。甲真的选择了“上”如果乙认为甲真的是傻子,那么乙可能冒险选择“右”。甲选择“前”。
理性操纵:利用对方的理性不足而引诱对方上钩,获取利益。如,三国中黄盖诈降五、序贯理性与理性操纵Ⅱ现实中该均衡很可能不会出39六、不可置信威胁I不可置信的威胁(空头威胁,emptythreat)精炼纳什均衡剔除了不可置信的威胁,使得我们可以更合理地对博弈中参与人行为的预测;为什么存在不可置信威胁?
例1,司马相如与卓文君的恋爱故事默认结婚(-1,1)(0,-2)(1,-1)断绝父女关系断绝恋爱关系文君父亲威胁所采取的策略会损害威胁者自己利益因而根本不会实施(根源是事前最优与事后最优不同);六、不可置信威胁I不可置信的威胁(空头威胁,emptyth40六、不可置信威胁Ⅱ其他例子管教孩子MBA复试录取打击进入(0,100)(50,50)(-10,30)默认不进入进入者在位者例2,市场进入博弈六、不可置信威胁Ⅱ其他例子打击进入(0,100)(50,5041七、承诺Ⅰ如何将不可置信的威胁变成可置信的威胁?——承诺(招聘,勤奋)例,市场进入博弈中的承诺行动在位者事前扩大生产能力,维护费用30万,但打击进入者的成本降低了,扣除维护费用后也可获得30万,如果进入者进入而在位者默认,则在位者利润为50-30=20万打击进入(0,70)(50,20)(-10,30)默认不进入进入者在位者扩大生产能力在位者七、承诺Ⅰ如何将不可置信的威胁变成可置信的威胁?——承诺(招42七、承诺Ⅱ承诺行动:使威胁或承诺可信的行动,采取承诺行动过后,实施威胁或承诺符合威胁者或承诺者的利益扩大生产能力虽然产生30万维护费用,但这样做仍然是值得的;这一模型解释了现实中大部分垄断企业有闲置生产能力(中国国情学生学习托福)其他承诺方式:召开新闻发布会公开宣称自己打击意图,有声望的企业言出必行。七、承诺Ⅱ承诺行动:使威胁或承诺可信的行动,采取承诺行动过后43七、承诺Ⅲ其他承诺行动的例子:项羽破釜沉舟对秦军最惠条款:生产耐用品的企业经常被“降价预期”所困扰:如果消费者预期企业将降价,他们将会等待,结果,企业只能降价。如汽车行业面临的问题;最惠条款可以起到承诺的作用:企业不会降价了。(100,80.40.20)七、承诺Ⅲ其他承诺行动的例子:44合同写入“差价赔付”记者向该楼盘售楼处进行了了解,一位销售员表示“现在这批房子均价2万/平,一共只有100套,面积有145、168、180平三种,上午就卖了20多套了”。值得一提的是,这批房源还有一个“最低价保证”,“我们还承诺,在交房前3个月,如果房价低于现在这批房子的价格,那么我们会按照差价金额补偿给你,这是写入购房合同的”,这也是此番宏观调控下首个承诺差价赔付的项目。某房产调查显示,该楼盘为今年9月25日开盘的新项目,当时报价为低区26500元/平,高区28000元/平,购房享5万抵20万的优惠。10月中旬左右,该案也曾推出10套特价房,在减15万的基础上再打95折。但网上房地产最新数据显示,其9月份推出的340套房源,仅有10套完成签约销售。合同写入“差价赔付”45九、子博弈精炼纳什均衡应用举例ⅠStackelberg(1934)寡头竞争模型企业1为领头企业,首先选择自己的产量;企业2为跟随者,根据企业1的产量选择自己的产量。设市场需求函数为企业i的利润为逆向归纳法求解SPNE结果。第二阶段企业2的问题为一阶条件,也就是反应函数为与cournot模型中企业2的反应函数相同九、子博弈精炼纳什均衡应用举例ⅠStackelberg(1946九、子博弈精炼纳什均衡应用举例Ⅰ企业1会预测到企业2的反应,因此第一阶段的问题为代入企业2的反应函数得一阶条件为代入反应函数,即得企业2的最优产量为九、子博弈精炼纳什均衡应用举例Ⅰ企业1会预测到企业2的反应,47九、子博弈精炼纳什均衡应用举例Ⅰ比较stackelberg模型和counot模型结果:均衡总产量:企业1均衡产量:企业2均衡产量:为什么?企业1存在先动优势(first-moveradvantage)九、子博弈精炼纳什均衡应用举例Ⅰ比较stackelberg模48九、子博弈精炼纳什均衡应用举例Ⅱ宏观经济政策的动态一致性(dynamicconsistency)——2004年诺贝尔经济学奖(Kydland&Prescott,1977)
背景1970年代以前,经济学领域基本上是凯恩斯主义思想统治着经济政策的研究。经济学家通常把宏观经济波动主要归因于需求方的变动,经济学家对宏观经济政策的分析也通常集中在解释和说明应该执行什么样的货币和财政政策来抵消需求的波动,这个时候还几乎没有人致力于解释实际经济政策的运作。九、子博弈精炼纳什均衡应用举例Ⅱ宏观经济政策的动态一致性(d49
从1970年代开始,该分析方法的缺陷日益显现,基于当时的经济理论所制定的经济稳定政策根本无法实现预定的目标。所以,在很长一段时间里,西方世界的经济都处于一种滞胀状态——失业和通货膨胀并存,而盛行的理论却无法对此作出有说服力的解释。与此同时,宏观经济波动并非仅仅缘于需求波动的特征也表现得十分明显,供应方面的波动(比如石油价格上涨、劳动生产率增长下降等)在经济周期中的作用变得越来越突出。正是在这样一种背景下,Kydland&Prescott对宏观经济及政策的观察、解释和分析运用新的方法,提供了一个独特的视角。九、子博弈精炼纳什均衡应用举例Ⅱ从1970年代开始,该分析方法的缺陷日益显现,基于九、子50九、子博弈精炼纳什均衡应用举例ⅡDynamicConsistencyortimeconsistency动态不一致:政策在制定时是最优的,但是在执行时不再是最优的,因而制定政策的政府不会实施政策。模型:KylandandPrescott的货币政策模型参与人:政府与私人部门行动顺序:私人部门选择预期的通货膨胀率,政府根据私人部门的预期通胀率选择实际的通胀率政府关心通货膨胀和失业率,设其效用函数为其中,为通货膨胀率,为实际产量,为自然失业率下的产量,和为系数,容忍某种程度的通货膨胀。九、子博弈精炼纳什均衡应用举例ⅡDynamicConsis51九、子博弈精炼纳什均衡应用举例Ⅱ设含有通货膨胀的菲力普斯曲线(expectationalPhillipscurve),又称意外产出函数(surpriseproductionfunction),为其中,为私人部门预期的通货膨胀率。政府选择最优的通货膨胀率,即政府对于私人部门选择预期通货膨胀率的反应函数表示产出对于未预期到的通胀率的敏感程度九、子博弈精炼纳什均衡应用举例Ⅱ设含有通货膨胀的菲力普斯曲线52九、子博弈精炼纳什均衡应用举例Ⅱ设有理性预期,即那么,政府的效用为如果承诺实行零通胀率,政府的效用为则有,均衡通货膨胀率为但是政府不会真的保证零通货膨胀率,因为一旦私人部门相信零通货膨胀,政府的最优通货膨胀率和效用分别为越大,扭曲程度越大,均衡通常率越高九、子博弈精炼纳什均衡应用举例Ⅱ设有理性预期,即那么,政府的53九、子博弈精炼纳什均衡应用举例Ⅱ政府根本没有积极性兑现自己的承诺,而会正的通胀率;进一步,私人部门具有理性预期,能够正确预测政府行为,政府无法获得的效用水平。零通胀率非SPNE结果,或者说是一个动态不一致的政策。九、子博弈精炼纳什均衡应用举例Ⅱ政府根本没有积极性兑现自己的54十、讨价还价(Bargaining)博弈讨价还价问题的普遍性几乎所有的交易都涉及讨价还价:买卖双方之间雇员与雇主之间合伙人之间夫妻之间政治领域之间中央政府与地方政府国家之间十、讨价还价(Bargaining)博弈讨价还价问题的普遍性55十、讨价还价(Bargaining)博弈所有的讨价还价问题的共同之处:首先,参加谈判各方通过达成协议所能够产生和得到的总收益应该比他们独立行动所能得到的个人收益之和要大。达成某种协议是当事人的共同利益,但他们之间在究竟达成哪一个协议的问题上存在利益冲突;协议的多重性可能阻止任何协议的出现。
例,假定2个人分1美元。要求每个人同时报出其想要的数量。如果他们所报数量x和y加起来等于或小于1,每个人得到其所报的量。否则一无所获。NE为?典型的“合作与竞争”问题;十、讨价还价(Bargaining)博弈所有的讨价还价问题的56十、讨价还价(Bargaining)博弈这不是一个零和博弈。表面看起来是一个零和博弈:当剩余存在时,谈判就是为了瓜分它。每个讨价还价者都试图让自己多得,而留给别人更少。但在这背后隐藏着一个危险,如果协议未能达成,没有人可以得到任何一点剩余。这一不利于双方的结果,以及双方都要避免之的愿望,为威胁(明显的或隐含的)创造了可能,这就使得讨价还价成为一个策略问题。十、讨价还价(Bargaining)博弈这不是一个零和博弈。57十、讨价还价(Bargaining)博弈分析讨价还价问题的两种思路:合作博弈思路(cooperativegameapproach):参与人联合作出决定,协议对双方具有约束力;——强调集体理性非合作博弈思路(non-cooperativeapproach):每个参与人独立决策,协议是一个纳什均衡,没有约束力;强调的是个人理性;注意:这里“合作”与“非合作”指的是“联合决策”(jointaction)和“独立决策”(separateaction)。十、讨价还价(Bargaining)博弈分析讨价还价问题的两58十、讨价还价(Bargaining)博弈纳什合作解——各方共同寻找和实施一个解决方案,可能找一个中立的第三方来作为执行的仲裁者。考虑一个画家与拍卖商之间的讨价还价问题:如果画家自己出售画,可得1000元;如果拍卖商干其他事情(如拍卖别人的画),收入是500元;如果画家委托拍卖商出售画,画的价格是3000元。他们之间如何分配这3000元?请同学们给出建议。十、讨价还价(Bargaining)博弈纳什合作解——59十、讨价还价(Bargaining)博弈问题的一般化:设想两个人,A和B,之间要就总价值等于V的分配问题讨价还价;如果他们之间能达成协议,V按照协议规定分配;如果不能达成协议,A得到a,B得到b。(a,b)被称“威胁点”或非合作状态(statusquo),是不能达成协议的最好选择。a+b<V;S=V-a-b是合作带来的剩余(surplus)十、讨价还价(Bargaining)博弈问题的一般化:60讨价还价(Bargaining)博弈分配规则:我们用x表示A得到的价值,y表示B得到的价值,假定A和B分别从剩余价值S中达到h和k的份额,那么:x=a+h(V-a-b);x-a=h(V-a-b)y=b+k(V-a-b);y-b=k(V-a-b)纳什公式讨价还价(Bargaining)博弈分配规则:纳什公式61十、讨价还价(Bargaining)博弈VVabPQ纳什讨价还价解图示威胁点十、讨价还价(Bargaining)博弈VVabPQ纳什讨价62十、讨价还价(Bargaining)博弈纳什证明:如果满足以下原则:(1)帕累托有效性Paretoefficiency;(2)效用测度的无关性Invarianceoflineartransformation;(3)无关选择的独立性independenceofirrelevantalternatives那么,讨价还价的唯一结果是最大化如下纳什福利函数的解:该讨价还价问题的效率边界十、讨价还价(Bargaining)博弈纳什证明:如果满足以63十、讨价还价(Bargaining)博弈PabQ(x-a)h(y-b)k=c2(x-a)h(y-b)k=c2(x-a)h(y-b)k=c1VV十、讨价还价(Bargaining)博弈PabQ(x-a)h64十、讨价还价(Bargaining)博弈纳什福利函数的解释(a,b)对最后的分配具有决定性的意义,可以理解为“谈判砝码”(bargainingpower);h和k:是剩余价值的分配比例,又可以理解为谈判力(bargainingstrength),可能与个人的耐心有关,或与个人的边际贡献(可替代性)有关;纳什:如果两个人是对称的(即可分配价值以过(a,b)点的45度线对称),h=k=1/2十、讨价还价(Bargaining)博弈纳什福利函数的解释65十、讨价还价(Bargaining)博弈非合作博弈思路:谈判实际上是一个讨价还价的过程,一个动态博弈;用非合作博弈的方法更合理;十、讨价还价(Bargaining)博弈非合作博弈思路:66十、讨价还价(Bargaining)博弈最常见的讨价还价方式:序贯讨价还价基本特征:两人,A和B,分一块钱;A先出价,B决定接受还是拒绝;如果接受,按照A提出的方案分配,谈判结束;如果B拒绝,B提出方案,A决定接受还是拒绝;如果接受,按B的方案分配,谈判结束;如果不接受,再由A提出方案;如此等等。提议提议谈判结束同意AB同意谈判结束A提议谈判结束B提议谈判结束同意同意十、讨价还价(Bargaining)博弈最常见的讨价还价方式67十、讨价还价(Bargaining)博弈决定结果的关键因素:谁先出价?谈判有无最后时限?谁最有耐心(时间偏好)?谈判的固定成本多大?十、讨价还价(Bargaining)博弈决定结果的关键因素:68十、讨价还价(Bargaining)博弈我们先考虑没有固定谈判成本的情况。假定:x:A得到的份额;y:B得到的份额;x+y=1s:A的贴现率;a=1/(1+s):A的贴现因子;r:B的贴现率;b=1/(1+r):B的贴现因子;贴现因子:反映参与人的耐心程度。每个人的耐心不同,对将来货币的主观贴现率是不同的十、讨价还价(Bargaining)博弈我们先考虑没有固定谈69十、讨价还价(Bargaining)博弈有限期谈判的情况如果只有一次谈判:逆向归纳意味着SPNE结果是:x=1,y=0;如果允许谈判两次:SPNE结果是:x=1-b,y=b;如果谈判三次,SPNE结果是:
x=1-b(1-a),y=b(1-a);如果谈判四次,SPNE结果是:
x=1-b(1-a(1-b)),y=b(1-a(1-b))如果谈判五次,SPNE结果是:x=1-b(1-a(1-b(1-a))),y=b(1-a(1-b(1-a)))……可以推导出任何给定的T<∞情况下的SPNE结果十、讨价还价(Bargaining)博弈有限期谈判的情况70十、讨价还价(Bargaining)博弈SPNE结果与a、b及博弈期限T关系:如果a=b=0,无论T,SPNE结果为x=1(先出价者得全部);如果b=0(无论a大小),则SPNE结果为x=1;如果a=0(无论b大小),则SPNE结果为x=1-b一个人对未来越没有耐心,得到的越少SPNE结果与博弈期限T的关系(不妨考虑a=b=1):如果T=1,3,5…,均衡结果为x=1(先动后动为一个人);如果T=2,4,6…,均衡结果为x=0(后动优势)(给定其贴现因子为1,后出价者会拒绝任何自己不能得到整个利润的出价,一直等到博弈最后阶段得到全部)十、讨价还价(Bargaining)博弈SPNE结果与a、b71十、讨价还价(Bargaining)博弈有限期讨价还价博弈一般结论:如果两人贴现因子都较高,也就是对未来有足够的耐心,谈判有“后动优势”(last-moveradvantage)(在奇数次谈判,先动和后动是一个人)。无论如何,一个人对未来越没有耐心,得到的越少十、讨价还价(Bargaining)博弈有限期讨价还价博弈一72十、讨价还价(Bargaining)博弈无限期谈判(Rubinstein,1982)不能用逆向归纳法求解,但可以使用类似的思路得到均衡解(x,y)Shakedandsutton(1984):博弈是无限期的,因此从参与人A第二次报价(也就是博弈的第3阶段)开始的子博弈(记为Ⅱ)与原博弈(记为I)是相同的。所以,均衡时参与人A在博弈I和博弈Ⅱ中所得份额应该是相同的。假定第三阶段时,A出价,得到x;在第二阶段时,B出价,给A为ax就可以了,B得到y=1-ax;在第一阶段时,A出价,给B为b(1-ax)就可以了,自己得到x=1-b(1-ax)十、讨价还价(Bargaining)博弈无限期谈判(Rubi73十、讨价还价(Bargaining)博弈因为从第三阶段开始的博弈与从第一阶段开始的博弈完全相同,参与人A在第一阶段能得到的最大份额一定等于其在第三阶段得到的最大份额相同,因此即在均衡状态下参与人A(先行者)的份额为参与人B(后行者)的份额为十、讨价还价(Bargaining)博弈因为从74十、讨价还价(Bargaining)博弈贴现因子的含义及其对均衡结果的影响二人的均衡份额为(先行者),(后行者)贴现因子表示耐心程度,其值越大说明越有耐心耐心优势:越有耐心,得到的利益越大先动优势:当双方具有相同耐心程度a=b时,先行者获得份额大于二分之一;特别地,具有无限耐心(即给定b,)的先行者可以获得全部利益,而具有无限耐心的后行者不能获得全部利益十、讨价还价(Bargaining)博弈贴现因子的含义及其对75十、讨价还价(Bargaining)博弈谈判的另一类成本是固定成本,如劳资谈判拖延的话,企业可能要为客户支付违约金。这类似于冰淇淋随时间而变小。十、讨价还价(Bargaining)博弈谈判的另一类成本是固76十、讨价还价(Bargaining)博弈举例设想100g冰淇淋,每次融化25g,到第5期时,冰淇淋已化完,第4期等于25g,第3期是50g,第2期是75g,第1期是100g。第4期:B出价,将把整个冰淇淋(25g)留给自己;第3期:A出价,A必须分给B25g的冰淇淋,此时冰淇淋为50g,所以分1/2给B,自己得1/2(25g);第2期:B出价,B只需给A25g(此时冰淇淋75g),自己得到2/3冰淇淋(50g);第1期:A出价,分给B50g,自己得到一半(50g)。PNE:每人1/2。十、讨价还价(Bargaining)博弈举例77十一、重复博弈重复博弈(RepeatedGame)同样结构的博弈重复多次,就是重复博弈。其中,每次博弈称为阶段博弈(stagegame)重复无限次,为无限次重复博弈;反之,为有限次重复博弈重复博弈的基本特征:各阶段博弈相互独立,前阶段博弈不会改变后阶段博弈的结构所有参与人都能看到博弈历史参与人的支付等于各阶段支付的贴现值之和十一、重复博弈重复博弈(RepeatedGame)78十一、重复博弈如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。-8,-80,-10-10,0-1,-1坦白抵赖坦白抵赖十一、重复博弈如果博弈不是一次的,而是重复进行的,参与人过去79十一、重复博弈假定上属博弈重复多次或无限次;那么,每个参与人有多个可选择的战略。仅举几例:All-D:不论过去什么发生,总是选择不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 13061-16:2025 EN Physical and mechanical properties of wood - Test methods for small clear wood specimens - Part 16: Determination of volumetric swelling
- 注册会计师考试的行业现状与试题及答案
- 2024年预算员证书考试后的职业发展规划题试题及答案
- 2040年合同特权制度创新与发展研究
- 二手市场的创业书
- 2024-2025学年语文三年级下册25《慢性子裁缝和急性子顾客》教学设计+教学设计(统编版)
- 第四单元 经济大危机和第二次世界大战 教学设计 2023-2024学年部编版九年级历史下学期
- ISMS信息安全培训
- 第10课 阿长与《山海经》教学设计-2024-2025学年统编版语文七年级下册
- 2023九年级数学下册 第一章 直角三角形的边角关系5 三角函数的应用第2课时 三角函数的应用(2)教学实录 (新版)北师大版
- 安徽省C20教育联盟2024-2025学年九年级下学期3月月考数学试题 (原卷版+解析版)
- 2025新疆机场(集团)有限责任公司阿克苏管理分公司第一季度招聘(75人)笔试参考题库附带答案详解
- 2025年高级育婴师的试题及答案
- 2025年北京电子科技职业学院高职单招高职单招英语2016-2024历年频考点试题含答案解析
- 儿童哮喘预防
- 无人机法律法规与安全飞行 第2版民用航空人员管理
- 2024年全国职业院校技能大赛高职组(体育活动设计与实施赛项)考试题库(含答案)
- XX化工有限责任公司维保方案
- 基础会计课件(完整版)
- 品质异常处罚细则及奖罚制度
- 二年级下册心理健康教案-第二十四课 帮爸爸妈妈分担 妈妈谢谢您|北师大版
评论
0/150
提交评论