




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章完全信息动态博弈参与者的收益函数是共同知识.完全信息:在第一章完全信息静态博弈(StaticGamesofCompleteInformation)中,要求参与者同时选择战略或行动,且只能选择一次.
但很多博弈参与者的行动选择并非同时,甚至可以有无限次.而且参与者的行动选择而是有先后顺序的.并非一次,这种博弈就是动态博弈(DynamicGamesofCompleteInformation)完全且完美信息:博弈进行的每一步当中,要选择
行动的参与者都知道这一步之前博弈进行的整个过程.“动态博弈具体描述参与人在战略情形中所遇到的序列结构.该模型允许我们研究这样的解,即每个参与人不仅可以在博弈开始时考虑他的行动计划,且在任何一个不得不做决策的时点上,他都可以考虑他的行动计划.与此相反,静态博弈限于这样的解,即每个参与者选择且仅选择一次他的行动计划,这个计划可包纳无数的变数,但静态博弈在博弈中的某些事件已知后则不允许参与者去重新考虑他的行动计划.”(马丁J.奥斯本博弈论教程87页)动态博弈分为
完美信息和非完美信息动态博弈.2.1完全且完美信息动态博弈2.1.A理论:逆向归纳法
第一,参与者1选择支付1000美元给参与者2还是一分不给;第二,参与者2观察到参与者1的选择,然后决定是否引爆一颗手雷把两个人一块炸死.一个两步博弈例子.两个参与者如何选择呢?如果参与者1相信这一威胁,他的最优反应是支付1000美元给参与者2,与者1却不会对这一威胁信以为真,它不可置信.参与者2接受,博弈结束.完全且完美信息动态博弈但参动态博弈的中心问题是可信任性.所有
手雷博弈属于下面简单类型的完全且完美信息动态博弈:(两人两阶段动态博弈)1.参与者1从可行集A1中选择一个行动a1,2.参与者2观察到a1后,从可行集A2中选择一个行动a2,
3
两人的收益分别为和逆向归纳法(backwardinduction)求解此博弈如下:当在博弈的第二阶段参与者2行动时,由于其前参与者1已选择行动a1,为假定对A1中的每一个a1,参与者2的最优化问题只用R2(a1)
表示.动的最优反应函数.行动a1所做出的反应,这样1在第一阶段要解决的问题可有唯一解,归结为:假定参与者1的这一最优化问题也有唯一解,我们称是这一博弈的逆向归纳解.此逆向归纳他面临的决策问题可用下式表示这就是参与者2对参与者1行由于参与者1能和参与者2一样解出2的问题,参与者1可以预测到参与者2对1每一个可能的表示为解不含有不可置信的威胁:参与者1预测参与者2将对1的可能选择的任何行动a1这一预测排除了参与者2不可置信的威胁,即做出最优反应,R2(a1)
;参与者2将在第二阶段到来时做出不符合自身利益的反应.例子:逆向归纳法背后的理性假设.考虑下例三阶段两个参与者的动态博弈,其中参与者1有两次行动.(2,0)(1,1)121LRL1R1R2L2(3,0)(0,2)博弈的解或博弈的结果:参与者选择L,博弈结束.博弈的逆向归纳解表示为(L,X).结论:参与者是理性的是“共同知识”是逆向归纳法背后假设.选择行动“开金矿博弈”(3个版本)(经济博弈论基础)甲欲开发一个价值4万元的金矿,缺少1万元资金,乙有1万元的资金可以投资.甲想说服乙借给他,并答应分给乙2万元,乙是否应该借给他?(不借,X
)可将此问题看作一个博弈.不借借还不还(1,0)乙甲(2,2)(0,4)版本1:无法律保障的开金矿博弈博弈的逆向归纳解:两个阶段两个参与者的动态易知此博弈的逆向归纳解为:乙选择不借,博弈结束.直观解释为:乙没有理由相信甲的“承诺”.不借借还不还起诉放弃(1,0)乙甲乙(2,2)(-1,0)(0,4)版本2:法律保障不充足的开金矿博弈(不借,X)博弈逆向归纳解:不借借还不还起诉放弃(1,0)乙甲乙(2,2)(1,0)(0,4)版本2:法律保障充足的开金矿博弈(借,还)博弈逆向归纳解:2·1·B斯塔克尔贝里(Stackelberg)双头垄断模型博弈的时间顺序如下(2)企业2观察到以后,然后选择产量
;
(市场上的总产量)(市场出清价格)c是生产的边际成本(固定成本为0).(1)企业1选择产量(3)企业i的收益由下面的利润函数给出:为求解此博弈的逆向归纳解,任意产量的最优反应应满足:首先计算企2对企业1由上式可得已知果相同.但两者不同之处在于这里的企业1
是企业2对是企业2对假定的企业1的产量的最优反应.
且企业1的产量选择是和企业2同时作出的.由于企业1也到他如选择,这与同时行动的古诺模型中得出的结而在古诺模型中已观测到的产量的真实反应,和企业2一样解出企业2的最优反应,企业1就可以预测企业2将根据选择产量.那么在在博弈的第一阶段,企业1的问题就可表示为于是这就是斯塔克尔贝里双头垄断博弈的逆向归纳解.斯塔克尔贝里模型解与古诺模型解的比较1)古诺博弈纳什均衡产量从而在斯塔克尔贝里博弈里相应的市场出清价格就比较低.不过在斯塔克尔贝里博弈中,企业1完全可以选择古诺均衡产量这时企业2的最优反应产量同样是古诺均衡产量,但企业1却选择了其它产量,那么企业1在斯塔克尔贝里博弈中的利润诺均衡中的利润.一定高于其在古
但斯塔克尔贝里博弈中的市场出清价格降低了,从而总利润水平也会下降.(古诺纳什均衡时的总利润)(斯塔纳什均衡时的总利润)企业1在斯塔克尔贝里博弈中利润的增加必定意味着企业2利润的减少.而在古诺博弈中两个企业的利润相等.这一结果揭示了单人决策问题和多人决策问题的一个重要不同之处.在单人决策理论中,占有更多信息的绝不会对决策者带来不利,然而在博弈论中,了解更多信息(或者更为准确地说,是让其他参与者知道一个人掌握更多信息)却可以让一个参与者受损.在斯塔克尔贝里博弈中,存在问题的信息是企业的产量:企业2知道并且(重要的是)企业1知道企业2知道于是企业1可以利用先动优势对企业2用诈!也即企业1可以事先让企业2知道一个虚假产量,如果企业2
相信企业1的虚假产量,则企业2将会选择对虚假产量的
最优反应产量,而企业1实际上选择的产量却是对企业2企业2受损.关于他的虚假产量最优反应产量的最优反应产量,使因为企业2的产量不是对企业1的最优反应.但是,企业2未必一定上当!另一个角度,则假设企业1先选择产量企业1选择了它的斯塔克尔贝里产量选择产量之后企业2但事先并没有观测到如果企业2相信企业2的最优反应产量仍是但是,如果企业1预测到企业2将持有这一推断并选择这一产量,企业1就会倾向于它对的最优反应产量而不愿意去选择斯塔克尔贝里产量那么企业2就不会相信企业1选择了斯塔克尔贝里产量.
于是,此时动态博弈的唯一纳什均衡产量是古诺博弈时的纳什均衡产量.也就是静态博弈同时行动的.这说明静态博弈中的“同时行动”不一定指时间意义上的,只要双反没有信息交流即可.(2.1C自己阅读)2·1·D讨价还价博弈(分钱博弈)—序贯谈判
三阶段谈判:参与人1和2就一美元的分配进行谈判.他们轮流提出方案:首先参与人1提出一个分配建议,参与人1提出一个分配建议,参与人2可以接受或拒绝;如果参与人2拒绝,就由参与人2提出分配建议,参与人1选择接受或拒绝;如此一直进行下去.一个条件一旦被拒绝,它就不再有任何约束力,并和博弈下面的进行不相关.
每个条件都代表一个阶段.
参与人都没有足够的耐心:他们对后面阶段得到的收益进行贴现,每一个阶段的贴现因子为下面是对三阶段谈判博弈时序的更为详细的描述:(1a)在第一阶段时.参与人1建议他分走1美元的S1,留给参与人2的份额为1-S1.(1b)参与人2或者接受这一条件(此时博弈结束,即拿到)或者拒绝这一条件(博弈将继续进行,进入第参与者1的收益为S1,参与人2的收益为1-S1,都可立二阶段)(2a)在第二阶段的开始,参与人2提议参与人1分得1美元的S2,留给参与人2的为1-S2.(请注意在阶段t,
St总是表示分给参与人1的,而不论是谁提出的条件)(2b)参与人1或者接受条件(此时博弈结束,参与人1的收益为S2,参与人2的收益为1-S2都可立即拿走)或者拒绝这一条件(此时博弈继续进行,进入第三阶段)
(3)在第三阶段的开始,参与人1得到1美元的S参与人2得到1-S.这里
下面求解此三阶段博弈的逆向归纳解:首先计算如果博弈进行到第二阶段,参与人2可能条件S2
,提供的最优条件,但下一阶段的S在当期的价值为参与人会1才接受
(我们假定当接受和拒绝无差异时,参与人总是选择接参与人1拒绝参与人2在这一阶段的可以在第三阶段得到S,那么当且仅当受条件).在本阶段收入(通过向参与人1提条件,给(通过向参与人1提出条件,给他从而参与人2在第二阶段的决策问题就可归于和下阶段收入他任意小于前一选择可得的之间作出选择.后一选择的贴现值为于是参与人2在第二阶段可以提出的最优条件是博弈进行到第二阶段,参与人2将提出条件也就是说如果1选择接受条件.第二阶段的决策问题,绝参与人1的条件在第二阶段可以得到但下一阶那么当在本阶段的的价值只有时参与人就可归结于在本阶段收入从而参与人1在第一阶段的决策问题
(通过向参与人2提(通过向参与人2提出参与人由于参与人1可以和参与人2同样地解出参与人2在参与人1也知道参与人2通过拒段得到的且仅当或者2才会接受出条件和下阶段收入任意的之间作出选择.后一选择的贴现值为小于前一选择可得的于是参与人1在第一阶段可以提出的最优条件是这样,在此三阶段博弈的逆向归纳解中,提出分配方案参与人1向参与人2后者接受该方案.下面考虑无限期的情况.博弈时序和前面的描述完全一致,只是第(3)阶段给出的外生解决方案被其后的无限步讨价还价(3a)、(3b)、(4a)、(4b)等等所代替:奇数步由参与人1出条件,偶数步由参与人2出条件,直至一方接受条件,讨价还价结束.如何利用逆向归纳法求解?1984年,谢克德和萨顿(ShakedandSutton)
提出一种方法.他们的方法思想是:将无限期博弈截开,从第三阶段开始的博弈(如果能进行到这一阶段)与(从第一阶段开始的)整个过程的博弈是相同的—两种情况下,都是由参与人1首先提出条件,其后两个参与人轮流出价,直至有一方接受条件谈判结束.ShakedandSutton,1984,思路要点:1对一个无限回合讨价还价博弈来讲,无论从第三回合开始,还是从第一回合开始结果都是相同的.2求解过程:假设整个博弈有一个逆向归纳解(S,1-S),即在第一回合甲出价S,乙接受是双方的收益.3由Shaked的思路,解(S,1-S)也是从第三回合开始博弈的结果.即第三回合为甲出价S,乙接受,双方收益(S,1-S).4再把上述第三回合理解成从第一阶段开始的无限回合博弈的第三回合,由于甲在第三回合出价是最终出价,故可理解为三回合强制性讨价还价博弈.由前面的讨论:甲在第一回合出价双方收益从而解得:为逆向递推解.2·2
完全非完美信息两阶段博弈2·2·A理论:子博弈精炼和在完全且完美信息动态博弈中相同,假定博弈的进行分为一系的阶段,下一阶段开始前参与者可观察到前面所有阶段的行动.与上节分析的不同之处在于每一阶段中有同时行动.这种阶段内的同时行动意味我们将以下类型的简单博着博弈包含了不完美信息.弈称为完全非完美信息两阶段博弈:1参与者1和2同时从自己的可行集A1和A2中选择行动a1和a2,2参与者3和4观察到第一阶段的结果后同时从各自的可行集A3和A4中选择行动a3和a4,然3收益为使用逆向归纳法解决此类问题,但这里从博弈的最后阶段逆向推导的第一步就包含了求解一个真正的博弈(给定第一阶段结果时,参与者3和4在第二阶段同时行动的博弈),而不再是前一阶段求解单人最优化的决策问题.为使问题简化,我们假设对第一阶段其后(参与者3和4之间博弈每一可能的结果的)第二阶段博弈有唯一纳什均衡,表示为如果参与人1和2预测到参与人3和4的行动将由上面的均衡给出,则参与者1和2在第一阶段的问题就可用以下的同时行动博弈表示:1参与者1和2同时从自己的可行集A1和A2中选择行动a1和a2,2收益情况为假定为以上同时行动博弈的唯一纳什均衡,则称为这两阶段博弈的子博弈精炼解.2·1·B
对银行的挤提两个投资者每人存入银行一笔存款D,银行已将这些存款投入一个长期项目.如果在该项目到期前银行被迫对投资者变现,共可收回2r,这里如银行允许投资项目到期,则项目共可取得2R,这里有两个日期.投资者可以从银行提款:日期1在银行的投资项目到期之前,日期2则在到期后.为了讨论方便,假设不存在贴现.如果两个投资者都在日期1提款,每人可得到r
,博弈结束.如果只有一个投资者在日期1提款,他可得到D,不过另一人可得到2r-D,博弈结束.如果两人都在日期2提款,每人得到R,博弈结束.如果只有一个投资者在日期2提款,则他得到2R-D,如果两人都不在日期1提款,则项目结束后投资者在日期2进行提款决策.另一个人得到D,博弈结束.最后,如果在日期2两个投资者都不提款,则银行向每个投资者返还R
,博弈结束.两个投资者在日期1和日期2的收益情况可以用下面的两个标准式博弈表示.
下一阶段
2r-D,D
D,2r-D
r,r
提款不提提款不提日期1
下一阶段
2r-D,D
D,2r-D
r,r
提款不提提款不提日期1
R
,RD,2R-D
2R-D,DR,R提款不提提款日期2不提逆向归纳法分析此博弈.先考虑日期2的标准式博弈.由于(由此可得),“提款”严格优于“不提款”,那么这一博弈有唯一纳什均衡:两个投资者都提款,最终收益为由于不存在贴现,可以直接用这一收益替入日期1的R,RD,2R-D
2R-D,DR,R提款不提提款日期2不提变为标准式博弈双方都不提款时的情况于是日期1的情况就R,R2r-D,DD,2r-D
r,r
提款不提提款不提由于(并且由此可得),这一两阶段博弈变形为单阶段博弈,存在两个纯战略纳什均衡:(1)
两个投资者都提款,最终收益为最初的两阶段银行挤提博弈就有两个子博弈精炼解.(2)
两个投资者都不提款最终收益为显然,
(提款,提款)是类似于“囚徒困境”的结果,是对大家都低效率的选择,但是,该博弈还有一个高效率的纳什均衡,因此,此模型不能预测何时会出现挤提.但是,挤提的确存在.补例(要挟诉讼,承诺行动与精炼均衡的关系)这个博弈有两个参与者:原告P和被告D.行动顺序如下:(1)原告决定是否对被告提出指控,指控的成本为C>0;(2)如果决定指控,原告要求被告支付S>0以了却诉讼;(3)被告决定接受还是拒绝原告的要求;(4)
如果被告拒绝,原告决定是放弃指控还是向法庭起诉,原告的起诉成本(包括律师费用)为p,被告的辩护成为d;(5)如果案子到了法庭原告以r的概率赢得x单位的支付.诉讼成功可能性非常小,目的是希望和解得到补偿.P不指控指控要求S拒绝接受起诉放弃(0,0)PDP原告指控的目的本身意味着阶段,那么在博弈的最后原告的最优选择是放弃.rx<p
,因为被告知道如果自己自己拒绝,原告将放弃,选择是拒绝;
原告在第一阶段的子博弈精炼纳什均衡是原告选择(不指控,要求,放弃),被告选择(拒绝),均衡结果为:原告不指控.被告在倒数第二阶段的最优原告知道将被拒绝,下面考虑承诺行动如何改变上述结果.假定原告在指控前将诉讼费p支付给律师,原告将选择起诉.无论那么,在博弈的最后阶段,最优选择是不指控.因此,结果如何,律师费不能退还.因为(假定胜诉的概率大于0).也即被告将会接受原告提出的赔偿要求,被告将会接受原告提出的赔偿要求如果的话.因为只要原告将选择私了而不是上法庭解决争端,是双方私了的赔偿因此假定双方的讨价还价能力相同,区域.意味着原告要求的赔偿为因为原告指控(即上法庭的期望收益小于诉讼成本),
的条件仍可能成立.如果显然,即使假定这个条件成立,原告提出指控要求.原告的纳什讨价还价解成本为c+p,子博弈纳什均衡结果将是:支付为被告的支付为案件私了.因为被告打官司的成本不仅包括应诉的法律费用而且涉及声誉损失(d
),所以,被告越大(大人物大企这是为什么大人物常常受到无端指控的原因之一.业),d越大,的条件越可能满足.当然,大企业,大人物也可以通过他们的承诺行动使自己避免小企业,小人物的无端指控.办法之一就是在被那么赔偿区域为纳什均衡解为成立,因为即使指控之前就支付律师费用y
.诺行动使被告节省成本因此,只要这就是为什么大公司,也可能不满足,从而,原告将不会提出指控.承诺行动就值得.这样的承大人物雇佣律师的原因之一.2·3重复博弈2·3·A理论:两阶段重复博弈考虑将“囚徒困境”博弈重复进行两次,过程博弈的收益等于两个阶段各自收益的简单相加,次博弈开始前可观察第一次进行的结果,(不考虑贴现因素),
4,4
0,5
5,0
1,1参与者2参与者1图2·3·1且在第二并假设整个这叫两阶段“囚徒困境”重复博弈.两阶段“囚徒困境”重复博弈属于第2·2.A节分析过的博弈
根据2·2.A节的求解此类博弈精炼解的程序,第两人的收益为二阶段博弈的结果为所余部分博弈的纳什均衡,即为
在此前提下分析第一阶段的情况.由此两阶段“囚徒困境”中,参与者在第一阶段的局势就可归纳为下图所示的博弈,其中第二阶段的收益(1,1)分别加到两人第一阶段每一收益组合上.该博弈有唯一的纳什均衡
5
,5
1
,6
6
,1
2
,2参与者2参与者1图2·3·2从而,两阶段囚徒困境唯一的子博弈精炼解就是第一在子博弈精炼解中,任一阶段都不能达成合作—的结果.阶段的和第二阶段的这一结论在更为一般的条件下同样成立.表示一完全信息博弈,其中参与者1到n同时从各自的行动空间A1到An中分别选择行动a1和an,得到收益分别为以后我们称博弈G为重复博弈中的阶段博弈.定义对给定的阶段博弈G,令G(T)表示G重复进
行T次的有限博弈,并且在下一次博弈开始前,所有以前博弈的进行都可被观测到.G(T)的收益为T次阶段博弈的简单相加.意有限的T次重复博弈G(T)有唯一的子博弈精炼解:即G的纳什均衡结果在每一阶段重复进行.定理如果阶段博弈G
有唯一的纳什均衡,则对任下面,再回到两阶段博弈,进一步考虑阶段博弈G有多个纳什均衡的情况,看下面例子:3,30,00,00,04,40,50,05,01,1图2.33容易看出,此博弈有两个纯战略纳什均衡:设图2.33表示的阶段博弈重复进行两次,并在第二次博弈开始前可观察第一次进行的结果,可以证明这一重复博弈中存在一个子博弈精炼解,其中第一阶段的战略组合为说明:严格地讲,我们只是对第2.2A节定义的博弈类型定义了子博弈精炼解,后面将会看到,二者解的定义对此类博弈我们还没有给出子博弈精炼解的定义,相差甚微.(该例分析复杂,略去)这个例子要说明的主要观点是:对将来行动所作的可信的威胁或承诺可以影响到当前的行动.另一方面,子博弈精炼的概念对可信性的要求并不严格.2·3重复博弈2·3·A理论:两阶段重复博弈重复博弈分析在参与者长期重复的相互往来中,关于将来行动的威胁或承诺能否影响到当前的行动.考虑将“囚徒困境”博弈重复进行两次,且在第二过程博弈的收益等于两个阶段各自收益的简单相加,次博弈开始前可观察第一次进行的结果,并假设整个(不考虑贴现因素),这叫两阶段“囚徒困境”重复博弈.
4,4
0,5
5,0
1,1参与者2参与者1图2·3·1两阶段“囚徒困境”重复博弈属于2·2节的完全非完美信息两阶段博弈.
根据2·2.A节的求解此类博弈精炼解的程序,第两人的收益为二阶段博弈的结果为所余部分博弈的纳什均衡,即为
在此前提下分析第一阶段的情况.由此两阶段“囚徒困境”中,参与者在第一阶段的局势就可归纳为下图所示的博弈,其中第二阶段的收益(1,1)分别加到两人第一阶段每一收益组合上.该博弈有唯一的纳什均衡
5
,5
1
,6
6
,1
2
,2参与者2参与者1图2·3·2从而,两阶段囚徒困境唯一的子博弈精炼解就是第一在子博弈精炼解中,任一阶段都不能达成合作—的结果.阶段的和第二阶段的这一结论在更为一般的条件下同样成立.表示一完全信息博弈,其中参与者1到n同时从各自的行动空间A1到An中分别选择行动a1和an,得到收益分别为以后我们称博弈G为重复博弈中的阶段博弈.定义对给定的阶段博弈G,令G(T)表示G重复T进行T次的有限博弈,并且在下一次博弈开始前,所有以前博弈的进行都可被观测到.G(T)的收益为T次阶段
博弈的简单相加.补充例子(要挟诉讼,承诺行动与精炼均衡的关系)这个博弈有两个参与者:原告P和被告D.行动顺序如下:(1)原告决定是否对被告提出指控,指控的成本为C>0;(2)如果决定指控,原告要求被告支付S>0以了诉讼;(3)被告决定接受还是拒绝原告的要求;(4)
如果被告拒绝,原告决定是放弃指控还是向法庭起诉,原告的起诉成本(包括律师费用)为p,被告的辩护成为d;(5)如果案子到了法庭原告以r
的概率赢得x单位诉讼成功可能性非常小,目的是希望和解得到补偿.的支付.P不指控指控要求S拒绝接受起诉放弃(0,0)PDP原告指控的目的本身意味着rx<p
,
最后阶段,因为被告知道如果自己拒绝,原告将放弃,在倒数第二阶段的最优选择是拒绝;
绝,原告在第一阶段的最优选择是不指控.因此,子博弈精炼纳什均衡是原告选择(不指控,要求,放弃),被告选择(拒绝)均衡结果为:原告不指控.那么,在博弈的原告的最优选择是放弃.被告原告知道将被拒下面考虑承诺行动如何改变上述结果.假定原告在指控前将诉讼费p支付给律师,结果如何,律师费不能退还.原告将选择起诉.无论那么,在博弈的最后阶段,受原告提出的赔偿要求也即被告将会接受原告提出的赔偿要求,因为只要因为(假定胜诉概率大于零),被告将会接如果的话.假定双方的讨价还价能力相同,纳什讨价还价解将选择私了而不是上法庭解决争端,是双方私了的赔偿区域.原告意味着原告要求的赔偿为因为原告指控成本为C+p,(即上法庭的期望收益小于诉讼的条件仍可能成立.如果显然即使成本),假定这个条件成立,子博弈纳什均衡结果将是:原告提出指控要求.原告的支付为被告的支付为案件私了.因为被告打官司的成本不仅包括应诉的法律费用该博弈模型的实际背景举例:而且涉及声誉损失(d
),所以,被告越大(大人物大这是为什么大人物常常受到无端指控的原因之一.当然,大企业,大人物也可以通过他们的承诺行动使自己避免小企业,小人物的无端指控.企业),d越大,的条件越可能满足.办法之一就是在被指控之前就支付律师费用.假定被告在被指控之前支付律师费用y,那么赔偿区域为纳什均衡解为成立,因为即使诺行动使被告节省成本因此,只要是为什么大公司,大人物雇佣律师的原因之一.也可能不满足,从而,原告将不会提出指控.承诺行动就值得.这就这样的承121接受接受拒绝,出S图1出讨价还价博弈(序贯谈判,鲁宾斯坦1982)—分钱博弈无贴现因子分钱博弈121接受拒绝,出S接受(序贯谈判,鲁宾斯坦1982)有贴现因子的分钱博弈讨价还价博弈—分钱博弈2·1·D讨价还价博弈(分钱博弈)—序贯谈判三阶段谈判:参与人1和2就一美元的分配进行谈判.他们轮流提出方案:首先参与人1提出一个分配建议,参与人1提出一个分配建议,参与人2可以接受或拒绝;如果参与人2拒绝,就由参与人2提出分配建议,参与人1选择接受或拒绝;如此一直进行下去.一个条件一旦被拒绝,它就不再有任何约束力,并和博弈下面的进行不相关.每个条件都代表一个阶段.参与人都没有足够的耐心:他们对后面阶段得到的收益进行贴现,每一个阶段的贴现因子为下面是对三阶段谈判博弈时序的更为详细的描述:(1a)在第一阶段时.参与人1建议他分走1美元的S1,留给参与人2的份额为1-S1.(1b)参与人2或者接受这一条件(此时博弈结束,立即拿到)或者拒绝这一条件(博弈将继续进行,进参与者1的收益为S1,
参与人2的收益为1-S1,都可入第二阶段)(2a)在第二阶段的开始,参与人2提议参与人1分得1美元的S2,留给参与人2的为1-S2.(请注意在阶段t,St总是表示分给参与人1的而不论是谁提出的条件)(2b)参与人1或者接受条件(此时博弈结束,参与人1的收益为S2,参与人2的收益为1-S2都可立即拿走)或者拒绝这一条件(此时博弈继续进行,进入第三阶段)(3)在第三阶段的开始,参与人1得到1美元的S,
参与人2得到1-S.下面求解此三阶段博弈的逆向归纳解:首先计算如果博弈进行到第二阶段,参与人2可能提件S2
,可以在第三阶段得到S,供的最优条件,参与人1拒绝参与人2在这一阶段的条但下一阶段的S在当期的价值为那么当且仅当参与人会1才接受
(我们假定当接受和拒绝无差异时,参与人总是选择接受条件)从而参与人2在第二阶段的决策问题就可归于在本阶段收入(通过向参与人1提出条件给他)和下阶段收入(通过向参与人1提条件给他任意
)之间作出选择.选择的贴现值为小于前一选择可得的,于是参与人2在第二阶段可以提出的最优条件是如果博弈进行到第二阶段,参与人2将提出条件也就是说参与人1选择接受条件.由于参与人1可以和参与人2同样地解出参与人2在第二阶段的决策问题,参与人1也知道参与人2通过拒绝参与人1的条件在第二阶段可以得到但下一阶段得到的的价值只有.那么当且仅当在本阶段的或者时参与人2才会接受与人1在第一阶段的决策问题就可归结于在本阶段收从而参入(通过向参与人2提条件和下阶段收入(通过向参与人2提出任意的)之间作出选择.后一选择的贴现值小于前一选择可得的于是参与人1在第一阶段提出的最优条件为这样,在此三阶段博弈的逆向归纳解中,参与人1向参与人2提出分配方案为,后者接受该方案.二、无限回合讨价还价博弈(Shaked1984)思路要点:1对一个无限回合讨价还价博弈来讲,无论从第三回合开始,还是从第一回合开始结果都是相同的.2求解过程:假设整个博弈有一个逆向归纳解(S,1-S),即在第一回合甲出价S,乙接受是双方的收益.3由Shaked的思路,解(S,1-S)也是从第三回合开收益(S,1-S)始博弈的结果.即第三回合为甲出价S,乙接受,双方4再把上述第三回合理解成从第一阶段开始的无限回合博弈的第三回合,由于甲在第三回合出价是最终出价,故可理解为三回合强制性讨价还价博弈.由前面的讨论:甲在第一回合出价双方收益从而解得:为逆向递推解.2·2
完全非完美信息两阶段博弈2·2·A理论:子博弈精炼和在完全且完美信息动态博弈中相同,假定博弈的进行分为一系的阶段,下一阶段开始前参与者可观察到前面所有阶段的行动.与上节分析的不同之处在于每一阶段中有同时行动.我们将以下类型的简单博弈称为完全非完美信息两阶段博弈:1参与者1和2同时从自己的可行集A1和A2中选择行动a1和a2,2参与者3和4观察到第一阶段的结果后同时从各自的可行集A3和A4中选择行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T-ZRIA 002-2024 工业巡检四足机器人通.用技术条件
- T-ZSM 0058-2024“领跑者”评价技术要求 饰面木质墙板
- 二零二五年度林业林地经营权买卖合同
- T-ZJATA 0022-2024 土壤中挥发性有机物测定用便携式气相色谱-质谱联用仪
- T-ZJZYC 022-2024 灵芝工厂化生产技术规程
- 二零二五年度签约主播与汽车厂商合作直播试驾体验协议
- 二零二五年度会展中心物业管理服务托管协议
- 二零二五年度新能源项目投资对赌协议
- 二零二五年度股东清算与清算资产评估及拍卖协议
- 二零二五年度创新创业团队员工合作协议书
- 毕业设计外文文献-Spring Boot
- 六年级下册《生命.生态.安全》全册教案(表格式)
- 采购入库单模板
- GB 14930.1-2022食品安全国家标准洗涤剂
- GB/T 15566.6-2007公共信息导向系统设置原则与要求第6部分:医疗场所
- 中国电信教育基地市级“三通两平台”建设方案(教育机构)
- 火力发电厂节能技术经济指标释义
- 智能制造知识课件
- 双方责任及工程分工界面
- 2017医学伦理知情同意书
- 中医学-导论课件
评论
0/150
提交评论