不完全信息动态博弈及应用_第1页
不完全信息动态博弈及应用_第2页
不完全信息动态博弈及应用_第3页
不完全信息动态博弈及应用_第4页
不完全信息动态博弈及应用_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

不完全信息动态博弈及应用本章主要介绍以下问题:1针对非完全信息动态博弈模型,我们介绍相应的均衡概念—子博弈精炼贝叶斯均衡的概念。2介绍一个求解有限信号博弈的精炼贝叶斯均衡的方法。3在应用方面,我们介绍了不完全信息动态博弈在次品市场、就业市场、企业投资与资本结构以及囚徒困境问题中的应用。4精炼贝叶斯均衡再精炼6.1子博弈精炼贝叶斯均衡的定义信息不完美的动态博弈模型一般不能再用子博弈精炼纳什均衡来刻画对于信息不完全的博弈模型,我们可以通过海萨尼转换的方法,把它转化为信息不完美的动态博弈模型。但对于信息不完美的动态博弈模型,一般不能再用子博弈精炼什均衡来刻画它。下例可清楚地说明此点。考虑图6-1所示的博弈树所对应的信息不完美博弈问题。它所对应的策略型博弈的支付矩阵如下:.图6-1I11

LMI21R.①②②该博弈存在两个纯策略纳什均衡:。因该博弈仅有一个子博弈,故它们也都是子博弈精炼纳什均衡。但是是个不可置信的均衡。因表明:不论局中人1选择什么行动,局中人2都将选择行动。但如果局中人1开始没有选择,而是进入到局中人2的信息集合,不论局中人2处于的哪个节点上,他选择都比选择好。因而局中人2不会选择,从而是不可置信的均衡。这表明了我们不能用子博弈精炼纳什均衡来刻画信息不完美、信息不完全的动态博弈模型。为了排除类似于这种不可置信的均衡,我们需要提出以下两个要求:对求解子博弈精炼纳什均衡的要求要求1在每一信息集中,应该选择行动的局中人必须对博弈进行到该信息集中每个节点的可能性有一个推断。对于非单点信息集,推断是该信息集不同节点上的一个概率分布。而对于单点信息集,在这点上局中人的推断为1。要求2给定局中人的推断,局中人的策略必须满足序贯理性的要求。即在每一信息集中,应该行动的局中人(以及局中人随后的策略),对于给定的该局中人的推断,以及其余局中人随后的策略(其中“随后的策略”是在达到给定的信息集之后,包括了其后可能发生的每种情况的完全的行动计划)必须是最优反应。对于图6-1所示的博弈树,要求1是说:如果博弈进入了信息集,局中人必须对博弈达到的两个节点的可能性有一个推断,即必须有一个上的概率分布。例如这个概率分布为(),如图6-2所示。

根据局中人2的推断可知,局中人2选的期望支付为,选的期望支付为。因,故局中人2满足序贯理性的策略行为是当他处于信息集上时,选择。这样,在要求1与要求2之下,我们排除了不可置信均衡。要求1仅要求局中人对其信息集内的节点有所推断,但合理的均衡应建立在合理推断的基础上,因而还要提出推断合理性的要求,为给出推断合理性要求先介绍以下概念图6-2p1-pI11

LMI21R①②②定义6.1对于一个给定的扩展式博弈中的均衡,如果博弈按照均衡策略进行时,将以正概率达到某个信息集,则称此信息集处于均衡路径上,反之,如果博弈按照给定均衡进行时,肯定不会达到某个信息集,该信息集称为处于均衡路径之外的信息集。要求3在处于均衡路径上的信息集上,推断由局中人的均衡策略及贝叶斯法则给出。例6-1考虑图6-3给出的博弈。

图6-31/4Ba0LR1/32/3V3/4I31DAAD①②③③该博弈的混合策略均衡,其中。这里不关心。按此均衡,该博弈进入信息集的概率为。故是处于均衡路径上的信息集。当博弈进入信息集时,参与人3对于左节点的推断应为,右节点的推断为。要求1到要求3包含了子博弈精炼贝叶斯均衡的主要内容。不同作者采用了不同的子博弈精炼贝叶斯均衡的定义。但其中全部都包含了要求1到要求3。且大多数作者还提出以下的要求。要求4在处于均衡路径之外的信息集上,推断由贝叶斯法则和局中人在此处可能的均衡策略决定。要求4的必要性例6.2考虑图6-4所给出的扩展式博弈。

策略组合()及相应的推断,满足要求1-3,是纳什均衡,但不是子博弈精炼纳什均衡。由,,故,为纳什均衡。对于要求1与3的满足是显然的,现考虑要求2。A1-pp图6-4

LR

I31DI21I11①②②

,博弈进入了信息集,参与人3选择,期望支付为2,选择,支付为1,故选;,博弈进入了信息集,局中人2选择L,支付为2,选择R,支付为1,故选L;,局中人选A,支付为2,选D,支付为1,故选A。从而()及满足要求1-3。从节点2开始的子博弈的支付矩阵为它有唯一的纳什均衡()。因而()在这个子博弈上的限制()不是纳什均衡。(),没有构成子博弈精炼均衡的原因就在于它不满足要求4。对于均衡()而言,信息集处于均衡路径之外,但推断与可能的策略组合()相矛盾。而{(),}满足要求1-4。它满足要求1与3是显然的,现考虑要求2。,参与人3在上选择,期望支付为2,选择,期望支付为3,故选;,参与人2在上选择,期望支付为3,选择,支付为1,故选;,参与人1在上选,支付为2,选择,支付为3,故选。我们已经说明了{(),}满足序贯理性的要求。因该博弈对于纳什均衡()而言不存在均衡路径之外的信息集,因而要求4自动满足。子博弈精炼贝叶斯纳什均衡的定义定义6.2

满足要求1到要求4的策略组合与推断称为不完全信息动态博弈模型的子博弈精炼贝叶斯纳什均衡,简称精炼贝叶斯均衡。不完全信息动态博弈的精炼贝叶斯均衡由参与人的策略组合与信息集上的推断组成,满足:1.给定推断,策略组合为子博弈精练纳什均衡。2.给定策略组合,推断满足贝叶斯法则。6.2信号传递博弈的精炼贝叶斯均衡信号传递博弈信号传递博弈是不完全信息动态博弈模型中一类简单、重要的博弈模型,它在经济管理领域内有很多应用。在信号传递博弈中,有两个参与人。参与人1称为信号发送者,参与人2称为信号接收者。参与人1具有私人类型,的概率分布是共同知识。海萨尼转换下的信号传递博弈时序如下:(0)自然首先按概率分布选择参与人1的私人类型,此处是参与人1的类型空间。自然将的值告诉参与人1。参与人2不知值,但了解的概率分布。(1)参与人1在了解到值后,选择信号,这里表示参与人1的行动空间,称其为信号空间。(2)参与人2在观察到参与人1发出的信号后,形成他对参与人1的私人类型的推断——后验概率。即在观察到行动的条件下,类型的条件概率。然后选择行动,这里,表示参与人2的行动空间。(3)对于给定的类型,信号,行动,参与人i获得支付,。在信号传递博弈中,信号发送者的策略是到上的映射::,。信号接收者的策略是到上的映射::,。信号传递博弈的精炼贝叶斯均衡的要求把6.1节中对于不完全信息动态博弈的精炼贝叶斯均衡的要求1-要求3,应用于信号传递博弈上,便可得到信号传递博弈的精炼贝叶斯均衡的要求。信号要求1

信号接收者观察到信号发送者所发送的信号之后,接收者必须根据所接收到的信号,对信号发送者的类型进行推断,即形成一个后验概率。信号要求1表明了信号发送者所发送的信号将会影响信号接收者对于信号发送者类型的推断。信号要求2R

对于信号与推断,信号接收者采取行,最大化他的期望支付,即

(为优化问题的解)。信号要求2R表明了信号接收者的行动与推断的一致性。信号要求2S

对于,给定信号接收者的策略,信号发送者选择信号,最大化自己的支付函数,即

(为优化问题的解)。最后,给定信号发送者的策略,令表示选择信号的类型集合,即。若,则对应于信号的信息集就处于均衡路径上;否则,任何类型都不选择,其对应的信息集则处于均衡路径之外。对处于均衡路径上的信号,把6.1节中的要求3运用于接收者的推断,可以得到:信号要求3

对于任意,如果存在,使,则信号接收者在对应于的信息集中持有的推断必须决定于贝叶斯法则和发送者的均衡策略。信号要求3说明了信号接收者的推断要满足贝叶斯法则,它保证了推断与信号发送者行动的一致性。信号传递博弈的精炼贝叶斯均衡的定义定义6.3称信号博弈中满足信号要求1,2R,2S,及3的策略组合和及推断为信号传递博弈的精炼贝叶斯均衡。我们下面给出一个例子说明信号博弈的定义为什么对均衡路径之外的信息集推断不作要求例6.3市场进入博弈参与人1是个潜在的市场进入者,其类型为概率与为的概率均为。参与人1知道后,可选择:进入与:不进入。如果参与人不进入市场,则博弈结束。参与人2是个市场在位者,他不知的取值,但了解的概率分布。当他看到参与人1进入市场后,可选择:合作与:抵制。支付向量如图6-5的博弈树所示。

,博弈进入了。在位者看到了进入者进入的行动,并且产生了推断:。若选择:合作,期望支付为50,若选择抵制,期望支付为。因而参与人2选择合作的充要条件是,或。故当时,。时,。,参与者1已获知了值,选择:进入或:不进入。当时,对于,参与人选择进入的支付为40,选择不进入的支付为0,故选择进入。对于,选择进入的支付为40,选择不进人支付为0,同样应选择进入,故有。I12I11图6-5①①②②◎这样,我们得到了该博弈的一个均衡:。它满足要求1-3。因为不存在均衡路径之外的信息集上的推断问题,因而没有必要对均衡路径之外的信息集上的推断作要求。而当时,。对,进入者选择进入支付为-10,选不进人支付为0;,情况也是这样,故有。于是,该博弈另一个均衡为。在该均衡下,是均衡路径之外的信息集,而该均衡对于上的推断没有限制作用,因而可以不必对均衡路径之外的信息集上的推断作任何要求。而在例6.2中,均衡()限制了。6.3信号传递博弈求解1.分离均衡不同类型的信号发送者,发送不同的信号。分离均衡意味着:是类型为的信号发送者的最优选择,就不是类型为的信号发送者的最优选择,是类型为的信号发送者的最优选择,就不是类型为的信号发送者的最优选择。可用数学表达式表示成如下两式:信号接收者的推断满足:

2.混同均衡不同类型的信号发送者,选择相同的信号发送。这时,信号接收者根据所接收到的信号,不能修改关于信号发送者类型的先验概率。设,为信号发送者的均衡策略,有:

由定义6.3可见,在信号博弈的精炼贝叶斯均衡中,参与人1的策略依赖于参与人2的策略;而参与人2的策略又依赖于参与人2的对于参与人1的类型的推断;而还依赖于参与人1的策略。求解纯策略意义下信号博弈的步骤(1)求信号接收者的推断依存的子博弈精炼均衡策略。在博弈第2阶段,参与人2观察到参与人1所发送的信号,设他对参与人1的类型的推断为,选择策略,最大化他的期望支付,即求解最大化问题:解得参与人2的推断依存的策略。(2)求信号发送者的推断依存的子博弈精炼策略。在博弈的第1阶段,设类型为的信号发送者预期到信号接收者的推断依存的策略,求,最大化自己的支付函数,即求解最大化问题:解得参与人1的推断依存的策略。(3)求信号博弈的精炼贝叶斯均衡。利用(1),(2)两步求得的参与人信念依存的策略及,求出满足贝叶斯法则的参与人2对于参与人1的类型的推断,及,,即为信号博弈的贝叶斯均衡。例6.4

本例是克瑞普斯(Kreps,1982)声誉模型的一个简化版本。考虑一个两期的声誉模型。,市场上在位企业可选择两个行动,:掠夺,:和解。企业1的私人类型可取:理智,:疯狂。其概率分布是共同知识。,进入者企业2观察到企业1的行动后,选择:坚持与:退出这两个行动。记,博弈树如图6-6所示。I21I12I11图6-6I22◎①①②②②在支付向量中。即理智的在位者更偏好于和解的行动,但他更希望成为垄断者。垄断利润为,为贴现因子。下面求该博弈的精炼贝叶斯均衡。,局中人2观察到企业1的行动,选择策略,最大化自己的期望支付当时,企业2求解最大化问题:当若,显然,从而得到企业2推断依存的策略:

(1)当(2)当,局中人了解到自己的类型,并预期到,选择策略,最大化自己的支付函数。(1)当时,对,企业1预期到,他的最优反应行为是求解最大化问题所以对,,。要求推断,与相矛盾,故此时不会产生精炼贝叶斯均衡。

(2)当时,参与人1预期到,他的最优选择行为是对,求解最大化问题从而的充要条件是。对,有。当或时,,这要求推断,从而当,时,有混同均衡:而当时,这要求推断,这时有分离均衡:

6.4信号传递博弈的应用6.4.1二手车交易模型二手车交易模型为叙述二手车交易模型,引入以下记号。1.为局中人集合,其中1代表二手车市场的卖主,2代表买主。2.为卖主的类型空间。卖主的私人类型表示卖主所出售的二手车是低质量的,表示卖主所出售的二手车是高质量的。卖主知道的取值,买主不知道的取值,但知道的概率分布为,。3.是卖主的行动集合即信号空间。分别表示卖主对于二手车的两种不同的要价,。4.为买主的行动空间。表示不购买的行动,表示购买的行动。5.博弈的时序二手车交易模型的精炼贝叶斯均衡第1阶段,卖者了解到的取值后,选择信号;第2阶段,买主观察到信号,后形成关于类型的推断:,,用表示高质量二手车对于买主的价值,表示低质量二手车对于买主的价值,且,表示低质量二手车伪装为高质量二手车卖主所需付出的成本。对于给定的,为确定起见,令,,,,,(表明在二手车市场上,低质量车容易伪装成高质量车)。两个局中人的支付函数(用表示卖主的支付函数,表示买主的支付函数)如下:

,,,,,,,,。上述双价二手车交易博弈树如图6-7所示下面求该博弈的精炼贝叶斯均衡。

.当博弈进入,局中人2观察到价格,形成了对的推断以及对的推断。参与人2选择(购买)的充要条件是:或。故知当时,。当时,。当博弈进入,局中人2观察到价格,形成了对的推断,对的推断。参与人2选择的充要条件是:。此不等式对任何都成立,故有。图6-7

1-π01-π1π1◎①①②②②②综上可得参与人2的推断依存策略:当时当时,。

.局中人1了解到自己的类型,并预期到,选择推断依存的策略,最大化自己的支付函数。当时,对于,局中人1的行为是求解最大化问题,所以。对于,,所以。故得参与人1推断依存的策略:,从而得到了混同均衡:。该均衡表明当二手车市场上好车占有时,卖主把所有车都作为好车卖,而买主都购买。当时,对于,。所以。对于,,所以从而可得混同均衡:,6.4.2就业市场信号博弈就业市场信号博弈模型的精炼贝叶斯均衡该博弈两个参与人是求职的工人与雇主。求职者有两种私人类型:,表示求职者的劳动生产率是;,表示求职者的劳动生产率为,,的概率分布:,是共同知识。由于劳动力市场的竞争性,使得雇主雇佣工人的期望利润为0。在完全信息下(即两个参与人都知道的值),雇主以工资雇佣型的工人,以雇佣型的工人。即可给出两个局中人的帕累托(Pareto)最优分配。当是求职者的私人类型时,求职者占有信息优势,雇主只能以雇佣工人,这时的工人就可能退出市场。这就是信息不对称所造成的逆向选择问题。为了解决逆向选择问题,求职者以受教育程度作为信号发送给雇主,以使雇主能区别两类不同的求职者。我们可用信号博弈模型分析这个问题。该模型假设:1教育对求职者的劳动生产率没有影响,目的是把注意力集中于用教育水平作为求职信号这一问题上来,使分析简化。2类型为的求职者,受教育程度为需要付出成本。假设,即类型为的求职者受教育水平为的边际成本大于类型为的受教育水平为的边际成本。这是该模型的一个关键性假设。正是这条假设使求职者的受教育程度具有信号作用,设。该博弈模型的时序如下:1.自然按分布选择求职者的劳动生产率。2.求职者了解到自己的劳动生产率后,选择受教育水平。3.雇主观察到求职者的受教育水平后,形成对于求职者类型的推断,并向工人提供工资,使雇主的期望利润为0。4.对给定的和,工人的利润为就业市场信号博弈模型的精炼贝叶斯均衡(1)考虑分离均衡.在分离均衡中,设存在一个受教育水平临界,当时,认为,当时,认为。即当推断满足,工资。,工资。当求职者选择时,求职者利润为,因而。当求职者选择时,求职者利润为,因而。这样求职者实际上仅有两种选择:或。故分离均衡可以表示为:,相应的推断为

,,工资水平为剩下的问题是决定的数值。据上述分析,可以画出如图6-8所示的博弈树。

,在博弈的第2阶段,雇主看到求职者所发出的信号,采用推断,,并选择使期望利润为0的工资政策。时,求职者预期到及其推断,选择,最大化利润。

图6-8-1001θ=Hθ=Lw=La0e=0w=Hw=H◎①①②②②②当时,的充要条件是。当时,,等同于。故当时,有分离均衡:

,

,,(2)考虑混同均衡在混同均衡中,雇主的推断及工资选择如下:当,,;当,,。。求职者选择时,利润为,故。选择时,利润为,故。此时博弈树如图6-9所示。1-qq01HLe=0w=Lw=Lw=H+(L-H)qw=H+(L-H)q

图6-9◎①①②②②②问题归结为的确定。,求职者预期到及雇主的推断:,,.选择,最大化利润。当时,,

等同于当时,等同于,故有混同均衡:

,,,

,其中。6.4.3企业投资与资本结构企业投资与资本结构信号博弈企业想开发一个项目,需要一笔资金。该企业之盈利能力是企业的私人信息。其概率分布,是共同知识。这里,。企业向潜在投资者提出一定比例的股份份额以换取投资额。问题是企业所提出的股份份额多少为宜。上述问题可用信号博弈加以分析。这里企业被视为信号发出者,股份份额作为企业赢利能力的信号。潜在投资者被视为信号接收者,他决定是否接受。用表示新项目的收益,表示投资者的机会利率(投资于其它处的利率)。且设。投资者无法分离利润与收益。该信号博弈的时序为1.自然以概率分布,选择企业的盈利能力(类型)。2.企业了解到类型后,选择股份份额。3.潜在投资者看到后,形成对企业利润的推断,并决定是否接受。4.若投资者拒绝,即选择行动,获得保留收益,企业的收益为;若投资者接受,即选择行动,获得收益,企业收益为。企业投资与资本结构信号博弈的均衡(1)考虑混同均衡设,潜在投资者的推断为,博弈树如图6-10所示。

在第2阶段,潜在投资者根据接收到的信号,形成了对企业利润的推断,,选择行动,最大化自己的期望利润,即求解显然,选择的充要条件是或故可得到

图6-101-ppSS◎①①②②在第1阶段,企业可预期到潜在投资者的策略及其推断,根据自己的类型求,最大化企业的收益。当时,考虑若企业选,使时,他希望投资者能选择,因而还要满足,可得当时,考虑。企业选择当然希望能被投资者接受,这样需要满足条件:,得到从而当满足时,可得混同均衡:,,,易知,当时,混同均衡存在。(2)考虑分离均衡。企业策略形如,潜在投资者接收到信号后,对于企业类型的推断为,。博弈树如图6-11所示。

在博弈的第2阶段,潜在投资者收到信号,形成推断,,选择行动或,最大化自己的期望支付。

1001a1a0a1a0a0a0a1a1图6-11◎①①②②②②对于,考虑,易知的充要条件是或。对,考虑,易知的充要条件是或。这样,可将所在的平面划分成四个区域:,,

,对于,有,对于,有,对于,有,对于,有。在博弈的第1阶段,企业预期到潜在投资者的策略及其推断。根据自己的类型,选择行动,最大化自己的期望支付。对于,即,时,`,潜在投资者不会对企业投资,因而我们不讨论这种情况。对于,即当,时,。当,考虑,的充要条件是或。当,考虑,的充要条件为或。故当时,不可能存在分离均衡。对于,即,,当,考虑,的充要条件是或,故有当,考虑,的充要条件是或,这与相矛盾。因而时,也不存在分离均衡。对于,即,,。当,考虑,的充要条件是或。记,故有。当,考虑,的充要条件是或。从而当,时,可得分离均衡:,,,6.4.4信息不完全条件下的囚徒困境问题大量的经验证据表明,既使在有限次重复的囚徒困境问题中,局中人双方采取合作的策略的情形也是经常发生的,克雷普斯(Kreps),米尔格罗姆(Milgrom),罗伯茨(Roberts),威尔逊(Wilson)(1982)的KMRW声誉模型通过将不完全信息引入有限次重复的囚徒困境模型,解开了这个悖论。该模型表明,对于有限次重复的囚徒困境博弈,在一定的条件下,绝大多数的阶段都会出现合作的局面。信息不完全条件下的囚徒困境模型在有限次的囚徒困境博弈中,假设囚徒1有两种类型:理性的和非理性的,这是囚徒1的私人类型。两种类型的概率分布:,是两个局中人的共同知识。设囚徒2是理性的。理性囚徒可以选择任何策略,而非理性的囚徒仅选择“针锋相对”策略。即第1阶段选择行动合作D,而在阶段选择与其对手阶段相同的行动。信息不完全有限重复囚徒困境问题时序如下:1.自然首先选择囚徒1的类型。囚徒1知道自己的类型,囚徒2仅知囚徒1类型的概率分布。2.两个囚徒进行第1阶段博弈,双方在此阶段的选择结果是共同知识。3.观察到第1阶段博弈结果后,进行第2阶段博弈,观察到第2阶段博弈结果后进行第3阶段博弈,如此下去,直到进行第阶段的博弈。4.两囚徒的支付是阶段博弈支付贴现之和。为简单,设贴现因子。阶段博弈由下列支付矩阵给出。其中。2阶段信息不完全条件下的囚徒困境模型首先讨论的情况。在第2阶段,囚徒2和理性的囚徒1,都会选择非合作行为。在博弈的第1阶段,非理性的囚徒1选择合作D,理性的囚徒1选择C。设囚徒2选择行动X,从而非理性的囚徒1在第2阶段也选择行动X,如表6.1所示。表6.1

非理性囚徒1

理性囚徒1

囚徒2

若,囚徒2的期望支付为若,囚徒2的期望支付为因而囚徒2在第1阶段选择合作D的充要条件是

或,(1)这说明,当局中人1非理性的可能性较大时,即若(1)成立,第1阶段给出了合作的行动组合()。3阶段信息不完全条件下的囚徒困境模型当时,仍假设(1)式成立。如果理性囚徒1和囚徒2在第1阶段选择合作,这时,和这两个阶段局中人的行动可在表6.1中取得到。三阶段博弈中各阶段局中人采取的行为由表6.2给出。下面我们给出第1阶段理性囚徒1和囚徒2选择合作的条件。由表6.2,首先,非理性的囚徒1没有动机背离表6.3所示的策略,理性囚徒1的收益为,囚徒2的期望收益为。如果理性囚徒1在第1阶段选择非合作,则囚徒1是理性的就成为了共同知识,于是第2,3阶段两个局中人都将选择非合作。这样,理性囚徒1第1阶段选择非合作可得到总收益,它要低于上述均衡收益,于是理性囚徒1没有动机背离表6.2所示的隐含策略。表6.2

非理性囚徒1

理性囚徒1

囚徒2

下面考虑囚徒2是否有背离的动机。如果囚徒2在第1阶段选择非合作

理性的和非理性的囚徒1在第2阶段也将选择在第1阶段选非合作后,囚徒2必须决定在第2阶段的行动选择。

如果选择非合作,则非理性囚徒1第3阶段仍选,

这时博弈的情况如表6.3所示。表6.3

非理性囚徒1

理性囚徒1

囚徒2囚徒2从这种背离中获取期望收益,它小于其均衡收益的条件为。在(1)的条件下,囚徒2不选择这种背离行动的条件为或(2)另一种情况是,囚徒2的背离行为可以是第1阶段选择非合作,但第2阶段选择合作。这时,非理性囚徒1将在第3阶段选择合作,博弈情况如表6.4所示。表6.4

非理性囚徒1

理性囚徒1

囚徒2

囚徒2的这种背离行为的期望收益为,它小于均衡期望收益的条件为。给定条件(1),囚徒2不选择这种背离行动的条件是(3)综上所述,我们已经证明了如果条件(1),(2),(3)成立,则表6.2给出了三阶段囚徒困境博弈的均衡路径。

阶段的囚徒困境问题对于一般阶段的囚徒困境问题,我们可以证明以下结论成立。结论对于期重复的囚徒困境博弈,如果阶段博弈支付矩阵中元素及非理性囚徒1的概率满足条件(1)、(2)、(3),则对所有的,都存在下述的合作均衡:理性的囚徒1和囚徒2从博弈开始直到期全部选择合作,并在期和T期选择表6.1所示的行动。

6.5精炼贝叶斯均衡再精炼在不完全信息动态博弈中,可能会出现很多均衡,一个自然的问题是,哪一个均衡更合理、更可能出现。因为博弈分析的目的之一是预测博弈的结果,博弈论的许多最新发展就是讨论如何通过对非均衡路径上的后验概率(推断)施加一些直观、合理的限制以改进精炼贝叶斯均衡的概念,从而得到更为合理的均衡结果。本节我们介绍克雷普斯(1984)和克雷普斯——曹(1987)的直观标准。均衡劣信号的定义定义6.4

给定信号博弈的精炼贝叶斯均衡,称信号为关于类型的均衡劣信号,如果下的信号发送者的均衡收益大于在下,信号接收者选择任何行动的收益,即该定义表明,如果对于给定的贝叶斯均衡,关于是均衡劣的信号,那么,当局中人的类型为时,他就不会发送信号。信号接收者猜测到这点,他在接收到信号时也不会推断。例6.5考虑由图6-12所示的信号博弈。可以验证是该信号博弈的一个混同均衡,是的均衡劣信号。因为。

不是的均衡劣信号,因为图6-12

0.90.1q1-p1-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论