决策与博弈论第4章

上传人：金*** IP属地：浙江上传时间：2025-03-23 格式：PPTX 页数：71 大小：1.21MB 积分：30 举报 版权申诉

已阅读5页，还剩66页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2025/3/221第四章不完全信息动态博弈4.1.1基本概念

不完全信息意味着至少有一个参与人拥有私人信息，通常用类型表示拥有不同私人信息的参与人，类型由“自然”或“上帝”给定。

博弈顺序：

（1）“自然”选择参与人的类型，并将类型告诉参与人自己，不告诉其他参与人，只将类型分布告诉其他参与人；（2）参与人开始行动，参与人的行动有先有后，后行动者能观察到先行动者的行动，而不能观察到先行动者的类型。

先行动者的类型行动后行动者推断2025/3/222先行动者预测后行动者的行动信息

后续博弈（continuationgame):从每一个信息集开始的博弈的剩余部分。与子博弈的区别：子博弈必须开始于单结信息集，并且不能切割信息集，而后续博弈可以始于任何完全信息集（不论是否为单结）。

完美贝叶斯均衡要求：（1）在每一个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布（信念）；（2）给定有关其他参与人类型的信念，参与人的策略在每一个信息集开始的后续博弈上构成贝叶斯均衡；（3）在所有可能的情况下（贝叶斯法则能适用），参与人使用贝叶斯法则修正有关其他参与人类型的信念。

2025/3/223

完美贝叶斯均衡吸取了子博弈完美纳什均衡和贝叶斯均衡的精华，是贝叶斯均衡、子博弈完美均衡和贝叶斯推断的结合。

子博弈完美纳什均衡：策略不仅必须是整个博弈的纳什均衡，还必须是其中每一个子博弈的纳什均衡。

完美贝叶斯均衡：策略不仅必须是整个博弈的贝叶斯纳什均衡，而且还必须构成每一个后续博弈的贝叶斯纳什均衡。

例：在图4.1.1表示的博弈中，自然赋予参与人1两种类型，L或H，将类型告诉参与人1，但只将参与人1的类型分布告诉参与人2.参与人1有两个行动L和R，参与人2有行动A和B，参与人2能够观察到参与人1的行动，但是不知道参与人1的类型（或自然的行动）。2025/3/224图4.1.1

海萨尼转换后的情形N11L[]H[]LRLRAABB(2.5,3)(2.5,3)(3,3)(2,1)(1,2)(1,1)22025/3/225图4.1.212LMRBABA(2.5,3)(2,1)(1,2)(1,1)(3,3)2025/3/226

博弈有两个纯策略纳什均衡，（L,A）和(R,B)。给定参与人1选择L，参与人2的信息集没有达到；给定参与人2选择A，参与人1的最优选择是L，因此，（L,A）是一个纳什均衡。因为这个博弈只有一个子博弈（从广义的角度看），即原博弈，所以（L,A）和(R,B)都是子博弈完美均衡。完美纳什均衡（L,A）依赖于一个不可置信的威胁：当参与人1偏离L而选择其他行动时，参与人2的最优行动是选择B，所以,参与人1不应该相信参与人2会选择A。

（L,A）的剔除：假设参与人2认为参与人1选择M和R的概率分别为q和1-q。给定这个信念，参与人2选择A的预期效用是,选择B的预期效用是

,这样，参与人2一定会选择B.

2025/3/227

给定参与人1知道参与人2将选择B，参与人1的最优选择是R。但给定R是参与人1的最优策略，当参与人2观察到参与人1没有选择L时，他推断参与人1一定选择了R，即。

因此，这个博弈的唯一完美贝叶斯均衡是

2025/3/2284.1.2不完全信息下的博弈与决策服务行业的市场进入模型，博弈顺序为：（i）进入者决定进入（E）或不进入（O）；（ii）

在位者选择高价（H）或低价（L）；（iii）自然选择需求，正常需求（N）的概率为0.6，萎缩需求（R）的概率为0.4；

在正常需求的情况下，如果进入者选择不进入，则进入者的支付为0，在位者选择低价时的支付为40，选择高价时的支付为200；如果进入者选择进入，则当在位者选择低价时，进入者的支付为-80，在位者支付为-40，当在位者选择高价时，进入者和在位者各得支付80。在萎缩需求时，在每种情况下，在位者的支付比正常情况少了40；而进入者选择进入时，其支付比正常情况下也少了40。2025/3/229不完全信息下的博弈与决策根据上面的的行动顺序，可以画出进入者的决策树（decisiontree)，见图4.1.3。进入者

在位者

自然

OELHRNRN0[0.5][0.5][0.4][0.6][0.4][0.6]-120-804080图4.1.3

市场进入决策树

2025/3/2210不完全信息下的博弈与决策市场进入博弈树4.1.4市场进入博弈树进入者

在位者

OE在位者

自然

LHRN[0.4][0.6](0,0)(0,40)自然

RN[0.4][0.6]自然

LHRN[0.4][0.6]自然

RN[0.4][0.6](0,160)(0,200)(-120,-80)(-80,-40)(40,40)(80,80)2025/3/22114.2.1信号博弈的完美贝叶斯均衡信号博弈

信号博弈中有两个参与者，具有信息优势的一个称为信号发送者（S），另一个称为信号接收者（R），博弈顺序为：

（i）自然从可行的类型集中赋予发送者类型的先验概率为，并告知接收者，而告知发送者，接收者不知道发送者的类型，；（ii）发送者从信号集中选择一信号m发送；

（iii）接收者观察到m后，从可行行动集中选择行动a

；

（iv）发送者的效用函数为，接收者的效用函数为或给出接收者的最优反应函数，两者为共同知识。

后验概率表示观察到信号m，接收者相信是类型发送的概率。

2025/3/2212信号博弈的完美贝叶斯均衡定义

（i）（ii）（iii）是接收者使用贝叶斯法则从先验概率、观察到的信号和发送者的最优策略得到的（在可能的情况下）。

定义4.2.1

信号博弈的完美贝叶斯均衡（perfectBayesianequilibrium）是策略组合和后验概率的结合，它满足：2025/3/2213信号博弈的完美贝叶斯均衡定义

如果不知道接收者的效用函数，但知道完全信息下接收者的最优反应函数，那么，定义4.2.1中的（i）用下面的（i´）代替

（i´）

信号博弈的完美贝叶斯均衡可以分成三类：分离均衡、混同均衡和准分离均衡。更加具体地，它们分别定义如下：

分离均衡（separatingequilibrium）

这种均衡中，不同类型的发送者以概率1选择不同的信号，也就是说，没有两种类型选择同一信号。在分离均衡中，信号准确地表现类型，特定的类型发送特定的信号。接收者完全可以通过信号准确判断出发送者的类型，即后验概率要么为0要么为1。

2025/3/2214信号博弈的完美贝叶斯均衡定义

混同均衡（poolingequilibrium）在这种均衡中，不同类型的发送者选择了相同的信号，换句话说，没有任何类型选择与其他类型不同的信号。这时，接收者无法从信号中得到新的信息，也就无法对先验信念进行修正。因此，后验概率等于自然赋给信号发送者类型的概率。

在混同均衡中，对于任何类型的信号发送者，选择均衡信号比选择其他任何信号的效用都高，即

准分离均衡（semi-separatingequilibrium）

一些类型的发送者随机地选择信号，另一些类型的发送者选择特定的信号。接收者得到某些信号时能够准确地判断出发送者的类型，得到另外的信号时尽管不能完全判断发送者的类型，但是能够修正自己的信念。

2025/3/2215信号博弈的完美贝叶斯均衡

直观标准的含义是，在非均衡路径中，接收者认为发送者不会选择无论接收者怎样采取行动发送者的效用总小于均衡时发送者效用的信号。

直观标准

如果m之后的信息集处于均衡路径之外，且m为类型的均衡劣信号，即均衡效用，则（在可能的情况下）接收者的推断。

信号博弈的完美贝叶斯均衡中一般存在不可置信((incredible)的均衡，为了剔除之，可以采用Kreps(1984)或Cho和Kreps(1987)的直观标准（intuitivecriterion）。接收者对类型发出的信号m所采取的行动记为，以替代效用函数中的a，下同。

2025/3/2216信号博弈的完美贝叶斯均衡“啤酒和热狗”信号博弈Cho和Kreps(1987)的“啤酒和热狗(beerandquiche”信号博弈中，博弈顺序为：（iv）发送者和接收者的效用见图4.2.1，两者为共同知识。

（i）自然从可行的类型集中赋予发送者类型的概率为，并将告知接收者，而将告知发送者，接收者不知道发送者的类型，且；

（ii）发送者从信号集中选择一信号发送；

（iii）接收者观察到信号后，从可行行动集中选择行动；

在博弈顺序中，类型代表软弱型（wimpy），代表粗暴型（surly）；B代表啤酒，Q代表热狗；D代表与发送者冲突（duel），N代表不与发送者冲突。[p]表示当接收者接收到信号后，认为发送者的类型为的概率，即。

2025/3/2217信号博弈的完美贝叶斯均衡“啤酒和热狗”信号博弈图4.2.1“啤酒和热狗”信号博弈

b,1d,00,-1b+d,0d,00,1b,-1b+d,0DNDNDNDNQBQB[p][1-p][q][1-q]RR0.10.9N2025/3/2218信号博弈的完美贝叶斯均衡“啤酒和热狗”信号博弈

支付的定性特征是，软弱型宁愿热狗，粗暴型宁愿啤酒，两种类型都不愿意与接收者冲突，而接收者宁愿与软弱型冲突，但不愿与粗暴型冲突。具体地，对两种类型的发送者来说，偏好的早餐价值，不偏好的早餐价值为0，而避免冲突价值。对接收者来说，与软弱型（粗暴型）冲突的支付为1（-1），所有其他支付为0。

2025/3/2219“啤酒和热狗”信号博弈

在啤酒和热狗博弈中，是发送者的一个分离策略，这里代表在发送者是软弱类型的情况下，选择热狗。如果，那么，发送者的策略和接收者的策略以及后验概率和是这个博弈的完美贝叶斯均衡。这里代表在发送者选择热狗的情况下，接收者选择冲突，也可以类似地解释。b,1d,00,-1b+d,0d,00,1b,-1b+d,0DNDNDNDNQBQB[p][1-p][q][1-q]RR0.10.9N2025/3/2220信号博弈的完美贝叶斯均衡“啤酒和热狗”信号博弈当时，是否啤酒和热狗有其他完美贝叶斯均衡？发送者可能选择的其他策略是、和。当时，软弱的发送者选择热狗得到的最低支付超过选择啤酒时得到的最高支付，这样软弱型将不选择啤酒，发送者也许选择的其他策略为。类似地，粗暴发送者选择啤酒得到的最低支付超过选择热狗得到的最高支付

，这样粗暴型将不选择热狗，策略不能成为完美贝叶斯均衡策略。于是，当时，上面取的分离完美贝叶斯均衡是该信号博弈的唯一完美贝叶斯均衡。2025/3/2221信号博弈的完美贝叶斯均衡“啤酒和热狗”信号博弈当时又是怎样的呢？现在，没有分离完美贝叶斯均衡。但是，有两个混同完美贝叶斯均衡。可直接证明，当时，发送者的策略、接收者的策略以及后验概率和一起构成一个混同完美贝叶斯均衡（事实上，对任何也成立）。这个混同均衡可解释为：粗暴类型获得它偏好的早餐并避免冲突；因为，软弱类型宁愿隐藏自己的类型信息，而不愿有偏好的早餐。软弱型假装成粗暴型而避免冲突，获得更高利润。

b,1d,00,-1b+d,0d,00,1b,-1b+d,0DNDNDNDNQBQB[p][1-p][q][1-q]RR0.10.9N2025/3/2222信号博弈的完美贝叶斯均衡斯彭斯的劳动力模型考察下面的信号博弈模型（斯彭斯，1974）：在模型中，有两个参与人，一个雇主和一个雇员，记雇员为参与人1（信号发送者），雇主为参与人2（信号接收者），雇主是不知情的参与人。博弈顺序为：

（i）自然从可行的类型集中赋予雇员类型的先验概率为，并将告知雇主，而将告知雇员，雇主不知道雇员的类型，；

（ii）雇员从信号集中选择一信号发送；

（iii）雇主观察到后，从可行行动集中选择行动（工资）；

雇员的效用为，雇主的效用函数为，两者为共同知识。

注意到，我们有。于是，由先验概率计算出的预期生产力为

2025/3/2223信号博弈的完美贝叶斯均衡斯彭斯的劳动力模型

假设教育成本是(分离条件(sortingcondition))。如果参与人1的类型是，且得到工资，其效用是：

2025/3/2224信号博弈的完美贝叶斯均衡斯彭斯的劳动力模型weweLHAB图4.2.2

图4.2.2中给出了两类型各自的无差异曲线。类型L的无差异曲线要比类型H的无差异曲线陡，这是因为，类型L增加一个给定教育水平的成本比类型H的成本更高；因此，类型L会要求工资有一个较大幅度的上升，这样才能使它的效用保持不变。

2025/3/2225信号博弈的完美贝叶斯均衡斯彭斯的劳动力模型雇主的效用函数为

只有当时，雇主才会接受雇员的条件。对任何一个教育水平而言（特别地，它为0），任何一个总会被接受，而任何一个总会被拒绝。

2025/3/2226信号博弈的完美贝叶斯均衡斯彭斯的劳动力模型分离均衡

在这个均衡中，两种类型的雇员选择两种不同的教育水平，不同类型的雇员得到不同工资。低生产力类型L必然会选择。（如果他投资，他的效用等于，将会比他在不投资时得到的效用低，后者至少等于L）。高生产力类型选择，让我们用和来定义教育水平。

2025/3/2227信号博弈的完美贝叶斯均衡斯彭斯的劳动力模型低生产力类型在不进行教育投资并被企业识别为低生产力类型（能够要求得到工资L），与进行教育投资并被企业误认为是高生产力类型（能够得到工资）这两者之间是无差异的。虽然，高生产力类型进行超过的投资，他会被雇主识别为高生产力类型（同时，如果他不进行投资，他得到的工资至少是L），但是，他不会进行这样的投资。明显地，一个分离完美贝叶斯均衡的教育水平位于区间之中，这是由于它必须满足激励相容约束和。而中的任何一个都是一个完美贝叶斯均衡的组成部分。规定，对不在中的均衡以外的教育水平而言，雇主会认为雇员不能要求得到超过L的工资，而且，很容易证明，类型L选择教育0而类型H选择教育。

2025/3/2228信号博弈的完美贝叶斯均衡斯彭斯的劳动力模型但是，当我们讨论均衡以外的推断时，一旦剔除弱劣策略，则只会有一个分离均衡存在。为了这个目的，我们注意到，对类型L而言，任何严格大于的都劣于教育水平0。（类型L投资0，他得到的工资至少是L；类型L投资，他得到的利润至多是。）特别地，根据直观标准，中的任何一个都应该引导出后验概率（因此，可以要求得到工资）。因此，为使企业识别出自己的类型，H类型的投资不必多于，我们得到一个唯一的分离均衡，其中，高生产力类型在“最小成本分离均衡水平”进行投资，投资为。

2025/3/2229信号博弈的完美贝叶斯均衡斯彭斯的劳动力模型混同均衡

这里还存在许多混同完美贝叶斯均衡。假定两种类型都选择教育水平。相应地，他们可以要求得到工资。为得到这样一个均衡，最好的办法是，对，你选择非均衡推断，因而，教育为的工资等于L。像过去一样，这给出了偏离的最小积极性。现在，由于有这种推断，最有利的偏离是选择，因此，为使成为一个混同均衡，我们需要和。因此，得到一个混同均衡连续统，混同均衡的教育水平位于区间之中，。2025/3/2230斯彭斯的劳动力模型简单剔除策略并不能使混同均衡集缩小，但是，直观标准剔除了所有的混同均衡。让我们从图4.2.2来考察这个问题。假定两种类型在点混同。如果参与人1偏离混同均衡而选择

B点包括更多的教育和更高的工资，对高生产力类型而言，工资提高足以抵消教育成本的增加，但这对低生产力类型而言不成立。因此，对类型L而言，选择B是均衡非优的（但对类型H不成立）。这样，在

B点，雇主应该形成的推断是，其预期利润应该是。注意到，我们有，若是小的，则雇主应该接受雇员的出价。因而，类型H应该选择B而不是A。这样，在A点的混同均衡是不满足直观标准的。

weweLHAB2025/3/2231信号博弈的完美贝叶斯均衡PhD录用博弈假设一所大学知道种群中80%的人憎恨经济学(H)，并且在他的PhD计划中是不适当的，20%的人喜欢经济学(L)，并且健康发展。此外，它不能观察到申请者类型。如果大学拒绝(R)一个申请，它的支付为0，申请者的支付为-1。如果大学接受(A)憎恨经济学的人的申请，大学和学生的支付都为-8，但是，如果申请者喜欢经济学，每个参与人的支付为16。图4.5.1给出了博弈的扩展式。种群百分比用自然选择学生是经济学爱好者或憎恨者的结点表示。在图4.5.1中，学生选择申请（A）和不申请（NA）。

2025/3/2232信号博弈的完美贝叶斯均衡Ph.D录用博弈图4.5.1Ph.D录用博弈

N0.80.2S2S1HL-8,-8-1,016,16ANAANAU1U2AARR0,00,0-1,02025/3/2233信号博弈的完美贝叶斯均衡PhD录用博弈分离均衡：爱好者申请，憎恨者不申请；大学允许；大学推断申请者的类型为经济学爱好者，而不申请者为憎恨经济学的学生，即，。分离均衡不必指出非均衡信念，无论两个可能的行动“申请”和“不申请”什么时候发生在均衡中，贝叶斯规则都可以应用。

PhD录用博弈是一类信号博弈，有几类完美贝叶斯均衡，非均衡信念（out-ofequilibriumbeliefs）不同，但均衡可以分成两类：分离均衡，在这一均衡中经济学爱好者申请，而憎恨者不申请；混同均衡，没有一类学生申请，大学的后验推断不变。具体来讲，有：

2025/3/2234信号博弈的完美贝叶斯均衡PhD录用博弈混同均衡：爱好者不申请，憎恨者不申请；学校拒绝；，，其中表示申请。后验推断支持混同均衡。两类学生避免申请，因为他们相信自己将被拒绝，并收到－1的支付；大学宁愿拒绝申请的任何学生，并相信80%的概率是憎恨者。在Cho和Kreps(1987)的直观标准下，如果有一类知情的参与人，不管不知情的参与人持有什么样的信念，他都不能从非均衡行动中收益，那么，不知情的参与人的信念必须认为那种类型的概率为0。这里，在任何可能的大学信念下，憎恨者不能从申请中收益，因此，大学认为申请者是憎恨者的概率为0，即。直观标准不支持混同均衡，因此，如果大学持有这样的信念，它将接收任何申请的人。

2025/3/2235完美贝叶斯均衡的再精练参与人的策略在每一个子博弈中都构成纳什均衡这个要求还是太弱，因为在不完全或不完美信息博弈中几乎没有什么子博弈。4.3.1序贯均衡

现象“状态”（assessment）由所有参与人的（混合）策略组合和所有信息集上的（后验）概率分布构成，即

2025/3/2236序贯均衡

记号包含结点x的信息集

在结点x进行选择的参与人给定混合策略组合p，达到结点x和信息集h的概率参与人i(x)到达信息集h(x)时在结点上的信念2025/3/2237序贯理性

如果对于任何信息集h和可选的策略，都有则是序贯理性的2025/3/2238如果对于中的某个序列有令为所有状态的集合，

是所有为严格混合策略的状态的集合则状态是一致的(consistent)2025/3/2239注意：策略不一定是完全混合的

一致性的定义不能将“颤抖”的概念运用到自然的行动上颤抖使得贝叶斯法则适用于博弈的所有路径序贯均衡一个满足序贯理性和一致性条件的状态。2025/3/2240例子参与人1在这两个结点上以相同的概率偏离

即颤抖确保参与人的信念遵照信息结构2025/3/2241序贯均衡与完美贝叶斯均衡

一致性条件比贝叶斯法则更强，满足一致性条件的均衡一定满足贝叶斯法则，但逆命题不成立。每一个序贯均衡都是完美贝叶斯均衡，但并不是每一个完美贝叶斯均衡都是序贯均衡定理4.3.1（Fudenberg和Tirole，1991）在一个类型相互独立的不完全信息多阶段博弈中，如果每个参与人最多只有两种可能的类型，或者博弈只有两个阶段，那么，贝叶斯法则等价于一致性条件，因此，完美贝叶斯均衡与序贯均衡是重合的。

2025/3/2242完美贝叶斯均衡的再精练颤抖手均衡

Selten(1975)使用策略式博弈引入颤抖手完美均衡的概念。颤抖手完美均衡的基本思想是，在任何一个博弈中，每一个参与人都有一定的可能性犯错误；一个策略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优策略的组合时，才是一个均衡。通过引入“颤抖”，博弈树上的每一个决策结出现的概率都为正，从而每一个决策结上的最优反应都有定义，原博弈的均衡可以理解为被颤抖扰动后博弈的均衡的极限。

2025/3/2243完美贝叶斯均衡的再精练颤抖手均衡IIIC1C2R1R2表4.3.1

2025/3/2244完美贝叶斯均衡的再精练颤抖手均衡（纯策略）纳什均衡：(R1,C1)和(R2,C2)。IIIC1C2C3R1R2R3表4.3.2

现在将表4.3.1的博弈扩展到表4.3.2。参与人有与前面同样的策略（并具有同样的效用支付），不过，每个参与人分别增加第三个策略。2025/3/2245新策略R3和C3似乎吸引了两个参与人，因为当两参与人选择这个策略组合时，每个参与人将获得5单位的效用，这比表4.3.1所示博弈的任何策略组合都要好。然而，策略R3和C3都是劣策略，对于参与人I，R3是R1的严格劣策略；对于参与人II，C3是C1的严格劣策略。这些劣策略应该被剔除，这样，没有一个参与人想单独选择第三个策略。因此，表4.3.1和4.3.2表示的博弈有同样的纳什均衡和。

完美贝叶斯均衡的再精练颤抖手均衡2025/3/2246Selten（1975）将非均衡事件的发生解释为“颤抖”(tremble)：当一个参与人突然发现一个不该发生的事件发生时（即博弈偏离均衡路径），他把这个不该发生的事件的发生归结为某一个其他参与人的非蓄意错误。设想参与人知道想选择或避免哪个策略，但是，在最后时刻，做选择的手颤抖了并且意外地选择了其他策略。

完美贝叶斯均衡的再精练颤抖手均衡允许参与人有可能犯错误，结论如何？2025/3/2247完美贝叶斯均衡的再精练颤抖手均衡当有颤抖时，参与人I怎样才能够有更多的理由偏好表4.3.2中的而不是表4.3.1中的R1。当有颤抖时，参与人I有理由相信参与人II以一定的概率选择策略C3。当这发生时，如果参与人I选择R1，他将获得8单位；如果参与人I选择R2，他将得到-1单位。类似地，当参与人II预期参与人I的手可能颤抖而选择R3时，那么，他的最优反应是选择C1。因此，两参与人的选择结果为(R1,C1),即使颤抖从未发生（即，甚至R3和C3没有被选择）。这样，可能的颤抖帮助两参与人从两个均衡中选择一个。

帮助选择一个纳什均衡2025/3/2248完美贝叶斯均衡的再精练参与人I预测参与人II不会选择C3，因为后者是劣策略的。然而，他预测到参与人II将以正概率选择C1或C2。令表示参与人I预测到参与人II将选择C1的主观概率。因为参与人I预测到参与人II不选择C3，所以，他的完全预测是：参与人II以概率选择C1，以概率选择C2。那么，参与人I又将做什么呢？

颤抖手的临界频率不允许颤抖2025/3/2249完美贝叶斯均衡的再精练颤抖手均衡如果他选择策略R1，他将以概率获得支付4，以概率获得支付-1。这样，他选择获得的预期效用为

类似地，如果他选择R2，他的预期效用为

2025/3/2250完美贝叶斯均衡的再精练这样，当时，即,如果，参与人I将选择策略R1。换句话说，假设参与人I预测到参与人II将以小于的概率试图获得结果C2，参与人I将选择策略R1去获得结果(R1,C1)，参与人I获得的效用为4。

两个参与人也许在选择时犯错误，无意识地选择了第三个策略。令这个误差的概率为。从参与人I的角度看，参与人II错误地选择的概率为，不犯这样的错误的概率为。在不犯错误的情况下，他将以概率选择，以概率选择。这样，参与人II在可能犯错误的情况下，选择的概率为，选择的概率为，选择的概率为。参与人I的预期效用则调整为

允许颤抖2025/3/2251完美贝叶斯均衡的再精练颤抖手均衡为了看到犯错误（颤抖）的影响，考虑下面的例子，例如，假设参与人I预测到参与人II将以概率选择策略C1。从上面的式子可知，在没有颤抖的情况下，使得等于，这意味着参与人I对策略R1和R2是无差异的。然而，很容易看到，当颤抖变得可能时，预期效用平衡已经打破。对任意，当时，有，这样，参与人I将选择策略R1而不是策略R2。

2025/3/2252完美贝叶斯均衡的再精练颤抖手均衡为了进一步阐明颤抖手的作用，假设参与人I预期到一个稳定的（非颤抖的）参与人II以概率选择C1。在没有颤抖时，参与人I应该选择R2。然而，如果参与人I预测到参与人II将以大于（即）的概率错误地选择C3，那么，有。这样，参与人I将再次选择R1。一般地，当以概率颤抖地选择C3时，参与人I将选择R1当且仅当（ifandonlyif），即

2025/3/2253完美贝叶斯均衡的再精练颤抖手均衡定义4.3.4

在n人策略式表述博弈中，纳什均衡是一个颤抖手完美均衡，如果对于每一个参与人，存在一个严格混合策略序列使得下列条件满足：

（i）对于每个，；

（ii）对于每一个和，策略是对其他参与人策略组合的最优反应，即：对于任何可选择的混合策略，有

上述定义中关键的一点是必须是严格混合策略（即选择每一个纯策略的概率严格为正）。

2025/3/2254完美贝叶斯均衡的再精练颤抖手均衡定理4.3.2

在有限两人策略博弈中,一个策略组合是颤抖手完美均衡，当且仅当它是一个(混合策略)纳什均衡并且两个参与人的策略都不是弱劣的。定理4.3.2的结论对三个参与人的博弈不成立，如表4.3.3所示的博弈。在此博弈中纳什均衡非劣，但不是颤抖手均衡（因为只要参与人2和3分别赋足够小的正概率给和，则参与人1对的支付超过他对的支付）。在这个三人策略式博弈中，纳什均衡是颤抖手完美均衡。

2025/3/2255完美贝叶斯均衡的再精练颤抖手均衡表4.3.3

三人策略式博弈

LRT1,1,11,0,1B1,1,10,0,1

LRT1,1,00,0,0B0,1,01,0,02025/3/2256均衡概念之间的关系在有限博弈中（策略式或扩展式），至少存在一个在代理人策略式下的颤抖手均衡（Selten,1975)。一个颤抖手完美均衡是序贯的，但反之不一定成立；然而，对于一般的博弈来说，这两个概念是重合的（Kreps和Wilson,1982)。颤抖手完美均衡一定是序贯均衡，序贯均衡一定是完美贝叶斯均衡，完美贝叶斯均衡一定是子博弈完美均衡，而子博弈完美均衡一定是纳什均衡。2025/3/2257声誉效应KMRW声誉模型

考虑一个两时期的声誉模型。在第一时期，市场上有两家企业1和2。只有企业1（“在位者”）采取行动：“掠夺”或“和解”。在第二时期，只有企业2选择行动：“坚持”或“退出”。两参与人1的支付都为两个时期的支付和，博弈的扩展式表述见图4.4.1。

2025/3/2258声誉效应KMRW声誉模型图4.4.1

N11理智疯狂掠夺和解掠夺坚持退出坚持退出坚持退出222025/3/2259声誉效应KMRW声誉模型在图4.4.1中，，，即一家理智企业1喜欢采取的是和解行动而不是掠夺行动，但是，企业1更愿意成为一名垄断者，这样他每期得到的（垄断）利润是；表示企业1的类型是理智的先验概率，从而表示企业1的类型是疯狂的先验概率；在第一时期只有企业1行动，在第二时期，只有企业2行动，为两时期之间的贴现因子，每个参与人的支付由两部分组成，在前面乘以的表示第二时期的支付；疯狂的企业1总是选择掠夺，而理智的企业1在第二时期不会选择掠夺性策略，这是因为它没有理由在博弈的终点建立并维持声誉。

2025/3/2260声誉效应KMRW声誉模型

假设疯狂的类型总是选择掠夺行动。于是，我们要研究的有趣问题是，理智类型企业的行为是怎样的？从一个静态的观点来看，如果企业1是理智的，他应愿意在第一期采取和解行动。但是，如果它采取掠夺行动，也许会使企业2相信它的类型是疯狂的，这样就会引致企业2退出（由于），并因此使自己第二期的利润增加。

2025/3/2261声誉效应KMRW声誉模型不同类型的企业1在第一期中选择不同的行动。这里，它意味着，理智类型企业采取和解行动。在一个分离均衡中，在第二期，企业2具有完全信息：如果表示进入者在第二期（事后）关于在位者类型的后验推断，那么分离均衡2025/3/2262声誉效应KMRW声誉模型两种类型的企业1在第一时期选择相同的行动。这里，它意味着，理智类型企业采取掠夺行动。在一个混同均衡中，当观察到均衡行动时，企业2并不修正推断：这里可能还存在杂合或准分离均衡。举例而言，

声誉博弈中，理智类型企业1可以在“掠夺”和“和解”之间进行随机选择（即在分离与混同二者之间进行随机选择）。这时，我们有

混同均衡2025/3/2263声誉效应KMRW声誉模型（4.4.1）

让我们首先寻找分离均衡存在的条件。在这样一个均衡中，理智类型的企业1采取和解行动，并因此显示出自己的类型，得到利润；企业2采取坚持行动，这是因为它预计在第二期，。如果企业1采取掠夺行动，这就会使得企业2相信它是疯狂的，这时它将会得到。于是，分离均衡存在的一个必要条件是

2025/3/2264声誉效应KMRW声誉模型反过来，假定条件（4.4.1）是满足的。分离完美贝叶斯均衡由下面的策略和推断组成：理智的在位者采取和解行动，而进入者（正确地）预计到在位者是理智的并采取坚持行动；疯狂的在位者采取掠夺行动，而进入者（正确地）预计到在位者是疯狂的并采取退出行动。

2025/3/2265声誉效应KMRW声誉模型（4.4.2）

现在，考虑混合均衡存在的可能性。在这种情况下，两种类型企业1都采取掠夺行动。当掠夺行动被观察到时，就像我们所看到的那样，。理智类型的企业在第一期失去利润，它必须引致企业2采取退出行动（至少，企业2退出这一事件的概率充分大）。因此，企业2在第二时期的预期利润必须非正，即

2025/3/2266声誉效应KMRW声誉模型反过来，假设条件（4.4.2）成立。考虑下面的策略和推断：两种类型的企业1都采取掠夺行动，并且，当进入者观察到掠夺行动时，它的事后推断是，采取退出行动；当它观察到和

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

决策与博弈论第4章

文档简介

温馨提示

最新文档

评论

决策与博弈论第4章

文档简介

温馨提示

最新文档

评论

相关文档