不完全信息动态博弈

上传人：1*** IP属地：湖北上传时间：2024-05-21 格式：PPT 页数：40 大小：448KB 积分：4.8 举报 版权申诉

已阅读5页，还剩35页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

不完全信息动态博弈精炼贝叶斯均衡不完美信息博弈的精炼贝叶斯均衡信号博弈一、精炼贝叶斯均衡不完全信息博弈“自然”选择参与人类型，参与人自己知道，其他参与人不知道；自然选择之后，参与人开始行动，行动有先后顺序，后行动者能观察到先行动者的行动，但不能观察到先行动者类型。（先行动者行动类型依存，每个参与人行动都传递着关于自己类型的某种信息）后行动者通过观察先行动者的行动来推断其类型或修正对其类型的先验信念（概率分布），然后选择自己的行动。一、精炼贝叶斯均衡先行动者预测自己的行动将被后行动者所利用，就会设法传递对自己最有利的信息，避免传递对自己不力的信息。——博弈过程不仅是选择行动的过程，也是参与人修正信念的过程。例，张三与李四的博弈张三恃强凌弱，第一次与李四见面，不知李四强弱。但对李四类型有先验概率{0.8.0.2}张三通过观察李四吃辣椒的数量修正李四强弱的看法（后验概率），并以此确定对李四的态度一、精炼贝叶斯均衡李四预测到这一点，即使生性懦弱，也会强迫自己吃辣椒，以传达对自己有利的信息。两种结果：——懦弱李四不吃辣椒，强悍李四吃辣椒且吃的足够多，使得懦弱李四不敢模仿。张三能够区分李四类型并选择是否欺负李四。——两类李四都吃同样多辣椒，张三不能从李四吃辣椒行为中推出自己的信息，维持对李四的类型的先验信念{0.8，0.2}

不进(9,0)(5,-1)进不进(9,0)(5,-1)进不进(9,0)(5,-1)进不进(7,0)(3,1)进不进(7,0)(3,1)进不进(7,0)(3,1)进在位者P=5P=4P=6进入者P=5P=4P=6N高低1-θθ(2,0)(6,0)(7,0)(6,0)(9,0)(8,0)单阶段最优垄断价格古诺均衡下的价格完全信息条件下，若在位者高成本——“进入”；若在位者低成本——不进入假设低成本在位者不会选择P=6，结果会怎样？在位者的价格选择中包含关于其类型的信息，进入者可据此修正对在位者类型的先验信念→在位者行动时必须考虑价格选择的信息效应θ<1/2，下列战略组合是一个贝叶斯均衡：不论在位者选择什么价格，进入者总是认为在位者高成本概率为θ*<1/2

，总是选择不进入；高成本在位者选择p=6,低成本在位者选择p=5。该均衡是否合理？——均衡中包含不可置信的战略。一个合理均衡应满足如下要求：给定每个参与人有关其他参与人类型的后验信念，参与人的战略组合在每个后续博弈上构成贝叶斯均衡。后验信念：参与人根据贝叶斯法则和均衡战略修正后验概率后续博弈：从每个信息集开始的博弈的剩余部分称为一个后续博弈。一、精炼贝叶斯均衡引入精炼贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡，这和子博弈精炼纳什均衡强化了纳什均衡是相同的。如果参与者的战略要成为博弈的一个精炼贝叶斯均衡，它们不仅必须是整个博弈的贝叶斯纳什均衡，而且还必须构成每一个后续博弈的贝叶斯纳什均衡。如果参与者的战略要成为一个子博弈精炼纳什均衡，则它们不仅必须是整个博弈的纳什均衡，还必须是其中每一个子博弈的纳什均衡。精炼贝叶斯均衡是对贝叶斯均衡的精炼，也是子博弈思想在不完全信息博弈中的推广，它本身是纳什均衡。二、不完美信息博弈的精炼贝叶斯均衡1(1,3)(2,1)(0,2)(0,1)LMRUBUB2(0,0)二、不完美信息博弈的精炼贝叶斯均衡1，31，32，1

0，20，00，11LM2UBR该博弈存在两个纯战略NE:（M,U）;(L,B)（M,U）;(L,B)同样是子博弈精炼纳什均衡

(L,B)却又明显要依赖于一个不可信的威胁：如果轮到参与者2行动，则选择U优于选择B，1便不会由于2威胁他将在其后的行动中选择B，而去选择L在信息完全但不完美的博弈中，尽管(L,B)是SPNE，它依赖一个不可信的空头威胁，应该从合理的预测中排除。

精炼贝叶斯均衡要求1：在每一信息集中，应该行动的参与者必须对博弈进行到该信息集中的哪个节有一个推断。对于非单节信息集，推断是在信息集中不同节点的一个概率分布；对于单节的信息集，参与者的推断就是到达此单一决策节的概率为l。要求2：给定参与者的推断，参与者的战略必须满足序贯理性的要求。即在各个信息集，给定该信息集上概率分布和其他参与人的后续策略，参与人的行动必须是最优的。(0,0)p1-p参与人2在自己信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”。给定该信念，2的行动必须是最优的（给定该信念，2的战略选择在后续博弈上构成贝叶斯均衡）。2选择U的期望支付为1*p+2*(1-p)=2-p2选择B的期望支付为0*p+1*(1-p)=1-p<2-p2选择U。给定2的后续战略（1知道2选择U），1的最优选择是M1(1,3)(2,1)(0,2)(0,1)LMRUBUB22如果观察到1没有选择L，则2一定知道1选择了M，于是有p=1要求3：在处于均衡路径之上的信息集中，推断由贝叶斯法则及参与者的均衡战略给出。定义

：对于一个给定的扩展式博弈中的均衡，如果博弈按照均衡战略进行时将以正的概率达到某信息集，我们称此信息集处于均衡路径之上。反之，如果博弈根据均衡战略进行时，肯定不会达到某信息集，我们称之为不在均衡路径上的信息集。(其中“均衡”可以是纳什、子博弈精炼、贝叶斯以及精炼贝叶斯均衡)p1-p1(1,3)(2,1)(0,2)(0,1)LMRUBUB2均衡(M,U)中，2的推断一定是：给1的均衡战略M，参与者2知道已经到达了信息集中的哪一个节，即p=1。设想存在一个混合战略均衡，其中参与者1选择M的概率为q1，R的概率为q2，选择R的概率为1-q1-q2

。要求3则强制性规定参与者2的推断必须为q1/(q1+q2)。精炼贝叶斯均衡为{M,U；p=1}精炼贝叶斯均衡是均衡战略和均衡信念的结合2的信息集在均衡路径上(0,0)p1-p3选择U的期望支付为p*1+(1-p)*2=2-p选择D的期望支付为p*3+(1-p)*1=1+2p当p<1/3时选择U，当p>1/3时选择D对于2而言，R是严格劣战略，因此2选择L与3p>1/3的信念一致D3UL(0,1,1)(0,1,2)(3,3,3)(1,2,1)U1R2FBD(2,0,0)对于2而言，R是严格劣战略，因此2选择L与3p>1/3的信念一致1预测到后续博弈的均衡，因此1选择F精炼贝叶斯均衡为{F,L,D;p≥1/3}p1-pD3UL(0,1,1)(0,1,2)(3,3,3)(1,2,1)U1R2FBD(2,0,0)考察战略组合（B，L，U；p=0）是否为精炼贝叶斯均衡精炼贝叶斯均衡要求:3在非均衡路径的信息集上的“判断”也必须与2的均衡战略L吻合。3的信息集不在均衡路径上。战略组合（B,L,U）是一NE，没有参与人愿意单独偏离这一结果这一组战略及推断也满足要求l到3（要求3自动满足）。要求4：对不在均衡路径上的信息集，推断由贝叶斯法则以及可能情况下的参与者的均衡战略决定。精炼贝叶斯均衡要求：在每个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布（信念）；给定该信息集上的概率分布和其他参与人的后续战略，参与人的行动必须是最优的；每一个参与人根据贝叶斯法则和均衡战略修正后验概率。贝叶斯选择最优战略寻求最大期望效用从观察到的信息不断更新信念精炼剔除不可置信的承诺和威胁行动是可信的，信念是合理的精炼贝叶斯在每一个决策点上都有一个合理信念(先验概率)时刻采取在给定信念(后验概率)下最优的行动根据观察到的行动不断更新信念(根据贝叶斯法则由先验概率形成后验概率)练习1UB23RL(3,2,0)(3,2,2)(6,5,0)(1,1,1)(4,4,4)MZYZY(2,3,1)(5,4,3)ZY2练习解答答案((L,Z),P(M)>0.5)均衡路径与非均衡路径均衡路径：各个局中人选择实施的行为所构成的路径非均衡路径：各个局中人没有选择实施的行为所构成的路径不但要给出均衡路径上的行为选择和信念，而且要给出非均衡路径上的行为选择和信念无论在均衡路径上还是在非均衡路径上，最优行为选择都是追求最大期望效用，信念都要合理三、信号博弈信号博弈是一种特殊的不完全信息动态博弈信号模型已被十分广泛地应用于经济学领域。如，spence(1973)文凭信号模型通常描绘的是二个参与人之间的两阶段不完全信息动态博弈。先行动者类型不为后行动者知道，而他只知道先行动者类型的先验概率分布。后行动者试图从他所观察到的先行动者的行动中对其类型进行概率判断（形成后验信念），并选择最优行动。先行动者预测到自己的行动中包含关于自己类型的信息，有动机告诉后行动者真实类型，或者试图欺骗后行动者。三、信号博弈先行动者可直接告诉后行动者自己类型，但后行动者不会相信。如果要让后行动者相信，必须做出一种努力（使自己付出成本），该成本是其他类型的先行动者不能模仿的——称成本支付为一种信号。通过该信号，先行动者能够告诉后行动者自己的真实类型例，企业金融市场融资，但投资者对真实赢利能力不了解。真正高赢利能力的企业可以通过向投资者支付较高的权益份额来区分自己和低赢利能力的企业，从而让投资者识别自己的真实类型而投资。另一方面，低赢利能力企业对自己真实赢利能力是清楚的，不敢模仿高赢利能力企业，只能承诺低权益份额，投资者不会投资。三、信号博弈信号博弈一般化：它包含两个参与者：发送者(记为S)与接收者(记为R)。博弈的时间顺序如下：自然按照概率分布为发送者S从一个可行类型空间中选取类型；发送者S观察到自己的类型后，从一个可行信号集中选取一个发送信号；接收者R观察到信号，然后从可行行动集中选择一个行动；双方获得各自支付和。

1LR不B(1,2)(1,0)AB(0,1)(2,4)AB(0,0)(2,1)AB(4,0)(1,3)A2LRNT1T20.50.5①N首先以{0.5,0.5}选择1的类型{T1,T2}三、信号博弈②1观察到自己类型后从信号集{L,R}中进行选择③2观察到1的信号，然后从{A,B}中选择行动。三.信号博弈Ｎ0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)分离均衡（separatingequilibrium）:不同类型的参与人发送相同信号混同均衡（poolingequilibrium）:不同类型的参与人发送相同信号准分离均衡（semi-equilibrium）:一些类型的发送者随机选择信号，另一些类型发送者选择特定信号Ｎ0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)信号要求12在观察到任何信号之后，接收者必须对哪些类型可能会发送持有一个推断——后验概率。p1-pq1-q信号要求2R

给定后验概率，接受者的行动选择应满足期望支付最大化——序贯理性信号要求2S：在给定接收者战略的条件下，发送者选择的信号必须使发送者的支付最大化。-序贯理性信号要求3

后验概率根据贝叶斯法则和发送者的战略形成hfＮ0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)p1-pq1-q混同均衡（L,L）由贝叶斯法则得(p,1-p）=(0.5,0.5)在该后验概率和（L,L）下，2选择AT1、T2是否有积极性发送L？需要确定如果T1、T2发出信号R，2的反应以及在该反应下1的支付如果2对信号R的反应是选择B，T1的支付0；T2支付为1如果2对R反应是B，则T1、T2有积极性发送L如果2对信号R的反应是选择A，T1的支付2；T2支付为1如果2对信号R的反应是A，类型T1的发送者愿意发出信号RhfＮ0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)p1-pq1-q对于假设存在混同均衡（L,L），成立的条件是2对于1发送L的信号的反应是选择A，对发送R的信号的反应是B——2均衡策略为（A,B）2对信号R的反应是选择B的条件是：1*q+0（1-q）<0*q+2(1-q)q<2/3精炼贝叶斯均衡为一个精炼贝叶斯均衡的表达中既要写出参与人在信息集上的行动选择，也同时表明他在信息集上的信念Ｎ0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)p1-pq1-q混同均衡（R,R）由贝叶斯法则得(q,1-q）=(0.5,0.5)2对于信号R的反应是选择B类型为T1的1支付为0，类型为T2的1支付为12对L的最优反应是A（无论p为多少），此时T1支付为1，T2支付为2（R,R）不可能称为混同均衡Ｎ0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)p1-pq1-q分离均衡（L,R）2的两个信息集都在均衡路径上，于是p、q都由贝叶斯法则与发送者的策略确定p=1,q=0给定p=1，2对于信号L的反应是选择A;给定q=0，2对于信号R的最优反应是选择BT1、T2支付均为1给定2的最优战略（A,B），T2有积极性偏离R的策略不存在分离均衡（L,R）Ｎ0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)p1-pq1-q分离均衡（R,L）由贝叶斯法则,得到p=0，q=1给定p=0，2对于信号L的反应是选择A;给定q=1，2对于信号R的最优反应是选择AT1、T2支付均为2给定2的最优战略（A,A），T1、T2均无积极性偏离(R,L)[(R,L),(A,A),p=1,q=1]为精炼贝叶斯均衡三、信号博弈垄断限价模型（Milgrom&Roberts，1982)解释现象：现实中的垄断企业并没有按照微观经济学给出的最优垄断价格(即边际成本等于边际收益生成的价格)定价，而是低于该最优垄断价格。一种解释：垄断企业故意定低价，以限制潜在企业进入。缺陷：忽略了信息不对称的关键条件，如果潜在进入者知道在位者的成本函数，那么会识破“故意”定低价的诡计，而进入参与竞争，分享利润。博弈解释：潜在进入者并不知道在位者的成本函数(这是合理的，因为“外行”不懂“内行”)，在位者通过低价来向潜在进入者传递自己低成本的信号。三、信号博弈基本模型I局中人：企业1—在位者，企业2—进入者企业1的战略：第一阶段，选择价格p1；第二阶段，若对手没有进入，选择垄断价格，否则选择古诺博弈均衡价格。企业2的战略：看到企业1第一阶段的定价之后，决定第二阶段是否进入，如进入，与企业1进行古诺博弈。不完全信息假定：企业1有两种类型，高成本H的先验概率为u(H)，低成本L的先验概率为u(L)。三、信号博弈基本模型II企业1选择价格p时的短期垄断利润为或，其为严格凹函数。设和为最优垄断价格，则，小于

用和表示企业1和企业2在第二阶段的利润，并且，这样博弈才有意义。贴现因子为。三、信号博弈分离均衡企业2准确地知道企业1是高成本的还是低成本的，并且在高成本时进入，而在低成本时不进入高成本在位者肯定会选，并且进入者一定会进入，那么

高成本在位者的总利润为

设此时低成本在位者的定价为，高成本者不模仿定价，要求

人人文库> 全部分类> 图纸下载 > 毕业设计

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

不完全信息动态博弈

文档简介

温馨提示

最新文档

评论

不完全信息动态博弈

文档简介

温馨提示

最新文档

评论

相关文档