不完全信息动态博弈课件资料_第1页
不完全信息动态博弈课件资料_第2页
不完全信息动态博弈课件资料_第3页
不完全信息动态博弈课件资料_第4页
不完全信息动态博弈课件资料_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主要内容 非合作博弈论2 完全信息静态信息博弈-纳什均衡3 完全信息动态搏弈-4 不完全信息静态博弈-贝叶斯纳什均衡5 不完全信息动态博弈-精练贝叶斯纳什均衡 子博弈精炼纳什均衡4 不完全信息动态博弈 精炼贝叶斯均衡 不完美信息博弈的精炼贝叶斯均衡 信号博弈成语故事:黔驴技穷-驴虎博弈 老虎通过不断试探来修正对毛驴的看法,每一步行动都是给定它的信念下最优的,毛驴也是如此。最终老虎将毛驴吃掉。 1 不完全信息动态博弈1 不完全信息动态博弈例,张三与李四的博弈张三恃强凌弱,第一次与李四见面,不知李四强弱。但对李四类型有先验概率0.8,0.2张三通过观察李四吃辣椒的数量修正李四强弱的看法(后验概率)

2、,并以此确定对李四的态度李四预测到这一点,即使生性懦弱,也会强迫自己吃辣椒,以传达对自己有利的信息。1 不完全信息动态博弈两种结果:懦弱李四不吃辣椒,强悍李四吃辣椒且吃的足够多,使得懦弱李四不敢模仿。张三能够区分李四类型并选择是否欺负李四。两类李四都吃同样多辣椒,张三不能从李四吃辣椒行为中推出自己的信息,维持对李四的类型的先验信念0.8,0.21 不完全信息动态博弈类型:自然首先选择参与人的类型,参与人自己知道,其他参与人不知道。-不完全信息行动:行动有先有后,后行动者能观测到先行动者的行动,但不能观测到其类型。-动态博弈但是,参与人行动是类型依存的,每个参与人的行动都传递有关自己类型的信息,

3、后行动者可以通过观察先行动者的行动来推测其类型并选择自己的最优行动。先行动者预测到自己的行动被后行动者利用,就会设法传递对自己最有利的信息。不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。 不进(9,0)(5,-1)进不进(9,0)(5,-1)进不进(9,0)(5,-1)进不进(7,0)(3, 1)进不进(7,0)(3,1)进不进(7,0)(3, 1)进在位者P=5P=4P=6进入者P=5P=4P=6N高低1-xx(2,0)(6,0)(7,0)(6,0)(9,0)(8,0)单阶段最优垄断价格古诺均衡下的价格在位者的价格选择中包含关于其类型的信息,进入者可据此修

4、正对在位者类型的先验信念在位者行动时必须考虑价格选择的信息效应第一阶段市场进入博弈2 基本思路T=2, 企业的行动选择是一个简单的静态博弈决策问题,但在第一阶段,情况要复杂得多:进入者是否进入依赖于它对在位者成本函数的判断:给定在位者是高成本时,进入者进入的净利润是1,低成本时进入者的利润是-1,当只当进入者认为在位者是高成本的概率大于1/2时,进入者才选择进入。但与静态博弈不同的是,在观测到在位者第一阶段的价格选择后,进入者可以修正对在位者成本函数的先验概率x,因为在位者的价格可能包含其成本函数的信息。价格P=4P=5P=6在位者高成本时的利润267在位者低成本时的利润6982 基本思路如:

5、低成本的在位者无论如何不会选p=6,因此,如果进入者观察到在位者选择了p=6,就可以推断在位者一定是高成本,选择进入是有利可图的。预测到p=6会招致进入者进入,即使高成本的在位者也可能不会选择p=6,而招致进入者的进入。问题核心:在位者必须考虑价格选择的信息效应,即不同的价格影响进入者的后验概率从而影响进入者的进入决策。2 基本思路一个非单阶段最优价格会减少现期利润,但如果它能阻止进入者进入,从而使在位者在第二阶段得到的是垄断利润而不是古诺均衡利润,如果垄断利润与古诺均衡利润的差距足够大,在位者选择一个非单阶段最优价格可能是最优的。 假定x1/2,下列战略组合是一个贝叶斯均衡:不论在位者选 择

6、什么价格,进入者总认为在位者是高成本的概率为 x*1/2,总是选择不进入;高成本在位者选择p=6,低成本在 位者选择p=5。 这个均衡是不合理的,因为它包含了一个不可置信威 胁:进入者不会修正对在位者成本函数的信念。价格P=4P=5P=6在位者高成本时的利润267在位者低成本时的利润6982 基本思路给定p=6不可能是低成本在位者的最优选择:如果在位者选择了p=6,进入者为什么仍然认为在位者是高成本的概率小于1/2呢?在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡概念中没有规定参与人如何修正自己的信念。2 基本思路 后续博弈:从每个信息集开始的博弈的剩余部分称为一个后续博弈。 后验信念:参

7、与人根据贝叶斯法则和均衡战略修正后验 概率一个“合理”的均衡应该满足如下要求:给定每一个参与人有关其他参与人类型的后验信念,参与人的战略组合在每一个后续博弈上构成贝叶斯均衡。2 基本思路精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯推断的结合。它要求:1、在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);2、给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;3、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。 后续战略:给定信息集开始的后续博弈的完备的行动规则3 贝叶斯法则在日常生活中,当面临不确定时,我们对某事件发生的可能性

8、有一个判断,然后,会根据新的信息来修正这个判断。统计学上,修正之前的判断称为“先验概率”修正后的判断称为“后验概率”贝叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。3 贝叶斯法则假定参与人的类型是独立分布的,参与人i有K个类型,有H个可能的行动,k和ah分别代表一个特定的类型和一个特定的行动。如果我们观察到i选择了ah,i属于k的后验概率是多少?3 贝叶斯法则 假定观测到一个人干了一件好事,那么这人是好人的后验概率是:人:好人(GP),坏人(BP) 事:好事(GT),坏事(BP) 一个人干好事的概率等于他是好人的概率p(GP)乘以好人干好事的概率p(GT|GP),加上他是坏人的

9、概率p(BP)乘以坏人干好事的概率p(GT|BP): ProbGT= p(GT|GP)* p(GP)+ p(GT|BP)* p(GT|BP)3 贝叶斯法则 假定我们认为这个人是好人的先验概率是1/2,观测到他干了好事之后如何修正他的先验概率依赖于他干的好事好到什么程度:1、是一件非常好的好事,坏人绝对不可能干,则p(GT| GP)=1 p(GT|BP)=02、这是一个非常一般的好事,好人会干,坏人也会干:p(GT|GP)=1 p(GT|BP)=13 贝叶斯法则 假定我们观测到他干了一件坏事,我们相信,好人绝对不会干坏事,那么可以肯定他绝对不是一个好人。 假定我们原来认为他是个坏人,大突然发现他

10、干了一件好事,我们如何看待呢?3、介于上述两种情况之间:好人肯定会干,但坏人可能会干也可能不会干:p(GT|GP)=1/2 p(GT|BP)=1/24 精炼贝叶斯均衡精炼贝叶斯均衡是一个战略组合s*()=(s1*(1),sn*(n)和一个后验概率组合 ,满足:(P)对于所有的参与人i,在每一个信息集h,存在 参与人的战略是序贯理性的,即在每个参与人的信息集中,给定这个人的信念以及其他参与人的战略,他在该信息集中的选择以及之后的行动是他在这些前提下的最优行动。(B) 是使用贝叶斯法则从先验概率pi(-ii),观测到的最优战略s*得到的。4 精炼贝叶斯纳什均衡精炼贝叶斯均衡是均衡战略和均衡信念的结

11、合,给定信念: 是使用贝叶斯法则从均衡战略和所观测到的行动得到的。因此,精练贝叶斯均衡是一个对应的不动点:x1/2,精炼贝叶斯均衡为:不论高成本和低成本,在位者选择p=5;进入者进入,当且仅当观察到 p=6(x(6)=1)高-在位者P=6进入者进入在位者利润:7+3高-在位者P=5进入者不进入在位者利润:6+7牺牲1单位换取4单位利润是合算的在位者P=5给定在位者的后验概率和战略低-在位者P=5进入者不进入在位者利润:9+9最优选择给定两类在位者都选p=5,进入者不能从观测到价格中得到任何信息,x(5)=(1*x)/(1*x+1*(1-x)=x1/2,进入的期望利润x(1)+(1-x)*(-1

12、)=2x-10,不进入的期望利润为0,因此不进入是最优的。混同均衡价格P=4P=5P=6高-在位者的利润267低-在位者的利润6984 精练贝叶斯纳什均衡混同均衡 因为两类在位者选择同样的价格,直观地讲,因为x1-p时,即p1/2时,2选择U。当p1-p时,即p1/2时,选择L当p1/2,( L ,U) p1/2时,(L ,U)信息集在均衡路径上当p1/2时,(R,D) 不在均衡路径上(0,0)1(1,3)(2,1)(0,0)(0,1)RLMUDUD2要求3:2对1的行动的判断符合各参与人的均衡策略,即要求“判断”是“参与人1选择L的概率p=1”(因为参与人1确实选择了L,而2选择也是在这样的

13、判断和参与人1的策略下做出的最优选择)。如果2判断p=0.25,与均衡的战略组合(L,U)矛盾要求4:在非均衡路径上的信息集处,“判断”由贝叶斯法则和参与人在此处可能有的均衡策略决定(0,0)1(1,3)(2,1)(0,0)(0,1)RLMUDUD2当p1/2时,(R,D) 不在均衡路径上p1-p2选择D,要求2“判断”1-p=1,即p=01选择M。2的判断与1的战略R不相一致。5 不完美信息博弈的精炼贝叶斯均衡p1-p3选择U的期望支付为p*1+(1-p)*2=2-p选择D的期望支付为 p*3+(1-p)*1=1+2p当p1/3的信念一致D3UL(0,1,1)(0,1,2)(3,3,3)(1

14、,2,1)U1R2FBD(2,0,0)1预测到后续博弈的均衡,因此1选择F精炼贝叶斯均衡为F,L,D;p1/3p1-pD3UL(0,1,1)(0,1,2)(3,3,3)(1,2,1)U1R2FBD(2,0,0)考察战略组合(B,L,U;p=0)是否为精炼贝叶斯均衡精炼贝叶斯均衡要求:3在非均衡路径的信息集上的“判断”也必须与2的均衡战略L吻合。3的信息集不在均衡路径上。这一组战略及推断也满足要求l到3(要求3自动满足)。 练习1:D3UL(3,3,0)(2,2,2)(5,5,0)(4,4,4)U1R2FBD(1,1,1)找出该博弈的精炼贝叶斯均衡答案:(F,R,D;p2/5)练习21UB23R

15、L(3,2,0)(3,2,2)(6,5,0)(1,1,1)(4,4,4)MZYZY(2,3,1)(5,4,3)ZY2贝叶斯法则如何应用?假定1、2采取混合策略1/32/33/41/4 当3观察到博弈进入到信息集,那么,他处在左边决策结的后验概率是?D3UL(3,3,0)(2,2,2)(5,5,0)(4,4,4)U1R2FBD(1,1,1)6 信号博弈动机和例子 1994年,比尔盖茨以3000万美元的价格购买了达芬奇的哈默手稿。传记作家麦克尔怀特问他为什么要这样做,盖茨苦笑道:“因为我需要它。” 拍卖前不知道哈默手稿对盖茨值多少以及他愿意出多少买。 盖茨可能为一个真正的狂热爱好者,也可能为一个并

16、非痴迷的文物迷 如果盖茨是后者,那么他有动机让拍卖方知道这一点,从而得到一个较低的开价6 信号博弈这些类型的参与人希望把自己的信号传递给不知道的参与人。另一方面,哈默手稿真正的狂热爱好者恰好有相反的动机,即不希望自己的私有信息让对方知晓。当某些类型的参与人希望将自己的类型告诉对手时,这类参与人可以选择发送某种信号使自己与其他类型的参与人区分开,实现“分离均衡”。信号必须可信。6 信号博弈例:名人广告代言 厂商A、B开发新产品。A产品质量好,B产品质量差,为私有信息,消费者不知道。 A请大明星做打广告,支付巨额广告费。 B不敢请大明星:A 出的价钱高到B不敢模仿。 消费者知道这一点,踊跃购买,增

17、加了A的市场回报,鼓励了A花大价钱做广告。 广告支付将有实力的厂商与实力较小的厂商区分开来,实现分离均衡。6 信号博弈信号博弈是一种特殊的不完全信息动态博弈信号模型已被十分广泛地应用于经济学领域。 如,spence (1973)文凭信号模型通常描绘二参与人之间的两阶段不完全信息动态博弈:先行动者类型不为后行动者知道,而他只知道先行动者类型的先验概率分布后行动者试图从他所观察到的先行动者的行动中对其类型进行概率判断(形成后验信念),并选择最优行动。先行动者预测到自己的行动中包含关于自己类型的信息,有动机告诉后行动者真实类型,或者试图欺骗后行动者。6 信号博弈先行动者可直接告诉后行动者自己类型,但

18、后行动者不会相信。如果要让后行动者相信,必须做出一种努力(使自己付出成本),该成本是其他类型的先行动者不能模仿的称成本支付为一种信号。通过该信号,先行动者能够告诉后行动者自己的真实类型6 信号博弈自然按照概率分布 为发送者S从一个可行类型空间中选取类型 ;发送者S观察到自己的类型后,从一个可行信号集 中选取一个发送信号;接收者R观察到信号 ,然后从可行行动集中 选择一个行动 ;双方获得各自支付 和 。 信号博弈一般化:它包含两个参与者:发送者(记为S )与接收者(记为R )。博弈的时间顺序如下:6 信号博弈信号博弈的所有可能的精练贝叶斯均衡可划分为3类:分离均衡:不同类型的发送者(参与人1)以

19、1的概率选择不同的信号,或者说,没有任何类型选择与其他类型相同的信号在分离均衡下,信号准确地揭示出类型。混同均衡:不同类型的发送者选择相同的信号,或者说,没有任何类型选择与其他类型不同的信号,因此,接收者不修正先验概率。准分离均衡:一些类型的发送者随机地选择信号,另一些类型的发送者选择特定的信号。 1LR不B(1,2)(1,0)AB(0,1)(2,4)AB(0,0)(2, 1)AB(4,0)(1,3)A2LRNT1T20.50.5N首先以0.5,0.5选择1的类型T1,T2 6 信号博弈1观察到自己类型后从信号集L, R中进行选择2观察到1的信号,然后从A,B中选择行动。6信号博弈0.50.5

20、T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)分离均衡(separating equilibrium):不同类型的参与人发送不同信号混同均衡(pooling equilibrium):不同类型的参与人发送相同信号准分离均衡(semi-equilibrium):一些类型的发送者随机选择信号,另一些类型发送者选择特定信号0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)信号要求1 2在观察到任何信号之后,接收者必须对哪些类型可能会发送持有一个推断后验概

21、率。 p1-pq1-q信号要求2R 给定后验概率,接受者的行动选择应满足期望支付最大化序贯理性信号要求2S:在给定接收者战略的条件下,发送者选择的信号必须使发送者的支付最大化。-序贯理性信号要求3 后验概率根据贝叶斯法则和发送者的战略形成 hf0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)p1-pq1-q混同均衡(L,L)由贝叶斯法则得(p,1-p)=(0.5,0.5)在该后验概率和(L,L)下,2选择AT1、T2是否有积极性发送L?需要确定如果T1、T2发出信号R ,2的反应以及在该反应下1的支付如果2对信号R

22、的反应是选择B,T1的支付0; T2支付为1如果2对R反应是B,则T1、T2有积极性发送L如果2对信号R的反应是选择A,T1的支付2; T2支付为1如果2对信号R的反应是A,类型T1的发送者愿意发出信号R hf0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)p1-pq1-q对于假设存在混同均衡(L,L),成立的条件是2对于1发送L的信号的反应是选择A,对发送R的信号的反应是B2均衡策略为(A,B)2对信号R的反应是选择B的条件是:1*q+0(1-q)0*q+2(1-q)q2/3精炼贝叶斯均衡为一个精炼贝叶斯均衡的表

23、达中既要写出参与人在信息集上的行动选择,也同时表明他在信息集上的信念0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)p1-pq1-q混同均衡(R,R)由贝叶斯法则得(q,1-q)=(0.5,0.5)2对于信号R的反应是选择B类型为T1的1支付为0,类型为T2的1支付为12对L的最优反应是A(无论p为多少),此时T1支付为1,T2支付为2(R,R)不可能称为混同均衡0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)p1-pq1-q分离均衡(

24、L,R)2的两个信息集都在均衡路径上,于是p、q都由贝叶斯法则与发送者的策略确定p=1,q=0 给定p=1,2对于信号L的反应是选择A;给定q=0,2对于信号R 的最优反应是选择BT1、T2支付均为1给定2的最优战略(A,B),T2有积极性偏离R的策略不存在分离均衡(L,R)0.50.5T1T2LRLR2ABBA(1,3)(4,0)(2,4)(0,1)A2BBA(2,1)(0,0)(1,0)(1,2)p1-pq1-q分离均衡(R,L)由贝叶斯法则,得到p=0,q=1给定p=0,2对于信号L的反应是选择A;给定q=1,2对于信号R 的最优反应是选择AT1、T2支付均为2给定2的最优战略(A,A)

25、,T1、T2均无积极性偏离(R,L)(R,L),(A,A),p=1,q=1为精炼贝叶斯均衡6 信号博弈解释现象:现实中的垄断企业并没有按照微观经济学给出的最优垄断价格(即边际成本等于边际收益的价格)定价,而是低于该最优垄断价格。一种解释:垄断企业故意定低价,以限制潜在企业进入。缺陷:忽略了信息不对称的关键条件,如果潜在进入者知道在位者的成本函数,那么会识破“故意”定低价的诡计,而进入参与竞争,分享利润。博弈解释:潜在进入者并不知道在位者的成本函数(这是合理的,因为“外行”不懂“内行”),在位者通过低价来向潜在进入者传递自己低成本的信号。 垄断限价模型(Milgrom & Roberts ,1982)6信号博弈局中人:企业1在位者,企业2进入者企业1的战略:第一阶段,选择价格p1;第二阶段,若对手没有进入,选择垄断价格,否则选择古诺博弈均衡价格。企业2的战略:看到企业1第一阶段的定价之后,决定第二阶段是否进入,如进入,与企业1进行古诺博弈。不完全信息假定:企业1有两种类型,高成本H的先验概率为u(H),低成本L的先

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论