版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章
完全信息动态博弈第1页在完全信息动态博弈中,博弈参加者行动存在先后次序。能够用博弈树表示完全信息动态博弈。能够经过逆向归纳法求解完全信息动态博弈子博弈精炼纳什均衡,剔除不可置信威胁。第2页第一节完全信息动态博弈概述一、完全信息动态博弈定义在完全信息静态博弈中,博弈参加者同时采取行动。但在完全信息动态博弈中,博弈参加者行动存在先后次序。从信息角度上,完全信息动态博弈与完全信息静态博弈类似,博弈参加者对博弈结构、博弈次序、双方收益等信息都具备完全了解。第3页二、博弈树在动态博弈中,因为博弈参加者行动存在先后次序,所以能够用更形象方法来表示动态博弈:博弈树(GameTree)。经过支付矩阵形式表示博弈通常被称为策略型或正则型博弈(NormalFormGame)。经过博弈树表示博弈通常被称为扩展型博弈(ExtensiveFormGame)。第4页动态市场争夺战博弈扩展型表示方式如图所表示“市场争夺战”博弈扩展型表示形式第5页1.博弈树组成要素(1)博弈参加者(2)行动次序:在动态博弈中,博弈参加者行动存在先后次序。(3)行动策略空间(ActionSet):指博弈参加者能够采取全部可能策略。(4)信息集(InformationSet):指博弈参加者在博弈过程中所知道信息。(5)支付函数指博弈参加者采取特定策略与所能得到收益之间关系。第6页2.博弈树结构(1)博弈树结构方法首先行动一方位于博弈树最上端,依据动态博弈过程中各方行动次序,博弈数自上至下延展。也有学者习惯自左至右结构博弈树。横向博弈树第7页博弈树中包含若干“节点”,节点用小圆圈表示。位于博弈树最上端节点称为“初始节点”。初始节点用空心小圆圈表示,其它节点均用实心小圆圈表示。在每个节点处均对应某个博弈参加者,将节点对应博弈参加者标识在节点旁边。比如:在“市场争夺战”博弈中,因为潜在进入者先行动,所以初始节点处对应博弈参加者为潜在进入者。将潜在进入者标识在博弈树初始节点旁边。当潜在进入者决议之后,轮到在位者进行决议。在位者所在节点称为“后续节点”。在位者位于两个后续节点上。在位者都有两种策略选择:“斗争”和“默许”。第8页假如初始节点处博弈参加者存在N种策略,那么就从初始节点处罚出N条路径。路径用线段表示。在线段旁注明对应策略。在“市场争夺战”博弈中,首先行动潜在进入者能够采取两种策略:“不进入”和“进入”。所以,从初始节点处引出两条线段,在两条线段旁分别标识“不进入”和“进入”。当潜在进入者选择结束后,到达在位者节点。在位者有两个选择:“斗争”和“默许”。所以,从在位者节点处引出两条线段,在两条线段旁分别标识“斗争”和“默许”。第9页当博弈不再有后续节点时,需要将博弈收益标识在博弈树末端。将博弈参加者收益放在括号里。需要注意是:各博弈参加者收益需要按照各参加者行动次序进行排列。先行动博弈参加者收益写在左边,依次类推,从左到右,最终行动博弈参加者收益写在最右边。各个博弈参加者收益之间用逗号分割。第10页(2)博弈树与博弈次序博弈树各节点之间存在次序关系,博弈树由上至下节点次序表示各博弈参加者进行决议次序。第11页从博弈树节点能够引出多条线段,但不能从博弈树多个节点共同抵达博弈树下方同一个后续节点。错误博弈树结构方法第12页正确博弈树结构方法正确博弈树结构方法第13页结构博弈树时只能按照由上至下路径,而不能存在由下向上路径,也不能形成循环路径。回溯路径唯一性在求解完全信息动态博弈时非常主要。因为在求解动态博弈均衡时,一个很主要方法是“逆向归纳法(BackwardInduction)”。只有首先确保从博弈树任何最终节点向上回溯时路径唯一,才能确保逆向归纳法可操作性。第14页正确博弈树结构方法正确博弈树结构方法第15页错误博弈树结构方法错误博弈树结构方法第16页三、信息集与三人罢工博弈在完全信息动态博弈中,假如将博弈树多个节点用虚线连接起来,表明这多个节点位于同一个博弈信息集中。也就是说:博弈参加者不知道自己位于同一个信息中哪个博弈节点上。能够经过“三人罢工博弈”来说明信息集含义以及信息集在动态博弈中主要性。第17页1.三人罢工博弈定义三人罢工博弈博弈树第18页2.三人罢工博弈策略选择与信息员工2只有一个信息集博弈树第19页员工3不能观察到员工2决议策略第20页员工3不知道员工1决议策略第21页员工3不知道员工1和员工2决议策略第22页三名员工都只有一个信息集博弈第23页四、博弈树与静态博弈博弈树方法不但能表示动态博弈,还能表示静态博弈。所谓“博弈先后次序”,它主要是一个信息概念,而不是一个纯时间先后概念。用博弈树表示囚徒困境第24页下面三种博弈表示方式所表示博弈内涵相同嫌疑人乙坦白不坦白嫌疑人甲坦白(5,5)(1,10)不坦白(10,1)(2,2)第25页第二节完全且完美信息动态博弈概述在完全且完美信息动态博弈(DynamicGamewithPerfectandCompleteInformation)中,每个博弈参加者均知道在自己之前进行决议参加者选择策略和博弈结构。博弈树中每个节点都独立组成一个信息集,没有虚线连接两个或多个博弈树节点。求解完全且完美信息动态博弈主要方法之一是:逆向归纳法。能够经过“海盗分宝博弈”这个生动有趣故事对“逆向归纳法”进行一个直观介绍。第26页一、海盗分宝博弈1.海盗分宝博弈规则五个海盗首先进行抽签,确定决议次序。五个海盗按照决议次序依次提出对100个金币分配方案。第一个海盗提出一个分配方案,如超出半数海盗(包含提出分配方案海盗)同意第一个海盗分配方案,即大于等于3名海盗同意第一个海盗分配方案时,那么该方案被经过,博弈结束。假如第一个海盗提出分配方案没有得到超出半数海盗同意,那么第一个海盗将被扔到海里喂鲨鱼。接下来由第二个海盗提出分配方案,假如超出半数海盗同意第二个海盗分配方案时,那么该方案被经过,博弈结束。第27页假如第二个海盗提出分配方案没有得到超出半数海盗同意,那么第二个海盗也将被扔到海里喂鲨鱼。接下来由第三个海盗提出分配方案,假如超出半数海盗,即大于等于2名海盗,同意第三个海盗分配方案时,那么该方案被经过,博弈结束。假如第三个海盗提出分配方案没有得到超出半数海盗同意,那么第三个海盗也将被扔到海里喂鲨鱼。接下来由第四个海盗提出分配方案。假如超出半数海盗同意第四个海盗分配方案时,那么该方案被经过,博弈结束。第28页假如第四个海盗提出分配方案没有得到超出半数海盗同意,那么第四个海盗也将被扔到海里喂鲨鱼。这时就只剩下第五个海盗了,第五个海盗将独吞抢劫来100个金币,博弈结束。在这种分配规则下,第一个海盗将提出怎样分配方案?第一个海盗提出分配方案需要满足两个条件。第一,确保超出半数海盗同意第一个海盗分配方案。第二:第一个海盗最大化自己能分到金币。假如直接从第一个海盗决议策略入手,此问题相对复杂。不妨从第五个海盗入手,然后按照从后向前次序依次逆向考查海盗策略选择。第29页2.求解海盗分宝博弈均衡第一个海盗将提出怎样分配方案?此分配方案在确保能得到超出半数海盗同意前提下应最大化第一个海盗利益。轮次分配方案提出者分配方案最终一轮海盗5自己独吞全部100个金币倒数第二轮海盗4任何分配方案都得不到经过倒数第三轮海盗3分配给第三个海盗100个金币,第四个海盗0个金币,第五个海盗0个金币。倒数第四轮海盗2分配给自己98个金币,第三个海盗0个金币,第四个海盗1个金币、第5个海盗1个金币。经过逆向归纳法推导出财宝分配方案第30页3.海盗分宝博弈均衡第一个海盗分配方案能够有两种。分配方案1:分配给自己97个金币,给第二个海盗0个金币,给第三个海盗1个金币,给第四个海盗2个金币,给第五个海盗0个金币。分配方案2:分配给自己97个金币,给第二个海盗0个金币,给第三个海盗1个金币,给第四个海盗0个金币,给第五个海盗2个金币。假如第一个海盗提出分配方案1,那么第二个海盗和第五个海盗将反对,而第一个、第三个和第四个海盗将同意,所以第一个海盗提议将取得经过。假如第一个海盗提出分配方案2,那么第二个海盗和第四个海盗将反对,而第一个、第三个和第五个海盗将同意,所以第一个海盗提议将取得经过。第31页二、扩展形式博弈策略表示方式1.将扩展形式博弈改写为策略形式动态博弈扩展表示形式第32页参加者2UV参加者1L(a1,b1)(a2,b2)R(a3,b3)(a4,b4
)错误动态博弈策略表示形式第33页参加者2(U,U)(U,V)(V,U)(V,V)参加者1L(a1,b1)(a1,b1)(a2,b2)(a2,b2)R(a3,b3)(a4,b4)(a3,b3)(a4,b4)动态博弈策略表示形式第34页参加者2(U,U,U)(U,U,V)(U,V,U)(U,V,V)(V,U,U)(V,U,V)(V,V,U)(V,V,V)参加者1L(a1,b1)(a1,b1)(a1,b1)(a1,b1)(a2,b2)(a2,b2)(a2,b2)(a2,b2)M(a3,b3)(a3,b3)(a4,b4)(a4,b4)(a3,b3)(a3,b3)(a4,b4)(a4,b4)R(a5,b5)(a6,b6)(a5,b5)(a6,b6)(a5,b5)(a6,b6)(a5,b5)(a6,b6)动态博弈扩展表示形式动态博弈策略表示形式第35页2.扩展形式转化为策略形式时规律参加者1纯策略空间为:参加者2纯策略空间为:参加者3纯策略空间为:第36页参加者2纯策略空间为:参加者1纯策略空间为:第37页第三节子博弈与逆向归纳法在图中,用虚线框起来部分称作一个子博弈(Sub-Game)。第38页一、子博弈子博弈是原始动态博弈一部分。子博弈包含博弈所需各种信息,能独立组成一个博弈。一个博弈子博弈需要满足四个条件。1.子博弈起始节点不能是原来博弈起始节点2.子博弈不能分割信息集3.有些博弈包含多个子博弈4.有些博弈没有子博弈第39页二、逆向归纳法1.逆向归纳法定义和求解方法逆向归纳法指:在求解动态博弈时,首先找到博弈次序在最终子博弈,找到子博弈中博弈参加者策略选择,然后按博弈次序由后向前逆向归纳,直至博弈树初始节点,从而找到博弈均衡。第40页1.逆向归纳法定义和求解方法逆向归纳法指:在求解动态博弈时,首先找到博弈次序在最终子博弈,找到子博弈中博弈参加者策略选择,然后按博弈次序由后向前逆向归纳,直至博弈树初始节点,从而找到博弈均衡。第41页第42页2.经过逆向归纳法求解博弈均衡实例第43页三、斯塔贝尔伯格寡头博弈斯塔贝尔伯格博弈(StackelbergDuopolyGame)是寡头博弈一个常见形式,是一个完全信息动态博弈。1.斯塔贝尔伯格寡头博弈定义斯塔贝尔伯格寡头博弈:市场中有两个厂商。厂商1先行动,选择本身产量。厂商2观察到厂商1选择产量后,再决议自己产量。厂商1通常被称为领先者,厂商2通常被称为跟随者。第44页2.求解斯塔贝尔伯格寡头博弈依据逆向归纳法,首先考虑厂商2怎样选择自己产量.作为领先者,厂商1在决定自己产量时会考虑自己决议产量对厂商2影响。求解得到:作为领先者厂商1产量为:作为跟随者厂商2产量为:第45页3.古诺寡头博弈与斯塔贝尔伯格寡头博弈在古诺寡头博弈中,市场需求函数和厂商成本函数与斯塔贝尔伯格博弈均相同。二者主要区分是:在古诺寡头博弈中,两家厂商同时进行决议,是一个完全信息静态博弈。在斯塔贝尔伯格寡头博弈中,厂商1先行动,厂商2后行动,是一个完全信息动态博弈。古诺寡头博弈均衡是:斯坦贝尔伯格寡头博弈均衡是:第46页斯塔贝尔博弈寡头博弈均衡示意图第47页第四节子博弈精炼纳什均衡泽尔滕(Selten)在1965年提出了“子博弈精炼纳什均衡(SubgamePerfectNashEquilibrium)”概念。子博弈精炼纳什均衡也被称为子博弈完美纳什均衡。子博弈精炼纳什均衡与纳什均衡不一样。纳什均衡要求:给定其它参加者在均衡处策略,任何一方博弈参加者在均衡处选择策略都是自己所能选择最优策略,没有博弈参加者有动机改变自己在均衡时策略。子博弈精炼纳什均衡不但要求均衡解是纳什均衡,而且要求均衡解在每一个信息集上都是最优解。第48页一、子博弈精炼纳什均衡含义经过逆向归纳法求解博弈树得到均衡是子博弈精炼纳什均衡。纳什均衡仅需要在均衡处,每个博弈参加者没有动机改变自己策略。子博弈纳什均衡不但要求均衡满足纳什均衡要求条件,还要求在动态博弈中,此均衡是每个子博弈最优解。也就是说:纳什均衡只对均衡处策略有要求。子博弈精炼纳什均衡不但对均衡处策略有要求,而且对抵达均衡路径有要求。要求从博弈初始节点开始,博弈参加者抵达均衡处所经过路径也必须是最优。第49页在“市场争夺战”博弈中,假如在位者选择“斗争”,那么潜在进入者会选择“不进入”。假如在位者选择“默许”,那么潜在进入者会选择“进入”。对潜在进入者来说,在位者“斗争”策略是一个不可置信威胁(NoncredibleThreat)或空洞威胁(EmptyThreat)。子博弈精炼纳什均衡就是把包含不可置信威胁纳什均衡从可能均衡中剔除出去。顾名思义,“子博弈精练纳什均衡”是对纳什均衡“精练”。经过剔除包含不可置信威胁纳什均衡,降低纳什均衡数目。第50页二、不可置信威胁在很多完全信息动态博弈中,都存在不可置信威胁。1.“市场争夺战”博弈在“市场争夺战”博弈中,(潜在进入者不进入,在位者斗争)这个纳什均衡包含不可置信威胁,所以不是一个子博弈精练纳什均衡。假如在位者把“斗争”变成一个可置信威胁(CredibleThreat),那么博弈均衡就会不一样。第51页2.斯塔贝尔伯格寡头博弈假如后行动跟随者做出一个“威胁”:不论先行动领先者选择何种产量,自己都会将产量定在对于领先者厂商来说,这是一个可置信威胁假如跟随者在含有法律约束力公证机构签署一项承诺:不论领先者选取何种产量水平,自己都会将产量定在,假如自己违反承诺,那么将自动捐出收益。跟随者厂商承诺变为一个可置信承诺。跟随者厂商不可置信威胁不会影响到先行动领先者厂商产量决议。然而跟随者可置信威胁确实会影响到先行动领先者厂商产量决议,进而影响博弈均衡。第52页三、逆向归纳法扩展应用逆向归纳法不但在求解完全且完美信息动态博弈时非常有用,在一些完全但不完美信息动态博弈中,逆向归纳法也有一定用武之地。第53页完全且完美信息动态博弈博弈均衡路径是:参加者1选择策略R,然后参加者2进行决议参加者2选择策略T,博弈结束。参加者1得到收益3、参加者2得到收益1。第54页四、逆向归纳法局限和“蜈蚣博弈”即使逆向归纳法是求解动态博弈子博弈精炼纳什均衡有力工具,但依据逆向归纳法求解出均衡有时却是和常理相悖。或者说:经过逆向归纳法有时也会求解出“不合理”均衡。经济学家罗森赛尔(Rosenthsal)提出“蜈蚣博弈(CentipedeGame)”就是这么一个经典例证。即使经过逆向归纳法能够求出蜈蚣博弈均衡解,但此均衡解合理性受到了普遍挑战。所以,蜈蚣博弈有时也被称为“蜈蚣博弈悖论”,简称“蜈蚣悖论(CentipedeParadox)”。第55页1.蜈蚣博弈定义假设有两名博弈参加者:参加者1和参加者2。两名参加者轮番进行决议:首先由参加者1进行决议,然后是参加者2,再次是博弈参加者1,然后是博弈参加者2,依次类推。在博弈初始节点处,参加者1有两个策略能够选择:T和C。策略T表示结束博弈(Terminate),策略C表示继续(Continue)博弈。当参加者1选择策略T时,博弈结束。参加者1得到收益1,参加者2得到收益1。当参加者1选择策略C时,轮到博弈参加者2进行决议。参加者2一样面临两个策略选择:策略T和策略C。第56页当参加者
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《英国小说家罗琳》课件
- 2016年全国科普日网络微信知识竞赛试题301(附答案)
- 20.电工基础期末试卷参考答案
- 土地(山地)临时占用协议
- 《化学资料小常识》课件
- 焊接裂纹分类与危害
- 专业知识与教研实践
- 建筑行业助理的职责概述
- 老年活动中心前台服务工作总结
- 艺术与心理健康的关联研究计划
- GB/T 29076-2021航天产品质量问题归零实施要求
- DL-T 5190.1-2022 电力建设施工技术规范 第1部分:土建结构工程(附条文说明)
- 殡葬服务人才需求调研报告
- 降低锐器盒不规肾内科品管圈课件
- 《了凡四训》课件
- 细节描写优秀课件
- 小学数学北师大二年级下册一除法《有余数的除法》
- 桥梁1-桥梁组成与分类
- 河北医大口腔颌面外科学实习指导
- 放弃优先购买权承诺书
- 心理咨询咨询记录表
评论
0/150
提交评论