Lecture 3 完全信息动态博弈

上传人：q*** IP属地：湖北上传时间：2023-02-04 格式：PPTX 页数：56 大小：1.35MB 积分：28 举报 版权申诉

已阅读5页，还剩51页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第三讲完全信息动态博弈动态博弈不同于静态博弈，动态博弈中的参与人行动有先后顺序，后行动者在先行动者做出决策之后，再视情况决定自己的行动。下棋、求婚、讨价还价（谈判）、价格战动态博弈中的参与人行动有先后顺序，后行动者在先行动者做出决策之后，再视情况决定自己的行动。因此先行动者需要考虑到自己的策略对后行动者的影响。动态博弈若旧公司威胁新公司，若进入一定采用价格战，该威胁是否可信？例：吓阻进入动态博弈例：吓阻进入两个博弈已经完全不同了！现实中，往往是新公司进入后，旧公司再做决定3.1博弈扩展式表述3.1.1博弈树开发商B开发不开发

开发商B开发不开发

开发开发商A

不开发4，48，00，80，0-3，-31，00，10，0(a)高需求情况(b)低需求情况开发开发商A

不开发n人有限战略博弈的扩展式表述一般可以用博弈树来表示。3.1博弈扩展式表述A开发不开发NNBBBB开发开发开发开发开发不开发不开发不开发大大小小（1/2）（1/2）（1/2）(0，0)(0，1)(0，0)(4，4)(8，0)(-3，-3)(1，0)(0，8)

若博弈行动顺序如下开发商A首先行动，选择开发或者不开发A决策后，自然选择市场需求大小开发商B观察到A的决策和市场需求后，决定开发或不开发不开发房地产开发博弈Ⅰ：3.1博弈扩展式表述博弈树(gametree)是包含多个结(node)与枝(branches)的集合，从单一的起始环节，不经回转，不经交错，直到终结环节。1.结(node)：包括决策结和终点结两类。2.枝(branches)：枝是一个决策结到它的直接后续结的连线，每一个枝代表参与人的一个行动选择。3.信息集(informationsets):博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集，该子集包括所有满足下列的决策结：(1)每一个决策结都是同一参与人的决策结(2)该参与人知道博弈进入该集合的某个决策结，但不知道自己究竟处在哪一个决策结。博弈树的基本结构3.1博弈扩展式表述信息集A开发不开发NNBBBB开发开发开发开发开发不开发不开发不开发大大小小（1/2）（1/2）（1/2）(0，0)(0，1)(0，0)(4，4)(8，0)(-3，-3)(1，0)(0，8)

房地产开发博弈Ⅱ不开发这里B能看到A是否开发，但看不到市场的大小3.1博弈扩展式表述信息集房地产开发博弈Ⅲ这里B能看到市场的大小，但不能看到A是否开发A开发不开发NNBBBB开发开发开发开发开发不开发不开发不开发大大小小（1/2）（1/2）（1/2）(0，0)(0，1)(0，0)(4，4)(8，0)(-3，-3)(1，0)(0，8)

不开发3.1博弈扩展式表述不同的博弈树可能表达同一个博弈N大不开发AABBBB开发开发开发开发开发不开发不开发不开发开发开发不开发小（1/2）不开发(0，0)(0，1)(0，0)(4，4)(8，0)(-3，-3)(1，0)(0，8)

房地产开发博弈Ⅲ：第二种表述（1/2）3.1博弈扩展式表述不同的博弈树可能表达同一个博弈N大不开发BBAAAA开发开发开发开发开发不开发不开发不开发开发开发不开发不开发(0，0)(0，1)(0，0)(4，4)(8，0)(-3，-3)(1，0)(0，8)

房地产开发博弈Ⅲ：第三种表述（1/2）（1/2）小3.1博弈扩展式表述扩展式表述也可以用于表述表示静态博弈(-8，-8)(0，-10)(-10，0)(-1，-1)

坦白抵赖

(-8，-8)(0，-10)(-10，0)(-1，-1)

坦白抵赖

囚徒困境扩展式表述3.1博弈扩展式表述

3.1博弈扩展式表述假定在博弈开始前自然就选择了“低需求”，并且已为参与人的共同信息；若开发商A先决策，那么博弈的扩展式如图。在博弈的开始，B的策略是什么？动态博弈中的策略ABB开发开发开发不开发不开发不开发(0，1)(0，0)(-3，-3)(1，0)3.1博弈扩展式表述“策略”的涵义：表示参与人（如开发商B）在各个信息集合（开发，不开发）观察到其他参与人（A）的行动之下的相应行动。开发商A有两个策略开发商B有四个策略动态博弈中的策略-3，-3-3，-31，01，00，10，00，10，0开发商B{开发，开发}{开发，不开发}{不开发，开发}{不开发，不开发}

开发开发商A

不开发3.1博弈扩展式表述

3.1.3完美信息博弈3.1博弈扩展式表述一般假定博弈满足“完美回忆”(perfectrecall)的要求。完美回忆是与信息集有关的概念，指的是没有参与人会忘记自己以前知道的事情，所有参与人都知道自己以前的选择。3.1.4完美回忆12UUUDDLLLLRRR1112(a)(b)N1两个不是完美回忆的例子3.2子博弈精炼纳什均衡并非所有纳什均衡都是合理的；只有其策略不包含不可置信行动的纳什均衡才是合理的。不包含不可置信的行动的策略所组成的纳什均衡被称为“精炼纳什均衡”；即不论过去发生了什么，构成精炼纳什均衡的战略，其所规定的行动在每一个决策点上都是最优的。所以，又称为“序贯均衡”(sequentialequilibrium)。泽尔腾(Selten)的“子博弈精炼纳什均衡”是纳什均衡概念的第一个最重要的改进。子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。子博弈(Subgame)是原博弈的一部分(小树subtree)，从单一元素的信息集合精炼纳什均衡(PerfectNashEquilirium)3.2子博弈精炼纳什均衡子博弈(Subgame)一个子博弈必须从一个单结信息集开始。ABB开发开发开发不开发不开发不开发(0，1)(0，0)(-3，-3)(1，0)房地产开发博弈(-3，-3)(1，0)开发不开发开发不开发(0，1)(0，0)(b)子博弈Ⅰ(b)子博弈Ⅱ(a)原博弈3.2子博弈精炼纳什均衡子博弈(Subgame)子博弈的信息集和支付向量都直接继承自原博弈。122LLURRDZ4Z1Z2Z3122LLURRD3lrlllrrr3囚徒困境的扩展式表述3.2子博弈精炼纳什均衡子博弈精炼均衡(SubgamePerfectNashEquilibrium,SPNE)是一策略组合，在原博弈中是纳什均衡，而且它相关的策略在每个子博弈中也都是该子博弈的纳什均衡。逆推法基于序贯理性原理，参与人在每一步骤上均追求效用极大子博弈精炼纳什均衡存在性定理I(Kuhn,1953)：每个完美信息扩展式的有限博弈都有一个逆推法找出的纯策略纳什均衡（也是纯策略子博弈精炼纳什均衡(SPNE)）。3.2子博弈精炼纳什均衡用逆向归纳法求解子博弈精炼纳什均衡的过程，实质是重复剔除严格劣策略的过程在扩展式博弈上的扩展。子博弈精炼纳什均衡在博弈树上所经过的决策点和最优选择构成一个路径，称为均衡路径（EquilibriumPath）。子博弈精炼纳什均衡3.2子博弈精炼纳什均衡子博弈精炼纳什均衡有些非完美信息博弈也可以运用逆向归纳法求解。21U’LUD’RD(2,2)(3,1)(2,-2)(-2,2)(-2,2)(2,-2)R’L’R’L’12存在性定理II(Selton)：有限的扩展式博弈一定有子博弈精炼纳什均衡(SPNE)。3.2子博弈精炼纳什均衡逆向归纳法理论上要求“所有参与人是理性的”是所有参与人的共同知识。尽管在简单的两阶段模型中，逆向归纳法及子博弈精炼纳什均衡给出的解是非常直观的，但是如果有许多个参与人或每个参与人有多次行动机会，情况可能并非如此。逆向归纳法的问题3.2子博弈精炼纳什均衡逆向归纳法的问题我们预测所有参与人都将选择A。如果n很小，这个预测大概是正确的；但是，如果n很大，这个预测就很值得怀疑。iAAAA12(2,…2)(1/n,…,1/n)(1/2,…,1/2)(1,…,1)(1/i,…,1/i)DDDDn与此相关的另一个问题是逆向归纳法要求支付向量是所有参与人的共同知识。参与人越多，共同知识的要求就越难满足3.2子博弈精炼纳什均衡逆向归纳法的问题这里，只有两参与人，但每个参与人有100个决策结…………1AAAA12(100,100)(98,101)(0,3)(1,1)(98,98)DDDD1蜈蚣博弈2A2A(99,99)(97,100)3.2子博弈精炼纳什均衡精炼纳什均衡策略不仅在均衡路径上是最优的，而且在非均衡路径上也是最优的。即参与人在不可能事件发生时，也应该按照理性原则进行最优行动。悖论：最优策略是基于理性假设做出的，但满足理性假设意味着不可能事件不会发生，如果不可能事件发生了，说明理性假设不成立，那么在采取下一步行动时为何还要假定对方为理性呢？反事实悖论3.3子博弈精炼纳什均衡应用举例

3.3.1动态产量竞争：斯塔克尔伯格(Stackelberg)模型3.3子博弈精炼纳什均衡应用举例

3.3.1动态产量竞争：斯塔克尔伯格(Stackelberg)模型古诺均衡点斯塔克尔伯格均衡点R1R2q2q1(a-c)/43(a-c)/8(a-c)/23.3子博弈精炼纳什均衡应用举例引擎厂希望生产大引擎，但汽车厂希望生产小车。若引擎厂事先宣布，只生产大引擎，这个承诺可信吗？3.3.2使不可置信的承诺成为可信：上下游关联博弈引擎厂

大车大引擎小引擎（8，3）大引擎（3，0）引擎厂汽车厂小车小引擎（3，6）

（1，1）3.3子博弈精炼纳什均衡应用举例引擎厂采取行动，使其生产小引擎的利润大幅降低＄3（卖掉或毁损部分生产小引擎的产能）。毁损部份产能表面上似乎不利其营运，但能促使汽车厂相信它的承诺只会生产大引擎，增强此宣言可信度。3.3.2使不可置信的承诺成为可信：上下游关联博弈引擎厂

大车大引擎小引擎（8，3）大引擎（0，0）引擎厂汽车厂小车小引擎（0，6）

（1，1）3.3子博弈精炼纳什均衡应用举例3.3.2使不可置信的承诺成为可信：吓阻进入博弈I可立即投资扩厂，拥有过剩生产能力，以便未来进行价格战，投资花费30。宣言会进行价格战还不如做一些像扩厂等可见的、不可逆转的决策。3.3子博弈精炼纳什均衡应用举例

3.3.3关税政策3.3子博弈精炼纳什均衡应用举例逆推法第二阶段是一个同时行动博弈，公司1的最优化问题3.3.3关税政策3.3子博弈精炼纳什均衡应用举例逆推法第一阶段是政府决策的同时行动博弈：3.3.3关税政策3.3子博弈精炼纳什均衡应用举例下列“囚徒困境”报酬(社会福利)：FTA(FreeTradeAgreement)“自由贸易协议”：双方同时降税成可使双方获利。但若无强制功能，则任一方均有诱因自FTA偏离！3.3.3关税政策3.4讨价还价与耐心讨价还价在现实生活中非常常见：劳资合同、公司利益分配、中央和地方、中美贸易、财产分配、家务等。讨价还价的特点在于，双方既有共同利益（不同于零和博弈），又有利益冲突。在一个博弈中，纳什均衡太多，使得反而有可能阻止任何一个均衡的出现。谈判基本特征：两人（A和B），分一块钱；A先出价，B决定接受还是拒绝；如果接受，按照A提出的方案分配，谈判结束；如果B拒绝，B提出方案，A决定接受还是拒绝；如果接受，按B的方案分配，谈判结束；如果不接受，再由A提出方案；如此等等。讨价还价3.4讨价还价与耐心假定x：A得到的份额；y：B得到的份额；约束条件：x+y=1s：A的贴现率；a=1/（1+s）：A的贴现因子；r：B的贴现率；b=1/（1+r）：B的贴现因子；贴现因子越大，越有耐心3.4.1鲁宾斯坦(Rubinstein)讨价还价模型3.4讨价还价与耐心若只有一次谈判，即A出价，B决定是否接受逆向归纳意味着子博弈精炼纳什均衡是：x=1，y=0若接受和不接受支付相等，假设参与人会接受若有两次谈判，A出价，B可以不接受再出价，A再决定是否接受在第二次谈判时，若B拒绝，那B的最优方案是提出x=0，y=1。根据假设，A会接受。考虑到这一点，在第一次谈判时，A会选择x=1-b，y=b，此时B会接受。若A选择x<1-b，显然不是最优；若A选择x>1-b，则B不会接受，也不是最优3.4.1鲁宾斯坦(Rubinstein)讨价还价模型：有限期3.4讨价还价与耐心若有三次谈判，A出价，B可以不接受再出价，A可以不接受再出价，最后B决定是否接受第三次谈判：x=1，y=0第二次谈判：x=a，y=1-a第一次谈判：x=1-b(1-a)，y=b(1-a)若有四次谈判第四次谈判：x=0，y=1第三次谈判：x=1-b，y=b第二次谈判：x=a(1-b)，y=1-a(1-b)第一次谈判：x=1-b(1-a(1-b))，y=b(1-a(1-b))3.4.1鲁宾斯坦(Rubinstein)讨价还价模型：有限期3.4讨价还价与耐心当有T次谈判时：T=2N+1，N=0,1,2…T=2N+2，N=0,1,2…两个结论：后动优势：当两人的耐心足够高时，谁在最后一轮出价，谁就具有优势。但这个优势随允许谈判次数的增加而递减。（注意：当谈判次数为T次时，A既是先动方，又是后动方）越有耐心的人，谈判中优势越大3.4.1鲁宾斯坦(Rubinstein)讨价还价模型：有限期3.4讨价还价与耐心

3.4.2无限期讨价还价模型与耐心3.4讨价还价与耐心如果B先出价：两个结论：无限次谈判具有“先动优势”一个人的耐心越大，谈判中的优势就越大谈判当中能够影响到最终分配结果的因素有两个：出价顺序谈判者的耐心，以及与耐心类似的谈判成本（包括机会成本）3.4.2无限期讨价还价模型与耐心3.4讨价还价与耐心在前面的讨论中，尽管谈判允许多次，但均衡情况下，双方一开始就达成协议，之后的谈判路径都是非均衡路径；现实中情况并不如此。通常，谈判总要进行多个回合，例如中国加入WTO是谈判，进行了10几年。为什么？3.4.3谈判与信息3.4讨价还价与耐心原因是：我们前面假定当事人具有完全信息：知道价值V和每个人的机会成本或谈判砝码，每个人的耐心，谈判的时限等等。并且，每个人知道每个人知道；每个人知道每个人知道每个人知道，等等。但在现实中，谈判面临的最大问题是信息不完全。价值V，耐心，机会成本等均有可能不是公开信息。谈判的过程实际上是信息揭示和窥探的过程。3.4.3谈判与信息3.4讨价还价与耐心两人之间分配一笔钱，其中一个人提出方案，另一个人可以接受，也可以拒绝；如果接受，每人得到方案规定的份额；如果拒绝，没有人得到任何东西。什么是这个博弈的精练纳什均衡？3.4.4最后通牒博弈3.4讨价还价与耐心两人之间分配一笔钱，其中一个人提出方案，另一个人可以接受，也可以拒绝；如果接受，每人得到方案规定的份额；如果拒绝，没有人得到任何东西。什么是这个博弈的精练纳什均衡？在大规模试验中，结果倾向于55:45，接近1:1！当然，还发现其他有趣结果：如男生给女生提方案时平均给予较多；而分专业进行的试验中，发现经济专业(尤其是博士生)提出方案接近70:30，而接受比例也较大。其它非均衡行为：小费、“事成之后，必有重谢”3.4.4最后通牒博弈3.5重复博弈与无名氏定理动态博弈中一种特殊但是非常重要的类型是“重复博弈”重复博弈是指同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”(1)阶段博弈之间没有“物质上”的联系(2)所有参与人都观测到博弈过去的历史。(3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。重复博弈3.5重复博弈与无名氏定理连锁店悖论在位者有20个连锁店，进入者每次进入其中一个市场，就变成了重复博弈。这里在位者会选择斗争的唯一原因是希望斗争能起到一种威慑作用。但根据逆推法，在有限次博弈中，威慑作用并不是一个可以置信的威胁。这个博弈的唯一的子博弈精炼均衡是在位者在每一个市场上选择默许，进入都在每一个市场上选择进入。这就是所谓的“连锁店悖论”(chain-storeparadox;Selten,1978)3.5.1有限次重复博弈40，50-10，00，3000，300在位者默许斗争

进入进入者不进入3.5重复博弈与无名氏定理囚徒困境的情况与连锁店悖论类

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

Lecture 3 完全信息动态博弈

文档简介

温馨提示

最新文档

评论

Lecture 3 完全信息动态博弈

文档简介

温馨提示

最新文档

评论

相关文档