博弈论(第八讲 完美信息动态博弈求解)_第1页
博弈论(第八讲 完美信息动态博弈求解)_第2页
博弈论(第八讲 完美信息动态博弈求解)_第3页
博弈论(第八讲 完美信息动态博弈求解)_第4页
博弈论(第八讲 完美信息动态博弈求解)_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八第八讲 完美信息动态博弈求解第八讲第八讲 完美信息动态博弈求解完美信息动态博弈求解引例引例第八讲第八讲 完美信息动态博弈求解完美信息动态博弈求解引例引例第第8讲讲 完美信息动态博弈求解完美信息动态博弈求解子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法离散动态博弈求解离散动态博弈求解连续动态博弈求解连续动态博弈求解8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8 8.1.1 .1.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法子博弈子博弈 子博弈子博弈:在某个扩展式博弈中,如果节点x以及它的所有后续节点所在的信息集都不包括非x的后续节点

2、,就称博弈树中的节点x开启了一个子博弈子博弈。子博弈是由节点x与它的后续节点所定义的树状结构。u 一旦处于子博弈中,各参与人都具有他们正处的子博弈的共同知识。u 子博弈是自成一体的扩展式博弈,将其看成一个独立的博弈也是有意义的。 如果一个子博弈的初始点并不是该博弈的初始点,这个子博弈被称为严格子博弈。严格子博弈。 8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8 8.1.1 .1.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法子博弈子博弈8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8 8.1.1 .1.1 子博弈精炼纳什均衡与

3、逆向归纳法子博弈精炼纳什均衡与逆向归纳法子博弈子博弈8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8 8.1.1 .1.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法子博弈子博弈8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8.1.2 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡子博弈精炼纳什均衡 子博弈精炼纳什均衡子博弈精炼纳什均衡:对于一个策略组合而言,如果它在原博弈的每一个子博弈中都是纳什均衡,这个策略组合就被称为子博弈精炼纳什均衡。 9在均衡博弈中所有决策节点处,在均衡博弈中所有决策节点

4、处,保证每个参与者的策略都能制定保证每个参与者的策略都能制定最佳行动。最佳行动。将参与者的最佳行动扩展到所有将参与者的最佳行动扩展到所有的偶然事件中,而不仅仅是那些的偶然事件中,而不仅仅是那些在均衡博弈中发生的事件。在均衡博弈中发生的事件。比较比较 纳什均衡纳什均衡 子博弈精子博弈精炼纳什均炼纳什均衡衡8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8.1.2 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡子博弈精炼纳什均衡纳什均衡(不绑架,释放,杀害),不付赎金)能够保证在盖伊不绑架的情况下,薇薇卡的最优行动为不付赎金;但是,一旦盖伊实施

5、绑架,盖伊在后两个节点上的策略仍为(释放,杀害)时,不付赎金不再是薇薇卡的最佳行动。因此,该纳什均衡不符合子博弈精炼纳什均衡的思想。纳什均衡(绑架,释放,杀害),支付赎金)符合子博弈精炼纳什均衡的思想。8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8.1.3 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法序贯理性序贯理性 为了求解子博弈精炼纳什均衡,不仅要考虑参与人事先(就博弈开始前而言)选择的最优反应,参与人在任何需要做出决定的时候,都应该表现出理性。这称为序贯理性。 如果序贯理性是参与人之间的共同知识,那么每个参与人都会“提前”考虑各参与人未来对于他在

6、某一信息集中采取的行为将如何相应地做出反应。 8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8.1.4 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法逆向归纳法逆向归纳法 逆向归纳法逆向归纳法:一种从后往前(从博弈树末端的信息集推到博弈开始时的信息集)分析动态博弈的方法。在可以到达终止节点的假定下,依次删去每个信息集中作为劣势策略的行动。 在完美信息条件下,如果没有两个及以上的终止点对某个在完美信息条件下,如果没有两个及以上的终止点对某个参与人来说支付相同,那么逆向归纳法可以为各参与人确定参与人来说支付相同,那么逆向归纳法可以为各参与人确定唯一的理性策略组

7、合。唯一的理性策略组合。8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8.1.4 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法逆向归纳法逆向归纳法8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8.1.4 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法逆向归纳法逆向归纳法该博弈的子博弈精炼纳什均衡为(绑架,释放,杀害),支付赎金)。8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8.1.4 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法逆向归纳法逆向归纳法8.1 子博弈精炼纳什均衡与

8、逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8.1.4 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法逆向归纳法逆向归纳法该博弈有4个纳什均衡:(DE,AC),(DE,BC),(UE,BD)和(UF,BD) ;该博弈有2个子博弈精炼纳什均衡: (DE,BC)与(UE,BD)。8.1 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法 8.1.5 子博弈精炼纳什均衡与逆向归纳法子博弈精炼纳什均衡与逆向归纳法小练习小练习 8.2 离散动态博弈求解离散动态博弈求解8.2.1离散动态博弈求解离散动态博弈求解古巴导弹危机古巴导弹危机8.2 离散动态博弈求解离散动态博弈求解8.2.1

9、离散动态博弈求解离散动态博弈求解古巴导弹危机古巴导弹危机8.2 离散动态博弈求解离散动态博弈求解8.2.2 离散动态博弈求解离散动态博弈求解安然公司与检查特权安然公司与检查特权8.2 离散动态博弈求解离散动态博弈求解8.2.3 离散动态博弈求解离散动态博弈求解种族歧视与棒球队种族歧视与棒球队8.2 离散动态博弈求解离散动态博弈求解8.2.3 离散动态博弈求解离散动态博弈求解种族歧视与棒球队种族歧视与棒球队道奇队不考虑种族,只看球员的才能;红袜队既考道奇队不考虑种族,只看球员的才能;红袜队既考虑球员的才能还考虑球员的种族。这从球员对每个虑球员的才能还考虑球员的种族。这从球员对每个球队的不同价值体

10、现出来。球队的不同价值体现出来。8.2 离散动态博弈求解离散动态博弈求解8.2.3 离散动态博弈求解离散动态博弈求解种族歧视与棒球队种族歧视与棒球队8.2 离散动态博弈求解离散动态博弈求解8.2.3 离散动态博弈求解离散动态博弈求解种族歧视与棒球队种族歧视与棒球队8.2 离散动态博弈求解离散动态博弈求解8.2.3 离散动态博弈求解离散动态博弈求解种族歧视与棒球队种族歧视与棒球队该博弈的子博弈精炼纳什均衡为(2322311211211,2322),(2322311211211,2323),(2322311211211,2342),(2322311211211,2343), (2322311211

11、211,2422),(2322311211211,2423),(2322311211211,2442),(2322311211211,2443). 8.2 离散动态博弈求解离散动态博弈求解8.2.4 离散动态博弈求解离散动态博弈求解抢先博弈抢先博弈 在抢先博弈中,每个参与者决定何时行动,当下列情形发生时参与者获得较高的支付:(1 1)先于其他人行动;)先于其他人行动;(2 2)行动之前等待更长的时间。)行动之前等待更长的时间。 假设只有两个乘客,排在第一位收益为30,排在第二位收益为20。排队时间的成本如右表所示: 8.2 离散动态博弈求解离散动态博弈求解8.2.4 离散动态博弈求解离散动态博

12、弈求解抢先博弈抢先博弈 通过求解可得,该博弈的子博弈精炼纳什均衡为(等待,行动,行动),(等待,行动,行动)。该博弈的均衡结果为参与人1在第三轮选择行动,二人的支付分别为9和(-1),明显劣于两人都一直选择等待所得到的支付水平25。这是由于人们的急切心理造成的。8.2 离散动态博弈求解离散动态博弈求解8.2.5 离散动态博弈求解离散动态博弈求解消耗战消耗战 消耗战是时机博弈,当下列情形发生时参与者获得较高的支付:(1 1)其他参与者较早行动;()其他参与者较早行动;(2 2)自己较早行动。)自己较早行动。 消耗战源于一种军事冲突类型。双方持续交火,每一方都希望对方能迅速放弃进攻或投降,都希望能

13、比对方坚持更长时间。 【例子】自己首先行动支付为0,而让对方首先行动的支付为100。如果双方都不行动,那么每一方的成本消耗都是10。 8.2 离散动态博弈求解离散动态博弈求解8.2.5 离散动态博弈求解离散动态博弈求解消耗战消耗战 该博弈的子博弈精炼纳什均衡为(等待,等待),(等待,等待)。该博弈的均衡结果为两个参与人都是一直选择等待,导致每个人的最终支付都为10。8.2 离散动态博弈求解离散动态博弈求解8.2.6 离散动态博弈求解小练习求解下列博弈的子博弈精炼纳什均衡:该博弈的子博弈精炼纳什均衡为(Ry,bb)。 8.3 连续动态博弈求解连续动态博弈求解广告和竞争广告和竞争 广告可以以多种形

14、式出现,并且对需求和福利有不同的效应。 强调一个产品的优点的广告,称为正面广告。 强调竞争产品劣势的广告,称为负面广告。 公司可以通过广告来增加对他的产品的需求,有时候增加的需求是以牺牲竞争公司的利益为代价的。8.3 连续动态博弈求解连续动态博弈求解广告和竞争广告和竞争 考虑一个古诺双寡头模型,其中公司1在与其他公司竞争之前需要进行广告宣传。公司1选择做广告的程度a0。广告对于该行业的商品需求具有正向效应,提高消费者愿意为两个公司所生产产品所付出的价格。市场价格p=a-q1-q2,q1与q2分别为公司1与公司2的产量。在公司1选择a之后,可以被公司2观察到。然后两个公司同时并独立地选择产量水平。假设公司以零成本生产,但公司1必须付出的广告成本为2a3/81。8.3 连续动态博弈求解连续动态博弈求解广告和竞争广告和竞争 该博弈的扩展式为:公司公司1公司公司1公司公司2aq2q1u1,u2 该博弈具有无限的严格子博弈公司1选择a之后进行的古诺双寡头竞争。 使用逆向归纳法求解该博弈:先求子博弈的纳什均衡,再计算公司1的广告投入。8.3 连续动态博弈求解连续动态博弈求解广告和竞争广告和竞争 公司1的支付为: 因为a已经被选定,可以看做是一个常数。对q1求导数并令其等于0,得到公司1对公司2所选产量q2的最优反应: 同理,公司2的最优反应函数为: 对这两式构成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论