第四章__序贯决策.ppt_第1页
第四章__序贯决策.ppt_第2页
第四章__序贯决策.ppt_第3页
第四章__序贯决策.ppt_第4页
第四章__序贯决策.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 序贯决策博弈,实验 : 枪手博弈1,三个快枪手相互之间的仇恨到了不可调和的地步。这天他们三在街上不期而遇,每个人的手都握住了枪把,一场生死决斗马上就要开始 已知这三个人中甲枪法精准,十发八中;乙的枪法也不错,十发六中,丙的枪法拙劣,十发四中。假如三个人同时开枪,决一死战,一枪后谁最后活下来的机会大一些?,实 验 : 枪手博弈2,假设现在三个枪手决定轮流开枪,谁活下来的机会大一些?,实 验 : 海 盗 分 宝,五个海盗抢到100颗宝石,他们决定按如下方法来分配:先抽签决定顺序(1,2,3,4,5);然后先由1号提出分配方案,其余的人进行表决,当且仅当半数和超过半数的人同意时,则按1号所提

2、方案分配,否则将1号扔进大海喂鲨鱼,当1号方案被否决,则由2号提出分配方案,其余的人进行表决,以此类推,假定这些海盗都是理性人,问第一个海盗应提出怎样的分配方案才能获得通过并使自己的收益最大?,本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。,主要内容,1、序贯博弈的定义和表示方法 2、寻找序贯博弈纳什

3、均衡的“箭头排除确定法”(旧版教材上称为虚线排除确定法) 3、寻找序贯博弈纳什均衡的“倒推法” 4、先动优势和后动优势 5、“倒推法”的缺陷,一、序贯博弈的定义和表示方法,假如某个垄断企业一年可以赚10亿元的利润,假定别的企业为了进入该行业需要投资4亿元。当新的企业准备进入时,原有垄断企业有两种决策 (1)“容忍”,但利润要变为5亿元。这时新的企业可以得5亿,减去4亿投资,仍有1亿。 (2)“抵抗”,例如降低价格,企业的利润变为2亿元,且新的企业也只得2亿,但减去投资,亏损2亿。 谁先动?潜在进入者,简称“进入者” 如何表示该博弈? 分析“进入者”和“垄断者”的纯策略。,博 弈 树,用博弈树来

4、表示序贯博弈。 它描述了博弈参与人的一个序贯决策过程,从博弈数的根开始,到末端点结束。 拥有初始决策节点的局中人先做出决策,他的决策引出博弈树的棱,而棱的末端将是下一个局中人做出决策,依此类推。,进入障碍博弈,进入者,进入,不进,垄断者,容忍,抵抗,容忍,抵抗,(1,5),(-2,2),(0,10),(0,4),垄断者,a,b,c,“进入者”和“垄断者”的纯策略,“进入者” 的有两个纯策略:进入和不进入 “垄断者”的有四个纯策略: 不管你怎样,我总是容忍容忍,容忍 不管你怎样,我总是对抗对抗,对抗 你进我对抗,你不进我忍对抗,容忍 你进我忍,你不进我对抗容忍,对抗 注:花括号第一项表示垄断者在

5、上决策节点b,即进入者选择进入时他要选择的行动,第二项表示垄断者在下决策节点c,即进入者选择不进入时他要选择的行动。,假设垄断企业的老板交给你这样的策略:对抗,容忍,你明白应该如何行动吗? 策略就是一个完整的行动计划,使得你可以把它交给另外一个人,让他知道如何代表你去执行这个策略。 什么是计划:“如果对手选A,我将采取行动X,如果,我将采取行动。”,行动与策略,在同时决策博弈中,行动就是策略。 但在序贯决策博弈中,行动是指每一个决策点上局中人的决策变量或行动的具体抉择。策略就是一个完整的行动计划。,策略组合,该博弈有八种可能的策略组合: ( 进入,(上)容忍,(下)容忍 ) ( 进入,(上)对

6、抗,(下)对抗 ) ( 进入,(上)对抗,(下)容忍 ) ( 进入,(上)容忍,(下)对抗 ) ( 不进,(上)容忍,(下)容忍 ) ( 不进,(上)对抗,(下)对抗 ) ( 不进,(上)对抗,(下)容忍 ) ( 不进,(上)容忍,(下)对抗 ),支 付,进入者纯策略与垄断者的“计划型”策略形成策略组合,构成一条路径。 支付对应每条路径,而不是对应每步选择、行为。 支付向量中,数字的排列按局中人的出场顺序出现。(进入者,垄断者),八种策略组合对应的支付,( 进入,(上)容忍,(下)容忍 )(1,5) ( 进入,(上)对抗,(下)对抗 )(-2,2) ( 进入,(上)对抗,(下)容忍 )(-2,

7、2) ( 进入,(上)容忍,(下)对抗 )(1,5) ( 不进,(上)容忍,(下)容忍 )(0,10) ( 不进,(上)对抗,(下)对抗 )(0,4) ( 不进,(上)对抗,(下)容忍 )(0,10) ( 不进,(上)容忍,(下)对抗 )(0,4),二、寻找序贯博弈的纳什均衡,例如:如图所示的情侣博弈,分析该博弈的纳什均衡?,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,(2,1),(0,0),(-1,-1),(1,2),男方和女方的纯策略,男方有两个纯策略:足球和芭蕾 女方有四个纯策略: 不管你怎样,我总是芭蕾芭蕾,芭蕾 不管你怎样,我总是足球足球,足球 你选择什么,我就选择什么足球,芭蕾 你

8、选择什么,我就不选择什么芭蕾,足球,八种策略组合,纳什均衡在哪,该博弈有八种可能的策略组合: ( 足球,(上)足球,(下)足球 ) ( 足球,(上)足球,(下)芭蕾 ) ( 足球,(上)芭蕾,(下)足球 ) ( 足球,(上)芭蕾,(下)芭蕾 ) ( 芭蕾,(上)足球,(下)足球 ) ( 芭蕾,(上)足球,(下)芭蕾 ) ( 芭蕾,(上)芭蕾,(下)足球 ) ( 芭蕾,(上)芭蕾,(下)芭蕾 ),用箭头排除确定法寻找纳什均衡,将以上策略在博弈书中用粗线表示。 将存在单独改变激励的策略用箭头标示。方法如下: (1)找到第二阶段两根粗线所对应的支付。 (2)比较这两个支付前面的数字,如果大的数字所对

9、应的那条“树枝”是细的,则男方存在单独偏离的动机,则男方的策略选择用箭头标示。 (3)比较这两个支付后面的数字,其中对应第一阶段“树枝”是细的那个数字可以不再考虑,因为男方没选这个方向。它是“虚”的。 (4)因此只在男方选的那个“树丫”上进行比较女方的支付,如果大的数字对应的“树枝”是细的,则女方的策略选择“树枝”用箭头标示。(P142),虚线排除确定法的缺陷,该方法可以找到纳什均衡,但找不到博弈的最终结果。 均衡是策略的组合,而结果则是行动的组合。(P143) 因此,我们一般用倒推法(Backwards Induction)来寻找序贯博弈的结果。,三、寻找序贯博弈的结果倒推法,从动态博弈的最

10、后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“倒推法” 或者“逆推归纳法”。 倒推法是动态博弈分析最重要、基本的方法。 步骤: 从博弈的最后一个阶段开始分析,通过比较最后一个参与决策的局中人的支付,推断他或她的选择,从而将他不会选的策略“枝桠”砍掉,从而回到上一个阶段,比较该阶段参与决策的局中人的支付,将他或她不会选的策略砍掉,依此类推,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,(2,1),(0,0),(-1,-1),(1,2),倒推法:(1)在上面一个枝桠上,由于最后一阶段是女方做决策,因此比较女方的支付1和0,将0所对应的芭蕾

11、策略砍掉,没砍掉的打上箭头。(2)在下面一个枝桠上,由于最后一阶段是女方做决策,因此比较女方的支付-1和2,将-1所对应的足球策略砍掉,没砍掉的打上箭头。(3)回到第一个阶段,比较带箭头的两个策略男方的支付(因为此时男方做决策),将支付将较小的策略砍掉。,女,博 弈 树,例如:仿冒和反仿冒博弈,练习:法律保障不足的开金矿博弈,3.2.3 逆推归纳法,乙,借,不借,(1,0),3.2.3 逆推归纳法,乙,借,不借,(1,0),(0,4),练习2:有法律保障的开金矿博弈,练习2:有法律保障的开金矿博弈,倒推法的评价,倒推法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则和得益情况等都非常

12、清楚,并且各个博弈方了解博弈结构,相互知道对方了解博弈结构。这些可能有脱实际的可能。 逆推归纳法也不能分析比较复杂的动态博弈。 在遇到两条路径利益相同的情况时倒推法也会发生选择困难。 对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许犯任何错误,而且要求所有博弈方相互了解和信任对方的理性,对理性有相同的理解,或进一步有理性的“共同知识”。,四、先动优势与后动优势,在序贯情侣博弈中,任何一方率先采取行动可能得到的好处,都比他或她后行动可能得到的好处大。这种局中人先动得益大于后行得益的情况,叫做先动优势。 请比较:,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,(2,1),(0,0),

13、(-1,-1),(1,2),女,先动优势,当男方先动时,男方得2,女方得1,但当女方先动时,男方得1,女方得2。 “先下手为强”,女,足球,芭蕾,男,足球,芭蕾,足球,芭蕾,(1,2),(-1,-1),(0,0),(2,1),男,序贯博弈中的性别战,举例:情侣博弈中往往是先动一方具有优势,因此男女双方往往要抢先一步,获得主动权,比如女方已经买好了电影票,再比如男方曾经多次告诉女方,世界杯就算不上班也要看!,后动优势,后动优势:后行动的得益比先行动的得益大的情况。 1.石头、剪刀、布的游戏。 2.如何分蛋糕? 一块蛋糕两人分,怎么分才公平?你愿意是切还是挑? 3.两家价格竞争的企业,在定价方面是不是也有后动优势?,用矩阵来演示先动优势和后动优势,乙,进入,不进入,左,中,右,甲,甲有后动优势!,乙,进入,不进入,左,中,右,甲,甲、乙各有什么优势?,乙,上,下,左,右,甲,甲有先动优势,乙有后动优势。可以预料,利益驱动,原来同时决策的这个博弈,容易演化成甲先决策乙后做决策的序贯博弈。,乙,上,下,左,右,甲,五、博弈论给自己出难题,残酷的蜈蚣博弈是说明逆推归纳法和博弈分析困难的经典博弈。,(0,10000),猜猜看这个残酷

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论