![序贯决策博弈概述_第1页](http://file4.renrendoc.com/view/6e5d9b138392218d6bf954e9157fd04c/6e5d9b138392218d6bf954e9157fd04c1.gif)
![序贯决策博弈概述_第2页](http://file4.renrendoc.com/view/6e5d9b138392218d6bf954e9157fd04c/6e5d9b138392218d6bf954e9157fd04c2.gif)
![序贯决策博弈概述_第3页](http://file4.renrendoc.com/view/6e5d9b138392218d6bf954e9157fd04c/6e5d9b138392218d6bf954e9157fd04c3.gif)
![序贯决策博弈概述_第4页](http://file4.renrendoc.com/view/6e5d9b138392218d6bf954e9157fd04c/6e5d9b138392218d6bf954e9157fd04c4.gif)
![序贯决策博弈概述_第5页](http://file4.renrendoc.com/view/6e5d9b138392218d6bf954e9157fd04c/6e5d9b138392218d6bf954e9157fd04c5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章序贯决策博弈序贯决策博弈:局中人做出策略选择时知道对手的策略选择。实验:枪手博弈1三个快枪手相互之间的仇恨到了不可调和的地步。这天他们三在街上不期而遇,每个人的手都握住了枪把,一场生死决斗马上就要开始……已知这三个人中甲枪法精准,十发八中;乙的枪法也不错,十发六中,丙的枪法拙劣,十发四中。假如三个人同时开枪,决一死战,一枪后谁最后活下来的机会大一些?实验:枪手博弈2假设现在三个枪手决定轮流开枪,谁活下来的机会大一些?实验:海盗分宝五个海盗抢到100颗宝石,他们决定按如下方法来分配:先抽签决定顺序(1,2,3,4,5);然后先由1号提出分配方案,其余的人进行表决,当且仅当半数和超过半数的人同意时,则按1号所提方案分配,否则将1号扔进大海喂鲨鱼,当1号方案被否决,则由2号提出分配方案,其余的人进行表决,以此类推,假定这些海盗都是理性人,问第一个海盗应提出怎样的分配方案才能获得通过并使自己的收益最大?
本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。主要内容1、序贯博弈的定义和表示方法2、寻找序贯博弈纳什均衡的“箭头排除确定法”(旧版教材上称为虚线排除确定法)3、寻找序贯博弈纳什均衡的“倒推法”4、先动优势和后动优势5、“倒推法”的缺陷一、序贯博弈的定义和表示方法假如某个垄断企业一年可以赚10亿元的利润,假定别的企业为了进入该行业需要投资4亿元。当新的企业准备进入时,原有垄断企业有两种决策(1)“容忍”,但利润要变为5亿元。这时新的企业可以得5亿,减去4亿投资,仍有1亿。(2)“抵抗”,例如降低价格,企业的利润变为2亿元,且新的企业也只得2亿,但减去投资,亏损2亿。谁先动?潜在进入者,简称“进入者”如何表示该博弈?分析“进入者”和“垄断者”的纯策略。博弈树用博弈树来表示序贯博弈。它描述了博弈参与人的一个序贯决策过程,从博弈数的根开始,到末端点结束。拥有初始决策节点的局中人先做出决策,他的决策引出博弈树的棱,而棱的末端将是下一个局中人做出决策,依此类推。进入障碍博弈进入者●进入不进●垄断者容忍抵抗●容忍抵抗◆(1,5)(-2,2)◆◆◆(0,10)(0,4)垄断者abc“进入者”和“垄断者”的纯策略“进入者”的有两个纯策略:进入和不进入“垄断者”的有四个纯策略:不管你怎样,我总是容忍——{容忍,容忍}不管你怎样,我总是对抗——{对抗,对抗}你进我对抗,你不进我忍——{对抗,容忍}你进我忍,你不进我对抗——{容忍,对抗}
注:花括号第一项表示垄断者在上决策节点b,即进入者选择进入时他要选择的行动,第二项表示垄断者在下决策节点c,即进入者选择不进入时他要选择的行动。假设垄断断企业的的老板交交给你这这样的策策略:{对抗,,容忍},你明明白应该该如何行行动吗??策略就是是一个完完整的行行动计划划,使得得你可以以把它交交给另外外一个人人,让他他知道如如何代表表你去执执行这个个策略。。什么是计计划:““如果对对手选A,我将将采取行行动X,,如果……,我将将采取行行动…。。”行动与策策略在同时决决策博弈弈中,行行动就是是策略。。但在序贯贯决策博博弈中,,行动是是指每一一个决策策点上局局中人的的决策变变量或行行动的具具体抉择择。策略略就是一一个完整整的行动动计划。。策略组合合该博弈有有八种可可能的策策略组合合:({进进入},,{(上上)容忍忍,(下下)容忍忍}))({进进入},,{(上上)对抗抗,(下下)对抗抗}))({进进入},,{(上上)对抗抗,(下下)容忍忍}))({进进入},,{(上上)容忍忍,(下下)对抗抗}))({不不进},,{(上上)容忍忍,(下下)容忍忍}))({不不进},,{(上上)对抗抗,(下下)对抗抗}))({不不进},,{(上上)对抗抗,(下下)容忍忍}))({不不进},,{(上上)容忍忍,(下下)对抗抗}))支付进入者纯纯策略与与垄断者者的“计计划型””策略形形成策略略组合,,构成一一条路径径。支付对应每条条路径,而不是是对应每步选择择、行为为。支付向量量中,数数字的排排列按局局中人的的出场顺顺序出现现。(进进入者,,垄断者者)八种策略略组合对对应的支支付({进进入},,{(上上)容忍忍,(下下)容忍忍}))——((1,5)({进进入},,{(上上)对抗抗,(下下)对抗抗}))——((-2,,2)({进进入},,{(上上)对抗抗,(下下)容忍忍}))——((-2,,2)({进进入},,{(上上)容忍忍,(下下)对抗抗}))——((1,5)({不不进},,{(上上)容忍忍,(下下)容忍忍}))——((0,10)({不不进},,{(上上)对抗抗,(下下)对抗抗}))——((0,4)({不不进},,{(上上)对抗抗,(下下)容忍忍}))——((0,10)({不不进},,{(上上)容忍忍,(下下)对抗抗}))——((0,4)二、寻找找序贯博博弈的纳纳什均衡衡例如:如如图所示示的情侣侣博弈,,分析该该博弈的的纳什均均衡?男●足球芭蕾●女足球芭蕾●足球芭蕾◆(2,1)(0,0)◆◆◆(-1,,-1))(1,2)男方和女女方的纯纯策略男方有两两个纯策策略:足足球和芭芭蕾女方有四四个纯策策略:不管你怎怎样,我我总是芭芭蕾———{芭蕾蕾,芭蕾蕾}不管你怎怎样,我我总是足足球———{足球球,足球球}你选择什什么,我我就选择择什么———{足足球,芭芭蕾}你选择什什么,我我就不选选择什么么——{芭蕾,,足球}八种策略略组合,,纳什均均衡在哪哪该博弈有有八种可可能的策策略组合合:({足足球},,{(上上)足球球,(下下)足球球}))({足足球},,{(上上)足球球,(下下)芭蕾蕾}))({足足球},,{(上上)芭蕾蕾,(下下)足球球}))({足足球},,{(上上)芭蕾蕾,(下下)芭蕾蕾}))({芭芭蕾},,{(上上)足球球,(下下)足球球}))({芭芭蕾},,{(上上)足球球,(下下)芭蕾蕾}))({芭芭蕾},,{(上上)芭蕾蕾,(下下)足球球}))({芭蕾},{(上))芭蕾,(下下)芭蕾}))用箭头排除确确定法寻找纳纳什均衡将以上策略在在博弈书中用用粗线表示。。将存在单独改改变激励的策策略用箭头标标示。方法如如下:(1)找到第第二阶段两根根粗线所对应应的支付。(2)比较这这两个支付前前面的数字,,如果大的数数字所对应的的那条“树枝枝”是细的,,则男方存在在单独偏离的的动机,则男男方的策略选选择用箭头标标示。(3)比比较这两两个支付付后面的的数字,,其中对对应第一一阶段““树枝””是细的的那个数数字可以以不再考考虑,因因为男方方没选这这个方向向。它是是“虚””的。(4)因因此只在在男方选选的那个个“树丫丫”上进进行比较较女方的的支付,,如果大大的数字字对应的的“树枝枝”是细细的,则则女方的的策略选选择“树树枝”用用箭头标标示。((P142)虚线排除除确定法法的缺陷陷该方法可可以找到到纳什均均衡,但但找不到到博弈的的最终结结果。均衡是策策略的组组合,而而结果则则是行动动的组合合。(P143)因此,我我们一般般用倒推推法(BackwardsInduction)来寻寻找序贯贯博弈的的结果。。三、寻找找序贯博博弈的结结果———倒推法法从动态博博弈的最最后一个个阶段博博弈方的的行为开开始分析析,逐步步倒推回回前一个个阶段相相应博弈弈方的行行为选择择,一直直到第一一个阶段段的分析析方法,,称为““倒推法法”或或者“逆逆推归纳纳法”。。倒推法是动态博弈弈分析最最重要、、基本的的方法。。步骤:从博弈的的最后一一个阶段段开始分分析,通通过比较较最后一一个参与与决策的的局中人人的支付付,推断断他或她她的选择择,从而而将他不不会选的的策略———“枝枝桠”砍砍掉,从从而回到到上一个个阶段,,比较该该阶段参参与决策策的局中中人的支支付,将将他或她她不会选选的策略略砍掉,,依此类类推…男●足球芭蕾●女足球芭蕾●足球芭蕾◆(2,1)(0,0)◆◆◆(-1,,-1)(1,2)×××倒推法:(1))在上面面一个枝枝桠上,,由于最后后一阶段段是女方方做决策策,因此此比较女女方的支支付1和和0,将将0所对对应的芭芭蕾策略略砍掉,,没砍掉掉的打上上箭头。。(2))在下面面一个枝枝桠上,,由于最最后一阶阶段是女女方做决决策,因因此比较较女方的的支付-1和2,将-1所对对应的足足球策略略砍掉,,没砍掉掉的打上上箭头。。(3))回到第第一个阶阶段,比比较带箭箭头的两两个策略略男方的的支付((因为此此时男方方做决策策),将将支付将将较小的的策略砍砍掉。女博弈树树例如:仿仿冒和反反仿冒博博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒练习:法法律保障障不足的的开金矿矿博弈乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)3.2.3逆逆推归纳纳法乙借甲不分分(0,4)(2,2)不借(1,0)3.2.3逆逆推归纳纳法乙借不借(1,0)(0,4)练习2:有法律保保障的开金矿博博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)练习2:有法律保保障的开金矿博博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)×××倒推法的的评价倒推法只只能分析析明确设设定的博博弈问题题,要求求博弈的的结构,,包括次次序、规规则和得得益情况况等都非非常清楚楚,并且且各个博博弈方了了解博弈弈结构,,相互知知道对方方了解博博弈结构构。这些些可能有有脱实际际的可能能。逆推归归纳法法也不不能分分析比比较复复杂的的动态态博弈弈。在遇到到两条条路径径利益益相同同的情情况时时倒推推法也也会发发生选选择困困难。。对博弈弈方的的理性性要求求太高高,不不仅要要求所所有博博弈方方都有有高度度的理理性,,不允允许犯犯任何何错误误,而而且要要求所所有博博弈方方相互互了解解和信信任对对方的的理性性,对对理性性有相相同的的理解解,或或进一一步有有理性性的““共同同知识识”。。四、先先动优优势与与后动动优势势在序贯贯情侣侣博弈弈中,,任何何一方方率先先采取取行动动可能能得到到的好好处,,都比比他或或她后后行动动可能能得到到的好好处大大。这这种局局中人人先动动得益益大于于后行行得益益的情情况,,叫做做先动优优势。请比较较:男●足球芭蕾●女足球芭蕾●足球芭蕾◆(2,1)(0,,0)◆◆◆(-1,-1)(1,2)×××女先动优优势当男方方先动动时,,男方方得2,女女方得得1,,但当当女方方先动动时,,男方方得1,女女方得得2。。“先下手为为强”女●足球芭蕾●男足球芭蕾●足球芭蕾◆(1,2))(-1,-1)◆◆◆(0,0))(2,1))×××男序贯博弈中中的性别战战举例:情侣侣博弈中往往往是先动动一方具有有优势,因因此男女双双方往往要要抢先一步步,获得主主动权,比比如女方已已经买好了了电影票,,再比如男男方曾经多多次告诉女女方,世界界杯就算不不上班也要要看!后动优势后动优势::后行动的的得益比先先行动的得得益大的情情况。1.石头、、剪刀、布布的游戏。。2.如何分分蛋糕?一块蛋糕两两人分,怎怎么分才公公平?你愿愿意是切还还是挑?3.两家价价格竞争的的企业,在在定价方面面是不是也也有后动优优势?用矩阵来演演示先动优优势和后动动优势乙进入不进入左中右4,123,102,123,122,101,11甲甲有后动优优势!乙进入不进入左中右4,123,102,123,122,101,11甲甲、乙各有有什么优势势?乙上下左右10,05,410,1005,0甲甲有先动优优势,乙有有后动优势势。可以预预料,利益益驱动,原原来同时决决策的这个个博弈,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中专校长年度工作总结样本(四篇)
- 2025年云南省建材订货合同(4篇)
- 2025年中班幼儿园班主任工作总结模版(三篇)
- 2025年主管中药师个人专业技术工作总结例文(四篇)
- 2025年二级建造师继续教育学习心得范例(3篇)
- 2025年人教版高二物理知识点总结(4篇)
- 2025年代收货款业务合作协议标准版本(2篇)
- 2025年个人工作总结暨的工作计划(四篇)
- 2025年个人年终工作总结及计划样本(二篇)
- 2025年个人月度工作心得体会模版(3篇)
- 出差报销单-中英对照版
- 电流互感器试验报告
- 蒋中一动态最优化基础
- 七年级英语阅读理解10篇(附答案解析)
- 抖音来客本地生活服务酒旅商家代运营策划方案
- 钻芯法桩基检测报告
- 【学前教育小学化成因分析及其对策10000字(论文)】
- 无线网网络安全应急预案
- 国籍状况声明书【模板】
- 常用保洁绿化人员劳动合同范本5篇
- 腕管综合征课件
评论
0/150
提交评论