序贯决策博弈相关资料_第1页
序贯决策博弈相关资料_第2页
序贯决策博弈相关资料_第3页
序贯决策博弈相关资料_第4页
序贯决策博弈相关资料_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章序贯决策博弈序贯决策博弈:局中人做出策略选择时知道对手的策略选择。

本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。主要内容1、序贯博弈的定义和表示方法2、寻找序贯博弈纳什均衡的“虚线排除确定法”3、寻找序贯博弈纳什均衡的“倒推法”4、先动优势和后动优势5、“倒退法”的缺陷一、序贯博弈的定义和表示方法在动态博弈中,参与人的行动有先后顺序,而且后行动者在自己行动之前能观察到先行动者的行动。博弈的三要素策略是在整个博弈中所有选择、行为的“完整计划”。什么是计划:“如果对手选A,我将采取行动X,如果…,我将采取行动…。”在同时决策博弈中,行动就是策略,但在序贯决策博弈中,行动是指每一个决策点上局中人的决策变量或行动的具体抉择。结果是上述“计划型”策略的策略组合,构成一条路径。支付对应每条路径,而不是对应每步选择、行为。支付向量中,数字的排列按局中人的出场顺序出现。构造博弈战略式表述在进入障碍博弈中潜在进入者只有一个信息集,两个可选择的行动,其行动空间为:SA=(进入,不进入)垄断者有两个信息集,每个信息集上有两个可选择的行动,其行动空间为:(进入,容忍)、(进入,对抗)、(不进入,容忍)、(不进入,对抗)扩展式表述博弈博弈的扩展式表述:参与人集合;参与人的行动顺序;行动空间;信息集;支付函数;外生事件(即自然的选择)的概率分布。在扩展式表述博弈,参与人是相机行事,即“等待”博弈到达自己的信息集(包括一个或多个决策)后再决定如何行动;在战略式表述博弈,参与人似乎是在博弈开始之前,就制定出了一个完全的相机行动计划,即“如果…发生,那么我将现在…”。博弈的扩展式表述——博弈树它描述了博弈参与人的一个序贯决策过程,从博弈数的根开始,到末端点结束。拥有初始决策节点的局中人先做出决策,他的决策引出博弈树的棱,而棱的末端将是下一个局中人做出决策,依此类推。举例假如某个垄断企业一年可以赚10亿元的利润,假定别的企业为了进入该行业需要投资4亿元。当新的企业准备进入时,原有垄断企业有两种决策(1)“容忍”,但利润要变为5亿元。这时新的企业可以得5亿,减去4亿投资,仍有1亿。(2)“抵抗”,例如降低价格,企业的利润变为2亿元,且新的企业也只得2亿,但减去投资,亏损2亿。谁先动?潜在进入者如何表示该博弈?进入障碍博弈进入者●进入不进●垄断者容忍抵抗●容忍抵抗◆(1,5)(-2,2)◆◆◆(0,10)(0,4)垄断者二、序贯博博弈的纳什什均衡例如:性别别战.男●足球芭蕾●女足球芭蕾●足球芭蕾◆(2,1))(0,0))◆◆◆(-1,-1)(1,2))策略组合该博弈有八八种可能的的策略组合合:({足球球},{((上)足球球,(下))足球}))({足球球},{((上)足球球,(下))芭蕾}))({足球球},{((上)芭蕾蕾,(下))足球}))({足球球},{((上)芭蕾蕾,(下))芭蕾}))({芭蕾蕾},{((上)足球球,(下))足球}))({芭蕾蕾},{((上)足球球,(下))芭蕾}))({芭蕾蕾},{((上)芭蕾蕾,(下))足球}))({芭蕾蕾},{((上)芭蕾蕾,(下))芭蕾}))用虚线排除除确定法寻寻找纳什均均衡将以上策略略在博弈书书中用粗线线表示。将存在单独独改变激励励的策略用用虚线表示示。方法如如下:(1)找到到第二阶段段两根粗线线所对应的的支付。(2)比较较这两个支支付前面的的数字,如如果大的数数字所对应应的那条““树枝”是是细的,则则男方存在在单独偏离离的动机,,则男方的的策略选择择“树枝””用虚线表表示。(3)比较较这两个后后面付前面面的数字,,其中对应应第一阶段段“树枝””是细的那那个数字可可以不再考考虑,因为为男方没选选这个方向向。它是““虚”的。。(4)因此此只在男方方选的那个个“树丫””上进行比比较女方的的支付,如如果大的数数字对应的的“树枝””是细的,,则女方的的策略选择择“树枝””用虚线表表示。(P159)虚线排除确确定法的缺缺陷该方法可以以找到纳什什均衡,但但找不到博博弈的最终终结果。均衡是策略略的组合,,而结果则则是行动的的组合。因此,我们们一般用倒倒推法(BackwardsInduction)来来寻找序贯贯博弈的结结果。三、、寻寻找找序序贯贯博博弈弈的的结结果果————倒倒推推法法从动动态态博博弈弈的的最最后后一一个个阶阶段段博博弈弈方方的的行行为为开开始始分分析析,,逐逐步步倒倒推推回回前前一一个个阶阶段段相相应应博博弈弈方方的的行行为为选选择择,,一一直直到到第第一一个个阶阶段段的的分分析析方方法法,,称称为为““逆逆推推归归纳纳法法””。。逆推推归归纳纳法法是是动动态态博博弈弈分分析析最最重重要要、、基基本本的的方方法法。。步骤骤::从博博弈弈的的最最后后一一个个阶阶段段开开始始分分析析,,通通过过比比较较最最后后一一个个参参与与决决策策的的局局中中人人的的支支付付,,推推断断他他或或她她的的选选择择,,从从而而将将他他不不会会选选的的策策略略————““枝枝桠桠””砍砍掉掉,,从从而而回回到到上上一一个个阶阶段段,,比比较较该该阶阶段段参参与与决决策策的的局局中中人人的的支支付付,,将将他他或或她她不不会会选选的的策策略略砍砍掉掉,,依依此此类类推推……男●足球球芭蕾蕾●女足球球芭蕾蕾●足球球芭蕾蕾◆(2,1)(0,,0)◆◆◆(-1,-1)(1,2)×××倒推法法:(1)在在上面面一个个枝桠桠上,,由于最最后一一阶段段是女女方做做决策策,因因此比比较女女方的的支付付1和和0,,将0所对对应的的芭蕾蕾策略略砍掉掉,没没砍掉掉的打打上箭箭头。。(2)在在下面面一个个枝桠桠上,,由于于最后后一阶阶段是是女方方做决决策,,因此此比较较女方方的支支付-1和和2,,将-1所所对应应的足足球策策略砍砍掉,,没砍砍掉的的打上上箭头头。((3))回到到第一一个阶阶段,,比较较带箭箭头的的两个个策略略男方方的支支付((因为为此时时男方方做决决策)),将将支付付将较较小的的策略略砍掉掉。女练习开金矿矿博弈弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)×××倒推法法的评评价逆推归归纳法法只能能分析析明确确设定定的博博弈问问题,,要求求博弈弈的结结构,,包括括次序序、规规则和和得益益情况况等都都非常常清楚楚,并并且各各个博博弈方方了解解博弈弈结构构,相相互知知道对对方了了解博博弈结结构。。这些些可能能有脱脱实际际的可可能逆推归归纳法法也不不能分分析比比较复复杂的的动态态博弈弈在遇到到两条条路径径利益益相同同的情情况时时逆推推归纳纳法也也会发发生选选择困困难对博弈弈方的的理性性要求求太高高,不不仅要要求所所有博博弈方方都有有高度度的理理性,,不允允许犯犯任何何错误误,而而且要要求所所有博博弈方方相互互了解解和信信任对对方的的理性性,对对理性性有相相同的的理解解,或或进一一步有有“理理性的的共同同知识识”。。四、先先动优优势与与后动动优势势在序贯贯情侣侣博弈弈中,,任何何一方方率先先采取取行动动可能能得到到的好好处,,都比比他或或她后后行动动可能能得到到的好好处大大。这这种局局中人人先动动得益益大于于后行行得益益的情情况,,叫做做先动优优势。请比较较:男●足球芭蕾●女足球芭蕾●足球芭蕾◆(2,1)(0,,0)◆◆◆(-1,-1)(1,2)×××女先动优优势当男方方先动动时,,男方方得2,女女方得得1,,但当当女方方先动动时,,男方方得1,女女方得得2。。“先下下手为为强””女●足球芭蕾●男足球芭蕾●足球芭蕾◆(1,,2))(-1,-1))◆◆◆(0,,0))(2,,1))×××男序贯博博弈中中的性性别战战举例::情侣侣博弈弈中往往往是是先动动一方方,比比如女女方已已经买买好了了电影影票,,再比比如男男方曾曾经多多次告告诉女女方,,世界界杯就就算不不上班班也要要看D!后动优势后动优势::后行动的的得益比先先行动的得得益大的情情况。例如:石头头、剪刀、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论