《博弈论教程(第三版)》6第四章 序贯决策博弈_第1页
《博弈论教程(第三版)》6第四章 序贯决策博弈_第2页
《博弈论教程(第三版)》6第四章 序贯决策博弈_第3页
《博弈论教程(第三版)》6第四章 序贯决策博弈_第4页
《博弈论教程(第三版)》6第四章 序贯决策博弈_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章序贯决策博弈4-1序贯决策博弈与博弈树4-2策略与行动4-3序贯博弈的纳什均衡4-4倒推法4-5先动优势与后动优势4-6博弈论给自己出难题扩展式表述回顾:战略式表达参与人集合参与人的战略集合支付函数不必考虑博弈的动态过程,因此,二人有限博弈矩阵表就可以分析4-1序贯决策博弈与博弈树考虑行动的先后顺序和博弈历史,适用于动态博弈。在战略式基础上要考虑:行动顺序对每次(每阶段)行动知道多少,有什么具体行动可供选择扩展式表述要素:参与人集合:i=1,2……参与人的行动顺序参与人的行动空间:每次行动都有什么选择参与人的信息集:每次行动时,参与人都知道些什么参与人的支付函数:是所有行动的函数外生事件(自然选择)的概率分布博弈的扩展式表述可以用博弈树来实现博弈树的特点是直观清晰,其优点是可以体现多人博弈过程举例:以房地产开发为例参与人是A、BA先行,然后是自然选择市场大小,最后B行动自然选择的概率分布为:市场需求大的概率为1/2,需求小的概率1/2。例子:决策有先后的博弈,称为序贯决策博弈(序贯博弈)。表述为博弈树的博弈,也叫做展开型表示的博弈。博弈树描述了所有局中人可以采取的所有可能的行动以及博弈的所有可能的结果。博弈树由节点(nodes)和棱(edges)组成,节点又分为决策节点(decisionnodes)和末端节点(terminalnodes)。博弈树以棱把节点连接起来。决策节点是局中人作出决策的地方。每个决策节点都与一个在该决策节点上进行决策的局中人相对应。每棵博弈树都有一个初始决策节点,初始决策节点也叫做博弈树的根(root),是博弈开始的地方。末端节点是博弈结束的地方,一个末端节点就是博弈的一个(可能的)结果(outcome)。每一个末端节点,都与一个支付向量相对应,这个向量按分量次序排列博弈的所有参与人在这个结果下的博弈所得。博弈的参与人的数目,就是支付向量的维数。首次行动顺序原则:序贯博弈各结果相应的支付向量中,按照每个参与人头一次决策行动出现先后的自然次序排列收益。博弈树必须说明在每一个决策节点上相应的局中人能够采取的所有可能的选择。一些博弈树可能包含“不做任何决策”的决策节点。每一个决策节点都有至少一条棱从它那里出发往后延伸,但是没有最大延伸数量的限制。对于不是根的每个节点,只能有来自别的节点的唯一的棱指向它这个节点。博弈树并不要求每个局中人必须在至少一个非末端节点上进行决策。即,可能会出现某些局中人并不在任何一个非末端节点上进行决策的情形。进入障碍博弈一个垄断企业因为他的产品一直可以卖高价赚取每年10亿元的利润。别的企业为了进入这个垄断的行业,需要4亿元的投资。当别的企业准备进入的时候,原有企业必须决策:或“容忍”新的企业进入,具体表现为他收缩产量以维持高价,这样他的利润降为5亿元。这时,设对方的利润也是5亿元,减去4亿元进入投资,实得1亿。或垄断企业展开商战“抵抗”,就是加大产量,降低价格,力图把进入者挤出去,这时原来垄断企业的利润降到2亿元,即使对方也得2亿元,却不抵投资的4亿元,结果亏损2个亿。即使对方不进入,垄断企业也可以采取降价威胁的策略。这时候其的利润下降为4亿元。n人序贯博弈的博弈树的主要特征

对于表达有n个局中人P1,P2,…,Pn参与的一个序贯博弈的博弈树:在树的每一个非末端节点上,都只有一个局中人进行决策;在树的每一个末端节点上,都指派了一个n维的“支付”向量p(v)=(p1(v),p2(v),…,p3(v)),这里v是这个末端节点的相应的策略表达.而1,2,…n是博弈参与人首次决策的自然顺序。注意几点:首先,末端节点并不为任何一个局中人所单独拥有,末端节点按照一定次序给出所有局中人在这个结果的博弈所得,约定采用首次行动顺序原则给出这个次序。博弈树并不要求每个局中人必须在至少一个非末端节点上进行决策。在一个多人序贯博弈中,可能会出现某些局中人并不在任何一个非末端节点上进行决策的情形。这些局中人因为没有行动的机会,实际上并不参与博弈,我们仍然把他们称为博弈的局中人或者参与人,他们实际上是别人的博弈后果的承受者。博弈树允许从一个非末端节点只伸延出一个棱的情况,在这种情况下,这个非末端节点就是一个实际上不做决策的决策节点。4-2策略与行动策略:参与博弈的各个局中人在进行决策时,可以选择的方法、做法或经济活动的水平、量值等。行动:局中人在博弈的某个时点上的决策变量。同时决策博弈,每个局中人的策略就是他能够采取的行动。序贯决策博弈,策略与行动有区别。序贯决策博弈行动:每一个决策节点上局中人的决策变量或行动的具体选择。策略:一个完整的行动计划,就构成局中人在博弈中的一个策略。“进入者”只有一个决策节点,他有两个纯策略可以选择:进入和不进入。“垄断者”有四个可能的纯策略:不管你怎样,我总容忍;不管你怎样,我总对抗;你进我抗,你不进我忍;你进我忍,你不进我抗。垄断者的这四个纯策略,可以简单描述为四个行动集,每一个行动集都说明垄断者在他拥有的两个决策节点上相应的行动。{容忍,容忍}、{抵抗,抵抗}、{抵抗,容忍}、{容忍,抵抗}。男策略:足球;芭蕾女策略:追随策略:他选择什么,我就选择什么;对抗策略:他选择什么,我就偏不选什么;芭蕾策略:无论他选什么,我都选我喜欢的芭蕾;足球策略:无论他选什么,我都选他喜欢的足球4-3序贯博弈的纳什均衡女方策略:八种可能的策略组合粗线表示法箭头排除确定法均衡与结果均衡与结果是两个不同的概念:均衡是策略的组合;结果是行动的组合。例如:情侣序贯博弈,其中一个纳什均衡是(足球,{足球,芭蕾}),这是一个策略组合,因为它给每个局中人规定了在各种可能发生的情况下应当采取的应对行动,对于每个局中人来讲,它都是一个完整的行动方案。按照上述这个均衡策略组合所导致的博弈结果是(足球,足球),即,博弈的最终结局是男女双方都去看足球。(足球,足球)是行动的组合。同时决策博弈中,由于“策略”选择等同于“行动”选择,所以那时候说“均衡”与说“结果”没有多少不同。至于符号方面,表示策略组合用圆括号,表示结果也用圆括号,但表示策略组合的圆括号里面的各项是策略,(理应)用花括号括住,而表示结果的圆括号里面的各项是行动,不该用花括号括住。练习策略组合?纳什均衡?策略组合策略组合星号简示法

:(U,{U’,*})2策略组合的节点表示法:({U/D},{U’/D’,U’’/D’’})8({ab/ac/ad},{ch/ck,dp/de},{bf/bg,em/en})4-4倒推法(逆向推导法)在序贯博弈中,由于均衡与结果是两个不同的概念,所以求解纳什均衡的虚线排除确定法(或箭头排除确定法),并不适用于求解序贯博弈的结果。一般使用倒推法(逆向推导法)求序贯博弈的结果。一般步骤从序贯博弈的最后一个决策阶段开始分析,每一次确定出所分析阶段局中人的行动选择和路径。然后再确定前一阶段决策的局中人的行动选择和路径。由于倒推法确定的各个局中人在各阶段的选择,都建立在后续阶段各个局中人理性选择的基础上,因而很自然就排除了包含不可置信威胁或承诺的可能性,因此它得到的结论比较可靠,并且由此确定下来的各个局中人的策略组合,具有较好的稳定性。事实上,倒推法是序贯博弈中使用得最普遍的方法,它对于分析完全并且完美信息的序贯博弈非常有用。4-5先动优势与后动优势

局中人先行得益大于后行得益的情况,叫做先动优势。“先下手为强”

局中人后行动得益大于先行动得益的情况,叫做后动优势。“后下手也不一定遭殃”:

eg.最优的制度;两商家确定价格甲有后动优势甲有先动优势,乙有后动优势4-6博弈论给自己出难题难题1:100元的分配(公平思想)难题2:抓钱博弈(蜈蚣博弈)难题3:旅行者困境难题1:100元的分配从一个班级里面挑出A、B两位同学,然后主持人拿出100元,让A、B两位同学就如何分配这100元进行一轮讨价还价:首先由A提出一个分配方案,比如“我拿75,你拿25”,如果B同意,则按照A所建议的方案在他们之间瓜分这100元。如果B拒绝A的提议,则两个人都将一文不名。难题2:抓钱博弈(蜈蚣博弈)主持A、B两人做博弈游戏,决策点上面写谁就轮到谁决策。一开始,A决策。如果A决策结束游戏,A得1,B得0;如果A不结束游戏,就轮到B决策,这时如果B决策结束游戏,B得2,A得0;如果B不结束游戏,则又轮到A决策。所以你看,两人轮流决策,奖赏越来越大,谁决策结束游戏,谁就得到全部奖赏,而对方什么也得不到。难题3:旅行者困境两个旅行者从一个以出产细瓷花瓶著名的地方旅行回来,他们都买了一样价格的花瓶。提

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论