




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十一讲广延型博弈与反向归纳策略第十一讲广延型博弈与反向归纳策略广延型博弈构成要素(1)决策点与决策分枝的结构,在初始决策点与最终结局点之间不存在任何闭环(closedloops);(2)清楚地指明什么决策点属于哪一个参与人;(3)在自然决策点上选择的概率是公共知识;(4)参与人作决策时所依据的信息集;信息集把参与人在某一时刻的所有决策点分成若干类;(5)在博弈的终极点上每一个参与人的收益二、广延型博弈的形式广延型博弈是以“决策树”或“博弈树”的形式来表达的。122(2,0)(2,-1)(1,0)(3,1)LRMNMN三、广延型博弈的规则第一,初始点没有一条箭头指向它;对其他所有箭头,都只有一条箭头指向它。第二,如果我们从某一点向初始点返回,我们就不可能再通过迂回的途径回这一点,我们只能按反向逐次返回原点。
第二节完美信息广延(动态)博弈一、特征。(一)决策有先后顺序(二)关于博弈进程的信息是不对称的后决策者拥有更多信息。(三)具有完美信息:即参与人决策时完全了解之前的博弈过程的信息。(四)动态博弈至少有两个阶段;阶段:参与者在某一时点进行的一次决策。二、可信性:先决策者对后决策者行为的信任性。即先决策者是否相信后决策者是否采取有利的(许诺)或不利的(威胁)行为。例1:父女博弈。女儿交了一个父亲不喜欢的男友,父亲威胁说:“你如果不断绝与他的关系,我与你断绝关系。”女儿是否相信父亲的威胁?这一博弈可如下表示:女儿父亲断绝交往不交往不断绝(1,-1)(2,1)(0,1)作为女儿,知道父亲断绝与女儿的关系损失是非常大的,因此,对父亲来讲,即使女儿不听话,“断绝”是下策,应被剔除掉:女儿父亲交往不交往不断绝(2,1)(0,1)聪明的女儿在看到父亲的威胁不可信时,一定不会选择“不交往”女儿父亲交往不断绝(2,1)父亲的威胁是不可信的。因此,所谓不可信的威胁,就是指一旦采取该策略,给他本人带来的收益并非最大的策略例2:开金矿(二阶段):参与人2欲开采一价值4万元的金矿,但缺乏1万资金,参与人1恰拥有一万元资金。参与人2对参与人1说:“如果你把钱借给我,我与你平分开金矿所得。”参与人1是否应相信2把钱借给他?12分借不借不分(2,2)(0,4)(1,0)在参与人借的资金开发金矿后,平分所得是其下策,故应被剔除:12借不借不分(0,4)(1,0)这时,“借”成为参与人1的下策,故应被剔除:1不借(1,0)参与人2的许诺是不可信的。所谓不可信的许诺,就是指一旦采取该策略,给他本人带来的收益并非最大的策略例3:开金矿(三阶段)在有完善的法律制度的条件下,参与人1可以在参与人而不信守承诺的情况下选择与其打官司,这样就变成了一个三阶段博弈。这时参与人1是否应相信2的承诺?12分借不借不分(2,2)(0,4)(1,0)1不打打(1,0)12分借不借不分(2,2)(1,0)1打(1,0)在参与人2不信守承诺的情况下,不打官司是参与人1的下策故应被剔除由于参与人1必定会选择打官司,故不分是参与人2的下策因此被剔除12分借不借(2,2)(1,0)在这种情况下,参与人1知道参与人2必定会其起平分收益,不借则变成了他的下策,剔除之。12分借(2,2)在法律制度建立后,参与人2的许诺变为可信在法律健全时,既可保障社会公平,又可提高社会经济活动效率。所谓可信的许诺(威胁),就是指一旦采取该策略,给他本人带来的收益一定最大的策略三、子博弈和逆推归纳法
(一)子博弈:从一个博弈的某个阶段开始的能够自成一个博弈的后续阶段。它必须有一个初始信息集,具备进行博弈的需要的各种信息。(二)逆推归纳法:从动态博弈的最后一个阶段或最后一个子博弈开始,逐步倒推以求解动态博弈的方法。四、子博弈精炼纳什均衡如果动态博弈中各参与人的策略在动态博弈本身和所有子博弈中都构成一个纳什均衡,则称该策略组合为一个子博弈精炼纳什均衡。例4.讨价还价博弈(三阶段)设两人就如何分割1万元进行谈判,规则如下:首先由1提出一个分割比例S1,2可以接受也可以拒绝,如果2拒绝,则提一个分割比例S2,这时1可以接受,也可以拒绝,如果拒绝,则出价S则2必须接受假设每经过一轮要有一定的折扣,折扣因子为。的大小与谈判者的耐心,通货膨胀以及资金的时间价值等有关。12接受出S1不接受出S2(S1,1-S1)(δ2S,δ2(1-S))(δS2,δ(1-S2))1接受不接受出S解:展开表示为应用逆推归纳法。第三阶段:1出S,2必须接受,因此S=112接受出S1不接受出S2(S1,1-S1)(δ2,0)(δS2,δ(1-S2))1接受不接受出S=1第二阶段:2知道在第三阶段1必出S=1,因此,为了避免这一情况的出现,自己出的S2(即1的所得)应满足:这时博弈树变为12接受出S1不接受出S2=δ(S1,1-S1)(δ2,
δ(1-δ))1接受第一阶段,如果1的出价S1满足1-S1≥δ(1-δ)即S1≤1-δ+δ2则2不会拒绝因此,1的最优出价S1=1-δ+δ2这时S1=1-δ+δ2>δ2避免进入下一段谈判,双方获得的收益均达到最大。¥12接受出S1=1-δ+δ2(1-δ+δ2,δ-δ2)最终的博弈路径(子博弈精炼纳什均衡)为例5.求下列四阶段动态博弈的子博弈精炼纳什均衡。12cabd(4,3)(3,6)(5,3)1h(8,5)1efg(2,4)第三节有同时选择的动态博弈一、特征:在博弈的某些阶段,有多个参与者同时进行决策11222VRLVˊDˊRˊLˊRˊLˊ(2,2)(3,1)(2,-2)(-2,2)(-2,2)(2,-2)例1
D
当博弈进行到第三阶段时,1,2必须同时作了决策,(或者说,每个参与人在决策时,并不知道对方作出了什么选择)。这样在第三阶段构成了一个策略(静态)博弈(二人零和博弈)。这一策略(静态)博弈的收益矩阵为:参与人1参与人2LˊRˊDˊ-2,22,-2Vˊ2,-2-2,2这个策略(静态)博弈有唯一的一个混合策略纳什均衡:((1/2,1/2),(1/2,1/2)),其带给双方的期望收益(0,0)这样这个博弈可以简化为12VRL(2,2)(3,1)D(0,0)继续运用逆推归纳法,易求得子博弈精炼纳什均衡为12L(3,1)D二、求解方法(一)按逆推归纳法的思路进行求解。(二)对同时选择构成策略(静态)博弈的阶段,分别应用策略(静态)博弈求解法求解(三)将求解结果分别代入原博弈简化,再按逆推归纳法求解。例2,银行挤兑两客户在银行各存100元,银行将这200元投资于一个长期项目,如果在项目到期前抽回资金,则只能收回140元(记为日期1),如果到期后(日期2)再收回投资,则可回收本利280元。客户抽回存款的日期也是这两种,这一博弈可扩展表示如下:11222不抽抽ˊ(140,140)2抽抽抽抽抽不抽不抽不抽不抽不抽(140,100)(100,140)(100,100)(40,100)(100,40)(70,70)解:应用逆向归纳法的思想求解。在日期2(即第二阶段),两客户决策构成了一个策略(静态)博弈,其正规型表示如下21抽不抽抽140,140140,100不抽100,140100,100日期2显然,这一策略(静态)博弈有唯一的纳什均衡为(抽,抽),其收益分别为140,140。将这一结果代入原博弈,可简化为:12不抽2抽抽抽不抽(40,100)(100,40)(70,70)(140,140)它又构成了一个策略(静态)博弈其正规型表示如下21抽不抽概率抽70,70100,140P不抽40,100140,1401-P概率r1-r日期1这一博弈有两个纯策略纳什均衡(抽,抽)和(不抽,不抽),还有一个混合策略纳什衡,即各以4/7的概率在第1日期抽回资金。
结果分析:1.当信用环境非常好的情况下,客户的选择是在第1日期“不抽”,在第二日期“抽回”,双方获利最大(140,140)2.当信用环境非常不好的情况下,客户的选择是在第1日期“抽”,在双方获利最小(70,70)3.当信用环境一般的情况下,客户数量很大时,将有4/7的客户在第1日期抽回资金。或者说,客户将抽回4/7的资金例3,关税与不完全国际竞争设有两个国家1,2,分别有两上企业(分别记为企业1,企业2),企业1,2生产既内销又出口的相互竞争商品,确定国家1,2的关税策略和企业1,2的产量策略。例3,关税与不完全国际竞争设有两个国家1,2,分别有两上企业(分别记为企业1,企业2),企业1,2生产既内销又出口的相互竞争商品,确定国家1,2的关税策略和企业1,2的产量策略。设Qi为国家i的市场商品总量,反需求函数Pi=a-Qi,企业i生产hi个单位供内销,ei单位供出口,因此Qi=hi+ej(i≠j)单位成本为常数C,国家i的关税
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国内销型苦丁茶数据监测研究报告
- 广东省汕尾市陆丰市碣石镇2024-2025学年三年级上学期期中测试语文试卷(含答案)
- 幼教面试试题试题及答案
- 英美概况考试试题及答案
- 2025年军队文职人员招聘之军队文职教育学题库检测试卷B卷附答案
- 采购与供应商分包合同(2篇)
- 词牌名的文化内涵与写作技巧:小学高年级语文古诗教学教案
- 化学反应与能量化学科学教案
- 学前教育中的寓言故事启示读后感
- 房地产行业智慧社区与智能家居开发方案
- 能断金刚:超凡的经营智慧
- 磷脂酶与脂质代谢
- 上海市奉贤区2022年中考二模英语试题(含解析和听力)
- 数字的秘密生活最有趣的50个数学故事
- 养老机构安全隐患排查清单、自查表、治理整改台账
- 5.1 数据安全概述
- led灯具生产工艺过程流程图
- 财务分析模板(43张)课件
- 城市供水管网供水管网检漏技术及仪器设备应用课件
- 第三方工程评估体系检查表
- 唐僧团队之如何打造团队
评论
0/150
提交评论