《博弈论教程(第三版)》15第十章 不完全信息序贯博弈_第1页
《博弈论教程(第三版)》15第十章 不完全信息序贯博弈_第2页
《博弈论教程(第三版)》15第十章 不完全信息序贯博弈_第3页
《博弈论教程(第三版)》15第十章 不完全信息序贯博弈_第4页
《博弈论教程(第三版)》15第十章 不完全信息序贯博弈_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章不完全信息序贯博弈

10-1不完全信息序贯博弈的表示10-2不完全信息序贯博弈的均衡10-3信号示意博弈10-4信号示意的进一步讨论10-1不完全信息序贯博弈的表示不完全信息序贯博弈的基本要素:(1)局中人;(2)局中人的决策时序;(3)局中人的行动集合;(4)局中人的类型集合;(5)局中人的信念,或局中人类型的联合概率分布;(6)局中人的支付函数。不完全信息序贯情侣博弈的博弈树(t大海和t丽娟取值0或2)(一)

局中人:大海,丽娟。(二)

局中人的决策时序:大海先采取行动,丽娟后采取行动。(三)

局中人的行动集合:A大海={足球,芭蕾},A丽娟={{足球,芭蕾},{足球,芭蕾}}。(四)

局中人的类型集合:T大海={0,2},T丽娟={0,2}。(五)局中人类型的联合概率分布:P(t大海=0,t丽娟=0)=P(t大海=2,t丽娟=2)=0.2,P(t大海=0,t丽娟=2)=P(t大海=2,t丽娟=0)=0.3。(六)局中人的支付函数:u大海(a大海,a丽娟;t大海),u丽娟(a大海,a丽娟;t丽娟),行动组合(a大海,a丽娟)由博弈路径给出,t大海∈T大海,t丽娟∈T丽娟。

通过加入虚拟局中人的方式,进一步展开表达不完全信息序贯情侣博弈。大海的类型和丽娟的类型都是外生给定的,服从一个预先确定的联合概率分布。虚拟局中人有四个行动可以选择。(t大海=0,t丽娟=0),(t大海=2,t丽娟=2),(t大海=0,t丽娟=2),(t大海=2,t丽娟=0)。大海就有四个决策节点,每个决策节点都有两个行动可以选择:足球,芭蕾。丽娟有八个决策节点,每个决策节点都有两个行动可以选择:足球,芭蕾。10-2不完全信息序贯博弈的均衡在不完全信息序贯博弈中,局中人可能包含多种类型。局中人的类型改变,其面临的博弈形势就可能会跟着发生改变。因此,在不完全信息序贯博弈中,策略要明确给出局中人在各种类型下各个决策节点的行动选择。大海的策略:{s大海(0)=足球,s大海(2)=足球}、{s大海(0)=足球,s大海(2)=芭蕾}、{s大海(0)=芭蕾,s大海(2)=足球}、{s大海(0)=芭蕾,s大海(2)=芭蕾}。可以简单表示为:{足球,足球}、{足球,芭蕾}、{芭蕾,足球}、{芭蕾,芭蕾}

丽娟有十六个策略策略组合({足球,足球},{足球,足球,芭蕾,芭蕾})关于信息集的推断:大海的左方信息集有上下两个决策节点:p大海(上|左),p大海(下|左)大海的信念可以记为:p大海={p大海(上|左),p大海(下|左);p大海(上|右),p大海(下|右)}p大海(下|左)表示低喜爱型大海(t大海=0)推断高喜爱型丽娟(t丽娟=2)出现的概率,因此也可记为p大海(2|0)丽娟的左上方信息集有左右两个决策节点,丽娟关于这个信息集的推断可以记为:p丽娟(左|左上),p丽娟(右|左上)贝叶斯推断p大海(上|左)=P大海(2|0)=0.2/0.5=0.4,p大海(下|左)=P大海(0|0)=0.6p大海(上|右)=0.6,p大海(下|右)=0.4简记为p大海={0.4,0.6;0.6,0.4}丽娟的信念推断:对于左上方信息集里决策节点出现的概率,丽娟有三种可行的合理推断。(大海是从左方信息集选择足球,还是从右方信息集选择足球,抑或是同时从两个信息集选择足球。)通过排列组合可知,丽娟存在八十一种可行的合理信念。博弈均衡有两个组成部分:一是局中人的策略组合,二是局中人的合理信念。例子:均衡可以表达为(s大海,s丽娟;p大海,p丽娟)贝叶斯子博弈精炼纳什均衡的要求

在一个不完全信息序贯博弈里,如果局中人的策略组合和信念组合满足下述两个要求,我们就称它们构成了博弈的贝叶斯子博弈精炼纳什均衡:要求1:在给定局中人的信念的情况下,局中人的策略组合满足序贯理性,即策略组合由逆推法得到。要求2:局中人的信念都是可行的,而且对于处在博弈路径上的信息集,相关信念由策略组合和贝叶斯推断给出。情侣博弈的贝叶斯子博弈精炼纳什均衡的要求:

我们称策略及信念组合(s大海,s丽娟;p大海,p丽娟)是不完全信息序贯情侣博弈的一个贝叶斯子博弈精炼纳什均衡,如果它满足以下两个要求:要求1:在给定信念组合(p大海,p丽娟)的情况下,策略组合(s大海,s丽娟)满足序贯理性,即策略组合(s大海,s丽娟)由逆推法得到。要求2:p大海和p丽娟都是可行的信念,而且对于处在博弈路径上的信息集,相关推断由策略组合(s大海,s丽娟)和贝叶斯法则给出。验证:策略及信念组合(s大海,s丽娟;p大海,p丽娟)=({芭蕾,足球},{足球,芭蕾,芭蕾,芭蕾};{0.4,0.6;0.6;0.4},{0,1;1,0;0,1;1,0}),是不完全信息序贯情侣博弈的唯一的贝叶斯子博弈精炼纳什均衡。{芭蕾,足球},{足球,芭蕾,芭蕾,芭蕾}1*0+1*1=1>0*0+0*0=0,足球最优{芭蕾,足球},{足球,芭蕾,芭蕾,芭蕾}2*1+2*0=2>(-1)*1+(-1)*0=-1,芭蕾最优芭蕾最优芭蕾最优{芭蕾,足球},{足球,芭蕾,芭蕾,芭蕾}1*0.4+1*0.6=1>2*0.4+0*0.6=0.8芭蕾最优足球最优练习:计算均衡的期望支付10-3信号示意博弈

一个局中人拥有私有信息,称为信号发送者(sender),以后简记为“S”;另一个局中人不拥有私有信息,称为信号接收者(receiver),以后简记为“R”。信号示意博弈的决策时序如下:第一阶段,虚拟局中人根据给定的概率分布P(ti),选择信号发送者的类型ti∈T。这里,T表示信号发送者的类型集合。第二阶段,信号发送者在清楚自己的类型ti的情况下,选择发送信号mj∈M。这里,M表示信号发送者的信号集合。第三阶段,信号接收者在不清楚信号发送者的类型ti但能观察到信号发送者的信号mj的情况下,选择自己的行动ak∈A。这里,A表示信号接收者的类型集合支付:uS(mj,ak;ti)和uR(mj,ak;ti)信号发送者有两个决策节点,每个决策节点都有两个行动可以选择,所以他有四个策略。

信号接收者有两个信息集,每个信息集有两个行动可以选择,所以他也有四个策略。信号接收者对两个信息集中的不同决策节点出现的概率进行推断,形成信念pR={pR(上|左),pR(下|左);pR(上|右),pR(下|右)}验证:(sS,sR;pR)=({m1,m2},{a2,a1};{1,0;0,1})是一个贝叶斯子博弈精炼纳什均衡。分离均衡

在贝叶斯子博弈精炼纳什均衡中,信号接收者能够根据信号发送者发送的信号来准确判别信号发送者的类型。混同均衡

在贝叶斯子博弈精炼纳什均衡中,信号接收者无法根据信号来区分信号发送者的类型。混同均衡(sS,sR;pR)=({m1,m1},{a1,a1};{0.4,0.6;0,1})信号示意博弈的应用:教育信号示意斯彭思(MichaelSpence)1973学历就成为一种信号,能够传递求职者生产能力这种私有信息的信号。无用教育的有用之处教育信号的成本假设市场上有两类求职者:低能力求职者和高能力求职者,分别用“L”和“H”表示,类型集合记为T={L,H}两类求职者的数量在市场上各占一半,低能力求职者和高能力求职者各占50%假设低能力求职者能够为企业创造出5的价值,同时他的保留收益为1;高能力求职者能够为企业创造出9的价值,同时他的保留收益为3。在制定工资时,企业和求职者的讨价还价能力相当,所以低能力求职者的工资为(5+1)/2=3,高能力求职者的工资为(9+3)/2=6,假设企业只会开出3和6这两种工资,即企业的工资集合为W={3,6}。有一种不能提升生产能力的“无用”教育,求职者接受这种教育需要耗费成本。用e表示接受教育的程度,假设低能力求职者的教育成本为cL=2e,高能力求职者的教育成本为cH=e。求职者了解企业的上述信念,因此,不管是能力低还是能力高,求职者都要么选择教育程度0,要么教育程度e*。求职者的教育信号集合为E={0,e*}教育信号博弈企业的信念:教育程度低于e*的求职者是低能力的,教育程度达到或超过e*的求职者是高能力的。p企业={p企业(上|左),p企业(下|左);p企业(上|右),p企业(下|右)}={1,0;0,1}只有(s求职者,s企业;p企业)=({0,e*},{3,6};{1,0;0,1})是教育信号博弈的贝叶斯子博弈精炼纳什均衡,信念p企业={1,0;0,1}才是可信的。企业能够根据教育程度来准确区分低能力求职者和高能力求职者,这是“无用”教育的有用之处。分离均衡在条件和同时满足的情况下,在条件得到满足的情况下,({0,e*},{3,6};{1,0;0,1})是一个贝叶斯子博弈精炼纳什均衡,而且是一个分离均衡。令e*=2练习当e*>3时总结有效的教育信号示意是需要成本的。这个成本不能太低,否则低能力求职者有动机冒充高能力求职者。这个成本也不能太高,否则高能力求职者也没有动力发送信号。10-4信号示意的进一步讨论一、高等教育的品牌效应考虑教育信号不整齐的因素,把e*设想为含金量高的教育程度和含金量低的教育程度之间的分界社会越成熟,名牌的效应就越明显。如果一种制度使得低能力的人可以伪装成高能力的人,这种制度就不是好的制度。由于滥竽充数这样的欺骗而遭受损失的,不是受骗的企业一方,而是被模仿的高能力的一方二、齐宣王不是滥竽充数的受害者文凭的水分企业的信念决定工资安排,工资安排导致相容的信号示意行为,而信号示意过程最终将证实企业最初的信念。在这样的环境中,要紧的是可行而合理的区分。三、所罗门断案如何设计规则和制度,获取和甄别信息四、指鹿为马的信息甄别模型测验甄别所设的违心追随程度值e*很高五、谁最需要比较先进的手提电脑20世纪90年代广州某报社关于手提电脑的分配问题免费与半价收费。信号的高成本可以保证信号的可信性六、一些面试技巧的不可重复性虚拟成本甄别的不可重复性。报社电脑的分配研究生面试题目所罗门断案七、考试学校的功过是非申请出国留学哪个更重要:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论