第二章策略型博弈_第1页
第二章策略型博弈_第2页
第二章策略型博弈_第3页
第二章策略型博弈_第4页
第二章策略型博弈_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论与信息经济学

GameTheoryandInformationEconomics第二部分非协作博弈实际第二章战略型博弈第三章扩展型博弈第四章贝叶斯博弈第五章动态贝叶斯博弈

主要内容第一节战略型博弈的表示第二节反复剔除严厉劣战略平衡第三节纳什平衡第四节混合战略纳什平衡第五节纳什平衡的存在性第二章战略型博弈——同时行动,如何决策

战略型(规范型〕表述——适宜表示静态博弈扩展型表述——适宜表示动态博弈

博弈有两种表述方法一、战略型博弈的含义完全信息静态博弈又称为战略型博弈。完全信息是指局中人对本人与其他局中人的一切与博弈有关的事前信息〔战略空间、支付函数等〕有充分的了解(局中人的支付函数是共同知识)。静态博弈是指在博弈中,局中人同时采取行动,或者局中人的行动有先有后,但后行动者不能知道先行动者的行动选择。第一节战略型博弈的表示二、战略型博弈的三个要素:1、局中人〔Players):1,2,…,n;2、战略〔Strategies):;3、支付函数〔Payofffunctions)表示为:第一节战略型博弈的表示1、有限博弈:(1)博弈中局中人人数有限;(2)每个局中人只需有限个战略。2、零和博弈:博弈中局中人所获支付之和为零,即一方所得为另一方所失。三、两种特殊博弈类型1、局中人:甲,乙2、策略:{坦率,不坦率}3、支付函数——支付矩阵〔双人有限博弈〕每个位置上第一个数字表示局中人1在对应的战略组合中得到的支付,第二个数字表示局中人2的相应所获支付。例2.1囚徒姿态及其战略型表示

(Tucker,1950)

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2囚徒姿态的支付矩阵

乙甲石头剪刀布石头0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,1例2.2石头、剪刀、布的支付矩阵

田忌齐王上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3例2.3田忌赛马的支付矩阵

局中人:男,女策略:男:看足球,看芭蕾女:看足球,看芭蕾支付矩阵:见下一页

例2.4性别大战〔battleofthesexes)

女男足球芭蕾足球3,21,1芭蕾-1,-12,3性别大战的支付矩阵一、根本思想:假设一个局中人在任何情况下从某种战略中得到的支付均小于从另一种战略中得到的支付,那么显然对他而言,前一种战略劣于后一种战略。从个人利益出发,被剔除的战略不会被局中人采用。从而可以利用剔除严厉劣战略的概念来简化博弈局势,能够会得到博弈的解。第二节反复剔除严厉劣战略平衡,假设存在,对于一切的都有且其中至少有一个为严厉不等式,那么称是第i个局中人的一个严厉劣战略。二、严厉劣战略的定义1、根据理性的局中人不会选择严厉劣战略这一原那么,可以经过反复剔除严厉劣战略的方法对博弈进展求解。2、其方法是:对每个局中人寻觅严厉劣战略,由于它不会被局中人选择实施,所以找到一种后就可以将其从博弈局势中剔除,从而得到一种新的缩减后的博弈局势,对这种新局势反复上述过程,直到无法找到新的严厉劣战略为止。三、反复剔除严厉劣战略对局中人甲而言,无论局中人乙采取何种战略,采用“不坦率〞战略得到的支付都小于采用“坦率〞战略。局中人甲的“不坦率〞战略严厉劣于“坦率〞战略.“不坦率〞战略都是一种严厉劣战略,从而可以剔除。博弈中局中人各自从本身利益出发的理性选择〔博弈平衡解〕就是〔坦率,坦率〕。四、囚徒姿态的解

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2例2.1囚徒姿态的支付矩阵

甲:“不坦率〞相对于“坦率〞是严厉劣战略

乙甲坦白不坦白坦白-6,-6-1,-8乙:“不坦率〞相对于“坦率〞是严厉劣战略

乙甲坦白坦白-6,-6·例2.5利用反复剔除严厉劣战略求解

乙甲左中右上1,01,20,1下0,30,12,0·乙:“右〞相对于“中〞是严厉劣战略

乙甲左中右上1,01,20,1下0,30,12,0·甲:“下〞相对于“上〞是严厉劣战略

乙甲左中上1,01,2下0,30,1·乙:“左〞相对于“中〞是严厉劣战略

乙甲左中上1,01,2·反复剔除严厉劣战略平衡是(上,中)

乙甲中上1,21、每一步剔除需求局中人间相互了解的更进一步假定,假设我们把这一过程运用到恣意多步,需求假定“局中人是理性的〞是共同知识。2、这一方法对博弈结果的预测经常是不准确的.五、反复剔除严厉劣战略有两个缺陷

乙甲石头剪刀布石头0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,0例2.2石头、剪刀、布的支付矩阵

利用反复剔除严厉劣战略无法求解例2.6利用反复剔除严厉劣战略无法求解

乙甲左中右上0,44,05,3中4,00,45,3下3,53,56,6大多数的博弈局势中运用剔除严厉劣战略的方法可以对博弈局势进展简化,但能够得不到博弈的平衡解。需求引入非协作博弈实际中的中心概念——纳什平衡(NashEquilibrium)。六、留意一、纳什平衡的思想“双赢〞或“多赢〞第三节纳什平衡它是关于博弈结局的一致性预测假设一切局中人预测一个特定的纳什平衡会出现,那么这种平衡就会出现。只需纳什平衡才干使每个局中人均认可这种结局,而且他们均知道其他局中人也认可这种结局。二、纳什平衡的意义1、博弈的纳什平衡是这样一种最优战略组合,是一种他好、我好大家都好的理性结局,其中每一个局中人均不能也不想一方面改动本人的战略而添加收益,每个局中人选择的战略是对其他局中人所选战略的最正确反响。

三、纳什平衡的定义2、数学定义:在战略型博弈中,假设对于每个局中人i,存在,都有

或那么称战略组合是此博弈G的一个纳什平衡。三、纳什平衡的定义1、双人有限博弈:双划线法首先对局中人2的每一个战略,局中人1寻觅支付最大的战略,在其对应支付下划线;然后对局中人1进展相应的步骤;最后,凡是两个局中人支付下均被划线的结局就是纳什平衡。四、纳什平衡的求法用双划线法可以求出纳什平衡:〔坦率,坦率〕,〔-6,-6〕意义:提示个人理性与集体理性之间的矛盾。例2.1囚徒姿态的纳什平衡

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2局中人:大猪,小猪策略:大猪:按,等待小猪:按,等待支付矩阵:见下一页纳什平衡:〔按,等待〕例2.7智猪博弈〔boxedpigs)

小猪大猪按等待按5,14,4等待9,-10,0例2.7智猪博弈的支付矩阵

小猪大猪按等待按5,14,4等待9,-10,0

小猪大猪按等待按5,14,4等待9,-10,0

女男足球芭蕾足球3,21,1芭蕾-1,-12,3例2.4性别大战博弈的支付矩阵

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

女男足球芭蕾足球3,21,1芭蕾-1,-12,3局中人:甲,乙策略:甲:放左手,放右手乙:猜左手,猜右手支付矩阵:见下一页没有纳什平衡例2.8猜左右手游戏

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,12、延续性博弈纳什平衡的求法首先求出每个局中人对其他局中人战略组合的反响函数——即在其他局中人战略组合给定时极大化本人的支付,得到的最正确反响战略表现为其他局中人战略组合的函数;然后将这些反响函数联立求解即得到博弈的纳什平衡解。四、纳什平衡的求法局中人:厂商1,厂商2策略:厂商1:选择产量厂商2:选择产量假设:价钱支付函数(利润函数):

例2.9两寡头产量竞争Cournot〔1838〕模型

Cournot模型求解反响函数:

纳什平衡:Cournot模型求解假设两寡头可以串谋,共同确定产量Q使总利润最大化,利润函数为:(Q)=Q(a-Q-c)总利润最大的产量为:——称为契约曲线总利润为:比较及含义:

两寡头产量串谋模型Q1

厂商2的反响曲线纳什平衡契约曲线厂商1的反响曲线OQ2图1反响曲线、纳什平衡与契约曲线局中人:厂商1,厂商2策略:厂商1选择价钱;厂商2选择价钱假设:两寡头固定本钱都为0,边沿本钱为常数c,消费者对厂商1和2消费产品的需求量分别为:;例2.10两寡头价钱竞争Bertrand〔1883〕模型支付〔利润〕函数:最优化的一阶条件是:

Bertrand〔1883〕模型及求解反响函数:

纳什平衡价钱:

Bertrand〔1883〕模型及求解在n个局中人的战略型博弈中,1、假设反复剔除严厉劣战略剔除掉除战略组合s以外的一切战略,那么这一战略组合s为该博弈的独一的纳什平衡。2、假设战略组合s是一个纳什平衡,那么它就不会被反复剔除严厉劣战略所剔除。纳什平衡是比反复剔除严厉劣战略更强的解概念。五、纳什平衡与反复剔除严厉劣战略平衡一、举例阐明混合战略纳什平衡例2.8猜左右手游戏第四节混合战略纳什平衡

乙甲(q)猜左手(1-q)猜右手(p)放左手-1,

11,

-1(1-p)放右手1,

-1-1,

1在甲选,乙选这种战略时,他们的期望成效分别为:混合战略与期望成效甲和乙的目的是:最优化的一阶条件是:

混合战略纳什平衡

混合战略纳什平衡为:

混合战略纳什平衡1、混合战略〔mixedStrategy)局中人i的一个混合战略是在其纯战略空间上的一个概率分布,其中是i选择战略的概率。局中人i的混合战略空间是他的一切混合战略构成的集合。纯战略可以了解为混合战略的特例。如等价于

二、混合战略纳什平衡在混合战略组合下,局中人i的期望成效函数为:

其中2、期望成效函数在战略型博弈中,假设对于每个局中人i,存在,都有

或那么称是博弈G的一个混合战略纳什平衡。3、混合战略纳什平衡奇数定理(Wilson1971):几乎一切的有限博弈都有奇数个纳什平衡。4、奇数定理例2.11社会保证博弈局中人:政府和下岗工人策略:政府:救援,不救援下岗工人:找任务,不找任务支付矩阵为:

三、运用举例

工人政府找工作不找救济3,2-1,3不救济-1,10

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论