第八章博弈论_第1页
第八章博弈论_第2页
第八章博弈论_第3页
第八章博弈论_第4页
第八章博弈论_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一节第一节 博弈论的基本概念与分类博弈论的基本概念与分类 第二节第二节 完全信息博弈完全信息博弈第三节第三节 不完全信息博弈不完全信息博弈( (自学)自学)第八章第八章 博弈论博弈论- -无处不在的游戏“要想在现代社会做一个有文化的人,你要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解必须对博弈论有一个大致了解”。 保罗保罗萨缪尔森萨缪尔森 一、博弈论的基本概念一、博弈论的基本概念 1 1 、 定 义 :定 义 : 博 弈 论 (博 弈 论 ( g a m e g a m e theorytheory),又称对策论,),又称对策论,是研究相是研究相互依赖、相互影响的决策主体的理互

2、依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结性决策行为以及这些决策的均衡结果的理论。果的理论。第一节第一节 博弈论的博弈论的基本概念与分类基本概念与分类通俗地讲,通俗地讲,博弈论是一种博弈论是一种“游戏理游戏理论论”。其准确的定义是:其准确的定义是:一些个人、一些个人、团队或其他组织,面对一定的环境团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中策略进行选择并加以实施,并从中各自取得相应结果

3、或收益的过程。各自取得相应结果或收益的过程。续上页续上页2 2、博弈论的演进博弈论的演进(1 1)早期博弈论的萌芽)早期博弈论的萌芽(田忌赛马)(田忌赛马) (2 2)合作型博弈(冯)合作型博弈(冯诺依曼与摩根斯诺依曼与摩根斯特恩于特恩于19441944年合著年合著博弈论和经济行博弈论和经济行为为););(3 3)非合作博弈(纳什均衡);)非合作博弈(纳什均衡);(4 4)2020世纪世纪5050年代以后,泽尔腾、海年代以后,泽尔腾、海萨尼等人对博弈论作了进一步的完善,萨尼等人对博弈论作了进一步的完善,使之更为实用。使之更为实用。附:纳什其人附:纳什其人3、博弈论模型简介博弈论模型简介博弈论模

4、型可以用五博弈论模型可以用五个方面来描述个方面来描述 GP,A,S,I,U P(player): 为局中人,博弈的参与者,为局中人,博弈的参与者,也称为也称为“博弈方博弈方”,局中人以最终实现自身,局中人以最终实现自身利益最大化为目标。利益最大化为目标。 A(action) :为各局中人的所有可能的策略或为各局中人的所有可能的策略或行动的集合。行动的集合。根据该集合是有限还是无限,根据该集合是有限还是无限,可分为有限博弈和无限博弈。可分为有限博弈和无限博弈。S(strategies) :博弈的进程,也是博弈进行的:博弈的进程,也是博弈进行的次序。次序。静态博弈与动态博弈。静态博弈与动态博弈。

5、I(information) :博弈信息,如果博弈各方:博弈信息,如果博弈各方对各种局势下所有局中人的得益状况完全对各种局势下所有局中人的得益状况完全清楚,称之为清楚,称之为完全信息博弈完全信息博弈。反之为。反之为不完不完全信息博弈。全信息博弈。 U:为局中人获得利益,也是博弈各方追为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,求的最终目标。根据各方得益的不同情况,分为分为零和博弈和变和博弈零和博弈和变和博弈。二、博弈的分类二、博弈的分类1 1、按照、按照参与人之间是否合作参与人之间是否合作进行分类,博弈进行分类,博弈可分为可分为合作博弈和非合作博弈。合作博弈和非合作博

6、弈。合作博弈合作博弈是指参与人之间有着一个对各方具是指参与人之间有着一个对各方具有约束力的协议,参与人在协议范围内进行有约束力的协议,参与人在协议范围内进行的博弈。反之,就是非合作博弈。的博弈。反之,就是非合作博弈。前者前者主要强调的是团体理性;主要强调的是团体理性;而后者而后者主要研主要研究人们在利益相互影响的局势中如何选择策究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,即策略选择问题,略使得自己的收益最大,即策略选择问题,强调的是个人理性。强调的是个人理性。2 2、在非合作博弈中,按照、在非合作博弈中,按照参与人的先后顺参与人的先后顺序序进行分类,又可分为进行分类,又可分为静

7、态博弈和动态博静态博弈和动态博弈。弈。静态博弈静态博弈是指,博弈中参与人同时选择行是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。不知道行动在先者采取了什么具体行动。动态博弈动态博弈是指参与人的行动有先后顺序,是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。选择,并据此作出相应的选择。3 3、按照按照参与人对其他参与人的了解程度参与人对其他参与人的了解程度进进行分类,博弈可分为行分类,博弈可分为完全信息博弈和不完完全信息博弈和不

8、完全信息博弈全信息博弈。n完全信息博弈完全信息博弈是指:是指:在每个参与人对所有在每个参与人对所有其他参与人的特征、战略和支付函数都有其他参与人的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。精确了解的情况下,所进行的博弈。n如果了解得不够精确,或者不是对所有的如果了解得不够精确,或者不是对所有的参与人都有精确的了解,在这种情况下进参与人都有精确的了解,在这种情况下进行的博弈就是行的博弈就是不完全博弈不完全博弈。 第一节第一节 博弈论的博弈论的基本概念与分类基本概念与分类博弈的分类及对应的均衡概念博弈的分类及对应的均衡概念 第一节第一节 博弈论的博弈论的基本概念与分类基本概念与分类行

9、动顺序行动顺序完全信息完全信息动动 态态静静 态态不完全信息不完全信息完全信息静态博弈完全信息静态博弈信信 息息不完全信息静态博弈不完全信息静态博弈完全信息动态博弈完全信息动态博弈不完全信息动态博弈不完全信息动态博弈纳什均衡纳什均衡贝叶斯纳什均衡贝叶斯纳什均衡精炼贝叶斯纳什均衡精炼贝叶斯纳什均衡子博弈精炼纳什均衡子博弈精炼纳什均衡一、完全信息静态博弈一、完全信息静态博弈二、二、完全信息动态博弈完全信息动态博弈第二节第二节 完全信息完全信息博弈博弈一、完全信息静态博弈:一、完全信息静态博弈:纳什博弈论的原理与应用纳什博弈论的原理与应用 、占优策略均衡、占优策略均衡无论其他参与人如无论其他参与人如

10、何选择自己的策略,该参与人的最优策略何选择自己的策略,该参与人的最优策略选择是惟一的。选择是惟一的。(1 1)经典案例经典案例: :囚徒困境囚徒困境 “ “囚犯困境囚犯困境”讲的是两个同案犯罪嫌疑犯讲的是两个同案犯罪嫌疑犯(囚徒)被警方拘捕后,为防其相互间串(囚徒)被警方拘捕后,为防其相互间串供,而分别拘捕、隔离审问时,两疑犯所供,而分别拘捕、隔离审问时,两疑犯所面临的认罪策略选择的问题。面临的认罪策略选择的问题。 囚徒B坦白 抵赖囚徒A坦白抵赖8,81,1010, 1 2 ,2n在博弈中,如果所有的参与人都有占优战略存在博弈中,如果所有的参与人都有占优战略存在,因而博弈将在所有参与人的占优战

11、略的基础在,因而博弈将在所有参与人的占优战略的基础上达到均衡。这种均衡称为上达到均衡。这种均衡称为占优战略均衡占优战略均衡。在上。在上表中的表中的“A A坦白坦白,B,B也坦白也坦白”就是占优战略均衡就是占优战略均衡(2 2)条件:)条件:占优策略虽然要求每个参与人是理占优策略虽然要求每个参与人是理性的,但并不要求每个参与人知道其他参与人也性的,但并不要求每个参与人知道其他参与人也是理性的。是理性的。(3 3) “ “囚犯困境囚犯困境”的意义:的意义:首先首先对亚当对亚当斯密的斯密的“看不见的手看不见的手”的原理提的原理提出挑战。出挑战。个人理性与集体理性的冲突。个人理性与集体理性的冲突。按按

12、照斯密的理论,在市场经济中,每一个人都从利照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。己的目的出发,而最终全社会达到利他的效果。从从“纳什均衡纳什均衡”引出一个悖论:从利己目的出发,引出一个悖论:从利己目的出发,结果损人不利己。两个囚徒的命运就是如此。从结果损人不利己。两个囚徒的命运就是如此。从这个意义上说,这个意义上说,“纳什均衡纳什均衡”提出的悖论实际上提出的悖论实际上动摇了西方经济学的基石动摇了西方经济学的基石 。 其次其次可悟出一条真理:合作是有利的可悟出一条真理:合作是有利的“利己利己策略策略”。 (4 4)应用:)应用:奥尔森奥尔森的的集体行

13、动的逻辑集体行动的逻辑多人囚犯两难博弈多人囚犯两难博弈 (n-person (n-person prisoners dilemma games)prisoners dilemma games),成为,成为非合作博弈论的一个重要分支。非合作博弈论的一个重要分支。 重复剔除的占优策略均衡重复剔除的占优策略均衡(1 1)智猪博弈)智猪博弈 按按钮对于吃食量的影响按按钮对于吃食量的影响第二节第二节 完全信息完全信息博弈博弈按按钮的猪按按钮的猪 吃到的猪食数量大猪大猪 小猪小猪 大猪大猪4单位4单位 小猪7单位1单位两猪同时5单位3单位智猪博弈智猪博弈第二节第二节 完全信息完全信息博弈博弈小猪按按钮等待

14、大猪按按钮 3, 1 2,4等待 7,1 0,0重复剔除的占优策略均衡重复剔除的占优策略均衡首先找出某参与人的严首先找出某参与人的严格劣策略,将它剔除,重新构造一个不包括已剔除策略的格劣策略,将它剔除,重新构造一个不包括已剔除策略的新博弈;然后,继续剔除这个新的博弈中某一参与人的严新博弈;然后,继续剔除这个新的博弈中某一参与人的严格劣策略;重复进行这一过程,直到剩下惟一的参与人策格劣策略;重复进行这一过程,直到剩下惟一的参与人策略组合为止。剩下的这个惟一的参与人组合,就是这个博略组合为止。剩下的这个惟一的参与人组合,就是这个博弈的均衡解弈的均衡解。严格劣策略:严格劣策略:是指在博弈中,不论其他

15、参与人采取什么策是指在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略,某一参与人可能采取的策略中,对自己严格不利的策略。略。(2 2)应用)应用: :集体行动出现的条件集体行动出现的条件之一之一是集体成员是集体成员的不对称。的不对称。 第二节第二节 完全信息完全信息博弈博弈3 3纳什均衡纳什均衡在这一均衡中,每个参与人都确信,在这一均衡中,每个参与人都确信,在给定其他参与人战略决定的情况下,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。他选择了最优战略以回应对手的战略。纳什均衡是完全信息静态博弈解的一般纳什均衡是完全信息静态博弈解的一

16、般情况。情况。第二节第二节 完全信息完全信息博弈博弈性性 别别 战战第二节第二节 完全信息完全信息博弈博弈女方看足球逛商场男方看足球3,10,0逛商场0,01,3第二节第二节 完全信息完全信息博弈博弈一、完全信息动态博弈:一、完全信息动态博弈:、子博弈精练纳什均衡子博弈精练纳什均衡n 房地产开发博弈(静态)房地产开发博弈(静态) B 开发 不开发 A开发不开发3,3 1,0 0, 1 0,0第二节第二节 完全信息完全信息博弈博弈在行动开始前的在行动开始前的A A看来,如果不计得失,看来,如果不计得失,B B有有四种战略可选择。四种战略可选择。 第一第一,无论,无论A A是否开发,是否开发,B

17、B都要开发。都要开发。 第二第二,如果,如果A A开发,开发,B B也开发;如果也开发;如果A A不不开发,开发,B B也不开发。也不开发。 第三第三,如果,如果A A开发,开发,B B就不开发;如果就不开发;如果A A不开发不开发 ,B B就开发。就开发。 第四第四,无论,无论A A是否开发,是否开发,B B必定开发。必定开发。第二节第二节 完全信息完全信息博弈博弈先行动者先行动者A A对对B B预测结果的收益矩阵预测结果的收益矩阵 B开发,开发 开发,不开发 不开发,开发 不开发,不开发 A开 发不开发3,3 3, 3 1, 0 1,0 0, 1 0, 0 0, 1 0,0第二节第二节 完

18、全信息完全信息博弈博弈 只有当某一战略组合在每一个子博弈上都只有当某一战略组合在每一个子博弈上都构成一个纳什均衡,这一战略组合才是构成一个纳什均衡,这一战略组合才是子子博弈精练纳什均衡。博弈精练纳什均衡。第二节第二节 完全信息完全信息博弈博弈2 2、重复博弈、重复博弈(1 1)定义:是指同样结构的博弈重复许多次,)定义:是指同样结构的博弈重复许多次,其中每次博弈称为阶段博弈。其中每次博弈称为阶段博弈。(2 2)影响重复博弈均衡结果的主要因素:博弈)影响重复博弈均衡结果的主要因素:博弈重复的次数和信息的完备性。重复的次数和信息的完备性。(3 3)博弈重复次数为无限次与)博弈重复次数为无限次与冷酷策略冷酷策略 博弈重复次数为有限次时每个博弈重复次数为有限次时每个阶段博弈的均阶段博弈的均衡解都是一次性博弈的纳什均衡解衡解都是一次性博弈的纳什均衡解。第二节第二节 完全信息完全信息博弈博弈3 3、 动态博弈战略行动动态博弈战略行动n在动态博弈中,参与人为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论