《战略与决策》第八章博弈分析方法_第1页
《战略与决策》第八章博弈分析方法_第2页
《战略与决策》第八章博弈分析方法_第3页
《战略与决策》第八章博弈分析方法_第4页
《战略与决策》第八章博弈分析方法_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、战略与决策第八章 博弈分析方法 第八讲 博弈分析方法8.1 博弈论概述8.1.1 博弈论简史8.1.2 博弈论的基本概念8.2 博弈的基本类型8.2.1 完全信息静态博弈:纳什均衡8.2.2 完全信息动态博弈:子博弈精炼纳什均衡8.2.3 不完全信息静态博弈:贝叶斯纳什均衡8.1 博弈论概述著名经济学家泰勒尔(Jean Tirole)说:“正如理性预期使宏观经济学发生革命一样,博弈论广泛而深远地改变了经济学家的思维方式。”如果情况果真如此,对今天的经济学家来说,不懂得博弈论显然是不行了。8.1.1 博弈论简史博弈论(game theory)又称对策论、游戏理论或策略运筹学。它最早由德国数学家、

2、哲学家莱布尼茨于1710年提出。1713年,杰姆斯瓦尔德格雷夫首次提出了对策论中的极大中的极小定理(minimax)。8.1.1 博弈论简史1944年,以冯诺依曼和奥斯卡摩根斯坦合著的博弈论与经济行为一书的出版为标志,博弈论得以广泛应用于经济学领域,并成为微观学的一个新的重要组成部分。1994年诺贝尔经济学奖授给了三位博弈论专家:美国普林斯顿大学的纳什(Nash)、加利福尼亚大学的海萨尼(Harsanyi)与德国波恩大学经济学家泽尔腾(Selten). 8.1.1 博弈论简史博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论与传统经济学有关决策理论是有区别的。在传

3、统微观经济学中,寡头市场是一个例外,而这一部分正是博弈论最主要的应用领域之一。 8.1.1 博弈论简史博弈论包括合作博弈和非合作博弈两种类型。现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈。合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,就是说,有没有一种binding agreement。如果有,就是合作博弈;反之,则是非合作博弈。 8.1.1 博弈论简史非合作博弈论创立于20世纪50年代。1950年,年仅22岁的纳什连续发表两篇划时代的论文,奠定了现代非合作博弈论的基石。 泽尔腾则在20世纪60年代中期将纳什均衡的概念引入动态分

4、析。 海萨尼在20世纪60年代末把不完全信息引入博弈分析。 8.1.1 博弈论简史进入20世纪80年代后,克瑞普斯(Kreps)和威尔逊(wilson)则对不完全信息动态博弈的研究作出了突出的贡献,并提出了更高级的均衡概念:“贝叶斯精炼纳什均衡”或“完美贝叶斯均衡”。 严格地说,博弈论并不是经济学的一个分支。实际上,它属于数学范畴。 8.1.1 博弈论简史至于博弈论专家获经济学奖,原因大致有三点:博弈论在经济学领域应用最广泛、最成功,博弈论的许多成果也是借助于经济学的例子来发展引申的。经济学家对博弈论的贡献也越来越大,特别是在动态分析和不完全信息引入博弈后。最根本性的原因是经济学和博弈论的研究

5、模式是一样的,都强调个人理性,即追求给定条件下效用最大化。 5.1.2 博弈论的基本概念 博弈论的基本概念包括:参与人,行动,信息,策略,支付(效用),结果和均衡。1)参与人(player),也叫局中人,指的是一个博弈中的决策主体。他的目的是通过选择行动(或战略)以最大化自己的支付(效用)水平。参与人可能是自然人,也可能是团体 5.1.2 博弈论的基本概念2)行动(actions),是参与人在博弈的某个时点的决策变量。参与人的行动可能是离散的,也可能是连续的。参与人的行动往往是有顺序的。行动顺序对博弈结果很重要。同样参与人,同样行为组合,行动顺序不同,会导致每个参与人的最优选择不同,得到不同的

6、博弈结果。 5.1.2 博弈论的基本概念3)信息(information),是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。信息集理解为参与人在特定时刻有关变量值的知识。完全信息是指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性。 5.1.2 博弈论的基本概念4)策略(strategies),也叫战略,是参与人在给定信息集的情况下的行动规则。它规定参与人在什么时候选择什么行动。因为信息集包含了一个参与人有关其他参与人之前行动的知识,战略告诉该参与人如何对其他参与人的行动作出反应,因而战略又叫参与人的“相机行动方案”。 5.1.2

7、 博弈论的基本概念5)支付(payoff),是指在一个特定的战略组合下参与人得到的确定效用水平,或者是参与人得到的期望效用水平。它是参与人真正关心的东西,并且是所有参与人战略或行动的函数。5.1.2 博弈论的基本概念 6)结果(outcome),是博弈分析者所要揭示的东西,是分析者感兴趣的要素的集合,如均衡战略组合、均衡行动组合、均衡支付组合等。 7)均衡(equilibrium),是所有参与人的最优战略组合或行动组合。一个博弈中可能出现多个均衡。 52 博弈的基本类型博弈的类型可以从两个角度描述。第一个是从参与人行动的先后顺序的角度,博弈可以分为静态与动态两种。静态博弈指的是博弈中,参与人同

8、时选择行动或虽非同时但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指参与人行动有先后顺序,且后行动者能观察到先行动者行动的选择。 52 博弈的基本类型第二个是从参与人对有关其他参与人(竞争对手)的特征、战略空间及支付函数的知识的角度,博弈可分为完全信息博弈和不完全信息博弈。完全信息博弈指的是每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识;否则,就是不完全信息。 52 博弈的基本类型将上述两种划分结合起来,就能得到4种不同类型的博弈,即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。与上述4种博弈相对应的是4个均衡概念,即纳什均衡

9、、子博弈精炼纳什均衡、贝叶斯纳什均衡以及精炼贝叶斯纳什均衡 行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡(纳什,1950,1951)完全信息动态博弈子博弈精炼纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡(海萨尔,1967,1968)不完全信息动态博弈精炼贝叶斯纳什均衡泽尔腾(1975)克瑞普斯和威尔逊,1982)(费得伯格和泰勒尔,1991)表1 博弈的分类及对应的均衡概念 5.2.1 完全信息静态博弈:纳什均衡完全信息静态博弈是一种最简单的博弈,在这种博弈中,由于每个人是在不知其他人行动的情况下选择自己的行动,故战略与行动是一个意思。博弈分析的目的是预测博弈的

10、结果,而纳什对非合作博弈的主要贡献正是定义了非合作博弈及其一般均衡解,并证明了这个均衡解的存在,从而奠定了非合作博弈的基础。 一、最优策略均衡 一般来说,由于每个参与人的支付(效用)是博弈中所有参与人的战略的函数,因此每个参与人的最优战略选择依赖于所有其他参与人的选择。在一些特殊的博弈中,不论其他参与人的策略如何,能够使自己的支付(效用)对自己最为有利的策略叫最优策略。 一、最优策略均衡 企业A的策略广告促销10,515,0不做广告6,810,2广告促销不做广告企业B的策略广 告 战二、重复剔除的最优策略均衡 在每个参与人都有最优策略的情况下,最优策略均衡是很理想的,然而,大多数情况下,最优策

11、略均衡是不存在的。尽管如此,在有些博弈中,我们仍可以应用最优策略的逻辑找到均衡。 二、重复剔除的最优策略均衡 假定猪圈内有大小猪各一头,在猪圈的一头有一个猪食槽,另一头安装一个按钮,控制猪食的供应。按一下按钮,有8个单位猪食进槽,但需要支付2个单位成本。若大猪先到,大猪吃到7个单位,小猪只能吃到1个单位;若小猪先到,大猪与小猪各吃到4个单位;若两猪同时到,大猪吃到5个单位,小猪吃到3个单位。 二、重复剔除的最优策略均衡 智猪博弈3, 1 2, 4 7,-1 0, 0 大猪按等待小猪按等待三、纳什均衡 在相当多的博弈中,我们无法使用重复剔除劣战略的办法找出均衡解。这时我们需要引入纳什均衡。纳什均

12、衡是完全信息静态博弈解的一般概念。它指在知道其他参与人采取的策略后,能够使自己的支付效用最为有利的策略组合。 三、纳什均衡 比如:如果B的选择给定,A的选择是最优的,以及A的选择给定,B的选择是最优的话,我们就说这一对策略组合是纳什均衡。假定A、B两企业都有生产麦片食品的业务,各自有两种策略,即生产咸麦片和甜麦片。A、B企业支付矩阵见下表 三、纳什均衡 -5,-5 10,10 10,10 -5,-5 A企业的策略B企业的策略生产咸麦片生产甜麦片麦片商博弈生产咸麦片生产甜麦片三、纳什均衡 -3,-3 2,0 0,20,0 A进退B进退斗鸡博弈四、混合策略每个行为人只作出一个选择并始终坚持这个选择

13、的策略称为纯策略。然而,在纯策略博弈中,往往会碰到找不到纳什均衡的情况。如果允许行为人使他们的策略随机化,也就是说,行为人对每项选择都指定一个概率,并按照这些概率作出他们的选择,这种策略叫作混合策略。四、混合策略我们可以通过用混合策略代替纯策略的方法来求出纳什均衡解。比如社会福利博弈,参与人是政府和一个流浪汉。流浪汉有两种策略:寻找工作或游荡;政府也有两种策略:救济或不救济。政府想帮助流浪汉,但前提是后者必须努力找工作,否则,不予救济;而流浪汉只有在得不到政府救济时才会寻找工作。四、混合策略3,2 -1,3 -1,1 0,0 政府流浪汉寻找工作游荡社会福利博弈救济不救济四、混合策略前面讨论的是

14、不存在纯策略纳什均衡但存在混合策略纳什均衡的博弈。有些博弈既存在纯策略均衡,也存在混合策略均衡。现举一例。有一男一女谈恋爱,晚上约会时或者去看足球比赛,或者去看芭蕾舞演出。男的偏好足球,女的则更喜欢芭蕾,但他们都宁愿在一起而不愿分开。 四、混合策略2,1 0,00,0 1,2 男女足球芭蕾性别战足球芭蕾五、囚犯的困境 博弈的纳什均衡的另一个问题是它并不一定导致帕累托有效的结果。博弈论中最著名的例子“囚徒的困境”深刻揭示了这一问题: 五、囚犯的困境 -3,-3 0,-6 -6,0 -1,-1 囚徒A囚徒B交代不交代囚徒的困境交代不交代五、囚犯的困境 囚徒困境反映了个人理性与集体理性的冲突。若两人

15、都能拒不交代,那么他俩的境况就会比其他策略下更好一些! 问题在于双方没有办法协调他们的行动。即使两囚徒在被捕之前约定双方都拒不交代仍然于事无补,因为没有人有积极性遵守事先的约定。五、囚犯的困境 囚犯的困境在经济和政治现象中有广泛的应用。例如,裁军计划、停止核试验其次,两个寡头选择产量的博弈也属于此类。 5.2.2 完全信息动态博弈:子博弈精炼纳什均衡一、动态博弈与精炼纳什均衡二、有限次重复博弈:“连锁店之谜”三、无限次重复博弈:“针锋相对(tit for tat)策略 一、动态博弈与精炼纳什均衡动态博弈概念的意义是将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是

16、最优的,决策者要“随机应变”、“向前看”,而不是固守旧略。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。 一、动态博弈与精炼纳什均衡博弈的标准型表达有3个要素:参与人、可选择策略、及支付函数。 博弈的扩展型表达包括五个要素:参与人、每个参与人选择行动的时点、每个参与人在每次行动时可供选择的行动集合、每个参与人在每次行动时有关对手过去行动选择的信息、支付函数。 一、动态博弈与精炼纳什均衡40,50 -10,00,3000,300 企业B企业A高价低价市场进入阻挠博弈进入不进入一、动态博弈与精炼纳什均衡泽尔腾认为:只有当参与人的策略在每一个子博弈中都构成纳什均衡才叫

17、作精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 应该强调的是,一个精炼均衡首先必须是一个纳什均衡,反之不然。只有那些不包含不可置信威胁的纳什均衡才是精炼的纳什均衡。 一、动态博弈与精炼纳什均衡企业B 企业A0,300进入不进入40,50-10,0高价合作低价竞争一、动态博弈与精炼纳什均衡有些纳什均衡之所以不是精炼均衡,是因为它们包含不可置信的威胁; 如果参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数,使不可信的威胁变得可信,博弈的精炼均衡就会相应改变。承诺行动能使不可信的威胁变得可信。 一、动态博弈与精炼纳什均衡承诺行动是指当事人在不施行这种不可置信

18、威胁时,就会付出更大的代价。尽管这种代价不一定发生,但承诺行动会给当事人带来很大好处,因为它会改变均衡结果。一般说来,承诺行动的成本越高,威胁的可信度就越高。 例如:破釜沉舟 二、有限次重复博弈:“连锁店之谜”如果有相同的参与人反复地进行博弈,每个参与人面前都有出现新策略的可能性。如果另一个参与人在这次作出背叛的选择,那么你就可以在下一次选择背叛以示报复。在一个重复对策中,每一个参与人都有机会树立合作的信誉,并以此鼓励对方也树立起合作的信誉。 二、有限次重复博弈:“连锁店之谜”影响均衡结果的主要因素是博弈的次数及信息的完整性。如果博弈只进行一次,参与人只会关心一次性支付;但如果博弈重复多次,参

19、与人可能会为长期利益暂时牺牲眼前利益从而选择不同的策略。 二、有限次重复博弈 连锁店之谜40,50 -10,00,3000,300 企业B企业A高价低价市场进入博弈进入不进入二、有限次重复博弈:“连锁店之谜”囚徒困境也有类似的情况。强盗分金算法(类比) 可以说,只要博弈重复的次数是有限的,则博弈的结果就将与一次性博弈(指对局一次)的结果相同。 强盗分金算法:10987654321109601010101099601010101897010101079701010169801010598010149901039901210001三、无限次重复博弈:“针锋相对(tit for tat)策略 “针锋

20、相对”策略,即在第一局中,你采取合作(不交代)的策略,在以后的每一局中,如果你的对手在上一局采取不合作,那么你也选不合作;反之,如果他合作,那么下一局你也选合作。换句话说,如果你的对手上一局选取什么策略,你在这一局就选择什么策略。三、无限次重复博弈:“针锋相对(tit for tat)策略 “针锋相对”的策略的确非常令人满意,因为它能立即对背叛加以惩罚。另一种对策,叫“冷酷策略”。它指如果第一次对方背叛了我,我将永远对他进行惩罚(采取不合作的策略),丝毫不给他“赎过自新”的机会。克雷普斯有关“声誉”的观点可以用来说明重复博弈导致帕累托有效的理论。 5.2.3 不完全信息静态博弈 贝叶斯纳什均衡

21、一、不完全信息静态博弈与逆运算纳什均衡二、古诺寡头竞争模型:贝叶斯纳什均衡应用 三、一级密封价格拍卖贝叶斯均衡应用一、不完全信息静态博弈与逆运算纳什均衡不完全信息博弈中,至少有一个参与人不知道其他参与人的支付函数。以市场进入为例:对潜在进入者企业B来说,不知道企业A的成本函数,也不知道企业A是否采取斗争(低价)策略。在给定企业B进入时,高成本企业的最优选择是高价(合作),而低成本企业的最优策略是低价(斗争)。 一、不完全信息静态博弈与 逆运算纳什均衡40,50 -10,00,3000,300 企业B企业A高价低价市场进入:高成本的情况进入不进入一、不完全信息静态博弈与 逆运算纳什均衡30,10

22、0 -10,1400,4000,400 企业B企业A高价低价市场进入:低成本的情况进入不进入一、不完全信息静态博弈与 逆运算纳什均衡因为企业B不知道企业A的成本函数,所以处于进退两难之境。这种情况的博弈以前人们认为是没法分析的,直到1966年才由海萨尼解决。他引人一个虚拟的参与人“自然”。自然不同于一般参与人之处在于它在所有后果之间是无差异的。一、不完全信息静态博弈与 逆运算纳什均衡“贝叶斯纳什均衡”的概念,表述为:在静态不完全信息博弈中,参与人同时行动,没有机会观察到别人的选择。给定别人的策略选择,每个参与人的最优策略依赖于自己的类型。 它是一种类型依从战略组合:在给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说,没有人有积极

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论