第三章企业博弈理论_第1页
第三章企业博弈理论_第2页
第三章企业博弈理论_第3页
第三章企业博弈理论_第4页
第三章企业博弈理论_第5页
已阅读5页,还剩139页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 企业博弈理论n1 经济学理论与博弈论经济学理论与博弈论 n2 博弈理论的分析框架博弈理论的分析框架 n3 企业博弈理论企业博弈理论本章讨论n举例分析我国经济发展中政府和企业之间是如何博弈的?1 经济学理论与博弈论经济学理论与博弈论n一、经济理论与博弈论的关系 n二、博弈理论发展的历史回顾 一、经济理论与博弈论的关系n经济学是研究稀缺资源配置的,而决定稀缺资源配置效率的关键是人们的决策行为。因此,经济学是研究人类行为的学科,经济学研究人类行为时依据理性人假设,即每个人都有其偏好,都是在面对既定约束条件下,最大化其偏好,每个人在选择经济行为时,面对的约束和追求的偏好都可以用数学函数表达,使

2、得经济学家用数学工具分析人类的行为成为可能n由于人类社会各成员之间只有相互依赖才能更好地生存和发展,所以,每个人在最大化其效用时,需要相互合作,为了获得合作的潜在利益,有效化解合作中可能出现的冲突,理性的人们设计了很多制度以规范各自的行为,其中,价格制度就是人们为实现合作,有效化解冲突的制度之一一、经济理论与博弈论的关系n新古典价格理论有两个重要假定:n市场上的卖者和买者数量众多,卖者之间、买者之间竞争的结果使得市场供求及价格变化充满了不确定性,任何一位卖(买)者都无法影响市场价格变化的方向,市场是竞争完全的n第二,市场信息在交易者之间呈现对称分布状态。但事实上,这两个条件都不完全具备一、经济

3、理论与博弈论的关系n市场上交易者的数量非常有限,有限交易者之间可借助于组织形式达成价格共谋,因此,现实中不存在严格意义的完全竞争市场,竞争者的行为相互影响,决策者在决策时,除了考虑在满足其约束条件的前提下,如何实现个人偏好最大化,还要考虑其决策结果可能对他人带来的影响以及其他决策者行为可能对其追求的结果产生影响一、经济理论与博弈论的关系n市场信息在各交易者之间往往呈现不对称分布,一般情况下,关于产品或服务的信息卖者要比买者掌握的更多,而占有信息优势的一方可能会利用信息优势获利,因此,仅靠价格制度在信息不对称的市场中是很难实现交易者之间合作带来的潜在利益和有效化解合作中的冲突,只有依靠其他非价格

4、制度与价格制度形成的制度体系来实现一、经济理论与博弈论的关系n博弈论是研究决策行为发生直接作用时候的决策以及决策均衡的(张维迎,1996)n在市场中某一决策者的决策行为和结果将影响其他决策者的决策行为和结果,反之该决策者的决策行为和结果又受到其他决策者决策行为和结果的影响,在决策者间相互影响的互动过程中,各位决策者的结果达到均衡状态的决策问题一、经济理论与博弈论的关系n传统微观经济学研究的决策理论也考虑决策者之间的相互竞争,但这种相互间的竞争关系在市场中呈现出一种间接影响关系n哈耶克认为在完全竞争的市场中,价格制度是一种能够高效传递其他市场参与者行为信息,指导人们决策的自动机制一、经济理论与博

5、弈论的关系n价格体系的最重要的特点是,其运转所需要的知识很经济。就是说,参与这个体系的个人只需掌握很少的信息便能采取正确的行动。最关键的信息只是以最简短的形式,通过某种符号来传递的,而且,只传递给有关的人一、经济理论与博弈论的关系n价格制度是借助于价格信号,有效地将无数分散在各参与者头脑中与市场选择相关的知识、技能、经验以及参与者之间自发产生的相互作用非人为地聚集起来,参与者通过对价格信号的利用和综合判断作出决策,从而推动市场经济发展的最好组织形式之一,价格机制扮演的就是市场信息传递角色,它在这方面的作用是无与伦比的一、经济理论与博弈论的关系n因而,在传统微观经济学框架内,市场竞争者之间相互作

6、用的结果,是通过价格信号表示出来,而价格信号又成为竞争者制定决策时,构建其目标函数的重要依据之一,所以说,市场参与者之间的直接影响和竞争关系,在价格制度框架中演变成一种间接关系。一、经济理论与博弈论的关系n博弈论则深入研究了市场竞争中,生产者之间、生产者与消费者之间以及消费者之间的相互作用和直接影响的关系和最后均衡的结果揭示了作为生产者的不同企业之间在考虑直接相互作用的情况下,如何实现自身利益最大化及最后形成的均衡解,为深入研究作为个体的不同消费者形成的消费者群体以及消费者个体行为拓宽了思路一、经济理论与博弈论的关系二 博弈理论发展的历史回顾n(1)博弈理论的产生及早期研究n(2)博弈理论的快

7、速发展期 n(3)博弈理论的成熟和完善期 (1)博弈理论的产生及早期研究n博弈理论又称对策理论、游戏理论n博弈是指决策主体(个人、企业、集团、社团、政党、国家等)在相互对抗中,对抗双方(或多方)相互依存的一系列策略和行动的过程集合n博弈论(Game Theory)是专门研究博弈如何出现均衡的规律的学科(1)博弈理论的产生及早期研究n其思想的应用可追溯到2000年前我国古代的齐威王和田忌赛马的经典案例n1838年古诺(Cournot)提出的关于产量决策的两寡头垄断竞争模型和1883年伯特兰德(Bertrand)提出的关于价格决策的“伯特兰德模型,则是现代博弈理论研究的起点(1)博弈理论的产生及早

8、期研究n1929年豪泰林(Hotelling)提出了存在空间产品差异的两厂商竞争博弈模型n理论界普遍认为,博弈理论的创立是以1944年冯诺依曼和摩根斯坦合著的博弈论与经济行为(The Theory of Games and Economic Behaviour)一书为标志(1)博弈理论的产生及早期研究n主要研究了经济主体的典型行为特征,提出了策略型和扩展型等基本博弈模型n但冯诺依曼和摩根斯坦恩仅对博弈论作了初步的理论化,观其整个理论体系,无论从理论构架还是从研究方法来看,都还不是很成熟(2)博弈理论的快速发展期n20世纪50-60年代是博弈理论研究、发展的重要阶段,也是出现博弈理论研究大师的时

9、代,合作博弈理论在这一时期达到顶峰,理论界将研究的重点逐渐转向非合作博弈理论n纳什(Nash)在1950年、1951年发表的两篇关于非合作博弈的重要文章,并提出了“纳什均衡”这一非合作博弈理论的核心概念,揭示了博弈理论和经济均衡之间的内在联系,抓住了博弈论研究的关键问题(2)博弈理论的快速发展期n1950年塔克(Tucker)定义了“囚徒困境”(prisonersdilemma)n1952-1953年夏普利提出核(Core)作为合作博弈的一般解的概念,还夏普利提出了值等概念(2)博弈理论的快速发展期n1965年,泽尔腾(Selten)将纳什均衡的概念引入到动态分析,提出了“精炼纳什均衡” 概念

10、,探讨了动态博弈的分析方法如倒推归纳法等分析方法,使经济博弈论的发展向前迈了一大步n19671968年海萨尼(Harsanyi)则把不完全信息引入博弈理论的研究并提出“贝叶斯纳什均衡” 的概念,初步运用随机分析方法解决信息不完全和不对称问题(3)博弈理论的成熟和完善期n1970年代,基于对完全理性假设的认识,博弈理论研究重点逐渐转向了“有限理性”下的博弈均衡,“进化博弈理论”是其中的突出代表n进化博弈理论源于生物学中进化博弈论应用的研究,在费歇尔(Fisher)和汉密尔顿关于性别比例的开创性研究工作之后,梅纳德斯密和普赖斯在合作的论文中提出了“进化稳定性策略的概念(Maynard,Price,

11、1973),他们的论文通常被看作是进化博弈理论的起点(3)博弈理论的成熟和完善期n1980年代以来,博弈论逐渐成为主流经济学的一部分,n有代表性的人物有克瑞普斯和威尔逊,他们在1982年合作发表了关于动态不完全信息博弈的研究成果n有米尔格罗姆、罗伯茨、弗登伯格、泰罗尔等,其中克瑞普斯、米尔格罗姆、罗伯茨和威尔逊在1982年发表的关于信誉问题的研究成果,被誉为“四人帮模型(3)博弈理论的成熟和完善期n博弈理论对经济理论另一个重要影响是博弈理论的著作和教材风行欧美大学,成为经济学专业的必修课n许多有名的经济学家在再版其教材时,都不同程度地补充了有关博弈理论的内容n博弈理论贯穿了几乎整个微观经济学,

12、在宏观经济学、产业组织理论及福利、劳动、环境经济学等方面的研究中也占有重要地位(3)博弈理论的成熟和完善期n以上学者所做的重大贡献,使博弈理论在一些关键性环节上取得了突破,并进一步推动了博弈理论的发展和完善n由于纳什、塞尔腾、海萨尼三人在博弈理论的发展和完善及其将博弈理论应用于经济理论和解释和解决现实问题等方面的突出贡献,使经济博弈论进入一个崭新、辉煌的发展时代,他们因此共同荣获了1994年的诺贝尔经济学奖(3)博弈理论的成熟和完善期n博弈论获此殊荣,吸引了更多学者关注博弈理论及其在经济学中的应用,并取得了更丰硕的成果,1996年,由于美国哥伦比亚大学的维克里(William Vickrey)

13、教授和英国剑桥大学的莫里斯(James Mirrlees)教授,对不对称信息条件下激励经济理论作出的基础性和开拓性贡献而获得当年的年诺贝尔经济学奖。(3)博弈理论的成熟和完善期n2001年的诺贝尔经济学奖同样被授予了研究博弈理论的专家,阿克洛夫教授、斯宾塞教授和斯蒂格利茨教授,他们在不对称信息市场理论方面所作的杰出贡献,标志着经济博弈理论的发展进入了一个崭新而辉煌的时代n这说明博弈论作为经济学科分支地位得到了最具权威性的肯定(3)博弈理论的成熟和完善期n2005年罗伯特奥曼和托马斯谢林获得诺贝尔经济学奖n奥曼很早就开始研究 “知识”等基础概念,1976年他给出了关于共同知识的数学定义,并证明了

14、一个著名结论,即如果人们能够充分交流,而且都是理性的,那么人们之间不可能对给定事件的判断存在不一致n根据这个结论进一步可以证明,人们都是在规避风险的前提下,不可能在有共同事先概率的情况下作相反投机,因而只有在交流不够,信息不充分,或者人们并不理性的情况下才可能存在投机,否则投机是不可能发生的。这就是所谓的“无投机定理”。这个定理对于理解市场经济中的许多现象具有重要意义(3)博弈理论的成熟和完善期n奥曼于1974年提出了“相关均衡” 概念,是在博弈有多重均衡、也就是人们有多重选择但需要协调的情况下,解决决策选择方面协调困难和避免冲突的重要机制之一n相关均衡是人们根据博弈策略以外的特定相关信号机制

15、进行决策选择实现的均衡n奥曼最著名的贡献在重复博弈上,他让信息不对称博弈具有某种“学习”性:当博弈一方处于信息劣势时,可以通过博弈来学习,结果是扩大了博弈的共同知识,使得纳什均衡更容易出现(3)博弈理论的成熟和完善期n谢林更多地从事博弈论地应用研究而非理论研究n谢林的博弈分析方法主要是思想、逻辑分析而非数学模型分析n谢林最著名的代表作冲突的策略。该书主要讨论军事战略、核战争、武器竞赛等问题,谢林更多地用博弈理论的分析框架分析一般的议价、谈判和冲突管理等问题n谢林在该书中提到“聚点”(focal point)理论(3)博弈理论的成熟和完善期n以 “城市博弈”为例说明聚点均衡。如果要求两个各自独立

16、地把上海、北京、南京、天津四个城市分成两个一组的两组,如果两人的分组方法相同,则都可以得到奖励,如果分法不同则都没有奖励。这个博弈每人都有三种分法,如果两个人都是任意分,则只有少数机会正好双方的分法相同(3)博弈理论的成熟和完善期n但通常在这个博弈中的实验中,参加者都知道应该把上海和南京分成一组,而把北京和天津分为一组,因为前两个城市都在南方,后两个城市都在北方,这种地理知识正是人们帮助人们进行选择的重要参考依据n因此两人都把上海和南京分成一组,把北京和天津分成一组,就是这个博弈的聚点均衡。聚点理论虽然简单,但它的思想或框架可以包容大部分均衡选择理论,对于人们理解和解决许多社会经济问题都有重要

17、作用(3)博弈理论的成熟和完善期n2007年埃里克马斯金获诺贝尔经济学奖在现代经济学最基础的领域做出了卓越贡献,包括公共选择理论、博弈论、激励理论与信息理论及机制设计,被誉当今国际经济学最受尊敬的经济学大师n马斯金1950年12月生于纽约,分别于1972、 1974 和1976年获哈佛大学数学学士,应用数学硕士学位和博士学位(3)博弈理论的成熟和完善期n1975年开始在剑桥大学进行两年的研究,1977年,在任教,1981年升为经济学教授,1985年回哈佛大学任教16年,2003年任世界计量经济学会会长,现任普林斯顿高级研究所社会研究学院讲座教授、社会科学部主任,也是普林斯顿大学访问教授,200

18、4年受邀担任武汉大学名誉教授。2007年受聘为清华大学名誉教授。2007年与莱昂尼德赫维奇和罗杰迈尔森获诺贝尔经济学奖,以表彰他们在创建和发展“机制设计理论”方面所作的贡献(3)博弈理论的成熟和完善期n瑞典皇家科学院发表的声明说,“机制设计理论”最早由赫维奇提出,马斯金和迈尔森则进一步发展了这一理论。这一理论有助于经济学家、各国政府和企业识别在何种情况下市场机制有效,何种情况市场机制无效,帮助人们确定有效的贸易机制、政策手段和决策过程。 n声明指出,“机制设计理论”的一个重要目标就是要解释何种制度或分配机制能够最大限度地减少经济损失。作为一个重要应用领域,该理论为最优贸易政策研究提供了重要的理

19、论依据 2 博弈理论的分析框架博弈理论的分析框架n一、基本概念n二、分析框架n三、纳什均衡一、基本概念n(1)博弈论n(2)参与人n(3)行动n(4)信息n(5)战略n(6)支付n(7)结果n(8)均衡(1)博弈论n博弈论(Game Theory),研究决策主体行为发生直接相互作用时候的决策以及这种决策的均衡问题,当一个人或企业的选择受到其他人、其他企业选择的影响,同时又影响到其他人、其他企业选择时的决策问题和均衡问题n俗称游戏理论或称对策论n博弈字面意思是赌博、下棋,赌博和下棋时常常要千方百计地应付对手,必须要讲究对策单人博弈和多人博弈n单人博弈只有一个博弈方,已退化为一般的最优化问题,经济

20、学中常见的求最优问题,实际上是博弈的特例n多个博弈方的博弈较单人博弈复杂,而且两人以上的博弈会出现合作博弈问题n多方博弈又将分为合作博弈与非合作博弈合作博弈和非合作博弈n分为合作博弈和非合作博弈,目前博弈论主要集中在非合作博弈领域n合作博弈与非合作博弈的主要区别在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有就是合作博弈,反之,则是非合作博弈n合作博弈强调的是团体理性、效率、公正和公平n非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的有限策略博弈和无限策略博弈n每一种策略都对应一个得益结果n从理论上讲,有限策略博弈的结果必然是有限的n无限策略

21、博弈的结果则有无穷多种可能零和博弈、常和博弈以及变和博弈n一方收益必来自另一方的损失,这样的博弈为零和博弈,零和博弈的博弈方始终是对立关系n各方都会有收益,但收益总和是一固定常数,这样的博弈为常和博弈n各方不同的策略组合会有不同的收益,这样的博弈为变和博弈n零和博弈是常和博弈的特例,常和博弈是变和博弈的特例 (2)参与人n参与人指的是一个博弈的决策主体,其参与博弈的目的是通过选择行动(或战略)以最大化自己的效用水平n参与人可能是自然人,也可能是团体,如企业、国家、甚至若干独立国家组成的集团如OPEC、欧盟、北约等n每个参与人必须有可供选择的行动和很好定义的偏好函数,那些不做决策的被动主体只当作

22、环境参数来处理虚拟参与人n在博弈论中,自然(nature)作为虚拟参与人来处理n自然是指决定外生随机变量概率分布的机制n在市场竞争博弈中,市场需求是一个随机变量,在农业生产中,降雨量变化是一个随机变量,一般假定在博弈开始时,自然以一定概率决定需求或降雨量的大小,而参与人决策的后果依赖于自然的选择n在不完全信息博弈中,自然选择参与人的类型n与一般参与人不同,自然作为虚拟参与人没有自己的支付和目标函数n一般用i=1,n代表参与人,N代表自然(3)行动n行动是参与人在博弈某个时点的决策变量。般地.我们用ai表示第i个参与人的一个特定行动,Ai=ai表示可供i选择的所有行动集合n参与人的行动可能是离散

23、的,也可能是连续的。如房地产开发商博弈中,每个参与人都只有两种行动可供选择,即Ai =开发,不开发,i= A,B,是离散的。在寡头产量竞争的古诺模型中,行动是选择产量qi , Ai =qi , qi 0是连续的(3)行动n在n人博弈中, n个参与人行动的有序集a=(a1,ai ,. an )称为行动组合,其中的第i个元素ai是第i个参与人的行动n与行动相关的一个重要问题是行动的顺序 ,在房地产开发博弈中,可能有以下顺序是(1)自然首先选择需求(大或小),然后开发商A和B同时选择开发还是不开发;(2)自然首先选择需求,然后A选择开发或不开发,最后B选择开发或不开发;(3)自然首先选择需求,然后B

24、选择开发或不开发,最后A选择开发或不开发(3)行动n行动顺序对于博弈结果非常重要,有关静态博弈与动态博弈的区分就是基于行动的顺序。同样的参与人,同样的行动集合,行动的顺序不同,每个参与人的最优选择就不同,博弈的结果就不同n在不完全信息博弈中,后行动者可以通过观察先行动者的行动来获得信息,从而使博弈分析成为预测人们行为的强有力工具n在博弈论中,一般假定参与人的行动空间和行动顺序是所有参与人的共同知识(4)信息n信息是参与人有关博弈的知识,特别是有关自然的选择、其他参与人的特征和行动的知识n信息集是描述参与人信息特征的概念,可以将其理解为参与人在特定时刻有关变量值的知识n一个参与人无法准确知道的变

25、量的全体属于一个信息集n在房地产开发博弈中,如果A不知道市场需求是大还是小,而B知道,那么,A的信息集为大,小,B的信息集为大或小;假定B先行动A后行动,那么,如果A在行动前能准确知道B选择了什么行动,A有关B行动的信息集为开发或不开发,反之,A的信息集为开发,不开发完美信息n完美信息与完全信息是两个有联系但又不完全相同的概念n完美信息是指一个参与人对其他参与人(包括虚拟参与人自然)的行动选择有准确了解的情况,即每一个信息集只包含一个值n轮到行动的博弈方是否完全了解此前对方的行动,如果完全了解则称之为具有完美信息的博弈,例如下棋,双方都清楚对方下过的着数,反之称为不完美信息的博弈 n由于信息不

26、完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。完全信息n完全信息(complete information)是指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性n得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈,例如齐威王和田忌赛马,各种马的组合对阵的结果双方都知道。反之为不完全信息博弈,例如投标拍卖,博弈各方均不清楚对方的估价共同知识n指所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道的知识n在房地产开发博弈中,每个参与人的行动集合都是共同知识,

27、如A知道自己的行动集合,B知道A的行动集合,B知道A知道自己的行动集合,A知道B知道A知道自己的行动集合等共同知识n共同知识是博弈论中的假定,在许多博弈中,即使所有参与者共同享有某种知识,每个参与人也许并不知道其他参与人知道这些知识,或者并不知道其他人知道自已拥有这些知识n在房地产开发博弈中,可能A和B都知道市场需求,但A并不知道B知道市场需求,即使A知道B知道市场需求,B可能并不知道A知道B知道市场需求(5)战略(strategies):n战略是参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动n因为信息集包含了一个参与人有关其他参与人之前行动的知识,战略告诉该参与人如

28、何对其他参与人的行动作出反应,因而战略是参与人的相机行动方案 一般用si表示第i个参与人的一个特定战略,Si=si代表第i个参与人的所有可选择的战略的集合n如果n个参与人每人选择一个战略,n维向量s=(s1,s2, ,si,sn)称为一个战略组合,其中si是第i个参与人选择的战略(5)战略n战略与行动是两个不同概念,战略是行动的规则而不是行动本身n毛泽东的人不犯我,我不犯人;人若犯我,我必犯人是一种战略。“犯”与“不犯”是两种行动,战略规定了什么时候选择“犯”,什么时候选择“不犯”n在静态博弈中,战略和行动是相同的,因为作为参与人行动的规则,战略依赖参与人获得的信息,在静态博弈中,所有参与人同

29、时行动,没有任何人能获得他人行动的信息,因而,战略选择就变成了简单的行动选择(5)战略n战略作为一种行动规则,必须是完备的,即要给出参与人在每一种可想象到的情况下的行动选择,即使参与人并不预期这种情况会实际发生n在房地产开发博弈中,如果A和B都知道市场需求大,A在B之后行动的战略不仅要给出如果B选择开发时A应该如何选择,还必须给出如果B选择“不开发”时A应该如何选择,即使A确信B肯定会选择“开发”(6)支付n支付或者是指在一个特定的战略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用水平n支付是博弈参与人真正关心的东西n假定每一个参与人的偏好都可以由一个VNM期望效用函数来代表,其

30、目标是选择自已的战略以最大化其期望效用函数(6)支付n令ui为第i个参与人的支付,u=(u1,ui,un)为n个参与人的支付组合n博弈的一个基本特征是一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择,即ui是所有参与人的战略选择函数:n ui=(s1,si,sn)(7)结果(outcome)n结果是博弈分析者所感兴趣的所有东西,如均衡战略组合,均衡行动组合,均衡支付组合等(8)均衡(equilibrium);n均衡是所有参与人的最优战略组合n一般记为: (s1*, si* , ,sn*)其中, si* 是第i个参与人在均衡情况下的最优战略,它是i的所有可能的战略中使

31、ui最大化的战略, ui是所有参与人的战略组合的函数i的最优战略通常依赖于其他参与人的战略选择二、综合分类及相关均衡静态动态完全信息完全信息静态纳什均衡纳什1950-1951完全信息动态子博弈精炼纳什均衡泽尔腾1965不完全信息不完全信息静态贝叶斯纳什均衡海萨尼1967-1968不完全信息动态贝叶斯精炼纳什均衡泽尔腾1975三、纳什均衡n(1)纳什均衡概念n(2)纳什均衡举例(1)纳什均衡概念n纳什对非合作博弈的主要贡献是在1950年代的两篇论文中定义了非合作博弈及其均衡解,并证明了均衡解的存在,即纳什均衡n设有n个人参与博弈,给定其他人战略的条件下,每个人选择自己的最优战略,所有参与人选择的

32、战略一起构成一个战略组合n纳什均衡是指该战略组合由所有参与人的最优战略组成,即给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略,从而没有任何人有积极性打破这种均衡(1)纳什均衡的概念n在有限个局中人参加的有限行为对策中,至少存在一个所有参与人的最优战略的组合,叫做纳什均衡。处于纳什均衡状态下,每个人都不能通过改变策略来得到更大的收益,所以谁也不存在改变现状的动力(1)纳什均衡的概念n在博弈G=S1,Sn;u1,un中,如果由各一博弈方的各一个策略组成的某个策略组合(s1*,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,si-1 * ,si+1 * , ,

33、 sn*)的最佳对策,即ui(s1*,si-1 * ,si*,si+1 * , , sn*) ui (s1*,si-1 * ,sij * ,si+1 * , , sn*)对任意sijSn都成立,则称(s1*,sn*)是G的一个纳什均衡(1)纳什均衡的概念n纳什均衡可理解为博弈中的所有参与人事先达成一项协议,规定每人的行为规则。问题是在没有外在强制力约束时,当事人是否会自觉地遵守这个协议?或说该协议能否自动实施?若当事人能自觉遵守该协议,则这个协议构成了一个纳什均衡,给定别人遵守协议的情况下,没有人有积极性偏离协议规定的行为规则n如果该协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人

34、会违背这个协议,不满足纳什均衡要求的协议是没有意义的,这就是纳什均衡的哲学思想(2)纳什均衡举例n囚徒困境n智猪博弈n性别战n斗鸡博弈n市场进入阻挠囚徒困境n警察抓住两个罪犯,但却缺乏足够证据指证他们所犯的罪行,如果罪犯中至少有一人供认犯罪就能确认罪名成立n为得到所需口供,警察将这两名罪犯分别关押以防止串供或结成攻守同盟,并分别对他们讲清其处境和面临的选择:n如果两人中有一人坦白认罪则坦白者立即释放而另一人将重判10年徒刑;如果两个人都坦白认罪,则他们将被各判5年监禁;当然若两人都拒不认罪,因缺乏证据,将会被以较轻的妨碍公事罪各判一年徒刑囚徒困境n 囚犯B坦白抵赖 囚 犯 A坦白-5,-50,

35、-10抵赖-10,0-1,-1囚徒困境n在此博弈中,博弈双方各自独立做出策略选择,完全知道对方可能的得益,每个博弈方选择其策略时,无法知道对方的实际选择,但却不能忽视对方选择对自己得益的影响,因此他会根据对方两种可能的选择分别考虑自己的最佳策略囚徒困境的结论n博弈双方在决策时都以自己最大利益为目标,结果是无法实现最大利益或较大利益,甚至导致对各方都最不利的结局,这种情况在现实生活中具有相当的普遍性,在市场竞争、公共产品生产等领域有着广泛应用n从囚徒困境可以引出一个重要结论:一种制度(体制)安排,要发生效力,必须是一种纳什均衡,否则,该制度安排便不能成立智猪博弈n 案例:笼子里养了两只猪,笼子一

36、头有一个按钮,另一头是饲料的出口和食槽。按一下按钮,将有相当于10个单位的猪食进槽,但是按动铵钮需付出劳动,要消耗相当于2个单位的猪食n每只猪都必须要做出决策是等在食槽旁边还是去按动按钮 n由于按钮和食槽分置笼子两端,付出劳动按动按钮的猪跑到食槽的时候,坐享其成的另一头猪早已开吃智猪博弈n若大猪先到,大猪吃到9个单位的猪食,小猪只能吃到1个单位的猪食n若同时到达,大猪吃到7个单位猪食,小猪吃到3个单位猪食n若小猪先到,小猪可以吃到4个单位猪食,而大猪只能吃到6个单位的猪食智猪博弈小猪按等待 大 猪按5,14,4等待9,-10,0智猪博弈n这场博弈结果依赖于大猪行为的判断。如果小猪去按动按钮,大

37、猪当然乐于等待在食槽旁吃掉9个单位的猪食;如果小猪等待,那么大猪将先去按动按钮再跑回来以获得相当于4个单位的猪食,比空肚子等待要好。对小猪来说,情况非常明了,无论大猪如何行动,它最好是等在食槽旁边n该博弈的均衡结果就是:每次都是大猪去按动按钮,小猪先吃,大猪再赶来吃共同生存智猪博弈n智猪博弈说明了在某个市场上一个占主导地位、控制着市场的公司和它的一个较小的竞争对手之间可能发生的竞争情况。这取决于占主导地位的公司如何看待这个较小的竞争对手对它的威胁程度 n智猪博弈中共同生存的均衡结果只有在大猪的食物份额没有受到小猪严重威胁时才会出现n公司大股东与小股东、炒股中的庄家与散户、修路中的富人与穷人、改

38、革中部分人积极参与等性别战n一对夫妻得到了两张时装表演票和同一时间的两张足球比赛票。妻子更想去看时装表演而丈夫更想去看足球,但又不愿或不能分头行动,争执不下就决定双方投票一次决定。若同选时装则去看时装表演,同选足球则去看足球比赛,如选择不一致则哪儿都不去n假设若丈夫与妻子同去看时装表演,妻子得益2单位,丈夫得益1单位,若丈夫与妻子都去看足球比赛则丈夫得益3单位,妻子得益1单位;若因为双方选择不同而没有出门则双方得益都为0单位性别战支付矩阵女足球芭蕾 男足球2,10,0芭蕾0,01,3性别战n 在该博弈中,有两个纳什均衡:(足球,足球),(时装,时装)。即给定一方去足球场,另一方也会去足球场,给

39、定一方去看时装,另一方也会去看时装n究竟哪个纳什均衡会发生?无法肯定,但实际生活中,或许是一次看足球,一次看时装,如此循环,形成一种默契n还有一个先动优势,若男的买票,两人就会出现在足球场,若女的买票,两人就会看时装表演斗鸡博弈n在一段笔直道路两端各有一司机驾驶着汽车开足马力向对方冲去,此时,谁胆怯退避让路谁就被称为胆小鬼,谁不避让最终停在道路中央,谁就被视为英雄n如果双方都停在道路中央,结果将两败俱伤,但如果双方都退避让路,他们虽然都安然无恙但却都成了胆小鬼,如果一个勇往直前而另一个退避让路,则前者就会非常荣耀并享有较高的满足感 ,该博弈可以用下图中的得益矩阵表示 斗鸡博弈支付矩阵司机B进退

40、 司 机 A进-3,-32,0退0,20,0斗鸡博弈n该博弈有两个纳什均衡:如果一方进,另一方的最优战略就是退,两人都进或都退都不是纳什均衡n以警察与游行队伍为例。游行队伍与警察越来越近,这时候一定要有一方退下来。如果警察不让步,游行队伍便会后退;反过来,如果游行队伍来势很猛,警察就得撤退。夫妻间矛盾也是个斗鸡问题。一般来说,吵得厉害了,不是妻子回娘家躲一躲,就是丈夫到院子里抽烟n 斗鸡博弈时,究竟哪一方退下来,因为退下来虽比两败俱伤好,毕竟是一件丢面子的事。若每一方都寄希望于对方退下阵来,两败俱伤的结局也可能出现市场进入阻挠n这是产业组织学中的一个例子。假设有一个垄断企业已在市场上(称在位者

41、),另一个企业虎视耽耽想进入(称进入者)n在位者想保持自己的垄断地位,就要阻挠对方进入,在此博弈中,进入者可以选择进入还是不进入两种战略;在位者也有两种战略默许和斗争。假如进入之前垄断利润为300,进入之后寡头利润合为100(各得50),进入成本为10,支付矩阵如下市场进入阻挠支付矩阵在位者默许斗争 进 入 者进入40,50-10,0不进入0,3000,300市场进入阻挠分析n本博弈有两个纳什均衡,即(进入,默许)和(不进入,斗争)n因为给定进入者进入,在位音选择默许时得50单位利润,选择斗争时得不到利润,其最优战略是默许。同样,给定在位者选择默许,进入者的最优战略就是进入,n尽管在进入者选择

42、不进入时,默许和斗争对在位者是一个意思,只有当在位者选择斗争时,不进入才是进入者的最优选择,所以(不进入,斗争)是一个纳什均衡,而(不进入、默许)不是纳什均衡3企业博弈理论n一、企业的合作博弈理论n二、古诺等的企业间竞争的博弈问题研究二、古诺等的企业间竞争的博弈问题研究n(1)古诺的寡头模型n(2)伯特兰德寡头模型n(3)豪泰林(Hotelling)价格竞争模型n(4)公共资源问题n(5)中央政府与地方政府关于基础设施建设的博弈古诺的寡头模型n以两厂商连续产量的古诺博弈为例,讨论无限策略博弈的纳什均衡n设市场上有1,2两厂商生产同样产品,厂商1的产量为q1,厂商2的产量为q2,市场总产量为Q=

43、 q1 + q2 ,设市场出清价格为P是市场总产量的函数P=P(Q)=8-Qn设两厂商生产都无固定成本,边际成本C1=C2=2n两厂商同时决定各自产量古诺的寡头模型n上述博弈问题博弈方为厂商1和厂商2,他们的策略空间是他们可以选择的产量,假设产量是连续可分的,因此两厂商在生产能力形成的产量上限约束下,有无限多种可选策略,双方的得益函数为: 22212221222221211121111116282628qqqqqqqqqcQPquqqqqqqqqqcQPqu古诺的寡头模型n两博弈方的得益都取决于双方的产量n该博弈的纳什均衡是寻找两博弈方的一个策略组合(q1*,q2*)满足其中的q1*和q2*相

44、互是对对方的最佳对策就构成一个纳什均衡n如果策略组合(q1*,q2*)是纳什均衡,那么(q1*,q2*)必须满足:222*1221*2116max6max21qqqqqqqqqq古诺的寡头模型n以上两式分别对q1,q2求偏导,并令一阶导数为0,即:026026*2*1*1*2qqqq古诺的寡头模型n解该方程得唯一解为: q1*=q2*=2,策略组合(2,2)为本博弈唯一的纳什均衡,最终市场总产量为4,市场价格为8-4=4,双方得益2(8-4)- 22=4n两厂商利润总和为4+4=8n若两厂商联合决策,设总产量为Q,则总得益U=P(Q)-CQ=Q(8-Q)-2Q=6Q-Q2n求导得:Q*=3,

45、q1*=q2*=1.5,各自分享的利润为4.5,此时集体理性大于个人理性古诺的寡头模型n在独立决策、缺乏协调机制的两个企业之间,合作结果不易实现,即使实现也不稳定n难以实现或维持合作的原因是:各生产一半实现最大总利润总产量的产量组合(1. 5,1. 5),不是纳什均衡,在这一策略组合下,双方都可以通过独自改变自己的产量而得到更高利润,它们都有突破1.5单位产量的冲动,在缺乏有强制作用的协议等保障手段时,这种冲动注定了维持较低水平的产量组合是不可能的,两厂商早晚都会增产,只有达到纳什均衡产量(2,2)时才会稳定下来,此时任一厂商单独改变产量会不利于自己,该博弈的支付矩阵如下:古诺的寡头模型厂商2

46、不突破突破 厂 商 1不突破4.5,4.53.75,5突破5,3.754,4反应函数n事实上,在博弈各方有无限多种策略选择的情况下,博弈方之间的相互影响及其在其他博弈方选定策略的情况下,各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数关系n在两寡头古诺模型中,对厂商2的任意产量q2,厂商1的最佳对策产量q1,就是使自己在厂商2生产q2的情况下利润最大化的产量,即q1是最大化问题:nMaxu1=Max(6q1-q1q2-q12)的解反应函数n令u1对q1求导,并取一阶导数为0,可得nq1=R1( q2) =1/2(6- q2)n这样我们得到了对于厂商2的每一个可能的产量,厂商1的最佳

47、对策产量的计算公式,它是厂商2产量的一个连续函数,我们称这个连续函数为厂商1对厂商2产量的一个“反应函数”(Reaction Function)n同样,厂商2对厂商1产量q1的反应函数nq2=R2( q1) =1/2(6- q1)伯特兰德寡头模型n将反应函数法应用到伯特兰德(Bertrand 模型分析,伯特兰德1883年提出了另一种形式的寡占模型,这种模型与选择产量的古诺模型的差别在于模型中各厂商所选择的是价格而不是产量,且产品有差异n产品差别是指两个厂商生产的是同类产品,但在品牌、质量和包装等方面有所不同,因此产品之间有很强的替代性,但又不是完全可替代,即价格不同时,价格较高的不会完全销不出

48、去需求函数n当厂商1和厂商2价格分别为P1、和P2时,它们各自的需求函数为:122222122211112111,PdPbaPPqqPdPbaPPqq相关参数n其中,d1,d20,即两厂商产品的替代系数,假设两厂商无固定成本,边际生产成本分别为c1和c2,两厂商同时决策n两博弈方厂商1和厂商2的策略空间分别为:nS1=0,P1max和S2= 0,P2max,其中, P1max, P2max是厂商1和厂商2还能卖出产品的最高价格支付函数122222222222222122211111111111112111,PdPbacPqcPqcqPPPuuPdPbacPqcPqcqPPPuu反应函数 122

49、2221222111112112121PdcbabPRPPdcbabPRP纳什均衡*122222*2*211111*12121PdcbabPPdcbabP纳什均衡2222121111121212*21112121222221211*1424424cbaddbbbcbaddbbdPcbaddbbbcbaddbbdP纳什均衡的解n设a1=a2=28,b1=b2=1,d1=d2=0.5,c1=c2=2n求P1*,P2*,u1,u2的值,如果追求集体理性最大化,将如何定价?n如果产品无差异,必须考虑消费者对价格的敏感性,如果所有消费者对价格非常敏感,则同质产品的价格差异不可能存在n请分析n个厂商伯特兰

50、德模型的纳什均衡豪泰林(Hotelling)价格竞争模型n豪泰林引入产品差异性,当不同企业生产产品存在差异时,消费者对不同企业的产品有不同偏好,价格不是他们唯一感兴趣的变量n 产品差异有多种形式,豪泰林模型考虑的是空间差异,既产品在物质性能上是相同的,但在空间位置上有差异,处于不同位置上的消费者要支付不同的运输成本,他们关心的是价格与运输成本之和,而不单是价格豪泰林模型举例n假定有一个长度为1的线性城市,消费者均匀地分布在0,1区间里,分布密度为1,假定有两个商店,分别位于城市的两端,商店1在x=0,商店2在x=1,出售物质性能相同的产品。每个商店提供单位产品的成本为c,消费者购买商品的旅行成

51、本与离商店的距离成比例,单位距离的成本为t。住在x的消费者如果在商店1采购,要花费xt的旅行成本;如果在商店2采购,要花费t(1-x)。n假定消费者具有单位需求,即或者消费1个单位或者消费0个单位,消费者从消费中得到的消费剩余为s豪泰林模型举例n现考虑两商店之间价格竞争的纳什均衡。假定两个商店同时选择自己的销售价格,我们假定s相对于购买总成本(价格加旅行费用)而言足够大,从而所有消费者都购买一个单位的产品,令pi为商店i的价格,Di (p1,p2)为需求函数,i=1,2n如果住在x的消费者在两个商店之间是无差异的,那么,所有住在x左边的将都在商店1购买,而住在x右边的将在商店2购买,需求分别为

52、D1=x,D2=1-x,x满足:p1+tx=p2+t(1-x)需求函数ttppxppD2,12211ttppxppD21,21212支付函数 tppcptppDcppptppcptppDcppp21221222112121112121,21,利润函数为纳什均衡2020221*2*121221211ttcppptcppptcpp两个一阶条件分析解释n可将消费者的位置差异解释为产品差异,这个差异可解释为消费者购买产品的旅行成本,旅行成本越高,产品的差异就越大,均衡价格从而均衡利润也就越高n随着旅行成本的上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断力加强,商店之间的竞争越来

53、越弱,消费者对价格的敏感度下降,从而每个商店的最优价格更接近于垄断价格n当旅行成本为零时,不同商店的产品之间具有完全的替代性,没有任何一个商店可以把价格定得高于成本,这就是伯川德均衡结果厂商位置的调整n以上分析是假定两个商店分别位于城市两个极端n事实上,均衡结果对于商店位置非常敏感n考虑另一个极端,假定两个商店位于同一个位置x,此时,他们出售的是同质产品,消费者关心的只是价格,那么,伯川德均衡是唯一的均衡:np1=p2=c,1=2=0商店位于任何位置的纳什均衡n假定商店1位于a(a0),商店2位于1-b(b0) ,1-a-b0(即商店1位于商店2的左边)n旅行成本为td2,(d是消费者到商店的

54、距离),那么,需求函数分别为下式需求函数及纳什均衡caapaaptcppabbatcbapbabatcbapbatppbabxppDbatppbaaxppD1 ,1 ,1 , 01 , 0311,311,12211,1221,*2*1*2*1*2*12121212211需求函数需求函数的解释n需求函数的第一项是商店自己的“地盘”(a是住在商店1左边的消费者,b是住在商店2右边的消费者)n第二项是位于两商店之间的消费者中靠近自己的一半n第三项代表需求对价格差异的敏感度n当a=b=0时,商店1位于0,商店2位于1,回到第一种情况n当a=1-b时商店1和商店2位于同一位置,回到第二种情况公共资源问题

55、n随着社会经济的不断发展,我们越来越无法回避公共资源利用、公共设施提供和公共环境保护等方面的问题都可用博弈关系分析n经济学中的公共资源是指具有没有哪个个人、企业或组织拥有所有权及大家都可以自由利用两个特征的自然资源或人类生产的供大众免费使用的设施和财货n如大家都可开采使用的地下水,可自由放牧的草地,可自由排放废水的公共河道,及公共道路、楼道的照明灯等n由于公共资源有上述两个特征,因而利用这些资源时不支付任何代价,除非政府将这些资源收归国有,并对使用者征收资源税或收取类似的费用。但政府采取上述措施,这些资源也就不再是上述经济学意义上的公共资源,而应该称为国有资源公共资源问题n经济学认为,在人们完

56、全从自利动机出发自由利用公共资源时,公共资源倾向于被过度利用、低效率使用和浪费n并且过度利用会达到任何利用它们的人都无法得到实际好处的程度n以公共草地放牧问题为例分析公共资源问题举例n 设某村庄有n个农户,该村有一片大家都可以自由放牧羊群的公共草地。由于这片一草地的面积有限,因此只能让不超过某一数量的羊吃饱,如果在这片草地上放牧羊只的实际数量超过这个限度,则每只羊都无法吃饱,从而每只羊的产出(毛、皮、肉的总价值)就会减少,甚至只能勉强存活或要饿死。假设这些农户在夏天才到公共草地放羊,而每年春天就要决定养羊的数量,则可看作各农户在决定自己的养羊数时是不知道其他农户养羊数的,即各农户决定养羊数的决

57、策是同时作出的。再假设所有农户都清楚这片公共一草地最多能养多少羊和羊只总数的不同水平下每只羊的产出,这就构成了n个农户之间关于养羊数的一个博弈问题,并且是一个静态博弈。公共资源问题举例n在此博弈中,博弈方就是n个农户,各自的策略空间就是他们可能选择的养羊数目qi(i=1,n)的取值范围;当各户养羊数为q1 , q2, , qi , , qn时,在公共草地上放牧羊只的总数为Q = q1 + q2+ + qi + + qn n每只羊的产出是羊只总数Q的减函数V = V(Q)-V(q1 + q2+ + qi + + qn)n假设购买和照料每只羊的成本对每个农户都是相同的不变常数c则农户i养今qi 只

58、羊的得益函数为:ui= qi V(Q)- qi c= qi V(q1 + q2+ + qi + + qn) -qi c公共资源问题举例n为方便讨论,设n=3,即只有3个农户,每只羊的产出函数V=100-Q=100-(q1+q2+q3),而成本c=4,此时三农户的支付函数分别为:332133232122132111410041004100qqqqquqqqqquqqqqqu反应函数n三农户各自对两农户策略的反应函数为:212133313122323211212148,212148,212148,qqqqRqqqqqRqqqqqRq纳什均衡n三个反应函数的交点(q1*,q2*,q3*)就是博弈的纳

59、什均衡n解联立方程组得q1*=q2*=q3*=24nu1*=u2*=u3*=576追求集体理性的情况n若从集体理性最大化出发,构造总的支付函数为:u=Q(100-Q)-4Q=96Q-Q2n使总支付u最大的养羊数Q*必然使得总支付函数导数为0,即n96-2Q=0,解得Q*=48,u*=2304,高于1728,此时q1*=q2*=q3*=16公共资源问题分析n该例再次证明了纳什均衡,或者说非合作博弈的结果有可能是低效率的n如果利用草地资源的农户数进一步增加,则纳什均衡策略的效率会更低n如果允许外来者随意加入利用该公共资源的行列,则所有利用该资源的人的利益很快都会消失,即羊只总数会随着放牧农户数的增

60、加而增加到刚好不至于亏损的水平,各农户将完全不能从在公共草地上养羊得到任何好处,公共资源等于完全被浪费掉了n目前北京上海等城市控制外来人口进城就可以用本例的思路分析公共资源问题分析n在公共资源利用方面出现类似悲剧,原因是每个可以利用公共资源的人都面临着囚徒困境,在总体上有加大利用资源可能(至少加大利用者自身还能增加得益)时,自己加大利用而他人不加大利用则自己得利,自己加大利用但其他人也加大利用则自己不至于吃亏,最终是所有人都加大利用资源直至再加入只会减少利益的纳什均衡水平公共资源问题分析n公共资源的悲剧在我国有许多例子。如在我国受风沙、沙漠化威胁的地区,当地居民关于保护还是毁坏防风防沙林带的选

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论