版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
经济博弈论
参考书《博弈与信息》艾里克·拉斯缪森著,北京大学出版社《博弈论》Drew.Fudenberg&JeanTirol,[美]朱•弗登博格,[法]让•梯若尔,经济科学出版社《博弈论—矛盾冲突分析》RogerB.Myerson,中国经济出版社《博弈论基础》Gibbons,R1992PricetonUniv.Press《博弈论与信息经济学》张维迎,北京大学出版社《博弈论》施锡铨上海财经大学出版社《经济博弈论》谢识予,复旦大学出版社著名经济学家泰勒尔(JeanTirole)说:“正如理性预期使宏观经济学发生革命一样,博弈论广泛而深远地改变了经济学家的思维方式”如果情况确实如此,对今天的经济学家来说,不懂得博弈论显然是不行了。博弈论为何如此热门?诺贝尔经济学奖偏爱博弈论研究1994年诺贝尔经济学授予约翰·纳什
约翰·海萨尼
莱因哈德·泽尔腾
1996年诺贝尔经济学授予威廉·维克瑞詹姆斯·莫里斯2001年诺贝尔经济学授予乔治.A.阿克洛尔夫A.斯潘塞约瑟夫.E.斯蒂格尼兹2005诺贝尔经济学授予罗伯特·奥曼托马斯·谢林2007年:诺贝尔经济学奖授予赫维茨(Hurwicz)马斯金(Maskin)梅耶森(Myerson)2012年:诺贝尔经济学奖授予埃尔文·罗斯(AlvinRoth)罗伊德·夏普利(LloydShapley)。埃尔文·罗斯(AlvinE.Roth)
罗伊德·夏普利(LloydS.Shapley)他们的贡献:
稳定的匹配理论与市场设计的实践经济学是研究资源最优配置问题的,而真实世界里配置资源的方式多种多样,市场、价格机制是经济学研究最多的。但是有一些市场里头,价格的作用受到多种限制,可能是来自法律等正式规则的限制,也可能是来自习俗或伦理道德等非正式制度的限制。例如:找对象,不是价高者得,而是情投意合才能结成夫妻。问题是情投意合这种分配方式讲究“配对”,而且这种配对最好还需要“稳定”,麻烦的是还不能依靠传统的价格机制,在这种情况下经济学应该怎么办呢?2012年的诺贝尔经济学奖就授给了夏普利(L.S.Shapley)和罗斯(A.E.Roth),表彰他们在“forthetheoryofstableallocationsandthepracticeofmarketdesign”夏普利与夏普利值我们熟悉的夏普利,是他在合作博弈上所做的贡献,即夏普利值。在前六次的诺奖获得者中,他们都可以说是在非合作博弈领域的大家(我们这门课实际上也是讨论在非合作博弈理论基础上的经济层面的应用问题),而夏普利则是合作博弈领域的巨头。所谓非合作和合作博弈的区分,简单来说就是非合作主要是个体之间的博弈,而合作博弈则处理群体与群体之间的博弈,例如医生与医院、学生与学校这类群体间的博弈。夏普利值也是这个合作博弈领域最为突出的贡献,不过有意思的是,这一次的诺贝尔经济学奖的贡献却没有颁给“夏普利值”,而是稳定配对理论。合作博弈
在博弈论中,合作的概念是重要的。我们现在能够阅读到的各种版本的博弈论教科书,以及本课程将要介绍的主要是经典博弈理论,都是建立在参与人理性的、非合作基础之上的。事实上,在非合作博弈理论还没有完全建立起来之前,合作博弈理论一直是博弈论专家们研究关注的领域。合作博弈的概念是冯·诺依曼(JohnvonNeumann)和摩根斯顿(OskarMorgenstern)在他们的《博弈论与经济行为》(1944)一书中首次提出。到50年代,合作博弈理论的发展到达鼎盛时期,其中包括纳什(Nash,1950)和夏普利(Shapley,1953)的“讨价还价模型”,Gillies和Shapley(1953)关于合作博弈中的“核”的概念,以及其他一些人的贡献。一般观点认为合作博弈理论要比非合作博弈理论更为重要,因为,如果人们的合作是有利可图的,参与博弈的理性人怎么会放弃合作而采取非合作态度呢?我们知道,在任何真实的博弈局势中,无论合作博弈还是非合作博弈,如果我们仔细地考察人们为达成一个协议而能做什么的话,那么原则上我们就应该有可能把它模型化,然后通过分析这个博弈的均衡(解)来预测其结果。不幸得很,在合作博弈理论中,各种合作博弈解的概念是针对不同情况、不同理由给出了不同的解释,如核心(core)、沙普利值(Shapelyvalue)、核仁(nucleolus)、核(kernel)、谈判集以及稳定集(stableset)等等,但没有一种解能够具有纳什均衡在非合作博弈中具有的核心地位,也许正是这一点使合作博弈理论的应用研究受到了极大地挑战。不仅如此,在现实社会中,竞争是一切社会、经济关系的根本基础,不合作是基本的,而合作常常又是令人难以捉摸的、是有条件的和暂时的。即便如此,人们并没有放弃对合作博弈理论研究的兴趣。因为,在现实社会中,确实存在有很多类似于“为共同目的而一起行动”的合作问题,如各种形式的联盟。联盟通常是那些有着共同利益的一群(两个或两个以上)人,为了试图增进他们的共同利益一起行动所组成的集团如个体厂商为了获得更高利润,期待通过集团形成卖方垄断;消费者为了寻求更低的价格,期待通过集团形成买方垄断;工人们为了得到更高的工资待遇,期待通过工会形成讨价还价的势力等等。以夏普利值为例来看合作问题例题1假定某议会共有100个席位,议员分属4个党派:红党43席,蓝党33席,绿党16席,白党8席;假定对于一般议题的任何提案,议会实行一人一票并且多数通过的投票规则。假设由于党纪的约束,议员对于任何议题,都只能按照党的意志投票。议会共有4个“议会党团”,每1个议会党团,都有可能面对其他3个议会党团组成的各种可能的联盟。其他3个议会党团的各种联盟组合,一共有7种:一种是3个议会党团各自成“团”有3个联盟一种是3个议会党团两两抱团有3个联盟一种是3个议会党团抱成一团有1个联盟每个党团面对其他3个党可能组成的联盟三个联盟两两联盟两两联盟两两联盟单独联盟单独联盟单独联盟红党43席蓝绿白57蓝绿49蓝白41绿白24蓝33绿16白8蓝党33席红绿白67红绿59红白51绿白24红43绿16白8绿党16席红蓝白84红蓝76红白51蓝白41红43蓝33白8白党8席红蓝绿92红蓝76红绿59蓝绿49红43蓝33绿16面对其他3个议会党团所有7种情形的联盟,我们要看看有几种情形他成为决定性的议会党团,即加入联盟就能够让联盟的议案通过不加入联盟就可以阻止联盟的议案通过,并且把成为决定性议会党团的数目叫做这个议会党团的“权力指数”。计算4个党派在议会的“权力指数”权力指数:即在不同情况他加入或者退出一个投票联盟足以改变投票结果的情况是多少。先看红党:有43席,可能面对的是7种情况:蓝绿白联盟57票蓝绿联盟49票、蓝白联盟41票、绿白联盟24蓝党33票、绿党16票、白党8票。在这7种情况下,有6种情况他加入联盟,联盟就会获胜、不加入联盟,联盟就会失败,于是我们说红党的权力指数是6。再看蓝党:有33席,也面对7种情况:红绿白联盟67票红绿联盟59票、红白联盟51票、绿白联盟24票单独的红党43票、绿党16票和白党8票。在这7种情况下,他只有面对绿白联盟24票或者单独的红党43票这2种情况,才是决定议案是否通过的议会党团,从而蓝党的权力指数是2。运用同样的方法,可以知道绿党的权力指数是2,白党的权力指数也是2.。结果是足以让人口呆目瞪的:在这个议会里面,议员数目33的蓝党,与议员数目差不多只有他三分之一的白党,权力指数竟然一样,都是2。事实上,上面的例子告诉我们,操纵一项提案是否能够通过的“能力”,与议员党团成员数目,并不成正比。四个党的议员数目之比是43:33:16:8,而“权力指数”之比却是6:2:2:2。夏普利值就是在分析这类问题时建立的概念和有力的工具,其中理论上最容易说明的,就是上述议会党团的权力指数,其他情况的夏普利值,会复杂很多。夏普利值的应用非常广泛比较浅白的应用,包括加装电梯的成本如何在不同楼层的公寓之间分摊,以及同一路线上远近不同的同事长期固定合伙乘出租车上下班如何分摊车费等等。上面例子当中的权力指数是6:2:2:2。如果你喜欢“圆整”的权力指数,也可以都除以6+2+2+2=12,把它们定义为总和为一的6/12:2/12:2/12:2/12,即1/2:1/6:1/6:1/6。美国的总统选举,在各州是赢者通吃的,一个州的多数选民选A君,那么这个州的选举团里面的每一个人,都必须选A君。上述关于权力指数的讨论,也有助于读者理解在各州赢者通吃的这种间接选举中,选民比较多的候选人何以未必胜出。代议制民主里面有一些这样的情况。这是关于合作、投票、分配、合作剩余、夏普利值等的讨论。稳定的匹配理论严格来说,并不是经济学家首先提出并在理论上解决这一问题的1962年,数学家盖尔(D.Gale)和博弈论学者夏普利在《美国数学月刊》(AmericanMathematicalMonthly)发表了一篇名为《大学录取和婚姻稳定》的文章,首先提出了后来被称为盖尔-夏普利算法的稳定配对(stablematching)问题。稳定配对是说不存在两个人,他们都更中意于彼此、胜过他们当前的配对者。通俗来说,就是你的配偶是你所获得的最爱。因为就整个市场而言,如果婚姻市场上有数量大致相当的适婚男女,男的知晓所有女的信息,女的也一样。然后男的对女的有一个排序,女的也对男的排序。接下来一方发起求婚,另一方对照自己的偏好排序表,如果是最爱的就接受,不是的就拒绝。在交易费用为零和配对时间不限的情况下,最终萝卜青菜各有所爱,每个人总能找到自己的伴侣,并且这种配对是稳定的,即没有人想分手,不会出现出轨的现象。为什么呢?让我们假设有X男和Y女出轨了,X与原来的M女分手,这说明X更偏好Y,这违反了预设的偏好稳定。当然这可能意味着X之前没有向Y求过婚,同样对Y来说选择X也意味着更偏好X,但每个人都是按照自己的偏好排序来求婚的,就违反了偏好排序。所以如果是稳定配对,就不存在出轨现象。在这里,我们应该注意到:这其实和经济学对理性人的偏好稳定及偏好可排序假设没有任何区别,无非是这里并不是用价格,而是用配对来配置婚姻资源。GS算法(盖尔-夏普利)对多人参与的合作博弈如何分配资源的问题有重要的贡献和启示。罗斯的贡献对经济学来说,不仅仅存在个体与个体之间的交换,而且还存在大量群体参与的交换,这个时候如何让供需双方稳定配对,并不是简单的事情。从抽象的理论到市场制度的实际设计的发展,考虑如何匹配不同的市场主体。例如学生如何与学校匹配,人体器官的捐献者如何与需要器官移植的患者匹配。经济学家要在这篇数学论文发表差不多20年后,才开始将其中的原理逐步应用到真实世界的市场里。而这个工作最主要的代表者就是罗斯。1984年罗斯的论文发表了一篇关于实习医生的文章,将夏普利的理论应用到解释实际经济问题中。在医学领域,学生通常在后几年学习生涯中需要去医院实习。40年代,美国的医院系统开始大规模发展,但医学院学生的数量很少,医院之间的竞争导致对医学院学生需求的急剧增加,于是很多医院就让学生提前实习,甚至在这些学生还没有选定专业领域的情况下就参加实习。但如果学生拒绝一个医院,往往导致医院再去找第二个学生就太迟了,因为第二个人可能已经被另一个医院抢走了。市场在这种情况下是极为不稳定的,因为医院往往会设定一个最后申请期限,迫使学生在不晓得是否还有其他机会之前就做出选择。由于医院未能及时给所有学生提供机会,而学生也未能向所有医院提出及时申请,双方都未能极大化自己的利益。NRMP全国住院医师配对项目到了1950年代,为了解决这个问题,美国设立了一个集中的清算所(Clearinghouse),也就是全国住院医师配对项目(NRMP:NationalResidentMatchingProgram)的项目。在1984年的论文中,罗斯发现这个清算所采用的就是盖尔-夏普利算法,从而达到有效而稳定的配对。市场设计跟着这个发现,罗斯随后考察了英国的医院和医生配对情况,发现有些地区是稳定的,而有一些则不然。那么随之而来的问题就是为什么会有这些差异呢?原来英国不同的地方采用的配对算法不同,而如何有一个算法使得配对稳定下来,就成为成功的关键。如何改进算法,不仅要利用每一个市场的信息,也要借助计算机技术的进步,将理论和实际联系起来,这促成和发展了经济学的一个分支:市场设计。市场设计在拍卖领域得到了最广泛的应用,2007年克拉克奖得主阿西(S.C.Athey)就是自然资源领域拍卖设计的领军人物。而Google公司的在线广告拍卖也得到了首席经济学家范里安的帮助。医生夫妇的问题美国的NRMP项目一开始很成功,但随后又遇上了一个意想不到的问题。那就是医生夫妇的问题,因为1950年代中期之后,医学院的女生数量开始增长,这导致了医学院学生中夫妻学生数量也开始增长,他们在找实习机会的时候,总是倾向于在一起,而采用NRMP系统找实习的话,两个人很可能分开,因为同一个医院对两个人的排序是有差异的。罗斯新的设计这种情况下夫妻学生档开始绕过NRMP找工作,这就重新导致了市场的不稳定。由于NRMP系统青睐医院胜过学生,招致了大量的批评。罗斯在1995年应NRMP的要求,重新设计了配对系统,加入对学生配偶考虑,这项调整使得清算所稳定配对的功能得以继续发挥。NRMP于1997年采用了罗斯新的设计,现在每年能为约2万个学生有效匹配医院实习职位。但这里还有一个问题:如果学生夫妻可以抗拒最初的NRMP项目来达到改变项目的目的,那么是不是也有人可以通过系统地操纵算法来获得更好的收益,例如通过先隐藏自己的真实偏好并使他人境况变差来获得更好的收益。对市场设计而言,最重要的除了稳定(stability)之外,还要激励兼容(incentivecompatibility),也就是说没有人有激励说谎话,这样除了能真实揭示出每个参与者的偏好排序外,也避免了有人系统性地操纵市场。罗斯后来的工作表明要系统实现操纵NRMP项目是不可能的,不仅因为新的算法避免了学生这种“错误表达偏好”的可能,也避免了医院系统操纵NRMP项目的可能,因为成本太高。关于激励兼容的研究,是2007年诺贝尔经济学奖得主赫维茨、马斯金和梅耶森的贡献了。而罗斯后来的主要工作是将博弈论、经验证据和实验室研究结合起来,这个领域之前的获奖者是2002年的弗农·史密斯。我们已经知道找对象和找工作都是双向配对的,但是有一些真实世界的问题却不是双向的,而是单向的。例如对器官移植而言,就是完全单向的,病人是等待者,而捐赠者捐出之后,最好能又快又好地进行移植手术,才能最大化捐赠人和受赠人的利益。在这个市场上,等待器官移植的人由于受到法律和道德的限制,不能实施价高者得,而且可能实施起来的成本也不低,所以必须要有另外的配置资源的方式。那么在器官移植这种问题上,如何提高效率呢?市场设计在这里也有可为之处夏普利和盖尔提出了另一种算法,叫做“首位交易循环”(TTC:toptradingcycle)。TTC机制除了在器官移植领域广泛应用外,在学生择校领域也有广泛应用。TTC是说先进行之前提到的稳定配对,已经配对完成的参与者就从市场中移除。说真话机制这个简单的限定在偏好稳定且可以排序的情况下,就导致没有人愿意说假话掩盖自己的偏好并试图操纵市场了,因为说真话揭示自己的真实偏好是唯一优胜的策略。在生死攸关的器官移植问题上,这一算法简单却又实用的保证了配对稳定和资源分配的效率。这里的挑战有两个:一是捐赠的器官是不是与受助者兼容;二是移除配对完成的参与者也需要时间。尽管如此,美国有大量的州已经实行这一TTC机制多年,为大量患者带去了福音。这类市场设计可以被推广到大量价格的作用受限的市场里其中最主要的一类应用是学生择校。学生要选到自己的理想学校,而学校也想挑选最佳学生,这显然属于两个群体之间如何最优配对且能稳定配对的问题。中国有不少研究高考择校问题的学者,已经在这方面做了一些探索,比较不同的择校机制之间的优劣。事实上,夏普利和后来的研究者已经将盖尔-夏普利算法做了改进,也可以被应用到价格起作用的市场中,例如拍卖,尤其是网络拍卖,有竞价,有大量的信息,以及便捷的技术,这个领域正在产出大量有意思的新问题和文章。机制设计理论2007年:诺贝尔经济学奖授予赫维茨(Hurwicz)马斯金(Maskin)梅耶森(Myerson)是因为他们“为机制设计理论奠定了基础”。机制设计理论是研究在自由选择、自愿交换、信息不完全及决策分散化的条件下,能否设计一套规则或制度来达到既定目标的理论,深远地影响了现代经济学发展。从一个单位的激励机制的设计,到整个社会和国家的制度设计,都可以用一个统一的模型来考虑。莱昂尼德·赫维奇(被誉为“机制设计理论之父”)赫维茨早在上世纪40年代就以研究博弈论出名。他论文《资源配置中的最优化与信息效率》,拉开“机制设计理论”的序幕;1973年赫维奇在最著名的《美国经济评论》杂志上发表论文《资源分配的机制设计理论》,奠定了机制设计理论这门学问的框架。埃里克·马斯金马斯金最大的一个贡献就是对有一个委托人兼有许多代理人的情况下,达到一个给定的目标,需要的充分必要条件是什么,这是一个很了不起的成果。因为他这个理论的前提是任何一个给定的目标。在机制设计理论方面,马斯金最出名的工作则是“纳什均衡可实施机制”,为人们寻找可行的规则提出一种标准,被称为马斯金定理。之前,莫里斯在1971年发表了《最优所得税理论的探索》的论文都堪称这方面的经典之作,赢得了1996年的诺贝尔经济学奖。罗杰·迈尔森
迈尔森最大的贡献就是奠定了最优合同理论的机制。最优合同理论是机制设计的一个分支。前几年拿诺贝尔经济学奖的这些人,实际上是在赫维茨的框架下做。现年56岁的芝加哥大学经济系教授迈尔森开发出了分析选举的数学模型并发表了70多篇有关博弈论和其他课题的论文。他在获奖当天于芝加哥举行的新闻发布会上表示,“我们认识到不仅资源的制约很重要,激励的制约也很重要。现在这些已经被理解为经济学问题的基本组成部分。”机制设计思想
“机制设计理论”解答的问题,是不同的制度或配置机制如何发挥作用?以实现社会福利或个人营利之类特定目标的最佳效益。机制设计理论可以看作是博弈论和社会选择理论的综合运用。所罗门王的故事
《圣经》上所罗门王的故事:两个女人为争夺一个孩子吵到所罗门王那里,都说孩子是自己的。所罗门王见她们争执不下,便喝令侍卫拿一把剑来,要把孩子劈成两半,一个人一半。这时其中一个女人赶紧说:“大王,不要杀死孩子。把孩子给她吧,我不和她争了”。所罗门王听了却说:“这个女人才是真的母亲,把孩子给她。”假如故事中的假母亲和真母亲说同样的话,那所罗门王该怎么办呢?所罗门王可以向其中任一母亲(称为A)提问孩子是不是她的。如果A说不是她的,那么孩子给另一个女人(称为B),GAMEOVER。如果A说孩子是她的,那么所罗门王可以接着问B是否反对。如果B不反对,则孩子归A,GAMEOVER。如果B反对,则所罗门就要她提出一个赌注,然后向A收取罚金。比较罚金和赌注,如果罚金高于赌注,则孩子给A,她只须交给所罗门王赌注那么多钱,而B要交给他罚金的钱;如果罚金比赌注低,则孩子给B,她给所罗门王赌注的钱,A的罚金也归他。不难推出,在A是真母亲的情形下,她的策略是说孩子是她的,然后B不反对。因为她反对的结果只会导致她要多交钱,因为A为了得到孩子并避免白白给出罚金,必然会真实地根据孩子对她的价值拿出罚金;在A是假母亲的情形下,她的策略是承认孩子不是她的,因为如果她说孩子是她的,B必然会反对,并且B为了得到孩子并少付钱,一定会真实出价,而A只有出高出孩子对她的真正价值的钱才会得到孩子,可这就不合乎她的偏好了。“没有规矩,不成方圆”方不方、圆不圆很大程度上取决于“规矩”的好坏,而如何去评价“规矩”,如何去创造个好“规矩”就是机制设计理论研究的课题。某种程度上看,机制设计理论似乎比我们熟知的传统经济理论更加抽象和高深,大部分经济学家都是习惯于在一个“既定框架”下研究各种最优化问题,而赫维茨等人研究的恰恰就是这个“既定框架”本身。机制设计是不完全信息下委托代理问题
经济社会活动中,存在着大量一方委托另一方完成特定工作的情况。其特征是委托方利益与被委托方的行为有密切关系,而且委托方不能直接控制被委托方的行为。只能通过报酬等间接影响被委托方的行为。除了有书面合同、协议,或至少有口头委托的明显委托关系以外,还有大量经济社会关系虽然没有明显的委托关系,但一方利益与另一方的行为有关,也可以用委托代理理论来加以研究。当对代理人付出的努力不能进行完全的检验,代理人有可能试图只付出少于他能够付出的努力时(偷懒);当一个只根据行动而不兼顾结果支付报偿的契约建立时,潜在的道德风险立即产生。
委托代理的核心是两人动态博弈,基本问题是代理人问题。是指由于代理人目标函数与委托人目标函数不一致,加上存在不确定性和信息不对称,代理人可能偏离委托人的目标函数,而出现损害委托人收益和非效率现象。就委托人而言,如何设计最优契约激励代理人是问题的关键。因此这种问题也称为“激励机制设计”或“机制设计”。在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。约翰·纳什,1928年生于美国
1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。约翰·海萨尼,1920年生于美国1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。莱因哈德·泽尔腾,1930年生于德国1994年Nobel经济学奖得主背景冯·诺依曼(VonNeumann),摩根斯坦恩(Morgenstern)(1944),博弈论和经济行为(TheTheoryofGamesandEconomicBehavior)。标志着博弈理论的初步形成Nash(1950,1951)两篇关于非合作博弈的重要文章,在非常一般的意义下,定义了非合作博弈及其均衡解,并证明了均衡解的存在。基本上奠定了现代非合作博弈论的基石。他们主要的贡献1994年:在非合作博弈的均衡分析理论方面做出了开创性德贡献对博弈论和经济学产生了重大影响1996年:在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论(莫里斯);在信息经济学、激励理论、博弈论等方面都做出了重大贡献(维克瑞)2001年:为不对称信息市场的一般理论奠定了基石。他们的理论迅速得到了应用,从传统的农业市场到现代的金融市场。他们的贡献来自于现代信息经济学的核心部分。
2005年:诺贝尔经济学奖授予拥有以色列和美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林,以表彰他们运用博弈论推进了人们对冲突与合作的理解。2007年:诺贝尔经济学奖授予以美国经济学家赫维茨、马斯金、罗杰-B-迈尔森,以表彰他们激励机制设计理论所作出的贡献与奠定基础。获得2001诺贝尔经济学奖
对不对称信息理论的贡献获得2001诺贝尔经济学奖加利福尼亚大学GeorgeAkerlof斯坦福大学MichaelSpence美国哥伦比亚大学JosephStiglitz他们三人的贡献是提出了当买方和卖方具有不对称信息时市场运作的理论,这一理论的应用非常广泛,从传统的农业市场到现代的金融市场均有涵盖。虽然过去经济学家对不完全信息早有研究,但他们研究的是更为复杂的不对称信息
奥曼和谢林利用博弈论解决了一个世纪难题即为何有的人、组织或国家在推进合作方面表现出色,而另一些人则深受冲突之苦。在核竞赛盛行的20世纪50年代后期,谢林出版了《冲突战略》一书,奠定了博弈论作为社会科学的方法论的地位。他指出,冲突中的一方可以通过自陷绝境从而加强自己的地位;拥有报复手段比抵抗手段更重要;难以预料的报复手段比已知的报复手段更有效。这些论断在一些地区冲突的解决和避免战争的斡旋中被证明是正确的。谢林的理论推进了博弈论在社会科学领域的发展,并被应用于从企业竞争到政治谈判的广泛领域。奥曼的贡献--在于创造了重复博弈理论他的理论着重解释这样一些问题:为何参与者太多合作就变得困难;参与者何时会偶尔互动一下;何时这种互动会瓦解等。重复博弈论解释了经济冲突—如价格战、贸易战的原因,也说明了为何一些政府比另一些政府能更好地管理公共资源。重复博弈理论已被用于从行业协会到有组织犯罪、从劳资谈判到国际贸易条约等领域。
2007年诺贝尔经济学奖按照亚当·斯密的设想,市场这只看不见的手在理想情境中能有效分配资源。但现实中总有各种各样的制度约束,导致市场不能发挥作用。
1991年诺贝尔经济学奖得主科斯指出市场存在交易费用,不能有效发挥作用,于是有企业这样的机制作为替代。因此不同类型的制度如何最大化个人或社会的福利就成为经济学的一个重要问题。这就是激励机制设计理论产生的背景。激励理论的两个方面通常而言,激励理论涉及两个方面:一个是最优机制,即机制的目标是最大化个人的预期收益。另一个可以称为效率机制,即设计者的目标不是个人收益最大化,而是社会整体的福利最大化。激励机制设计理论激励机制设计理论不仅在理论上将博弈论引入到新制度经济学中,推动了理论的发展;在现实中,也有助于人们找出有效的交易机制、管制手段和投票程序,丰富了现实中可以选择的经济制度。各种预测虽然都没有猜中获奖名单,但赫维茨、马斯金和梅耶森的获奖是“意料之外,情理之中”。1.博弈论概述1.1如何描述一个博弈问题1.2优势策略1.3纳什均衡1.4纳什均衡应用举例1.5计算纳什均衡1.1如何描述一个博弈问题Case1.guesscoin
-1,11,-11,-1-1,1
正面
反面猜硬币方盖硬币方正面反面
博弈方:盖硬币方和猜硬币方;可选策略:正面和反面;几乎同时决策;所得利益
:猜对者得1元,盖者输1元;猜错者输1元,盖方得1元。Case2.prisoners’dilemma-1,-1-8,00,-8-5,-5不坦白坦白不坦白坦白囚犯2囚犯1博弈方:
囚犯1、2可选策略:坦白与不坦白几乎同时决策所得利益:
若两人同时坦白各判5年;若一个坦白一个不坦白,坦白放人,不坦白被判8年;若两人同时不坦白各被判1年。Case3.boxedpigs5,14,49,-10,0按等待按等待小猪
大猪博弈方:大猪和小猪;可选策略:按和等待;几乎同时决策所得利益:按一下按纽会有10个猪食进槽,但谁按谁要支付成本2个单位。若大猪先到,大猪吃9个,小猪吃1个;若同时到,大猪吃7个,小猪吃3个;若小猪先到,大猪吃6个,小猪吃4个。Case4.夫妻之争4,50,01,15,4看足球看芭蕾
看足球看芭蕾夫
妻博弈方:丈夫和妻子;可选策略:看足球和看芭蕾;几乎同时决策所得利益Case4.Chickengame
-3,-32,00,20,0进退AB进
退博弈方:两个人A,B;可选策略:进或退。决策次序:几乎同时决策所得利益:若两继续前进则两败俱伤;若一方前进另一方退下来,前进者取得胜利,退下来者丢面子;若两人都退下来,两Case5.石头剪子布的博弈博弈方1,2;可选策略:石头、剪子和布;几乎同时决策;所得利益:0表示没有输赢;1表示赢;-1表示输。0,01,-1-1,1-1,10,01,-11,-1-1,10,0博弈方2石头剪子布博弈方1石头剪子布Case6无限策略博弈古诺寡头模型中(需求函数:p=a-Q,其中Q=q1+q2)两厂商博弈方可选择策略:产量q1、q2支付函数为:u=pq-cq=(p-c)qui=[a-(q1+q2)-c]qi=(a-c)qi-q1qi-q2qii=1,2
如果假设a=8,c=2,则有
u1=6q1-q1q2-
q12u2=6q2-q1q2-q22 Case7.市场进入与阻挠
Player1:在位者Player2:进入者
:初始结Player2有两个可选策略:进入与不进决策结Player1面临两个可选策略:斗争与合作(a,b)为支付向量21
不进
进入斗争合作
(0,300)(-10,0)(40,50)
BasicfactorsofGamePlayersStrategies&strategiessetOrderofgameInformationPayoff&payofffunctionOutcome&EquilibriumCasesPlayers
决策主体:单人博弈、两人博弈和多人博弈可以是自然人或团体,如企业、国家、OPEC、EU、NATO等目的是通过选择行动或策略以最大化自己的支付或效用水平重要的是每个决策主体必须有可供选择的行动或策略和一个很好定义的偏好函数而不做决策的被动主体只当作环境参数单人博弈——只有一个博弈方的博弈例:单人迷宫入口AB出口(奖金M)A,1B,1右左右左M00扩展形Strategies
是博弈中各博弈方可以选择的行动方案,即对行为或者经济活动水平等等的可能的选择,或决策内容。不同的博弈问题中各博弈方可选策略的多少不同,一般分为:有限策略博弈和无限策略博弈有限策略博弈即策略数有限,且两三个可选策略的博弈最为常见;有限策略博弈往往用支付矩阵、扩展形法将所有策略、结果及支付罗列出来。见博弈的表述式无限策略博弈其策略数种往往是一个连续统,只能用数集或函数式加以表示见Case6。博弈的表述式策略式和结果式矩阵策略式是由每一种可能的策略组合所产生的支付情况,通常用支付矩阵表示;结果式表明的是每一种可能的行动组合产生的支付情况扩展式和博弈树参与人1参与人2参与人2(参与人1,参与人2)Information
是Player有关博弈的知识,它是重要的决策依据和决定博弈结果的重要因素完美信息与不完美信息完美博弈
N大小
AA
开发不开开发不开BBBB
(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)
不完美博弈
N大小
AA
开发不开开发不开BBBB
(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)
开发不开开发不开开发不开开发不开不完美博弈
N大小
AA
开发不开开发不开BBBB
(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)
开发不开开发不开开发不开开发不开不完美博弈
N大小
BB
开发不开开发不开A
(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)
开发不开开发不开开发不开开发不开确定性信息与不确定性信息参与人1参与人2参与人2(参与人1,参与人2)对称信息与不对称信息完全信息与不完全信息TheorderofPlayStaticGamemeans:每个博弈参与人几乎同时行动(不是时间概念)DynamicGamemeans:每个博弈参与人选择行动或策略有先后之分重要的是后行动方通过观察先行动方的行动来获取信息,从而使得博弈分析成为预测人的行为的一个强有力的工具RepeatedGame:是指同一个博弈反复进行所构成的博弈过程构成重复博弈的一次性博弈称为“原博弈”或“阶段博弈”Payoff它是指在一个特定的策略组合下player得到的确定的效用水平,或者指参与人得到的期望效用水平这是player真正关心的东西,是player博弈后所得利益他的目标就是在自己可以选择的策略集合里,选择某个战略以最大化自己的期望效用函数。UtilityFunction如果有n人博弈,令ui为Playeri
的支付,u=(u1,…ui…un)为支付组合payoffprofile,博弈的一个基本特征是一个参与人的支付不仅取决于自己的策略选择,而且取决于所有其他参与人的策略选择,即ui是所有参与人的策略选择的函数:
ui=ui(s1,,…si,…sn)
其中si是Playeri
的策略选择。Outcome&Equilibrium博弈的结果是所有博弈方所关心的,如均衡策略组合,均衡行动组合,均衡支付组合。均衡是所有参与人的最优策略的组合,一般记为S*=(S1*,…,Si*,…,Sn*)
其中,Si*
是Playeri
在均衡情况下的最优策略。要做的事后面要讨论1.2优势策略从数学上讲,就是:囚犯1和囚犯251囚犯1囚犯25-588(-5,-5)8501.3纳什均衡个案多重纳什均衡纯策略纳什均衡随机策略的纳什均衡强、弱纳什均衡个案:智猪博弈、建模者困境和性别战Case.boxedpigs5,14,49,-10,0按等待按等待小猪
大猪求解这个博弈问题:1.下划线法2.重复剔除严格劣策略纳什均衡:(按,等待)这个博弈有占优策略?Case.建模者困境Case.性别战三帕累托有效博弈的一个结果是帕累托有效(Paretoefficient),当且仅当不存在另一个能使所有参与人的状况更好的结果。囚徒困境可以说是一个存在帕累托改善(或者说无效均衡)的例子。纳什均衡是博弈的结局,它指博弈中每个局中人均不能因单方面改变自己的策略选择而获益。纳什均衡是一个僵局:给定别人不动的情况下,没有人有兴趣动。纳什均衡可以理解为一种具有自我强制力的协议,即这种协议没有外加力量保证实施却使每个参与者都自愿遵守,原因就在背叛协议无利可图。NE的哲学思想
“当事人会自觉遵守这个协议”,等于说这个协议构成一个NE:即给定别人遵守协议的情况下,没有人有积极性偏离这个协议规定的自己的行动准则如果一个协议不构成NE,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足NE要求,这个协议是没有意义,这就是NE的哲学思想。NE的正式定义G={S1,…Sn;u1…un}是个n人博弈,策略组合s*=(s1*,…,si*,…,sn*)是一个NE,如果对每一个i,si*是给定其他参与人选择
s-i*=(s1*,…s-1*,si+1*,…sn*)的情况下第i个参与人的最优策略,即:
ui(si*,s-i*)≥ui(si,s-i*)si∈Si,对所有的i
则s*=(s1*,…,si*,…,sn*)是NE。这是一个弱纳什均衡(weaklyNE)定义。NE有强弱之分StrictorstrongNE,如果给定其他参与人的策略,每一个参与人的最优选择是唯一的,就是说,
s*=(s1*,…,si*,…,sn*)是一个strictNE,当只当对于所有的i,si’≠si*,
ui(si*,s-i*)>ui(si’,s-i*)
则s*=(s1*,…,si*,…,sn*)是一个StrictNE。1.4计算纳什均衡纳什均衡是一个策略组合,也是最优策略组合;即在给定条件下,每一个博弈方最大化自己效用选择的结果。如在G={S1,…Sn;u1,…un}中,如果有策略组合(S1*,…,Si*,…,Sn*),其中任一博弈方i的策略Si*都是对其余博弈方的策略组合
S-i*=(S1*,…,S*i-1,S*i+1…,Sn*)的最佳对策,则这个策略组合就是博弈的解。博弈问题解法划线法-有限策略博弈的解法反应函数-无限策略博弈的解法重复剔除严格劣策略或严格下策反复消去法混合策略下列博弈问题的解如果以划线法解上述博弈问题,则发现:猜硬币——无解囚徒的困境——有唯一稳定的解智猪博弈——有一个解斗鸡博弈——有两个解但不唯一石头剪子布的博弈——无稳定解齐威王与田忌赛马——无稳定解反应函数法古诺寡头模型中(需求函数:p=a-Q,其中Q=q1+q2)两厂商为博弈方1,2可选择策略:产量q1、q2(无限策略型)支付函数为:u=pq-cq=(p-c)q如果假设a=8,c=2,则有
u1(q1,q2)=6q1-q1q2-
q12u2(q1,q2)
=6q2-q1q2-q22 以CournotModel为例这是一个完全信息的博弈模型Reactionfunction
q1*=R(q2*)=(6-q2*)/2——反应函数
q2*=R(q1*)=(6-q1*)/2——反应函数反应函数——是指当支付payoff是策略的多元连续函数时:u=u(s1…si…sn),我们可以求得每个博弈方针对其他博弈方最佳策略的最佳反应构成的函数,即通过du/dsi=o,求出每个博弈策略Si*=R(S1*,…Si-1*,Si+1*,…Sn*),这就是反应函数。博弈的解——就是各个反应函数的交点(如果有)古诺博弈解的几何意义q10q1*q2*E(q1*,q2*)q1*=R(q2*)q2*=R(q1*)q2进一步阅读的例子反应函数的概念和思路可以应用到一般的无限多种策略博弈的求解中,可以使博弈问题的解法简约如产业组织理论研究中经典的模型:Bertrand双寡头模型。它与CournotModel不同的是,该模型中厂商的可选策略是价格而不是产量。Hotelling价格竞争模型。混合策略以猜硬币博弈为例,这是一个零和博弈,没有NE。其显著的特征是每一个博弈方都想掌握对方选择策略的规律性,而对方又不想让对方掌握自己特征,他最好的选择是随机选择策略,即按一定的概率分布选择自己的策略。在本例中,如果盖硬币方以概率p选择正面,1-p选择反面,但如果p>1-p或P>1/2,即盖方出正面多于出反面,在这种情况下,他的期望收益:
E=p·1+(1-p)·(-1)=2(P-1/2)>0
就平均而方,猜方获利机会要多,这样对盖方不利。如何计算猜硬币博弈的解?对盖方来说,最好的方法是设计一个概率分布,使猜方无法掌握其盖的规律性,即使猜方的EU正=EU反,这样猜方就不会依据你对策略的偏好占到你任何便宜。同样,猜方也以相同概率随机选择策略。在本博弈中,博弈双方的决策内容都不是确定性的具体策略,而是以一定的概率分布随机选择策略,这样的决策被称为随机策略或混合策略MixedStrategy。为了区别,将有确定性的决策内容的博弈问题中的策略称为“纯策略”,其均衡也为“纯策略纳什均衡”。混合策略的定义在G={S1,…Sn;u1,…un}中,博弈方i的策略为Si={si1,…sik},则博弈方i以概率分布pi=(pi1,…pik)随机选择其k个可选择策略,则这Pi就称为一个随机策略或混合策略,其中0≤pij≤1,j=1,…k都成立,且pi1+···pik=1.斗鸡博弈的混合策略设A方以概率pA(进)+pA(退)=1设B方以概率pB(进)+pB(退)=1A、B如何选择PA,PB?对A方来说,他设计的概率要使B方在选择每一种策略时无差异:
EB进=pA进·(-3)+pA退·
(2)
EB退=pA进·(0)+pA退·
(0)-3,-32,00,20,0进退B
进退
A令EB进=EB退
-3pA进+2pA退=0pA进+pA退=1
则pA进=0.6,pA退=0.4同理,pB进=0.6,pB退=0.4随机策略决策的基本原则第一个原则不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性。第二个原则他们选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性地倾向某一策略而在博弈中占上风。斗鸡博弈的随机策略均衡在纯策略中,NE是一组最优策略组合S*=(S1*…Si*…Sn*)如囚徒困境中,(坦白,坦白)是一个纳什均衡,其支付为(-5,-5)。在随机策略中,NE也是一组策略组合,但是以概率大小来选择相应最优策略。以斗鸡博弈来看,A方以(0.6、0.4)分别选择进和退,B方也(0.6、0.4)概率分别选择进和退,这就是混合策略的NE。其支付分别为各自期望收益(EA、EB)(-0.6,-0.6):监督博弈博弈方:代理人A、委托人P代理商的可选策略:工作W,偷懒S
工资w,工作的花费g,且w>g委托人的可选策略:检查I,不检查N
委托人检查的费用h,
增加的价值为v(v>w)假定g>h>0其支付矩阵如图所示
0,-h
w,-w
w-g,v-w-hw-g,v-w检查不检查偷懒工作
代理商委托人监督博弈的随机策略均衡用下划线求解,可知本博弈无纯策略NE。设代理商:偷懒的概率为x,工作概率为1-xp1=(x,1-x)设委托人:检查的概率为y,不检查的概率为1-yp2=(y,1-y)对代理商来说他设计的概率p1=(x,1-x),应该使委托人在不同策略选择下的期望收益相等,即EUPI=EUPN
EUPI=x(-h)+(1-x)(v-w-h)EUPN=x(-w)+(1-x)(v-w)
令EUPI=EUPN,则求出x=h/w同理对委托人他的概率p2=(y,1-y),也使EUAW=EUAS,则y=g/w因此,本博弈混合策略的NE为(h/w,1-h/w),(g/w,1-g/w)均衡时的期望
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年建筑劳务分包项目招标详细协议一
- 海洋平台防腐施工合同
- 2024年度专业弱电工程技术服务协议版
- 会议室墙面装饰施工协议
- 2024年度标准空地租赁协议修订版一
- 建筑防爬行类害安全施工协议
- 核电工程合同毛利评估
- 2024年专业酒店用品供应及采购合同合同版
- 技术门市租赁合同样本
- 药品研发材料储存外仓租赁合同
- 初中语文古诗词教学实践研究
- 2024年秋初中生物七年级上册教学设计(教案)第二节 细菌
- 人教版小学一年级语文上册全册试卷全套含答案
- EASL-EASD-EASO代谢相关脂肪性肝病-MASLD-临床实践指南解读幻灯
- 2024年秋季新苏教版一年级上册数学课件 期末复习 第3课时 图形的认识
- 华中师大版七年级上册信息技术 4.2信息的合理存放-文件及文件夹的合理存储 教案
- 防雷与接地作业指导书
- 施工组织设计-汽研中心风洞试验室工程
- 突发环境事件应急预案评审会汇报课件-(模板)
- 楚雄彝族自治州楚雄市2022-2023学年七年级上学期期末数学试题
- JT∕T1180.4-2018交通运输企业安全生产标准化建设基本规范第4部分:道路普货运输
评论
0/150
提交评论