讲义管理博弈论_第1页
讲义管理博弈论_第2页
讲义管理博弈论_第3页
讲义管理博弈论_第4页
讲义管理博弈论_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

管理博弈论

(ManagementGameTheory)第1讲博弈论概述及完全信息静态博弈主讲人:张成科博士广东工业大学经济与贸易学院zhangck@本次讲义提纲教材及参考书

本课程的主要内容第一章博弈论概述本课程的教学目的第二章完全信息静态博弈教材及参考书教材:张维迎,博弈论与信息经济学,上海三联书店,上海人民出版社.2001.主要参考书:

1.陶长琪主编信息经济学,经济科学出版社.20012.谢识予,经济博弈论,复旦大学出版社,20013.侯光明,李存金,管理博弈论,北京理工大学出版社,20054.雷霖,现代企业经营决策-博弈论方法应用,清华大学出版社发行5.王则柯,新编博弈论平话,出版:中信出版社6.潘天群,博弈生存-社会现象的博弈论解读,中央编译出版社北京图书发行7.王国成,企业治理结构与企业家选择-博弈论在企业组织行为选择中的应用,经济管理出版社8.姚国庆,21世纪高等院校经济学专业系列教材-博弈论,南开大学出9.jeantirole,经济科学译丛-博弈论,中国人民大学出版社教材及参考书本课程的主要内容第一章博弈论概述本课程的教学目的第二章完全信息静态博弈内容导航指针课程主要内容简介第一篇非合作博弈理论第一章绪论第二章完全信息静态信息博弈-纳什均衡第三章完全信息动态搏弈-子博弈精炼纳什均衡第四章不完全信息静态博弈-贝叶斯纳什均衡第五章不完全信息动态博弈-精练贝叶斯纳什均衡第二篇管理博弈论

第六章委托-代理理论(I)

第七章委托-代理理论(II)

第八章管理激励与约束机制设计主要内容简介(续)本课程的教学安排本课程的主要内容第一章博弈论概述本课程的教学目的内容导航指针第1章博弈论概述

§1博弈论与经济管理关于“博弈论”:博弈论是研究人们在利益相互影响的格局中的策略选择问题、是研究多人决策问题的理论。而策略选择是人们经济行为的核心内容,此外,经济学和博弈论的研究模式是一样的:即强调个人理性,也就是在给定的约束条件下追求效用最大化。可见,经济学和博弈论具有内在的联系。在经济学和博弈论具有的这种天然联系的基础上产生了经济博弈论。博弈论与经济管理诺贝尔经济学奖获得者萨缪尔森有一句话:你可以将一只鹦鹉训练成一个经济学家,因为它只需要学习两个词:供给和需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,就是“纳什均衡”。第1章博弈论概述

§1博弈论与经济管理将博弈的思想明确地应用于经济领域,始于古诺(Cournot,1838)、伯特兰德(Bertrand,1883)和艾奇沃斯(Edgeworth,1925)等人关于两寡头的产量和价格垄断、产品交易行为的研究,他们通过对不同的经济行为方式和案例建立了相应的博弈论模型,为经济博弈论的发展提供了思想雏形和有益尝试。近半个多世纪以来,博弈论引起了众多经济学家的极大兴趣,使得博弈论在经济学中的应用模型越来越多。大约从20世纪80年代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础(张维迎,P8)。第1章博弈论概述

§1博弈论与管理学博弈论研究的是:给定信息结构,什么是可能的均衡结果?——是方法论导向的。管理博弈论是非对称信息博弈论在管理学上的应用。她研究的问题是:给定信息结构,什么样的机制安排是最有效率的?——是问题导向的。什么是博弈?张维迎关于博弈论的定义——是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的,也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。

第1章博弈论概述施锡铨关于博弈论的定义分析在一群举止行为颇具策略的理性人之间的相互作用的正规方法。博弈论关注的是互相依(interdependence)

每一个体猜测其他个体的选择是什么?每个人将采取什么样的行动?(当最优的行动依赖于其他人的所作所为时,这个问题尤其令人关注。)

这些行动产生什么样的结局?对于整个群体,这个结局好吗?如果群体不止一次地互相作用,会有任何差异吗?如果每一个体对群体内其他个体的特性没有把握,答案将发生怎样的变化?博弈论是考虑以下每一项条款的正规方法:群体——在任何博弈中有不止一个决策者;每一个决策者称为局中人相互作用——任何单个局中人的行为直接影响到群体内至少一个其他的局中人。策略——单个局中人在决定自己所取的行动时,会考虑到相互依存性。理性——在考虑到这种相互依存性时,每一个局中人会选择自己的最优行动。

什么是博弈?●张守一——是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。●[美]RogerB.Myerson——博弈论可以被定义为是智能的理性决策者之间冲突与合作的数学模型的研究。第1章博弈论概述二、博弈论概述(一).什么是博弈?

博弈论模型是从人类社会的政治、经济、军事等活动中抽象出来的一种数学模型。在这种模型中首先要有参与人或局中人。参与人通过对于某些行动的选择行为体现对于该种活动的参与。参与人的活动要涉及自己和其他人的利益。这种利益一般不仅与自己的行动有关,特别与其他参与人的行动选择有关。博弈论主要研究参与人在这种理性行动中的理性行为以及在所有参与人都采取理性行为的假设下博弈的最终结果。博弈论概述博弈论(gametheory,又译为对策论)定义:研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡。开始于-冯.诺曼(VonNeumann)与摩根斯坦(Morgenstern)在1944年合作的《博弈论与经济行为》(TheTheoryofGamesandEconomicBehaciour)参与人:两人及两人以上;行为:做出决策;行为目标:收益最大化(或者最小化)环境条件:目标的实现不仅取决于自己的行为,同时还取决于其他人的行为,个人的最优选择是其他人选择的函数——策略性的行为。典型例子:高考报志愿博弈论概述

(一)什么是博弈论博弈论概述

(一)什么是博弈论注意两点:1、是两个或两个以上参与者之间的对策论当鲁滨逊在孤岛上遇到了新上岛的其他人,则就是博弈问题了!一般优化问题与博弈问题的区别博弈模型与最优化模型的本质区别是什么?(静态)博弈问题:(静态)最优化问题:博弈与优化问题的本质区别一美圆拍卖与“光滑斜坡”理论耶鲁大学教授马丁.舒比克设计的“陷阱游戏”:一名拍卖人拿出一张一美圆钞票,请大家给这张钞票开价;每次叫价以10美分为单位,出价最高者和次高者都要向拍卖人支付相当于出价数目的费用。利用博弈规则设计获取利益的经典博弈模型

教授们在课堂实验上跟毫无疑心的本科生们玩这个游戏,总是可以赚够在教工食堂吃一顿午饭的钱。

你打算如何玩这个游戏?利用博弈规则设计获取利益的经典博弈模型第1章博弈论概述

§2

博弈论的基本概念1、参与人Players:一个博弈中的决策主体,他们各自的目的是通过选择行动(策略)以最大化自己的目标函数/效用水平/支付函数。他们可以是自然人或团体或法人,如企业、国家、地区、社团、欧盟、北约等。那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人,而只能当做环境参数来处理。如指手划脚的看牌人、看棋人,企业的顾问等。对参与人的决策来说,最重要的是必须有可供选择的行动集(策略集)和一个很好定义的支付函数。第1章博弈论概述

§2

博弈论的基本概念虚拟参与人(pseudo-player):指“自然”(nature)、“上帝”God,也即决定外生的随机变量的概率分布的机制。“某事在人、成事在天”的“天”;如出远门去旅游,可能很开心,也可能很尴尬(生病住医院),两者概率分布90%、10%或98%与2%或其他,由上帝决定。在以后的讨论中,我们记参与人为i,参与人集合记为T,即T={1,2,……,i,……,n},即该博弈中共有n个参与人;为了讨论的方便,把某个参与人i之外的其他参与人称为的i对手记为-i;N代表自然。第1章博弈论概述

§2

博弈论的基本概念*注意:博弈理论家一般对参与人做两个基本的假设——参与人都是个体理性的和智能的理性的(rational)?1—如果一个决策者在追逐其目标时能前后一致地做决策,就称他为rational。RogerB·Myerson(P2)

2—广义而言指的是一种行为方式,他同在给定条件或约束下最有效地实现预期目标相关。第1章博弈论概述

§2

博弈论的基本概念智能的(intelligent)?

当我们像博弈论专家那样分析一个博弈时,如果参与人知道我们对此博弈所知道的一切,并能做出我们对此博弈所能做出的一切推断,我们就说此博弈的参与人是智能的。RogerB·Myerson(P3)第1章博弈论概述

§2

博弈论的基本概念2、策略(strategies):博弈中有两种策略概念,一种为纯策略(purestrategy),简称策略,指参与人在博弈中可以选择采用的行动(ac-tionsormoves)方案,是参与人在给定信息结构的情况下的行动规则,它规定参与人在什么时候的什么情况下采取什么行动。因而一个策略是参与人的一个“相机行动方案”(contingentActionplan)。如“人不犯我…”、“按第一套方案行动、实施第二套方案…”……,第1章博弈论概述

§2

博弈论的基本概念2、策略的描述记参与人i的一个策略为si,参与人i在一个博弈中的全部可供选择的策略记为Si(策略集strategyset),即si∈Si

Si={s1,s2,…si

,…,sn},表示参与人i在该博弈中共有n个可行的策略。如果n个参与人每人从自己的Si中选择一个策略si,则向量s=(s1,s2,﹍,si,﹍,sn)是一个策略组合(strategyprofile),参与人i之外的其他参与人的策略组合可记为s-i=(s1,s2,﹍,si-1,si+1,﹍,sn)。例如田忌的某个策略s田忌=上中下,或中下上,等等;S田忌={上中下,上下中,中上下,中下上,下上中,下中上}第1章博弈论概述

§2

博弈论的基本概念另一种策略概念是在纯策略基础上形成的混合策略(mixedstrategy)概念,参与人i的混合策略pi是他的纯策略空间Si上的一种概率分布,表示参与人实际进行决策时根据这种概率分布在纯策略中随机选择加以实施。Pi(si)表示Pi分配给纯策略si的的概率。如出门要否带雨伞?天气预报说有时有雨。猜拳?这是一个十分玄乎的概念,让人不容易理解,它是一种不确定,采用这种策略的目的就是让对方琢磨不透,实施时似乎由一架随机机器在操作。随机策略randomizedstrategy

纯策略是混合策略的特例?第1章博弈论概述

§2

博弈论的基本概念*注意:

1、策略与行动是两个不同的概念,策略是行动的规则而不是行动本身。回顾“犯与不犯”的问题。在静态博弈中,由于参与人同时行动,没有人能掌握他人的之前行动的信息,故没有可针对的行动,从而策略的选择就变成了行动的选择,即策略和行动是同一的。行动集Aiai

2、作为一种行动规则,策略必须是完备的,就是说,策略要给出参与人在每一种可能想象到的情况下的行动选择,即使参与人并不预期这种情况会实际发生。“丑话说在前-----”第1章博弈论概述

§2

博弈论的基本概念3、支付(payoffs):参与人从各种策略组合中获得的收益。收益往往采用效用(utility)概念。它或者是一个特定策略组合下某个参与人得到的确定效用水平,或者是期望效用水平。它是策略组合的函数,所以也称支付函数(payofffunction),记为ui(s),ui(s)=ui(s1,s2…,si

,…sn-1,sn).第1章博弈论概述

§2

博弈论的基本概念*注意1:博弈的一个基本特征是一个参与人的支付不仅取决于自己的策略选择,而且取决于所有其他参与人的策略选择;是策略组合的函数。

2:支付是参与人真正关心的东西,参与人在博弈中的目标就是选择自己的策略以最大化自己的支付函数。第1章博弈论概述

§2

博弈论的基本概念一个博弈中,明确了以上三个概念,该博弈的基本框架就形成了,故称为博弈的三个基本要素。一个具体博弈界定,还须明确行动的顺序和有关的信息。4、行动的顺序(theorderofplay):博弈中参与人实施决策活动的顺序。同时或有先有后。其他因素不变,但顺序不同,参与人的最优选择就不同,博弈的结果也不同。事实上,同的顺序安排意味着不同的博弈。静态博弈和动态博弈。第1章博弈论概述

§2

博弈论的基本概念5、信息(information):指一个博弈中参与人有关该博弈的知识,如关于N的选择、其他参与人的策略集、支付函数、行动时间等.博弈论中关于信息的具体概念有:●信息集(informationset)—主要出现在动态博弈中,可理解为参与人在特定时刻上对有关变量的值的知识;一个参与人无法准确知道的变量的全体属于一个信息集。买古董。第1章博弈论概述

§2

博弈论的基本概念●完美信息(perfectinformation):指一个参与人对其他参与人(包括N)的行动选择有准确了解的情况,即一个信息集只包含一个值。动态博弈的概念。●完全信息(completeinformation):指N不首先行动或N的初始行动被所有的参与人准确观察到的情,即没有事前的不确定性。完全信息意味着各个参与人的支付函数是共同知识。显然,不完全(incomplete)信息意味着不完美(imperfect)信息。第1章博弈论概述

§2

博弈论的基本概念●共同知识(commonknowledge)是与信息有关的一个重要概念。如听过某个老师的课,学生认识老师,但老师不一定就记住该学生,路上碰在一块了,学生会不会叫老师呢?也许学生会以为老师不认识他,打招呼会把老师弄得莫名其妙。解释一:共同知识指“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道…”。

解释二:如果每个参与人都知道某个事实,每个参与人都知道每个参与人都知道它,如此等等,从而形如“(每个参与人都知道)k每个参与人都知道它”的语句对k=0,1,2,…都是正确的,那我们就称这个事实为参与人中间的共同知识。第1章博弈论概述

§2

博弈论的基本概念●私人信息(privateinformation):指任何一个他拥有但不是该博弈中所有参与人共同知识的信息。由于存在私人信息,便有了信息不对称的问题。第1章博弈论概述

§2

小结博弈论的基本概念包括:参与人:博弈论中选择行动以最大化自己效用的决策主体;行动:参与人的决策变量战略:参与人选择行动的规则信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识支付函数:参与人从博弈中获得的效用水平

结果:博弈分析真正感兴趣的要素的集合均衡:所有参与人的最优战略的组合参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。第1章博弈论概述

§3

博弈论的分类分类是一种深化认识的方法。博弈可以根据不同的标志从不同的角度进行多种分类。通过分类我们将对博弈有进一步的了解,同时对博弈理论的结构体系有初步的认识。1、按参与人的多少分:单人博弈和多人博弈第1章博弈论概述

§3

博弈论的分类2、按策略空间是否有限分:有限策略博弈和无限策略博弈3、按各策略组合下参与人支付之和情况分:零和博弈、常和博弈和变和博弈。第1章博弈论概述

§3

博弈论的分类4按参与人行动的先后顺序:静态博弈和动态博弈静态博弈:参与人同时选择行动或非同时行动但后行动者并不知道前行动者采取了什么具体行动;动态博弈:参与人行动有先后顺序,且后行动者能够观察先行动者选择的行动。第1章博弈论概述

§3

博弈论的分类参与人对其他参与人(对手)的特征、战略空间及支付函数的知识:完全信息博弈和不完全信息博弈。完全信息:每一个参与人对所有其他参与人的(对手)的特征、战略空间及支付函数有准确的知识,否则为不完全信息。第1章博弈论概述

§3

博弈论的分类5、按信息是否完全分:完全信息博弈和不完全信息博弈6、按信息是否完美分(动态博弈):完美信息动态博弈和不完美信息动态博弈第1章博弈论概述

§3

博弈论的分类博弈理论体系的结构框架按下面博弈类型安排:

行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950,1951)完全信息动态博弈子博弈精练纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈精练贝叶斯纳什均衡泽尔腾(1965)Kreps

和Wilson(1982)Fudenberg

和Tirole(1991)第1章博弈论概述

§4

博弈论研究著名学者因对博弈论研究作出杰出贡献而获诺贝尔经济学奖的经济学家:●纳什(Nash):Nash-Equilibrium●塞尔藤(Selten):Subgame-PerfectNashE---●海萨尼(Harsanyi):Bayes-NashEquilibrium1994●维克利、莫里斯1996博弈论大师Nash第1章博弈论概述

§4

博弈论研究著名学者●迈克尔·斯宾斯(Spence):1948年生于美国的新泽西,1972年获哈佛大学博士头衔,现兼任美国哈佛和斯坦福两所大学经济学教授。●乔治·阿克尔洛夫:1940年生于美国的纽黑文,1966年获美国麻省理工学院博士头衔,现为美国加利福尼亚大学经济学教授。●约瑟夫·斯蒂格利茨,1948年生于美国的印第安纳州,1967年获美国麻省理工学院博士头衔,曾任世界银行的首席经济学家,现任美国哥伦比亚大学经济学教授。第1章博弈论概述

§4

博弈论研究著名学者

2001年三人同获诺贝尔经济学奖,分享1000万瑞典克郎(94.3万美元)的奖金。他们“发展并研究了市场信息不对称的问题,揭示了当代信息经济的核心”。阿克尔洛夫是最早发现信息不对称的学者之一。阿克尔洛夫最大的贡献是解释了在发展中国家里,信贷市场信息的不对称导致了这些国家信贷市场的过高利息。此外,阿克尔洛夫还把信息不对称运用于解释各种社会问题,比如因为信息不对称,医疗保险市场上,老年人、个体劳动者的医疗保险利益得不到保障。第1章博弈论概述

典型博弈模型-囚徒困境案例1-囚徒困境-纳什均衡

-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵赖坦白抵赖-8大于-100大于-1(坦白,坦白)是纳什均衡第1章博弈论概述

典型博弈模型-囚徒困境设定:(1)每个局中人都知道博弈规则和博弈结果的支付矩阵;(2)每个局中人都是理性的(个人理性和个人最优决策);(3)不能“串通”第1章博弈论概述

典型博弈模型-囚徒困境通俗地讲:

纳什均衡的含义是:给定别人战略情况下,没有任何单个参与人有积极性选择其他战略,从而没有人有积极性打破这种均衡。第1章博弈论概述

典型博弈模型-囚徒困境两个寡头企业选择产量的博弈:

如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小于卡特而产量下的利润。请举几个囚徒困境的例子第1章博弈论概述

典型博弈模型-囚徒困境同样的情形发生在:公共产品的供给美苏军备竞赛经济改革中小学生减负……第1章博弈论概述

典型博弈模型-囚徒困境囚徒困境的性质:个人理性和集体理性的矛盾;个人的“最优策略”使整个“系统”处于不利的状态。思考:为什么会造成囚徒困境是否由于“通讯”问题造成了囚徒困境?“要害”是否在于“利己主义”即“个人理性”?是否囚徒困境的结果就一定不利?第1章博弈论概述

典型博弈模型-囚徒困境结论:人类自私的天性,使他们陷入“囚徒困境”,难以自拔。

解决囚徒困境问题的“出路”“解决个人理性和集体理性之间冲突的办法不是否认个人理性,而是设计一种机制,在满足个人理性的前提下达到集体理性”;“一种制度安排,要发生效力,必须是一种纳什均衡。否则,这种制度安排便不能成立”。囚徒困境的效果在不同情况下对社会而言可能是“负面”的,也可能是“正面”的。本课程的教学安排本课程的主要内容博弈论概述本课程的教学目的内容导航指针学习本课程的目的

张维迎认为:“近几十年来,经济学一直在为其他学科提供武器,但恐怕没有任何其他工具比博弈论更有力了”。博弈论可以:引导学生运用书中介绍的理论分析现实的经济现象扩大学生的知识面开阔思路和思维模式博弈论成为目前研究“热点”一、以博弈论为方法或工具的研究状况博弈论作为一种研究方法和工具,已经在各个领域得到了广泛的应用,尤其是在经济学领域,从1944年Neumann和Morgenstern出版第一本关于经济博弈论的著作《TheoryofGameandEconomicBehavior》,到1994年诺贝尔经济学奖授予博弈论专家JohnNash、Reinhard

Selten和JohnHarsanyi,奠定了博弈论在经济学中的地位。2005年诺贝尔经济学奖再次授予博弈论专家RobertJ.Aumann和ThomasC.Schelling,由此更引发了专家学者对博弈理论及其应用研究的关注。管理科学有工程研究热点之一目前,博弈理论已在经济学领域以及管理科学与工程、控制理论与控制工程等学科方向得到了广泛的应用。文献[1]以1994~2004年国内外与管理科学与工程学科相关的论文文献计量研究表明,“管理博弈论与模型”已经成为管理科学与工程学科排名第4的“热点领域”[1]。通过国家自然科学基金资助项目查询发现,国内学者针对理论与实际问题提出了许多项目研究,取得了丰富的成果。

获国家自然科学基金资助项目多通过国家自然科学基金网站“资助项目”查寻,从2000年到2007年,共资助与博弈论有关的项目68项!如南京大学的周晶教授连续获得三项资助,最近两项分别为:“竞争环境下的收益管理博弈模型与决策分析”“基于博弈模型的城市交通供需耦合平衡机理及控制研究”。国家自然科学基金资助的部分项目情况(I)首都经济贸易大学的刘黎明教授研究了“财政体制的博弈分析”;重庆大学的蒲勇健教授“用博弈论方法研究国企债转股中的互动行为和政策效应”;武汉大学的丁煌教授进行了“新体制下公共政策的博弈论研究”;南京大学的肖条军教授开展了“基于演化博弈理论的企业行为与组织模式研究”和“需求不确定性环境下供应链管理的博弈模型研究”;上海交通大学的席裕庚教授开展了“基于非合作博弈的多目标生产调度研究”;南京大学的盛昭瀚教授研究了“基于博弈学习理论的企业组织治理演化理论”;国家自然科学基金资助的部分项目情况(II)清华大学的林旭东教授“基于动态博弈研究电子市场价格演化、信息价值与效率问题”;北京工业大学的李振龙教授研究了“城市交通网络拥塞控制的博弈模型及其优化”;华中科技大学的薛明皋教授开展了“R&D联盟的期权博弈理论评估模型及实证研究”;东南大学的陶军教授开展了“基于博弈理论的非合作网络QoS分配中关键技术的研究”等等。这些研究极大地丰富和发展了博弈论方法体系、拓展了博弈论的应用领域、为社会经济发展作出了应有的贡献。在对博弈理论的自身发展和完善研究方面,国内外学者也开展了研究,如:DavidW.K.Yeung和LeonA.Petrosyan研究了“合作随机微分博弈(CooperativeStochasticDifferentialGames)[2];A.Cincotti和H.Iida用信息熵思想研究了结局不确定的博弈模型及其相应的博弈均衡策略[3];四川大学的刘光中教授对多维博弈理论及其应用进行了研究;北京交通大学的修乃华教授进行了“广义非合作博弈的均衡和优化算法研究”;武汉大学的王先甲教授开展了“进化博弈中基于粒子群优化与拟生灭过程的智能体有限理性进化与合作机制研究”;贵州大学的向淑文教授对广义信息集与若干博弈问题开展了研究等等。我本人所承担的广东省哲学社科规划项目“城市区域经济竞合研究:基于战略网络的城市博弈理论和方法(No.03/04C2—05)”关键词:博弈论1999—2005/全部数据/114

/114

序号篇名作者刊名年/期1基于委托人-代理人关系的患者就医行为研究张帆上海理工大学学报(社会科学版)2005/042基于价格折扣策略的供需协调模型杨皎平科技管理研究2005/113托马斯·谢林对博弈论的贡献刘安国经济学动态2005/124指向合作与和谐的理论——2005年度诺贝尔经济学奖得主学术贡献评介周鹏经济学动态2005/1252005年度诺贝尔经济学奖新闻公报刘安国经济学动态2005/106经营者声誉与国有企业的经营绩效——一种博弈论的分析视角李军林经济学动态2005/107评《开放经济与中国产业组织研究》黄泰岩经济学动态2005/088对非法煤矿监控的博弈分析李新光广州市经济管理干部学院学报2005/039中央与地方政府基础设施投资的博弈分析王丽丽东南大学学报(哲学社会科学版)2005/S110夏普利值在产学研合作利益分配中的应用舒尚奇中国市场2005/3911海域使用监察的博弈分析李权昆渔业经济研究2005/0112激励制度中的声誉激励陈静工业技术经济2005/09132005年诺贝尔经济学奖获奖者主要贡献杜丹嘉兴学院学报2005/S214不打非理性的价格战梁小民英才2005/12共有记录2266条

首页上页下页末页共有记录2266条

首页上页下页末页在中国期刊网上用“博弈论”作关键词的查寻结果第二章完全信息静态信息博弈-纳什均衡一博弈的战略表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例一博弈的战略表述案例-房地产开发项目-假设有A、B两家开发商市场需求:可能大,也可能小投入:1亿假定市场上有两栋楼出售:需求大时,每栋售价1.4亿,需求小时,售价7千万;如果市场上只有一栋楼需求大时,可卖1.8亿需求小时,可卖1.1亿一、博弈的战略表述4000,40008000,00,80000,0不开发开发商A开发不开发开发-3000,-30001000,00,10000,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况博弈的战略式表述一、博弈的基本概念及战略表述博弈论的基本概念包括:参与人:博弈论中选择行动以最大化自己效用的决策主体;行动:参与人的决策变量战略:参与人选择行动的规则信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识支付函数:参与人从博弈中获得的效用水平

结果:博弈分析真正感兴趣的要素的集合均衡:所有参与人的最优战略的组合参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。一、博弈的基本概念及战略表述参与人:博弈论中选择行动以最大化自己效用的决策主体。可以是自然人,也可以是团体,如企业、国家甚至由若干国家组成的集团(OPEC、欧盟等)。虚拟参与人:“自然”作为虚拟参与人自然:指决定外生的随机变量的机制为分析方便引入,自然作为虚拟参与人没有自己的支付和目标函数(即所有结果对它是无差异的)参与人决策的后果依赖于自然的选择。在不完全信息博弈中,自然选择参与人的类型一、博弈的基本概念及战略表述行动:参与人在某个时点的决策变量Ai表示第i个参与人的一个特定行动行动的顺序:行动的顺序对于博弈的结果是非常重要的,事实上,不同的行动顺序意味着不同的博弈。在博弈论中,一般假设参与人的行动空间和行动顺序是所有参与人的共同知识。一、博弈的基本概念及战略表述信息:参与人在博弈中的知识,特别是有关其他参与人的特征和行动的知识。如房地产开发博弈中,如果A不知道市场需求,而B知道,则A的信息集为{大,小},B的信息集为{大}或{小}完美信息:指一个参与人对其他参与人(包括“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。完全信息:指自然不首先行动或自然的行动的初始行动所有参与人观察到的情况。共同知识:指“所有参与人知道所有参与人知道所有参与人知道….”的知识。一、博弈的基本概念及战略表述战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。在静态博弈中,战略和行动是相同的。作为一种行动规则,战略必须是完备的。一、博弈的基本概念及战略表述支付函数:参与人从博弈中获得的效用水平,或者指参与人得到的期望效用水平。博弈的基本特征是一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择一、博弈的基本概念及战略表述结果:博弈分析感兴趣的所有东西如均衡战略组合、均衡行动组合、均衡支付组合等。一、博弈的基本概念及战略表述均衡:所有参与人的最优战略的组合一般记为:一、博弈的基本概念及战略表述博弈的战略式表述:一、博弈的基本概念及战略表述寡头产量博弈中,企业是参与人,产量是战略空间,利润是支付;战略式表述博弈为:第2章完全信息静态信息博弈-纳什均衡一博弈的基本概念及战略表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例二占优战略均衡案例1-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵赖坦白抵赖-8大于-100大于-1-8大于-100大于-1抵赖是A的严格劣战略抵赖是B的严格劣战略二占优战略均衡占优战略:不论其他人选择什么战略,参与人的最优战略是唯一的,这样的最优战略称为“占优战略”(dominantstrategy)。二占优战略均衡占优战略均衡定义:在博弈的战略表达式中,如果对于所有的i,Si*是i的占优战略,下列战略组合称为占优战略均衡:二占优战略均衡注意:如果所有人都有(严格)占优战略存在,那么占优战略均衡就是可以预测的唯一均衡。占优战略只要求每个参与人是理性的,而不要求每个参与人知道其他参与人是理性的(也就是说,不要求理性是共同知识)。为什么?二占优战略均衡4000,40008000,00,80000,0不开发开发商A开发不开发开发-3000,-30001000,00,10000,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况博弈的战略式表述A严格劣战略B严格劣战略

5,14,49,-10,0等待小猪大猪按等待按案例2-智猪博弈等待是小猪的严格占优战略大猪有无严格占优战略?4大于10大于-1第2章完全信息静态信息博弈-纳什均衡一博弈的基本概念及战略表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例三重复剔除的占优均衡重复剔除严格劣战略:思路:首先找到某个参与人的劣战略(假定存在),把这个劣战略剔除掉,重新构造一个不包含已剔除战略的新的博弈,然后再剔除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。这个唯一剩下的战略组合就是这个博弈的均衡解,称为“重复剔除的占优均衡”。三重复剔除的占优均衡注意:

与占优战略均衡中的占优战略和劣战略不同,这里的占优战略或劣战略可能只是相对于另一个特定战略而言。三重复剔除的占优均衡

5,14,49,-10,0等待小猪大猪按等待按案例2-智猪博弈按是小猪的严格劣战略-剔除4大于10大于-1“按”是大猪的占优战略,纳什均衡:大猪按,小猪等待三重复剔除的占优均衡重复剔除的占优均衡战略组合称为重复剔除的占优均衡,如果它是重复剔除劣战略后剩下的唯一战略组合。如果这种唯一战略组合是存在的,我们就说该博弈是重复剔除占优可解。注意:如果重复剔除后的战略组合不唯一,该博弈就不是重复剔除占优可解的。三重复剔除的占优均衡1,01,20,30,1M列先生行先生UDL0,12,0R行:没有占优战略列:M严格优于R剔除R行:L优于D列:无占优战略剔除DM优于L(U,M)是重复剔除的占优均衡三重复剔除的占优均衡练习:在下列战略式表达中,找出重复剔除的占优均衡4,35,16,22,18,43,63,09,62,8C2R1R2C1C3R3三重复剔除的占优均衡注意:1、重复剔除的占优均衡结果与劣战略的剔除顺序是否有关取决于剔除的是否是严格劣战略。2、重复剔除的占优均衡要求每个参与人是理性的,而且要求“理性”是参与人的共同知识。即:所有参与人知道所有参与是理性的,所有参与人知道所有参与人知道所有参与是理性的三重复剔除的占优均衡2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除顺序:R3、C3、C2、R2使用劣战略剔除,可以看到(R1,C3)是重复剔除劣战略均衡。举例:三重复剔除的占优均衡2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除顺序:C2、R2、C1、R3战略组合(R1,C3)是重复剔除劣战略均衡。两者不一样。若使用严格劣战略剔除,可以看到,(R1,C3)(R1,C1)都两个留下的战略组合,不唯一,因此在这里是不可解的。举例:三重复剔除的占优均衡尽管许多博弈中重复剔除的占优均衡是一个合理的预测,但并不总是如此,尤其是大概支付某些极端值的时候。8,10-1000,97,66,5参与人B参与人AUDLRU是A的最优选择,但是,只要有1/1000的概率B选R,A就会选D四纳什均衡定义:在有n个参与人的战略式表述博弈G={S1,S2,…,Sn;u1,u2,…,un}中,战略组合s*=(s1*,s2*,…,

sn*)是一个纳什均衡,如果对于每一个i,si*是给定其他参与人的选择s-i*=(s1*,…,si-1*,si+1*,…,sn*)的情况下第i个人的最优战略,即

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论