《经济博弈论》教材教学课件_第1页
《经济博弈论》教材教学课件_第2页
《经济博弈论》教材教学课件_第3页
《经济博弈论》教材教学课件_第4页
《经济博弈论》教材教学课件_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、经济博弈论教材 教学课件第一章 导论 本章介绍博弈论的基本概念,包括什么是博弈和博弈论,给出一些经典博弈例子。对博弈分类和博弈理论的结构作一些讨论,对博弈论的发展历史等作简单介绍。目标是让读者对博弈论的内容和博弈模型有更直观的概念和印象,本教材的基本内容,以及博弈分析的基本思想方法等形成初步的认识,为后面各章展开详细分析作好铺垫和准备。 本章分五节1. 1什么是博弈论1. 2几类经典博弈模型1. 3博弈结构和博弈的分类1. 4博弈论历史和发展的简要评述1. 5博弈论在我国的应用1.1 什么是博弈论1.1.1 从游戏到博弈1.1.2 一个非技术性定义1.1.1 从游戏到博弈博弈就是策略对抗,或策

2、略有关键作用的游戏博弈Game,博弈论Game Theory,Game即游戏、竞技游戏和经济等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用 游戏下棋、猜大小 经济寡头产量决策、市场阻入、投标拍卖寡头市场厂商的产量决策;市场开发竞争中策略较量和策略依存;投标拍卖 政治、军事美国和伊拉克、以色列和巴勒斯坦政治、军事和社会的决策较量博弈论不能称作游戏理论,也不完全称作对策论1.1.2 一个非技术性定义定义:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的

3、过程。四个核心方面博弈的参加者(Player)博弈方(单人、两人和多人)各博弈方的策略(Strategies)或行为(Actions) (有限策略、无限策略) 博弈的次序(Order)(静态、动态、序贯、重复)博弈方的得益(Payoffs)(零和、非零和、常和、非常和)这就是评价博弈论的标准和依据或者说以上就是博弈论的四个基本要素1.2 几个经典博弈模型1.2.1 囚徒的困境1.2.2 赌胜博弈1.2.3 产量决策的古诺模型关于博弈论,流传最广的是一个叫做“囚徒困境”的故事。这个博弈是1950年图克(Tucker)提出的,这个博弈模型提出后曾引发了大量的相关研究,也有许多关于“囚徒困境”的版本

4、。“囚徒困境”对博弈论的发展起到了巨大的推动作用。可以说凡是讲博弈论,都会说到这个经典的博弈模型。引例:囚徒困境(Prisoners Dilemma)1.2.1 囚徒的困境囚徒的困境是图克(Tucker)1950年提出的该博弈是博弈论最经典、著名的博弈该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷一、基本模型-5, -50, -8-8, 0-1, -1坦 白不坦白坦 白不坦白两个罪犯的得益矩阵囚徒 2囚徒1囚徒1:坦白囚徒2:坦白以后经常用到这种形式分析博弈的上策(假设条件:个人效用最大化)有人提出:利用囚徒困境解决反腐败

5、问题。个体理性与团体理性的矛盾。1,18, 0 0,85,5囚徒1不坦白 警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需口供,警察将这两名罪犯分别关押以防止他们串供或攻守联盟,并分别跟他们讲清他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会以较轻的妨碍公务罪各判1年徒刑;如果两人中一人坦白认罪,则坦白者马上释放而另一人将重判8年徒刑;如果两人都坦白认罪,则他们各判刑5年监禁。他们如何作出决策呢? 不坦白坦白坦白囚徒2囚徒1:坦白囚徒2:坦白两个罪犯的得益矩阵(Payoff Matrix)引例:囚徒困境(Pr

6、isoners Dilemma) 不妨将条件放宽,允许囚犯A和B在审讯室里一起单独呆上10分钟,然后再决定是否坦白。很明显,双方交流的主旨就是建立攻守同盟,克服自利心理,甚至可能订立一个口头协议,要求双方都不去坦白。然后,双方再单独被提审。我们不妨设想,囚犯A的心理,他一定会认为,如果囚犯B遵守约定的话,则自己坦白就可获得自由;如果囚犯B告密的话,若不坦白就会被终生囚禁。事实上,囚犯A的策略并没有因为简单的沟通或协议而摆脱两难境地。 企业之间相互沟通信誓旦旦,价格战仍然会爆发;美苏两国经常会晤,甚至签订核不扩散条约,但军费一年高过一年。这些现象都反映了上面所说明的问题。囚徒困境说明了什么?在(

7、坦白、坦白)这个组合中,囚徒1和囚徒2都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果囚徒1和囚徒2都选择抵赖,各判刑年,显然比都选择坦白各判刑年好得多。当然,囚徒1和囚徒2可以在被警察抓到之前订立一个攻守同盟,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定,显然最好的策略是双方都抵赖. 囚徒困境的意义“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到

8、自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。 对经典经济学的冲击“纳什均衡”首先对亚当斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。 生活中的例子 在荷兰召开了一次“合作及社会两难困境研讨会”,与会的都是博弈论专家。当大会结束之后,有两个学者麦息克和路

9、特提议大家玩一个游戏。 他们将一个大信封拿出来,请在场的43位学者专家拿出金钱装到这个信封里。如果到最后这信封里的钱超过250元,麦息克和路特将自己捞腰包,退还每人10元。不过,如果最后信封内的钱不足250元,就统统没收,大家拿不到一分钱。 仔细想一想,如果你在场,你会奉献多少钱呢?结果是,打开信封一数,总共是元,比目标250元差一点点“囚徒困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单地说, “囚徒困境”问题都是个体理性和集体理性的矛盾引起的。现实中“囚徒困境”类型的问

10、题是很多的。例如厂商之间的价格大战、恶性的广告竞争、初等和中等教育中的应试教育、乱砍林木、生育、排污等,其实都是“囚徒困境”博弈的表现形式。囚徒困境的应用:价格大战 假定两个企业都采取比较低的价格,可以各得利润70亿元;都采取比较高的价格,各得100亿元;而如果一家采取较高的价格而另一家采取较低的价格,那么,价格高的企业利润为20亿元,价格低的企业因为多销利润上升到150亿元,究竟是采用较高的价格好还是采用较低的价格好? 70,70 150, 20 20, 150 100, 100百事可乐低价 高价可口可乐低价高价寡头1:低价(70)寡头2:低价(70)政府组织协调的必要性和重要性 设想乡下地

11、方有一个只有两户人家的小居民点,由于道路情况不好,与外界的交通比较困难。如果修一条路出去,每家都能得到3那么多好处,但是修路的成本相当于4。要是没有人协调,张三李四各自打着小算盘,最后结果如何呢? 1, 1 1,3 3,1 0, 0李四 修 不修 修张三 不修 结论:公共品问题一定要有人协调囚徒困境的应用:公共产品的供给 对甲和乙两家居民来说,“修路”都是劣战略,因而他们都不会出资修路。 这里,为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位,然后投入4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善。 这就是我们看到的为什么大多数路、桥等公共设施都是由政府

12、出资修建的原因。 同样的道理,国防、教育、社会保障,环境卫生等都由政府承担资金投入,私人一般没有积极性承担这方面服务的积极性和能力。 如果双方都扩军,则各自花费2000亿美元用于军费;彻底裁军,则军费为零;若一方扩军,另一方裁军,其情形会怎样呢?我们的想法是:赢方掠夺的财富是有限的,比方说8000亿美元,而输方遭到的损失是无法估量的。2,28, 80, 0苏联 扩军 裁军 扩军 美国 裁军问题:人类为什么那么傻,不选择右下角?囚徒困境的应用:军备竞赛“囚徒困境”不仅可以解释政治、经济领域的竞争,在广阔的社会生活中,这一困境的影响也随处可见。例如,我国目前的基础教育,可以说就是一个“囚徒困境”。

13、囚徒困境的应用:应试教育“囚徒困境”的内在根源是什么?“囚徒困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益的整体最优。简单地说,“囚徒困境”问题都是个体理性与集体理性的矛盾引起的。现实中“囚徒的困境”类型的问题很多。例如厂商之间的价格大战,恶性的广告竞争,初等、中等教育的应试教育,环境污染,计划生育等等。都是“囚徒的困境”的表现形式1.2.2 赌胜博弈赌博、竞技等构成的博弈问题,在经济中也有许多应用,赌胜博弈也是一类重要的博弈问题,对经济竞争和合作也有很大启示赌胜博弈的特点是一方得等于另

14、一方失,不可能双赢,属于“零和博弈”这方面的例子不胜枚举:划拳、石头剪子布等。一、田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田 忌齐威王得益矩阵取胜关键:不让对方猜到自己策略,尽可能猜出对方策略没有一种策略是上策或下策(永远最好或者最差的)这是非对称的非零和博弈 在这个博

15、弈中齐威王和田忌应该怎样选择自己的策略,才能最终获得满意的结果呢? 首先,作为博弈方的齐威王和田忌不能让对方知道或猜中自己的策略,从而导致自己输掉比赛。这也意味着任何一方的策略选择不能一成不变,或者不能有规律性地变动,即必须以随机的方式选择策略,否则一旦对方捕捉到这种规律性的变动,就可以针对性地采取应对措施。 其次,无论对齐威王还是田忌,可选择的六种策略之间没有优劣之分。从图可以看出,对齐威王来说,每一种策略都可能有六种不同的结果,究竟最终得到哪种结果,主要看对方策略与自己策略的对应状况,而不是自己的策略本身。同样的,对田忌来讲六种策略本身也无好坏之分。因此,两博弈方在决策时对自已的可选策略并

16、无偏好,应以相同的概率选用二、猜硬币博弈-1, 11, -11, -1-1, 1正 面反 面猜硬币方盖硬币方正 面反 面这是对称的零和博弈三、石头、剪子、布0, 01, -1-1, 1-1, 11, -10, 01, -1-1, 10, 0石 头剪 子布博弈方2石 头剪 子布博弈方1这是对称的零和博弈其他几个典型的博弈问题 1、智猪博弈(Boxed Pigs) 猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一边有一个猪食槽,另一边安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就需要付2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃

17、7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。最后结果如何呢? 5, 1 4, 4 9, 1 0, 0小猪 按 等 按 大猪 等智猪博弈的应用例1 大股东挑起监督经理的重任 考察现代企业制度,“智猪博弈”最典型的例子是大股东和小股民的角色差异和行为差异。在一个股份公司里面,股东应该承担监督经理的职能。但是监督经理的工作是很不容易的,需要花费很大的精力和很多的时间去搜集信息,并作出分析。 一句话,监督成本是很高的。但是股东有大有小。别人向一家公司投资一个亿,是这家公司的大股东,你买了这家公司几手股票,也是这家公司的小股东。 假定公司运营得好盈利较多时,分红会是运营不太好时

18、的几倍;那么虽然你这个小股东和他这个大股东都希望公司运营得好,但是利益关切程度却实在相差很远。设想公司运营得好,大股东的分红可以增加1千万元,你这个小股东的分红可以增加1万元。增加1万元分红当然是好事,但是如果这需要你密切监督经理的工作才能实现。而密切监督经理的工作,本身的代价就差不多相当于1万元, 甚至超过1万元,那么你就没有多少积极性去密切监督经理们的工 作。大股东就不一样,哪怕花几万元十几万元的代价雇人监督经理 的工作,对他也是很值得的:几万元十几万元代价的监督可以换来近 千万元的分红增加,何乐而不为? 可见,大股东相当于智猪博弈中的大猪,小股东相当于小猪。在大小股东是否密切监督经理工作

19、的博弈中,大股东因为利益相关会担当起搜集信息监督经理的重任,小股东坐享其成也可以因大股东密切监督经理的工作而得益。例2 股票市场例3 大企业与小企业 股市上有大户,也有小户,大户类似“大猪”,小户类似“小猪”。这时候,对小户而言,“跟大户”是最优选择,而大户必须自己搜集信息,进行分析。 进行新产品开发研究,为新产品做广告,对大企业来说是值得的,对小企业而言,则得不尝试。所以,一种可能的情况是,小企业把精力放在模仿上,或等待大企业用广告打开市场后出售廉价产品。例4 公共产品供给(续) 假如这两户人家一户富,一户穷。富户一般会承担修路的责任,穷户则很少这样干,因为富户常常是高朋满座,坐车坐轿的都来

20、,而穷人家只是自己穿着破鞋走路,路修好了他走起来舒服,路修不好他也无所谓。2、性别战(Battle Of Sexes)其他几个典型的博弈问题 2, 1 0, 01 ,1 1, 2 女 足球 芭蕾 足球男 芭蕾 一男一女谈恋爱,有些业余活动要安排,或者去看足球比赛或者看芭蕾舞演出。男的偏好足球,女的更喜欢芭蕾演出,但他们都宁愿在一起,不愿分开。问题:假如他俩都为对方着想,结果怎样呢? 圣诞节的礼物非理性结局吉姆和德拉小两口很穷。吉姆有一只挂表,但是没有表链;德拉有一头秀发,可穷得连梳子也买不起。圣诞节到了,吉姆送给德拉一个梳子,德拉送给吉姆一条表链。可是德拉再也不要梳子了,因为她卖了秀发为吉姆买

21、回了表链,吉姆再也不需要表链了,因为他卖了挂表为德拉买了梳子。几个典型的博弈问题3、斗鸡博弈(Chicken Games) 吉米和东尼拿着火棍从独木桥的两端走向中央进行火拼,每个人都有两种策略:继续前进,或退下阵来。若两人都继续前进,则两败俱伤;若一方前进另一方退下来,前进者取得胜利,退下来的丢了面子。那么,吉米和东尼这场斗鸡博弈的对阵形势怎样呢? 1,1 0, 2 2,02,2 东尼 退却 勇进 退却 吉米 勇进斗鸡博弈的应用美苏抢占地盘美苏两个军事集团在世界各地抢占地盘,也是一种斗鸡博弈。一般说来,如果一方已经抢占了一块地盘,另一方就设法占领另一块地盘,而不是与对手竞争同一块地盘。警察与游

22、行队伍游行队伍与警察越来越近,这时候,必有一方要退下来。如果警察不让步,游行队伍便会向后退;反过来,如果游行队伍来势很猛,警察就得后撤。夫妻间矛盾这也是斗鸡问题,一般说来,吵得厉害了,不是妻子回娘家躲一躲,就是丈夫到院子里抽支烟。1.2.3 产量决策的古诺模型古诺模型是寡头产量竞争,是市场经济中最常见的问题之一古诺1838年提出,直到现在还是经常使用古诺模型有很多扩展古诺模型与囚徒困境相似,对理解市场经济和博弈分析本身都有重要价值一、三厂商离散产量P4455376281612856520253056420202455525252543113333333734921213二、n个厂商连续产量理论

23、推导,一般结果1.3 博弈结构和博弈分类1.3.1 博弈中的博弈方1.3.2 博弈中的策略1.3.3 博弈中的得益1.3.4 博弈的过程1.3.5 博弈的信息结构1.3.6 博弈方的能力和理性1.3.7 博弈的分类和博弈理论的结构1.3.1 博弈中的博弈方博弈方:独立决策、独立承担博弈结果的个人或组织博弈规则面前博弈方之间平等,不因博弈方之间权利、地位的差异而改变博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈,单人博弈是退化的博弈一、单人博弈只有一个博弈方的博弈例一:单人迷宫入口AB出口(奖金M)A,1B,1右左右左M00扩展形单人博弈问题可

24、以退化为最优化问题游戏者 0 M 0 0A左B左A左B右A右B左A右B右例二:运输路线-7000-16000-10000-10000好天气(75%)坏天气(25%)自 然商人水 路陆 路运输路线得益矩阵01-7000-10000-16000-10000运输路线扩展形好天气(75%)坏天气(25%)单人博弈实质个体最优化问题有一个商人需要将一批商品从A地向B地运输,从A地到B地有水、陆两条路线,走陆路运输成本为10000元,走水路的运输成本为7000元。走陆路比较安全,走水路则有一定的风险,如果遇到恶劣天气将会造成这批货物总价值10%的损失。假设已知该批货物的总价值为90000元,运输期间出现暴

25、风雨天气的概率为1/4,问该商人该选择哪条运输路线?期望值:-9250-10000二、两人博弈两人博弈即有两个博弈方的博弈两人博弈最常见,研究最多,是最基本和有用的博弈类型囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致利益不一定冲突,如制式问题信息不一定是优势个人利益最大化不一定是整体利益最大化三、多人博弈三个博弈方之间的博弈可能存在“破坏者”:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响。申办奥运会是典型例子。(竞选等。破坏者、合作者共谋)多人博弈的表示有时与两人博弈不同,需要多个得益

26、矩阵,或者只能用描述法多个厂商(3厂商)采用新技术与老技术的博弈1.3.2 博弈中的策略策略:博弈中各博弈方的选择内容(每个博弈方的可选策略不一定完全相同,即不一定对称)策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同有限博弈:每个博弈方的策略数都是有限的无限博弈:至少有某些博弈方的策略有无限多个(如连续产量的确定)1.3.3 博弈中的得益得益:各博弈方从博弈中所获得的利益(利润、收入、量化的效用、社会效益、福利等,有效用,有损失)得益对应博弈的结果,也就是各博弈方策略的组合得益是各博弈方追求的根本目标及行为和判断的主要依据根据得益的博弈分类:零和博弈、常和

27、博弈、变和博弈博弈方是对立的:分蛋糕、分财产、讨价还价零和博弈:也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同 猜硬币,田忌赛马,石头-剪刀-布常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系 分配固定数额的奖金、利润,遗产官司变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。 囚徒困境、产量博弈、制式问题等分冰激凌是特殊的变和博弈1.3.4 博弈的过程博弈过程:博弈方选择、行为的次序,包括是否多次重复选择、行为。博弈过程对博弈结果也有重要影响。根据博弈的过程,博弈可分为静态博弈、动态博弈、重复博弈。静态博弈:所有博弈方同时或

28、可看作同时选择策略的博弈 田忌赛马、猜硬币、古诺模型动态博弈:各博弈方的选择和行动有先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动 弈棋、市场进入、领导追随型市场结构重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能(讨价还价、投标拍卖) 长期客户、长期合同、信誉问题有限次重复博弈无限次重复博弈有限次重复博弈与无限次重复博弈的方法上也有明显的不同短期(不一定有合作的意向)流动摊位长期(有合作的意向)固定摊位1.3.5 博弈的信息结构完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益(共同知识)不完全信息博弈:至少部分博弈方不

29、完全了解其他博弈方得益的情况的博弈,也称为“不对称信息博弈”完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈1.3.6 博弈方的能力和理性完全理性和有限理性完全理性:有完美的分析判断能力和不会犯选择行为的错误有限理性:博弈方的判断选择能力有缺陷个体理性和集体理性个体理性:以个体利益最大为目标集体理性:追求集体利益最大化合作博弈:允许存在有约束力协议的博弈非合作博弈:不允许存在有约束力协议的博弈1.3.7 博弈的分类和博弈理论的结构非合作博弈和合作博弈非合作博弈范围内:完全理性博弈和有限理性博弈(进化博弈)静

30、态博弈,动态博弈,重复博弈完全信息静态博弈,不完全信息静态博弈,完全且完美信息动态博弈,完全但不完美信息动态博弈,不完全信息动态博弈零和博弈和非零和博弈,单人博弈和多人博弈1.4 博弈论历史和发展简述博弈论的早期研究博弈论的形成博弈论的成长和发展博弈论的成熟及与主流经济学的融合博弈论的早期研究博弈论历史没有公认答案对具有策略依存特点决策问题的研究可上溯到18世纪初甚至更早(古诺)博弈论真正的发展在本世纪(上世纪1944年)博弈论总体上仍然是发展中的学科(诺贝尔经济学奖1994,1996,2001,2004,2007等) 2000年前我国古代的“齐威王田忌赛马”1500年前巴比伦犹太教法典“婚姻

31、合同问题”等。1838年古诺寡头模型。1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理 、“逆推归纳法”1921-1927年波雷尔混合策略的第一个现代表述,有数种策略两人博弈的极小化极大解 1928年诺伊曼和摩根斯坦扩展形博弈定义,证明有限策略两人零和博弈有确定结果 博弈论的形成冯.诺伊曼和摩根斯坦博弈论和经济行为Theory of Games and Economic Behavior 1944引进扩展形(extensive form)表示和正规形(normal form)或称策略形(strategy form)、矩阵形(matrix form)表示提出稳定集(stable s

32、ets)解概念正式提出创造博弈论一般理论的主意给出博弈论研究的一般框架、概念术语和表述方法1.4.3 博弈论的成长和发展一、第一个研究高潮,本世纪40年代末和50年代初1950年纳什提出“纳什均衡”(Nash equilibrium)概念和证明纳什定理,发展非合作博弈的基础理论。 1950年Melvin Dresher和Merrill Flood在兰德公司(美国空军)“囚徒的困境”(Prisons dilemma)博弈实验,(Howard Raiffa)独立进行这个博弈实验;1952-1953年期间(L. S. Shapley)和(D. B. Gillies)提出“核”(Core)作为合作博弈

33、的一般解概念Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。奥曼(R. J. Aumann)“40年代末50年代初是博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。” 二、50年代中后期一直到70年代博弈论发展的青年期1954-1955年提出了“微分博弈”(Differential games)的概念。奥曼则在1959年提出了“强均衡”(Strong equilibrium)的概念。“重复博弈”(Repeated games)也是在50年代末开始研究的,这自然引出了关于重复博弈的“民间定理”(Folk theorem)。

34、1960年(Thomas C. Schelling)引进了“焦点”(Focal point)的概念。博弈论在进化生物学(Evolutionary Biology)中的公开应用也是在60年代初出现的。 塞尔腾(Selten)1965提出“子博弈完美纳什均衡”(subgame perfect Nash equilibrium)1975年提出的“颤抖手均衡”(Trembling hand perfect equilibrium)海萨尼(Harsanyi)1967-1968三篇构造不完全信息博弈理论的系列论文,“贝叶斯纳什均衡”(Bayesian Nash equilibrium)。海萨尼1973年提

35、出关于“混合策略”的不完全信息解释,以及“严格纳什均衡”(Strict Nash equilibrium)。70年代“进化博弈论”(Evolutionary game theory)的重要发展,(John Maynard Smith)1972年引进“进化稳定策略”( Evolutionarily stable strategy,ESS)等。“共同知识”(Common knowledge)的重要性,因为奥曼1976年的文章引起广泛的重视。 三、40年代末到70年代末是博弈论发展的重要阶段这个时期博弈理论仍然没有成熟,理论体系还比较乱,概念和分析方法很不统一,在经济学中的作用和影响还比较有限,但这

36、个时期博弈论研究的繁荣和进展却是非常显著的。对这一阶段博弈论研究的迅速发展,除了理论发展自身规律的作用以外,全球政治、军事、经济特定环境条件的影响(战争和冷战时期的军事对抗和威慑策略研究的需要,经济竞争、国际经济竞争的加剧),以及经济学理论发展本身的需要等,都起了重要的作用。正是因为有了这一阶段博弈论研究的繁荣发展,才有80、90年代博弈论的成熟和对经济学的博弈论革命。 博弈论的成熟及与主流经济学的融合一、80、90年代是博弈论走向成熟的时期 1981(Elon Kohlberg) “顺推归纳法”(Forward induction)克瑞泼斯(David M. kreps)和威尔孙(Robert Wilson)1982年提出“序列均衡”(Sequential equilibria)1982年斯密(John Maynard Smith)出版了进化和博弈论()1984年由伯恩海姆(B. D. Bernheim)和皮尔斯(D. G. Pearce)提出“可理性化性”(Rationalizability)海萨尼和塞尔腾1988年提出了在非合作和合作博弈中均衡选择的一般理论和标准,1991年弗得伯格(D. Fudenberg)和泰勒尔(J. Tirole)首先提出了“完美贝叶斯均衡”(Perfext Bayesian equilibriu

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论