博弈论课件前言

上传人：春*** IP属地：广东上传时间：2023-07-31 格式：PPT 页数：145 大小：6.25MB 积分：30 举报 版权申诉

已阅读5页，还剩140页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈论课件前言第1页，课件共145页，创作于2023年2月参与人：两人及两人以上；行为：做出决策；行为目标：收益最大化环境条件：目标的实现不仅取决于自己的行为，同时还取决于其他人的行为，个人的最优选择是其他人选择的函数

——策略性的行为分钱游戏与运输路线选择第2页，课件共145页，创作于2023年2月博弈（Game）：●博弈——是指代表不同利益主体的决策者，在一定的环境条件和规则下，同时或先后、一次或多次从各自允许选择的行动方案中加以选择并实施，从而取得各自相应结果的活动。●[美]RogerB.Myerson——一个博弈指的是涉及到两个或更多个参与人的某个社会局势。●[英]AdamSmith——博弈是个体参与人从各自的动机出发生相互作用的一种状态。第3页，课件共145页，创作于2023年2月博弈论（GameTheory，对策论）：●[美]RogerB.Myerson——博弈论可以被定义为是智能的理性决策者之间冲突与合作的数学模型的研究。●[美]RobertGibbons——isthestudyofmulti-persondecisionproblems.第4页，课件共145页，创作于2023年2月●张维迎——是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的，也就是说，当一个主体，好比说一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。●张守一——是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。第5页，课件共145页，创作于2023年2月教材——P5博弈论就是系统研究各种各样博弈中参与人的合理选择及其均衡的理论。第6页，课件共145页，创作于2023年2月关于“经济博弈论”：博弈论是研究人们在利益相互影响的格局中的策略选择问题、是研究多人决策问题的理论。而策略选择是人们经济行为的核心内容，此外，经济学和博弈论的研究模式是一样的：即强调个人理性，也就是在给定的约束条件下追求效用最大化。可见，经济学和博弈论具有内在的联系。在经济学和博弈论具有的这种天然联系的基础上产生了经济博弈论。第7页，课件共145页，创作于2023年2月将博弈的思想明确地应用于经济领域，始于古诺（Cournot,1838）、伯特兰德（Bertrand,1883）和艾奇沃斯（Edgeworth,1925）等人关于两寡头的产量和价格垄断、产品交易行为的研究，他们通过对不同的经济行为方式和案例建立了相应的博弈论模型，为经济博弈论的发展提供了思想雏形和有益尝试。近半个多世纪以来，博弈论引起了众多经济学家的极大兴趣，使得博弈论在经济学中的应用模型越来越多。大约从20世纪80年代开始，博弈论逐渐成为主流经济学的一部分，甚至可以说成为微观经济学的基础（张维迎，P8）。第8页，课件共145页，创作于2023年2月博弈论究竟是一门什么样的学科呢？有人认为是经济学的一个分支，有人认为是数学的一个分支。我们把它看作是一种方法论，即它提供了一个观察问题的新视角、分析问题的新方法和解决问题的新思路；它的应用范围不仅包括经济学，像政治学、军事、外交、国际关系、公共选择、犯罪心理分析等都涉及博弈论。只不过从应用的成果来看，博弈论在经济学领域的应用最广泛、最成功，经济学家对博弈论的贡献也特别大，使得博弈论在经济学领域的应用无处不在：微观研究领域有交易机制的模型（如讨价还价模型和拍卖模型）；第9页，课件共145页，创作于2023年2月在中观经济研究中，劳动力经济学和金融理论都有关于企业要素投入品市场的博弈模型，即使在一个企业内部也存在博弈问题：工人之间会为同一个升迁机会勾心斗角，不同部门之间为争取公司的资金投入相互竞争；从宏观角度看，国际经济学中有关于国家间的相互竞争或相互串谋、选择关税或其他贸易政策的模型；至于产业组织理论更是大量应用博弈论的方法（见JeanTirole的《产业组织理论》）。第10页，课件共145页，创作于2023年2月二、博弈论的产生和发展博弈思想的基本特征是参与人在追求自己目标的过程中，不仅仅只是考虑自己能怎么做，还必须要考虑其他参与人会怎么做；针对其他参与人的行为，自己该实施哪个可行的行动，才能使自己的目标函数最大化，也就是说，在一个博弈格局中，每个参与人所实施的行动都是策略性的行动。

——知己知彼，百战不殆第11页，课件共145页，创作于2023年2月产生与发展教材P1-3《现代经济对策论》P6-7冯·诺依曼和摩根斯坦（Von.neumannandmorgenstern）冯·诺依曼是20世纪伟大的数学家之一，后者是德国人（1902年生），美国当代杰出经济学家。

《ThetheoryofGamesandEconomicBehaviour》的产生：二战期间，为了有效对抗法西斯，不仅是军人，连物理学家、数学家，甚至经济学家都被动员起来，组成“运筹研究班”，共同研究作战计划，在作战中数学的合理性得到了广泛运用，产生了种种理论。博弈论便是其中之一。二战结束后，大部分理论研究都转向其他领域。博弈论则在摩根斯坦的劝说下，与冯合作成就了《ThetheoryofGamesandEconomicBehaviour》，即转到了经济领域。冷战期间得到了政府的大力支持，博弈论不仅在经济领域，而后在社会学、外交问题军事问题上都得到了应用。第12页，课件共145页，创作于2023年2月因对博弈论研究作出杰出贡献而获诺贝尔经济学奖的经济学家：●纳什(Nash):Nash-Equilibrium

塞尔藤(Selten):Subgame-PerfectNashE---

海萨尼(Harsanyi):Bayes-NashEquilibrium1994●维克利、莫里斯1996●迈克尔·斯宾斯(Spence):1948年生于美国的新泽西，1972年获哈佛大学博士头衔，现兼任美国哈佛和斯坦福两所大学经济学教授。乔治·阿克尔洛夫：1940年生于美国的纽黑文，1966年获美国麻省理工学院博士头衔，现为美国加利福尼亚大学经济学教授。

第13页，课件共145页，创作于2023年2月约瑟夫·斯蒂格利茨，1948年生于美国的印第安纳州，1967年获美国麻省理工学院博士头衔，曾任世界银行的首席经济学家，现任美国哥伦比亚大学经济学教授。

2001年三人同获诺贝尔经济学奖，分享1000万瑞典克郎（94.3万美元）的奖金。瑞典皇家科学院之所以把这崇高的荣誉给予这三位经济学家，是因为他们在现代信息经济学研究领域作出了突出的贡献，他们“发展并研究了市场信息不对称的问题，揭示了当代信息经济的核心”。教材P192第14页，课件共145页，创作于2023年2月阿克尔洛夫是最早发现信息不对称的学者之一。我们上街购物，几乎处处都能碰上假货：花了上千元买的“进口名牌服装”，原来是国产的，只值几十元；“真皮”皮鞋用的是人造革的料……为什么假货愈演愈烈？为什么假货在发展中国家特别猖獗？阿克尔洛夫回答说：“一家商场，一般是售货员比顾客更了解产品的质量，如果售货员把这种信息加以垄断，最后即使他提供越来越差的产品，顾客也不会知道。顾客的利益因而受到损害”。（只有买错，没有卖错）阿克尔洛夫最大的贡献是解释了在发展中国家里，信贷市场信息的不对称导致了这些国家信第15页，课件共145页，创作于2023年2月贷市场的过高利息。此外，阿克尔洛夫还把信息不对称运用于解释各种社会问题，比如因为信息不对称，医疗保险市场上，老年人、个体劳动者的医疗保险利益得不到保障。第16页，课件共145页，创作于2023年2月三、基本概念

1、参与人Players:一个博弈中的决策主体，他们各自的目的是通过选择行动（策略）以最大化自己的目标函数/效用水平/支付函数。他们可以是自然人或团体或法人，如企业、国家、地区、社团、欧盟、北约等。那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人，而只能当做环境参数来处理。如指手划脚的看牌人、看棋人，企业的顾问等。对参与人的决策来说，最重要的是必须有第17页，课件共145页，创作于2023年2月可供选择的行动集（策略集）和一个很好定义的支付函数。虚拟参与人（pseudo-player）:指“自然”（nature）、“上帝”God，也即决定外生的随机变量的概率分布的机制。“某事在人、成事在天”的“天”；如出远门去旅游，可能很开心，也可能很尴尬（生病住医院），两者概率分布90%、10%或98%与2%或其他，由上帝决定。在以后的讨论中，我们记参与人为i,参与人集合记为T，即T={1，2，……，i，……，n},即该博弈中共有n个参与人；为了讨论的方便，把某个参与人i之外的其他参与人称为的i对手记为-i；N代表自然。第18页，课件共145页，创作于2023年2月*注意：博弈理论家一般对参与人做两个基本的假设——参与人都是理性的和智能的理性的（rational）?1—如果一个决策者在追逐其目标时能前后一致地做决策，就称他为rational。RogerB·Myerson(P2)

2—广义而言指的是一种行为方式，他同在给定条件或约束下最有效地实现预期目标相关。具体地讲，理性大致有以下三项第19页，课件共145页，创作于2023年2月内容：（1）存在一组可供选择的备选或替代方案；（2）每一种方案均对应着某种特定的预期净收益或满足程度或目标实现程度；（3）人们总是选择那个能够带来最大预期净收益的方案。（西蒙，1964）智能的（intelligent）?当我们像博弈论专家那样分析一个博弈时，如果参与人知道我们对此博弈所知道的一切，并能做出我们对此博弈所能做出的一切推断，我们就说此博弈的参与人是智能的。RogerB·Myerson(P3)第20页，课件共145页，创作于2023年2月

2、策略（strategies）:博弈中有两种策略概念，一种为纯策略（purestrategy）,简称策略，指参与人在博弈中可以选择采用的行动（ac-tionsormoves）方案，是参与人在给定信息结构的情况下的行动规则，它规定参与人在什么时候的什么情况下采取什么行动。因而一个策略是参与人的一个“相机行动方案”（contingentActionplan）。如“人不犯我…”、“按第一套方案行动、实施第二套方案…”……，记参与人i的一个策略为si，参与人i在一个博弈中的全部可供选择的策略记为Si（策略集strategyset），即si

∈Si

，Si={s1

，s2

，…si

，…，sn},表示参与人i在该博弈中共有n个可行的策略。第21页，课件共145页，创作于2023年2月如果n个参与人每人从自己的Si中选择一个策略si,则向量s=（s1，s2，﹍，si，﹍，sn）是一个策略组合(strategyprofile),参与人i之外的其他参与人的策略组合可记为s-i=（s1，s2，﹍，si-1,si+1

，﹍，sn）。

例如田忌的某个策略s田忌=上中下，或中下上，等等；S田忌={上中下，上下中，中上下，中下上，下上中，下中上}第22页，课件共145页，创作于2023年2月另一种策略概念是在纯策略基础上形成的混合策略（mixedstrategy）概念，参与人i的混合策略pi是他的纯策略空间Si上的一种概率分布，表示参与人实际进行决策时根据这种概率分布在纯策略中随机选择加以实施。Pi(si)表示Pi分配给纯策略si的的概率。如出门要否带雨伞？天气预报说有时有雨。猜拳？这是一个十分玄乎的概念，让人不容易理解，它是一种不确定，采用这种策略的目的就是让对方琢磨不透，实施时似乎由一架随机机器在操作。随机策略randomizedstrategy

纯策略是混合策略的特例？第23页，课件共145页，创作于2023年2月*注意：

1、策略与行动是两个不同的概念，策略是行动的规则而不是行动本身。回顾“犯与不犯”的问题。在静态博弈中，由于参与人同时行动，没有人能掌握他人的之前行动的信息，故没有可针对的行动，从而策略的选择就变成了行动的选择，即策略和行动是同一的。行动集Aiai

2、作为一种行动规则，策略必须是完备的，就是说，策略要给出参与人在每一种可能想象到的情况下的行动选择，即使参与人并不预期这种情况会实际发生。“丑话说在前-----”第24页，课件共145页，创作于2023年2月3、支付（payoffs）：参与人从各种策略组合中获得的收益。收益往往采用效用（utility）概念。它或者是一个特定策略组合下某个参与人得到的确定效用水平，或者是期望效用水平。它是策略组合的函数，所以也称支付函数（payofffunction），记为ui(s)，ui(s)=ui(s1，s2…，si

，…sn-1

，sn).

第25页，课件共145页，创作于2023年2月

1：博弈的一个基本特征是一个参与人的支付不仅取决于自己的策略选择，而且取决于所有其他参与人的策略选择；是策略组合的函数。

2：支付是参与人真正关心的东西，参与人在博弈中的目标就是选择自己的策略以最大化自己的支付函数。*注意第26页，课件共145页，创作于2023年2月一个博弈中，明确了以上三个概念，该博弈的基本框架就形成了，故称为博弈的三个基本要素。一个具体博弈界定，还须明确行动的顺序和有关的信息。

4、行动的顺序（theorderofplay）:博弈中参与人实施决策活动的顺序。同时或有先有后。其他因素不变，但顺序不同，参与人的最优选择就不同，博弈的结果也不同。事实上，不同的顺序安排意味着不同的博弈。静态博弈和动态博弈。第27页，课件共145页，创作于2023年2月

5、信息（information）：指一个博弈中参与人有关该博弈的知识，如关于N的选择、其他参与人的策略集、支付函数、行动时间等.博弈论中关于信息的具体概念有：●信息集（informationset）—主要出现在动态博弈中，可理解为参与人在特定时刻上对有关变量的值的知识；一个参与人无法准确知道的变量的全体属于一个信息集。买古董。●完美信息（perfectinformation）:指一个参与人对其他参与人（包括N）的行动选择有准确了解的情况，即一个信息集只包含一个值。动态博弈的概念。第28页，课件共145页，创作于2023年2月●完全信息（completeinformation）：指N不首先行动或N的初始行动被所有的参与人准确观察到的情况，即没有事前的不确定性。完全信息意味着各个参与人的支付函数是共同知识。显然，不完全（incomplete）信息意味着不完美（imperfect）信息。●共同知识（commonknowledge）是与信息有关的一个重要概念。如听过某个老师的课，学生认识老师，但老师不一定就记住该学生，路上碰在一块了，学生会不会叫老师呢？也许学生会以为老师不认识他，打招呼会把老师弄得莫名其妙。第29页，课件共145页，创作于2023年2月

解释一：共同知识指“所有参与人知道，所有参与人知道所有参与人知道，所有参与人知道所有参与人知道所有参与人知道…”。

解释二：如果每个参与人都知道某个事实，每个参与人都知道每个参与人都知道它，如此等等，从而形如“（每个参与人都知道)k每个参与人都知道它”的语句对k=0，1，2，…都是正确的，那我们就称这个事实为参与人中间的共同知识。解释三：这是一个“由己及人，由人及己”的无限推理过程，是k→∞时的高阶知识((每个人)k-1）。一件事一旦在某个群体中成为第30页，课件共145页，创作于2023年2月共同知识，则从任何一个个体出发，他对这件事的理解等等都已达到了完全的统一，不再有任何层面的不确定性（奥曼，1976）。在博弈论中，一般假定参与人的行动空间Ai和行动顺序是共同知识。*为了说明共同知识的重要性，引用一个寓言故事。第31页，课件共145页，创作于2023年2月故事发生在一个村庄，村里有100对夫妻，他们都是地道的逻辑学家（智能的）；村里有一些奇特的风俗：每天晚上，村里的男人们都将点起篝火，绕圈围坐举行会议，议题是谈论自己的妻子。在会议开始时，如果一个男人有理由相信他的妻子对他总是守贞的，那么他就在会议上当众赞扬她的美德。另一方面，如果在会议之前的任何时间，只要他发现他妻子不贞的证据，那他就会在会议上悲鸣怯哭，并企第32页，课件共145页，创作于2023年2月求神灵严厉地惩罚她。再则，如果一个妻子曾有不贞，那她和她的情人会立即告知村里除她丈夫之外所有的已婚男人（奇异的传统风俗）。所有这些传统和风俗都是村民的共同知识。事实上，每个妻子都已对丈夫不忠。于是每个丈夫都知道除自己妻子之外其他人的妻子都是不贞的女子，因而每个晚上的会议上每个男人都赞美自己的妻子。这种状况持续了很多年，直到有一天来了一位传教士。传教士参加了篝火会议，并听到每个男人都在赞美自己的妻子，他站起来走到围坐圆圈的中心，大声地提醒说：“这个村子里第33页，课件共145页，创作于2023年2月有一个妻子已经不贞了。”在此后的99个晚上，丈夫们继续赞美各自的妻子，但在第100个晚上，他们全都悲鸣怯哭，并企求神灵严惩自己的妻子。*怎样理解这个故事？传教士究竟告诉了丈夫们他们所不知道的什么？第34页，课件共145页，创作于2023年2月

首先注意到若只有一个妻子不贞，她丈夫能够立刻知道这个不贞的女人就是自己的妻子，因为他丈夫知道没有另外的不贞女人，若有的话他是知道的，所以在传教士访问后的第一个晚上这个丈夫就会哭；现在他没有哭，那就意味着确实存在一个女子不贞，由此，从“第一个晚上没有男人哭”中可推断出：有两个女子已经不贞。在传教士走后的第二晚上，既然已推断出有两个女子不贞，而自己只知道一个，那另一个就是自己的妻子，那这个丈夫应该在“第二个晚上哭”。第二个晚上“这个丈夫也没有哭”，由此丈夫们推断出：已有三个女子不贞。第35页，课件共145页，创作于2023年2月由归纳法可以证明，对于1和100之间的任意正整数k，如果恰有k个妻子不贞，那么在传教士走后的连续k-1个晚上，所有的丈夫照样各自称赞自己的妻子，但在第k个晚上，k个不贞妻子的丈夫会悲鸣怯哭，于是，在99个赞扬之夜过后的第100个晚上，每个丈夫都知道一定有100个不贞的妻子。不幸的是包括自己的妻子在内！第36页，课件共145页，创作于2023年2月传教士究竟告诉了丈夫们什么？每个丈夫都知道有99个不贞的妻子，故传教士所说的已经有一个女子不贞的话对任何人来说都不是什新闻。但“传教士对所有100个男人做了一个声明”是commonknowledge，从而这个传教士所声明的内容（有一个妻子不贞）也就成了100个男人之间的commonknowledge。在传教士宣告之前，每个形如“（每个丈夫知道)k有一个妻子不贞”的判断对于k≤99都是正确的，但对于第37页，课件共145页，创作于2023年2月K=100就不正确了。例如，若从1到100对丈夫们进行编号，则1已经知道2已经知道3已经知道……99已经知道100的妻子是不贞的，但1不知道2已经知道3已经知道……99已经知道100已经知道1的妻子是不贞的。因而从这个寓言中引申出的含义是，从一个共同知识的事实推出的结果与从（例如）只知道每个人已经知道每个人已经知道的事实推出的结果可以非常不同。第38页，课件共145页，创作于2023年2月●私人信息（privateinformation）：指任何一个他拥有但不是该博弈中所有参与人共同知识的信息。由于存在私人信息，便有了信息不对称的问题。第39页，课件共145页，创作于2023年2月四、博弈的分类分类是一种深化认识的方法。博弈可以根据不同的标志从不同的角度进行多种分类。通过分类我们将对博弈有进一步的了解，同时对博弈理论的结构体系有初步的认识。教才Ｐ14１、按参与人的多少分：单人博弈和多人博弈２、按策略空间是否有限分：有限策略博弈和无限策略博弈第40页，课件共145页，创作于2023年2月３、按各策略组合下参与人支付之和情况分：零和博弈、常和博弈和变和博弈４、按参与人行动的顺序分：静态博弈和动态博弈５、按信息是否完全分：完全信息博弈和不完全信息博弈６、按信息是否完美分（动态博弈）：完美信息动态博弈和不完美信息动态博弈第41页，课件共145页，创作于2023年2月博弈理论体系的结构框架按下面博弈类型安排：静态动态完全信息完全信息完全信息静态博弈动态博弈不完全信息不完全信息不完全信息静态博弈动态博弈第42页，课件共145页，创作于2023年2月五、本课程安排的特点目前，博弈论的书籍较多，版本不同，内容结构安排各有千秋，有的详细，有的简练；有的注重纯理论的数学演绎，有的则关注应用研究，等等。

Thisclassisdesignedtointroducegametheorytothosewhowilllaterconstruct(oratleastconsume)game-theoreticmodelsinappliedfieldswithineconomics.Theexpositionemphasizestheeconomicapplicationsofthetheoryatleast第43页，课件共145页，创作于2023年2月

asmushthepuretheoryitself,forthreereasons.First,theapplicationshelpteachthetheory;formalargumentsaboutabstractgamesalsoappearbutplayalesserrole.Second,theapplicationsillustratetheprocessofmodelbuilding–theprocessoftranslatinganinformaldescriptionofamulti-persondecisionsituationintoaformalgame-theoreticproblemtobeanalyzed.Third,thevarietyofapplicationsshowsthatsimilarissuesarisein

第44页，课件共145页，创作于2023年2月

differentrentareasofeconomics,andthatthesamegame-theoretictoolscanbeappliedineachsetting.Infact，peoplewhohavenotstudiedpuregametheoryalsocanunderstandthecompetitivesituationjustbyknowingtheapplications.第45页，课件共145页，创作于2023年2月Chapter1

完全信息静态博弈StaticGamesofCompleteInformation

Inthischapterweconsidergamesofthefollowingsimpleform:first,theplayerssimultaneouslychooseactions;then,theplayersreceivepayoffsthatdependonthecombinationofactionsjustchosen.Withintheclassofsuchstatic(orsimultaneous-move)games,werestrictattentiontogamesofcompleteinformation.That

第46页，课件共145页，创作于2023年2月

iseachplayer’spayofffunction(thefunctionthatdeterminestheplayerspayofffromthecombinationofactionschosenbytheplayers)iscommonknowledgeamongalltheplayers.教材P21一、Normal-FormRepresentationofGamesandNashEquilibrium(一)Normal-FormRepresentationofGames第47页，课件共145页，创作于2023年2月Inthenormal-formrepresentationofagame,eachplayersimultaneouslychoosesastrategy,andthecombinationofstrategieschosenbytheplayersdeterminesapayoffforeachplayer.Weillustratethenormal-formrepresentationwithaclassicalexample—Theprisoners’Dilemma.＊Twosuspectsarearrestedandchargedwithacrime.Thepolicelacksufficientevidencetoconvictthesuspects,unlessatleastoneconfesses.Thepoliceholdthesuspectsinseparatecellsandexplaintheconsequences第48页，课件共145页，创作于2023年2月

thatwillfollowfromtheactionstheycouldtake.Ifneitherconfessesthenbothwillbeconvictedofaminoroffenseandsentencedtooneyearinjail.Ifbothconfessthenbothwillbesentencedtojailfiveyears.Finally,ifoneconfessesbuttheotherdoesnot,thentheconfessorwillbereleasedimmediatelybuttheotherwillbesentencedtoeightyearsinjail—fiveforthecrimeandafurtherthreeforobstructingjustice(干扰司法)。第49页，课件共145页，创作于2023年2月囚徒２招认沉默招认–5,-50,-8囚徒１沉默-8,0-1,-1

囚徒的困境第50页，课件共145页，创作于2023年2月Wenowturntothegeneralcase.Thenormal-formrepresentationofagamespecifies:(1)theplayersinthegame;(2)thestrategiesavailabletoeachplayer;(3)thepayoffreceivedbyeachplayerforeachcombinationofstrategiesthatcouldbechosenbytheplayers.第51页，课件共145页，创作于2023年2月

Definition:Thenormal-formrepresentationofan-n-playergamespecifiestheplayers’strategyspacesS1,…,Snandtheirpayofffunctionsu1,…,un.WedenotethisgamebyG={S1,…,Sn;u1,…,un}.教材Ｐ22＊理解完全信息静态博弈时要注意事项第52页，课件共145页，创作于2023年2月１Althoughwestatedthatinanormal-formgametheplayerschoosetheirstrategiessimultaneously,thisdoesnotimplythatthepartiesnecessarilyactsimultaneously:itsufficesthateachchoosehisorheractionwithoutknowledgeoftheothers’choices,aswouldbethecase“theprisoners’dilemma”iftheprisonersreacheddecisionsatarbitrarytimes(在任意时间)whileintheirseparatecells.第53页，课件共145页，创作于2023年2月2Herewemayrecognize‘completeinformation’asthateachplayerknowthepayofffunctionsoftheothers.第54页，课件共145页，创作于2023年2月(二)Dominant-StrategyEquilibriumDefinitionInthenormal-formgameG={S1,…,Sn;u1,…,un},letsi'andsi"

befeasiblestrategiesforplayeri(i.e.,si'andsi"aremembersofSi

).Strategysi'isstrictlydominatedbystrategysi"ifforeachfeasiblecombinationoftheothers’strategies,i’spayofffromplayingsi'isstrictlylessthani’spayofffromplayingsi".i.e.:第55页，课件共145页，创作于2023年2月

ui(s1,…,si-1,si',si+1,…,sn)

<ui(s1,…,si-1,si“,si+1,…,sn)

(DS)foreachs-i=(s1,…,si-1,si+1,…,sn)thatcanbeconstructedfromtheotherplayers’strategySpacesS1,…,Si-1,Si+1,…,Sn.第56页，课件共145页，创作于2023年2月囚徒２招认沉默招认–5,-50,-8囚徒１沉默-8,0-1,-1

囚徒的困境策略“沉默”严格劣于策略“招认”第57页，课件共145页，创作于2023年2月博弈分析的目的：预测博弈的均衡结果，即给定每个参与人都是理性的是共同知识，什么是每个参与人的最优策略？什么是所有参与人的最优策略组合？第58页，课件共145页，创作于2023年2月*肯定性（sure-thing）或替代性（substitution）公理：一个决策者在事件Ａ发生的偏好选项１胜于选项２，并且在事件Ａ不发生时也偏好选项１胜于选项２，那么就有，他在知道事件Ａ无论是发生还是不发生之前都应该偏好选项１胜于选项２。——“理性的参与人不会选择严格劣策略”第59页，课件共145页，创作于2023年2月“重复剔除严格劣策略（iteratedeliminationofstrictlydominatedstrategies）”的思路：首先，找出某个参与人的严格劣策略，并把它从他的策略空间中剔除，重新构造一个已不包含该严格劣策略的博弈；其次，剔除新博弈中某个参与人的严格劣策略；重复上述过程，直到只剩下唯一的策略组合。——我们认为这个唯一所剩的策略组合是稳定的。Ｐ２４第60页，课件共145页，创作于2023年2月DefinitionInanormal-formgame,ifforeachplayeri,si"isi’sdominantstrategy,thanwecallthestrategiesprofile(s1″,…,sn"

)the‘dominant-strategyequilibrium’.第61页，课件共145页，创作于2023年2月参与人２左中右上1，01，20，1参与人１下0，30，12，0策略组合（上，中）是均衡结局，将实现支付（1，2）。第一第二第三第62页，课件共145页，创作于2023年2月

参与人２左中右上０,４4,05,3参与人１中4,00,45,3下3,53,56,6每个参与人都不存在严格劣策略第63页，课件共145页，创作于2023年2月（三）纳什均衡

DefinitionInthen-playernormal-formgameG={S1,…,Sn;u1,…,un},thestrategies(s1*…,sn*)areaNashequilibriumif,foreachplayeri,si*is(atleasttiedfor至少不劣于)playeri’sbestresponsetothestrategiesspecifiedforthen-1otherplayers,(s1*…,sn-1*,sn+1*,…,sn*):

ui(s1*…,sn-1*,si*,

sn+1*,…,sn*)

≥ui(s1*…,sn-1*,si

sn+1*,…,sn*)……….(NE)

第64页，课件共145页，创作于2023年2月

foreveryfeasiblestrategysiinSi;Thatis,si*solves

maxui(s1*…,sn-1*,si,

sn+1*,…,sn*).

si∈Si

上述均衡概念是1951年由数学家约翰·纳什（JohnNash）首先解释清楚的，所以将他所解释的均衡称为纳什均衡。*对纳什均衡的理解：第65页，课件共145页，创作于2023年2月

1Ifgametheoryistoprovideauniquesolutiontoagame-theoreticproblemthenthesolutionmustbeaNashequilibrium,inthefollowingsense.Supposethatgametheorymakesauniquepredictionaboutthestrategyeachplayerwillchoose.Inorderforthispredictiontobecorrect,itisnecessarythateachplayerbewillingtochoosethestrategypredictedbythetheory.Thuseachplayer’spredictedstrategymustbethatplayer’sbestresponsetothestrategiesoftheotherplayers.Suchapredictioncouldbecalled第66页，课件共145页，创作于2023年2月strategicallystableorself-enforcing,becausenosingleplayerwantstodeviatefromhisorher

Predictedstrategy.WewillcallsuchapredictionaNashequilibrium.-----------------------------RobertGibbonsP8第67页，课件共145页，创作于2023年2月2为了理解纳什均衡的哲学含义，让我们设想n个参与人在博弈之前协商达成一个协议，规定每一个参与人选择一个特定的策略。我们要问的一个问题是，给定其他参与人都遵守这个协议，在没有外在强制的情况下，是否有任何人有积极性不遵守这个协议？显然，只有当遵守协议带来的效用大于不遵守协议时的效用，一个人才会遵守这个协议。如果没有任何参与人有积极性不遵守这个协议，我们说这个协议是可以自动实施的（self-enforcing），这个协议就构成一个纳什均衡；否则，它就不是一个纳什均衡。（张维迎，P68）第68页，课件共145页，创作于2023年2月3纳什均衡是一种策略组合，使得每个参与人的策略是对其他参与人策略的最优放应。纳什均衡是博弈将会如何进行的“一致”（consistent）预测，这意指，如果所有参与人预测特定纳什均衡会出现，那么没有参与人有动力采用与均衡不同的行动。因此纳什均衡（也只有纳什均衡）能具有性质使得参与人能预测到它，预测到他们的对手也会预测到它，如此继续。与之相反，任何固定的非纳什均衡如果出现就意味着至少有一个参与人“犯了错”，或者是对对手行动的预测上犯了错，或者是（给定那种预测）在最大化自己的收益时犯了错。(JeanTirole)P10第69页，课件共145页，创作于2023年2月纳什均衡通过了一致预测检验并不就使得它们是好的预测，在一些博弈格局中如果认为可以获得精确预测那会过于轻率，由此我们想提请注意一个事实，博弈的最可能结果实际上取决于比标准式所提供的更多的信息。例如，可能希望知道参与人对于此类博弈具有多少经验，他们是否来自同一种文化因此而分县分享关于博弈将会如何进行的特定期望，以及如此等等。

(JeanTirole)P10-11第70页，课件共145页，创作于2023年2月Abrute-forceapproach(一个最直接的方法)tofindingagame’sNashequilibriumissimplytocheckwhethereachpossiblecombinationofstrategiessatisfiescondition(NE)inthedefinition.Inatwo-playergame,thisapproachbeginsasfollows:foreachplayer,andforeachfeasiblestrategyforthatplayer,determinetheotherplayer’sbestresponsetoeachofthatstrategy.……划线法

……画箭头法第71页，课件共145页，创作于2023年2月参与人２左中右上０,４4,05,3参与人１中4,00,45,3下3,53,56,6每个参与人都不存在严格劣策略（下，右）是NE，将实现支付（6，6）第72页，课件共145页，创作于2023年2月囚徒２招认沉默招认–5,-50,-8囚徒１沉默-8,0-1,-1囚徒的困境（沉默，沉默）帕累托优于（招认，招认）第73页，课件共145页，创作于2023年2月有一头大猪和一头小猪住在同一个猪圈里，猪圈的一侧放者猪食槽，另一侧安装着一个控制食物供应的按钮。按一次按钮，有8个单位的食物进槽，但需承担2个单位的成本。偌大猪小猪同时到达猪食槽，大猪吃到5个单位的食物，小猪吃到3个单位的食物；若大猪先到，大猪吃7个单位的食物，小猪只能吃到1个单位；若小猪先到，小猪吃到4个单位食物，大猪也吃到4个单位食物。练习：第74页，课件共145页，创作于2023年2月智猪博弈（boxedpigsgame）小猪去按等待去按3，12，4

大猪等待7，-10，0大猪的收益外部化，小猪不劳而获，免费搭了大猪的便车。第75页，课件共145页，创作于2023年2月请列举“搭便车”的现象冲开水、搞卫生；股市上庄家与散户20世纪70年代末80年代初，美国市场上私人标签（privatelabel）的软饮料价格便宜、质量较差，因此占有较低的市场份额。可口可乐公司和百事可乐公司最初能容忍这些私人标签饮料的存在，因为它们是小猪，威胁有限。可是没过多久，一家主要的私人标签饮料供应商Cott公第76页，课件共145页，创作于2023年2月司通过挑衅性的定价和较高的质量，从拥有较低市场份额的地区品牌，成长为一个拥有三分之一市场份额的、旗鼓相当的竞争者。此时，可口可乐公司和百事可乐公司通过降低价格这种进攻性的行动，使私人标签软饮料的市场份额立即瓦解了。第77页，课件共145页，创作于2023年2月小鸡博弈（thegameofchicken）设想汤姆和吉米是两个顽皮的小孩，他们在小伙伴的鼓动下要进行一场关于勇气的比赛：两人分别从一条独木桥的两端冲向对方，谁退却谁就是“小鸡”。显然，如果两个人都向前冲，则两败俱伤，设支付水平为-2；如果一个勇进而另一个退却，则勇进者受到小伙伴的欢呼，退却者受到嘲讽，设支付分别为4和-1；若两人同时退却，则一起受到小伙伴的嘲笑，设支付为0，因为两人一起受到嘲笑比起一人单独受到嘲笑要好受些。箭头法第78页，课件共145页，创作于2023年2月吉米退却勇进退却汤姆勇进0，0-1，44，-1-2，-2有两个均衡。实际会怎样？可能之一：两兵相遇，勇者胜第79页，课件共145页，创作于2023年2月（四）IteratedEliminationofstrictlyDominatedstrategiesandNashEquilibriumPropositionAInan-playernormal-formgameG={S1,…,Sn;u1,…,un},ifiteratedeliminationofstrictlydominatedstrategieseliminatedallbutthestrategies(s1*…,sn*),thanthesestrategiesaretheuniqueNashequilibriumofthegame.占有策略均衡（DE）是NE第80页，课件共145页，创作于2023年2月PropositionBInan-playernormal-formgameG={S1,…,Sn;u1,…,un},ifthestrategies(s1*…,sn*)areaNashequilibrium,thentheysurviveiteratedeliminationofstrictlydominatedstrategies.属于NE的策略会不会被剔除掉？第81页，课件共145页，创作于2023年2月二、无限策略博弈的解和反应函数法

Inthissectionweusethemodeltoillustrate:(a)thetranslationofaninformalstatementofaproblemintoanormal-formrepresentationofagame;(b)thecomputationsinvolvedinsolvingforthegame’sNashequilibrium.65‘第82页，课件共145页，创作于2023年2月按竞争程度划分的市场类型（就卖方来说；对于买方而言，市场是竞争的，且每一单个买者对市场价格影响程度较小）：

A完全竞争市场

B寡头竞争市场

C独家垄断市场卡特尔市场类型不同，厂商之间行为特怔不同，A与C类型中，厂商的决策都是个体优化决策，而B类型中寡头垄断竞争的本质就构成博弈，他们都是理性的决策者，他们的行为既影响（一）CournotModelofDuopoly第83页，课件共145页，创作于2023年2月自身，又影响对方。尽管两寡头由于垄断能给他们带来一些共同的利益，但是他们的根本利益并不是完全一致的。如果两寡头之间可以签定有约束力的协议，彼此之间达成合作，形成完全垄断，此时的博弈是一种合作博弈。然而在大多数情况下，彼此之间很难达成有约束力的协议，这样就是非合作博弈。最早研究两寡头垄断竞争，并作出巨大贡献的当推法国经济学家Cournot（《财富理论的数学原理研究》，1838），他对寡头市场的极端形式——两寡头垄断市场作了分析，研究了在静态条件下，完全相同产品市场中两家厂商的第84页，课件共145页，创作于2023年2月竞争行为、反应函数和均衡结果，得出结论：

……第85页，课件共145页，创作于2023年2月1、players：厂商1和厂商2向市场提供无差异的同质的产品；面临的决策是qi=？qiQ

pui，博弈●标准式表述P34p是市场出清价格，是市场供应量Q的减函数：

p=p(Q)=a-Q=a-(qi+qj)第86页，课件共145页，创作于2023年2月2、策略：产出水平qi，策略集Si={qi：qi≥0}3、支付函数：ui(si,sj)=ui(qi,qj)=qip–cqi假定两厂商均无固定成本，只有常数边际成本c。

=qi[a-(qi+qj)]–cqi=-qi2+(a-c-qj)qi第87页，课件共145页，创作于2023年2月●无限策略博弈NE的求解按NE定义的条件，如果策略组合（qi*

，qj*）是NE，那么对于qj*，qi*是下列优化问题的解：

Maxui(qi

，qj*)qi∈Si=Max[-qi2+(a-c-qj*)qi]

qi∈Siduidqi-2qi+(a-c-qj*)

第88页，课件共145页，创作于2023年2月令：-2qi+(a-c-qj*)=0得：qi*=(a-c-qj*)/2于是有方程组：q1*=(a-c-q2*)/2q2*=(a-c-q1*)/2q1*=q2*=(a-c)/3此时，u1*=u2*=（a-c)2/9第89页，课件共145页，创作于2023年2月考虑关系式：qi*=(a-c-qj*)/2无论qj是否最优，由qi=(a-c-qj)/2决定的qi总是厂商i针对厂商j产出水平的最优反应；我们称关系式qi=(a-c-qj)/2为厂商i针对厂商j的策略的反应函数，并记为：qi*=Ri(qj)=(a-c-qj)/2.由此NE（qi*

，qj*

）必须是方程组：

q1=(a-c-q2)/2q2=(a-c-q1)/2的解。-------------------------反应函数法第90页，课件共145页，创作于2023年2月对于无限策略博弈，其NE的求解主要是通过反应函数，而反应函数则由各个参与人的支付函数优化求得，即：Ri(s-i)来自于

Maxui(s1…,sn-1,si

sn+1,…,sn)si∈Si下面用图解来说明该模型的NE是：（（a-c）/3，（a-c）/3）第91页，课件共145页，创作于2023年2月q1q2a-c(a-c)2(a-c)/2a-cR2(q1)=(a-c-q1)/2R1(q2)=(a-c-q2)/2(a-c)3(a-c)/3NE0第92页，课件共145页，创作于2023年2月如果两个寡头能联合起来从共同利益角度进行决策，那他们将会怎样？古诺模型中，q1*=q2*=(a-c)/3，u1*=u2*=（a-c)2/9；生产垄断产量的一半，q1m=q2m=qm/2=（a-c)/4＜(a-c)/3=q1*=q2*，而u1m=u2m=（a-c)2/8＞（a-c)2/9=u1*=u2*。思考：假定每个厂商要么生产垄断产出的一半，要么生产古诺产量，任何其它产出都不允许，那么他们会作怎样的决策？第93页，课件共145页，创作于2023年2月Cournot通过模型研究得出：两寡头市场产量比垄断市场高、价格比垄断市场价格低、利润比垄断市场低。这是典型的囚徒困境问题，导致个人理性和集体理性的冲突。类似的寡头垄断在实际经济活动中，在某些地区、某段时期、对于某种商品来说并不鲜，见，如电力业、电信业等。第94页，课件共145页，创作于2023年2月桔农弃桔美国1933年5月颁布的《农业调整法》是罗斯福上台后实施“新政”所颁布的一系列法令之一。旨在控制农业生产规模，减少农产品供给，以提高农产品价格。具体措施是，政府与农民签订限产合同，对自愿限产的农民实行直接津贴补助。第95页，课件共145页，创作于2023年2月（二）BertrandModelofDuopolyP39*两厂商决策的相互影响在于需求函数

Di(pi,pj)=a-pi+bpj两厂商的产品具有一定的差异性；b是厂商i的产品对厂商j的产品的替代系数。●标准式表述1、参与人：厂商1与厂商2；他们生产同类但存在一定差异的产品。第96页，课件共145页，创作于2023年2月2、他们选择价格，Si={pi：pi≥0}；3、他们的支付函数就是他们的利润函数：

ui=ui(pi,pj)=Di(pi,pj)pi-Di(pi,pj)c=(a-pi+bpj)(pi-c)

假定两厂商均无固定成本，只有常数边际成本c。厂商i的反应函数：Ri(pj)=a+c+bpj2第97页，课件共145页，创作于2023年2月将是：P1*=p2*=c2P1=a+c+bp22P2=a+c+bp1P1*=p2*=(a+c)/(2-b)b﹤2思考：在Bertrand的模型中，如果两厂商的产品是同质的，那么NE会是什么？Bertrandparadox第98页，课件共145页，创作于2023年2月（三）豪泰林(Hotelling,1929)的价格竞争模型

P41在该模型中，产品在物质形态上无差异，但在空间上处于不同的位置。●标准式表述1、参与人：商店1与商店2。他们分别位于一线性城市的两端，出售同质的商品；2、他们要决定的是各自商品的售价pi，

Si={pi：pi≥0}；第99页，课件共145页，创作于2023年2月令该线性城市的长度为1，消费者均匀地分布3、他们的支付函数就是利润函数：u1=D1p1-D1cu2=D2p2-D2c注：设两家商店商品的单位成本相同为c。设消费者购买商品的旅行成本为t，并且每个消费者都具有单位需求，即每个消费者只要认为价格“足够低”就会（也仅仅）购买一个单位的商品，这意味着如果商店i的价格“不太高”，对商店i的需求等于发现从商店i购买更为便宜的顾客的数量。第100页，课件共145页，创作于2023年2月在[0，1]的区间里，分布密度为1；商店1位于0处，商店2位于1处。x为[0，1]上的任意一点。01商店1商店2x住在x的消费者到商店1购买的旅行成本是tx，到商店2购买的成本是t(1-x)；如果住在x的消费者在两个商店之间购买的成本是无差异的，那么所有住在x左边的消费者在商店1购买，所有住在x右边的消费者在商店2购买，即有：D1=x，D2=1-x。这里x满足：第101页，课件共145页，创作于2023年2月P1+tx=P2+t(1-x)x=(P2-P1+t)/2t所以有需求函数：

D1=x=(P2-P1+t)/2t；D2=1-x=(P1-P2+t)/2tu1=D1p1-D1c=(p1-c)(P2-P1+t)/2tu2=D2p2-D2c=(p2-c)(P1-P2+t)/2t第102页，课件共145页，创作于2023年2月反应函数：R1(p2)=(c+t+p2)R2(p1)=(c+t+p1)解两个反应函数组成的方程组，得：p1*=p2*=c+tu1*=u2*=t/2商店的利润与消费者的旅行成本成正比。P42第103页，课件共145页，创作于2023年2月思考：“冰激凌问题”夏季某海滨浴场有两个冰激凌销售商，冰激凌是由同一个工厂供应（产品无差异），价格由厂家统一确定。那么消费者会就近购买。问：两个销售商将选址何处？对于Hotelling的价格竞争模型，可以一般地讨论两家商店位于[0，1]区间内任意位置时的情形：01ab商店1商店2x第104页，课件共145页，创作于2023年2月若住在x处的消费者到商店1与商店2无差异，那么有D1=x，D2=1-x；x满足：P1+t(x-a)2=P2+t(1-x-b)2设旅行成本为td

人人文库> 全部分类> 教育资料 > 备课教案

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论课件前言

文档简介

温馨提示

最新文档

评论

博弈论课件前言

文档简介

温馨提示

最新文档

评论

相关文档