博弈论开放教程_第1页
博弈论开放教程_第2页
博弈论开放教程_第3页
博弈论开放教程_第4页
博弈论开放教程_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、微观经济学第十章 博弈论第十章博弈论第十章博弈论微观经济学第十章 博弈论博弈论博弈论:用来分析所观察到的决策主体相互影响时的:用来分析所观察到的决策主体相互影响时的现象,在给定的条件下寻求最优的解决办法。现象,在给定的条件下寻求最优的解决办法。一、博弈论的发展一、博弈论的发展2020世纪世纪4040年代博弈论思想体系初步建立,经过年代博弈论思想体系初步建立,经过5050年代年代的理论发展,博弈论在的理论发展,博弈论在6060年代逐步走向成熟。年代逐步走向成熟。2020世纪世纪7070年年代中后期以后,随着博弈论在经济分析领域内的广泛和成代中后期以后,随着博弈论在经济分析领域内的广泛和成功应用,

2、博弈论也逐步进入主流经济学的体系。功应用,博弈论也逐步进入主流经济学的体系。第一节博弈论概述第一节博弈论概述微观经济学第十章 博弈论博弈论的发展博弈论的发展19441944年,由冯年,由冯诺依曼和摩根斯坦恩合著的诺依曼和摩根斯坦恩合著的博弈论博弈论和经济行为和经济行为一书的出版标志着现代博弈论作为一种系统一书的出版标志着现代博弈论作为一种系统理论的创立。理论的创立。2020世纪世纪5050年代,纳什创立了公理化的讨价还价理论,年代,纳什创立了公理化的讨价还价理论,证明纳什讨价还价解的存在性,逐渐形成了以纳什非合作证明纳什讨价还价解的存在性,逐渐形成了以纳什非合作博弈理论为核心的现代博弈论体系。

3、博弈理论为核心的现代博弈论体系。2020世纪世纪6060年代以后,年代以后,泽尔滕在纳什的研究基础上引入动态分析,海萨尼则把不泽尔滕在纳什的研究基础上引入动态分析,海萨尼则把不完全信息引入到博弈论中。完全信息引入到博弈论中。2020世纪世纪7070年代以后,经济学家开始强调个人理性。年代以后,经济学家开始强调个人理性。微观经济学第十章 博弈论博弈论与主流经济学博弈论与主流经济学博弈论进入主流经济学,反映了经济学发展的以下几博弈论进入主流经济学,反映了经济学发展的以下几个趋势:个趋势:经济学研究的对象越来越转向个体,放弃了一经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定;些没有微观

4、基础的假定;经济学越来越转向人与人之间经济学越来越转向人与人之间竞争与合作的研究,特别是经济学注意到理性人的个人理竞争与合作的研究,特别是经济学注意到理性人的个人理性行为可能导致的集体非理性;性行为可能导致的集体非理性;经济学越来越重视对信经济学越来越重视对信息的研究。息的研究。博弈可以划分为博弈可以划分为合作博弈合作博弈和和非合作博弈非合作博弈。合作博弈与。合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议。如果能,就是合当事人能否达成一个具有约束力的协议。如果能,就是合作博弈;反之,则是非合作博弈

5、。作博弈;反之,则是非合作博弈。微观经济学第十章 博弈论沙滩上的饮料销售商沙滩上的饮料销售商为了争取更多的游客,两家销售商的销售位置又会开为了争取更多的游客,两家销售商的销售位置又会开始向中点移动,最终都将销售位置定在了中点处。始向中点移动,最终都将销售位置定在了中点处。图10-1博弈分析举例:沙滩上的饮料销售商两家销售商的初始位置AB1/43/41/21/2销售商A的位置移动AB3/83/49/167/161/29/16销售商B的位置移动AB3/85/81/21/21/2两家销售商的最终位置A、B11/21/2二、博弈分析举例二、博弈分析举例微观经济学第十章 博弈论掷币游戏掷币游戏A、B两个

6、小孩玩掷币游戏,两人各拿出一枚硬币抛两个小孩玩掷币游戏,两人各拿出一枚硬币抛掷在地面上,要么正面朝上,要么反面朝上。掷在地面上,要么正面朝上,要么反面朝上。都同为正面或反面朝上,都同为正面或反面朝上,A赢得赢得B一枚硬币;一枚硬币;一正面一反面朝上,一正面一反面朝上,A输给输给B一枚硬币。一枚硬币。这个例子中,两个小孩各自得到的结果(赢得一枚硬这个例子中,两个小孩各自得到的结果(赢得一枚硬币或者输掉一枚硬币),不仅取决于自己掷币的后果,也币或者输掉一枚硬币),不仅取决于自己掷币的后果,也取决于对手掷币的后果,双方决策的互相影响构成博弈。取决于对手掷币的后果,双方决策的互相影响构成博弈。在这个博

7、弈中,一方所得正是其他方所失,这种博弈在这个博弈中,一方所得正是其他方所失,这种博弈称为称为零和博弈零和博弈。微观经济学第十章 博弈论囚徒困境囚徒困境囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。表被关在不同的屋子里审讯。表10-1给出了囚徒困境模型的给出了囚徒困境模型的表述。每个囚徒都有两种选择:坦白或抵赖。表中每一格表述。每个囚徒都有两种选择:坦白或抵赖。表中每一格的两个数字代表对应两个囚徒选择组合下各自的刑期。的两个数字代表对应两个囚徒选择组合下各自的刑期。表表10-1囚徒困境囚徒困境-3,-3-10,0抵赖抵赖0,-

8、10-8,-8坦白坦白囚徒囚徒A抵赖抵赖坦白坦白囚徒囚徒B微观经济学第十章 博弈论博弈的要素包括参与人、行动、信息、策略、支付、博弈的要素包括参与人、行动、信息、策略、支付、结果和均衡,其中,参与人、策略和支付是描述一个博结果和均衡,其中,参与人、策略和支付是描述一个博弈所需要的最基本的要素,参与人、行动和结果统称为弈所需要的最基本的要素,参与人、行动和结果统称为博弈规则。博弈规则。参与人:指一个博弈中的决策主体在囚徒困境模参与人:指一个博弈中的决策主体在囚徒困境模型中,有两个参与人,即型中,有两个参与人,即“囚徒囚徒A”和和“囚徒囚徒B”。行动:是参与人在博弈的某个时点的决策变量。行动:是参

9、与人在博弈的某个时点的决策变量。在囚徒困境模型中,囚徒在囚徒困境模型中,囚徒A、B都只有两种行动可供选都只有两种行动可供选择,即择,即“坦白坦白”和和“抵赖抵赖”。三、博弈的要素三、博弈的要素微观经济学第十章 博弈论信息是参与人在博弈中的知识,特别是有关其他信息是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。在囚徒困境模型参与人(对手)的特征和行动的知识。在囚徒困境模型中,两囚徒的信息是都知道自己和另一囚徒在选择坦白中,两囚徒的信息是都知道自己和另一囚徒在选择坦白和抵赖的不同组合时面对的处罚。和抵赖的不同组合时面对的处罚。策略:是参与人在拥有既定信息情况下的行动规策略:

10、是参与人在拥有既定信息情况下的行动规则,它规定参与人在什么时候选择什么行动。一个参与则,它规定参与人在什么时候选择什么行动。一个参与人的所有可选择的策略的集合就是这个参与人的人的所有可选择的策略的集合就是这个参与人的策略空策略空间间。如果每个参与人选择一个策略,就构成一个。如果每个参与人选择一个策略,就构成一个策略组策略组合合。支付:在博弈论中指一个特定策略组合下参与人支付:在博弈论中指一个特定策略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用得到的确定效用水平,或者是指参与人得到的期望效用微观经济学第十章 博弈论水平。支付是博弈参与人真正关心的东西。在一个策略水平。支付是博弈参

11、与人真正关心的东西。在一个策略组合下,所有参与者的支付就构成了一个支付组合组合下,所有参与者的支付就构成了一个支付组合。在在囚徒困境模型中,如果两囚徒的策略组合为(抵赖,坦囚徒困境模型中,如果两囚徒的策略组合为(抵赖,坦白),那么囚徒白),那么囚徒A的支付为的支付为-10,囚徒,囚徒B的支付为的支付为0,两,两囚徒的支付组合为(囚徒的支付组合为(-10,0);如果两囚徒的策略组合);如果两囚徒的策略组合为(坦白,坦白),那么囚徒为(坦白,坦白),那么囚徒A和囚徒和囚徒B的支付均为的支付均为-8,两囚徒的支付组合为(两囚徒的支付组合为(-8,-8)。)。结果:是博弈分析者感兴趣的所有东西,如均衡

12、结果:是博弈分析者感兴趣的所有东西,如均衡策略组合、均衡支付组合等。策略组合、均衡支付组合等。均衡:是所有参与人的最优策略的组合。均衡:是所有参与人的最优策略的组合。微观经济学第十章 博弈论表10-2博弈的分类及对应的均衡概念不完全信息动态博弈精炼贝叶斯纳什均衡不完全信息静态博弈贝叶斯纳什均衡不完全信息完全信息动态博弈子博弈精炼纳什均衡完全信息静态博弈纳什均衡完全信息动态静态行动顺序信息四、博弈的分类四、博弈的分类微观经济学第十章 博弈论每一个参与人对所有其他参与人(对手)的特征、每一个参与人对所有其他参与人(对手)的特征、策略空间及支付函数有准确的知识,而且博弈的参与人策略空间及支付函数有准

13、确的知识,而且博弈的参与人同时选择行动或虽非同时但后行动者并不知道前行动者同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体行动,这种情况下参与人的决策就是采取了什么具体行动,这种情况下参与人的决策就是完完全信息静态博弈全信息静态博弈。纳什对非合作博弈的主要贡献是在一般的意义上定纳什对非合作博弈的主要贡献是在一般的意义上定义了非合作博弈及其均衡解,并证明了均衡解的存在,义了非合作博弈及其均衡解,并证明了均衡解的存在,这一均衡就被称为这一均衡就被称为“纳什均衡纳什均衡”。第二节完全信息静态博弈第二节完全信息静态博弈微观经济学第十章 博弈论博弈可以采用两种不同的方式来表述,一种是博弈可

14、以采用两种不同的方式来表述,一种是策略式策略式表述表述,一种,一种是扩展式表述是扩展式表述。从理论上讲,这两种表述形式。从理论上讲,这两种表述形式几乎是完全等价的,但策略式表述更适合于分析静态博弈,几乎是完全等价的,但策略式表述更适合于分析静态博弈,扩展式表述更适合于分析动态博弈。扩展式表述更适合于分析动态博弈。一、博弈的策略式表述一、博弈的策略式表述策略式表述策略式表述n个参与人个参与人;说明每个参与人都有哪些策略;说明每个参与人都有哪些策略;每个每个参与人都选定一种策略时,每个参与人的支付水平(获参与人都选定一种策略时,每个参与人的支付水平(获得的效用)是多少。根据上面给出的三要素,策略式

15、表得的效用)是多少。根据上面给出的三要素,策略式表述的博弈就是述的博弈就是:微观经济学第十章 博弈论n1n1uuSS,;,G在双头垄断的产量博弈中,两个寡头厂商在双头垄断的产量博弈中,两个寡头厂商A、B是参是参与人,两者的产量与人,两者的产量qA、qB的范围是其策略空间,获得利的范围是其策略空间,获得利润润A、B是其支付,策略式表述的博弈可写为是其支付,策略式表述的博弈可写为:BABBAABAqqqq0q0q,;,G微观经济学第十章 博弈论表表10-3掷币游戏掷币游戏1,-1-1,1反面反面-1,11,-1正面正面小孩小孩A反面反面正面正面小孩小孩B策略式表述的博弈举例策略式表述的博弈举例在掷

16、币游戏中,每个参与人的支付直接用其赢得或输在掷币游戏中,每个参与人的支付直接用其赢得或输掉的硬币数量来表示:赢得一枚硬币的支付为掉的硬币数量来表示:赢得一枚硬币的支付为1,输掉一,输掉一枚硬币的支付为枚硬币的支付为-1。掷币游戏的支付矩阵见表。掷币游戏的支付矩阵见表10-3所示。所示。微观经济学第十章 博弈论表表10-4斗鸡博弈斗鸡博弈-1,-10,2撤退撤退2,0-3,-3进攻进攻公鸡公鸡A撤退撤退进攻进攻公鸡公鸡B再如下面的斗鸡博弈。试想有两只公鸡遇到一起,每再如下面的斗鸡博弈。试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是进攻,一是撤退。如果一只只公鸡有两个行动选择:一是进攻,一是

17、撤退。如果一只公鸡撤退,一只公鸡进攻,则进攻的公鸡获得胜利,撤退公鸡撤退,一只公鸡进攻,则进攻的公鸡获得胜利,撤退的公鸡很丢面子;如果两只公鸡都撤退则打个平手;如果的公鸡很丢面子;如果两只公鸡都撤退则打个平手;如果两只公鸡都进攻,那么两败俱伤。设其支付矩阵见表两只公鸡都进攻,那么两败俱伤。设其支付矩阵见表10-4所示。所示。斗鸡博弈斗鸡博弈微观经济学第十章 博弈论生活中的生活中的“斗鸡博弈斗鸡博弈”n1、美、苏争霸中的讹诈:古巴导弹危机、俄罗斯部队空降、占领科索沃国际机场n2、理想家庭:性情互补n3、交通规则(如靠左行驶、红绿等规则)的形成n4、退一步海阔天空微观经济学第十章 博弈论囚徒困境讲

18、的是两个嫌疑犯作案后被警察抓住,分别囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。表被关在不同的屋子里审讯。表10-1给出了囚徒困境模型的给出了囚徒困境模型的表述。每个囚徒都有两种选择:坦白或抵赖。表中每一格表述。每个囚徒都有两种选择:坦白或抵赖。表中每一格的两个数字代表对应两个囚徒选择组合下各自的刑期。的两个数字代表对应两个囚徒选择组合下各自的刑期。表表10-1囚徒困境囚徒困境-3,-3-10,0抵赖抵赖0,-10-8,-8坦白坦白囚徒囚徒A抵赖抵赖坦白坦白囚徒囚徒B囚徒困境囚徒困境微观经济学第十章 博弈论生活中的囚徒困境生活中的囚徒困境n1、抵制买房运动的失败n2、

19、彩电价格联盟的解体n3、污染问题、超载问题探源n4、霍布斯“丛林原则”与国家的产生n5、亚当。斯密“看不见的手”:人人为己,社会自然福利最大;OLSON定律:人人为己,社会福利最小(无益)微观经济学第十章 博弈论表表10-5智猪博弈与重复剔除的占优均衡智猪博弈与重复剔除的占优均衡0,07,-1等待等待2,43,1按按大猪大猪A等待等待按按小猪小猪B智猪博弈的支付矩阵0,0等待等待2,4按按大猪大猪A等待等待小猪小猪B剔出小猪劣策略的支付矩阵2,4按按大猪大猪A等待等待小猪小猪B再剔出大猪劣策略的支付矩阵智猪博弈智猪博弈微观经济学第十章 博弈论生活中的博弈生活中的博弈微观经济学第十章 博弈论占优

20、策略均衡占优策略均衡不论其他参与人选择什么策略,他的最优策略是唯不论其他参与人选择什么策略,他的最优策略是唯一的,这样的最优策略被称为一的,这样的最优策略被称为占优策略占优策略。在。在 “囚徒困境囚徒困境”的例子中,每个囚徒都有两种可选择的策略:坦白或抵的例子中,每个囚徒都有两种可选择的策略:坦白或抵赖。但是,不论另一囚徒选择什么策略,每个囚徒的最赖。但是,不论另一囚徒选择什么策略,每个囚徒的最优策略是优策略是“坦白坦白”。所有参与人占优策略的组合称为所有参与人占优策略的组合称为占优策略均衡占优策略均衡。占优策略均衡占优策略均衡微观经济学第十章 博弈论考虑考虑“智猪博弈智猪博弈”例子。例子。猪

21、圈里围着两头猪,一头大猪圈里围着两头猪,一头大猪,一头小猪。猪圈的一头有一个猪槽,另一头安装了一猪,一头小猪。猪圈的一头有一个猪槽,另一头安装了一个按钮,控制着猪食的供应。按下一按钮会有个按钮,控制着猪食的供应。按下一按钮会有8个单位的个单位的猪食进槽,但按下按钮的猪需要付出猪食进槽,但按下按钮的猪需要付出2个单位的成本。若个单位的成本。若大猪先到,大猪吃到大猪先到,大猪吃到7个单位,小猪只能吃个单位,小猪只能吃1个单位;若同个单位;若同时到,大猪吃时到,大猪吃5个单位,小猪吃个单位,小猪吃3个单位;若小猪先到,大个单位;若小猪先到,大猪和小猪各吃猪和小猪各吃4个单位。个单位。表表10-5的的

22、表列出对应不同策略表列出对应不同策略组合的支付水平,如第一格表示两头猪同时按下按钮,就组合的支付水平,如第一格表示两头猪同时按下按钮,就会同时走到猪食槽,大猪吃会同时走到猪食槽,大猪吃5个单位,小猪吃个单位,小猪吃3个,扣除个,扣除2个单位的成本,支付水平分别为个单位的成本,支付水平分别为3和和1。重复剔除的占优均衡重复剔除的占优均衡微观经济学第十章 博弈论表表10-5智猪博弈与重复剔除的占优均衡智猪博弈与重复剔除的占优均衡0,07,-1等待等待2,43,1按按大猪大猪A等待等待按按小猪小猪B智猪博弈的支付矩阵0,0等待等待2,4按按大猪大猪A等待等待小猪小猪B剔出小猪劣策略的支付矩阵2,4按

23、按大猪大猪A等待等待小猪小猪B再剔出大猪劣策略的支付矩阵微观经济学第十章 博弈论如果重复剔除劣策略后剩下的策略组合是唯一的,那如果重复剔除劣策略后剩下的策略组合是唯一的,那么该博弈才是重复剔除占优可解的。但很多博弈是无法使么该博弈才是重复剔除占优可解的。但很多博弈是无法使用重复剔除劣策略的方法找到均衡解的。例如性别之战的用重复剔除劣策略的方法找到均衡解的。例如性别之战的例子。一男一女谈恋爱,周末安排业余活动,要么看足球例子。一男一女谈恋爱,周末安排业余活动,要么看足球比赛,要么看舞蹈演比赛,要么看舞蹈演出。男的爱好足球,出。男的爱好足球,女的更喜欢舞蹈,但女的更喜欢舞蹈,但他们宁愿在一起而不他

24、们宁愿在一起而不愿分开。支付矩阵见愿分开。支付矩阵见表表10-6所示。所示。表表10-6性别之战性别之战2,30,0舞蹈舞蹈1,13,2足球足球男男舞蹈舞蹈足球足球女女纳什均衡纳什均衡微观经济学第十章 博弈论一个参与人的纳什均衡策略是面对其他参与人的均一个参与人的纳什均衡策略是面对其他参与人的均衡策略时的最优选择衡策略时的最优选择。在囚徒困境中,(坦白,坦白)。在囚徒困境中,(坦白,坦白)是一个纳什均衡,而(抵赖,抵赖)不是一个纳什均衡,是一个纳什均衡,而(抵赖,抵赖)不是一个纳什均衡,因为给定同伙选择抵赖,自己选择抵赖时得到因为给定同伙选择抵赖,自己选择抵赖时得到-3,选择,选择坦白时得到坦

25、白时得到0,因而抵赖不是自己的最优策略;同样,因而抵赖不是自己的最优策略;同样,(坦白,抵赖)和(抵赖,坦白)也不是纳什均衡。在(坦白,抵赖)和(抵赖,坦白)也不是纳什均衡。在性别之战中,(足球,足球)是一个纳什均衡,因为一性别之战中,(足球,足球)是一个纳什均衡,因为一旦形成这个策略组合的结果,任何一方的偏离都会造成旦形成这个策略组合的结果,任何一方的偏离都会造成自己支付的减少,例如女的此时去看舞蹈将把自己的支自己支付的减少,例如女的此时去看舞蹈将把自己的支付从付从2降到降到1;同样,(舞蹈,舞蹈)也是一个纳什均衡,;同样,(舞蹈,舞蹈)也是一个纳什均衡,其他策略组合都不是纳什均衡。其他策略

26、组合都不是纳什均衡。微观经济学第十章 博弈论首先考虑首先考虑A的策略,对于的策略,对于B的每一个给定策略,找出的每一个给定策略,找出A的最优策略,在其对应的支付下划一横线,再用类似的方的最优策略,在其对应的支付下划一横线,再用类似的方法找出法找出B的最优策略。完成这个过程后,如果某个支付组的最优策略。完成这个过程后,如果某个支付组合的两个数字下都有线,这个支付组合所对应的策略组合合的两个数字下都有线,这个支付组合所对应的策略组合就是一个纳什均衡。就是一个纳什均衡。表表10-7寻求纳什均衡寻求纳什均衡2,33,4M1,40,2U参与人参与人ACL参与人参与人BRD2,11,03,11,14,2寻

27、求纳什均衡寻求纳什均衡微观经济学第十章 博弈论通过对纳什均衡与占优策略均衡以及重复剔除的占优通过对纳什均衡与占优策略均衡以及重复剔除的占优均衡的分析,可知它们之间的关系如下:均衡的分析,可知它们之间的关系如下:每一个占优策略每一个占优策略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优策略均衡或重复剔除的占优均衡个纳什均衡都是占优策略均衡或重复剔除的占优均衡。这是因为,一个参与人的占优策略是对于所有其他参这是因为,一个参与人的占优策略是对于所有其他参与人的任何策略组合的最优选择,自然也一定是对于所有与人的任何策略组合的最优选

28、择,自然也一定是对于所有其他参与人的某个特定策略的最优选择;而一个参与人的其他参与人的某个特定策略的最优选择;而一个参与人的纳什均衡策略只要求是对于其他参与人均衡策略(这是一纳什均衡策略只要求是对于其他参与人均衡策略(这是一个或几个特定策略)的最优选择。所以说,个或几个特定策略)的最优选择。所以说,占优策略均衡占优策略均衡和重复剔除的占优均衡是特殊的纳什均衡,它们所要求的和重复剔除的占优均衡是特殊的纳什均衡,它们所要求的条件比纳什均衡的条件要严格条件比纳什均衡的条件要严格。微观经济学第十章 博弈论库诺特模型与纳什均衡库诺特模型与纳什均衡用用QA、QB分别表示厂商分别表示厂商A和厂商和厂商B的产

29、量;的产量;CA(QA)和和CB(QB) 表示两者的成本函数表示两者的成本函数; PP(QAQB) 表示需求函表示需求函数的逆函数,其中数的逆函数,其中P是价格。厂商是价格。厂商A和厂商和厂商B的利润函数分的利润函数分别为:别为:AAABABAAQCQQQPQQ,BBBBABABQCQQQPQQ,三、纳什均衡与寡头垄断市场三、纳什均衡与寡头垄断市场微观经济学第十章 博弈论对每个厂商的利润函数求一阶偏导数并令其等于零对每个厂商的利润函数求一阶偏导数并令其等于零,整理可得:整理可得:BAAQRQABBQRQ 反应函数意味着每个厂商的最优策略(产量)是另一反应函数意味着每个厂商的最优策略(产量)是另

30、一个厂商的策略(产量)的函数,两个反应函数的交叉点个厂商的策略(产量)的函数,两个反应函数的交叉点(即两个方程的解)就是纳什均衡(即两个方程的解)就是纳什均衡:*,BAQQQ 微观经济学第十章 博弈论伯川德模型中,由于产品是相同的,消费者将只会从伯川德模型中,由于产品是相同的,消费者将只会从价格最低的厂商那里购买。因此,价格较低的厂商将供应价格最低的厂商那里购买。因此,价格较低的厂商将供应整个市场。如果两个厂商定价相同,则消费者对于从哪个整个市场。如果两个厂商定价相同,则消费者对于从哪个厂商购买不会在意,假定此时两个厂商各占供给市场的一厂商购买不会在意,假定此时两个厂商各占供给市场的一半。在这

31、种情况下的纳什均衡就是竞争均衡,即两个厂商半。在这种情况下的纳什均衡就是竞争均衡,即两个厂商都制定的价格将等于边际成本,都只赚到零利润。都制定的价格将等于边际成本,都只赚到零利润。为了验证这是一个纳什均衡,应指出此时两个厂商都为了验证这是一个纳什均衡,应指出此时两个厂商都没有改变价格的冲动。没有改变价格的冲动。这时这时,厂商没有改变价格的冲动,厂商没有改变价格的冲动,但已经是在给定对方选择的情况下所做的最好的选择。但已经是在给定对方选择的情况下所做的最好的选择。伯川德模型与纳什均衡伯川德模型与纳什均衡微观经济学第十章 博弈论二、子博弈精炼纳什均衡二、子博弈精炼纳什均衡如果采用参与者同时行动的静

32、态博弈分析方法分析动如果采用参与者同时行动的静态博弈分析方法分析动态博弈,得到的纳什均衡中就会存在不合理的均衡策略。态博弈,得到的纳什均衡中就会存在不合理的均衡策略。泽尔腾通过对动态博弈的分析完善了纳什均衡的概念,定泽尔腾通过对动态博弈的分析完善了纳什均衡的概念,定义了义了“子博弈精炼纳什均衡子博弈精炼纳什均衡”。仍以市场销售的博弈为例。为了构造这个动态博弈的仍以市场销售的博弈为例。为了构造这个动态博弈的策略式表述,先来分析销售者和购买者的策略空间。策略式表述,先来分析销售者和购买者的策略空间。纳什均衡与不可置信威胁纳什均衡与不可置信威胁微观经济学第十章 博弈论销售者先行动,有两种策略:高价和

33、低价。购买者后销售者先行动,有两种策略:高价和低价。购买者后行动,根据销售者的行动,就有四种策略:高价时多购,行动,根据销售者的行动,就有四种策略:高价时多购,低价时少购;高价时多购,低价时多购;高价时少购,低低价时少购;高价时多购,低价时多购;高价时少购,低价时少购;高价时少购,低价时多购。将这四种策略分别价时少购;高价时少购,低价时多购。将这四种策略分别简记为:高多低少;高多低多;高少低少;高少低多。简记为:高多低少;高多低多;高少低少;高少低多。表表10-8市场销售博弈的策略式表述市场销售博弈的策略式表述6,80,3低价低价4,14,1高价高价销售者销售者高多低少高多低少购买者购买者0,

34、32,7高多低多高多低多高少低少高少低少 高少低多高少低多6,82,7微观经济学第十章 博弈论表表10-810-8对市场销售的博弈分析使用的是静态分析方法,对市场销售的博弈分析使用的是静态分析方法,得到三个纳什均衡:得到三个纳什均衡:( (高价,高少低少高价,高少低少) );( (低价,高多低低价,高多低多多) );( (低价,高少低多低价,高少低多) )。但究竟哪一个均衡实际上会发。但究竟哪一个均衡实际上会发生,静态分析难以确定。更严重的是,在纳什均衡中,参生,静态分析难以确定。更严重的是,在纳什均衡中,参与人在选择自己的策略时,把其他参与人的策略当作是给与人在选择自己的策略时,把其他参与人

35、的策略当作是给定的,同时也不考虑自己的选择如何影响对手。所以说,定的,同时也不考虑自己的选择如何影响对手。所以说,纳什均衡允许了纳什均衡允许了“不可置信威胁不可置信威胁”的存在。的存在。不可置信威胁不可置信威胁是指,对于先行动的参与人来说,后行动的参与人的选择是指,对于先行动的参与人来说,后行动的参与人的选择空间依赖于先行动者的选择,在先行动者已做出行动选择空间依赖于先行动者的选择,在先行动者已做出行动选择的前提下,有一些对先行动者不利的策略将不会被后行动的前提下,有一些对先行动者不利的策略将不会被后行动者选择,即这些策略是不可置信的。者选择,即这些策略是不可置信的。微观经济学第十章 博弈论例

36、如,对于策略组合(高价,高少低少)来说,意味例如,对于策略组合(高价,高少低少)来说,意味着不管销售者采取高价策略还是低价策略,购买者将始终着不管销售者采取高价策略还是低价策略,购买者将始终会少购,在这个策略威胁下,销售者就不会采取低价策略,会少购,在这个策略威胁下,销售者就不会采取低价策略,否则得到的支付为否则得到的支付为0 0。销售者并不会相信这个威胁。在销。销售者并不会相信这个威胁。在销售者真的选择低价时,如果购买者是理性的就会选择多购:售者真的选择低价时,如果购买者是理性的就会选择多购:少购得到的支付是少购得到的支付是3 3,多购却是,多购却是8 8。可见,纳什均衡(高价,。可见,纳什

37、均衡(高价,高少低少)就是不可置信的。高少低少)就是不可置信的。子博弈的概念子博弈的概念子博弈子博弈:指从每一个行动选择(即一个决策结)开始:指从每一个行动选择(即一个决策结)开始至博弈结束这一阶段的行动过程,是原博弈的一部分。至博弈结束这一阶段的行动过程,是原博弈的一部分。微观经济学第十章 博弈论市场销售博弈的博弈树市场销售博弈的博弈树如图如图10-4的的图所示;决图所示;决策点策点x和它的后续点构成和它的后续点构成一个子博弈,如图一个子博弈,如图10-4的的图所示;决策点图所示;决策点y和它和它的后续点也构成一个子的后续点也构成一个子博弈,如图博弈,如图10-4的的图所图所示。另外,原博弈

38、自身示。另外,原博弈自身也是自己的一个子博弈。也是自己的一个子博弈。这样,这样,市场销售博弈共市场销售博弈共有三个子博弈有三个子博弈。y销售者购买者高价购买者购买者xx多购少购多购少购y少购多购少购图10-4市场销售博弈的博弈树低价(4,1)(2,7)多购(6,8)(0,5)原博弈(4,1)(2,7)购买者(6,8)(0,5)子博弈a子博弈b微观经济学第十章 博弈论泽尔腾定义的子博弈精炼纳什均衡是纳什均衡的一个泽尔腾定义的子博弈精炼纳什均衡是纳什均衡的一个重要改进,分开了动态博弈中的重要改进,分开了动态博弈中的“合理的纳什均衡合理的纳什均衡”和和“不合理的纳什均衡不合理的纳什均衡”。正如纳什均

39、衡是完全信息静态博。正如纳什均衡是完全信息静态博弈解的一般概念一样,弈解的一般概念一样,子博弈精炼纳什均衡是完全信息动子博弈精炼纳什均衡是完全信息动态博弈解的一般概念态博弈解的一般概念。子博弈精炼纳什均衡定义如下:子博弈精炼纳什均衡定义如下:如果一个扩展式表述如果一个扩展式表述的策略组合是其原博弈的纳什均衡,又给出其每一个子博的策略组合是其原博弈的纳什均衡,又给出其每一个子博弈上的纳什均衡,那么它就是一个子博弈精炼纳什均衡弈上的纳什均衡,那么它就是一个子博弈精炼纳什均衡。子博弈精炼纳什均衡子博弈精炼纳什均衡微观经济学第十章 博弈论仍以市场销售博弈为例。仍以市场销售博弈为例。在子博弈在子博弈a

40、a中,购买者的最中,购买者的最优选择优选择“少购少购”,在子博弈,在子博弈b b中,购买者的最优选择中,购买者的最优选择“多多购购”。纳什均衡(高价,高少低少)中购买者的均衡战略。纳什均衡(高价,高少低少)中购买者的均衡战略“高少低少高少低少”,给出了子博弈,给出了子博弈a a上的纳什均衡(少购),上的纳什均衡(少购),却没有给出子博弈却没有给出子博弈b b上的纳什均衡上的纳什均衡,所以(高价,高少低,所以(高价,高少低少)不是子博弈精炼纳什均衡。同样,(低价,高多低多)少)不是子博弈精炼纳什均衡。同样,(低价,高多低多)也不是子博弈精炼纳什均衡。而对于纳什均衡(低价,高也不是子博弈精炼纳什均

41、衡。而对于纳什均衡(低价,高少低多)中购买者的均衡战略少低多)中购买者的均衡战略“高少低多高少低多”来说,既给出来说,既给出子博弈子博弈a a上的纳什均衡也给出了子博弈上的纳什均衡也给出了子博弈b b上的纳什均衡(即上的纳什均衡(即高价时将少购,低价时将多购),所以(低价,高少低多)高价时将少购,低价时将多购),所以(低价,高少低多)才是子博弈精炼纳什均衡。才是子博弈精炼纳什均衡。微观经济学第十章 博弈论逆向归纳法求解子博弈精炼纳什均衡逆向归纳法求解子博弈精炼纳什均衡用逆向归纳法求解市场销售博弈的中子博弈精炼纳什用逆向归纳法求解市场销售博弈的中子博弈精炼纳什均衡如下。均衡如下。销售者购买者高价

42、低价多购少购购买者多购少购购买者高价低价少购多购购买者多购少购图10-5逆向归纳法求解子博弈精炼纳什均衡(4,1)(2,7) (6,8)(0,3)最后决策结上子博弈的纳什均衡销售者(4,1)(2,7) (6,8)(0,3)回溯到初始决策结上的纳什均衡微观经济学第十章 博弈论承诺行动承诺行动:指当事人在不施行这种不可置信的威胁时:指当事人在不施行这种不可置信的威胁时就会付出更大的代价,尽管这一代价不一定发生,但承诺就会付出更大的代价,尽管这一代价不一定发生,但承诺行动会给当事人带来很大的好处,因为它可以改变均衡结行动会给当事人带来很大的好处,因为它可以改变均衡结果。在上面的例子中,子博果。在上面

43、的例子中,子博弈精炼纳什均衡的策略组合弈精炼纳什均衡的策略组合是(进入,合作),即企业是(进入,合作),即企业B B进入、企业进入、企业A A合作。但是,合作。但是,如果企业如果企业A A通过某种承诺行通过某种承诺行动使自己的动使自己的“不合作不合作”威胁威胁变得可置信,企业变得可置信,企业B B就不敢就不敢进入了。进入了。企业B企业A进入不进入合作不合作图10-6市场进入博弈的博弈树(40,50)(-10,0)(0,300)承诺与子博弈精炼纳什均衡承诺与子博弈精炼纳什均衡微观经济学第十章 博弈论重复博弈重复博弈:是指同样结构的博弈重复多次。如果博弈:是指同样结构的博弈重复多次。如果博弈只是进

44、行了一次,参与人只会关心一次性支付;但如果博只是进行了一次,参与人只会关心一次性支付;但如果博弈重复进行,参与人可能会为长期利益暂时牺牲眼前利益弈重复进行,参与人可能会为长期利益暂时牺牲眼前利益从而选择不同的策略。从而选择不同的策略。重复博弈的基本思想重复博弈的基本思想在重复博弈理论背后的主要思想是:如果每个囚徒都在重复博弈理论背后的主要思想是:如果每个囚徒都相信做出相信做出“抵赖抵赖”的选择在长期内得到的利益将超过他短的选择在长期内得到的利益将超过他短期内的损失,那么博弈被重复进行时,他们共同想要的结期内的损失,那么博弈被重复进行时,他们共同想要的结果(抵赖,抵赖)将会出现。果(抵赖,抵赖)

45、将会出现。三、重复博弈三、重复博弈微观经济学第十章 博弈论连锁店悖论连锁店悖论假设同样的市场有假设同样的市场有20个(可以理解企业个(可以理解企业A有有20个连锁个连锁店),企业店),企业B每次只能进入一个市场(连锁店),这就成为每次只能进入一个市场(连锁店),这就成为了了20次重复博弈。在这个博弈中,企业次重复博弈。在这个博弈中,企业A选择选择“不合作不合作”的的唯一原因是这一选择能够起到威慑作用,使企业唯一原因是这一选择能够起到威慑作用,使企业B不敢进入。不敢进入。然而,结果会是这样吗?然而,结果会是这样吗?在有限次(这里是在有限次(这里是20次)重复博弈中,次)重复博弈中,“不合作不合作

46、”是是不可置信的。设想前不可置信的。设想前19个市场已被企业个市场已被企业B进入,企业进入,企业B下一下一步要进入第步要进入第20个市场。因为这是最后一个市场,对于企业个市场。因为这是最后一个市场,对于企业A而言,这与第一次博弈没什么区别,选择而言,这与第一次博弈没什么区别,选择“合作合作”是最优是最优策略,企业策略,企业B自然选择进入。自然选择进入。微观经济学第十章 博弈论四、子博弈精炼纳什均衡与寡头垄断市场四、子博弈精炼纳什均衡与寡头垄断市场斯坦克尔伯格提出了描述寡头垄断市场的斯坦克尔伯斯坦克尔伯格提出了描述寡头垄断市场的斯坦克尔伯格模型,这是一个完全信息动态博弈的例子。在这个模型格模型,

47、这是一个完全信息动态博弈的例子。在这个模型中,有两个参与人:一个主导厂商中,有两个参与人:一个主导厂商A和一个追随厂商和一个追随厂商B;行动顺序是:主导厂商行动顺序是:主导厂商A首先确定产量首先确定产量QA,追随厂商,追随厂商B观观察到厂商察到厂商A的选择后再确定自己的产量的选择后再确定自己的产量QB。各厂商的行动。各厂商的行动空间都是自己的产量,支付为各自的利润函数。空间都是自己的产量,支付为各自的利润函数。用用QA、QB分别表示厂商分别表示厂商A和厂商和厂商B的产量;的产量;CA(QA)和和CB(QB) 表示两者的成本函数;表示两者的成本函数; PP(QAQB) 表示需求表示需求函数的逆函

48、数,其中函数的逆函数,其中P是价格。是价格。微观经济学第十章 博弈论厂商厂商A和厂商和厂商B的利润函数分别为:的利润函数分别为:AAABABAAQCQQQPQQ,BBBBABABQCQQQPQQ,首先来计算厂商首先来计算厂商B对厂商对厂商A可能的选择所作出的反应,可能的选择所作出的反应,即求厂商即求厂商B的反应函数。厂商的反应函数。厂商B达到支付(即利润)最大达到支付(即利润)最大时,有:时,有:0QCQQPQQQPQBBBABBABB微观经济学第十章 博弈论由此得到厂商由此得到厂商B对厂商对厂商A的反应函数:的反应函数:ABBQRQ 将上式代入到厂商将上式代入到厂商A的利润函数中:的利润函数

49、中:AAAABABAAQCQQRQPQQ,求一阶导数并令其等于零:求一阶导数并令其等于零:0QCQR1QRQPQQRQPQAAABABAAABAAA可得到厂商可得到厂商A的均衡产量,代入厂商的均衡产量,代入厂商B对厂商对厂商A的反的反应函数,可得到厂商应函数,可得到厂商B的均衡产量。的均衡产量。微观经济学第十章 博弈论第四节不完全信息博弈第四节不完全信息博弈一、海萨尼转换一、海萨尼转换不完全信息博弈以前被认为是没有办法分析的,直到不完全信息博弈以前被认为是没有办法分析的,直到海萨尼引入一个虚拟的参与人,将不确定性条件下的选择海萨尼引入一个虚拟的参与人,将不确定性条件下的选择转换为风险条件下的选

50、择转换为风险条件下的选择。不完全信息的博弈又称贝叶斯博弈。不完全信息博弈不完全信息的博弈又称贝叶斯博弈。不完全信息博弈中,至少有一个参与人不知道其他参与人的支付函数中,至少有一个参与人不知道其他参与人的支付函数。微观经济学第十章 博弈论表表10-9不完全信息的市场进入博弈不完全信息的市场进入博弈0,3000,300不进入不进入-10,040,50进入进入企业企业B合作合作企业企业A0,40030,80不合作不合作合作合作不合作不合作0,400-10,100高成本高成本低成本低成本不完全信息的市场进入博弈不完全信息的市场进入博弈来看市场进入博弈例子。企业来看市场进入博弈例子。企业A A是在位者,企业是在位者,企业B B是潜是潜在进入者。对企业在进入者。对企业B B来说,不知道企业来说,不知道企业A A的成本情况,也不的成本情况,也不知道企业知道企业A A是否采取合作策略。假定企业是否采取合作策略。假定企业A A的成本可能有两的成本可能有两种情况:高成本和低成本。对应两种不同成本的策略组合种情况:高成本和低成本。对应两种不同成本的策略组合的支付矩阵见表的支付矩阵见表10-910-9。微

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论