中南财经政法大学806经济学辅导班-第八章--西方经济学-博-弈-论PPT课件_第1页
中南财经政法大学806经济学辅导班-第八章--西方经济学-博-弈-论PPT课件_第2页
中南财经政法大学806经济学辅导班-第八章--西方经济学-博-弈-论PPT课件_第3页
中南财经政法大学806经济学辅导班-第八章--西方经济学-博-弈-论PPT课件_第4页
中南财经政法大学806经济学辅导班-第八章--西方经济学-博-弈-论PPT课件_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021/7/241第八章第八章 博博 弈弈 论论 Game Theory2021/7/242 主主 要要 内内 容容l1.博弈论概述博弈论概述l2.完全信息静态博弈完全信息静态博弈l3.完全信息动态博弈完全信息动态博弈l4.不完全信息静态博弈不完全信息静态博弈l5.不完全信息动态博弈不完全信息动态博弈2021/7/243一一 博弈论概述博弈论概述l 博弈论(博弈论(Came theory)又称对策论、游戏理论或)又称对策论、游戏理论或策略运筹学。它最早由德国数学家,哲学家莱布尼兹策略运筹学。它最早由德国数学家,哲学家莱布尼兹于于1710年提出。年提出。l 1713年,杰姆斯年,杰姆斯瓦尔德格

2、雷夫首次提出了对策论瓦尔德格雷夫首次提出了对策论中的极大中的极小定理(中的极大中的极小定理(minimax)。然而,直到)。然而,直到1944年,以冯年,以冯诺依曼和奥斯卡诺依曼和奥斯卡摩根斯坦合著摩根斯坦合著博弈博弈论与经济行为论与经济行为一书的出版为标志,博弈论才得以广一书的出版为标志,博弈论才得以广泛应用于经济学领域,并成为微观经济学的一个新的泛应用于经济学领域,并成为微观经济学的一个新的重要组成部分。重要组成部分。 2021/7/244 博弈博弈思想最早产生于我国古代。思想最早产生于我国古代。 早在两千多年的春秋时期,孙武在早在两千多年的春秋时期,孙武在孙子兵法孙子兵法中论述中论述的军

3、事思想和治国策略,就蕴育了丰富和深刻的对策论思想。的军事思想和治国策略,就蕴育了丰富和深刻的对策论思想。孙武的后代孙膑,为田忌谋划,巧胜齐王,这个著名的孙武的后代孙膑,为田忌谋划,巧胜齐王,这个著名的“田田忌赛马忌赛马”,就是典型的对策思想的成功运用。,就是典型的对策思想的成功运用。2021/7/245l 1994年年10月月11日,瑞典皇家科学院公布了该年度日,瑞典皇家科学院公布了该年度诺贝尔经济学奖评先结果:诺贝尔经济学奖评先结果:l 美国普林斯顿大学的纳什(美国普林斯顿大学的纳什(F.J.Nash)和加利福尼)和加利福尼亚大学的豪尔绍尼(亚大学的豪尔绍尼(J.Harsanyi)与德国波恩

4、大学经)与德国波恩大学经济学家泽尔腾(济学家泽尔腾(Reinhard.selten),因长期致力于),因长期致力于博弈论及其在经济学中运用的研究,共同获此殊荣。博弈论及其在经济学中运用的研究,共同获此殊荣。2021/7/246纳什纳什John Nash2021/7/2472021/7/248l 2005年年10月月10日,瑞典皇家科学院在瑞典首都斯德日,瑞典皇家科学院在瑞典首都斯德哥尔摩的皇家科学院议事厅宣布,将哥尔摩的皇家科学院议事厅宣布,将2005年诺贝尔经年诺贝尔经济学奖授予有以色列和美国双重国籍的罗伯特济学奖授予有以色列和美国双重国籍的罗伯特奥曼和奥曼和美国人托马斯美国人托马斯谢林,以

5、表彰他们通过博弈理论的分析谢林,以表彰他们通过博弈理论的分析增强世人对合作与冲突的理解。增强世人对合作与冲突的理解。l 2021/7/249博弈论与传统经济学有关理论的区别博弈论与传统经济学有关理论的区别l 传统经济学涉及的个人决策,是在给定价格参数和收入的条传统经济学涉及的个人决策,是在给定价格参数和收入的条件下,追求效用最大化的决策(消费者均衡或生产者均衡);个件下,追求效用最大化的决策(消费者均衡或生产者均衡);个人效用只依赖于自己的选择,而外在于他人的选择;个人最优选人效用只依赖于自己的选择,而外在于他人的选择;个人最优选择只是价格和收入的函数而不包含其他人选择的函数。择只是价格和收入

6、的函数而不包含其他人选择的函数。l 在博弈论看来,个人效用不仅依赖于自己的选择,而且依赖于在博弈论看来,个人效用不仅依赖于自己的选择,而且依赖于他人的选择;个人的最优选择是其他人选择的函数。他人的选择;个人的最优选择是其他人选择的函数。2021/7/2410 非合作博弈的发展非合作博弈的发展l 博弈论包括合作博弈与非合作博弈两种类型。我们博弈论包括合作博弈与非合作博弈两种类型。我们谈到的博弈论,一般是指非合作博弈,如下象棋等。谈到的博弈论,一般是指非合作博弈,如下象棋等。l 非合作博弈创立于非合作博弈创立于50年代。年代。1950年,年,22岁的纳什岁的纳什连续发表两篇划时代的论文:连续发表两

7、篇划时代的论文:N个人对策的均衡点个人对策的均衡点与与讨价还价问题讨价还价问题,1951年又发表了年又发表了非合作对非合作对策策。(。(纳什均衡纳什均衡)l 塔克(塔克(A.Tucker)在)在1950年他的一篇名为年他的一篇名为两个两个之谜之谜的论文中对的论文中对“囚徒困境囚徒困境”作了明确的定义。他作了明确的定义。他们两人的著作基本上奠定了现代非合作博弈论的基石。们两人的著作基本上奠定了现代非合作博弈论的基石。2021/7/2411l 泽尔腾则在泽尔腾则在60年代中期将纳什均衡的概念引入年代中期将纳什均衡的概念引入动态动态分析分析。他在。他在1965年发表年发表需求减少条件下寡头垄断模需求

8、减少条件下寡头垄断模型的对策论描述型的对策论描述一文,提出了一文,提出了“子博弈精炼纳什均子博弈精炼纳什均衡衡”(Subgame perfect Nash equilibrium)的概)的概念,又称念,又称“子对策完美纳什均衡子对策完美纳什均衡”。这一研究对纳什。这一研究对纳什均衡进行了第一次改进,选择了更具说服力的均衡点。均衡进行了第一次改进,选择了更具说服力的均衡点。2021/7/2412l 豪尔绍尼在豪尔绍尼在60年代末把年代末把不完全信息不完全信息引入博弈分析。引入博弈分析。他在他在1967年发表的开拓性论文年发表的开拓性论文由贝叶斯局中人参加由贝叶斯局中人参加的不完全信息博弈的不完全

9、信息博弈中重新给出了不完全信息的新定中重新给出了不完全信息的新定义,并由此提出义,并由此提出“贝叶斯均衡贝叶斯均衡”的概念。的概念。l 进入进入80年代后,克瑞普斯(年代后,克瑞普斯(kreps)和威尔逊)和威尔逊(wilson)则对不完全信息动态博弈的研究作出了突)则对不完全信息动态博弈的研究作出了突出的贡献,并提出了更高级的均衡概念:出的贡献,并提出了更高级的均衡概念:“贝叶斯精贝叶斯精炼纳什均衡炼纳什均衡”或称或称“完美贝叶斯均衡完美贝叶斯均衡”。2021/7/2413l 1博弈论在经济学领域中应用最广泛,最成功;博博弈论在经济学领域中应用最广泛,最成功;博弈论的许多成果也是借助于经济学

10、的例子来发展引申弈论的许多成果也是借助于经济学的例子来发展引申的的;l 2经济学家对博弈论的贡献也越来越大,特别是经济学家对博弈论的贡献也越来越大,特别是在动态分析和不完全信息引入博弈后,例如克瑞普斯,在动态分析和不完全信息引入博弈后,例如克瑞普斯,威尔逊都是经济学家威尔逊都是经济学家;l 3最根本性的原因是经济学和博弈论的研究模式最根本性的原因是经济学和博弈论的研究模式是一样的,都强调个人理性,即追求给定条件下效用是一样的,都强调个人理性,即追求给定条件下效用最大化。最大化。博弈专家之所以获经济学奖,原因大致有三点:博弈专家之所以获经济学奖,原因大致有三点:2021/7/2414 博弈论的基

11、本概念博弈论的基本概念 博弈是指一些个人、团队或组织,面对一定的环博弈是指一些个人、团队或组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,从各自允许选择的行为或策略中进行选择并加以实施,各自从中取得相应结果的过程。各自从中取得相应结果的过程。 博弈论就是描述在这种形势下各方理性地选择自己博弈论就是描述在这种形势下各方理性地选择自己的行动所实现的结果,分析各决策主体的行为发生相的行动所实现的结果,分析各决策主体的行为发生相互作用时的决策以及这种决策的均衡问题。互作用时的决策以及这种决

12、策的均衡问题。2021/7/2415例:房地产开发例:房地产开发l1、A B两个开发商,投资两个开发商,投资1亿;亿;l2、如果市场上有两栋房出售,需求大,每栋:、如果市场上有两栋房出售,需求大,每栋:1.4亿;需求小,每栋:亿;需求小,每栋:7千万;千万;l 如果市场上有一栋房出售,需求大,每栋:如果市场上有一栋房出售,需求大,每栋:1.8亿;需求小,每栋:亿;需求小,每栋:1.1亿;亿;l3、开发与不开发。、开发与不开发。l 2021/7/24168种可能的结果种可能的结果l1、需求大,、需求大,A开发,开发,B不开发,则不开发,则A的利润的利润8千万,千万, B的利润为的利润为0;l2、

13、需求大,、需求大,A开发,开发,B开发,则开发,则A的利润的利润4千千万,万, B的利润的利润4千万;千万;l3、需求大,、需求大,A不开发,不开发,B开发,则开发,则A的利润的利润0, B的利润为的利润为8千万;千万;l4、需求大,、需求大,A不开发,不开发,B不开发,利润各为不开发,利润各为02021/7/2417l5、需求小,、需求小,A开发,开发,B不开发,则不开发,则A的利润的利润1千万,千万, B的利润为的利润为0;l6、需求小,、需求小,A开发,开发,B开发,则开发,则A的利润的利润-3千千万,万, B的利润的利润-3千万;千万;l7、需求小,、需求小,A不开发,不开发,B开发,

14、则开发,则A的利润的利润0, B的利润为的利润为1千万;千万;l8、需求小,、需求小,A不开发,不开发,B不开发,利润各为不开发,利润各为02021/7/2418l 如果需求是不确定的,是否开发依赖于各自在如果需求是不确定的,是否开发依赖于各自在多大程度上认为市场需求是大的及对方是否开发。多大程度上认为市场需求是大的及对方是否开发。l 例:如需求大的概率为例:如需求大的概率为0.3,A认为认为B开发的可开发的可能性为能性为x,那么那么A开发的期望利润为:开发的期望利润为:l Eu=0.34000 x+8000(1-x)+l 0.7-3000 x+1000(1-x)lA不开发的期望利润为不开发的

15、期望利润为0。解。解Eu0 x31/402021/7/2419博弈三要素、信息及博弈均衡博弈三要素、信息及博弈均衡l(1)局中人()局中人(player):指参加博弈的各个决策个):指参加博弈的各个决策个体,既可以是自然人,也可以是团体。局中人都是体,既可以是自然人,也可以是团体。局中人都是“理性理性”的,即他清楚地了解自己的目标或利益所在,的,即他清楚地了解自己的目标或利益所在,在决策时考虑自己的知识(信息)以及对其他局中人在决策时考虑自己的知识(信息)以及对其他局中人策略的期望,总是采取最佳行动(或策略)以实现其策略的期望,总是采取最佳行动(或策略)以实现其支付的最大化。支付的最大化。l

16、虚拟局中人:自然虚拟局中人:自然,是外部随机变量,对所有利益,是外部随机变量,对所有利益主体都无差异。主体都无差异。2021/7/2420l (2)行动与策略行动与策略( actions or strategies) 。行动是。行动是局中人在博弈的某个时点的决策变量;每一个局中人的所局中人在博弈的某个时点的决策变量;每一个局中人的所有可能选择的行动的集合称这该局中人的行动空间有可能选择的行动的集合称这该局中人的行动空间(action space);所有局中人的行动的一个有序集合称);所有局中人的行动的一个有序集合称为该博弈的一个行动组合(为该博弈的一个行动组合(action profile);

17、);l 策略是局中人在所有给定信息集(信息集是局中人在特策略是局中人在所有给定信息集(信息集是局中人在特定时刻进行决策时所面对的集合)下的行动规则,他规定定时刻进行决策时所面对的集合)下的行动规则,他规定局中人在什么时候选择什么行动。局中人在什么时候选择什么行动。l 2021/7/2421l 策略和行动不是等同的,它是行动的规则而不是行动本策略和行动不是等同的,它是行动的规则而不是行动本身,策略必须具有完备性,即一个策略是关于行动的一个身,策略必须具有完备性,即一个策略是关于行动的一个完整计划完整计划它明确了局中人在每一种可能情况下对可行它明确了局中人在每一种可能情况下对可行动的选择;一个局中

18、人所有可能策略的集合称为该局中人动的选择;一个局中人所有可能策略的集合称为该局中人的策略空间(的策略空间(stratgy space),所有局中人策略的一个),所有局中人策略的一个有序集合称为博弈的一个策略组合(有序集合称为博弈的一个策略组合(strategy profile。l Si=si S=(s1,s2,si sn)l 如果一个策略规定局中人在每一个给定信息的情况下,如果一个策略规定局中人在每一个给定信息的情况下,选择一种特定的行动,则这个策略称为纯策略(选择一种特定的行动,则这个策略称为纯策略(pure strategies)。相反,如果一个策略规定局中人在每一个)。相反,如果一个策略

19、规定局中人在每一个给定信息的情况下,以某种概率分布随机地选择不同的行给定信息的情况下,以某种概率分布随机地选择不同的行动,则这种策略称为混合策略(动,则这种策略称为混合策略(mixed strategies)2021/7/2422l (3)支付(支付(pay off):指在一个特定的策略组合下,局中人得到:指在一个特定的策略组合下,局中人得到的效用水平或期望效用水平。一个局中人的支付是所有局中人的策略的效用水平或期望效用水平。一个局中人的支付是所有局中人的策略选择的函数,它不仅取决于自己的策略选择,而且还取决于(他所设选择的函数,它不仅取决于自己的策略选择,而且还取决于(他所设想的)所有其他局

20、中人的策略选择,任何一个局中人改变自己的策略想的)所有其他局中人的策略选择,任何一个局中人改变自己的策略都将影响其他局中人的支付水平,即,局中人之间的利益是相互牵制都将影响其他局中人的支付水平,即,局中人之间的利益是相互牵制的和制约的。所有局中人的支付的一个有序集合称为博弈的一个支付的和制约的。所有局中人的支付的一个有序集合称为博弈的一个支付组合(组合(payoff profile。l Ui=Ui(s1,s2,si sn)l 参与博弈的多个局中人的收益可用一个矩阵或框图表示,这种矩阵参与博弈的多个局中人的收益可用一个矩阵或框图表示,这种矩阵或框图叫做收益矩阵。或框图叫做收益矩阵。2021/7/

21、2423l (4)信息(信息(information):是局中人有关博弈的知识,):是局中人有关博弈的知识,特别是有关其他局中人的特征(如策略空间、支付函数等特别是有关其他局中人的特征(如策略空间、支付函数等等)和行动的知识。信息集(等)和行动的知识。信息集(information sets)是局中)是局中人在特定时刻进行决策时,所面对的信息变量值的集合。人在特定时刻进行决策时,所面对的信息变量值的集合。共同知识(共同知识(common knowledge)是指)是指“所有局中人知所有局中人知道,所有局中人知道所有局人知道,道,所有局中人知道所有局人知道,”(或信息)。(或信息)。如果局中人的

22、策略选择、支付函数等都是共同知识,则称如果局中人的策略选择、支付函数等都是共同知识,则称之为完全信息(之为完全信息(complete information ),否则就是不),否则就是不完全信息(完全信息(incomplete information )2021/7/2424l (5)博弈均衡博弈均衡(games equilibrium):是指所有局中):是指所有局中人的最优策略组合。这里所讲的均衡与一般均衡是有区别人的最优策略组合。这里所讲的均衡与一般均衡是有区别的,前者是局中人的最优策略组合,即局中人之间的冲突的,前者是局中人的最优策略组合,即局中人之间的冲突与合作达到一种相对稳定的状态;

23、而后者则是这种策略组与合作达到一种相对稳定的状态;而后者则是这种策略组合所产生的结果。从某种程度上讲是合所产生的结果。从某种程度上讲是“均衡均衡”和和“均衡结均衡结果果”的关系。前者是一种动态概念,后者是一种静态概念。的关系。前者是一种动态概念,后者是一种静态概念。与纯策略相对应的均衡是纯策略均衡,与混合策略相对应与纯策略相对应的均衡是纯策略均衡,与混合策略相对应的均衡是混合策略均衡。的均衡是混合策略均衡。2021/7/2425博弈的类型博弈的类型 根据博弈者选择的策略,博弈论可划分为合作根据博弈者选择的策略,博弈论可划分为合作博弈与非合作博弈。纳什(博弈与非合作博弈。纳什(Nash)、泽尔腾

24、()、泽尔腾(Selten)和和豪尔绍尼豪尔绍尼(Harsanyi)()(19941994诺贝尔经济学奖获得诺贝尔经济学奖获得者)的主要贡献在于非合作博弈方面,而且现在大多者)的主要贡献在于非合作博弈方面,而且现在大多数经济学家论及博弈时,也主要是指非合作博弈。数经济学家论及博弈时,也主要是指非合作博弈。2021/7/2426 合作博弈和非合作博弈的区别在于人们的行动为相互作合作博弈和非合作博弈的区别在于人们的行动为相互作用时,当事人能否达成一个具有约束力(用时,当事人能否达成一个具有约束力(binding agreement)的协议。若有,就是合作博弈;否则就是非合作博弈。的协议。若有,就是

25、合作博弈;否则就是非合作博弈。 合作博弈强调的是团体理性、效率、公正和公平。非合作合作博弈强调的是团体理性、效率、公正和公平。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。率的,也可能是无效率的。2021/7/2427 从局中人行动的先后顺序可划分为静态博弈(从局中人行动的先后顺序可划分为静态博弈(Static Static gamegame)和动态博弈()和动态博弈(dynamic gamedynamic game)。静态博弈是指在博)。静态博弈是指在博弈中,局中人同时选择行动或虽非同时行动但后行动者并弈

26、中,局中人同时选择行动或虽非同时行动但后行动者并不知道先行动者采取了什么具体行动。动态博弈是指局中不知道先行动者采取了什么具体行动。动态博弈是指局中人的行动有先后顺序,且后行动者能够观察到先行动者所人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。选择的行动。 2021/7/2428 从局中人是否具有有关其他参与人(对手)的特征、从局中人是否具有有关其他参与人(对手)的特征、策略空间及支付函数方面的知识的角度,可划分为完策略空间及支付函数方面的知识的角度,可划分为完全信息博弈全信息博弈( (game of complete information) )和不完全和不完全信息博弈信息博

27、弈( (game of incomplete information) )。 此外,根据支付结构不同:常和与变和博弈此外,根据支付结构不同:常和与变和博弈2021/7/2429l博弈的分类博弈的分类特征特征完全信息完全信息不完全信息不完全信息静态静态纳什均衡纳什均衡纳什(纳什(1950,1951)贝叶斯纳什均衡贝叶斯纳什均衡豪尔绍尼(豪尔绍尼(1967,1968)动态动态子博弈精练纳什均子博弈精练纳什均衡衡泽尔腾(泽尔腾(1965)精练贝叶斯纳什均衡精练贝叶斯纳什均衡泽尔腾(泽尔腾(1975)克瑞普斯和威尔逊克瑞普斯和威尔逊(1982)2021/7/2430博弈的表述方式:策略式与扩展式博弈的

28、表述方式:策略式与扩展式l策略式:支付矩阵策略式:支付矩阵 囚犯囚犯B的的 策略策略囚犯囚犯A的策略的策略坦白坦白抵赖抵赖坦白坦白-8,-80,-10抵赖抵赖-10,0-1,-12021/7/2431l扩展式:博弈树扩展式:博弈树(4,4)(8,0)(-3,-3) (1,0)(0,8)(0,0)(0,1) (0,0)开发开发不开发不开发开发开发不开发不开发开发开发不开发不开发开发开发不开发不开发BBBB大大大大小小小开发开发不开发不开发NN(1/2)(1/2)(1/2)(1/2)8-1A2021/7/2432 博弈论进入主流经济学,反映了经济学发展的博弈论进入主流经济学,反映了经济学发展的以下

29、几个趋势:以下几个趋势: l l 第一,经济学研究的对象越来越转向个体,放弃了一第一,经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定,如消费函数及其投资函数、销售些没有微观基础的假定,如消费函数及其投资函数、销售最大化等,一切从个人效用函数及其约束条件开始,解约最大化等,一切从个人效用函数及其约束条件开始,解约束条件下的个人效用函数及其约束条件开始,解约束条件束条件下的个人效用函数及其约束条件开始,解约束条件下的个人效用最大化问题而导出行为及均衡结果。下的个人效用最大化问题而导出行为及均衡结果。 2021/7/2433l 第二,经济学越来越转向人与人关系的研第二,经济学越来越转向

30、人与人关系的研究,特别是人与人之间行为的相互影响和作用,究,特别是人与人之间行为的相互影响和作用,人们之间的利益冲突与一致,竞争与合作的研人们之间的利益冲突与一致,竞争与合作的研究。究。 l 第三,第三, 经济学越来越重视对信息的研究,经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影特别是信息不对称对个人选择及制度安排的影响。响。 2021/7/2434 通常情况下,每个局中人的支付是博弈中所有参与人策通常情况下,每个局中人的支付是博弈中所有参与人策略的函数,故每个局中人的最优策略选择依赖于所有其他参略的函数,故每个局中人的最优策略选择依赖于所有其他参与人的策略选择。但与

31、人的策略选择。但在一些特殊博弈中,一个参与人的最优在一些特殊博弈中,一个参与人的最优策略选择可能并不依赖于其他参与人的策略选择,即无论其策略选择可能并不依赖于其他参与人的策略选择,即无论其他参与人选择什么策略,他的最优策略是唯一的,这种最优他参与人选择什么策略,他的最优策略是唯一的,这种最优策略被称为策略被称为“占优策略占优策略”(dominant strategy)。)。 例:例:“囚徒困境囚徒困境” 囚徒困境是博弈论中的经典案例。该故事讲的是,两个囚徒困境是博弈论中的经典案例。该故事讲的是,两个嫌疑犯作案后被警察抓住,分别被关在不同的房间里进行审嫌疑犯作案后被警察抓住,分别被关在不同的房间

32、里进行审讯。警察知道两人有罪,但缺乏有力的证据,除非两人之中讯。警察知道两人有罪,但缺乏有力的证据,除非两人之中有一个坦白。警察告诉每个人,他们的可选择的策略与支付有一个坦白。警察告诉每个人,他们的可选择的策略与支付如下表:如下表:占优策略均衡占优策略均衡2021/7/2435 在该博弈中,每个囚徒有两种可能选择的策略:坦白和抵在该博弈中,每个囚徒有两种可能选择的策略:坦白和抵赖。显然,无论同伙选择什么策略,每个囚徒的最优策略都赖。显然,无论同伙选择什么策略,每个囚徒的最优策略都是是“坦白坦白”。如,。如,B选择坦白,若选择坦白,若A选择坦白时支付为选择坦白时支付为-8,选,选择抵赖时支付为择

33、抵赖时支付为-10,因而坦白比抵赖好;若,因而坦白比抵赖好;若B选择抵赖,选择抵赖,A坦白时的支付为坦白时的支付为0,抵赖时为,抵赖时为-1,因而坦白比抵赖好。即是说,因而坦白比抵赖好。即是说,“坦白坦白”是是A的占优策略。同样,的占优策略。同样,“坦白坦白”也是也是B的占优策略。的占优策略。 囚犯囚犯B的的 策略策略囚犯囚犯A的策略的策略坦白坦白抵赖抵赖坦白坦白-8,-80,-10抵赖抵赖-10,0-1,-12021/7/2436l广告战广告战 广告广告 AB不广告不广告广告广告不广告不广告10,515,06,810,22021/7/2437重复剔除的占优策略均衡重复剔除的占优策略均衡 在绝

34、大多数博弈中,并不存在占优策略均衡。但在有些在绝大多数博弈中,并不存在占优策略均衡。但在有些博弈中,仍可应用占优的逻辑找出均衡。博弈中,仍可应用占优的逻辑找出均衡。 案例:案例:“猪智博弈猪智博弈” 猪圈里有两头猪(大猪和小猪),猪圈一头有一猪食槽猪圈里有两头猪(大猪和小猪),猪圈一头有一猪食槽,另一头安装着一个按制猪食供应的按钮,按一下钮,有另一头安装着一个按制猪食供应的按钮,按一下钮,有8个个单位的猪食进槽,但需单位的猪食进槽,但需2个单位的成本。两头猪有两种策略:个单位的成本。两头猪有两种策略:按钮和等待。具体的博弈支付和结果如下表:按钮和等待。具体的博弈支付和结果如下表:2021/7/

35、2438 按按钮的猪按按钮的猪吃到的猪食吃到的猪食大猪大猪小猪小猪大猪大猪44小猪小猪71两猪同时两猪同时53 按按钮对对吃食量的影响按按钮对对吃食量的影响小猪小猪按按钮按按钮等待等待大猪大猪按按钮按按钮3,12,4等待等待7,-10,0 猪智博弈猪智博弈2021/7/2439 依赖于小猪的策略:若小猪选依赖于小猪的策略:若小猪选“等待等待”,大猪的最优策略,大猪的最优策略是是“按按”;若小猪选;若小猪选“按按”,大猪的最优策略为,大猪的最优策略为“等待等待”。因此,不能用上述占优策略找出均衡。因此,不能用上述占优策略找出均衡。 可能的均衡是什么呢?若小猪是理性的,他只会选可能的均衡是什么呢?

36、若小猪是理性的,他只会选“等等待待”,因为,因为“等待等待”严格优于严格优于“按按”。假定大猪知道小猪是。假定大猪知道小猪是理性的,则会预测到小猪的选择;此时,大猪的最优选择只理性的,则会预测到小猪的选择;此时,大猪的最优选择只能是能是“按按”。因此,(按,等待)是该博弈唯一的均衡。因此,(按,等待)是该博弈唯一的均衡。 找出上述均衡的思路是:先找出某个参与人的劣策略(假定存找出上述均衡的思路是:先找出某个参与人的劣策略(假定存在),把它剔除,重新构造一个不包含已剔除策略的新博弈;在),把它剔除,重新构造一个不包含已剔除策略的新博弈;然后再剔除新博弈中某个参与人的劣策略;然后再剔除新博弈中某个

37、参与人的劣策略;直至剩下一直至剩下一个唯一的策略组合。该策略组合就是博弈的均衡解,称为个唯一的策略组合。该策略组合就是博弈的均衡解,称为“重复剔除的占优策略重复剔除的占优策略2021/7/2440l 例:找出下列博弈的重复剔除的占优策略均衡例:找出下列博弈的重复剔除的占优策略均衡 ),(*1*isss局中人局中人BLMR局中人局中人AU1,01,20,1D0,30,12,02021/7/2441 解解:局中人局中人BLM局中人局中人AU1,01,2D0,30,1局中人局中人BLM局中人局中人AU1,01,22021/7/2442 纳什均衡纳什均衡 纳什均衡纳什均衡 (Nash equilibr

38、ium)是指这样一种均衡,博弈)是指这样一种均衡,博弈中的每个局中人都确信,在其他局中人策略给定的情况下,中的每个局中人都确信,在其他局中人策略给定的情况下,他选择了最优策略。他选择了最优策略。博弈的理想结局是,每个局中人选择的博弈的理想结局是,每个局中人选择的策略是对其他局中人所选策略的最佳反应,其中每一个局中策略是对其他局中人所选策略的最佳反应,其中每一个局中人都不能因单方面改变自己的策略而获益。人都不能因单方面改变自己的策略而获益。 2021/7/2443 策略组合就是一个纳什均衡。策略组合就是一个纳什均衡。 表表参与人BLCR参与人AU0,44,05,3M4,00,45,3D3,53,

39、56,62021/7/2444l斗鸡斗鸡博弈博弈 AB进进退退进进退退-3,-32,00,20,02021/7/2445l麦片商麦片商博弈博弈 咸麦片咸麦片甜麦片甜麦片AB咸麦片咸麦片甜麦片甜麦片-5,-510,1010,10-5,-52021/7/2446 承诺行动l如果参与人能在博弈前采取某种措施改变自己的行动如果参与人能在博弈前采取某种措施改变自己的行动空间或支付函数,原来不可置信的威胁就可能变的可空间或支付函数,原来不可置信的威胁就可能变的可置信,博弈的均衡结果就会相应改变。这些为改变博置信,博弈的均衡结果就会相应改变。这些为改变博弈结果而采取的措施即是弈结果而采取的措施即是“承诺行动

40、承诺行动”。l 如果一个承诺可以改变对手的最优选择,该承诺为如果一个承诺可以改变对手的最优选择,该承诺为完全承诺;完全承诺;l如果一个承诺只是增加行动的成本而不是使该行动完如果一个承诺只是增加行动的成本而不是使该行动完全没有可能,该承诺为不完全承诺。全没有可能,该承诺为不完全承诺。2021/7/2447l 将承诺行动纳入模型的一个方法是明确将承诺行动作为将承诺行动纳入模型的一个方法是明确将承诺行动作为初始阶段的初始阶段的“行动行动”包括在博弈中。包括在博弈中。l 例:在例:在A决策前,决策前,B与某个客户签定一个合同,规定与某个客户签定一个合同,规定B交交房的期限,如房的期限,如B不能履约,将

41、赔偿客户不能履约,将赔偿客户3500万。这个合同万。这个合同就是一个承诺行动,这样就是一个承诺行动,这样B的的 开发,开发开发,开发 就是一个可就是一个可置置信的威胁,子博弈精炼纳什均衡是(不开发,信的威胁,子博弈精炼纳什均衡是(不开发, 开发,开开发,开发发 ),而不是原来的(开发,),而不是原来的(开发, 不开发,开发不开发,开发 )。l可可置信的威胁与不可置信的威胁与不可可可置信的威胁置信的威胁2021/7/2448重复博弈l一、重复博弈与序列博弈的区别一、重复博弈与序列博弈的区别l1、在序列博弈中,上阶段的选择决定下阶段的选择,、在序列博弈中,上阶段的选择决定下阶段的选择,重复博弈的不

42、同阶段则不存在这一必然联系;重复博弈的不同阶段则不存在这一必然联系;l2、在序列博弈中,每个阶段的博弈结构彼此不同,、在序列博弈中,每个阶段的博弈结构彼此不同,重复博弈则是同样结构,重复多次;重复博弈则是同样结构,重复多次;l3、在序列博弈中,不仅有多个阶段博弈,而且每个、在序列博弈中,不仅有多个阶段博弈,而且每个阶段博弈都有先有后,重复博弈虽然有多个阶段,但阶段博弈都有先有后,重复博弈虽然有多个阶段,但各个阶段可以是同时博弈,也可以是先后博弈;各个阶段可以是同时博弈,也可以是先后博弈;2021/7/2449l4、重复博弈与序列博弈都追求收益最大化,重复博弈与序列博弈都追求收益最大化,但前者并

43、不追求每个阶段收益最大化,而是追但前者并不追求每个阶段收益最大化,而是追求所有阶段收益的贴现值或加权平均值最大化,求所有阶段收益的贴现值或加权平均值最大化,不因眼前局部利益而牺牲长远整体利益。不因眼前局部利益而牺牲长远整体利益。2021/7/2450有限重复博弈-田忌赛马上中下上中下上下中上下中中上下中上下中下上中下上下上中下上中下中上下中上上中下上中下3 -31 -1 1 -11 -1-1 11 -1上下中上下中1 -13 -31 -11 -11 -1-1 1中上下中上下1 -1-1 13 -31 -11 -11 -1中下上中下上-1 11 -11 -13 -31 -11 -1下上中下上中1 -11 -11 -1-1 13 -31 -1下中上下中上1 -11 -1-1 11 -11 -13 -3田田齐齐2021/7/2451l 如果双方都采取混合策略,以相同概率随机如果双方都采取混合策略,以相同概率随机选择出马次序,齐威王和田忌每次比赛的期望选择出马次序,齐威王和田忌每次比赛的期望收益依次为收益依次为1,-1:l (3+1+1+1-1+1)/6=1l (1-3-1-1-1-1)/6=-1l如比赛为如比赛为t次,则齐威王收益收益次,则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论