版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、博弈论与信息经济学(Game Theory and Information Economics )张玲玲中国科学院研究生院管理学院主要内容简介第一章 概述-人生处处皆博弈第一篇 非合作博弈理论第二章 完全信息静态信息博弈-纳什均衡第三章 完全信息动态搏弈-子博弈精炼纳什均衡第四章 不完全信息静态博弈-贝叶斯纳什均衡第五章 不完全信息动态博弈-精练贝叶斯纳什均衡第二篇 信息经济学 第六章 委托-代理理论(I) 第七章 委托-代理理论(II) 第八章 逆向选择与信号传递 主要内容简介第三章 完全信息动态搏弈 -子博弈精炼纳什均衡一 博弈扩展式表述二 子博弈精练纳什均衡三 应用举例博弈的战略表述案例
2、- 房地产开发项目-假设有A、B两家开发商市场需求:可能大,也可能小投入:1亿假定市场上有两栋楼出售:需求大时,每栋售价1.4亿,需求小时,售价7千万;如果市场上只有一栋楼需求大时,可卖1.8亿需求小时,可卖1.1亿博弈战略表述4000,40008000,00,80000,0不开发开发商A开发不开发开发-3000,-30001000,00,10000,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况博弈的战略式表述一 博弈扩展式表述博弈的扩展式表述包括三个要素:参与人集合每个参与人的战略集合由战略组合决定的每个参与人的支付进入者进入不进入(0,300)在位者市场进入阻挠博
3、弈树不可置信威胁合作(40,50)斗争(-10,0)房地产开发博弈4000,40008000,00,80000,0不开发开发商A开发不开发开发-3000,-30001000,00,10000,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况博弈的战略式表述A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)参与人(A,B,N)战略支付参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布房地产开发博弈结,决策结结
4、,终点结枝结,初始结 信息集一 博弈扩展式表述博弈的基本构造结: 包括决策结和终点结两类;决策结是参与人行动的始点,终点结是决策人行动的终点.结满足传递性和非对称性x之前的所有结的集合,称为x的前列集P(x),x之后的所有结的集合称为x的后续集T(x)。枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择.信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:1 每个决策结都是同一个参与人的决策结;2 该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结.A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开
5、发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B在决策时不确切地知道自然的选择; B的决策结由4个变为2个房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的选择;但不知道A的选择(或A、B同时决策) 房地产开发博弈一 博弈扩展式表述只包含一个决策结的信息集称为单结信息集,如果博弈树的所有信息都是单结的,该博弈称为完美信息博弈。自然总是假定是单结的,因为自然在参与人决策之后
6、行动等价于自然在参与人之前行动但参与人不能观测到自然的行动。不同的博弈树可以代表相同的博弈,但是有一个基本规则:一个参与人在决策之前知道的事情,必须出现在该参与人决策结之前。 B知道自然的选择;但不知道A的选择(或A、B同时决策) A既不知道N也不知道B的选择 N开发不开发AA大小1/21/2BBBA开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)房地产开发博弈开发不开发N开发不开发BB大小1/21/2AAAA开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,
7、1)(0,0) B知道自然的选择;但不知道A的选择(或A、B同时决策) A? 房地产开发博弈开发不开发二 占优战略均衡 案例1-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵赖坦白抵赖AB坦白抵赖BBAA坦白抵赖坦白抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵赖坦白抵赖坦白抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)囚徒困境博弈的扩展式表述囚徒困境博弈的扩展式表述智猪博弈的扩展式表述?5,14,49,-10,0等待小猪大猪按等待按案例2-智猪博弈第三章 完全信息动态搏弈 -子博弈精炼纳什均衡一 博弈扩展式表述二 子博弈精练纳什均衡扩展
8、式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题三 应用举例博弈的划分博弈的划分:从参与人行动的先后顺序:静态博弈和动态博弈静态博弈:参与人同时选择行动或非同时行动但后行动者并不知道前行动者采取了什么具体行动;动态博弈:参与人行动有先后顺序,且后行动者能够观察先行动者选择的行动。博弈的划分参与人对其他参与人(对手)的特征、战略空间及支付函数的知识:完全信息博弈和不完全信息博弈。完全信息:每一个参与人对所有其他参与人的(对手)的特征、战略空间及支付函数有准确的 知识,否则为不完全信息。博弈的划分: 行动顺序
9、信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950,1951)完全信息动态博弈子博弈精练纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈精练贝叶斯纳什均衡泽尔腾(1965)Kreps 和Wilson(1982)Fudenberg 和Tirole(1991)完全信息静态博弈的特点?占优均衡DSE重复剔除占优均衡IEDE纯战略纳什均衡PNE混合战略纳什均衡MNE完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)考虑下列问题:一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合理?纳什均衡假定每一个参与人在选择自己的最
10、优战略时假定所有其他参与人的战略是给定的,但是如果参与人的行动有先有后,后行动者的选择空间依赖于前行动者的选择,前行动者在选择时不可能不考虑自己的行动对后行动者的影响。子博弈精练纳什均衡的一个重要改进是将“合理纳什均衡”与“不合理纳什均衡”分开。一 、博弈的基本概念及战略表述4000,40008000,00,80000,0不开发开发商A开发不开发开发-3000,-30001000,00,10000,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况博弈的战略式表述扩展式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx纳什均衡与均衡结果:存
11、在三个纯战略纳什均衡: (不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发)两个均衡结果: (开发,不开发) (不开发,开发)注意:均衡不同于均衡结果到底哪一个均衡结果将最终出现?需求小的情况完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。承诺行动与子博弈精练纳什均衡承诺行动与子博弈精练纳什均衡有些战略之所以不是精练纳什均衡,是因为它包含了不可置信的威胁战略,如果参
12、与人能在博弈之前采取某种行动改变自己的行动空间或支付函数,原来不可置信威胁将变得可置信,博弈的精练纳什均衡也会随之改变.这些改变博弈结果而采取的措施称为承诺行动.完全承诺:承诺可以使某项行动完全没有可能(破釜沉舟).不完全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没有可能.承诺行动与子博弈精练纳什均衡A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发博弈 如果在A决策之前,B与某客户签定了一个合同,规定B若不在特定时期内开发若干面积的写字楼,则将支付违约金3.5,这个合同就是承诺行动.(1,-3.5)完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1
13、965) 曹操与袁绍的仓亭之战,曹操召集将领来献破袁之策,程昱献了十面埋伏之计,他让曹操退军河上,诱袁前来追击,到那时“我军无退路,必将死战,可退袁矣”。 曹操采纳此计,令许褚诱袁军军至河上,曹军无退路,操大呼曰:“前无去路,诸军何不死战!”,众军奋力回头反击,袁军大败。第三章 完全信息动态搏弈 -子博弈精炼纳什均衡一 博弈扩展式表述二 子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题三 应用举例战略的表述战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什
14、么行动,是参与人的“相机行动方案”。在静态博弈中,战略和行动是相同的。作为一种行动规则,战略必须是完备的。扩展式表述博弈的纳什均衡足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx男的策略:足球,芭蕾选择足球;还是选择芭蕾。女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾,芭蕾),(足球,足球)1、追随策略:他选择什么,我就选择什么2、对抗策略:他选择什么,我就偏不选什么3、芭蕾策略:不管他选什么,我都选芭蕾;4、足球策略:不管他选什么,我都选足球。策略即:如果他选择什么,我就怎样行动的相机行动方案。在扩展式博弈里,参与人是相机行事,即“等待”博弈到达一个自己的信息集
15、(包含一个或多个决策结后,再采取行动方案。什么是动态博弈?扩展式表述博弈的纳什均衡若A先行动,B在知道A的行动后行动,则A有一个信息集,两个可选择的行动,战略空间为:(开发,不开发);B有两个信息集,四个可选择的行动,B有四个纯战略:开发策略:不论A开发不开发,我开发;追随策略:A开发我开发,A不开发我不开发;对抗策略:A开发我不开发,A不开发我开发;不开发策略不论A开发不开发我不开发,简写为:(开发,开发),(开发,不开发),(不开发,开发),(不开发,不开发),括号内的第一个元素对应A选择“开发”时B的选择,第二个元素对应A选择“不开发”时B的选择。A开发不开发BB开发不开发开发(-3,-
16、3)(1,0)(0,1)(0,0)不开发xx什么是参与人的战略?扩展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0开发,开发开发,不开发不开发, 开发不开发,不开发开发不开发开发商B开发商A战略式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx开发,(开发,不开发)纳什均衡与均衡结果:存在三个纯战略纳什均衡: (不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发)两个均衡结果: (开发,不开发) (不开发,开发)注意:均衡不同于均衡结果扩展式-3, -3-3, -31, 01, 00, 10, 00, 10
17、, 0开发,开发开发,不开发不开发, 开发不开发,不开发开发不开发开发商B开发商A战略式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx开发,(开发,不开发)路径在扩展式博弈中,所有n个参与人的一个纯战略组合决定了博弈树上的一个路径。(开发,不开发,开发)决定了博弈的路径为A开发B不开发-(1,0)(不开发,开发,开发)决定了路径:?第三章 完全信息动态搏弈 -子博弈精炼纳什均衡一 博弈扩展式表述二 子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题
18、三 应用举例子博弈精炼纳什均衡泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。子博弈精炼纳什均衡-不可置信威胁美国普林斯顿大学古尔教授在1997年的经济学透视里发表文章,提出一个例子说明威胁的可信性问题:两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告状,我都把你们两个关起来,关起来比没有玩具更可怕。现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说:快把玩具还我,不然我就要去告诉爸爸
19、。哥哥想,你真要告诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因此哥哥对弟弟的警告置之不理。的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可置信的。扩展式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx纳什均衡与均衡结果:存在三个纯战略纳什均衡: (不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发)两个均衡结果: (开发,不开发) (不开发,开发)注意:均衡不同于均衡结果到底哪一个均衡结果将最终出现?子
20、博弈精练纳什均衡A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发) 如果A选择开发,B的最优选择是不开发,如果A选择不开发,B的最优选择是开发,A预测到自己的选择对B的影响,因此开发是A的最优选择。子博弈精练纳什均衡结果是:A选择开发,B选择不开发。xx 对于(不开发,(开发,开发),这个组合之所以构成纳什均衡,是因为B威胁不论A开发还是不开发,他都将选择开发,A相信了B的威胁,不开发是最优选择,但是A为什么要相信B的威胁呢? 毕竟,如果A真开发,B选择开发得-3,不开发得0,所以B的最
21、优选择是不开发。如果A知道B是理性的,A将选择开发,逼迫B选择不开发。自己得1,B得0,即纳什均衡(不开发,(开发,开发)是不可置信的。因为它依赖于B的一个不可置信的威胁。 同样: (不开发,不开发)也是一个不可置信威胁,纳什均衡(开发,(不开发,不开发)是不合理的。子博弈精练纳什均衡泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。什么是子博弈,什么是子博弈精练纳什均衡?有没有更好的方法找到子博弈精练纳什均衡?完全信息动态博弈-子博弈精练纳什均
22、衡泽尔腾(1965)子博弈:是原博弈的一部分,它本身也可以作为一个独立的博弈进行分析:(1)子博弈必须从一个单结信息点开始:只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结。如果信息集包含两个以上的决策结,则这两个都不可以作为子博弈的初始结(见下页)。(2)子博弈的信息集和支付向量都直接继承自原博弈,即当x和x在原博弈中属于同一信息集时,他们在子博弈中才属于同一信息集。习惯上,任何博弈的本身称为自身的一个子博弈。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)不开发A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx不
23、开发开发不开发(1,0)(-3,-3)x开发(0,1)(0,0)x子博弈I子博弈II房地产开发博弈A坦白抵赖BB坦白抵赖坦白(-8,-8)(0,-10)(-10,0)(-1,-1)找出房地产开发博弈的子博弈(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发)A开发不开发XX大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 参与人X的信息集不能开始一个子博弈,否则的话,参与人B的信息将被切割。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)子博弈精练
24、纳什均衡: 扩展式博弈的战略组合是一个子博弈精练纳什均衡,如果:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发博弈开发不开发(1,0)(-3,-3)x开发(0,1)(0,0)x子博弈I子博弈II(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发)在c上构成均衡,在b上不构成; 在b和c上都构成 在c上构成均衡,在b上不构成完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)不开发 判断下列均衡结果哪个构成子博弈精练纳什均衡?不开发bc完全信息动态博弈-子博弈精
25、练纳什均衡泽尔腾(1965)如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称为“均衡路径”,博弈树上的其他路径称为“非均衡路径”。纳什均衡只要求均衡战略在均衡路径的决策结上是最优的;而构成子博弈精练纳什均衡不仅要求在均衡路径上策略是最优的,而且在非均衡路径上的决策结上也是最优的。这是纳什均衡与子博弈精练纳什均衡的实质区别。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)战略是参与人行动规则的完备描述,它要告诉参与人在每一种可预见的情况下(即每一个决策结)上选择什么行动,即使这种情况实际上没有发生(甚至参与人并不预期它会发生)。因此,只有当一个战略规定
26、的行动规则在所有可能的情况下都是最优的,它才是一个合理的可置信的战略,子博弈精练纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。第三章 完全信息动态搏弈 -子博弈精炼纳什均衡一 博弈扩展式表述二 子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题三 应用举例用逆向归纳法求-子博弈精练纳什均衡1UDL(3,1)(0,0)2(2,2)R 给定博弈达到最后一个决策结,该决策结上行动的参与人有一个最优选择,这个最优选择即该决策结开始的子博弈的纳什均衡 倒数第二个决策
27、结,找倒数第二个的最优选择,这个最优选择与我们在第一步找到的最优选择构成一个纳什均衡。 如此重复直到初始结。每一步都得到对应于子博弈的一个纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的子博弈的纳什均衡,这个过程的最后一步得到整个博弈的纳什均衡完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)用逆向归纳法求子博弈精练纳什均衡 对于有限完美信息博弈,逆向归纳法求解子博弈精练纳什均衡是一个最简便的方法。A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发博弈完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)1UDL(1,1)22,0RU(3,0)(0,
28、2)2D 子博弈精练纳什均衡(U,U),L). U和L分别是参与人1和参与人2在非均衡路径上的选择。 逆向归纳法求解子博弈精练纳什均衡的过程,实质上是重复剔除劣战略的过程:从最后一个决策结依次剔除每个子博弈的劣战略,最后生存下来的战略构成精练纳什均衡。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)用逆向归纳法求解的子博弈精练纳什均衡也要求“所有的参与人是理性的”是共同知识。如果博弈由多个阶段组成,则从逆向归纳法得到的均衡可能并不非常令人信服。完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)进入者进入不进入(0,300)在位者市场进入阻挠博弈树不可置信威胁支付函数行动合作(40,5
29、0)斗争(-10,0)作业强盗分赃(向前展望,倒后推理)有5个强盗抢得10枚硬币,在如何分赃上争论不休,于是他们决定:(1)抽签决定个人的号码(1,2,3,4,5)(2)由1号提出分配方案,然后5人表决,如果方案超过半数同于就通过,否则他被扔进大海喂鲨鱼;(3)1号死后,2号提方案,4人表决,当且仅当超过半数同意时方案通过,否则2号被扔进大海;(4)依次类推,知道找到一个每个人都接受的方案(当然,如果只剩5号,他独吞)结果会如何?作业强盗1234501001000098011970120970102完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)练习:-作业6参与人1(丈夫)和参与人2(
30、妻子)必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性均为50%,支付函数为:如果只有一人带伞,下雨时带伞者的效用为-2.5,不带伞者的效用为-3不下雨时带伞的效用为-1,不带的效用为0;如两人都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给出下列四种情况下的扩展式及战略式表述:(1)两人出门前都不知道是否会下雨;并且两人同时决定是否带伞(即每一方在决策时都不知道对方的决策);(2)两人在出门前都不知道是否会下雨,但丈夫先决策,妻子观察到丈夫是否带伞后才决定自己是否带伞;(3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策,妻子后决策;(4),同(3),但妻子先决策,
31、丈夫后决策.第三章 完全信息动态搏弈 -子博弈精炼纳什均衡一 博弈扩展式表述二 子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题三 应用举例承诺行动与子博弈精练纳什均衡承诺行动与子博弈精练纳什均衡有些战略之所以不是精练纳什均衡,是因为它包含了不可置信的威胁战略,如果参与人能在博弈之前采取某种行动改变自己的行动空间或支付函数,原来不可置信威胁将变得可置信,博弈的精练纳什均衡也会随之改变.这些改变博弈结果而采取的措施称为承诺行动.完全承诺:承诺可以使某项行动完全没有可能(破釜沉舟).不完
32、全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没有可能.承诺行动与子博弈精练纳什均衡 曹操与袁绍的仓亭之战,曹操召集将领来献破袁之策,程昱献了十面埋伏之计,他让曹操退军河上,诱袁前来追击,到那时“我军无退路,必将死战,可退袁矣”。 曹操采纳此计,令许褚诱袁军军至河上,曹军无退路,操大呼曰:“前无去路,诸军何不死战!”,众军奋力回头反击,袁军大败。承诺行动与子博弈精练纳什均衡A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发博弈 如果在A决策之前,B与某客户签定了一个合同,规定B若不在特定时期内开发若干面积的写字楼,则将支付违约金3.5,这个合同就是
33、承诺行动.(1,-3.5)承诺行动与子博弈精练纳什均衡经常有这样的情况,非理性-通常是自动的而不是策略性的-是一个优势。在电影怪爱博士中的末日机器就是一个例子。前苏联认为不可能在一场理性的军备竞赛中超过更富有的美国,所以,他制造了一颗炸弹,如果任何人引爆了这颗炸弹,它将自动炸毁整个世界。着部电影描述了这样一个细节,你必须告诉对方你有这么一个末日机器。据说前美国总统尼克松曾告诉他的副手哈德蔓,他对这个策略更复杂的看法:我称为疯子理论,我要让北越相信我已经到了无论付出多少都要结束战争的地步,我们只要他听到这样的传闻:“看在上帝的份上,尼克松已经被共产党搞疯了,当他生气的时候,我们没法制止他,他的手
34、已经按在核按纽上了。”胡志明两天之后会到巴黎求和的。子博弈精炼纳什均衡-不可置信威胁美国普林斯顿大学古尔教授在1997年的经济学透视里发表文章,提出一个例子说明威胁的可信性问题:两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告状,我都把你们两个关起来,关起来比没有玩具更可怕。现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说:快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因此哥哥对弟弟的警告置之不理。的确,如果弟弟是
35、会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可置信的。第三章 完全信息动态搏弈 -子博弈精炼纳什均衡一 博弈扩展式表述二 扩展式表述博弈的纳什均衡三 子博弈精练纳什均衡子博弈精练纳什均衡用逆向归纳法求子搏弈精练纳什均衡承诺行动与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡的存在问题多个参与人的情况蜈蚣博弈四 重复博弈和无名氏定理五 应用举例逆向归纳法与子搏弈精练纳什均衡的存在问题1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A 逆向归纳法要求“所有参与人是理性的”是所有参与人的共同知识。因此,在有多个参
36、与人或每个参与人有多次行动机会的情况下,逆向归纳法的结果可能并非如此。多个参与人的情况(2,2)如果n很小,逆向归纳法的结果逆向归纳法与子搏弈精练纳什均衡的存在问题如果n很大,结果又如何呢?1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A多个参与人的情况(2,2)如果n很大 对于参与人1,获得2单位支付前提是所有n-1个参与人都选A,否则就要考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p=1/2,则无限次重复博弈的纳什均衡为: 厂商从生产高质量的产品开始,继续生产高质量的产品,除非曾经生产过低质量产品,如果上一次生产了低质量的产品,
37、之后永远生产低质量的产品。 第一个消费者选择购买,只要厂商不曾生产过低质量的产品,随后消费者继续购买,如果厂商曾件生产过低质量的产品,之后消费者不再购买。重复博弈的均衡结果贴现因子:下一期的一单位支付在这一期的价值。重复博弈参与人不固定时的重复博弈1,1-1,20,00,0厂商消费者购买不购买高质量低质量质量博弈 厂商:如果生产低质量的产品,得到的短期利润是2,但之后每阶段利润为0,如果总是生产高质量的产品,每阶段得到1单位利润,贴现值为1/(1- ) =2,厂商将不会生产低质量产品。害怕失掉消费者。 消费者: =1/2,其只关心1阶段的支付,只有当预期高质量时,才会购买。消费者预期不曾生产过
38、低质量产品的厂商将继续生产高质量产品,故选择购买,反之亦然厂商生产过高质量的产品.重复博弈的均衡结果 克莱因等认为这个例子可以解释为什么消费者偏好去大商店购买东西而不信赖走街串巷的小商贩。 西蒙等用类似博弈解释雇佣关系,认为,企业存在的原因之一正式创造一个“长期的参与人”,这样一个参与人由于对未来利益的考虑而更讲信用。重复博弈未来影响现在对未来的预期,是影响我们行为的重要因素。一种是预期的收益,一种是预期的风险。地摊、车站、旅游点不但服务质量差,而且假货横行公共汽车上,两个陌生人会为座位而争吵,但是如果他们互相认识为什么现代城市人的关系如此冷漠?为什么不文明行为屡禁不止?第三章 完全信息动态搏
39、弈 -子博弈精炼纳什均衡一 博弈扩展式表述二 扩展式表述博弈的纳什均衡三 子博弈精练纳什均衡四 重复博弈五 应用举例斯坦克尔伯的寡头竞争模型轮流出价的讨价还价模型囚徒的救赎旅行者困境第三章 完全信息动态搏弈 -子博弈精炼纳什均衡斯坦克尔伯的寡头竞争模型企业1企业2参与人:企业1、企业2;行动顺序:企业1先选择产量q1,企业2观测到q1,然后选 择自己的产量q2。支付: 利润,利润是两个企业产量的函数斯坦克尔伯的寡头竞争模型qi :第i个企业的产量C:代表单位不变成本假定逆需求函数为:第i个企业的利润函数为:企业1企业2斯坦克尔伯的寡头竞争模型用你向归纳法求解,首先考虑给定q1的情况下,企业2的
40、最优选择。企业2的问题是:最优化一阶条件意味着:因为企业1预测到企业2将根据S2(q1)来选择q2,企业1在第1阶段的问题是:斯坦克尔伯的寡头竞争模型均衡结果比较垄断情况下库诺特寡头竞争模型斯坦克尔伯寡头竞争模型产量A:A:B:B:总产量利润A:A:B:B:总利润斯坦克尔伯的寡头竞争模型从上述计算可以看出:斯坦克尔伯的均衡总产量大于库诺特均衡总产量,企业1的斯坦克尔伯的均衡产量大于库诺特均衡产量,企业2的斯坦克尔伯的均衡产量小于库诺特均衡产量。同样,企业1在斯坦克尔伯博弈中的利润大于在库诺特博弈中的利润,企业2的利润却有所下降,这就是所谓的“先动优势”。 拥有信息优势可能使参与人处于劣势。企业
41、1先行动的承诺价值 :企业1之所以获得斯坦克尔伯利润而不是库诺特利润,是因为它的产品一旦生产出来就变成了一种积淀成本,无法改变,从而使企业2不得不承认它的威胁是可置信的。而假如企业1只是宣布了它将生产 ,企业2是不会相信她的威胁的。第三章 完全信息动态搏弈 -子博弈精炼纳什均衡一 博弈扩展式表述二 扩展式表述博弈的纳什均衡三 子博弈精练纳什均衡四 重复博弈五 应用举例斯坦克尔伯的寡头竞争模型轮流出价的讨价还价模型囚徒的救赎旅行者困境轮流出价的讨价还价模型分蛋糕的动态博弈游戏规则:第一轮由第一个参与人(小鹃)提出条件,第二个参与人小明可以接受,从而游戏结束,也可以不接受,则游戏进入第二轮;小明提
42、出条件,小鹃可以接受,从而结束游戏,也可以不接受,从而进入第三轮;蛋糕融化呈线性,游戏结束,蛋糕融化第一种情况:假设博弈只有一步,小鹃提出分配方案,如果小明同意,两个人按照约定分蛋糕,如果小明不同意,两人什么也得不到。结果会怎样?轮流出价的讨价还价模型第二种情况:桌上放了一个冰淇淋蛋糕,但两轮谈判过后,蛋糕将完全融化。博弈结果如何?第三种情况:桌上的冰淇淋蛋糕在三轮谈判后将完全融化,结果又如何?第四种情况:桌上的冰淇淋蛋糕在四轮谈判后将完全融化,或者在五轮谈判、六轮,100轮谈判后将完全融化,结果又如何? 博弈的结果是:假如“轮数”是偶数,双方各得一半,假若论述是奇数,则小鹃得到(n+1)/2
43、n;小明得到(n-1)/(2n)轮流出价的讨价还价模型通常情况下,在一个漫长的多轮的讨价还价过程汇总,谁第一个提出条件并不重要。“妥协”的几乎一半对一半的解决方案看来还是难以避免的。如果谈判长时间陷入僵持状态,“胜方”大概什么也得不到,“败方”自然也不会更好。最后一个提出条件的人可以得到“全部”,而全部有可能是什么也没有,所谓“赢得战役而输掉战争”。参与人应该把握第一个提出条件的机会,提出一个刚好足以引诱对方接受的条件。思考:如果讨价还价过程真象上面那样,为什么罢工还会出现?第三章 完全信息动态搏弈 -子博弈精炼纳什均衡一 博弈扩展式表述二 扩展式表述博弈的纳什均衡三 子博弈精练纳什均衡四 重
44、复博弈五 应用举例斯坦克尔伯的寡头竞争模型轮流出价的讨价还价模型囚徒的救赎旅行者困境囚徒的救赎好莱圬大片肖申克的救赎是一部很好看的电影,主要内容是一个被冤屈的囚犯如何凭着坚定的信念和聪明才智逃出牢房。我们的“囚犯”也可以通过好的策略合作,摆脱“困境”的诅咒。囚徒的救赎 什么是最好的策略? 在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出了多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。重复博弈-囚徒困境-冷酷战略无限次重复博弈囚徒困境博弈重复无穷次,结果如何?证明得出,如果参与人有足够的耐心,(抵赖,抵赖)是一个子博弈
45、精练纳什均衡结果)。冷酷战略(1)开始选择抵赖;(2)选择抵赖一直到有一方选择了坦白,然后永远选择坦白。-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵赖坦白抵赖 无限次重复博弈使其走出了囚徒困境,背后的原因是: 如果博弈重复无穷次而且每个人有足够的耐心,任何短期机会主义行为的所得都是微不足道的,参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的机会主义的行为。囚徒的救赎-一报还一报一报还一报如果重复博弈多次,就有报复的机会,这种惩罚的规则是:人家对你怎么做,你就对他怎么做:如果他上次背叛了你,你这次背叛他;如果上次他与你合作,你这次就选择与他合作。一报还一报能够赢得竞赛不是靠打击对方,而是靠从对方引出使双方都有好处的行为。囚徒的救赎-一报还一报艾克谢罗德认为,一报还一报体现了这个策略符
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 挂靠公司的车终止合同范本(2篇)
- 二零二五年度出租车司机职业发展规划合同样本3篇
- 二零二五年份农家院农业观光园租赁管理合同4篇
- 2025年度专业培训中心场地租赁及配套设施租赁合同3篇
- 2025年度煤炭铁路运输合同争议解决机制
- 2025年度危险化学品运输安全管理合同4篇
- 2025年度南京琴行教师学生家长沟通与协作合同4篇
- 二零二五年度城市地下空间开发利用承包经营合同4篇
- 二零二五版木材行业木方板材库存管理合同范本3篇
- 二零二五年度美团商家入驻信息安全管理合同4篇
- 2025年度杭州市固废处理与资源化利用合同3篇
- 部编版二年级下册《道德与法治》教案及反思(更新)
- 充电桩项目运营方案
- 退休人员出国探亲申请书
- 伤残抚恤管理办法实施细则
- 高中物理竞赛真题分类汇编 4 光学 (学生版+解析版50题)
- 西方经济学-高鸿业-笔记
- 幼儿园美术教育研究策略国内外
- 物业公司介绍
- 2024届河南省五市高三第一次联考英语试题及答案
- 【永辉超市公司员工招聘问题及优化(12000字论文)】
评论
0/150
提交评论