博弈论与信息经济学完全信息动态博弈的课件_第1页
博弈论与信息经济学完全信息动态博弈的课件_第2页
博弈论与信息经济学完全信息动态博弈的课件_第3页
博弈论与信息经济学完全信息动态博弈的课件_第4页
博弈论与信息经济学完全信息动态博弈的课件_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、博弈论与信息经济学完全信息动态博弈的课件博弈的战略表述博弈的战略表述引例- 房地产开发项目-假设有A、B两家开发商市场需求:可能大,也可能小投入:1亿v假定市场上有两栋楼出售:需求大时,每栋售价1.4亿,需求小时,售价7千万;v如果市场上只有一栋楼需求大时,可卖1.8亿需求小时,可卖1.1亿& by H. Q. Feng, CUFE2/58博弈的战略式表述博弈的战略式表述不开发开发商A开发不开发开发不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况& by H. Q. Feng, CUFE3/58q 在静态博弈中,所有的参与人同时行动(或虽有先后,但没有人在自

2、己行动在静态博弈中,所有的参与人同时行动(或虽有先后,但没有人在自己行动之前观察到别人的行动)。之前观察到别人的行动)。 博弈论(习惯)用战略式表述博弈和分析静态博弈博弈论(习惯)用战略式表述博弈和分析静态博弈 博弈的战略表达式包括博弈的战略表达式包括3 3个要素:参与人集合、每个参与人的战略集合、由个要素:参与人集合、每个参与人的战略集合、由战略组合决定的每个参与人的支付。战略组合决定的每个参与人的支付。 战略式表述简单地给出参与人有些什么战略可以选择。战略式表述简单地给出参与人有些什么战略可以选择。q 在动态博弈中,参与人的行动有先后顺序,且后行动者在自己行动之前能观察到在动态博弈中,参与

3、人的行动有先后顺序,且后行动者在自己行动之前能观察到先行动者的行动。先行动者的行动。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。都与静态博弈有很大区别。 一般用扩展式表述来描述和分析动态博弈。一般用扩展式表述来描述和分析动态博弈。博弈的扩展式表述所博弈的扩展式表述所“扩展扩展”的主要是参与人的战略空间。的主要是参与人的战略空间。一、动态博弈的表述扩展式& by H. Q. Feng, CUFE4/58q扩展式表述要给

4、出每个战略的动态描述:谁扩展式表述要给出每个战略的动态描述:谁在什么时候行动,每次行动时有些什么具体在什么时候行动,每次行动时有些什么具体行动可供选择,以及知道什么。行动可供选择,以及知道什么。在扩展式表述中,战略对应于参与人的相机行动在扩展式表述中,战略对应于参与人的相机行动规则,规则,即什么情况下选择什么行动,而不是简单即什么情况下选择什么行动,而不是简单的、与环境无关的行动选择。的、与环境无关的行动选择。动态博弈中的战略是一组“IfThen”结构,即“果你这样,我将怎样”一、动态博弈的表述扩展式& by H. Q. Feng, CUFE5/58(2)博弈的扩展式表述包括以下要素:

5、)博弈的扩展式表述包括以下要素:q 参与人集合:参与人集合:i=1,n,此外,此外,N代表虚拟参与人代表虚拟参与人“自然自然”q 参与人的行动顺序:谁在什么时候行动;参与人的行动顺序:谁在什么时候行动;q 参与人的行动空间:在每次行动时,参与人有些什么选择;参与人的行动空间:在每次行动时,参与人有些什么选择;q 参与人的信息集:每次行动时,参与人知道什么;参与人的信息集:每次行动时,参与人知道什么;q 参与人的支付函数:在行动结束之后,每个参与人得到些什么(支付参与人的支付函数:在行动结束之后,每个参与人得到些什么(支付是所有行动的函数);是所有行动的函数);q 外生条件(即自然的选择)的概率

6、分布。外生条件(即自然的选择)的概率分布。 假定房地产开发博弈的行动顺序如下:开发商假定房地产开发博弈的行动顺序如下:开发商A首先行动,选择开发或不开发;首先行动,选择开发或不开发;在在A决策后,自然选择市场需求的大小;开发商决策后,自然选择市场需求的大小;开发商B在观测到在观测到A的决策和市场需求的决策和市场需求后,决定开发或不开发。后,决定开发或不开发。一、动态博弈的表述扩展式& by H. Q. Feng, CUFE6/58一、动态博弈的表述一、动态博弈的表述扩展式扩展式q对于有限参与人有限策略的动态博弈,博弈扩展形成一颗博弈树。q博弈树的基本元素:结、枝、信息集需要注意的概念:

7、前列集、后续集;初始结、决策结、终点结;直接前列结、直接后续结。以及相应的符号信息集:某个参与人都知道些什么信息集是用来标注某参与人知道些什么信息的,不同的标注表示这个人知道不同的信息& by H. Q. Feng, CUFE7/58ANNBBBB不开发开发不开发开发不开发开发不开发开发不开发开发小(1/2)市场需求:大(1/2)小(1/2)大(1/2)(4,4)(8,0) (-3,-3) (1,0)(0,8) (0,0) (0,1)(0,0)结:包括决策结和终点结。决策结:参与人采取行动的时点终点结:博弈行动路径终点枝:从一个决策结到它的直接后续结的连线每一个枝代表参与人的一个行动选

8、择。一、动态博弈的表述扩展式对于有限参与人有限策略的动态博弈,博弈扩展形成一颗博弈树。博弈树的基本元素:结、枝、信息集 信息集& by H. Q. Feng, CUFE8/58ANNBBBB不开发开发不开发开发不开发开发不开发开发不开发开发小(1/2)市场需求:大(1/2)小(1/2)大(1/2)(4,4)(8,0) (-3,-3) (1,0)(0,8) (0,0) (0,1)(0,0)一、动态博弈的表述扩展式信息集博弈树上的所有决策结被分割成不同的信息集。一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一个参

9、与人的决策结(2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。每个信息集仅包含一个决策结。意味着所有参与人在决策时准确地知道自己处在哪个决策结。如果博弈树的所有信息集都是单结的,该博弈称为完美信息博弈;否则就是不完美信息博弈。7个信息集:A:1个;N:2个;B:4个& by H. Q. Feng, CUFE9/58信息集:房地产博弈信息集:房地产博弈IIA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B B B B若行

10、动顺序不变,但B并不确切知道自然的选择,即需求量大小。这是,B的信息集变成2个。& by H. Q. Feng, CUFE10/58信息集:房地产博弈信息集:房地产博弈IIIA 开发 不开发 大 小 大 小开发 不开发 开 不开 开 不开 开 不开 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N N B1 B2 B3 B4若行动顺序不变,B确切知道自然的选择,即需求量大小,但不知道A的选择& by H. Q. Feng, CUFE11/58信息集:房地产博弈信息集:房地产博弈IVN 大 小 开 不开 开 不开开发 不开发

11、开 不开 开 不开 开 不开 (4,4) (8,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) (0,0) B B A A A A不同博弈树可以描述同一个博弈。例如,B确切知道自然的选择(但不知道A的选择);A对N和B的选择均不了解。以下是一种博弈树形式支付向量的次序发生了变化& by H. Q. Feng, CUFE12/58q市场进入阻挠”博弈(导论,例5):q这是产业经济学的一个例子,设想有一个垄断企业已在市场上(称为“在位者”),另一个企业虎视眈眈想进入(称为“进入者”)。在位者想保持自己的垄断地位,所以就阻挠进入者进入。q在这个博弈中,进入者有两种战略可

12、以选择:进入、不进入;在位者也有两种战略:默许、阻止。一、动态博弈的表述扩展式& by H. Q. Feng, CUFE13/58q假定进入之前垄断利润为假定进入之前垄断利润为300,进入之后寡头利润合为,进入之后寡头利润合为100(各得(各得50),进入成本为),进入成本为10。在位者默许斗争不进入进入进入者该博弈有几个纳什均衡?市场进入阻挠一、动态博弈的表述扩展式& by H. Q. Feng, CUFE14/58q该博弈有两个纳什均衡,该博弈有两个纳什均衡, 即(进入,默许),(不进入,斗争)。即(进入,默许),(不进入,斗争)。q 尽管在进入者选择不进入时,默许和斗争对

13、在位者是一个意思,尽管在进入者选择不进入时,默许和斗争对在位者是一个意思,但只有当在位者选择斗争时,不进入才是进入者的最优选择,但只有当在位者选择斗争时,不进入才是进入者的最优选择,所以,(不进入,斗争)是一个纳什均衡,而(不进入,默许)所以,(不进入,斗争)是一个纳什均衡,而(不进入,默许)不是一个纳什均衡。不是一个纳什均衡。q该博弈的扩展式表述为:该博弈的扩展式表述为:一、动态博弈的表述扩展式& by H. Q. Feng, CUFE15/58进入者不进入进入(0,300)在位者默许斗争(40,50)(-10,0)一、动态博弈的表述扩展式& by H. Q. Feng, C

14、UFE16/58二、子博弈精炼纳什均衡纳什均衡有几个问题:纳什均衡有几个问题:q第一,一个博弈不止一个均衡,事实上,有些第一,一个博弈不止一个均衡,事实上,有些博弈可能有无数个纳什均衡,究竟哪一个更合博弈可能有无数个纳什均衡,究竟哪一个更合理?理?q纳什均衡假定每一个参与人在选择自己的最优纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的,战略时假定所有其他参与人的战略是给定的,但是如果参与人的行动有先有后,后行动者的但是如果参与人的行动有先有后,后行动者的选择空间依赖于前行动者的选择,先行动者在选择空间依赖于前行动者的选择,先行动者在选择时不可能不考虑自己的行动对

15、后行动者的选择时不可能不考虑自己的行动对后行动者的影响。影响。& by H. Q. Feng, CUFE17/58第三,由于不考虑自己选择对别人选择的影响,纳什均衡允许了不可第三,由于不考虑自己选择对别人选择的影响,纳什均衡允许了不可置信威胁的存在。如置信威胁的存在。如“市场阻挠博弈市场阻挠博弈”中,如果进入者者真的进入,中,如果进入者者真的进入,在位者的最优行动显然是默许而不是斗争,因为默许带来在位者的最优行动显然是默许而不是斗争,因为默许带来50的利润,的利润,斗争则将预期的利润化为乌有。所以,斗争是一种不可置信的斗争则将预期的利润化为乌有。所以,斗争是一种不可置信的威胁,威胁,就

16、是说,如果在位企业摆出一副就是说,如果在位企业摆出一副“你进入我斗争你进入我斗争”的架势,那么进的架势,那么进入企业不应该被这种威胁所吓倒。因为它是不可置信的。但是,入企业不应该被这种威胁所吓倒。因为它是不可置信的。但是,纳什均衡概念承认了这种不可置信的威胁,所以(不进入,斗争)纳什均衡概念承认了这种不可置信的威胁,所以(不进入,斗争)便成为一个纳什均衡。便成为一个纳什均衡。二、子博弈精炼纳什均衡& by H. Q. Feng, CUFE18/58子博弈精炼纳什均衡子博弈精炼纳什均衡- -不可置信威胁不可置信威胁q 美国普林斯顿大学古尔教授美国普林斯顿大学古尔教授202X年在经济学透视

17、里发表文章,提出一个例子说明年在经济学透视里发表文章,提出一个例子说明威胁的可信性问题:威胁的可信性问题:q 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦的父亲宣布政策:好两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告状,我都把你们两个关起来,关起来比没好去玩,不要吵我,不管你们谁向我告状,我都把你们两个关起来,关起来比没有玩具更可怕。现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说:有玩具更可怕。现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说:快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告诉爸爸,我是要倒霉

18、快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇的,可是你不告状不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因此哥哥对弟弟的警告置之不理。变得更坏,所以你不会告状,因此哥哥对弟弟的警告置之不理。q 的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可置信的。状的好。可见,弟弟是理性人,他的告状威胁是不可置信的。& by H. Q. Feng

19、, CUFE19/58q泽尔腾于泽尔腾于1965年通过对动态博弈的分析完善年通过对动态博弈的分析完善了纳什均衡的概念,定义了了纳什均衡的概念,定义了“子博弈精炼纳子博弈精炼纳什均衡什均衡”。q这个概念的核心思想是:这个概念的核心思想是:将纳什均衡中包含的不可置信的威胁战略剔除出将纳什均衡中包含的不可置信的威胁战略剔除出去。使均衡战略不再包含不可置信的威胁。从而去。使均衡战略不再包含不可置信的威胁。从而给出动态博弈的一个合理的预测结果,给出动态博弈的一个合理的预测结果,它要求参与人的决策在任何点上都是最优的,决它要求参与人的决策在任何点上都是最优的,决策者要策者要“随机应变随机应变”,”向前看向

20、前看”,而不是固守旧而不是固守旧的策略。的策略。二、子博弈精炼纳什均衡& by H. Q. Feng, CUFE20/58q“子博弈子博弈”的概念:从每一个行动选择开始至的概念:从每一个行动选择开始至博弈结束又构成一个博弈,称为博弈结束又构成一个博弈,称为“子博弈子博弈”。如在进入者选择进入之后,在位者选择行动如在进入者选择进入之后,在位者选择行动开始就是一个子博弈。开始就是一个子博弈。q子博弈需满足的条件:子博弈需满足的条件:子博弈必须从一个单结信息集开始。?子博弈必须从一个单结信息集开始。?子博弈的支付函数只是原博弈支付函数留在子博子博弈的支付函数只是原博弈支付函数留在子博弈上的部

21、分弈上的部分子博弈不能切割原博弈的信息集子博弈不能切割原博弈的信息集一般把整个博弈也称为一个子博弈。一般把整个博弈也称为一个子博弈。二、子博弈精炼纳什均衡& by H. Q. Feng, CUFE21/58q泽尔腾的泽尔腾的“子博弈精炼纳什均衡子博弈精炼纳什均衡” 一个纳什均衡称为精炼纳什均衡,当且仅当参与一个纳什均衡称为精炼纳什均衡,当且仅当参与人的战略在每一个子博弈中都构成纳什均衡。人的战略在每一个子博弈中都构成纳什均衡。就是说,组成精炼纳什均衡的战略必须在每一个就是说,组成精炼纳什均衡的战略必须在每一个子博弈中都是最优的。子博弈中都是最优的。二、子博弈精炼纳什均衡& by

22、 H. Q. Feng, CUFE22/58扩展式表述博弈的纳什均衡(需求小)扩展式表述博弈的纳什均衡(需求小)q若若A A先行动,先行动,B B在知道在知道A A的行动后行动,则的行动后行动,则A A有一个信息集,有一个信息集,两个可选择的行动,战略空间为两个可选择的行动,战略空间为:(开发,不开发);q B B有两个信息集,四个可选择的行动,有两个信息集,四个可选择的行动,B B有四个纯战略:有四个纯战略:q开发策略:不论开发策略:不论A A开发不开发,我开发;开发不开发,我开发;q追随策略:追随策略:A A开发我开发,开发我开发,A A不开发我不开发;不开发我不开发;q 对抗策略:对抗策

23、略:A A开发我不开发,开发我不开发,A A不开发我开发;不开发我开发;q不开发策略:不论不开发策略:不论A A开发不开发我不开发,开发不开发我不开发,q 简写为:(开发,开发),(开发,不开发),简写为:(开发,开发),(开发,不开发),(不开发,开发),(不开发,不开发),(不开发,开发),(不开发,不开发),A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx什么是参与人的战略?& by H. Q. Feng, CUFE23/58扩展式开发,开发开发,不开发不开发, 开发不开发,不开发开发不开发开发商B开发商A战略式A开发不开发BB开发不开发开发(

24、-3,-3)(1,0)(0,1)(0,0)不开发xx纳什均衡与均衡结果:存在三个纯战略纳什均衡: (不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发)两个均衡结果:(开发,不开发),(不开发,开发)哪一个均衡结果将最终出现?& by H. Q. Feng, CUFE24/58扩展式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx路径在扩展式博弈中,所有n个参与人的一个纯战略组合决定了博弈树上的一个路径。(开发,不开发,开发)决定了博弈的路径为A开发B不开发-(1,0)(不开发,开发,开发)决定了路径:?& by H.

25、 Q. Feng, CUFE25/58子博弈精练纳什均衡子博弈精练纳什均衡A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发) 如果A选择开发,B的最优选择是不开发,如果A选择不开发,B的最优选择是开发,A预测到自己的选择对B的影响,因此开发是A的最优选择。子博弈精练纳什均衡结果是:A选择开发,B选择不开发,即(对抗策略)xx 对于(不开发,(开发,开发),这个组合之所以构成纳什均衡,是因为B威胁:不论A开发还是不开发,他都将选择开发,A相信了B的威胁,不开发是最优选择,但是A为什么要相信

26、B的威胁呢? 毕竟,如果A真开发,B选择开发得-3,不开发得0,所以B的最优选择是不开发。如果A知道B是理性的,A将选择开发,逼迫B选择不开发。自己得1,B得0,即纳什均衡(不开发,(开发,开发)是不可置信的。因为它依赖于B的一个不可置信的威胁。 同样: (不开发,不开发)也是一个不可置信威胁,纳什均衡(开发,(不开发,不开发)是不合理的。& by H. Q. Feng, CUFE26/58& by H. Q. Feng, CUFEq均衡路径均衡路径构成子博弈精炼纳什均衡的战略不仅在均衡路构成子博弈精炼纳什均衡的战略不仅在均衡路径上是最优的,而且在非均衡路径上也是最优径上是最优

27、的,而且在非均衡路径上也是最优的。这是纳什均衡与子博弈精炼纳什均衡的实的。这是纳什均衡与子博弈精炼纳什均衡的实质区别质区别q 只有当一个战略规定的行动规则在所有可能的情况下都是最优的时,只有当一个战略规定的行动规则在所有可能的情况下都是最优的时,它才是一个合理的、可置信的战略它才是一个合理的、可置信的战略q 序贯理性:不论过去发生了什么,参与人应该在博弈的每一个时序贯理性:不论过去发生了什么,参与人应该在博弈的每一个时点上最优化自己的决策点上最优化自己的决策二、子博弈精炼纳什均衡& by H. Q. Feng, CUFE27/58q 在市场进入博弈中,在给定进入者已经进入的情况下,在位

28、者在市场进入博弈中,在给定进入者已经进入的情况下,在位者的的“斗争斗争”已经不再是最优的。所以(进入,斗争)不是一个已经不再是最优的。所以(进入,斗争)不是一个精炼纳什均衡。剔除了这个均衡,(进入,默许)是唯一的子精炼纳什均衡。剔除了这个均衡,(进入,默许)是唯一的子博弈精炼纳什均衡。应该强调的是,一个精炼均衡首先必须是博弈精炼纳什均衡。应该强调的是,一个精炼均衡首先必须是一个纳什均衡,但纳什均衡不一定是精炼均衡。只有那些不包一个纳什均衡,但纳什均衡不一定是精炼均衡。只有那些不包含不可置信威胁的纳什均衡才是精炼纳什均衡。含不可置信威胁的纳什均衡才是精炼纳什均衡。二、子博弈精炼纳什均衡&

29、 by H. Q. Feng, CUFE28/58q不可置信的威胁引出信息经济学中一个很重要的概念,即不可置信的威胁引出信息经济学中一个很重要的概念,即“承诺行动承诺行动”(commitment)。承诺行动是当事人使自己的威)。承诺行动是当事人使自己的威胁战略变成可置信的行动。一种威胁在什么时候才是可置信的?胁战略变成可置信的行动。一种威胁在什么时候才是可置信的?q 只有在当事人若不实施这种威胁就会遭受更大的损失的时候。所以只有在当事人若不实施这种威胁就会遭受更大的损失的时候。所以说,承诺行动意味着当事人要为自己的说,承诺行动意味着当事人要为自己的“失信失信”付出成本,尽管这付出成本,尽管这种

30、成本并不一定发生。但承诺行动会给当事人带来很大的好处,因种成本并不一定发生。但承诺行动会给当事人带来很大的好处,因为他会改变均衡结果。为他会改变均衡结果。q 典型事例典型事例“破釜沉舟破釜沉舟”的故事的故事 十字路口的摄像头十字路口的摄像头曹操与袁绍的曹操与袁绍的“仓亭之战仓亭之战”二、子博弈精炼纳什均衡 曹操与袁绍的仓亭之战,曹操召集将领来献破袁之策,程昱献了十面埋伏之计,他让曹操退军河上,诱袁前来追击,到那时“我军无退路,必将死战,可退袁矣”。 曹操采纳此计,令许褚诱袁军军至河上,曹军无退路,操大呼曰:“前无去路,诸军何不死战!”,众军奋力回头反击,袁军大败。& by H. Q.

31、Feng, CUFE29/58q例如,在市场进入阻挠博弈中,如果在位者通过某种承例如,在市场进入阻挠博弈中,如果在位者通过某种承诺行动使自己的诺行动使自己的“斗争斗争”威胁变得可置信,进入者就不威胁变得可置信,进入者就不敢进入,在位者就可以获得敢进入,在位者就可以获得300的垄断利润,而不是的垄断利润,而不是50的寡的寡头利润。头利润。q 承诺行动有多种形式,一个简单的办法就是在位者与某个第三承诺行动有多种形式,一个简单的办法就是在位者与某个第三者打个赌。者打个赌。二、子博弈精炼纳什均衡& by H. Q. Feng, CUFE30/58子博弈精炼纳什均衡的逆向归纳求解法子博弈精炼纳什

32、均衡的逆向归纳求解法q 对于我们现在所讨论的有限完全信息动态博弈,逆向归纳法是对于我们现在所讨论的有限完全信息动态博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。求解子博弈精炼纳什均衡的最简便方法。q在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上去,这就是逆向归纳法。所以逆向归纳法就是从动态博弈上去,这就是逆向归纳法。所以逆向归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒推以求的最后一个阶段或最后一个子博弈开始,逐步向前倒推以求解动态博弈均衡的方法解动态博弈均衡的方法q 求解步骤见求解步骤见2.3-3(P16

33、8)& by H. Q. Feng, CUFE31/58不开发A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx不开发开发不开发(1,0)(-3,-3)x开发(0,1)(0,0)x子博弈I子博弈II房地产开发博弈找出房地产开发博弈的子博弈(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发)子博弈精炼纳什均衡的逆向归纳求解法子博弈精炼纳什均衡的逆向归纳求解法& by H. Q. Feng, CUFE32/58A开发不开发XX大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-

34、3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 参与人X的信息集不能开始一个子博弈,否则的话,参与人B的信息将被切割。& by H. Q. Feng, CUFE33/58A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx开发不开发(1,0)(-3,-3)x开发(0,1)(0,0)x子博弈I子博弈II(不开发,(开发,开发), (开发,(不开发,不开发)在c上构成均衡,在b上不构成; 在c上构成均衡,在b上不构成不开发判断下列均衡结果哪个构成子博弈精练纳什均衡?不开发bc子博弈精炼纳什均衡的逆向归纳求解法(开发,(不开发,开发) 在b和c上都构成

35、& by H. Q. Feng, CUFE34/58对逆向归纳法的概括对逆向归纳法的概括q 逆向归纳法求解子博弈精练纳什均衡的过程,实质上是重复剔除劣战略的过程:从最后一个决策结依次剔除每个子博弈的劣战略,最后生存下来的战略构成精练纳什均衡。q 只适用于完美信息博弈(尽管也可以分析某些非完美信息博弈)q 用逆向归纳法求解的子博弈精练纳什均衡也用逆向归纳法求解的子博弈精练纳什均衡也要求要求“所有的参与人是理所有的参与人是理性的性的”是共同知识是共同知识。 有多个参与人有多个参与人或每个参与人有多次行动机会每个参与人有多次行动机会的情况下,逆向归纳法的结果可能并不可靠。& by H

36、. Q. Feng, CUFE35/58逆向归纳法与子搏弈精练纳什均衡的存在问题逆向归纳法与子搏弈精练纳什均衡的存在问题1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A多个参与人的情况(2,2)如果n很小,逆向归纳法的结果& by H. Q. Feng, CUFE36/58逆向归纳法与子搏弈精练纳什均衡的存在问题逆向归纳法与子搏弈精练纳什均衡的存在问题如果如果n n很大,结果又很大,结果又如何呢?如何呢?1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A(2,2) 对于参与人1,获得2单位支付前提是所有n-1

37、个参与人都选A,否则就要考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p1,所有n-1个参与人选择A的概率是pn-1,如果n很大,这个值就很小; 另外,即使参与人1确信所有n-1个参与人都选A,他也可能怀疑是否第2个参与人相信所有n-2个参与人都选A。 这个链越长,共同知识的要求就越难满足。& by H. Q. Feng, CUFE37/58逆向归纳法与子搏弈精练纳什均衡的存在问题逆向归纳法与子搏弈精练纳什均衡的存在问题1D(1,1)A?2D(0,3)A1D(98,98)A2D(98,101)A(100,100)2D(97,100)A1D(99,99)A(罗森塞(另

38、一种)蜈蚣博弈)有两个参与人1、2,每个参与人有100个决策结。在第n步,若1决策结束,1、2都得n;若2决策结束,1得n-1,2得n+2,逆向归纳法的结果:一开始,就结束!1D(2,2)A2D(1,4)A但是,当你没有预料的事情发生时,比如参与人选择了A,你该如何选择?你的选择应该依赖于你的参与人未来的行为。特别是,你如何修正你对参与人理性程度的评价。& by H. Q. Feng, CUFE38/58逆向归纳法与子搏弈精练纳什均衡的存在问题逆向归纳法与子搏弈精练纳什均衡的存在问题q 逆向归纳法理论没有为当某些未预料到的事情出现时参与人如何形成逆向归纳法理论没有为当某些未预料到的事情

39、出现时参与人如何形成他们的预期提供解释,这使得逆向归纳法的解释受到怀疑。他们的预期提供解释,这使得逆向归纳法的解释受到怀疑。q 弗德伯格等人将偏离行为解释为是由于有关弗德伯格等人将偏离行为解释为是由于有关“支付函数支付函数”信息的不确定性造信息的不确定性造成的,即实际的支付函数不同于原来认为的支付函数,从而参与人在观测到成的,即实际的支付函数不同于原来认为的支付函数,从而参与人在观测到未曾预料到的行为时应该修正有关支付函数的信息。未曾预料到的行为时应该修正有关支付函数的信息。q 他们认为,任何一个有关博弈行为的理论应该是他们认为,任何一个有关博弈行为的理论应该是“完备的完备的”,即理论应该对,

40、即理论应该对任何可能的行为赋予正的概率,从而当某件事情出现时,参与人对随后的博任何可能的行为赋予正的概率,从而当某件事情出现时,参与人对随后的博弈行为的条件预测总是很好定义的。弈行为的条件预测总是很好定义的。& by H. Q. Feng, CUFE39/58作业作业1、第、第2章习题章习题3(p235)。)。2、三寡头(、三寡头(A、B、C)市场需求函数市场需求函数P=100-Q, Q是三个厂商的产量之和,三厂是三个厂商的产量之和,三厂商的边际成本均为商的边际成本均为2且无固定成本。如且无固定成本。如A、B同时决定产量,同时决定产量,C根据根据A和和B的产的产量决策,试求三厂商各自的

41、产量和支付(利润)。量决策,试求三厂商各自的产量和支付(利润)。3、强盗分赃(向前展望,倒后推理)、强盗分赃(向前展望,倒后推理) 有有5个强盗抢得个强盗抢得100枚宝石,在如何分赃上争论不休,于是他们决定:枚宝石,在如何分赃上争论不休,于是他们决定: (1 1)抽签决定个人的号码()抽签决定个人的号码(1 1,2 2,3 3,4 4,5 5) (2 2)由)由1 1号提出分配方案,然后号提出分配方案,然后5 5人表决,如果方案超过半数同意就通过,否则他被扔进大海喂鲨鱼;人表决,如果方案超过半数同意就通过,否则他被扔进大海喂鲨鱼; (3 3)1 1号死后,号死后,2 2号提方案,号提方案,4

42、4人表决,当且仅当超过半数同意时方案通过,否则人表决,当且仅当超过半数同意时方案通过,否则2 2号被扔进大海;号被扔进大海; (4 4)依次类推,直到找到一个每个人都接受的方案(当然,如果只剩)依次类推,直到找到一个每个人都接受的方案(当然,如果只剩5 5号,他独吞)号,他独吞) 分赃的结果会如何?分赃的结果会如何?& by H. Q. Feng, CUFE40/58三、重复博弈三、重复博弈q 重复博弈是一种特殊但非常重要的动态博弈重复博弈是一种特殊但非常重要的动态博弈重复博弈:指重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为重复多次,其中的每次博弈称为“阶段博弈阶段博弈”。如

43、囚徒困境。如囚徒困境。q 重复博弈的特征:重复博弈的特征:q 1、阶段博弈之间没有、阶段博弈之间没有“物质上物质上”的联系,即的联系,即前一阶段的博弈不改变后一阶段前一阶段的博弈不改变后一阶段的结构的结构 ;q 2、所有参与人都观测到博弈过去的历史;、所有参与人都观测到博弈过去的历史;q 3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均值。、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均值。贴现因子:贴现因子:下一期的一单位支付在这一期的价值。注意:在每个阶段,参与人可同时行动,也可不同时行动。注意:在每个阶段,参与人可同时行动,也可不同时行动。& by H. Q

44、. Feng, CUFE41/58三、重复博弈三、重复博弈q为何研究重复博弈为何研究重复博弈经济中的长期关系经济中的长期关系人们的预见性人们的预见性未来利益对当前行为的制约未来利益对当前行为的制约长期合同、回头客、长客和一次性买卖的区别长期合同、回头客、长客和一次性买卖的区别有无确定的结束时间有无确定的结束时间& by H. Q. Feng, CUFE42/58q影响重复博弈均衡结果的主要因素是博弈重影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。复的次数和信息的完备性。博弈重复的次数的重要性来源于参与人在短期利博弈重复的次数的重要性来源于参与人在短期利益和长远利益之间的

45、权衡。益和长远利益之间的权衡。信息的完备性:当一个参与人的支付函数不为其信息的完备性:当一个参与人的支付函数不为其他参与人知道时,该参与人可能有积极性建立一他参与人知道时,该参与人可能有积极性建立一个个“好好”的声誉以换取长远利益。的声誉以换取长远利益。三、重复博弈三、重复博弈& by H. Q. Feng, CUFE43/58q 有限次重复博弈有限次重复博弈连锁店悖论连锁店悖论进入者进入不进入在位者默许斗争默许(-10,0)(0,300)(0,300)(40,50)xx在位者斗争 假定同样的市场上有20个(可以理解为在位者有20个连锁店),进入者每次进入一个市场,博弈就变成了20次重

46、复博弈。 假定进入者进入第1个市场,在位者应该如何反应呢?三、重复博弈三、重复博弈& by H. Q. Feng, CUFE44/58& by H. Q. Feng, CUFE有限次重复博弈有限次重复博弈连锁店悖论连锁店悖论q市场的“先来后到”重复博弈中,在位者在第一次选择“斗争”时不可置信的威胁。惟一的子博弈精炼纳什均衡是他总是“默许”。q 倒着想:如果已经进入了n-1个,在最后一个时,其威胁本来是不可置信的,则最后一个会“默许”,再往前推,由于每阶段的“斗争”都是不可置信的,则所有大门都在“默许”下向后来者敞开q悖论:我n大的市场岂容你染指?斗!但事实不会如此q 只要博弈的

47、重复次数是有限的,“重复”并不改变囚徒困境的结果。& by H. Q. Feng, CUFE45/58三、重复博弈三、重复博弈q 无限次重复博弈无限次重复博弈q囚徒困境博弈重复无穷次,结果如囚徒困境博弈重复无穷次,结果如何?何?证明得出,如果参与人有足够的证明得出,如果参与人有足够的耐心,(抵赖,抵赖)是一个子耐心,(抵赖,抵赖)是一个子博弈精练纳什均衡结果)。博弈精练纳什均衡结果)。q冷酷战略冷酷战略(1 1)开始选择抵赖;)开始选择抵赖;(2 2)选择抵赖一直到有一方选择了坦白,)选择抵赖一直到有一方选择了坦白,然后永远选择坦白。然后永远选择坦白。囚徒A囚徒 B坦白抵赖坦白抵赖 无

48、限次重复博弈使其走出了囚徒困境,背后的原因是: 如果博弈重复无穷次而且每个人有足够的耐心,任何短期机会主义行为的所得都是微不足道的,参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的机会主义的行为。& by H. Q. Feng, CUFE46/58q一个男孩被视为傻瓜,因为每当别人拿一枚一个男孩被视为傻瓜,因为每当别人拿一枚1 1角硬币和角硬币和5 5分硬币让他选的时候,他总是选分硬币让他选的时候,他总是选5 5分的,有一个人觉得奇怪,就问他:分的,有一个人觉得奇怪,就问他:“为什为什么你不拿么你不拿1 1角钱的?角钱的?”,q男孩小声回答:男孩小声回答:“假若我拿

49、了假若我拿了1 1角钱的硬币,角钱的硬币,下次他们就不会拿钱让我选了。下次他们就不会拿钱让我选了。”& by H. Q. Feng, CUFE47/58参与人不固定时的重复博弈质量博弈 假定只有一个厂商提供产品,每个消费者只买一次,且每个阶段只有一个消费者。 为什么消费者偏好于购买大商店的产品而不相信走街串巷的小商贩?厂商消费者购买不购买高质量低质量一次博弈的均衡结果三、重复博弈& by H. Q. Feng, CUFE48/58重复博弈重复博弈q未来影响现在q对未来的预期,是影响我们行为的重要因素。一种是预期的对未来的预期,是影响我们行为的重要因素。一种是预期的收益,一种是预

50、期的风险。收益,一种是预期的风险。q 地摊、车站、旅游点不但服务质量差,而且假货横行地摊、车站、旅游点不但服务质量差,而且假货横行q 公共汽车上,两个陌生人会为座位而争吵,但是如果他们互相认识公共汽车上,两个陌生人会为座位而争吵,但是如果他们互相认识q 为什么现代城市人的关系如此冷漠?为什么不文明行为屡禁不止?为什么现代城市人的关系如此冷漠?为什么不文明行为屡禁不止?q & by H. Q. Feng, CUFE49/58q 斯坦克尔伯的寡头竞争模型斯坦克尔伯的寡头竞争模型 经济学上的许多理论先于博弈论,但包含了博弈论的一些基本思想。正如库诺特均衡可以看作纳什经济学上的许多理论先于博弈

51、论,但包含了博弈论的一些基本思想。正如库诺特均衡可以看作纳什均衡的一个版本一样,斯坦克尔伯格(均衡的一个版本一样,斯坦克尔伯格(Stackelberg)均衡可以看作是泽尔腾的子博弈精炼纳什均)均衡可以看作是泽尔腾的子博弈精炼纳什均衡的最早版本。衡的最早版本。q 轮流出价的讨价还价模型轮流出价的讨价还价模型q 劳资博弈劳资博弈四、子博弈精炼纳什均衡应用举例& by H. Q. Feng, CUFE50/58斯坦克尔伯格寡头竞争模型斯坦克尔伯格寡头竞争模型企业1企业2v参与人:企业1(领头企业)、企业2(尾随企业);v行动顺序:企业1先选择产量q1,企业2观测到q1,然后选 择自己的产量q2。v支付: 利润,利润是两个企业产

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论