版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡n四 重复博弈有限次重复博弈无限次重复博弈参与人不固定时的重复博弈n五 应用举例重复博弈n一次动态博弈也称为“序贯博弈”。n重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。如囚徒困境。n重复博弈的特征:1、阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段的结构 ;2、所有参与人都观测到博弈过去的历史;3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。贴现因子:下一期的一单位支付在这一期的价值。注: (1)在每个阶段,参与人可同时
2、行动(囚徒困境),也可不同时行动(房地产开发)。(2)重复博弈可能是完美信息博弈,也可能是不完美信息博弈。重复博弈 因为其他参与人过去的历史总是可以观测到的,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史,因此,参与人在重复博弈中的战略空间远远大于和复杂于每一阶段的战略空间,这意味着,重复博弈可能带来一些“额外”的均衡结果,而它可能在一次博弈分析中不存在。 影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。 博弈重复的次数的重要性来源于参与人在短期利益和长远利益之间的权衡。 信息的完备性:当一个参与人的支付函数不为其他参与人知道时,该参与人可能有积极性建立一
3、个“好”的声誉以换取长远利益(第四章)。重复博弈和无名氏定理n有限次重复博弈连锁店悖论进入者进入不进入在位者默许斗争默许(-10,0)(0,300)(0,300)(40,50)xx在位者斗争 假定同样的市场上有20个(可以理解为在位者有20个连锁店),进入者每次进入一个市场,博弈就变成了20次重复博弈。 假定进入者进入第1个市场,在位者应该如何反应呢?重复博弈和无名氏定理n这个博弈的纳什均衡是什么?n假定博弈共进行10次,结果会如何?n为什么会出现这个结果?n倒推论证法 假定现在是第十次,结果和一次博弈一样。第九次,即倒数第二次,局中人已经很清楚,最后一次博弈对方肯定要实行低价,因此,现在如何
4、对他施行好心都不会在下一次得到好报,所以,理性人的“我”没有理由实施高价使对方获益。依次类推。3,36,11,65,5高价企业乙企业甲低价高价低价价格大战中的囚徒困境价格大战中的囚徒困境重复博弈和无名氏定理n定理:定理:令G是阶段博弈,G(T)是G重复T(有限)次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡的重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。n定理说明有限次的重复博弈不改变阶段博弈的均衡结果。n注:(1)唯一的纳什均衡可以是混合策略纳什均衡;(2)阶段博弈G是完全信息的不要求G一定是静态的;(3)G是完全且
5、完美信息时结论仍然成立;(4)如果阶段博弈纳什均衡不唯一,定理结论不成立。重复博弈和无名氏定理1,1-1,1-1,11,-1f参与人1EFe参与人21, 15, 00, 00, 54, 40, 00, 00, 03, 3参与人Ae1e2e3参与人Bf1f2f3重复博弈和无名氏定理n当阶段博弈只重复有限次时,唯一的子博弈精炼纳什均衡便是静态博弈中的纳什均衡(唯一)的重复。n因在最后一轮,除了静态博弈纳什均衡之外没有别的可置信的威胁。在倒数第二轮为惩罚背离而进行的威胁是毫无意义和不可置信的,均衡仍为静态纳什均衡;类推一直可上溯到第一轮。n上述结论对阶段博弈纳什均衡解唯一时是成立的,不唯一时,可根据
6、具体情况求解有限重复博弈的子博弈精炼纳什均衡解。重复博弈和无名氏定理n纳什均衡不唯一的情况0,03,46,04,30,00,00,60,05,5MUMLRD参与人B参与人1 一次博弈有三个纳什均衡:(M, L),(U,M)和混合战略均衡(3/7U, 4/7M),(3/7L, 4/7M);对应支付向量分别为(4, 3),(3, 4),(12/7, 12/7)。 若贴现因子大于7/9,若博弈重复两次则如下战略组合是一个子博弈精炼纳什均衡:第一阶段选择(D,R);如果第一阶段结果是(D,R),二阶段选择(M,L);否则选择混合战略。第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n
7、二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡n四 重复博弈有限次重复博弈无限次重复博弈参与人不固定时的重复博弈n五 应用举例重复博弈与无名氏定理n无限次重复博弈n囚徒困境博弈重复无穷次,结果如何?n证明得出,如果参与人有足够的耐心,(抵赖,抵赖)是一个子博弈精练纳什均衡结果)。n冷酷战略(1)开始选择抵赖;(2)选择抵赖一直到有一方选择了坦白,然后永远选择坦白。-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵赖坦白抵赖 令r为贴现因子,证明冷酷战略是纳什均衡。如果A在博弈的某个阶段首先选择了坦白,随当阶段获得0的支付,但会促发B“永远坦白”的惩罚。因此给定B不坦白,A不坦白
8、的条件是: 若B首先选择坦白,A是否有积极性坚持冷酷战略惩罚B的不合作?显然会。 类似可证冷酷战略也是B的最优战略。22*0( 8)( 8)1( 1)( 1)1/8rrrrr 即在条件下给定B坚持冷酷战略,A不会偏离冷酷战略(首先坦白)。贴现因子:下一期的一单位支付在这一期的价值。重复博弈与无名氏定理 再证冷酷战略是子博弈精炼纳什均衡,即冷酷战略在每一个子博弈上都构成纳什均衡。在冷酷战略纳什均衡下,子博弈分为两类:没有任何人曾经坦白(前面证明显示是纳什均衡);至少有一个曾经坦白(参与人只是重复单阶段博弈的纳什均衡,自然也是整个子博弈的纳什均衡)。 无限次重复博弈使其走出了囚徒困境,背后的原因是
9、: 如果博弈重复无穷次而且每个人有足够的耐心,任何短期机会主义行为的所得都是微不足道的,参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的机会主义的行为。重复博弈与无名氏定理n求下述阶段博弈对应无穷多次博弈的冷酷战略均衡(开始选择合作C;选择合作一直到有一方选择了不合作,然后永远选择不合作D)是子博弈精炼纳什均衡的贴现因子取值范围。n参与人13,30,55,01,1CCDD参与人2重复博弈与无名氏定理n一个男孩被视为傻瓜,因为每当别人拿一枚1角硬币和5分硬币让他选的时候,他总是选5分的,有一个人觉得奇怪,就问他:“为什么你不拿1角钱的?”,男孩小声回答:“假若我拿了1角钱的硬
10、币,下次他们就不会拿钱让我选了。”n求小男孩的贴现因子取值范围。重复博弈与无名氏定理n无名氏定理(无名氏定理(Friedman 1971):):*1212*12( , )( ,)( ,)()1,( ,)nniinGnGGaGee eeavv vvVvev Vivv vv令 为一个 人阶段博弈,为以 为阶段博弈的无穷次重复博弈,是 的一个纳什均衡(纯或混合战略),是 决定的支付向量,是一个任意支付向量, 是可行支付向量集合。那么,对于任何满足的,存在一个贴现因子使得对于所有的是一个特定的子博弈精炼纳什均衡结果。 即在无限重复博弈中,如果参与人有足够耐心,那么,任何满足个人理性的可行支付向量都可以
11、通过一个特定的子博弈精炼纳什均衡得到。重复博弈与无名氏定理n 根据无名氏定理,只有当贴现因子足够接近于1时,帕累托最优才会出现。n 该定理还告诉我们无限次重复博弈可能有无穷多个精炼纳什均衡结果。因此精炼均衡仍不能帮助我们走出多重均衡的困境。n 在现实中,参与人可以使用特定的协调机制来达到一个“聚点均衡”(在库诺特博弈中,生产垄断参量可能是一个聚点均衡,具有相同成本函数的企业获得相同的垄断利润)。第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡n四 重复博弈有限次重复博弈无限次重复博弈参与人不固定时的重复博弈n五 应用举例参
12、与人不确定时的重复博弈n参与人不固定时的重复博弈1,1-1,20,00,0厂商消费者购买不购买高质量低质量质量博弈 假定只有一个厂商提供产品,每个消费者只买一次,且每个阶段只有一个消费者。 为什么消费者偏好于购买大商店的产品而不相信走街串巷的小商贩?一次博弈的均衡结果 消费者在购买时不知道自己买产品的质量,但知道所有之前消费者购买的产品质量。参与人不确定时的重复博弈n参与人不固定时的重复博弈1,1-1,20,00,0厂商消费者购买不购买高质量低质量质量博弈 如果厂商的贴现因子r =1/2,则无限次重复博弈的纳什均衡为: 厂商从生产高质量的产品厂商从生产高质量的产品开始,继续生产高质量的产品,开
13、始,继续生产高质量的产品,除非曾经生产过低质量产品,除非曾经生产过低质量产品,如果上一次生产了低质量的产如果上一次生产了低质量的产品,之后永远生产低质量的产品,之后永远生产低质量的产品。品。 第一个消费者选择购买,第一个消费者选择购买,只要厂商不曾生产过低质量的只要厂商不曾生产过低质量的产品,随后消费者继续购买,产品,随后消费者继续购买,如果厂商曾生产过低质量的产如果厂商曾生产过低质量的产品,之后消费者不再购买。品,之后消费者不再购买。重复博弈的均衡结果参与人不确定时的重复博弈n参与人不固定时的重复博弈1,1-1,20,00,0厂商厂商消费者消费者购买购买不购买不购买高质量高质量低质量低质量质
14、量博弈质量博弈 厂商:如果生产低质量的产品,得到的短期利润是2,但之后每阶段利润为0,如果总是生产高质量的产品,每阶段得到1单位利润,贴现值为1/(1- ) =2,厂商将不会生产低质量产品。害怕失掉消费者。 消费者: =1/2,其只关心1阶段的支付,只有当预期高质量时,才会购买。消费者预期不曾生产过低质量产品的厂商将继续生产高质量产品,故选择购买,反之亦然厂商生产过高质量的产品.重复博弈的均衡结果 克莱因等认为这个例子可以解释为什么消费者偏好去大商店购买东西而不信赖走街串巷的小商贩。 西蒙等用类似博弈解释雇佣关系,认为,企业存在的原因之一正式创造一个“长期的参与人”,这样一个参与人由于对未来利
15、益的考虑而更讲信用。第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡n四 重复博弈n五 应用举例斯坦克尔伯的寡头竞争模型轮流出价的讨价还价模型囚徒的救赎旅行者困境第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n斯坦克尔伯的寡头竞争模型企业1企业2v参与人:企业参与人:企业1 1、企业、企业2 2;v行动顺序:企业行动顺序:企业1 1先选择产量先选择产量q q1 1,企业,企业2 2观测到观测到q q1 1,然后选,然后选 择自己的产量择自己的产量q q2 2。v支付:支付: 利润,利润是两个企业产量的函数利润,利润是两个企
16、业产量的函数n斯坦克尔伯的寡头竞争模型nqi :第i个企业的产量nC:代表单位不变成本n假定逆需求函数为:n第i个企业的利润函数为:企业1企业22 , 1),)(),(21icQPqqqii)()(21qqaQP斯坦克尔伯的寡头竞争模型n用逆向归纳法求解,首先考虑给定q1的情况下,企业2的最优选择。企业2的问题是:)(),(212212cqqaqqqMax最优化一阶条件意味着:)(21)(1122cqaqSq因为企业1预测到企业2将根据S2(q1)来选择q2,企业1在第1阶段的问题是:)()(,(111211cqSqaqqSqMax)(21*1caq)(41*2caq垄断情况下库诺特寡头竞争模
17、型斯坦克尔伯寡头竞争模型产量A:A:B:B:总产量利润A:A:B:B:总利润)(21ca)(31ca)(31ca2)(91ca2)(91ca)(21ca)(41ca2)(81ca2)(161ca2)(41ca)(21ca2)(41ca)(32ca)(43ca2)(92ca2)(163ca斯坦克尔伯的寡头竞争模型均衡结果比较斯坦克尔伯的寡头竞争模型n从上述计算可以看出:n斯坦克尔伯的均衡总产量大于库诺特均衡总产量,企业1的斯坦克尔伯的均衡产量大于库诺特均衡产量,企业2的斯坦克尔伯的均衡产量小于库诺特均衡产量。同样,企业1在斯坦克尔伯博弈中的利润大于在库诺特博弈中的利润,企业2的利润却有所下降,这
18、就是所谓的“先动优势”。若企业的战略选择是价格,则博弈具有“后动优势”。n 拥有信息优势可能使参与人处于劣势。企业1先行动的承诺价值 :企业1之所以获得斯坦克尔伯利润而不是库诺特利润,是因为它的产品一旦生产出来就变成了一种积淀成本,无法改变,从而使企业2不得不承认它的威胁是可置信的。而假如企业1只是宣布了它将生产 ,企业2是不会相信它的威胁的。因为如果企业2选择斯坦伯格参量(a-c)/4,企业的最优产量是3(a-c)/8,n最终唯一的纳什均衡是双方都选择库诺特产量。)(21ca宏观经济政策的动态一致性货币政策模型n政府政策的动态一致性:一个政策不仅在制定阶段应该是最优的(从政府角度),而且在制
19、定之后的执行阶段也是最优的,假设没有任何新的信息出现。n动态不一致是因政府没积极性真正实施这项政策;自然国民也就不信这一政策。n货币政策模型(Kydland and Prescott 1977)n(1)参与人:政府和私人部门;(2)博弈过程:私人部门选择预期的通货膨胀率,政府在给定预期通货膨胀率下选择实际通货膨胀率。n政府面临的问题是给定私人部门通货膨胀率预期下选择货币政策:n最优化上述最优化问题得政府短期最优通货膨胀率(政府的反应函数):n若私人部门有理性预期即预期的通胀率等于政府的最优通胀率,则均衡通胀率:货币政策模型22( , )() ,0,1. .(),0eMaxMycykycksty
20、y *21()(1) )1eckyk 可理解为市场扭曲程度。*1(1)eckyn政府面临的问题是给定私人部门通货膨胀率预期下选择货币政策:n最优化上述最优化问题得政府短期最优通货膨胀率(政府的反应函数):n若私人部门有理性预期即预期的通胀率等于政府的最优通胀率,则均衡通胀率:货币政策模型22( , )() ,0,1. .(),0eMaxMycykyckstyy *21()(1) )1eckyk 可理解为市场扭曲程度。*1(1)ecky货币政策模型n由均衡通货膨胀率(S)可得政府短期效用水平:n而零通胀率(P)对应政府效用:n零通胀率不是一个子博弈精炼纳什均衡,因在私人部门轻信政府零通胀率情况下
21、,政府的最优通胀率及效用水平分别是:2212(1)(1),0,0,1SMkycck *212212(0) ()(1)(1() (1) )efckyMcky 22(1)PMky 第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡n四 重复博弈n五 应用举例斯坦克尔伯的寡头竞争模型轮流出价的讨价还价模型囚徒的救赎旅行者困境轮流出价的讨价还价模型(1)n分蛋糕的动态博弈(如果参与人在接受和拒绝之间无差异时假定接受。)n游戏规则:第一轮由第一个参与人小鹃提出条件,第二个参与人小明可以接受,从而游戏结束,也可以不接受,则游戏进入第二轮
22、;小明提出条件,小鹃可以接受,从而结束游戏,也可以不接受,从而进入第三轮;蛋糕融化呈线性,游戏结束,蛋糕融化n第一种情况:假设博弈只有一步,小鹃提出分配方案,如果小明同意,两个人按照约定分蛋糕,如果小明不同意,两人什么也得不到。结果会怎样?轮流出价的讨价还价模型(1)n第二种情况:桌上放了一个冰淇淋蛋糕,但两轮谈判过后,蛋糕将完全融化。博弈结果如何?n第三种情况:桌上的冰淇淋蛋糕在三轮谈判后将完全融化,结果又如何?n第四种情况:桌上的冰淇淋蛋糕在四轮谈判后将完全融化,或者在五轮谈判、六轮,100轮谈判后将完全融化,结果又如何?n参与人1、2轮流出价分割一块蛋糕,两人获得的份额和折现率分别为n如
23、果参与人在接受和拒绝之间无差异时假定接受。轮流出价的讨价还价模型1212,;,.x x 1122111211.1(1)2.1.(1)12ttiixxxxtxxior参与人参与人2参与人 出价(参与人2出价)n若博弈次数T有限,则有下述子博弈精炼纳什均衡:n子博弈精炼纳什均衡与贴现因子之间关系:轮流出价的讨价还价模型12122212112121211112121121212:1,1;0,11.3:1(1),1(1);,11;1 ,10.4:1(1(1(1),1(1(1(1);TxxxxTxxxxxxTxx 1212212120,1;0,0,1;0,=0,1;1,1,3,5:1;2,4,6:0.(
24、)xxxTxTx 后动优势n 一般来说,如果 均衡结果不仅依赖于贴现因子的相对比率,而且依赖于博弈时间长度T和谁在最后阶段出价。然而这种依存关系随T的变大而变小;当T趋于无穷大时,我们得到“先动优势”:即如果 唯一的均衡是 n定理(Rubinstein 1982):在无限期轮流出价博弈中,唯一的子博弈精炼纳什均衡结果是:轮流出价的讨价还价模型01,1,2ii121 (1).x*221211()11xifx 第三章 完全信息动态搏弈 -子博弈精炼纳什均衡n一 博弈扩展式表述n二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡n四 重复博弈n五 应用举例斯坦克尔伯的寡头竞争模型轮流出价的讨价还价
25、模型囚徒的救赎旅行者困境囚徒的救赎n好莱圬大片肖申克的救赎是一部很好看的电影,主要内容是一个被冤屈的囚犯如何凭着坚定的信念和聪明才智逃出牢房。我们的“囚犯”也可以通过好的策略合作,摆脱“困境”的诅咒。囚徒的救赎-一报还一报一报还一报能够赢得竞赛不是靠打击对方,而是靠从对方引出使双方都有好处的行为。如果重复博弈多次,就有报复的机会,这种惩罚的规则是:人家对你怎么做,你就对他怎么做,如果他上次背叛了你,你这次背叛他,如果上次他与你合作,你这次就选择与他合作。艾克谢罗德认为,一报还一报体现了这个策略符合四个优点:清晰、善意、报复性和宽恕性。这一法则不会引发作弊,所以是善意的;它不会让作弊者逍遥法外,所以是报复的;它不会长时间怀恨在心,只要作弊者改正,就愿意恢复合作,所以是宽恕的。一报还一报从自己
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年微机控制硬支承动平衡机项目投资价值分析报告
- 2024至2030年家居挂袋项目投资价值分析报告
- 2024至2030年哑光丝绸内墙乳胶漆项目投资价值分析报告
- 2024至2030年不锈钢雕刻工艺品项目投资价值分析报告
- 2024年中国陶瓷异鞍环填料市场调查研究报告
- 2024年防静电牛仔服项目可行性研究报告
- 2024年针线拉钩项目可行性研究报告
- 2024年豪华型电子根尖测定仪项目可行性研究报告
- 2024年中国营养壮骨粉市场调查研究报告
- 年度双拥工作计划024年双拥工作计划
- DL∕T 5161.6-2018 电气装置安装工程质量检验及评定规程 第6部分:接地装置施工质量检验
- 马王卫生院医疗质量提升攻坚年行动部署落实情况汇报
- GB/T 18029.1-2024轮椅车第1部分:静态稳定性的测定
- 【化归思想在中学数学中的应用探究6600字(论文)】
- 国家开放大学《个人与团队管理》期末考试题库及答案
- 科普版四年级上册英语全册同步练习
- 2024年监狱民警述职报告范文(3篇)
- 铁路局客运段考核判断题题库与答案
- TD/T 1049-2016 矿山土地复垦基础信息调查规程(正式版)
- 热烈欢迎领导莅临指导模板
- 大学生涯发展展示
评论
0/150
提交评论