版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、博弈论与信息经济学 (Game Theory and Information Economics)第4章:重复博弈Chapter 4: Repeated Game11 基本博弈(回顾)囚徒困境是这样一个博弈:每个参与人有一个占优策略,但是,当所有参与人使用他们这一占优策略时,所产生的均衡对于每个人的结果,比他们都使用劣策略反而还要差。囚徒困境博弈-8,-80,-10-10,0-1,-1囚徒 A坦白抵赖坦白抵赖囚徒 B本章考虑囚徒困境中的参与人是否以及如何获得和保持对他们都有利的合作结果,克服为了自身利益而背叛的个人激励。21 基本博弈(回顾)-8,-80,-10-10,0-1,-1囚徒 A坦白
2、抵赖坦白抵赖囚徒 B在任何一个囚徒困境中,都会有合作策略和欺骗或背叛策略。囚徒困境博弈(回顾) “抵赖”合作策略(双方获得最佳结果)“坦白”欺骗策略(牺牲对方利益换取自己利益)囚徒困境能否以及如何解决,问题的实质在于通过非合作(个人)的行动去实现合作(共同偏好)的结果。31 基本博弈(回顾) 解法1:重复参与人之间重复和持续的关系是博弈的特征。重复博弈(repeated game):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈” (stage game).序贯博弈(sequential game):参与人在前一个决策点的选择决定随后的子博弈的结构,因此,从后一个决策点开始的子博弈不同
3、于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次;A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx41 基本博弈(回顾) 解法1:重复所有参与人观察到博弈过去的历史; 重复博弈的特征参与人的总支付是所有阶段博弈支付的贴现值之和;无限次重复博弈有限次重复博弈52 博弈的有限次重复在一个囚徒困境的重复博弈中,每个参与人担心一次背叛会导致未来合作的崩溃如果未来合作的价值很大,超过了短期背叛所获得的,那么从参与人的长期个人利益着想,参与人就自动不会选择背叛,并不需要动用第三方来施加任何额外惩罚。重复博弈均衡结果的影响因素:博弈重复的次数62 博弈的有
4、限次重复288,288360,216216,360324,324餐馆 A20(背叛)26(合作)餐馆 B20(背叛)26(合作)餐馆定价博弈假定两个餐馆开始处于合作状态,每个人收取高价格26。如果他们正常地竞争至少3个月,按照重复博弈的理论,我们似乎就应该看到合作行为(高价格)而不是背叛行为(低价格)但是解实际上没有那么简单。72 博弈的有限次重复如果他们只经营3个月,则餐馆会分析且选择它们三个月中的最优策略。逆向归纳法第三个月:餐馆没有进一步关系值得考虑,每个餐馆的占优策略都是背叛。第二个月:双方没有更进一步关系(都知道第三个月会背叛),所以第二个月每个餐馆的占优策略都是背叛。第一个月:知道
5、第二、三个月会背叛,第一个月每个餐馆选择背叛。囚徒困境82 博弈的有限次重复只要两个参与人之间的关系持续一段有限时间,在最后阶段的博弈中,占优策略(背叛)就会被采用(参与人到达博弈终点时,继续合作就毫无价值,于是他们选择背叛)按照逆向归纳法的预测,相互背叛就会从博弈的最后一期蔓延到第一期。92 博弈的有限次重复40,50-10,00,3000,300进入者进入不进入默许斗争在位者市场进入博弈Chain Store Paradox唯一的SPNE为进入者进入,在位者默许有限次重复博弈中,斗争不是一个可置信战略。因为逆向归纳法得到唯一的SPNE为在位者在每个市场选择默许,进入者选择进入。102 博弈
6、的有限次重复定理:令G为阶段性博弈,G(T)是G重复T次的重复博弈(T108/(1+r)时,即r2时,背叛一次才划算。几乎不可能。所以在对手执行以牙还牙策略时,餐馆A还是继续合作 较好,而不是背叛一次。1/(1+r)贴现因子 163 博弈的无限次重复它会在第一个月得到360,但接下来每个月会损失36。当对手采取TFT策略时,餐馆A永久背叛是否划算?当且仅当3636/(1+r)+ 36/(1+r)2+ 36/(1+r)3+时,即r1时,餐馆A选择永久背叛。当餐馆B采取TFT策略时,餐馆A最好不要背叛合作,双方都采取高价的合作结果才是均衡。餐馆A的未来损失的贴现值为36/(1+r)+ 36/(1+
7、r)2+ 36/(1+r)3+173 博弈的无限次重复TFT只是触发策略的一种,是比较“仁慈”的策略。所以如果TFT能够解决囚徒困境,那么其他更严厉的策略也能够帮助实现合作。183 博弈的无限次重复 给定别人选择冷酷战略,“我”一直选择合作的支付为 给定别人选择冷酷战略,“我”选择背叛的支付为 给定别人选择冷酷战略,“我”一直选择合作的条件是当 合作作为均衡结果出现当对手采取冷酷策略(grim strategy)时,囚徒A选择合作的条件是什么?193 博弈的无限次重复 含义:在无限次重复博弈中,如果参与人对未来足够重视( 足够大),那么,任何程度的合作都可以通过一个特定的子博弈精炼纳什均衡得到
8、。无名氏定理(Friedman1971):在无限次重复博弈中,当贴现因子足够大时,任何帕累托优于单阶段博弈纳什均衡的收益组合(支付向量)都可以实现,即都能够成为子博弈精炼纳什均衡结果。203 博弈的无限次重复囚徒困境博弈的可行支付集合-8,-80,-10-10,0-1,-1坦白抵赖坦白抵赖惩罚点(纳什均衡点)(-1,-1)(-10, 0)(-8,-8)(0,-10)213 博弈的无限次重复等待的补偿:经济学里讲的时间价值结束的不确定性无限次重复博弈,可以解释为有限次博弈,只是到底在那一阶段结束博弈是不确定的,每一阶段都有可能结束博弈,而且各阶段结束博弈的概率p是相等的。数学推理如下:博弈达到t
9、阶段的概率为(1-p)t-1, 那么t阶段支付的期望值为t(1-p)t-1,其贴现值为t-1 t(1-p)t-1,令= (1-p)即得结论。贴现因子的另一种解释223 博弈的无限次重复参与人不固定的重复博弈1,1-1,20,00,0消费者购买不购买高质量低质量厂商 假定厂商从生产高质量产品开始;继续生产高质量产品,除非曾经生产过低质量;如果上一次生产了低质量,则永远生产低质量 第一个消费者选择购买;只要厂商不曾生产过低质量,随后的消费者继续购买;如果曾经厂商生产过低质量,则之后的消费者不再购买。233 博弈的无限次重复可以证明,当0.5时,该策略组合为SPNE。均衡结果是(购买,高质量)重复博
10、弈时,厂商不敢以劣货欺人厂商有积极性考虑长远利益时,就会建立一个信誉。 为什么买于“坐贾”而非“行商”?为什么车站旁边的劣质品那么多?企业存在的一个原因是创造一个“长期参与人”,因其考虑长期利益而遵章守纪、态度积极信任是在重复博弈中,当事人谋求长期利益最大化的手段(Kreps, 1986; Gibbons, Robert, 2000) 24亚当斯密:最商业化的社会,也是最讲究道德的社会。3 博弈的无限次重复市场经济和道德25解法:惩罚与奖励施加直接惩罚于背叛的参与人:将惩罚的成本考虑后,参与人的支付就会发生改变,囚徒困境就迎刃而解。囚徒 A坦白抵赖坦白抵赖囚徒 B-8,-80,-10-10,0
11、-1,-1-8,-8-6,-10-10,-6-1,-1假设:背叛者虽然先出狱,但合作者的朋友在外面等着揍他,这种身体的伤害相当于另外5年的判刑。26解法:惩罚与奖励假设:更严厉的惩罚,凡是坦白都会收到惩罚由第三方执行。这种身体的伤害相当于另外5年的判刑。囚徒 A坦白抵赖坦白抵赖囚徒 B-8,-80,-10-10,0-1,-1-13,-13-5,-10-10,-5-1,-1通过奖励合作者同样可以解决囚徒困境27解法:领导在囚徒困境的许多例子中,博弈都假定为对称,所以参与人在背叛(合作)时,失去(得到)的支付完全相等。然而,在实际的策略情况下,一个参与者可能相对较“大”(领导者),另一个相对较“小
12、”。如果支付相差较大,则背叛时,大部分的损害会如落在较大参与者身上,以致她明知对手会背叛,依然选择合作行动。28解法:领导疫苗研发博弈 多米尼加和索婆利亚两国人口受到一种名为急性发作睡眠(SANE)的疾病的威胁,每2000人有1人会感染这种疾病(0.05%感染率),让感染者陷入1年的深度睡眠但会造成巨大损失。每名工人因生病一年不能工作的损失是32000美元。国家1亿名工人,患病人数50000,预计损失为16亿美元。两国损失之和为32亿。 科学家确信投入20亿美元,可迅速研制100%有效疫苗。 两国独立决策是否出钱赞助该项目。但一旦一国赞助,另一国则可不费成本得到科研成果使用疫苗29解法:领导多米尼加研发不研发研发不研发索婆利亚-2,-2-2,00,-2-1.6,-1.6现在假设:两国人口不等,多米尼加为1.5亿,索婆利亚为0.5亿。如两
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吉首大学《高级语言程序设计B实验》2021-2022学年期末试卷
- 吉首大学《软件工程导论》2021-2022学年期末试卷
- 《供应链管理》课件 张静芳 第9章 供应链金融管理;第10章 供应链绩效管理
- 仓库出货免责协议书范文范本
- 慈善筹款合作协议书范文模板
- 2024年大型养羊场出让协议书模板范本
- 吉林师范大学《文学概论II》2021-2022学年第一学期期末试卷
- 2024年大件搬运维修合同范本
- 2022年公务员多省联考《申论》真题(辽宁B卷)及答案解析
- 吉林师范大学《光电子技术》2021-2022学年期末试卷
- 形势与政策-论朝鲜半岛局势
- 通达信指标公式源码主力动向
- 潜油泵及潜油泵加油机讲义
- 医患沟通内容要求记录模板(入院、入院三日、术前、术后、出院)
- 航海学天文定位第四篇第6章天文定位
- 第8章 腹部检查(讲稿)
- 浅谈深度教学中小学数学U型学习模式
- 湿法脱硫工艺计算书
- 江西上饶铅山汽车驾驶科目三考试线路
- (医学PPT课件)NT检查规范
- 导电炭黑的用途及使用方法
评论
0/150
提交评论