范里安-第二十一章-博弈论课件_第1页
范里安-第二十一章-博弈论课件_第2页
范里安-第二十一章-博弈论课件_第3页
范里安-第二十一章-博弈论课件_第4页
范里安-第二十一章-博弈论课件_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二十一章 博弈论1博弈论博弈论的发展早期的探索 Waldegrave (1713)、 Cournot (1838)、Zermelo(1913)、Borel(1921-27)等基本框架的形成John von Neumann and Oskar Morgenstern (1944) Theory of Games and Economic Behavior2博弈论合作博弈与非合作博弈合作博弈:参与者之间可以达成一个可信的联盟,大家选择一个联合战略。非合作博弈:参与者之间不能达成可信的联盟,各自根据自身效用最大化来行动。3博弈论例:古诺竞争合作解:合谋均衡非合作竞争解:古诺均衡4博弈论非合作博弈理

2、论的发展Nash(1950):纳什均衡Selton(1960):子博弈精练均衡动态博弈与不可信威胁Harsanyi(1967-68):贝叶斯纳什均衡 不完全信息与信念的形成1994年若贝尔经济学奖5博弈论非合作博弈分类完全信息不完全信息静态(同时行动)完全信息静态博弈不完全信息静态博弈动态(序贯行动)完全信息动态博弈不完全信息动态博弈信息时间6纳什均衡博弈的表述(博弈结构)参与者:有谁参与?行动顺序:按什么顺序行动?战略集:当i行动时可以选择哪些行动?信息集:当i行动时知道什么?支付函数:给定每个人的选择后,每个参与者能够得到什么?7纳什均衡标准式博弈完全信息静态博弈单个要素:参与者、纯战略集

3、 、支付函数。支付矩阵(-1,-1)(-9,0)(0,-9)(-6,-6)囚徒困境沉默招认招认沉默囚徒1囚徒28纳什均衡如何预测博弈的结果?9纳什均衡占优战略(Dominant Strategy)战略 是参与者i的占优战略,如果对于任意其他可行的战略 ,对于其他参与者的每一个战略组合,i选择 的收益都不小于选择 的收益。理性的参与者一定会选择占优战略10纳什均衡占优战略(-1,-1)(-9,0)(0,-9)(-6,-6)囚徒困境沉默招认招认沉默囚徒1囚徒2(招认,招认)11纳什均衡不存在占优战略:性别博弈12纳什均衡纳什均衡逻辑:从参与者的资源选择理论到处他们的最优战略。均衡的性质:每个参与者

4、选择的战略一定是针对其他参与者战略选择的最优反应。具有战略稳定性,即,没有一个参与者愿意独自偏离他所选择的战略。13纳什均衡纳什均衡(定义)战略组合 是一个纳什均衡,如果,对于每一个参与者都有:14纳什均衡纳什均衡(-1,-1)(-9,0)(0,-9)(-6,-6)囚徒困境沉默招认招认沉默囚徒1囚徒2(招认,招认)15纳什均衡基本假设参与者都知道博弈结构,而且知道其他参与者也都知道博弈结构参与者都知道其他参与者是理性的,知道别人知道自己是理性的16纳什均衡共同知识(Common Knowledge)我们说知识M是共同知识,如果每个参与者知道M,参与者知道“每个参与者知道M”,17纳什均衡私人信

5、息:在博弈结构中或在博弈开始前,参与者i的私人信息是指他知道,但不是所有参与者的共同知识。完全信息:没有私人信息的博弈结构不完全信息:存在私人信息的博弈结构18纳什均衡例:古诺竞争成本信息19纳什均衡信息:决策相关信息支付相关信息不完全信息:有些参与者不知道其他参与者的支付函数20纳什均衡纳什均衡:均衡的多重性均衡的选择问题习惯、社会习俗等性别博弈21纳什均衡纳什均衡:均无穷个纳什均衡分饼博弈:有一单位财富在两个人之间分配,两人同时提出自己的份额si 如果s1+s21,那么两个人都一无所获。22纳什均衡纳什均衡:不存在纯战略纳什均衡(-1,1)(1,-1)(1,-1)(-1,1)正面背面正面背

6、面猜硬币23纳什均衡混合战略参与者i的一个混合战略是指在其纯战略空间 中的一个概率分布。确定选采取某一个纯战略的概率。混合战略:纯战略空间:24纳什均衡纳什均衡:混合战略(-1,1)(1,-1)(1,-1)(-1,1)正面(z)背面(f)正面(z)背面(f)猜硬币参与者 i 选择正面的概率为P参与者 j 选择正面的概率为q参与者1参与者2参与者1的期望收益:25纳什均衡纳什均衡混合战略最优反应函数:26纳什均衡混合战略猜硬币27纳什均衡练习2:监督博弈:求解纳什均衡W=10, g=5, h=3, v=1528完全信息动态博弈例:敲诈博弈博弈分两步:1、参与者1选择支付1000¥给参与者2,好事

7、一分不给。 2、参与者2在看到1的选择后,选择是否引爆手雷把两人一块炸死。参与者2的威胁:不给就引爆是否可信?29完全信息动态博弈例:敲诈博弈参与者1的战略空间:给,不给参与者2的战略空间:(R,R),(R,L),(L,R),(L,L)R:不拉;L:拉30完全信息动态博弈扩展式博弈博弈树1、结点:决策结 终点结2、枝:可行行动3、信息集31完全信息动态博弈敲诈博弈:完美信息:后动者能够观察到先动者的行为32完全信息动态博弈囚徒困境不完美信息:不能观察到他人的行为33完全信息动态博弈逆向推理1、求最后决策者在给定结点上 的最优选择2、给定最后决策者的选择,分析最后第二格决策者的最优选择最后由初始

8、结点上的决策者决定最终结果34完全信息动态博弈子博弈精练均衡(非正式定义)由逆向推理得到的均衡解为子博弈精练均衡不包含不可置信威胁的纳什均衡35完全信息动态博弈子博弈精练均衡36完全信息动态博弈例:序贯谈判I:最后通牒博弈1、先由提议者提议其中一种分配方案2、回应者看到提议后,决定是否接受 该提议,如果接受则岸提议方案分配, 如果拒绝,双方都得到0。双方通过谈判决定10单位财富的分配37重复博弈重复博弈将“阶段博弈”重复进行一个“阶段博弈 ”构成一个完整的博弈结构阶段博弈完成后得到相应的支付。38重复博弈重复博弈考虑“未来行动的威胁或承诺能否影响当前行动?”关键在于未来行动的威胁或承诺是否可信如:价格战威胁、合谋承诺39重复博弈重复两次的囚徒困境以什么来支持或激励对方合作?逆向推理:第二期合作是否可能?40重复博弈有限次重复博弈如果阶段博弈 有唯一的纳什均衡,那么对于有限次重复博弈 由唯一的子博弈精练均衡:即将阶段博弈的纳什均衡在每阶段重复进行。41重复博弈在充重复博弈中实现合作的可能性无限重复阶段博弈存在多重均衡42重复博弈无限重复博弈冷酷战略:只要对方不背叛就选择合作,如果对方背叛,那么在随后各期博弈中将永远选择背叛。背叛支付给定参与者1采取冷酷战略,参与者2:合作的支付:只要参与者2的贴现因子: ,那么参与者2就有激励合作。43重复博弈无名氏定理(Friedman,197

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论