博弈论之策略型博弈与Nash均衡_第1页
博弈论之策略型博弈与Nash均衡_第2页
博弈论之策略型博弈与Nash均衡_第3页
博弈论之策略型博弈与Nash均衡_第4页
博弈论之策略型博弈与Nash均衡_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论

TheGameTheory上海财经大学金融学院韩其恒参考书籍施锡铨(2002),博弈论。上海财经大学出版社。张维迎(1996),博弈论与信息经济学。上海人民出版社,上海三联书店,[美]朱•弗登博格,[法]让•梯若尔(2003),博弈论。中国人民大学出版社陈学彬(1999),宏观金融博弈分析。上海财经大学出版社。经济学家梯若尔(JeanTirole):“正如理性预期使宏观经济学发生革命一样,博弈论广泛而深远的改变了经济学家的思维方式。”如果情况确实如此,对今天的经济学家来说,不懂得博弈论显然是不行了。值得人们尊敬的人在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。约翰·纳什,1928年生于美国

1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。约翰·海萨尼,1920年生于美国1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。莱因哈德·泽尔腾,1930年生于德国1994年Nobel经济学奖得主背景冯·诺依曼(VonNeumann),摩根斯坦恩(Morgenstern)(1944),博弈论和经济行为(TheTheoryofGamesandEconomicBehavior)。标志着博弈理论的初步形成Nash(1950,1951)两篇关于非合作博弈的重要文章,在非常一般的意义下。定义了非合作博弈及其均衡解,并证明了均衡解的存在。基本上奠定了现代非合作博弈论的基石。

第一章导论

1.什么是博弈论定义:关于包含相互依存情况中理性行为的研究。目的:决策,合理的预测思想:有限性,东方性妻子

BF

B丈夫F1,20,00,02,1性别战(battleofsexes)腐败问题的博弈分析政府监督不监督

受贿官员

不受贿R-F,F-C-SR,-S0,-C0,0贸易自由化的博弈分析乙国自由化保护

自由化甲国

保护10,10-10,2020,-10-5,-5大户与散户的博弈模型散户分析并进入跟随大户进入

分析并进入大户

跟随散户进入0.7p-c,0.3p-c0.7p-c,0.3p0.7p,0.3p-c0,0国有股减持投资者支持不支持

减持国有股东

不减持5,-6-8,-2-3,-1-5,0机构投资者之间的博弈分析机构乙合作不合作

合作机构甲

不合作0.5,0.5双方获利均为溢价的一半0,1乙获全部溢价1,0甲获全部溢价0,0双方获利均为零货币政策目标的博弈分析企业增加投资不增加投资

增加货币供给中央银行

不增加货币供给0,2通货膨胀率10%经济增长率5%2,1通货膨胀率0%经济增长率10%-1,0通货膨胀率10%经济增长率0%1,3通货膨胀率0%经济增长率5%上市公司虚假信息披露行为的博弈分析发现(θ)F-C+E,-F-D-C,0未发现(1-θ)-C,E-D0,E-D0,0证券监管机构上市公司造假不造假检查不检查E:造假行为对上市公司的额外收益;F:监管机构发现公司造假后的惩罚;C:监管机构的检查成本;D:上市公司造假的成本;θ:监管机构成功查实公司造假行为之概率。2.博弈要素局中人策略 纯策略空间Si={Si1,Si2,…,Siki}盈利(支付)函数(payofffunction):Ui(s)3.博弈的分类从信息的角度:完全信息、不完全信息从局中人行动的先后次序:静态博弈、动态博弈完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈第一部分完全信息静态博弈第二章策略型博弈与Nash均衡1.博弈的正则型两人零和游戏(猜谜游戏)局中人212

局中人11,-1-1,1-1,11,-112定义:n人博弈正则型(或策略型)表示指定了n个局中人的纯策略空间,以及对应每个策略组合的盈利函数U1,U2,…,Un,可将该博弈表示为:G={S1,S2,…,Sn;U1,U2,…,Un}2.混合策略猜谜游戏无纯策略解设甲的策略为(p,1-p) 乙的策略为(q,1-q)对于甲来说,如果乙伸一个指头,期望盈利为:p+(-1)(1-p)=2p-1≥0p≥0.5 如果乙伸两个指头,期望盈利为:-p+(1-p)=-2p+1≥0p≤0.5因此理想的混合策略是:(0.5,0.5)1,-1-1,1-1,11,-1定义:局中人i(i=1,2,…,n)中的一个混合策略是该局中人的纯策略空间Si=(si1,si2,…,siki)上的一个概率分布,可用σi来表示。所有n个局中人各自的混合策略σ1,σ2,…,

σn是独立的。n个混合策略构成的σ={

σ1,σ2,…,

σn}是一个策略组合(策略剖面,profile)。σi(sij)表示第i个局中人混合策略σi在纯策略sij上的概率,因此局中人i在混合策略σ上的期望盈利为:算例局中人2

LMRU局中人1MD4,35,16,22,18,43,63,09,62,8局中人1的混合策略:σ1=(σ1(U),σ1(M),σ1(D)=(1/3,1/3,1/3)局中人2的混合策略:σ2=(σ2(U),σ2(M),σ2(D)=(0,1/2,1/2)策略组合:σ=(σ1,σ2)4,35,16,22,18,43,63,09,62,8局中人1策略组合σ的期望盈利为:U1(σ)=4*1/3*0+5*1/3*1/2+6*1/3*1/2+2*1/3*0+8*1/3*1/2+3*1/3*1/2+3*1/2*0+9*1/3*1/2+2*1/3*1/2

=11/2局中人1的混合策略:σ1=(σ1(U),σ1(M),σ1(D)=(1/3,1/3,1/3)局中人2的混合策略:σ2=(σ2(U),σ2(M),σ2(D)=(0,1/2,1/2)策略组合:σ=(σ1,σ2)4,35,16,22,18,43,63,09,62,8局中人2策略组合σ的期望盈利为:U2(σ)=3*1/3*0+1*1/3*1/2+2*1/3*1/2+1*1/3*0+4*1/3*1/2+6*1/3*1/2+0*1/2*0+6*1/3*1/2+8*1/3*1/2

=9/23.累次严优(iterateddominance)隐含着Nash均衡的思想局中人2

LMRU局中人1MD4,35,16,22,18,43,63,09,62,8

局中人2

LMR4562833923121460684,35,16,22,18,43,63,09,62,8局中人1

局中人2

LRU局中人1MD

局中人2

LR局中人1U4,36,22,13,63,02,84,36,2312146068合理,符合逻辑的过程,得到累次严优的解为:局中人2

L局中人1U累次严优的局限性4,3严劣纯策略定义:对局中人i的某个纯策略si,如果存在混合策略σi*,使得s-iS-iUi(σi*,s-i)≥Ui(si,s-i)

且在S-i中至少存在一个纯策略组合s-i*S-i,使上式中的不等号严格成立Ui(σi*,s-I*)>Ui(si,s-I*)

则称纯策略si为局中人i的弱劣纯策略。 如果对一切s-iS-I,上式中的不等式严格的成立Ui(σi*,s-i)>Ui(si,s-i)s-iS-i

则称si为局中人i的严劣纯策略。4.累次严优的应用囚徒困境

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论