博弈论之策略型博弈与Nash均衡课件_第1页
博弈论之策略型博弈与Nash均衡课件_第2页
博弈论之策略型博弈与Nash均衡课件_第3页
博弈论之策略型博弈与Nash均衡课件_第4页
博弈论之策略型博弈与Nash均衡课件_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论

TheGameTheory上海财经大学金融学院韩其恒hqheng@博弈论

TheGameTheory上海财经大学金融学院1参考书籍施锡铨(2002),博弈论。上海财经大学出版社。张维迎(1996),博弈论与信息经济学。上海人民出版社,上海三联书店,[美]朱•弗登博格,[法]让•梯若尔(2003),博弈论。中国人民大学出版社陈学彬(1999),宏观金融博弈分析。上海财经大学出版社。参考书籍施锡铨(2002),博弈论。上海财经大学出版社。2经济学家梯若尔(JeanTirole):“正如理性预期使宏观经济学发生革命一样,博弈论广泛而深远的改变了经济学家的思维方式。”如果情况确实如此,对今天的经济学家来说,不懂得博弈论显然是不行了。经济学家梯若尔(JeanTirole):“正如理性预期使3值得人们尊敬的人博弈论之策略型博弈与Nash均衡4在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。约翰·纳什,1928年生于美国

1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和5在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。约翰·海萨尼,1920年生于美国1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和6在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。莱因哈德·泽尔腾,1930年生于德国1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和7背景冯·诺依曼(VonNeumann),摩根斯坦恩(Morgenstern)(1944),博弈论和经济行为(TheTheoryofGamesandEconomicBehavior)。标志着博弈理论的初步形成Nash(1950,1951)两篇关于非合作博弈的重要文章,在非常一般的意义下。定义了非合作博弈及其均衡解,并证明了均衡解的存在。基本上奠定了现代非合作博弈论的基石。背景冯·诺依曼(VonNeumann),摩根斯坦恩(Mor8

第一章导论

1.什么是博弈论定义:关于包含相互依存情况中理性行为的研究。目的:决策,合理的预测思想:有限性,东方性

第一章导论

1.什么是博弈论9妻子

BF

B丈夫F1,20,00,02,1性别战(battleofsexes)

10腐败问题的博弈分析政府监督不监督

受贿官员

不受贿R-F,F-C-SR,-S0,-C0,0腐败问题的博弈分析11贸易自由化的博弈分析乙国自由化保护

自由化甲国

保护10,10-10,2020,-10-5,-5贸易自由化的博弈分析12大户与散户的博弈模型散户分析并进入跟随大户进入

分析并进入大户

跟随散户进入0.7p-c,0.3p-c0.7p-c,0.3p0.7p,0.3p-c0,0大户与散户的博弈模型13国有股减持投资者支持不支持

减持国有股东

不减持5,-6-8,-2-3,-1-5,0国有股减持14机构投资者之间的博弈分析机构乙合作不合作

合作机构甲

不合作0.5,0.5双方获利均为溢价的一半0,1乙获全部溢价1,0甲获全部溢价0,0双方获利均为零机构投资者之间的博弈分析15货币政策目标的博弈分析企业增加投资不增加投资

增加货币供给中央银行

不增加货币供给0,2通货膨胀率10%经济增长率5%2,1通货膨胀率0%经济增长率10%-1,0通货膨胀率10%经济增长率0%1,3通货膨胀率0%经济增长率5%货币政策目标的博弈分析16上市公司虚假信息披露行为的博弈分析发现(θ)F-C+E,-F-D-C,0未发现(1-θ)-C,E-D0,E-D0,0证券监管机构上市公司造假不造假检查不检查E:造假行为对上市公司的额外收益;F:监管机构发现公司造假后的惩罚;C:监管机构的检查成本;D:上市公司造假的成本;θ:监管机构成功查实公司造假行为之概率。上市公司虚假信息披露行为的博弈分析发现(θ)F-C+E,-172.博弈要素局中人策略 纯策略空间Si={Si1,Si2,…,Siki}盈利(支付)函数(payofffunction):Ui(s)2.博弈要素局中人183.博弈的分类从信息的角度:完全信息、不完全信息从局中人行动的先后次序:静态博弈、动态博弈完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈3.博弈的分类从信息的角度:完全信息、不完全信息19第一部分完全信息静态博弈第二章策略型博弈与Nash均衡第一部分完全信息静态博弈第二章策略型博弈与Nash均201.博弈的正则型两人零和游戏(猜谜游戏)局中人212

局中人11,-1-1,1-1,11,-1121.博弈的正则型两人零和游戏(猜谜游戏)1,-1-1,1-21定义:n人博弈正则型(或策略型)表示指定了n个局中人的纯策略空间,以及对应每个策略组合的盈利函数U1,U2,…,Un,可将该博弈表示为:G={S1,S2,…,Sn;U1,U2,…,Un}定义:n人博弈正则型(或策略型)表示指定了n个局中人的纯策略222.混合策略猜谜游戏无纯策略解设甲的策略为(p,1-p) 乙的策略为(q,1-q)对于甲来说,如果乙伸一个指头,期望盈利为:p+(-1)(1-p)=2p-1≥0p≥0.5 如果乙伸两个指头,期望盈利为:-p+(1-p)=-2p+1≥0p≤0.5因此理想的混合策略是:(0.5,0.5)1,-1-1,1-1,11,-12.混合策略猜谜游戏无纯策略解1,-1-1,1-1,1123定义:局中人i(i=1,2,…,n)中的一个混合策略是该局中人的纯策略空间Si=(si1,si2,…,siki)上的一个概率分布,可用σi来表示。所有n个局中人各自的混合策略σ1,σ2,…,

σn是独立的。n个混合策略构成的σ={

σ1,σ2,…,

σn}是一个策略组合(策略剖面,profile)。定义:局中人i(i=1,2,…,n)中的一个混合策略是该局中24σi(sij)表示第i个局中人混合策略σi在纯策略sij上的概率,因此局中人i在混合策略σ上的期望盈利为:σi(sij)表示第i个局中人混合策略σi在纯策略sij25算例局中人2

LMRU局中人1MD4,35,16,22,18,43,63,09,62,8算例26局中人1的混合策略:σ1=(σ1(U),σ1(M),σ1(D)=(1/3,1/3,1/3)局中人2的混合策略:σ2=(σ2(U),σ2(M),σ2(D)=(0,1/2,1/2)策略组合:σ=(σ1,σ2)4,35,16,22,18,43,63,09,62,8局中人1策略组合σ的期望盈利为:U1(σ)=4*1/3*0+5*1/3*1/2+6*1/3*1/2+2*1/3*0+8*1/3*1/2+3*1/3*1/2+3*1/2*0+9*1/3*1/2+2*1/3*1/2=11/2局中人1的混合策略:4,35,16,22,18,43,63,27局中人1的混合策略:σ1=(σ1(U),σ1(M),σ1(D)=(1/3,1/3,1/3)局中人2的混合策略:σ2=(σ2(U),σ2(M),σ2(D)=(0,1/2,1/2)策略组合:σ=(σ1,σ2)4,35,16,22,18,43,63,09,62,8局中人2策略组合σ的期望盈利为:U2(σ)=3*1/3*0+1*1/3*1/2+2*1/3*1/2+1*1/3*0+4*1/3*1/2+6*1/3*1/2+0*1/2*0+6*1/3*1/2+8*1/3*1/2=9/2局中人1的混合策略:4,35,16,22,18,43,63,283.累次严优(iterateddominance)隐含着Nash均衡的思想局中人2

LMRU局中人1MD4,35,16,22,18,43,63,09,62,83.累次严优(iterateddominance)隐含29

局中人2

LMR4562833923121460684,35,16,22,18,43,63,09,62,8局中人1

30

局中人2

LRU局中人1MD

局中人2

LR局中人1U4,36,22,13,63,02,84,36,2312146068局中31合理,符合逻辑的过程,得到累次严优的解为:局中人2

L局中人1U累次严优的局限性4,3合理,符合逻辑的过程,得到累次严优的解为:4,332严劣纯策略定义:对局中人i的某个纯策略si,如果存在混合策略σi*,使得s-iS-iUi(σi*,s-i)≥Ui(si,s-i)

且在S-i中至少存在一个纯策略组合s-i*S-i,使上式中的不等号严格成立Ui(σi*,s-I*)>Ui(si,s-I*)

则称纯策略si为局中人i的弱劣纯策略。 如果对一切s-iS-I,上式中的不等式严格的成立Ui(σi*,s-i)>Ui(si,s-i)s-iS-i

则称si为局中人i的严劣纯策略。严劣纯策略定义:对局中人i的某个纯策略si,如果存在混合策334.累次严优的应用囚徒困境乙坦白抗拒坦白甲抗拒-8,-80,-15-15,0-1,-14.累次严优的应用囚徒困境-8,-80,-15-15,034虽然(坦白,坦白)是累次严优的解,但不是有效解。定义:如果不存在其他的结局,使得某些局中人的效用(盈利)比在这个结果的效用好,同时又不会使其他局中人的效用变的更差,则称博弈的这个结局是有效的。(抗拒,抗拒)是有效的,但不是博弈的解。个体理性并非一定导致集体理性。虽然(坦白,坦白)是累次严优的解,但不是有效解。35博弈论

TheGameTheory上海财经大学金融学院韩其恒hqheng@博弈论

TheGameTheory上海财经大学金融学院36参考书籍施锡铨(2002),博弈论。上海财经大学出版社。张维迎(1996),博弈论与信息经济学。上海人民出版社,上海三联书店,[美]朱•弗登博格,[法]让•梯若尔(2003),博弈论。中国人民大学出版社陈学彬(1999),宏观金融博弈分析。上海财经大学出版社。参考书籍施锡铨(2002),博弈论。上海财经大学出版社。37经济学家梯若尔(JeanTirole):“正如理性预期使宏观经济学发生革命一样,博弈论广泛而深远的改变了经济学家的思维方式。”如果情况确实如此,对今天的经济学家来说,不懂得博弈论显然是不行了。经济学家梯若尔(JeanTirole):“正如理性预期使38值得人们尊敬的人博弈论之策略型博弈与Nash均衡39在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。约翰·纳什,1928年生于美国

1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和40在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。约翰·海萨尼,1920年生于美国1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和41在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。莱因哈德·泽尔腾,1930年生于德国1994年Nobel经济学奖得主在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和42背景冯·诺依曼(VonNeumann),摩根斯坦恩(Morgenstern)(1944),博弈论和经济行为(TheTheoryofGamesandEconomicBehavior)。标志着博弈理论的初步形成Nash(1950,1951)两篇关于非合作博弈的重要文章,在非常一般的意义下。定义了非合作博弈及其均衡解,并证明了均衡解的存在。基本上奠定了现代非合作博弈论的基石。背景冯·诺依曼(VonNeumann),摩根斯坦恩(Mor43

第一章导论

1.什么是博弈论定义:关于包含相互依存情况中理性行为的研究。目的:决策,合理的预测思想:有限性,东方性

第一章导论

1.什么是博弈论44妻子

BF

B丈夫F1,20,00,02,1性别战(battleofsexes)

45腐败问题的博弈分析政府监督不监督

受贿官员

不受贿R-F,F-C-SR,-S0,-C0,0腐败问题的博弈分析46贸易自由化的博弈分析乙国自由化保护

自由化甲国

保护10,10-10,2020,-10-5,-5贸易自由化的博弈分析47大户与散户的博弈模型散户分析并进入跟随大户进入

分析并进入大户

跟随散户进入0.7p-c,0.3p-c0.7p-c,0.3p0.7p,0.3p-c0,0大户与散户的博弈模型48国有股减持投资者支持不支持

减持国有股东

不减持5,-6-8,-2-3,-1-5,0国有股减持49机构投资者之间的博弈分析机构乙合作不合作

合作机构甲

不合作0.5,0.5双方获利均为溢价的一半0,1乙获全部溢价1,0甲获全部溢价0,0双方获利均为零机构投资者之间的博弈分析50货币政策目标的博弈分析企业增加投资不增加投资

增加货币供给中央银行

不增加货币供给0,2通货膨胀率10%经济增长率5%2,1通货膨胀率0%经济增长率10%-1,0通货膨胀率10%经济增长率0%1,3通货膨胀率0%经济增长率5%货币政策目标的博弈分析51上市公司虚假信息披露行为的博弈分析发现(θ)F-C+E,-F-D-C,0未发现(1-θ)-C,E-D0,E-D0,0证券监管机构上市公司造假不造假检查不检查E:造假行为对上市公司的额外收益;F:监管机构发现公司造假后的惩罚;C:监管机构的检查成本;D:上市公司造假的成本;θ:监管机构成功查实公司造假行为之概率。上市公司虚假信息披露行为的博弈分析发现(θ)F-C+E,-522.博弈要素局中人策略 纯策略空间Si={Si1,Si2,…,Siki}盈利(支付)函数(payofffunction):Ui(s)2.博弈要素局中人533.博弈的分类从信息的角度:完全信息、不完全信息从局中人行动的先后次序:静态博弈、动态博弈完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈3.博弈的分类从信息的角度:完全信息、不完全信息54第一部分完全信息静态博弈第二章策略型博弈与Nash均衡第一部分完全信息静态博弈第二章策略型博弈与Nash均551.博弈的正则型两人零和游戏(猜谜游戏)局中人212

局中人11,-1-1,1-1,11,-1121.博弈的正则型两人零和游戏(猜谜游戏)1,-1-1,1-56定义:n人博弈正则型(或策略型)表示指定了n个局中人的纯策略空间,以及对应每个策略组合的盈利函数U1,U2,…,Un,可将该博弈表示为:G={S1,S2,…,Sn;U1,U2,…,Un}定义:n人博弈正则型(或策略型)表示指定了n个局中人的纯策略572.混合策略猜谜游戏无纯策略解设甲的策略为(p,1-p) 乙的策略为(q,1-q)对于甲来说,如果乙伸一个指头,期望盈利为:p+(-1)(1-p)=2p-1≥0p≥0.5 如果乙伸两个指头,期望盈利为:-p+(1-p)=-2p+1≥0p≤0.5因此理想的混合策略是:(0.5,0.5)1,-1-1,1-1,11,-12.混合策略猜谜游戏无纯策略解1,-1-1,1-1,1158定义:局中人i(i=1,2,…,n)中的一个混合策略是该局中人的纯策略空间Si=(si1,si2,…,siki)上的一个概率分布,可用σi来表示。所有n个局中人各自的混合策略σ1,σ2,…,

σn是独立的。n个混合策略构成的σ={

σ1,σ2,…,

σn}是一个策略组合(策略剖面,profile)。定义:局中人i(i=1,2,…,n)中的一个混合策略是该局中59σi(sij)表示第i个局中人混合策略σi在纯策略sij上的概率,因此局中人i在混合策略σ上的期望盈利为:σi(sij)表示第i个局中人混合策略σi在纯策略sij60算例局中人2

LMRU局中人1MD4,35,16,22,18,43,63,09,62,8算例61局中人1的混合策略:σ1=(σ1(U),σ1(M),σ1(D)=(1/3,1/3,1/3)局中人2的混合策略:σ2=(σ2(U),σ2(M),σ2(D)=(0,1/2,1/2)策略组合:σ=(σ1,σ2)4,35,16,22,18,43,63,09,62,8局中人1策略组合σ的期望盈利为:U1(σ)=4*1/3*0+5*1/3*1/2+6*1/3*1/2+2*1/3*0+8*1/3*1/2+3*1/3*1/2+3*1/2*0+9*1/3*1/2+2*1/3*1/2=11/2局中人1的混合策略:4,35,16,22,18,43,63,62局中人1的混合策略:σ1=(σ1(U),σ1(M),σ1(D)=(1/3,1/3,1/3)局中人2的混合策略:σ2=(σ2(U),σ2(M),σ2(D)=(0,1/2,1/2)策略组合:σ=(σ1,σ2)4,35,16,22,18,43,63,09,62,8局中人2策略组合σ的期望盈利为:U2(σ)=3*1/3*0+1*1/3*1/2+2*1/3*1/2+1*1/3*0+4*1/3*1/2+6*1/3*1/2+0*1/2*0+6*1/3*1/2+8*1/3*1/2=9/2局中人1的混合策略:4,35,16,22,18,43,63,633.累次严优(iterateddominance)隐含着Nash均衡的思想局中人2

LMRU局中人1MD4,35,16,22,18,43,63,09,62,83.累次严优(iterateddominance)隐含64

局中人2

LMR45

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论