第32讲:纳什均衡(II):混合策略意义上的_第1页
第32讲:纳什均衡(II):混合策略意义上的_第2页
第32讲:纳什均衡(II):混合策略意义上的_第3页
第32讲:纳什均衡(II):混合策略意义上的_第4页
第32讲:纳什均衡(II):混合策略意义上的_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第3讲讲:纳纳什什均衡(均衡(Nash Equilibrium)混合混合策略策略意义上的分析意义上的分析1我们已经学习了如下四种博弈的基本分析思路和方法: I、严格上策均衡分析 II、严格下策反复消去法 III、划线法 IV、箭头法 其中,前两种是以策略之间的绝对优劣关系为基础,后两种是以策略之间的相对优劣关系为基础。2 前述四种纳什均衡分析方法无法对如下两类博弈的博弈方的选择和博弈结果作明确前述四种纳什均衡分析方法无法对如下两类博弈的博弈方的选择和博弈结果作明确的预测,也就无法给博弈方提供明确的建议:的预测,也就无法给博弈方提供明确的建议: 不存在纳什均衡的博弈,如猜硬币博弈。不存在纳什均

2、衡的博弈,如猜硬币博弈。 纳什均衡不唯一的博弈,如夫妻之争博弈。纳什均衡不唯一的博弈,如夫妻之争博弈。3 需要引入需要引入“混合策略混合策略”和和“混合策略纳什均衡混合策略纳什均衡”概念概念4混合策略混合策略 博弈博弈方以一定的概率分布在可选策略中随机选择的决策方式,在分析原来没有纳什方以一定的概率分布在可选策略中随机选择的决策方式,在分析原来没有纳什均衡的博弈时有非常重要的意义。均衡的博弈时有非常重要的意义。 在博弈论中,通常把这种策略选择方式称为在博弈论中,通常把这种策略选择方式称为“混合策略混合策略”(Mixed Strategy)。与此)。与此对应地,把博弈中原来意义上的策略称为对应地

3、,把博弈中原来意义上的策略称为“纯战略纯战略”(Pure Strategy)。)。5混合策略的较正式混合策略的较正式定义定义:6纯策略与混合策略之间的纯策略与混合策略之间的关系关系 纯策略可以看作为特殊的混合策略,即选择相应纯策略的概率为纯策略可以看作为特殊的混合策略,即选择相应纯策略的概率为1,选择其余纯策,选择其余纯策略的概率为略的概率为0的混合策略。的混合策略。 如如“猜硬币博弈猜硬币博弈”中,纯策略中,纯策略“盖正面盖正面”可以看做为(可以看做为(1,0),纯策略),纯策略“盖反面盖反面”可以看做为(可以看做为(0,1)。)。78 混合策略可以看作纯策略的扩展,即如果给一个博弈的每个博

4、弈方的纯策略空间赋混合策略可以看作纯策略的扩展,即如果给一个博弈的每个博弈方的纯策略空间赋予不同的概率分布,就形成了不同的混合策略。予不同的概率分布,就形成了不同的混合策略。9需要在混合策略的意义上定义纳什需要在混合策略的意义上定义纳什均衡均衡 博弈方的策略从博弈方的策略从“纯策略纯策略”扩展到扩展到“混合策略混合策略”。 博弈方的策略空间从博弈方的策略空间从“纯策略空间纯策略空间”扩展到扩展到“混合策略空间混合策略空间”。10混合策略意义上的纳什均衡,简称为混合策略意义上的纳什均衡,简称为“混合混合策略纳什均衡策略纳什均衡”。 纳什均衡的本质规定性是纳什均衡的本质规定性是“均衡策略组合满足各

5、博弈方的策略相互是对其他博弈方策均衡策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策略的最佳对策”。111.确定确定“混合策略纳什均衡混合策略纳什均衡”的的方法方法 期望得益最大化法;期望得益最大化法; 期望得益等值法期望得益等值法; 反应函数法。反应函数法。12 以以“猜硬币博弈猜硬币博弈”为例为例13猜硬币猜硬币博弈博弈 博弈的混合策略纳什均衡为博弈的混合策略纳什均衡为“盖硬币方盖硬币方”以以1/2的概率随机选择纯策略的概率随机选择纯策略“盖正面盖正面”,“猜硬币方猜硬币方”以以1/2的概率随机选择纯策略的概率随机选择纯策略“猜正面猜正面”。14期望得益最大化期望得益最大化法法1

6、516171819 期望得益等值法期望得益等值法20212223242526期望得益等值期望得益等值法法 博弈的混合策略纳什均衡为博弈的混合策略纳什均衡为“盖硬币方盖硬币方”以以1/2的概率随机选择纯策略的概率随机选择纯策略“盖正面盖正面”,“猜硬币方猜硬币方”以以1/2的概率随机选择纯策略的概率随机选择纯策略“猜正面猜正面”。这与利用。这与利用“期望得益最大期望得益最大化法化法”获得的结果完全一致获得的结果完全一致。27“期望得益等值法期望得益等值法”的思路的思路总结总结 令各个博弈方随机选择纯策略的概率分布,满足使对方或其他博弈方采用不同纯策令各个博弈方随机选择纯策略的概率分布,满足使对方

7、或其他博弈方采用不同纯策略的期望得益相同,从而计算出各个博弈方随机选择各纯策略的概率略的期望得益相同,从而计算出各个博弈方随机选择各纯策略的概率。28 反应函数法反应函数法29反应函数反应函数法法 将博弈方的策略空间扩展到混合策略,将纳什均衡扩展到包括混合策略纳什均衡以将博弈方的策略空间扩展到混合策略,将纳什均衡扩展到包括混合策略纳什均衡以后,求纯策略纳什均衡的反应函数法也可以扩展到求混合策略纳什均衡。后,求纯策略纳什均衡的反应函数法也可以扩展到求混合策略纳什均衡。303132333435363738混合策略反应函数法混合策略反应函数法 反应函数是一博弈方对另一博弈方每种可能的决策内容的最佳反

8、应决策组成的函反应函数是一博弈方对另一博弈方每种可能的决策内容的最佳反应决策组成的函数数 在纯策略的范畴中,反应函数是个博弈方选择的纯策略对其他博弈方纯策略的反在纯策略的范畴中,反应函数是个博弈方选择的纯策略对其他博弈方纯策略的反应应 在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是以方对另在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是以方对另一方的概率分布的反应,同样也是一定的概率分布一方的概率分布的反应,同样也是一定的概率分布39 确定确定“混合策略纳什均衡混合策略纳什均衡”的方法的方法 期望得益最大化法;期望得益最大化法; 期望得益等值法期望得益等值法; 反应函数法。反应函数法。40 2.纳什均衡的存在性纳什均衡的存在性41纳什纳什定理定理42用通俗的语言,纳什定理就是说用通俗的语言,纳什定理就是说“每一个有限博弈都每一个有限博弈都至少有一个混合策略纳什均衡至少有一个混合策略纳什均衡”该定理说明了纳什该定理说明了纳什均衡的普遍存在性,这也就意味着纳什均衡分析在我均衡的普遍存在性,这也就意味着纳什均衡分析在我们遇到的大多数博弈问题中,都是一种基本的分析方们遇到的大多数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论