经济博弈论第五讲_第1页
经济博弈论第五讲_第2页
经济博弈论第五讲_第3页
经济博弈论第五讲_第4页
经济博弈论第五讲_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五讲第五讲混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡5.1 严格竞争博弈和混合策略的引进严格竞争博弈和混合策略的引进没有纳什均衡策略组合,无法用前述纳什均衡概念分析的博弈问题:没有纳什均衡策略组合,无法用前述纳什均衡概念分析的博弈问题:-1, 11, -11, -1-1, 1正 面反 面猜硬币方猜硬币方盖盖硬硬币币方方正 面反 面取胜关键:不能让另一方猜到自己的策略不能让另一方猜到自己的策略 尽可能猜出对方策略尽可能猜出对方策略各博弈方必须保证自身策略选择的随机性;各博弈方必须保证自身策略选择的随机性; 重视各个策略的概率分布重视各个策略的概率分布盖硬币方n避免自己的选择带有规律性

2、避免自己的选择带有规律性n如果你选择出正面的概率为如果你选择出正面的概率为p,则出反面的概率就,则出反面的概率就是是1-p,出正面多于出反面,意思味着,出正面多于出反面,意思味着p1/2,对方如果全猜正面,则他的期望利益为:对方如果全猜正面,则他的期望利益为:p*1+(1-P)*(-1)=2p-10n最可靠的方法是以相同的概率随机出正面和反面最可靠的方法是以相同的概率随机出正面和反面即取即取p=1/2n很显然,双方都以很显然,双方都以1/2的概率随机选择正面、反的概率随机选择正面、反面时,双方都面时,双方都无法无法根据对方的选择方式,根据对方的选择方式,调整调整自自己的策略或选择方式己的策略或

3、选择方式获得利益获得利益。n双方可选策略随机选择概率达到了稳定(双方可选策略随机选择概率达到了稳定(均衡均衡)混合策略:混合策略: 博弈方以博弈方以一定的概率一定的概率分布在可选策略中分布在可选策略中随机选择随机选择的的决策方式。决策方式。n在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 n纯策略也可以看成混合策略,纳什均衡策略组合中的策略纯策略也可以看成混合策略,纳什均衡策略组合中的策略选择概率为选择概率为1,其他策略的选择概率为,其他策略的选择概率为0。n在混合策略的意义上定义纳什均衡:任何博弈方在

4、混合策略的意义上定义纳什均衡:任何博弈方单独改变单独改变自己的策略自己的策略或者或者随机选择各个纯策略的概率分布随机选择各个纯策略的概率分布,都不能都不能给自己给自己增加增加任何利益。任何利益。 ,;,11nnuuSSGi,1ikiissSki),(1ikiippp10ijpkj, 111ikipp2, 35, 23, 11, 5CDAB博弈方2博弈方15213BABApppp1352DCDCpppp博弈方1的混合策略博弈方2的混合策略n 策略 得益n博弈方1 (0.8,0.2) 2.6n博弈方2 (0.8,0.2) 2.6不存在纯策略均衡。不存在纯策略均衡。决策时利用随机性;决策时利用随机性

5、;选择每种策略的概率要恰好使对方无机可乘。选择每种策略的概率要恰好使对方无机可乘。确定性选择的策略称确定性选择的策略称“纯策略纯策略”双方都以双方都以1/6的相同概率随机选择各自的六个纯策略,构的相同概率随机选择各自的六个纯策略,构成本博弈的唯一的成本博弈的唯一的混合策略纳什均衡混合策略纳什均衡。齐威王的期望得益齐威王的期望得益?田忌的期望得益田忌的期望得益?田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,

6、-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田忌田忌 齐齐威威王王得益矩阵1994年经济学诺贝尔奖得主之一的塞尔顿教授。不存在纯策略纳什均衡。守卫睡策略的期望得益为:S(1-pt)+(-D)pt小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对守卫的处罚:短期效果是使守卫更尽职但长期中并不是使守卫更尽职,而是会降低盗窃发生的概率0- D- D守卫得益(睡)SPt 小偷偷的概率1p*p*小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对小偷的处罚:短期内

7、能抑制盗窃发生率长期并不能降低盗窃发生率,但会使得守卫更多的偷懒当然,把守卫可以更轻松挣钱看成增加社会福利或理解成少派守卫,那么加重对小偷的惩罚还是有意义的。0- P- P小偷得益(偷)VPg 守卫睡的概率15.2 多重均衡博弈和混合策略n夫妻之争的混合策略纳什均衡2, 10, 00, 01, 3歌剧足 球歌剧足球丈丈 夫夫妻妻子子夫妻之争夫妻之争3)(0)(0)(1)(FpCpFpCpwwww1)(0)(0)(2)(FpCpFpCphhhh妻子的混合策略丈夫的混合策略 策略 期望得益博弈方1 (0.75,0.25) 0.67博弈方2 (1/3,2/3) 0.75结果明显不如双方交流协商:任何

8、一方至少得1在经济活动中有许多与夫妻之争相似的博弈问题。在经济活动中有许多与夫妻之争相似的博弈问题。电器往往有不同的原理或相关技术标准(制式),如果厂电器往往有不同的原理或相关技术标准(制式),如果厂商采用相同制式,对于推广各自的产品很有帮助。设有两商采用相同制式,对于推广各自的产品很有帮助。设有两个厂商同时计划收进生产线,有个厂商同时计划收进生产线,有A、B两种不同制式。两种不同制式。制式问题1, 30, 00, 02, 2ABAB厂商厂商2厂厂商商1制式问题制式问题 A B 得益厂商1: 0.4 0.6 0.664厂商2: 0.67 0.33 1.296两个纯策略均衡(两个纯策略均衡(A,

9、A)、()、(B,B),厂商),厂商1更喜欢后一个,更喜欢后一个,而厂商而厂商2更喜欢前一个,如果更喜欢前一个,如果不协商不协商,混合策略纳什均衡,混合策略纳什均衡结果结果是不理想是不理想的。在引进技术、投资、开发产品等问题上,不同的。在引进技术、投资、开发产品等问题上,不同厂商厂商各自为政的行为常常导致低效率各自为政的行为常常导致低效率。市场机会博弈-50,-50100,00,1000,0进不 进进不进厂商厂商2厂厂商商1市场机会市场机会 进 不进 得益厂商1: 2/3 1/3 0厂商2: 2/3 1/3 05.3 混合策略和严格下策反复消去法混合策略和严格下策反复消去法n在包括混合策略的情

10、况下,关于严格下策反复在包括混合策略的情况下,关于严格下策反复消去法的结论仍然成立。消去法的结论仍然成立。n任何博弈方都不会采用任何严格下策;严格下任何博弈方都不会采用任何严格下策;严格下策反复消去法不会消去任何纳什均衡;如果经策反复消去法不会消去任何纳什均衡;如果经过反复消去后留下的策略组合是唯一的,那么过反复消去后留下的策略组合是唯一的,那么一定是纳什均衡。一定是纳什均衡。n不论是纯策略还是混合策略不论是纯策略还是混合策略不管博弈方不管博弈方2采用哪种策略,包括所有可能的纯策略和所采用哪种策略,包括所有可能的纯策略和所有的混合策略,博弈方有的混合策略,博弈方1混合策略混合策略(1/2,1/

11、2,0)的期望利益的期望利益始终为始终为3/2,都大于采用,都大于采用D策略时能得到的确定性收益策略时能得到的确定性收益1 3, 10, 20, 23, 31, 31, 1LRUMD博弈方博弈方2博博弈弈方方123212111003eu23212111030eu博弈方2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用纯策略R时,博弈方1采用混合策略(1/2,1/2,0)的得益即使博弈方2采用混合策略(q,1-q),博弈方1采用上述混合策略的利益还是:232121212113)1 (00)1 (3qqqquen消去D策略后的得益矩阵n此时,L策是博弈方2的相对于R的严格下策,也可以将它从博弈方2的策略空间中消去。n纳什均衡为(M,R)3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论