混合策略纳什均衡_第1页
混合策略纳什均衡_第2页
混合策略纳什均衡_第3页
混合策略纳什均衡_第4页
混合策略纳什均衡_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

混合策略纳什均衡第1页,共35页,2023年,2月20日,星期日第二节混合策略纳什均衡的求解方法二、反应对应法例:扑克牌对色游戏(p77)无纯策略NE给定混合策略p甲=(r,1-r);p乙=(q,1-q)π甲(p甲,p乙)=2r(1-2q)+(2q-1)整理原则:一项含r,一项不含rπ乙(p甲,p乙)=

2q(2r-1)-(2r-1)整理原则:一项含q,一项不含q按照NE的条件,一个策略组合如过是一个NE,那么其中的每一个策略都是参与人针对其他参与人策略组合的最优反应,在纯策略NE中,这个“最优反应”可能是一个具体的纯策略(离散情形),也可能是一个反应函数(reactionfunction,如连续情形、古诺模型)。而在一个混合策略NE中,这个“最优反应”将是一个概率或很多个概率——被称为“反应对应”(reactioncorrespondence)第2页,共35页,2023年,2月20日,星期日第二节混合策略纳什均衡的求解方法二、反应对应法例:扑克牌对色游戏(p77)先看甲的最优反应,记为r*=R(q):观察π甲(p甲,p乙)=2r(1-2q)+(2q-1)rq01(红)1(红)1/21/2r*=R(q)反应对应曲线第3页,共35页,2023年,2月20日,星期日第二节混合策略纳什均衡的求解方法二、反应对应法例:扑克牌对色游戏(p77)再看乙的最优反应,记为q*=R(r):观察π乙(p甲,p乙)=

2q(2r-1)-(2r-1)rq01(红)1(红)1/21/2q*=R(r)反应对应曲线第4页,共35页,2023年,2月20日,星期日第二节混合策略纳什均衡的求解方法二、反应对应法例:扑克牌对色游戏(p77)作为NE,各个参与人的反应应该同时为最优,只有两个反应对应的交点满足NE:r*=1/2,q*=1/2NE支付为:π甲(p甲,p乙)=2r(1-2q)+(2q-1)=0π乙(p甲,p乙)=

2q(2r-1)-(2r-1)=0rq01(红)1(红)1/21/2q*=R(r)r*=R(q)第5页,共35页,2023年,2月20日,星期日第二节混合策略纳什均衡的求解方法二、反应对应法作业:社会福利博弈。使用反应对应法找到纳什均衡。

流浪汉寻找工作游荡救济政府

不救济3,2-1,3-1,10,0第6页,共35页,2023年,2月20日,星期日第三节寻找多重纳什均衡例:情侣博弈两个(多个)纯策略纳什均衡问题:纳什均衡找完了吗?有无混合策略纳什均衡?一、支付最大化法给定混合策略p陈明=(r,1-r);p钟信=(q,1-q)Maxπ陈明(p陈明,p钟信)=r[3q+(1-q)

]+(1-r)[0+2(1-q)]=r(4q-1)+2(1-q)Maxπ钟信(p陈明,p钟信)=q(2r+0)+(1-q)[r+3(1-r)]=q(4r-3)+(3-2r)NE:(r*,q*)=(3/4,1/4)二、反应对应法rq第7页,共35页,2023年,2月20日,星期日第三节寻找多重纳什均衡二、反应对应法:情侣博弈先看陈明的最优反应,记为r*=R(q):π陈明(p陈明,p钟信)

=r(4q-1)+2(1-q)rq01(钟信德语)1(陈明德语)1/4r*=R(q)第8页,共35页,2023年,2月20日,星期日第三节寻找多重纳什均衡二、反应对应法:情侣博弈再看钟信的最优反应,记为q*=R(r):π钟信(p陈明,p钟信)=q(4r-3)+(3-2r)rq01(钟信德语)1(陈明德语)1/4q*=R(r)3/4第9页,共35页,2023年,2月20日,星期日第三节寻找多重纳什均衡二、反应对应法:情侣博弈反应对应曲线有三个交点:三个NE:r*=0,q*=0纯策略(确定性)r*=3/4,q*=1/4混合策略(不确定性)r*=1,q*=1纯策略(确定性)rq01(钟信德语)1(陈明德语)1/43/4r*=R(q)q*=R(r)第10页,共35页,2023年,2月20日,星期日第三节寻找多重纳什均衡二、反应对应法:情侣博弈支付的帕累托优势:初步印象π陈明=r(4q-1)+2(1-q),π钟信=q(4r-3)+(3-2r)r*=0,q*=0纯策略(确定性)

双方NE支付:π陈明*=3,π钟信*=2r*=3/4,q*=1/4混合策略(不确定性)双方NE支付:π陈明*=3/2,π钟信*=3/2r*=1,q*=1纯策略(确定性)双方NE支付:π陈明*=2,π钟信*=3纯策略纳什均衡比混合策略纳什均衡具有支付优势,这称为帕累托优势如果博弈同时存在纯策略纳什均衡和混合策略纳什均衡,前者往往得到优先考虑第11页,共35页,2023年,2月20日,星期日第三节寻找多重纳什均衡二、反应对应法:情侣博弈夫妻之争博弈第12页,共35页,2023年,2月20日,星期日第四节纳什均衡的存在性不同均衡概念的关系优势均衡纯策略纳什均衡混合策略纳什均衡第13页,共35页,2023年,2月20日,星期日第四节纳什均衡的存在性问题:是否所有的博弈都存在NE(纯的或混合的)?Nash在1950年证明:任何有限博弈,都至少存在一个NE。

纳什定理:在一个由n个博弈方的G={S1,…,Sn;u1,…,un}中,如果n是有限的,且Si都是有限集,则该博弈至少存在一个纳什均衡,但可能包含混合策略Wilson(1971)证明,几乎所有有限博弈,都存在有限奇数个NE,包括纯策略NE和混合策略NE。(纯策略)纳什均衡的存在性定理(Debreu,1952;Glicksberg,1952;Fan,1952):

考虑一个n人策略式博弈,如果每个参与人的纯策略空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash均衡。第14页,共35页,2023年,2月20日,星期日第四节纳什均衡的存在性例:凹但不连续的支付函数

二人博弈:策略空间为S1=S2=(0,1)

支付函数:

反应对应:

反应对应曲线:s2s11/31/3s1=s2=无纳什均衡第15页,共35页,2023年,2月20日,星期日第四节纳什均衡的存在性问题:是否所有的博弈都存在NE(纯的或混合的)?(纯策略)纳什均衡的存在性定理(Debreu,1952;Glicksberg,1952;Fan,1952):

考虑一个n人策略式博弈,如果每个参与人的纯策略空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,支付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash均衡。(混合策略)纳什均衡的存在性定理(Glicksberg,1952):

在n人策略式博弈中,如果每个参与人的纯粹策略空间Si是欧氏空间中的非空、紧(闭而有界)的凸集,如果支付函数ui(s)为连续函数,那么博弈至少存在一个混合策略Nash均衡.第16页,共35页,2023年,2月20日,星期日第五节多重纳什均衡的筛选一个博弈可能有多个均衡,但仍然存在不稳定性——你预测出现这个纳什均衡,因而有相应选择,我却以为会出现另一个,乃有我的选择,此时的组合可能并不构成纳什均衡博弈论并没有一个一般的理论证明纳什均衡结果一定能出现如何保证纳什均衡出现?一、帕累托优势标准:按照支付大小筛选纳什均衡例:猎人博弈第17页,共35页,2023年,2月20日,星期日第五节多重纳什均衡的筛选如何保证纳什均衡出现?二、风险优势标准:风险小的NE优先假设概率,比较期望支付大小例:虚拟博弈两个纳什均衡,哪个更优?假设r=1/2,q=1/2给定q=1/2:甲采用上策略的期望支付为:9/2+0/2=4.5甲采用下策略的期望支付为:8/2+7/2=7.5给定r=1/2:乙采用左策略的期望支付为:9/2+0/2=4.5乙采用右策略的期望支付为:8/2+7/2=7.5期望支付越大,风险越小:甲采用下策略,乙采用右策略选择的纳什均衡为:(下策略,右策略)第18页,共35页,2023年,2月20日,星期日第五节多重纳什均衡的筛选如何保证纳什均衡出现?二、风险优势标准:风险小的NE优先风险偏离损失乘积比较法1.甲:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-0=42.乙:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-0=43.风险优势标准方法:偏离A的损失VS偏离B的损失1×1<4×44.结论(1)偏离B的损失更大:16(2)不偏离B选择的纳什均衡偏离损失更大者为:B,即(下策略,右策略)AB第19页,共35页,2023年,2月20日,星期日第五节多重纳什均衡的筛选如何保证纳什均衡出现?二、风险优势标准:风险小的NE优先风险偏离损失乘积比较法1.甲:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-0=42.乙:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-0=43.风险偏离损失乘积比较法:偏离A的损失VS偏离B的损失1×1<4×44.结论(1)偏离B的损失更大:16(2)不偏离B选择的纳什均衡偏离损失更大者为:B,即(下策略,右策略)AB第20页,共35页,2023年,2月20日,星期日第五节多重纳什均衡的筛选如何保证纳什均衡出现?二、风险优势标准:风险小的NE优先5.风险偏离损失乘积比较法的缺陷:例:假设M远远大于m1.甲:单独偏离均衡的损失(1)偏离A的损失:(M-m)-M/2=M/2-m(2)偏离B的损失:M-(M-m)=m2.乙:单独偏离均衡的损失(1)偏离A的损失:0-0=0(2)偏离B的损失:0-0=0如果使用风险偏离损失乘积比较法:偏离A的损失VS偏离B的损失(M/2-m)×0=m×0一种建议:甲偏离A的损失VS甲偏离B的损失M/2-m>m选择的纳什均衡为:A,即(D,L)AB第21页,共35页,2023年,2月20日,星期日第五节多重纳什均衡的筛选如何保证纳什均衡出现?二、帕累托优势标准和风险优势标准的关系如果帕累托优势标准和风险优势标准的选择冲突?例:帕累托优势标准法:选择的纳什均衡为A风险优势标准:1.甲:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-(-1000)=10042.乙:单独偏离均衡的损失(1)偏离A的损失:6-5=1(2)偏离B的损失:4-(-1000)=1004风险偏离损失乘积比较法:偏离A的损失VS偏离B的损失1×1<1004×1004选择的纳什均衡为:B怎么办?AB第22页,共35页,2023年,2月20日,星期日第五节多重纳什均衡的筛选如何保证纳什均衡出现?四、聚点均衡如果帕累托优势标准和风险优势标准都无法使用呢?在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点(focalpount)”均衡。这些信息可能与社会文化习惯、参与人过去博弈的历史等有关。(Schelling,1960)性别战:某一方的生日;社会地位提名博弈道路交通规则廉价磋商(Cheaptalk)与协调博弈尽管无法保证磋商会达成一个协议,即使达成协议也不一定会被遵守,但在一些博弈中,事前磋商确实可以使某些均衡实际上出现。例:两人同时给对方打电话第23页,共35页,2023年,2月20日,星期日第五节多重纳什均衡的筛选如何保证纳什均衡出现?四、聚点均衡廉价磋商(Cheaptalk)尽管无法保证磋商会达成一个协议,即使达成协议也不一定会被遵守,但在一些博弈中,事前磋商确实可以使某些均衡实际上出现。例:虚拟博弈中的事前告知例:两人同时给对方打电话重复博弈、学习过程与协调模式9,90,00,01,1R乙甲UDL9,90,88,07,7R乙甲UDL聚点第24页,共35页,2023年,2月20日,星期日第五节多重纳什均衡的筛选如何保证纳什均衡出现?四、聚点均衡重复博弈与协调模式假定博弈重复许多次,即使参与人最初难以协调行动,在博弈若干次后,某种特定的协调模式可能会形成,特别地,假定参与人每一轮根据其对手以前的“平均”战略来选择自己的最优战略,博弈可能收敛于一个纳什均衡。以上情况并不保证必然出现纳什均衡第25页,共35页,2023年,2月20日,星期日2023年4月12日博弈论第三章第二讲多重纳什均衡26第三节多重纳什均衡的选择标准四、相关均衡(一)案例:“地域连坐”下的产品质量博弈企业乙好产品差产品好产品企业甲差产品4,4-8,-2-2,-8-2,-2第26页,共35页,2023年,2月20日,星期日2023年4月12日博弈论第三章第二讲多重纳什均衡27第三节多重纳什均衡的选择标准四、相关均衡(二)相关均衡参与人主动设计某种形式的选择机制,形成制度安排,从而确定最终均衡“三鹿”事件出现后,河北省其他食品企业以后如何做?4,4-8,-2-2,-8-2,-2第27页,共35页,2023年,2月20日,星期日2023年4月12日博弈论第三章第二讲多重纳什均衡28第三节多重纳什均衡的选择标准五、抗共谋均衡(一)案例:抽象的选择乙左右上甲下

乙左右上甲下0,0,10-5,-5,0-5,-5,01,1,-5丙:A-2,-2,0-5,-5,0-5,-5,0-1,-1,5丙:B第28页,共35页,2023年,2月20日,星期日2023年4月12日博弈论第三章第二讲多重纳什均衡29第三节多重纳什均衡的选择标准五、抗共谋均衡(二)共谋偏离(集体偏离)均衡的激励1.如果集体偏离(上,左,A)(1)起因:甲、乙集体偏离,选(下,右,A)(2)结果:甲的支付0→1,乙的支付0→1(3)结论:甲、乙有集体偏离的动机,(上,左,A)非抗共谋均衡第29页,共35页,2023年,2月20日,星期日2023年4月12日博弈论第三章第二讲多重纳什均衡30第三节多重纳什均衡的选择标准五、抗共谋均衡(二)共谋偏离(集体偏离)均衡的激励2.如果集体偏离(下,右,B)(1)若甲、乙集体偏离,选(上,左,B)-1→-2,-1→-2(2)若甲、丙集体偏离,选(上,右,A)-1→-5,5→0(3)若乙、丙集体偏离,选(下,左,A)-1→-5,5→0(4)结论:缺乏集体偏离的激励,(下,右,B)为抗共谋均衡第30页,共35页,2023年,2月20日,星期日2023年4月12日博弈论第三章第二讲多重纳什均衡31猎鹿博弈:何为抗共谋均衡?

乙猎鹿打兔猎鹿甲打兔10,100,44,04,4第31页,共35页,2023年,2月20日,星期日多人博弈中的共谋问题防共谋均衡:如果一个博弈的米讴歌策略组合满足下列要求:1、没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图2、给定选择偏离的博弈方又再次偏离

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论