![经济博弈论第三讲混合博弈.ppt_第1页](http://file1.renrendoc.com/fileroot2/2020-1/11/e959aaa5-ccf8-47ce-ae9d-e2081d1dd736/e959aaa5-ccf8-47ce-ae9d-e2081d1dd7361.gif)
![经济博弈论第三讲混合博弈.ppt_第2页](http://file1.renrendoc.com/fileroot2/2020-1/11/e959aaa5-ccf8-47ce-ae9d-e2081d1dd736/e959aaa5-ccf8-47ce-ae9d-e2081d1dd7362.gif)
![经济博弈论第三讲混合博弈.ppt_第3页](http://file1.renrendoc.com/fileroot2/2020-1/11/e959aaa5-ccf8-47ce-ae9d-e2081d1dd736/e959aaa5-ccf8-47ce-ae9d-e2081d1dd7363.gif)
![经济博弈论第三讲混合博弈.ppt_第4页](http://file1.renrendoc.com/fileroot2/2020-1/11/e959aaa5-ccf8-47ce-ae9d-e2081d1dd736/e959aaa5-ccf8-47ce-ae9d-e2081d1dd7364.gif)
![经济博弈论第三讲混合博弈.ppt_第5页](http://file1.renrendoc.com/fileroot2/2020-1/11/e959aaa5-ccf8-47ce-ae9d-e2081d1dd736/e959aaa5-ccf8-47ce-ae9d-e2081d1dd7365.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三讲混合策略纳什均衡,我们将纳什均衡定义为一组满足所有参与人的效用最大化要求的策略组合,即( s1*, si* , , sn* )是一个纳什均衡,当且仅当(ui(si*, s-i *) ui(si, s-i *)。根据这一定义,有些博弈不存在纳什均衡的。,社会福利博弈 流浪汉 找工作 游荡 救济 3,2 -1,3 政府 不救济 -1,1 0,0,这个博弈不存在纳什均衡。给定政府救济,流浪汉的最优策略是游荡;给定流浪汉游荡,政府的最优策略是不救济;给定政府不救济,流浪汉的最优策略是找工作;给定流浪汉找工作,政府的最优战略是救济;如此等等,没有一个策略组合构成纳什均衡。,猜谜游戏(A决定,B来猜
2、;B猜中,奖励;否则,惩罚) B 正面 反面 正面 -1,1 1,-1 A 反面 1,-1 -1,1,上述两个博弈的显著特征是,每个参与人都想猜透对方的策略,而每一个参与人又都不能让对方猜透自己的策略。这样的情况出现在诸如体育比赛和战争等情况中都会出现。在这类博弈中,都不存在纳什均衡。,上述两个博弈不存在纯策略纳什均衡,但是存在下面将要定义的混合策略纳什均衡。这里的混合策略是指参与人以一定的概率选择某种策略,比如说,参与人以0.3概率选择第一种策略,以0.2的概率选择第二种策略,以0.5的概率选择第三种策略。如果一个采取混合策略,他的对手就不能准确猜出他实际上会选择的策略,但在均衡点可以知道对
3、手不同策略的概率分布。,流浪汉 找工作 游荡 救济 3,2 -1,3 政府 不救济 -1,1 0,0 设想政府以1/2的概率选择救济,1/2的概率选择不救济。对流浪汉来说,选择寻找工作的期望效用是1/22+ 1/21=1.5,选择游荡带来的期望效用为1/23+ 1/20=1.5。所以流浪者的任何一种策略(纯的或混合)都是对政府所选择的混合策略的最优反应。 如果流浪汉以0.2的概率选择找工作,以0.8的概率选择游荡,政府的任何一种策略(纯的或混合)都是对流浪汉所选择的混合策略的最优反应。每一个参与人的混合策略都是给定对方混合策略时的最佳选择,这一混合策略组合就是一个纳什均衡,混合策略的定义:在博
4、弈G=s1,s2, ,sn中,博弈方i的策略空间为Si=(si1,si2, ,sik),则博弈方以pi=(pi1,pi2, ,pik)随机选择k个可选策略称为一个混合策略。其中,0pik1,k=1,2, ,k,且pi1+pi2+pik=1 相对于这种以一定概率分布在一些策略中随机选择,原来的确定性的具体的策略称为纯策略,原来的纳什均衡也称为纯策略纳什均衡。纯策略也可看作特殊的混合策略。 我们把纳什均衡的概念也作相应的扩大:对一个策略组合,无论它是纯策略还是混合策略,只要满足各博弈方都不想单独偏离它,就称其为纳什均衡。,混合策略纳什均衡的求法,可以通过计算各方的期望得益,寻求使自己期望得益最大化
5、的最佳反应函数,求各博弈方的最佳反应函数的公共解。可以用求最佳反应函数交点的方法,也可以用解方程组得方法。还可以应用下面的原则来计算:任何博弈方的在混合策略纳什均衡中的所选策略,都必须使其他博弈方选择其任何策略的期望得益相同。即自己的选择要使对方无机可乘,不能通过有针对性的倾向是某一策略成为优势策略。再举一个例子。,例 某博弈的得益矩阵为 乙 C D A 2,3 5,2 甲 B 3,1 1,5 这个博弈没有纯策略纳什均衡。要计算混合策略纳什均衡,设甲的混合策略为(p,1-p), 则甲的选择必须使乙选C和选D的期望得益相等,即:p3+(1-p) 1=p2+(1-p) 5 解得p=0.8。即甲的混
6、合策略是(0.8,0.2),同样,设乙的混合策略为(q,1-q) ,则乙的纳什均衡策略也必须使甲无论选A还是选B的期望收益相等。即: q2+(1-q) 5=q3+(1-q) 1 解得 q=0.8 即乙的混合策略也是(0.8,0.2) 容易算出在这个混合策略纳什均衡下,甲乙各自的得益都是2.6.它的意义是说,虽然在一次博弈中,其结果只能是得益矩阵中四个得益的一种,但多次独立重复进行,平均结果是双方各得2.6.,1.制式问题 彩电有不同的制式,采用相同的制式,则不同厂商间的零部件可以通用,相关设备可以相互匹配,对大家有一定的好处,但也有互相竞争的压力和损失。设两个厂商要引进生产线,面临A、B 两个
7、制式,其得益矩阵如下: 厂商2 A B A 1,3 0,0 厂商1 B 0,0 2,2,容易看出,该博弈有两个纯策略纳什均衡: (A,A)和(B,B),但会出现哪一个均衡呢?可以看出,厂商1喜欢后一个而厂商2 喜欢前一个均衡。没有必然的结果,因此,双方的决策要进行混合策略决策。 不难算出厂商1的纳什均衡混合策略是(0.4,0.6) 厂商2的混合策略纳什均衡策略是(0.67,0.33) 在此均衡下,双方的期望得益分别为0.664 和1.926,都小于任何一个纯策略纳什均衡的得益。 由此可见,政府或行业组织制定统一的标准或规定是非常重要的。这也是世界上各国甚至国际间对许多重要产品规定统一规格、标准
8、的原因。 当然因为技术垄断等因素,也有相反的、各厂商间不统一的例证:如打印机墨盒、手机充电器等。,2.市场机会 设两个厂商都发现了一个市场机会,但市场容量不大。若只有一家进入,能赚100,若同时进入,则各亏50. 厂商2 进 不进 进 -50,-50 100, 0 厂商1 不进 0 ,100 0 , 0,0 本博弈也有两个纯策略纳什均衡(不进,进),(进,不进)但它们分别有利于两个厂商,因此这两个均衡都不容易实现,都应采取混合策略。 请同学们自己计算混合策略纳什均衡及得益。,在包括混合策略的情况下,严格劣策略消去法有时仍然使用。因为严格劣策略消去法不会消去任何纳什均衡。如下面的例子: 乙 A B C 3,1 0,2 甲 D 0,2 3,3,甲、乙的策略没有好坏之分。但若甲以混合策略(0.5,0.5,0)选择C、D、E,则博弈方乙选择纯策略A时,甲期望得益 0.53+0.50+01=1.5 乙选择纯策略B时,甲期望得益 0.50+0.53+01=1.5 乙选择混合策略(q,1-q) 时,甲期望得益 0.5q3+0.5(1-q) 0+0.5q0 +0.5(1-q)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年全球及中国可吸收三氯生涂层抗菌缝合线行业头部企业市场占有率及排名调研报告
- 2025年全球及中国超宽带雷达传感器行业头部企业市场占有率及排名调研报告
- 2025-2030全球阻燃聚乙烯膜行业调研及趋势分析报告
- 饭店房屋租赁合同范文
- 建筑工程挂靠内部协议合同
- 2025佳兆业集团年度低压柜设备战略采购合同
- 虚拟股合伙协议合同范本
- 2025工程建设招标设标合同条件第1部分
- 直播带货商家签约的合同范本
- 2025房地产委托开发合同酬金
- 青少年铸牢中华民族共同体意识路径研究
- 江苏省南京市2024年中考英语试题(含解析)
- 学校农业教育体验项目方案
- 水利工程施工监理规范(SL288-2014)用表填表说明及示例
- 独家投放充电宝协议书范文范本
- 财税实操-反向开票的方式解读
- TwinCAT CNC实现对G代码.NC文件的加密与解密
- 《联合国教科文:学生人工智能能力框架》-中文版
- 2023年部编人教版六年级道德与法治下册全册课件【完整版】
- 2024-2030年中国二手医疗器械行业市场发展趋势与前景展望战略分析报告
- 世界近代史-对接选择性必修 课件-高考统编版历史一轮复习
评论
0/150
提交评论