版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章完全信息的静态博弈第一节博弈模型的分析方法
一、上策均衡(1)上策:在一个博弈中,不论其他博弈方选择什么策略,某一博弈方的最优策略是唯一的,称这种策略为该博弈方的一个上策。(2)上策均衡:如果在一个博弈中的某个策略组合中的所有策略都是各个博弈方的各自的上策,称这个策略组合为该博弈的一个“上策均衡”。上策均衡的分析(1)囚徒B坦白不坦白例1:囚徒困境囚徒A坦白不坦白-5,-50,-8-8,0-1,-1上策均衡的分析(2)大猪踩不踩例2:智猪博弈小猪踩不踩1.5,3.5-0.5,65,0.50,0结论:由于不是所有的博弈都存在着这种上策均衡,因此,上策均衡的分析方法存在一定的局限性。二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变化,一个博弈方的某种策略给他带来的得益,总是比另一种策略给他带来的得益要小,那么称前一种策略为相对于后一种策略的一个“严格下策”。(2)经“反复消去”博弈方的严格下策以后,每个博弈方可选策略都缩小为一个策略。因此,每个博弈方都选择各自剩下的一个策略所组成的策略组合,是这个博弈的均衡解。严格下策反复消去法的分析(1)囚徒B坦白不坦白例1:囚徒困境囚徒A坦白不坦白-5,-50,-8-8,0-1,-1严格下策反复消去法的分析(2)大猪踩不踩例2:智猪博弈小猪踩不踩1.5,3.5-0.5,65,0.50,0严格下策反复消去法的分析(3)博弈方2左中右例2:下图中的得益矩阵表示两博弈方的一个静态博弈,试使用严格下策反复消去法进行分析。博弈方1上下1,01,30,10,40,22,0严格下策反复消去法的总结(1)先找出某一个博弈方的严格下策(假定存在),然后把这个严格下策去掉,继续这个过程,一直到只剩下一个唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解。如果剩下的策略组合不唯一,那么就不能用严格下策反复消去法去解。(2)严格下策反复消去法也不能解决所有的博弈分析问题。严格下策反复消去法的思考问题:(1)“严格下策”和“上策”之间有没有对应关系,什么情况下有对应关系?(2)使用严格下策反复消去法所得到的均衡结果,是否与消去的严格下策的次序有关。严格下策反复消去法的练习博弈方2ULR例2:下图中的得益矩阵表示两博弈方的一个静态博弈,试使用严格下策反复消去法进行分析。博弈方1UD1,01,20,10,30,12,0三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导出博弈分析的“划线法”。例:下图中的得益矩阵表示两博弈方的一个静态博弈,试使用划线法进行分析。博弈方2左中右上下博弈方11,01,30,10,40,22,0划线法的练习(1)囚徒B坦白不坦白例2:囚徒困境囚徒A坦白不坦白-5,-50,-8-8,0-1,-1划线法的联系(2)博弈方2LCR例3:下图中的得益矩阵表示两博弈方的一个静态博弈,试使用划线法进行分析;另可否用严格反复消去法分析。博弈方1UMD0,44,05,34,00,45,33,53,56,6三种分析方法的总结在一个博弈中,对于一个稳定性的策略组合,不管是否唯一,都有一个共同的特性,就是每一个博弈方的策略都是针对其他博弈方策略的最佳对策,各博弈方都不愿意改变策略的策略组合。第二节纳什均衡一、纳什均衡在博弈G=(S1,S2,…,Sn;u1,u2,…,un)中,如果某个策略组合(s1*,s2*,…,sn*)中的任一博弈方i的策略si*,都是对其余博弈方策略的最佳对策,也即:Vi,有下面式子成立:ui(s1*,s2*,…,si*,…,sn*)≥ui(s1*,s2*,…,si,…,sn*)其中,Vsi∈Si。纳什均衡的练习(1)囚徒B坦白不坦白例1:囚徒困境囚徒A坦白不坦白-5,-50,-8-8,0-1,-1纳什均衡的练习(2)大猪踩不踩例2:智猪博弈小猪踩不踩1.5,3.5-0.5,65,0.50,0纳什均衡的练习(3)猜硬币者正反例2:猜硬币的博弈盖硬币者正反-1,11,-11,-1-1,1二、有关纳什均衡的几个结论
(1)纳什均衡的一致预测性:如果所有的博弈方都预测某一个特定的纳什均衡所组成的策略组合会出现,那么,所有的博弈方都不会选择与预测结果不一致的策略。(2)每一个上策均衡都是纳什均衡,但反过来纳什均衡不一定是上策均衡。二、有关纳什均衡的几个结论
(3)在一个博弈中,如果使用严格下策反复消去法消去了除某一策略组合以外的所有策略组合,那么该策略组合一定是该博弈的唯一的纳什均衡。(4)通过划线法所求出的最佳策略组合一定是纳什均衡。有关纳什均衡的例子(1)丈夫时装足球例1:夫妻之争妻子时装足球2,10,00,01,2有关纳什均衡的例子(2)B进退例2:斗鸡博弈A进退-1,-12,11,20,0三、有关纳什均衡的应用举例
(1)古诺(Cournot,1838)的寡头模型设一市场有厂商1和厂商2生产同样的产品(产品是同质的)。如果厂商1的产量为q1,厂商2的产量为q2,则市场上的总产量为Q=q1+q2。设上述总产量全部售出的价格为P=P(Q)=8-Q。再设两厂商的生产都无固定成本,且每增加一单位产量的边际成本相等,c1=c2=2,最后强调的是两厂商同时决定他们各自的产量,也就是他们在决策时都不知道对方的产量。试确定上述博弈模型达到纳什均衡时两个厂商的各自的产量。反应函数的概念
称R1(q2):q1=R1(q2)=1/2(6-q2)为厂商1对厂商2产量的“反应函数”,它意味着对厂商2的每一个产量q2,有厂商1的最佳对策的q1,q1是厂商2产量的一个连续函数。同理,称R2(q1):q2=R2(q1)=1/2(6-q1)为厂商2对厂商1产量的“反应函数”。它意味着对厂商1的每一个产量q1,有厂商2的最佳对策的q2。古诺模型的深入分析厂商2不突破(1.5)突破(2)例:高低产量决策厂商1不突破突破4.5,4.53.75,55,3.754,4(2)伯特兰德寡头模型
已知:当厂商1和厂商2的价格分别为P1和P2时,他们各自的需求函数为:q1=a1–b1P1+d1P2
q2=a2–b2P2+d2P1假设两厂商无固定成本,其边际生产成本分别为c1和c2。试用反应函数的方法来确定纳什均衡时的价格。(3)公共资源问题
设某个村庄有三个农户,该村有一片大家都可以自由放牧羊群的公共草地。由于这片草地的面积有限,因此只能让不超过某一数量的羊吃饱,如果在这片草地上的放牧的羊只的数量超过这个数量,则每只羊都无法吃饱,从而每只羊的产出(毛,皮和肉的总价值)就会减少,甚至有些羊就会饿死。假设这些农户在夏天才到公共草地放羊,而每年的春天就要决定养羊的数量。(3)公共资源问题
再假设所有的农户都清楚这片公共草地上最多能养多少只羊,以及羊只总数不同水平下每只羊的不同产出。在这个博弈中,博弈方是3个农户,他们各自的策略空间就是他们的养羊数目qi(i=1,2,3)的取值范围,此时在公共草地上放牧羊只的总数Q=q1+q2+q3,根据上面的介绍,每只羊的产出V应是羊只的总数Q的减函数V=V(q1+q2+q3)=100-(q1+q2+q3)。假设购买和照料每只羊的成本对每个农户都是相同的不变常数c=4。试用反应函数的方法来确定纳什均衡时的三个农户的养羊数量。第三节混合策略和混合策略的纳什均衡
一、混合策略
在一个博弈中,博弈方在每一个给定的信息情况下只选择一种特定的策略,称之为纯策略。在一个博弈中,博弈方以一定的概率分布在可选的策略中随机选择策略的决策方式,称之为混合策略。混合策略在数学上的一般定义定义:在博弈G=(S1,S2,…,Sn;u1,u2,…,un)中,设博弈方i的策略空间为Si=(si1,si2,…,sik),则博弈方i以概率分布pi=(pi1,pi2,…,pik)随机在其k个可选策略中选择的“策略”,称为一个“混合策略”,其中,0≤pij≤1(j=1,2,…,k),且pi1+pi2+…+pik=1。
二、混合策略的纳什均衡纯策略空间上的纳什均衡的定义:如果一个策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时,就是一个纳什均衡当策略扩展到混合策略时,上述纳什均衡的概念仍成立。此时,策略含义既可能是纯策略,也可能是混合策略混合策略纳什均衡的推导猜硬币者正反例:猜硬币的博弈盖硬币者正反-1,11,-11,-1-1,1博弈方选择策略的原则(1)自己的策略选择不能预先被另一方知道或猜测到;(2)在博弈的多次重复中,博弈方一定要避免自己的选择带有规律性;(3)每一个博弈方选择每种策略的概率一定要使对方无机可乘;使博弈中各博弈方选择不同策略的平均得益(期望得益)相等;混合策略的纳什均衡例子(1)博弈方2CD例1:博弈方1AB2,35,23,11,5例2:齐威王与田忌赛马
田忌上上中中下下中下上下上中下中下上中上上中下齐上下中威中上下王中下上下上中下中上3,-3
1,-1
1,-1
1,-1
-1,1
1,-1
1,-1
3,-3
1,-1
1,-1
1,-1
-1,1
1,-1
-1,1
3,-31,-1
1,-1
1,-1
-1,1
1,-1
1,-1
3,-31,-1
1,-1
1,-1
1,-1
1,-1
-1,1
3,-31,-1
1,-11,-1-1,1
1,-11,-13,-3例3:小偷和守卫的博弈
一小偷欲偷窃有一守卫者看守的仓库,如果小偷偷窃时守卫在睡觉,则小偷就能得手,偷得价值为V的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就被抓住,小偷产生负的效用-P。守卫睡觉而未遭偷窃有S的正效用,因睡觉被窃,守卫要有负的效用-D。而如果小偷不偷,则他既无所得也所失;而守卫不睡,他也没有得失。试确定上述博弈是否有纯策略的纳什均衡,是否唯一,否则求出其混合策略的纳什均衡,并分析所得到的结果。分析:守卫睡不睡(1)博弈的矩阵形式小偷偷不偷V,-D-P,00,S0,0(2)小偷与守卫的混合策略的博弈,揭示了一种“激励的悖论”。例4:夫妻之争丈夫时装足球妻子时装足球2,10,00,01,2例5:市场机会博弈
博弈问题:两厂商同时发现一个市场机会,但这个市场的容量并不大,如果只有一个厂商进入该市场,能挣到100个单位的利润,但如果两厂商同时进入该市场,则他们不仅挣不到钱而且要亏损50个单位。如果在这两个厂商之间没有沟通和协商解决的有效办法,试确定上述博弈是否有纯策略的纳什均衡,是否唯一,否则求出其混合策略的纳什均衡,并分析所得到的结果。分析:厂商2进不进博弈的矩阵形式厂商1进不进-50,-50100,00,1000,0例6:市民责任博弈李四旁观报警张三旁观报警0,010,77,107,7第四节多重纳什均衡分析
一、纳什定理(NASH1950)
在一个有n个博弈方的博弈G=(S1,S2,…,Sn;u1,u2,…,un)中,如果n是有限的,且Si都是有限集(i=1,2,…,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。一、帕累托上策均衡在一个多重纳什均衡的博弈中,如果这些纳什均衡有明显的优劣关系,并且所有的博弈方都偏好其中的某一个纳什均衡,也就是说,这个纳什均衡给所有博弈方带来的得益,大于其他纳什均衡给所有博弈方带来的得益,称该纳什均衡为帕累托上策均衡。帕累托上策均衡举例国家2战争和平国家1战争和平-5,-58,-10-10,810,10“战争与和平”从国家和人民总体的长远利益出发进行客观分析,战争通常对任何一方都是有害无益的。选择战争比选择和平有利的唯一情况是对方已经选择了战争,因为这时候不奋起反击就会任人宰割。二、“廉价磋商”在一个多重纳什均衡博弈中,博弈方为保证某一个纳什均衡出现,可以在博弈开始之前进行不花成本或低成本的“廉价磋商”,这样的磋商即使不能达成协议,但可以使某一个纳什均衡实际上出现。廉价磋商举例博弈方BLR博弈方AUD9,90,00,01,1三、风险上策均衡在多重纳什均衡的博弈中,各个博弈方从风险的角度上,通常比较倾向于接受预测风险较小的策略组合博弈方BLR博弈方AUD9,90,88,07,7风险上策均衡举例猎鹿博弈:两个人同时发现1头鹿和两只兔子,如果两人合力抓鹿,则可以把这头价值10个单位的鹿抓住,当然兔子是抓不到了;如果两人都去抓兔子,则各可以抓到一只价值3单位的兔子,鹿就会跑掉;但如果一个人选择抓兔子而另一个人选择抓鹿,那么选择抓兔子的能抓到一只兔子,选择抓鹿的人什么也抓不到。由于两人的决策
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东酒店管理职业技术学院《能源工程与管理》2023-2024学年第一学期期末试卷
- 广东交通职业技术学院《住宅空间设计》2023-2024学年第一学期期末试卷
- 广东建设职业技术学院《高层建筑给排水与消防》2023-2024学年第一学期期末试卷
- 广东海洋大学《中学英语课程标准研读与教材分析》2023-2024学年第一学期期末试卷
- 广东工业大学《道路软件应用》2023-2024学年第一学期期末试卷
- 广东东软学院《高级木材学》2023-2024学年第一学期期末试卷
- 广东创新科技职业学院《初等数学研究》2023-2024学年第一学期期末试卷
- 《功能材料学概论》课件
- 广东白云学院《化工单元仿真实训》2023-2024学年第一学期期末试卷
- 共青科技职业学院《舞蹈III》2023-2024学年第一学期期末试卷
- 软件定义网络(SDN)实战教程课件
- 上海市住院医师规范化培训公共科目考试题库-重点传染病防治知识
- 燃烧仿真.燃烧数值模拟方法:化学反应动力学模型:燃烧仿真前沿技术与研究
- 2024江苏省铁路集团限公司春季招聘24人高频考题难、易错点模拟试题(共500题)附带答案详解
- 线性代数考试练习题带答案大全(二)
- 2024智能变电站新一代集控站设备监控系统技术规范部分
- 企业反恐专项经费保障制度
- 电梯工程师在电梯设计中的工作内容
- 《概率论与数理统计基础》全套教学课件
- 2024国家开放大学电大本科《液压气动技术》期末试题及答案
- GB/T 30306-2024家用和类似用途饮用水处理滤芯
评论
0/150
提交评论