版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 完全信息静态博弈,本章介绍完全信息静态博弈。完全信息静态博弈各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。,2.1 基本分析思路和方法,2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法,2.1.1 上策均衡基本分析思路和方法,在某个博弈中,如果不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其他策略,至少不低于其他策略。
2、这时我们不难理解,上述“某个策略”必然是该博弈方愿意选择的策略。例如囚徒困境博弈中的“坦白”就是这样的策略(对两个博弈方都成立)。,cont,我们称这种策略为该博弈方的一个“上策”(dominant-strategy)。 进一步,如果 一个博弈的某个策略组合中的所有策略 都是各个博弈方各自的上策,那么这个 策略组合肯定是所有博弈方都愿意选择 的,必然是该博弈比较稳定的结果。,cont,我们称这样的策略组合为该博弈的一个“上策 均衡”( dominant-strategy equilibrium)。上策 均衡是博弈分析中最基本的均衡概念之一,上 策均衡分析是最基本的博弈分析方法。囚徒的 困境中的
3、(坦白,坦白)实际上就是一个上策 均衡“坦白”对该博弈的两个博弈方来说都是上 策。,2.1.1 上策均衡应用,上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来 的得益始终高于其它的策略,至少不低于其他策略的策略。 囚徒的困境中的“坦白”;双寡头削价中“低价”。,-5, -5,0, -8,-8, 0,-1, -1,坦 白,不坦白,坦 白,不坦白,两个罪犯的得益矩阵,囚徒 2,囚 徒 1,cont,上策均衡,上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果 上策均衡不是普遍存在的,cont,cont,上策均衡 上策均衡:一个博弈的某个策略
4、组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果 (局限性)上策均衡不是普遍存在,2.1.2基本分析思路和方法- 严格下策反复消去法,一、思路和原理 反思上策均衡分析的思路,不难发现上策均衡分析采用的决策思路是一种选择法的思路,是在所有可选择策略中选出最好一种地思路。实际上,选择是指人们在决策活动所运用的一种策略思路而不是全部的决策思路,人们在决策活动中还会采用另外的决策思虑。排除的思路,也就是所谓的排除法,就是其中最常运用的一种。,续,排除法与选择法在形式上正好相反,它是通 过对可选策略的相互比较,把不可能采用的 较差策略排除掉,从而筛选出较好的策略, 或者至少缩小候选策
5、略的范围。这种排除法 的思路导出了博弈分析中的严格下策反复消 去法。对囚徒的困境博弈中的两个博弈方来 说不管对方的策略如何,各自两种可选策略 中的“坦白”策略都比“不坦白”策略来得好。,续,这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。一般地,如果在一个博弈中,不管其他博弈方的策略如何变化,一个博弈方的某种策略给他带来的得益,总是比另一种策略给他带来的得益要小,那么我们称前一种策略为相对于后一种策略的一个“严格下策”。若对一个博弈运用严格下策反复消去法后,整个博弈方只有唯一的策略幸存下来,那么该策略将是该博弈方的唯一选择,如果该博弈的策略组合中只有唯一一个幸存下来,这个
6、策略组合就是该博弈的结果。如囚徒的困境的博弈中的(坦白,坦白)。,2.1.2 严格下策反复消去法应用,严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略 严格下策反复消去:,续,缺陷: (1)有些博弈无严格下策;如抛硬币博弈。 (2)即使有严格下策,也只可能消去一部分。 此时该方法失效,失效的根源是策略的相互依存性,他们之间可能没有严格的依存关系。,2.1.3 划线法的基本思想,博弈方的最终目标都是实现自身的最大得益。在具有 策略和利益相互依存性的博弈问题中,各个博弈方的得 益既取决于自己选择的策略,还与其他博弈方选择的策 略有关,因此,博弈方
7、在决策时必须考虑其他博弈方的 存在和策略选择。根据这种思想,科学的决策思路应该 是:先找出自己针对其他博弈方每种策略或策略组合配 合,给自己带来最大得益的策略(这种相对最佳对策总 是存在的,不过不一定惟一),然后在此基础上,通过 对其他博弈方策略选择的判断,包括对其他博弈方对自 己策略判断的判断等,预测博弈的可能结果和确定自己 的最优策略。,2.1.3 划线法应用,寻找纳什均衡,c1,c2,c3,r1,r2,r3,100,100,0,0,50,101,50,0,1,1,60,0,0,300,0,0,200,200,纳什均衡:举例,广告博弈 纳什均衡:(做广告,做广告),企业1,企业2,考虑团队
8、生产:,工作,偷懒,工作,偷懒,6,6,2,2,0,8,8,0,2.2 纳什均衡,2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法,2.2.1 纳什均衡的定义,策略空间: 博弈方 的第 个策略: 博弈方 的得益: 博弈: 纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡,纳什均衡:给定你的策略,我的策略是最优的,给定我的策略,你的策略是最优的,或者用另外一种形式表示, 是下述最大化问题的解 注意到上述定义中,
9、可以取等号,这样的纳什均衡称为弱纳什均衡。如果 则称 是一个强(strict or strong)纳什均衡.也 就是说一个纳什均衡是强的,给定其它人的策 略,每个参与人的最优策略是唯一的。,纳什均衡de具体表述,(低价,低价)是纳什均衡,纳什均衡的直观理解与哲学思考,纳什均衡 的每一个策略称为纳什均衡战略 ,那么 没有任何一个战略严格优于纳什均衡战略。为了理解纳什均 衡,从另一个角度思考:假设在博弈之前n个参与人达成一个 协议,规定每一个参与人选择一个特定的策略,令 代表这个协议。我们要问在其他参与人都遵守这个协议,在 没有外在强制的情况下是否有任何参与人有积极性不遵守这个 协议?显然理性的参
10、与人只有在遵守协议带来的效用大于不 遵守协议带来的效用时,一个人才会遵守这个协议。如果没有 任何人有积极性不遵守这个协议,那么这个协议是可以,纳什均衡的直观理解(续),自动实施的(self-enforcing),这个协议就构成一个纳什均衡。 自动实施的(self-enforcing)在团队中的应用。,2.2.2 纳什均衡与一致预期,纳什均衡:所有参与人的最优战略的组合:给定该战略中别人的选择,没有人有积极性改变自己的选择。 一致预期:基于信念的选择是合理的;支持选择的信念是正确的; 预期的自我实现:如何所有人认为这个结果会出现,这个结果就会出现。预期是自我实现的,预期不会错误。如果你认为我预期
11、你将选择x,你就真的会选择x。,2.2.3 纳什均衡与严格下策反复消去法,上策均衡定是纳什均衡,但纳什均衡不一定是上策均衡 命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡 命题2.2:在n个博弈方的博弈中 中,如果 是 的 一个纳什均衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的,2.3 无限策略分析和反应函数,2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和
12、局限性,2.3.1 古诺的寡头模型,企业cournot模型 (无限策略博弈) 古诺( cournot ,1838)比纳什(1950)定义早100年 假设条件: 在一个寡头市场上两企业生产销售同质产品,市场总产量q = q1+q2 (两寡头企业就是指这两家企业垄断了某一行业的市场) 市场出清价格 p = 8 - q 生产无固定成本,边际成本 c=c1=c2=2 两企业同时独立地决定各自的生产产量(q1, q2) 问题:两家企业应如何决策?,古诺的寡头模型分析,企业1的利润(得益): u 1 (q1, q2) = pq1 c1q1 = (8-q) q1 - 2q1 = 6 q1- q1 q2- q
13、12 企业2的得益: u 2 (q1, q2) = pq2 c2q2 = (8-q) q2 - 2q2 = 6 q2- q1 q2- q22,古诺的寡头模型分析(续),设(q1*, q2*)是一纳什均衡,由联立求解: max q1 u 1 (q1, q2*) = max q1 (6 q1- q1 q2*- q12) max q2 u 2 (q1*, q2) = max q2 (6 q2- q1* q2- q22) 有 6- q2*- 2q1* =0 6- q1*- 2q2* =0 其静态博弈模型有唯一纳什均衡:(q1*, q2*) =(2, 2) 使市场总产量 q* =q1*+q2*=4, 市
14、场出清价格 p*= 8 - q* 得二企业总得益:u *= u 1* + u 2*=4 +4=8,古诺的寡头模型分析(续),企业总得益: u = qp (q) - cq = 6q- q2 有 6 - 2q* =0 , 使最大产量q* =3 , 即(q1*, q2*) =(1.5, 1.5) 使二企业最大总得益: u* = u 1* + u 2*=4 .5 + 4.5 = 9 8 结论: 根据总体利益最大化确定的产量效率高于根据企业个体利益最大化确定的产量效率.,4.5,4.5,5,3.75,3.75,5,4,4,不突破,突破,厂商2,不突破,突破,厂 商 1,以自身最大利益为目标:各生产 2单
15、位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5,两寡头间的囚徒困境博弈,2.3.2 反应函数(划线法),古诺模型的反应函数,(3,0),(6,0),(0,6),(0,3),(2,2),r1(q2),r2(q1),2.3.3 伯特兰德(bertrand)寡头模型,假设1:厂商1和厂商2生产产品是同类,具有一定的替代性。 假设2:需求函数是线性的,且需求函数为 假设3:生产无固定成本,边际成本 c1,c2 假设4:厂商同时决策,cont,利润函数为: 一阶条件:,cont,纳什均衡( )必需满足,一些扩展,需求函数,2.3.6 豪泰林(hotelling)价格
16、竞争模型,在库诺特模型中,产品是同质的,在这个假设下,如果企业的竞争战略是价格而不是产量,伯特兰德(bertland,1883)(又译为:伯川德)证明,即使只有两个企业,在均衡情况下,价格等于边际成本,企业利润为零,与完全竞争市场均衡一样。这便是所谓的“伯特兰德悖论”,解开这个悖论的办法之一是引入产品的差异性。如果不同企业生产的产品是有差异的,替代弹性就不会是无限的,此时消费者对不同企业的产品有着不同的偏好,价格不是,他们感兴趣的唯一变量。还存在产品差异的情况下,均衡价格不会等于边际成本。 产品差异性有多种形式。我们现在考虑一种特殊的差异,即空间上的差异,这就是经典的豪泰林模型。在豪泰林模型中
17、产品在物质性能上相同的,但在空间位置上有所差异。因为不同位置上的消费者要支付不同的运输成本,他们关心的是价格与运输成本之和,而不单是价格。假设有一个长度为1的线性城市,消费者均匀地分布在0,1区间里,分布密度为1。假定,有两个商店,分别位于城市的两端,商店1在 x=0,商店2在x=1,出售物质性能相同的产品,每个商店提供单位产品的成本为c,消费者购买商品的旅行成本与离商店的距离成正比例,单位距离的成本为t。这样,住在x的消费者如果在商店1采购,要花费tx的旅行成本;如果在商店2采购,要花费t(1-x) 。假定消费者具有单位需求,即或者消费1个单位或者消费0个单位。消费者从消费中得到的消费剩余为
18、 。,我们现在考虑两商店之间价格竞争的纳什均衡。假定两个商店同时选择自己的销售价格。为了简单起见,我们假定 相当于购买总成本(价格加旅行费用)而言足够大从而所有消费者都购买一个单位的产品。令 pi为商店i的价格,di(p1,p2) 为需求函数,i=1,2。如果住在x左边的将都在商店1购买,而住在x右边的将在商店2购买,需求分别为d1=x,d2=1-x,这里x满足 p1+tx=p2+t(1-x),解上式得需求函数分别为: d1(p1,p2)=x=(p2-p1+t)/2t d2(p1,p2)=1-x=(p1-p2+t)/2t 利润函数分别为: (p1,p2)= (p1c) d1(p1,p2) =
19、(p1c)(p2-p1+t)/2t (p1,p2)= (p2 c) d2(p1,p2) = (p2 c)(p1-p2+t)/2t,商店选择自己的价格p最大化利润,给定p,两个一阶条件分别是: 二阶条件是满足的。解上述两个一阶条件,得最优解为(注意对称性): p pct 每个企业的均衡利润为: t /2,我们将消费者的位置差异解释为产品差异,这个差异进一步可以解释为消费者购买产品的旅行成本。旅行成本越高,产品的差异越大,均衡价格从而均衡利润也就越高,原因在于,随着旅行成本的上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断能力加强,商店之间的竞争越来越弱,消费者对价格的敏感度
20、下降,从而每个商店的最优价格接近于垄断价格。另一方面,当旅行成本为零时,不同商店的产品之间具有,完全的替代性,没有任何一个商店可以把价格定的高于成本,我们得到伯特兰德均衡结果。 在以上的分析中,我们假定两个商店分别位于城市的两个极端,事实上,均衡结果对于商店的位置是很敏感的,考虑另一个极端的情况,假定两个商店位于同一位置。此时,他们出售的是同质的产品,消费者关心的只是价格,那么,伯特兰德均衡有唯一的均衡: p1=p2=c , =0,更为一般地,我们可以讨论商店位于任何位置的情况。假定商店1位于a0,商店2位于1-b(b 0)。为不失一般性,假定 1-a-b 0(即商店1位于商店2的左边)。如果
21、旅行成本为二次式,即旅行成本为td2 ,这里d是消费者到商店的距离,那么,需求函数分别为: d1(p1,p2)=x =a + ( 1-a-b )/2 + (p2-p1)/2t (1-a-b),d2 (p1,p2)=1-x =b + ( 1-a-b )/2 + (p1-p2)/2t (1-a-b) 需求函数的第一项是商店自己的“地盘”( a 是住在商店左边的消费者, b 是住在商店右边的消费者),第二项是位于两商店之间的消费者中靠近自己的一半,第三项代表需求对价格差异的敏感度。 纳什均衡为: p (a,b) ct (1-a-b)(1+(a-b)) p2 (a,b) ct (1-a-b)(1+(b
22、-a)),当a=b=时,商店位与,商店位于,我们回到前面讨论的第一种情况: p (,) p (,) ct 当a=b时,两个商店位于同一位置,我们走到另一种极端: p (a,- a) p (a ,- a) c,练习,如果在一条1千米长的长街上均匀居住着许多居民,有两个人同时想在该长街上开便利店。 1.如果假设所有居民都是到最近的便利店购买商品,问这两个人会如何选择店面位置? 2.如果假设每户居民都是到最近的便利店购买商品,但购买数量与他们到便利店的距离有关,假设,q=1-d,q为购买量,d为居民与便利店的距离,此时问这两个人会如何选择店面位置?,问题2,0,1,(x+y)/2,x,y,1,1,c
23、ont.,cont.,一阶条件为: 说明:纳什均衡与居民购买量与距离无关时是相同的。两点的任务是争夺客户资源,而不是增加单个客户的购买量,消费者的利益是被忽略的。,文献选读,1、服务延伸产品差异化_服务增强机制探讨_基于hotelling地点模型框架内的理论 2、商户联盟与hotelling竞争下支付卡交换费的比较分析 3、跨国并购后的品牌策略_基于hotelling模型的分析 4、具有网络外部性的扩展hotelling模型 5、对中国移动_中国联通价格竞争的一种解释_存在转换成本的双寡头价格博弈 6、关系营销适用性的博弈分析_一个拓展的豪泰林_hotelling_模型,2.4 混合策略和混合
24、策略纳什均衡,2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数,社会福利博弈:无纳什均衡,流浪汉 寻找工作 游荡 救济 政府 不救济,你救济,他就游荡;你游荡,他就不救济,社会福利博弈的特征,不存在纳什均衡 类似:父母与啃老族 回望:另一个不正常的博弈 情侣博弈两个纳什均衡,思考,如何分析“不存在”纳什均衡或存在多个纳什均衡的博弈?,2.4.1 严格竞争博弈和混合策略的引进,一、猜硬币博弈,(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多,引出混合策略纳什
25、均衡概念,2.4.1 、混合策略、混合策略博弈 和混合策略纳什均衡,混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。 混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。,二、一个例子,该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析,策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6,三、齐威王田忌赛马,1、齐威王田忌赛马的博弈分析(con
26、t ),emperor qi 的策略由上到下分别称为策略a,b,c,d,e和f, tian ji 的策略由左到右分别称为策略g,h,i,j,k和l 当齐威王分别以概率pa,pb,pc,pd,pe,pf选择策略a,b,c,d,e和f 时,田忌 选择g的期望得益-3pa-pb-pc+pd-pe-pf 选择h的期望得益-pa-3pb+pc-pd-pe-pf 选择i的期望得益-pa-pb-3pc-pd-pe+pf 选择j的期望得益-pa-pb-pc-3pd+pe-pf 选择k的期望得益pa-pb-3pc-pd-3pe-pf 选择l的期望得益-pa+pb-pc-pd-pe-3pf,齐威王田忌赛马的博弈分
27、析(cont ),从这些表达式可以看出:田忌的期望得益是受齐威王选择的概率的影响。所以齐威王希望他选择的概率分布(pa,pb,pc,pd,pe,pf)使田忌选任何策略都无可乘之机。也就是说上面6个期望得益相等。 解之得: pa=pb=pc=pd=pe=pf, 又因为: pa+pb+pc+pd+pe+pf=1 所以: pa=pb=pc=pd=pe=pf =1/6,2、田忌赛马结果,no nash equilibrium solution exist from the reward matrix, we can find the probability that emperor qi would
28、have won the game is 30/36 = 5/6. the optimal strategy of emperor qi and tian ji is (1/6, 1/6, 1/6, 1/6, 1/6, 1/6) respectively,一个重要应用,问题提出:,1.如果小偷偷自行车被抓住,加大惩罚,能防止盗窃的发生吗? 2.如果学生考生作弊被监考老师抓住,诸如:留校察看、开除等惩罚措施能防止 学生作弊吗? 3.如果学生逃课,老师点名发现逃课同学,一次扣5分,学生就不逃课吗?,4.应该加大对逃税人的处罚,还是应该加大对税收机关的监督来减少偷税漏税呢?,问题提出(cont.),
29、5.山西黑砖窑事件,为什么要追究省长的责任? 6.国家政府应该加大对下岗工人的救济,还是应该帮助下岗工人自谋职业呢? 7.企业出现某种责任时间,为什么要追究中层 干部的责任?,四、小偷和守卫的博弈,reinhard selten (1930 - ),1996年3月professor selten于上海,(一)、小偷和守卫的博弈模型,1、模型的描述 (1)小偷偷窃,守卫睡觉,则小偷偷得脏物v (v0), 守卫有负效用d(管理部门对守卫的惩罚 d0); (2)如小偷偷窃,守卫不睡觉,则小偷被抓有惩罚p (管理部门对小偷的惩罚 p0), 守卫有效用; (3)如小偷不偷窃,守卫睡觉,则小偷有效用,守卫
30、有正效用s (s0); (4)如小偷不偷窃,守卫不睡觉,则小偷与守卫各有效用;,2.模型的得益矩阵表示,图1:小偷与守卫的得益矩阵,4、小偷和守卫的博弈特征,有纯策略nash均衡吗? 一是在一次性博弈中没有自动实施的纯策略nash均衡; 二是不能让对对方预先猜测到自己的策略。,5、小偷和守卫的博弈分析,方法一:代数方法(略) (1)假设小偷选择“偷”策略的概率为pt ,选择“不偷”策略的概率为1 pt (2)假设守卫选择 “睡” 策略的概率为pg ,选择“不睡”策略的概率为1 pg,5、小偷和守卫的博弈分析(续),方法二:图示方法 小偷的决策: 守卫睡的得益 u守卫睡 = pt (-d)+ (
31、1 pt) s 守卫不睡的得益: u守卫不睡 = pt *0+ (1 pt) *0 =0,守卫得益(睡) u守卫睡的图象,0,s,pt 小偷偷的概率,1,守卫得益(睡),-d,于是:直线与横轴的交点就是小偷的最佳决策pt* 。 (为什么?),pt*,cont,原因:小偷希望选择最优的pt* 使得守卫睡与不睡的期望得益无差异,或者说使得守卫选择睡与不睡无机可乘。 u守卫睡 = pt (-d)+ (1 pt) s u守卫不睡 =0 于是解得: , , 小偷选择“偷”与“不偷”的混合策略为: ( , ),cont,注意到:如果小偷偷,守卫睡,则守卫有d个单位的惩罚,若d增大到d ,则小偷的最佳决策偷
32、将减少。,cont,守卫的决策: 小偷偷的得益 u小偷偷 = pgv + (1-pg)(-p) 小偷不偷的得益: u小偷不偷 = pg*0+(1-pg)*0=0,cont,pg*,于是:直线与横轴的交点就是守卫的最佳决策pg* 。 (为什么?),cont,原因:守卫希望选择最优的pg* 使得小偷偷与不偷的期望得益无差异,或者说使得小偷选择偷与不偷无机可乘。 u小偷偷 = pgv + (1-pg)(-p) u小偷不偷 =0 于是解得:pg* = p / (v+p) , 1-pg* =v / (v+p) 守卫选择“睡”与“不睡” 的混合策略为: ( p / (v+p) ,v / (v+p) ) 综
33、上:混合策略nash均衡为: ( s / (s+d) , d / (s+d) ), ( p / (v+p) ,v / (v+p) ),=,cont,注意到:如果守卫不睡,小偷偷,则小偷被 抓住有p个单位的惩罚,若p增大到p ,则守卫 的最佳决策睡将增加。,6、结果与实践意义,激励的悖论 通过前面的分析,增加对守卫的惩罚作用,可以防止犯罪有很好的作用。 但小偷的惩罚d由于守卫的收入p无关。为什么守卫不睡呢? 实践:,练习1: 社会福利博弈,练习2:监督博弈,2.4.2 多重均衡博弈和混合策略,一、夫妻之争的混合策略纳什均衡,夫妻之争的混合策略纳什均衡(cont.),夫妻之争博弈的混合策略纳什均衡
34、 博弈方1 (0.75,0.25) 博弈方2 (1/3,2/3) 考察在该混合均衡下的双方得益 妻子:pw(c)ph(c)*2+ph(f)*0+pw(f)ph(c)*0+ph(f)*1 =3/4*1/3*2+1/4*2/3*1=0.67 丈夫: pw(c)ph(c)*1+ph(f)*0+pw(f)ph(c)*0+ph(f)*3 =3/4*1/3*1+1/4*2/3*3=0.75 若两人协商选择(时装,时装),(足球,足球)的一个其收 益都大于0.67,0.75。 沟通的重要性:夫妻,团队,人际关系,一些制式,二、市场机会博弈,进 不进 得益 厂商1: 2/3 1/3 0 厂商2: 2/3 1/
35、3 0,如何协调?,仅仅“理性”是不够的; focal point(prominence):schelling(1960); 帕累托最优均衡:可以通过协商选择一个纳什均衡; 文化与制度 行业组织;,法律和社会规范如何协调预期,法律和社会规范就是这种协调预期的规则,帮助人们在多个纳什均衡中筛选一个特定的纳什均衡。 社会规范是通过习惯、长期的交互博弈产生的行为规则,法律是立法机关制定的行为规则,但不论是法律还是社会规范,它们的功能都是协调预期。,解决规则冲突的三个方式,一是一个规则取代其他的规则,让一部分人改变行为规范适应另一部分人,也就是所谓的“接轨”, 二是建立全新的规则,如中国人和德国人在一
36、起交流时都用英语,而不是中文,也不是德文; 三是建立协调规则的规则。如“入乡随俗”,“客随主便”。 究竟哪一种,与规则要解决的问题有关,也与其他因素有关。,2.4.3 混合策略和严格下策反复消去法,结论:严格下策反复消去法既不会消去纯策略nash均衡也不会消去混合策略nash均衡。 对博弈方1和博弈方2,都没有 严格下策。但是博弈方1采用混合 策略(1/2,1/2,0)时,博弈方2 采用纯策略l时,博弈方1的得益: u1=1/2*3+1/2*0+0*1=3/2,混合策略和严格下策反复消去法(cont),即使博弈方2也采用混合(q,1-q), 博弈方1的得益:u1=1/2*q*3+1/2*(1-
37、q)*0+1/2*q*0+ 1/2*(1-q)*3=3/2 表明:策略d是相对于混合 策略(1/2,1/2,0)的严格下 策。于是删去策略d得到又 变得博弈。,2.4.4 混合策略de反应函数,反应函数一博弈方对另一博弈方每种可能的决策内容的最佳反应决策构成的函数。 在混合策略中,博弈方的决策是概率分布,因此反应函数是一方对另一方的概率分布的反应。 例1:猜硬币博弈 用(r,1-r)表示盖硬币方 的混合策略,用(q,1-q)表 示盖硬币方的混合策略。 那么反应函数就是r和q的关系,2.4.4 混合策略反应函数,猜硬币博弈,例2:夫妻之争博弈,2.5 纳什均衡的存在性,nash 定理(1950,
38、nash的存在性定理1 ): 在一个博弈g =s1, sn ; u1, un ,如博弈方个数n有限, 博弈方的策略空间si都为有限集,则该博弈至少存在一个nash均衡,但可能包含混合策略 nash 定理:每一个有限博弈至少存在一个纯策略的或混合策略的纳什均衡。 纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。,2.5 纳什均衡的存在性(cont),纳什均衡的奇数定理 威尔逊(wilson)在1971年证明,几乎所有有限博弈都有有限奇数个纳什均衡。如果一个博弈有2m(即偶数个)纯策略纳什均衡,则一定存在第2m+1个(即奇数个)混合策略纳什均衡。,2.6 纳什均衡的选择和
39、分析方法扩展,2.6.1 多重纳什均衡博弈的分析 2.6.2 共谋和防共谋均衡,2.6.1 多重纳什均衡博弈的分析,帕累托上策均衡 风险上策均衡 聚点均衡 相关均衡,一、帕累托上策均衡,有些博弈问题虽然存在着多个nash均衡, 但是所有博弈方明显都对其中一个nash均 衡有相同的偏好,这个均衡称为 帕累托上策均衡 例1:鹰鸽博弈经典博弈 鹰鸽博弈并不是鹰鸽两种动物之间的博弈,恰 恰是同一物种、种群内部竞争和冲突问题。,模型描述:,这个博弈中有两个 纯策略纳什均衡, (鹰,鹰)和 (鸽,鸽) 显然后者帕累托 优于前者,所以, (鸽,鸽)是本博弈的一个帕累托上策均衡。,例2:国家之间的战争与和平问
40、题,这个博弈中有两个纯策略 纳什均衡,(战争,战争) 和(和平,和平),显然 后者帕累托优于前者,所 以,(和平,和平)是本 博弈的一个帕累托上策均衡。 注意到:实际中, (和平,和平)并不容易实现。,大学改革:教师招聘,只留本校生,不留本校生,只留本校生,不留本校生,2,2,2,0,0,2,10,10,二、风险上策均衡,博弈模型1: 纯策略nash均衡 (u,l) and(d,r),且(u,l) 为帕累托上策均衡。 混合策略nash均衡 (7/8,1/8),( 7/8,1/8 )(求法略) 注: (u,l)均衡一定能实现吗?,风险上策均衡的定义:,虽然某个nash均衡帕累托优于另一个 nas
41、h均衡,但风险却要高于后者,为了规 避风险,博弈方必然趋于选择后一个nash 均衡策略,这个nash均衡称为“风险上策 均衡”(risk-dominant equilibrium) 例如:上例中(d,r)为“风险上策均衡”,猎鹿博弈(stag-hunting game),卢梭在他的论人类不平等的起源和基础中说到: 如果一群猎人出发去猎一头鹿,他们完全意识到,为了成功,他们必须都要忠实地坚守自己的位置;然而如果一只野兔碰巧经过他们中的一个人附近,毫无疑问他会毫不迟疑地追逐它,一旦他获得了自己的猎物,他就不太关心他的同伴是否错失了他们的目标。,现在对上述描述简化。假设只有两个猎人,他们必须同时决定
42、是猎鹿还是野兔。如果两个人均决定猎鹿,那么他们会获得一头鹿(价值1000元),并在他们之中进行平分;如果两个人均猎野兔,那么他们每个人可以获得一只野兔(价值100元);如果一个猎兔而另一个猎鹿,则前者获得一只野兔,后者将一无所获。 如果每个人都希望自己得到尽可能多的猎物,请作出支付矩阵并分析此博弈的纯策略纳什均衡。,猎鹿博弈(stag-hunting game),三、聚点均衡(focal points equilibrium),利用博弈设定以外的信息和依据选择的均衡 文化、习惯或者其他各种特征都可能是聚点均衡的依据 城市博弈(城市分组相同) 时间博弈(报出相同的时间)是聚点均衡的典型例子,四、相关均衡,在博弈中遇到多重nash均衡的难题时, 博弈方就应设计某种形式的均衡选择机制, “相关均衡”就是在这种机制下选择出的 nash均衡。,一个例子,模型1: 纳什均衡:(u,l)、(d,r)得益相差很大,双方都不会 妥协选择某一个。聚点均衡(天气,抛硬币),但仍不理想。,三个纳什均衡: (u,l)、(d,r) 和混合策略均衡 (1/2,1/2),(1/2,1/2) 结果都不理想,不如(d,l)。,cont.,同时混合策略也不是理想的结果。因为双方的期 望得益
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024沥青采购合同
- 2023-2024学年人教版(2015)小学信息技术四年级下册文字处理初尝试(说课稿)
- 2024某影视公司与某广告公司关于影视植入广告服务的合同
- 1 《沁园春·长沙》 (说课稿)-2024-2025学年高一语文同步说课稿与知识梳理(统编版必修上册)
- 5G网络建设与优化协议
- 2024年革新版:基于VR技术的虚拟物流培训服务合同
- 2024陕西餐饮业劳动合同范本及服务条款3篇
- 2《学会沟通交流》第1课时说课稿-2024-2025学年道德与法治五年级上册统编版
- 11变废为宝有妙招(说课稿)-部编版道德与法治四年级上册
- 2025年度文化产业融合发展合同补充协议3篇
- 过敏性紫癜-教学课件
- GB/T 24183-2021金属材料薄板和薄带制耳试验方法
- 医院手术分级动态管理表
- 湖南2023消耗量定额说明及计算规则-市政工程
- 药店血液制品管理制度 全
- 污水管网工程主要项目清单与计价表参考模板范本
- 危险化学品储存柜安全管理
- 术后恶心呕吐防治专家共识(全文)
- 圆形蓄水池工程量及配筋Excel计算
- 浙教版初中科学八下《表示元素的符号》课件
- 汽车仪表与显示系统课件
评论
0/150
提交评论