《博弈论与公共政策》完全信息静态博弈BPPT课件_第1页
《博弈论与公共政策》完全信息静态博弈BPPT课件_第2页
《博弈论与公共政策》完全信息静态博弈BPPT课件_第3页
《博弈论与公共政策》完全信息静态博弈BPPT课件_第4页
《博弈论与公共政策》完全信息静态博弈BPPT课件_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.,1,博弈论与公共政策,刘 霖 北京大学政府管理学院,.,2,第一讲 完全信息静态博弈,.,3,主要内容,一、博弈的标准式表述 二、占优策略均衡 三、重复剔除的占优均衡 四、纳什均衡 五、多重纳什均衡的比较 六、混合策略 七、扩展及应用,.,4,何谓静态博弈? 每个参与者只行动一次,且同时行动。,.,5,何谓完全信息博弈? 每一参与者的收益函数属于所有参与者的共同知识。,.,6,一、博弈的标准式表述,博弈的标准式表述包括三个方面的内容: (1)博弈的参与者 (2)每个参与者可供选择的策略集 (3)针对所有参与者可能选择的策略组合,每个参与者获得的收益(即收益函数),.,7,对于一个 n 人博

2、弈,设各参与者的策略集依次为 S1,S2, ,Sn ,收益函数分别为u1,u2, ,un ,其中 ui (s1,s2, ,sn) 为各参与者选择策略组合 (s1,s2, ,sn) 时参与者 i 的收益,则可用标准式将该博弈表示如下: G = S1,S2, ,Sn ; u1,u2, ,un ,.,8,在双人有限策略的情况下,可以用双变量矩阵更直观地表述博弈。,.,9,例1:囚徒困境,.,10,但是,如果参与者超过2人,则用双变量矩阵形式来表示博弈就不方便了,甚至根本无法采用这种形式。,.,11,例2:三人有限策略博弈,.,12,二、占优策略均衡,1、占优策略 在博弈中,如果不管其他参与者选择什么

3、策略,某个参与者的特定策略都优于或至少不劣于其它任何策略,那么,我们就说这个特定策略是该参与者的占优策略。 在前面的囚徒困境博弈中,“招认”就是每个囚徒的占优策略。,.,13,2、占优策略均衡 如果每个参与者都存在占优策略,那么由这些占优策略构成的组合就称为占优策略均衡。 在前面的囚徒困境中,(招认,招认)就构成一个占优策略均衡。,.,14,注意: 占优策略均衡只要求每个参与者是理性的,而并不要求每个参与者知道其他参与者是理性的,也就是说,不要求“理性”是共同知识。,.,15,例3:帆船比赛,1983年美洲杯帆船决赛前4轮结束后,Dennis Conner率领的“自由号”在这项共有7轮的重要赛

4、事中暂时以3胜1负的成绩排在首位。 那天早上,第5轮比赛即将开始,整箱整箱的香槟送到“自由号”的甲板上,而在他们的观礼船上,船员们的妻子全都穿着红白蓝相间的 背心和短裤,迫不及待地要在她们的丈夫夺取美国人失落132年之久的奖杯后参加合影。,.,16,比赛一开始,由于“澳大利亚二号”抢在发令枪之前起步,不得不退回到起点线后再次起步,这使“自由号”获得了37秒的优势。澳大利亚队的船长John Bertrand 打算转到赛道左边,满心希望风向发生变化,可以帮助他们赶上去,Conner则决定将“自由号”留在赛道右边。这一回, Bertrand押宝对了,因为风向果然按照他的心愿偏转了5度,澳大利亚人以1

5、分47秒的巨大优势赢得了这轮比赛。 再赛两轮之后, “澳大利亚二号”赢得了决赛桂冠。“自由号”船员们的妻子伤心不已。,.,17,例4:公共产品的提供问题,某小区住有A、B、C三户,每户可以自主决定是否为大家提供一件公共产品,假设每件公共产品给每户带来的效用是100元,而其成本为150元。 各户会如何决策?,.,18,.,19,例5:中小学补课博弈,新华社北京2008年1月16日电1月26日,北京市中小学将正式放寒假。北京市教委16日发出通知,首次强调严禁中学办选拔性培训班,同时严禁中小学补课,并要求各区县公布补课举报电话。 新华社济南2008年1月17日电山东省教育厅副厅长张志勇在17日召开的

6、全省中小学素质教育工作会议上说,要坚决制止中小学校假期加班补课行为,把时间还给孩子。今年寒假,小学、初中和高一高二年级正月十五之前一律不准上课,高三年级正月初十之前不准上课。,.,20,三、重复剔除的占优均衡,1、重复剔除的占优均衡 首先从某一参与者的策略集里剔除掉一个劣策略,再重新考察各个参与者剩下的策略中哪些是劣策略并剔除其中之一,不断重复这一过程直到每个参与者都仅剩一个策略为止,最后得到的策略组合就称为重复剔除的占优均衡。,.,21,例6:俾斯麦海之战,.,22,在单人决策中,当所有情况下的收益都增加(至少不减少)时,当事者的境况不会变得更坏,但在博弈中则未必。比较下面的两个博弈:,.,

7、23,例 7,.,24,2、理性共识 重复剔除的占优均衡不仅要求每个参与者是理性的,而且要求“理性”是参与者的共同知识,即参与者具有“理性共识”(Common Knowledge of Rationality,简记为CKR)。,.,25,理性共识可划分为不同的层次: 零阶理性共识:每个人都是理性的,但不知道其他人是否理性。 一阶理性共识:每个人是理性的,并且知道其他人也都是理性的,但不知道其他人是否知道自己是理性的。 二阶理性共识:每个人是理性的,也知道其他人都是理性的,而且知道其他人知道自己是理性的,但不知道其他人是否知道自己知道他们是理性的。 依此类推。,.,26,例 8,.,27,选择越

8、多(行动空间越大),对理性共识的要求越高。 请看下例:,.,28,例 9,.,29,例10:交通事故责任立法,考虑行人与司机的博弈,每个参与者都有两种策略 (小心、不小心) 可选,“小心”需要付出努力,且努力成本为100元。若发生车祸,则行人会受到伤害,相当于1000元的损失。假设,只要有任何一方不小心就必然发生车祸;即使双方都小心,仍有10%的可能性发生车祸。,.,30,情况1:无法可依 (法律没有规定谁承担车祸责任),.,31,.,32,情况2:无过失责任 (法律规定司机要对任何车祸负责),.,33,情况3:英美法系 (法律规定只有在司机有过失(不小心)而行人没有过失的情况下,行人才可以获

9、得赔偿。),.,34,情况4:考虑公平的立法 (法律规定除非行人有过失(不小心),否则司机就要承担责任。),.,35,四、纳什均衡,许多博弈既不存在占优策略均衡,也不存在重复剔除的占优均衡。,.,36,博弈实验1,分钱财博弈,.,37,例 11,.,38,1、纳什均衡的定义 如果存在这样一个策略组合给定该策略组合中其他参与者的选择,没有人有积极性改变自己的选择,我们就说该策略组合是一个纳什均衡。 交通规则问题就是一个很好的例子:,.,39,例12:交通规则问题,.,40,纳什均衡是一种一致预期:基于信念的选择是合理的;支持选择的信念是正确的。 以交通规则问题为例,如果甲认为乙将靠右走,甲就会选

10、择靠右走;给定甲选择靠右走,乙确实会靠右走。 这种一致预期能够自我实现,不会出错:如何所有人认为这个结果会出现,这个结果就会出现。,.,41,2、纳什均衡的意义 如果某个策略组合为纳什均衡,那么任何一个参与者都没有激励独自背离他所选定的策略。这就是说,该策略组合是“策略稳定”或“自动实施”的。 换一种说法,如果参与者事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。,.,42,3、严格纳什均衡与弱纳什均衡,.,43,4、用划线法求纳什均衡,.,44,例 13,.,45,5、纳什均衡与重复剔除的占优均衡之间的关系 命题一: 纳什均衡不会被重复剔除严格

11、劣策略过程所剔除。,.,46,命题二: 如果重复剔除严格劣策略过程最终只剩下唯一的策略组合,那么这一策略组合为该博弈唯一的纳什均衡。,.,47,命题三: 不能被重复剔除严格劣策略过程所剔除的策略组合,不一定是纳什均衡。,.,48,例14:约会博弈,.,49,命题四: 重复剔除弱劣策略过程有可能剔除弱纳什均衡,但不会剔除严格纳什均衡。,.,50,例 15,.,51,6、连续策略情况下求纳什均衡 例16:古诺的双头垄断模型,.,52,例17:伯川德的双头垄断模型,.,53,五、多重纳什均衡的比较,1. 聚点均衡 2. 帕累托效率标准 3. 强均衡 4. 抗联盟(抗共谋)纳什均衡,.,54,例18:

12、泡酒吧博弈,.,55,例19,赌徒如何分钱?,.,56,博弈实验2,第一次实验,.,57,第二次实验,.,58,例20:三人有限策略博弈,.,59,六、混合策略,1、混合策略 所谓混合策略,就是参与者以一定的概率从几种纯策略中随机选择。 有些博弈不存在纯策略纳什均衡,但存在混合策略纳什均衡。,.,60,例21:监督博弈,监督,不监督,偷懒,不偷懒,1,1,1,2,2,3,2,2,.,61,例22:单相思,.,62,例23:划拳博弈,.,63,例24:防空系统与真假导弹,混合策略的应用。,.,64,2、说明 (1)一个给定的纯策略可能会严格劣于一个混合策略,即使这个纯策略并不严格劣于其他任何一个

13、纯策略。,.,65,.,66,(2)一个给定的纯策略可以是针对对手的一个混合策略的最优反应,即使这一纯策略并不是针对对手的任何一个纯策略的最优反应。,.,67,.,68,(3)给定其他参与者的策略,参与者的一个混合策略要成为其最优反应,混合策略中每一个概率大于0的纯策略本身也必须是其最优反应。,.,69,3、混合策略纳什均衡的充要条件 对任一参与者,凡是以正的概率被选择的纯策略应带来相等的期望收益,且不低于以零概率被选择的纯策略带来的期望收益。,.,70,4、混合策略纳什均衡的求法 (1)对于每个参与者,选择其纯策略空间的一个子集。构造一个一般化的混合策略组合。 (2)检查是否存在参数(概率)

14、使得该混合策略组合满足混合策略纳什均衡的充要条件。若存在,则为混合策略纳什均衡。 (3)不断重复前两步,直到完成对各参与者所有子集组合的分析为止。,.,71,例25:求混合策略均衡,.,72,5、对混合策略的理解 参与者 i 的混合策略可以解释为其对手对于 i 将会选择哪一个纯策略的不确定性,实际上,在 i 的心中,可能依据自己掌握的一点儿私人信息已经选择了某一纯策略。不过,由于其他参与者不能观察到 i 的私人信息,他们无法确定 i 的选择,我们就用 i 的混合策略表示其他参与者的这种不确定性。,.,73,n 人正在目击一场犯罪。每个人都希望警察赶来,但宁可别人去报警。假定,若无人报警,每人的

15、收益为 0 ;若有人报警,则报警者的收益为 v-c 而未报警者的收益为v,且 vc0。 你会如何选择?,.,74,6、纳什定理(纳什均衡的存在性) 在 博弈 中, 如果 n 是有限的,并且对每个 i ,Si 是有限的,则博弈至少存在一个纳什均衡,均衡可能包含混合策略。,.,75,七、扩展及应用,1、纳什均衡的应用举例,.,76,例26:美国总统选举,在2000年的美国总统选举中,共有三位候选人:布什、戈尔和纳德。由于最终结果是由总统选举团投票决定而非由普选票决定,民主党的戈尔面临着不利因素,他获得的普选票数必须超出其他对手1%,才有机会赢得大选。 各方在普选中的支持率如下表所示。 在该博弈中,纳什均衡是什么?谁当选总统?,.,77,.,78,例27:公共地的悲剧,.,79,例28:偷税与审计,税务局要决定是否对某种税收收入进行审计,纳税者有偷税的潜在欲望,但只有当他们不会被查出时才会想偷税;税务局则希望以最小的成本来避免或查出纳税者的偷税行为。 现在假设: 防止或查出偷税行为的收益为 4,审计成本为 C1。,.,80,.,81,1、在均衡时,会出现什么状况?各方的收益是多少? 2、税务局有没有办法提高自己的收益?,.,82,三个选民(1、2、3)要就三个备选方案(A、B、C)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论