博弈论ppt课件_第1页
博弈论ppt课件_第2页
博弈论ppt课件_第3页
博弈论ppt课件_第4页
博弈论ppt课件_第5页
已阅读5页,还剩155页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

正大光明公正無私,1,博弈论theTheoryofGames,博弈论2009,正大光明公正無私幫助別人成就自己,2,主要内容,一、博弈现象及基本概念二、完全信息静态博弈三、完全信息动态博弈四、不完全信息静态博弈五、不完全信息动态博弈六、不完全信息专题,博弈论2009,正大光明公正無私幫助別人成就自己,3,主要参考书,姚国庆:博弈论,高等教育出版社,2007.罗云峰:博弈论教程,清华大学出版社、北京交通大学出版社。张维迎:博弈论与信息经济学,上海三联书店,上海人民出版社,2004。施锡铨,博弈论,上海财经大学出版社,2002。,博弈论2009,正大光明公正無私幫助別人成就自己,4,张守一,现代经济对策论,高等教育出版社,1998。钱颂迪,运筹学,清华大学出版社,1996。美艾里克.拉斯缪森:博弈与信息,北京大学出版社,2003。美弗登博格:博弈论,中国人民大学出版社,2002。,博弈论2009,正大光明公正無私幫助別人成就自己,5,第一讲博弈现象与基本概念,1博弈现象2.博弈概念3.博弈描述4.博弈练习5.关于博弈论,博弈论2009,正大光明公正無私幫助別人成就自己,6,1博弈现象,田忌赛马:正确的策略可以反败为胜。囚徒困境:,甲,乙,理性的人是自私自利的;理性选择不是全局最优。,博弈论2009,正大光明公正無私幫助別人成就自己,7,经济合作:,甲,乙,诚信的价值;一报还一报策略;人类生存环境启示。,博弈论2009,正大光明公正無私幫助別人成就自己,8,长街上的超市(海滩占位模型),资源浪费还是理性的必然?其它相似情形:旅行社的热门路线;黄金时间的电视节目;总统竞选。,博弈论2009,正大光明公正無私幫助別人成就自己,9,狩猎与投资狩猎:两个猎人围住一头鹿,各卡住两个关口中的一个,齐心协力即可成功获得并平分猎物。此时有一群兔子跑过,任何一人去抓兔子必可成功,但鹿会跑掉。他们会坚持猎鹿还是去抓兔子?,博弈论2009,正大光明公正無私幫助別人成就自己,10,共同投资:双方共同投资一个大项目,可期望有较大收益。此时如某方抽出资金去进行小项目投资,必可成功获小利,但会使共同项目陷入困境,使对方蒙受损失。投资者会如何选择?,博弈论2009,正大光明公正無私幫助別人成就自己,11,旅行者困境两个旅行者花瓶被摔坏,向航空公司索赔。航空公司知道价格约为八九十元,但不知道确切价格。于是请两位旅客在100元以内自己写下花瓶的价格。如两人写的一样,就认为他们讲真话,并按所写数额赔偿;如果两人写的不一样,就认定低者讲真话,并照此价格赔偿。同时,对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。理性原则下,他们会写多少价格呢?,博弈论2009,正大光明公正無私幫助別人成就自己,12,什么是博弈:个人或团体间在依存和对抗、合作和冲突中的决策问题。博弈论研究博弈过程中的理性行为。,2.博弈概念,博弈论2009,正大光明公正無私幫助別人成就自己,13,如何理解理性行为:自身利益最大;持续地有意图的行动;不对动机妄加猜测;不考虑道德问题;只研究合法问题;盈利函数有多重标准。,博弈论2009,正大光明公正無私幫助別人成就自己,14,博弈三要素局中人(参与人)players:决策主体;自然人、团体或“虚拟局中人”;有可供选择的策略和明确定义的利益函数;分为两人和多人,博弈论2009,正大光明公正無私幫助別人成就自己,15,策略(战略)strategies:采取行动的规则;可以是一次行动也可以是一个行动序列;可以是纯策略也可以是混合策略;分为有限和无限。支付(盈利函数)payoff:对应于某策略组合的局中人利益或损失;确定的或是期望的;分为零和和非零和。,博弈论2009,正大光明公正無私幫助別人成就自己,16,扩展术语:信息:信息集;完全信息(complete);完美信息(perfect)。共同知识:双方可能获取的相同信息;彼此都能算清楚。博弈结果:均衡策略组合;均衡行动组合。均衡:所有局中人最优策略的组合。,博弈论2009,正大光明公正無私幫助別人成就自己,17,博弈的策略型(标准型、正则型)表述:指定n个局中人,以及他们各自的纯策略空间和这些局中人各自的支付(盈利)函数我们将该博弈表示为:,3.博弈描述,博弈论2009,正大光明公正無私幫助別人成就自己,18,例:寡头竞争问题,策略型表述多适用于静态博弈。另一种表述方式是扩展式表述,两种表述形式几乎是完全等价的,但是扩展式表述更适合于讨论动态博弈。,博弈论2009,正大光明公正無私幫助別人成就自己,19,房地产开发实例双方:A,B策略:开发投资1亿元;不开发,投资0售价:高需:1.4亿元(两栋),1.8亿元(一栋);低需:0.7亿元(两栋),1.1亿元(一栋)。,博弈论2009,正大光明公正無私幫助別人成就自己,20,结果:高需,(开,不开),(0.8,0)高需,(不开,开),(0,0.8)高需,(开,开),(0.4,0.4)高需,(不开,不开),(0,0)低需,(开,不开),(0.1,0)低需,(不开,开),(0,0.1)低需,(开,开),(-0.3,-0.3)低需,(不开,不开),(0,0),博弈论2009,正大光明公正無私幫助別人成就自己,21,策略型表述:(两人有限博弈;矩阵形式),A,B,高需求情况,低需求情况?,博弈论2009,正大光明公正無私幫助別人成就自己,22,房地产博弈分析假设:同时决策;市场需求双方已知若市场需求大,双方开发,各得0.4万元。若市场需求小,依赖于对方行动。若市场不确定,依赖对市场的判断及对方行动。例:P0.5,最坏情况期望盈利500万元,开发。P0.3,对方开发概率31/40时,开发;否则,不开发。(?),博弈论2009,正大光明公正無私幫助別人成就自己,23,关键问题:对自然状态的概率估计;不同时间决策(决策顺序);对对方先验信息的估计(即估计对方对信息的掌握程度)。现实困难:对市场了解程度不同;对对方了解程度不同;如何向对方暗示自己的行动。,博弈论2009,正大光明公正無私幫助別人成就自己,24,4.博弈练习游戏一:心灵感应两个人一组,独立写出1至10之间的任意5个数。如果不重复则得奖;否则受罚。获胜的秘诀是什么?,博弈论2009,正大光明公正無私幫助別人成就自己,25,游戏二:海盗逃生有5个海盗,即将被处死刑。法官愿意给他们一个机会。从100个黄豆中随意抓取,最多可以全抓,最少可以不抓,可以和别人抓的一样多。抓得最多的和最少的要被处死。如果你第一个抓,你抓几个?,博弈论2009,正大光明公正無私幫助別人成就自己,26,游戏三:100元怎么分?,你看见两个小孩在玩耍,出于好奇,你给他们100元,让他们猜拳。猜赢者决定怎么分这100元,而输者如果同意赢者的分配比例,那么他们将各有所得,如果不同意,那么这100元,你将收回。请你替赢者考虑一下,怎样分配,赢者既得到最大利益,又能让输者也同意呢?,博弈论2009,正大光明公正無私幫助別人成就自己,27,游戏四:一元钱竞拍,给一元钱钞票开出你的价钱,使自己获益最大或损失最少;每次叫价以5分钱为单位;开价最高者得到这一元钱;出价最高和次高者一并按所开的价钱支付。斜坡上的均衡;“骑虎难下”的博弈;“协和谬误”,博弈论2009,正大光明公正無私幫助別人成就自己,28,游戏五:强盗分赃,有五个强盗抢得100枚金币,在如何分赃问题上争吵不休。于是他们决定:(1)抽签决定自己的号码(1,2,3,4,5);(2)由1号提出分配方案,然后5人表决,如果方案超过半数同意就通过,否则他将被仍进大海喂鲨鱼;,博弈论2009,正大光明公正無私幫助別人成就自己,29,(3)1号死后,由2号提方案,4人表决,当且仅当超过半数同意方案通过,否则2号同样被仍进大;(4)依次类推,直到找到一个每个人都接受的方案(当然,如果只剩下5号,他当然接受一个人独吞的结果)。如果你是第一个强盗,你该如何提出分配方案才能使自己的收益最大化呢?,博弈论2009,正大光明公正無私幫助別人成就自己,30,5.关于博弈论,博弈分类:合作、非合作:是否存在一个具有约束力的协议(bindingagreement)前者强调团体理性(效率、公正、公平)后者强调个人理性(最优决策,不保证效率),博弈论2009,正大光明公正無私幫助別人成就自己,31,完全信息与不完全信息:每一个局中人对自己及其它局中人是否有完全的了解;包括局中人特征、策略空间、盈利函数等知识。动态与静态:行动的先后顺序;是否同时(或不同时但对方不知)。,博弈论2009,正大光明公正無私幫助別人成就自己,32,发展历史:1944VonNeumann同时到5:3;小猪先到4:4,博弈论2009,正大光明公正無私幫助別人成就自己,49,分析:小猪有占优策略,大猪没有,所以不存在占优均衡;在“理性”为共同知识的情况下,存在重复剔除的占优均衡,即(大猪按,小猪等)。应用:此为“多劳不多得,少劳不少得”的奇怪情形,是一种有趣的社会现象。经济学中称为“搭便车现象”,博弈论2009,正大光明公正無私幫助別人成就自己,50,无论局中人I怎样决策,局中人II与其选取策略M还不如选取策略R。对于局中人II来说,M是个劣策略。可以去掉II的“M”列。,例:,博弈论2009,正大光明公正無私幫助別人成就自己,51,假定II不选M,对于I来说M和D是劣策略。,博弈论2009,正大光明公正無私幫助別人成就自己,52,故I选择U。这时,II选择L而不选R。可以预测博弈的合理结局可能是(U,L)即(4,3)。,博弈论2009,正大光明公正無私幫助別人成就自己,53,严优均衡的局限有时无法开始累次严优的剔除;例:房地产投资中市场小的情况反常现象:盈利函数取极端值时;如果双方都存在严劣策略,从不同人开始的结果一致;与混合策略的优劣比较。,博弈论2009,正大光明公正無私幫助別人成就自己,54,分析:累次严优过程产生了唯一解(U,L)。然而,不管局中人I如何行动,局中人II取R仅比取L在盈利上差0.5。I选策略U要冒极大的风险,策略D比U更加稳健。所以,局中人I不会选U,而是选择D。稳健性。,例:,博弈论2009,正大光明公正無私幫助別人成就自己,55,3.纳什均衡定义:有n个局中人的策略式表述博弈G=S1,Sn;u1,un,策略组合s*=(s1*,si*,sn*)是一个纳什均衡,如果对于每一个i,si*是给定其它局中人选择s-i*=(s1*,si-1*,si+1*,sn*)的情况下第i个局中人的最优策略,即ui(si*,s-i*)ui(si,s-i*),siSi,i,博弈论2009,正大光明公正無私幫助別人成就自己,56,或者用另一种表述方式:si*是下述最大化问题的解:si*argmaxui(s1*,si-1*,si,si+1*,sn*),i=1,2,n。siSi结论:最优对任一参与者的任一策略成立;是一种可以自动实施的协议(self-enforcing),博弈论2009,正大光明公正無私幫助別人成就自己,57,两人有限博弈纳什均衡的确定例:用表上作业法寻找nash均衡,博弈论2009,正大光明公正無私幫助別人成就自己,58,对纳什均衡的理解“一致性”特征:局中人预测到均衡;局中人也预测到其它人预测到均衡;没有局中人有兴趣作不同的选择。是局中人的一致性预测;但不一定最好。,博弈论2009,正大光明公正無私幫助別人成就自己,59,与严优均衡的关系:(1)每个占优均衡、重复剔除的占优均衡一定是纳什均衡,反之则不然。(2)纳什均衡一定是在重复剔除严劣策略过程中没有剔除的策略组合,反之则不然。(3)纳什均衡有强弱之分。强纳什均衡;弱纳什均衡。允许弱劣策略存在。,博弈论2009,正大光明公正無私幫助別人成就自己,60,例:市场进入博弈参与人:在位者;进入者策略:在位者:默许、斗争;进入者:进入、不进入。假定:进入之前的垄断利润为300,进入之后寡头利润为100,进入成本为10。,博弈论2009,正大光明公正無私幫助別人成就自己,61,纳什均衡分析:(进入,默许)是强纳什均衡,(不进入,斗争)是弱纳什均衡。,博弈论2009,正大光明公正無私幫助別人成就自己,62,重复剔除弱劣策略方法:“斗争”是在位者的弱劣战略被剔除,(进入,默许)是唯一重复剔除的占优均衡;纳什均衡(不进入,斗争)将被剔除掉。说明(弱)纳什均衡允许弱劣战略存在。,博弈论2009,正大光明公正無私幫助別人成就自己,63,4.纳什均衡应用举例(1)消耗战(鹰鸽博弈)两只老虎为争夺猎物对峙。都坚持则猎物腐烂;一方放弃则归另一方;都放弃则都得不到猎物。猎物价值f,僵持成本为c。(对称博弈与对称均衡),博弈论2009,正大光明公正無私幫助別人成就自己,64,(2)性别战(协调博弈)一对情侣周末安排,女方喜欢音乐会,男方喜欢足球赛。情侣陪伴看喜欢的为最好,陪情侣看自己不喜欢的为次之,各自看自己喜欢的又次之,各自看不喜欢的最糟糕。,博弈论2009,正大光明公正無私幫助別人成就自己,65,(3)协同作业1两人合作,报酬相同为v。两人同时用力,代价为cl;只有一人用力,代价为ch。cl=0(图?)最优反应函数:ai*(aj)=(c+aj)/2联立求Nash均衡得:a1=a2=c,博弈论2009,正大光明公正無私幫助別人成就自己,67,(5)Cournot寡头竞争模型Cournot,1838,完全信息静态博弈。参与人:企业1和企业2;企业策略:选择产量;支付:利润,是两个企业产量的函数。,博弈论2009,正大光明公正無私幫助別人成就自己,68,第i个企业的产量:成本函数:价格函数:第i个企业的利润函数:,博弈论2009,正大光明公正無私幫助別人成就自己,69,对每个企业的利润函数求导并令其等于零:分别定义了两个反应函数:结论:每个企业的最优战略(产量)是另一个企业产量的函数。,博弈论2009,正大光明公正無私幫助別人成就自己,70,两个反应函数的交叉点就是纳什均衡:,博弈论2009,正大光明公正無私幫助別人成就自己,71,考虑上述模型的简单情况:设,价格函数取线性形式:最优化的一阶条件分别为:,博弈论2009,正大光明公正無私幫助別人成就自己,72,反应函数为:解两个反应函数,得纳什均衡为:每个企业的纳什均衡利润分别为:,博弈论2009,正大光明公正無私幫助別人成就自己,73,与垄断情况作比较:垄断企业的问题:垄断企业的最优产量:垄断利润:,博弈论2009,正大光明公正無私幫助別人成就自己,74,结论:(1)寡头竞争的总产量大于垄断产量的原因,在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。(2)易证明,双方串谋成立卡特尔是不稳定的,双方都有欺骗的动机。(?),博弈论2009,正大光明公正無私幫助別人成就自己,75,(6)自学伯川德模型多党竞选;事故赔偿法;公共地悲剧;争议仲裁;合作性谈判;报案;专家诊断;,博弈论2009,正大光明公正無私幫助別人成就自己,76,5.混合策略纳什均衡例:社会福利博弈(父母与懒惰儿子)参与人:政府;一个流浪汉政府策略:救济、不救济;流浪汉策略:找工作、流浪,博弈论2009,正大光明公正無私幫助別人成就自己,77,支付矩阵:,博弈论2009,正大光明公正無私幫助別人成就自己,78,假定:政府的混合策略流浪汉的混合策略则政府的期望效用函数为:,博弈论2009,正大光明公正無私幫助別人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论