




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
博弈论专题一、基本概念1、参与人;2、行动;3、信息;4、战略;5、支付函数6、结果;7、均衡;二、分类1、静态博弈:参与人同时参与选择行动。2、动态博弈:参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。3、完全信息:每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识。4、不完全信息:每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数没有准确的知识。
行动顺序信息静态动态完全信息完全信息静态博弈(纳什均衡)、纳什完全信息动态博弈(子博弈精炼纳什均衡)、泽尔腾不完全信息不完全信息静态博弈(贝叶斯纳什均衡)、海萨尼不完全信息动态博弈(精炼贝叶斯纳什均衡)、泽尔腾博弈的分类及对应的均衡概念所谓博弈均衡指博弈中所有参与者都不想改变自己的策略的这样一种状态。沙滩买冰淇淋的两商贩博弈均衡纳什均衡:1、如果A的选择是给定的,则B的选择是最优的;如果B的选择是给定的,则A的选择是最优的;这样策略组合的均衡为纳什均衡;2、它是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,即给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略,从而没有任何人有积极性打破这种均衡,即僵局。10,106,1212,68,8合作不合作不合作合作甲乙占优策略均衡占优策略均衡:由博弈中的所有参与者的占优策略组合所构成的就是占优策略均衡。(一)、纳什均衡经典例子:1、囚徒困境:-8,-80,-10-10,0-1,-1坦白抵赖抵赖坦白囚徒A囚徒B-8,-80,-10-10,0-1,-1降价不降价不降价降价厂商A厂商B厂商价格策略均衡-8,-80,-10-10,0-1,-1竞赛不竞赛不竞赛竞赛国家A国家B国家军备竞赛策略均衡-8,-80,-10-10,0-1,-1吵架不吵架不吵架吵架丈夫妻子夫妻竞赛策略均衡2、智猪博弈:5,14,49,-10,0按等待等待按大猪小猪5,14,49,-10,0搜集等待等待搜集大股东小股东5,14,49,-10,0研发等待等待研发大企业小企业2,10,00,01,2足球芭蕾芭蕾足球男女3、性别战:先动优势:若男的买票,两人就会出现在足球场;若女的买票,两人就会出现在芭蕾舞厅;-3,-32,00,20,0进退退进AB4、斗鸡博弈:-3,-32,00,20,0吵躲躲吵丈夫妻子夫妻博弈:40,50-10,00,3000,300默许斗争不进入进入进入者在位者5、市场进入阻挠0,44,05,34,00,45,33,53,56,6.寻找纳什均衡:2,30,23,41,12,7.4,54,3.5,16,22,18,43,63,09,62,8重复优势解法:逐次删去劣势策略。(二)、完全信息动态博弈:子博弈精炼纳什均衡1、纳什均衡存在的问题:(1)一个博弈可能有不止一个纳什均衡,哪一个会发生并不知道;(2)静态博弈时,不考虑自己的策略对对手的影响,动态博弈中必须进行考虑。(3)纳什均衡允许了不可置信威胁的存在。在市场进入的例子中,如果在位者摆出一幅“你进入我就斗争”的架式,(不进入,斗争)便成为一个纳什均衡。40,50-10,00,3000,300默许斗争不进入进入进入者在位者2、泽尔腾的贡献(1)针对静态纳什均衡的问题,泽尔腾对动态博弈进行了分析,定义了子博弈精炼纳什均衡。将纳什均衡中不可置信威胁战略剔除出去,使均衡战略不再包含不可置信的威胁。它要求参与人的决策在任何时点上都是最优的。决策者要“应变”,而不是“固守”。(2)扩展性博弈形式的5个要素:参与人;每个参与人选择行动的时点;每个参与人在每次行动时可供选择的行动集合;每个参与人在每次行动时有关对手过去行动选择的信息;支付函数。博弈树——是扩展型的一种形象化表述。“子博弈”进入者合作不进入在位者斗争(40,50)(-10,0)(0,300)进入市场进入阻挠博弈树(3)、概念:一个纳什均衡称为精炼纳什均衡,当且只当参与人的战略在每一个子博弈中都构成纳什均衡,即组成精炼纳什均衡的战略必须在每一个博弈中都是最优的。因此,(进入,斗争)不是一个精炼纳什均衡,而(进入,合作)是惟一的子博弈精炼纳什均衡。*“不可置信——承诺行动”的例子:谈恋爱;破釜沉舟;红军、白军抢占小岛,炸桥断后路;80,80.70,5960,9059,70努力不努力不严严老师学生承诺行动:严!!!(三)不完全信息静态博弈:贝叶斯纳什均衡市场进入的例子——进入者知道在位者的偏好、战略空间及各种战略组合下的利润水平。如果进入者实际上并不完全了解在位者的生产函数、成本函数及偏好,这就是不完全信息博弈。设想在位者成本函数有两种可能的情况,对应于这两种情况的支付矩阵分别如表一和表二:解释:在给定进入者选择进入的情况下,高成本在位者的最优战略是默许,而低成本在位者的最有战略是斗争。低成本情况下斗争之所以比默许优,可能是由于在位者的生产成本是如此低,从而他在非常低的价格下获得的垄断利润也高于相对高的价格下分享到的寡头利润;也可能在位者有一种好斗的天性,他更乐于与进入者斗争而不是合作。40,50-10,00,3000,300默许斗争不进入进入进入者在位者表一:市场进入:高成本情况30,100-10,1400,4000,400默许斗争不进入进入进入者在位者表一:市场进入:低成本情况在1967年以前,遇到这种不知对手的选择情况,自己的战略自然无法选择,因此相应的问题无法解决。海萨尼的贡献在于引进了一个虚拟的参与人—“自然”,使得上述情况可以分析。自然首先行动——选择参与人的类型,被选择的参与人知道自己的真是类型,而其他参与人并不清楚这个被选择的参与人的真是类型,仅知道各种可能类型的概率分布。另外,被选择的参与人也知道其他参与人心目中的这个分布函数,即分布函数是一种共同知识(commonknowledge)。在市场进入的这个例子中,“自然”首先选择在位者的类型——高成本还是低成本;在位者本人知道自己究竟是高成本还是低成本,而进入者仅知道在位者或者高成本,或者是低成本,并且,知道高成本和低成本的可能性各为多少。海萨尼把“不完全信息博弈”转换成“完全但不完美信息博弈”。贝叶斯是一位概率统计学家,贝叶斯均衡是纳什均衡在不完全信息博弈中的自然扩展。贝叶斯纳什均衡是这样一种类型战略组合——给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说,没有人有积极性选择其他战略。以市场进入为例:进入者知道高成本的可能性为x,低成本的可能性为(1-x)。那么,进入者选择进入得到的期望利润为40x+(-10)(1-x);选择不进入的期望利润为零。当x>0.20时,进入得到的期望利润才大于不进入时的期望利润,从而,进入才是最优的。即x大于0.20,那么,贝叶斯纳什均衡是——进入者选择进入,高成本在位者选择默许,低成本在位者选择斗争。40,50-10,00,3000,300默许斗争不进入进入进入者在位者高成本30,100-10,1400,4000,400默许斗争不进入进入进入者在位者低成本100,100-50,00,00,0接受不接受不求爱求爱求爱者你表一:求爱博弈:品德优良者求爱100,-100-50,00,00,0接受不接受不求爱求爱求爱者你表二:求爱博弈:品德恶劣者求爱假设你认为求爱者品德优良的概率为x。求爱者也知道这个x为多少。则他求爱你接受时你的期望效用为100x+(-100)(1-x);你不接受时你的期望效用为零。当x>1/2时,你接受才是最优选择。如果x确实小于1/2,贝叶斯纳什均衡是——求爱者不求爱,你不接受。原因在于他知道他求爱会被你拒绝,这种损脸面(-50)的事是不值得干的。(四)不完全信息动态博弈:精炼贝叶斯均衡精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为来修正自己有关后者类型的“信念”(主观概率),并由此来选择自己的行动。精炼贝叶斯均衡是所有参与人战略和信念的一种结合,它满足如下条件:(1)给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得的。1、张三与你(恃强欺弱、早餐——辣椒)2、黔驴技穷(五)纯策略、混合策略及混合策略的均衡纯策略:每个行为人只作出一个选择并始终坚持这个选择,这种策略叫做纯策略;混合策略:允许行为人使他们的策略随机化——对每项选择都制定一个概率,按照这些概率作出他们的选择;混合策略的均衡:每个行为人都选定了最优频率,并在另一个行为人的频率选择给定的情况下按照这个最优频率采取他的策略;计算题计算题:求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡?2,10,21,23,0LRBT博弈方1博弈方2解:设博弈方1采用T策略的概率为p,则采用B策略的概率为(1-p);再设博弈方2采用策略L的概率为q,那么采用策略R的概率是(1-q)。根据上述概率分别计算两个博弈方采用各自两个纯策略的期望得益,并令它们相等:因此,纳什均衡为博弈方1以概率分布2/3和1/3在T和B中随机选择;博弈方2以概率分布3/4和1/4在L和R中随机选择。两寡头古诺模型,,P为市场出清价格,两个厂商的边际成本不同,分别为。如果,问纳什均衡产量各为多少?如果,则纳什均衡产量又各为多少?解:两个厂商的利润函数为:将利润函数对产量求导并令其等于0得:解得两个厂商的反应函数为:具体写成:当时,根据上述两个厂商的反应函数,直接求出两个厂商的纳什均衡产量分别为:q1,q2都大于0;当时,根据反应函数求出来的厂商2产量。这意味着厂商2不会生产,这是厂商1成了垄断厂商,厂商1的最优产量选择是利润最大化的垄断产量:因此这种情况下的纳什均衡为课后第一题:解:0,0-1,11,-11,-10,0-1,1-1,11,-10,0剪刀剪刀石头石头布布求纳什均衡?解:当2选择剪刀、石头和布时,三者的期望收益相等,即同理:当1选择剪刀、石头和布时,三者的期望收益相等,即思考题:
比较分析完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,并举例说明?总需求为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年邯郸科技职业学院单招职业倾向性测试题库汇编
- 2025年湖南艺术职业学院单招职业技能测试题库汇编
- 2025年湖南机电职业技术学院单招职业倾向性测试题库1套
- 2025年河北省安全员B证考试题库及答案
- 人体机能复习试题含答案
- 神经康复练习卷附答案
- 中级电子商务师复习测试卷含答案
- 中医考试复习测试附答案
- 2025年广东松山职业技术学院单招职业倾向性测试题库完整版
- 2025年湖南中医药高等专科学校单招职业技能测试题库学生专用
- 新版高中物理必做实验目录及器材-(电子版)
- (正式版)SHT 3551-2024 石油化工仪表工程施工及验收规范
- 高考古代诗歌鉴赏复习教案
- 负数的认识1202
- After-Effects影视特效设计教程完整版全套ppt课件
- 中国铁塔建设维护工作培训PPT通用通用课件
- 新视野大学英语第三版Book 2 Unit 1 Text A
- 医疗设备清单
- 《夏夜多美》课件(ppt)
- SHD干燥机说明书(英)
- 蓝色卡通风格研学旅行报告PPT讲座学习
评论
0/150
提交评论