




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、博弈论:原理、模型与教程第一部分完全信息静态博弈第 2 章 Nash 均衡本章将通过分析理性参与人在博弈中的 选择行为 ,探讨完全信息静态问题的求解,并给出 完全信息静态博弈的解 Nash均衡。2.1占优行为(已精细订正!)首先考察博弈论中最为经典的一个博弈模型“囚徒困境”( prisoners dilemma )博弈 。两个小偷作案后被警察抓住, 分别关在不同的屋子里审讯。 在审讯之前,小头偷从律师那里得知: 如果两个人都坦白,将被个判刑 4 年;如果两个人都抵赖,将会因为证据不足而各判 1年;如果其个一人坦白另一人抵赖, 坦白的讲将会得到宽大处理而被无罪释放, 而抵赖的将被重刑,判刑 6
2、年。试问两个小偷将会如何选择?上述“囚徒困境” 博弈问题是 Tucker 在 20 世纪 50 年代提出的,该问题不仅“可以作为实际生活中许多现象的一个抽象概括” ,而且对它的研究在一定程度上也奠定了非合作博弈论的理论基础。在“囚徒困境”博弈问题中,参与人是两个小偷,参与人的战略都是:坦白和抵赖,支付就是在各种选择下所得到的刑期。图 2-1 给出了“囚徒困境”博弈问题的战略式描述 。小偷 2坦白抵赖坦白-4, -40, -6小偷 1抵赖-6, 0-1, -1图 2-1 “囚徒困境”博弈显然,在“囚徒困境博弈”中,小偷选择的结果不仅与自己的选择有关,而且与另一小偷的选择有关,那么小偷如何选择呢?
3、不妨这样考虑小偷的 决策过程: 假设对方坦白,自己该怎么做;假设对方抵赖,自己应该怎么做。也就是,给定另一小偷的决策,寻找自己的 最优决策 。对于每个小偷,当对方坦白时,自己坦白得4 ,抵赖得6 ,所以应该选择“坦白” ;而当对方抵赖时,自己坦白得0 ,抵赖得1,所以还是应该选择“坦白” 。 也就是说,无论对方如何选择,每个小偷都会选择 “坦白”。因此,博弈的结果就是两个小偷都选择 “坦白”。两个小偷都选择 “坦白”,这样的结果似乎与我们的直觉相矛盾。因为在“囚徒困境”的 4 种结果 (即 (坦白 ,坦白 ) 、 (坦白 , 抵赖 ) 、(抵赖 ,坦白 ) 、(抵赖 ,抵赖 ) )中,虽说不能
4、肯定 (坦白 ,坦白) 这个结果是最差的,但它显然不如 (抵赖 , 抵赖 ) 。这是因为 (坦白 ,坦白 ) 导致两个小偷都得 4 ,而 (抵赖 ,抵赖 ) 却能使大家都得 1 ,也就是说, (抵赖, 抵赖) 是 Pareto 优于 (坦白 ,坦白) 的。既然选择“抵赖”对双方都有好处,那么两个小偷是否都会选择 “抵赖”呢?只要小偷是前面所假设的完全理性的参与人,答案就是否定的。不妨假设两个小偷都选择“抵赖” ,现在分析小偷的这种选择是否是理性的。 对小偷 1 而言,小偷 2 选择“抵赖”的情况下,自己选择“抵赖”得 1,选择“坦白”得 0 ,显然“坦白”优于“抵赖” 。因此,理性的小偷 1
5、将会偏离“抵赖”而选择“坦白” 。基于同样的原因,理性的小偷 2 也会偏离“抵赖”而选择“坦白” 。除了 (坦白 ,坦白) 和 (抵赖 ,抵赖 ) 以外,“囚徒困境” 是否会出现其他结果呢? 比如说一个人坦白,一个人抵赖?我们说这样的结果也是不会出现的,因为在对方选择“坦白”的情况下,自己选择“抵赖”显然是不理性的。剩下的问题是: 当两个小偷都选择 “坦白”时,是否有人偏离 “坦白”而选择“抵赖” 。基于同样的分析,两个小偷只要是理性的,这种情况就不会发生1。因此,虽然结果(抵赖 ,抵赖 ) 是结果 (坦白 ,坦白 ) 的1也许有人会问:如果两个小偷在被抓之前就制定攻守同盟 ,决定双方选择“抵
6、赖”,这是否可以是博弈的结果为(抵赖 , 抵赖 ) 呢?这要取决于 “攻守同盟” 对双方是否具有约束力 ,是否对双方的支付产生影响。只要这种“攻守同盟”对双方的选择没有约束力,不能对违Pareto 改进(即所有的人都得到好处) ,但只要两个小偷是理性的,这种对所有人都有好处的 “改进” 两人都无法得到。 这也反映出现实生活中经常出现的“个人理性与集体理性间的矛盾” 。事实上,“囚徒困境”在现实生活中有着许多应用。也许“囚徒困境”博弈是人们虚构出来的一个博弈模型,但在现实生活中与 “囚徒困境” 相似的情形却很多。 例如,寡头垄断市场上厂商间的价格大战,就是典型的“囚徒困境“。20 世纪 90 年
7、代末期我国出现的彩电企业间的价格大战就是这种情形, 还有目前人们议论比较多的有关中小学生教育方式的选择。 家长明知道素质教育对孩子的长远发展更有益处,但为了应付各种各样的升学考试,也不得不让孩子参与各种名目的“模拟考试”或“考试培训” ,这也是典型的“囚徒困境” 。诸如此类的例子,现实生活中还有很多。背协议(即“攻守同盟” )的参与人的支付产生影响,理性的参与人都会选择偏离“抵赖”而选择“坦白” 。进一步分析“囚徒困境”中小偷的战略,可以发现战略“坦白”具有这样的特点: 无论对方怎样选择(选择“坦白”或者“抵赖” ),“坦白”总是理性小偷的最优战略。考察更一般的n 人博弈情形。 n 人博弈中,
8、参与人i (i1,2, n) 的支付 uiui (si , s i ) 既与自己的选择si 有关,也与其他参与人的选择s i 有关。因此,在一般情况下,使某参与人的支付uiui (si , s i ) 最大化的最优战略 si 与其他参与人的选择s i 有关。但在某些特殊情况下, 如“囚徒困境”博弈中,可能会出现这样的情况:参与人i (i1,2,n) 的最优战略 si 与其他人参与人的s i 无关。也就是说,无论其他参与人选择什么战略,参与人的最优战略总是唯一的。 这样的最优战略称为 “占优战略”(dominant strategy ), 如“囚徒困境”中参与人的“坦白”战略。定义 2-1在 n
9、 人博弈中,如果对于所有的其他参与人的选择s i ,sin都是参与人 i 的最优选择,即 si Si (si si ), s i j1Sj ,有jiui (si , s i )u(si , s i )则称 si 为参与人 i 的占优战略 。显然,在一个博弈问题中, 如果某个参与人具有占优战略, 那么只要这个参与人是理性的, 他肯定就会选择他的占优战略, 参与人的这种选择行为称为 占优行为 。占优行为是理性参与人选择行为的最基本特征。【例 2-1 】 考察图 2-2 所示的战略式博弈,其中参与人 1 有两个战略 a1 和 a2 ,参与若有四个战略 b1 , b2 ,b3 和 b4 。在参与人 2
10、 的四个战略中,战略 b3 是参与人 2 的占优战略 。参与人 2b1bb3b42a参与人 1a122, 1-2, -61, 20, 13, 0-1, 23, 3-1, -2图 2-2 战略式博弈更进一步,如果所有的参与人都具有占优战略,那么只要参与人是理性的,肯定都会选择自己的占优战略, 在这种情况下, 博弈的结果就由参与人的占优战略共同决定。 像这种由参与人的占优战略共同决 定 的 博 弈 结 果 , 称 为 占 优 战 略 均 衡 ( dominant-strategy equilibrium )。定义 2-2在 n 人博弈中,如果对所有参与人 i (i 1,2, ,n) ,都存在占优战略si ,则占优战略组合 s ( s1 , s2 , , sn ) 称为占优战略均衡 。显然,在一个博弈问题中,如果所有参与人都有占优战略存在,那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈结果。例如,在“新产品开发博弈”中,当市场需求大时,在完全信息静态的“新产品开发博弈”中(见图1-2 ),企业 1 和 2 都有占优战略“开发”,因此博弈的结果为占优战略均衡(开发,开发)2。【例 2-2 】 考察图 2-3 中的战略式博弈,其中参与人 1 有占优战略 a2 ,参与人 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四川省绵阳富乐国际重点达标名校2025年招生统一考试模拟(一)数学试题含解析
- 石阡县2025届三下数学期末统考试题含解析
- 上海外国语大学附中2024-2025学年高三毕业班适应性考试化学试题含解析
- 浙江省衢州市常山县2025届初三第二学期化学试题统练八试题含解析
- 企业单位劳动合同
- 销售利润分成合同协议书范本
- 安徽卓越县中联盟皖豫名校联盟历史答案
- 货运代理从业人员合同谈判与签订考试
- 珠海二手房买卖合同指南
- 幼儿舞蹈的审美特征
- 186F曲轴的设计与校核计算
- 医学与人文-PPT课件
- 法律职业资格考试2023年历年真题及答案完整版
- 上海安装监理工程师复习题 (JS安装)
- 中考语文名著导读红岩复习资料
- 小学生天文知识竞赛复习题库及答案
- 土方填筑碾压试验方案(完整版)
- 往日时光(原版)钢琴双手简谱_钢琴谱_钢琴简谱
- RCS-985说明书V300
- 2014—2015—2《刑法总论》教学大纲(修正版)
- 《焦虑症基础知识》PPT课件.ppt
评论
0/150
提交评论