博弈论模板PPT课件

上传人：优*** IP属地：广东上传时间：2020-04-21 格式：PPT 页数：60 大小：668KB 积分：68 举报 版权申诉

已阅读5页，还剩55页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 上次内容回顾博弈论的定义什么是博弈博弈的要素参与人策略集和效用共同知识假设博弈论的知识体系完全信息静态博弈及其表示占优策略和占优均衡严劣策略和重复剔除严劣策略均衡 2 局中人2LRU局中人1MD Nodominantstrategiesanddominatedstrategies whatabouttheresult 3 BestResponse BR UdoesbestagainstL MdoesbestagainstR 4 L R概率为0 5时 ExpectedpayoffofU 2 5ExpectedpayoffofM 2 5ExpectedpayoffofD 3此时 Ddoesbest 5 假定1认为2选择r的概率为p r 则1选U M D的期望收益分别为 Eu1 U p r 1 p r 5 p r 0Eu1 M p r 1 p r 1 p r 2Eu1 D p r 1 p r 4 p r 2 6 7 BR是期望收益最大时的反应图中x 1 3 y 3 5由图可知 p r 1 3时 1的最佳反应是选U 1 3 p r 3 5时 1的最佳反应是选D p r 3 5时 1的最佳反应是选M 8 9 点球博弈 10 11 PartnershipGame 2人拥有一家公司每人分享利润的一半每人的策略精力投入水平 Si 0 4 利润 4 S1 S2 bS1S2 b 0 1 4 U1 2 S1 S2 bS1S2 S1S1U2 2 S1 S2 bS1S2 S2S2 12 参与人的BR是什么 13 b 1 4时 14 15 纳什均衡 16 NashEquilibrium Theactionprofiles isaNashEquilibriumif foreveryplayeriandeveryactionsiofplayeri s isatleastasgoodasaccordingtoplayeri spreferencesasthetheactionprofile si s i inwhichplayerichoosessi whileeveryotherplayerchooses i Equivalently foreveryplayeri ui s ui si s i Foreveryactionofplayeri 17 DefinitionInthen playergameG S1 Sn u1 un thestrategiesprofile s1 sn areaNashequilibriumif foreachplayeri si is atleasttiedfor 至少不劣于 playeri sbestresponsetothestrategiesspecifiedforthen 1otherplayers s1 sn 1 sn 1 sn ui s1 sn 1 si sn 1 sn ui s1 sn 1 si sn 1 sn NE 18 foreveryfeasiblestrategysiinSi Thatis si solvesmaxui s1 sn 1 si sn 1 sn si Si上述均衡概念是1951年由数学家约翰纳什 JohnNash 首先提出的称为纳什均衡 19 纳什均衡 NashEquilibrium 定义对于一个策略式表述的博弈G N Si ui i N 称策略组合s s1 si sn 是一个纳什均衡如果对于每一个i N si 是给定其他参与人选择s i s1 si 1 si 1 sn 情况下参与人i的最优策略经济理性策略即 ui si s i ui si s i 对于任意的si Si 任意的i N均成立 20 纳什均衡的通俗定义纳什均衡是一种策略组合给定对手的策略每个参与人选择自己的最优策略 21 1Ifgametheoryistoprovideauniquesolutiontoagame theoreticproblemthenthesolutionmustbeaNashequilibrium inthefollowingsense Supposethatgametheorymakesauniquepredictionaboutthestrategyeachplayerwillchoose Inorderforthispredictiontobecorrect itisnecessarythateachplayerbewillingtochoosethestrategypredictedbythetheory 22 Thuseachplayer spredictedstrategymustbethatplayer sbestresponsetothestrategiesoftheotherplayers Suchapredictioncouldbecalledstrategicallystableorself enforcing becausenosingleplayerwantstodeviatefromhisorherPredictedstrategy WewillcallsuchapredictionaNashequilibrium RobertGibbons 23 2一种稳定的策略组合当所有参与人的选择公开以后每个人都满意自己作出了正确的选择没有人能得到更好的结果了在博弈论中这种结果被称为NE 24 3NE的哲学含义 n个参与人在博弈之前协商达成一个协议规定每一个参与人选择一个特定的策略问题是给定其他参与人都遵守该协议在没有外在强制的情况下是否有人选择不遵守 25 只有当遵守协议带来的效用大于不遵守时参与人才会遵守如果没有任何参与人有积极性不遵守这个协议该协议是可以自动实施的 self enforcing 构成纳什均衡否则就不是纳什均衡 26 4纳什均衡是一种策略组合每个参与人的策略是对其他参与人策略的最优反应纳什均衡是博弈将会如何进行的一致 consistent 预测如果所有参与人预测特定纳什均衡会出现那么没有参与人有动力采用与均衡不同的行动 27 纳什均衡也只有纳什均衡一致预测性任何非纳什均衡的出现意味着至少有一个参与人犯了错或者是对对手行动的预测上犯了错或者是给定那种预测在最大化自己的收益时犯了错 JeanTirole 28 纳什均衡的一致预测性如果所有参与方都预测一个特定的博弈结果会出现那么所有的参与方都不会利用该预测或者这种预测能力来选择与预测结果不一致的策略即没有哪个参与方有偏离这个预测结果的愿望因此这个预测结果最终就真会成为博弈的结果一致的意义在于各博弈方的实际行为选择与他们的预测一致 29 假设各参与方预测的策略组合相同以及各参与方都是完全理性的也就是不会犯错误的情况下不可能预测任何非纳什均衡是博弈的结果 30 纳什均衡的立法意义纳什均衡是一种稳定局面给定别人遵守协议的情况下没有人有积极性偏离协议规定如果一个协议不构成纳什均衡它就不可能自动实施因为至少有一个人会违背这个协议不满足纳什均衡要求的协议是没有意义的 31 立法的目标与其实施的结果要一致必须使得参与博弈的各方达到纳什均衡否则立法就仅仅是正式或官方规则而实际有效的支配人们的是潜规则纳什均衡的立法意义 32 纳什均衡的立法意义潜规则的要害是三方博弈私下达成默契的双方蒙骗正式制度和公正原则的代表预测是博弈分析最基本的目的之一纳什均衡的一致预测性质是其预测能力的基本保证 33 纳什均衡应用的局限性我们对纳什均衡应用的广泛性和有效性不能过分夸大尽管纳什均衡非常重要但不是说学到了这种分析方法你就能预测所有博弈的结果纳什均衡分析仅仅保证个体理性的智能人的博弈结果是唯一纯策略纳什均衡时的预测纳什均衡分析并不能保证对所有博弈的结果都作出准确的预测 34 纳什均衡应用的局限性现实中的博弈可能是下面三种情况之一有许多博弈不存在纯策略纳什均衡有些博弈是多重纳什均衡博弈方可能是集体理性或有限理性 35 36 ExistenceofNashEquilibrium Nash在1950年证明任何有限博弈都至少存在一个NE Theorem Nash1950 Inthen playernormal formgameG S1 Sn u1 un ifnisfiniteandSiisfiniteforeveryithenthereexistsatleastoneNashequilibrium possiblyinvolvingmixedstrategies 37 Wilson 1971 证明几乎所有有限博弈都存在有限奇数个NE 包括纯策略NE和混合策略NE OddnessTheorem 38 纳什于1950年提出并证明了纳什定理纳什定理的主要内容为在一个有n个参与人的策略式博弈G S1 Sn u1 un 中如果n是有限的且Si是有限集 i 1 n 则该博弈至少存在一个纳什均衡在混合策略意义下纳什定理 39 纳什定理的一些说明纳什定理的证明要用到不动点定理所谓不动点定理是指一个定义在X X上的函数f x 集合X是非空的闭的有界的和凸的函数f是连续的则至少存在一个x 使得f x x x被称为不动点 40 纳什定理的一些说明运用不动点定理证明纳什定理的主要步骤是设计一个策略组合空间上的一个映射说明该映射的任何不动点都是一个纳什均衡使用不动点定理证明这个映射一定存在一个不动点 41 不动点什么是不动点呢想像有一个容器里面充满了大量的小球现在用一个勺子任意搅拌这容器里的小球搅拌过后每一个小球都重新占据了容器中的一个位置如果某个小球的新位置和旧位置重合那么这个小球就是一个不动点数学里面有一类经典的定理说的是这样的不动点总是存在的无论你怎么搅拌总有这样的不动点小球以不变应万变终点又回到起点 42 纳什定理的一些说明映射选择的是n人最优反应对应其含义是对于任意一个混合策略组合 p1 pn 对于每一个参与人i 求出I针对其他参与人混合策略 p1 pi 1 pi 1 pn 的最优反应然后构建n个参与人最优反应对应的卡氏积一个最优混合策略组合就是这一对应集的不动点 43 纳什定理的一些说明因此只要证明前面的最优反应对应满足不动点定理条件就可以了 44 纳什均衡 NashEquilibrium 纳什均衡占优均衡重复剔除严劣策略均衡的关系定理a每一个占优均衡重复剔除严劣策略均衡一定是纳什均衡但反过来不一定成立定理b纳什均衡一定不能通过重复剔除严劣策略方法剔除下面对上述定理进行简要证明 45 两个定理的证明首先证明定理b 纳什均衡一定不能通过重复剔除严劣策略方法剔除记纳什均衡时的策略组合为s s1 si sn 用反证法假定纳什均衡在重复剔除严劣策略均衡中被剔除掉不失一般性假设s1 是s 中被首先剔除的策略则在S1中一定存在一个尚未被剔除的策略s1 相对参与人1而言严格优于s1 46 两个定理的证明于是根据重复剔除严劣策略定义对于此时所有尚未被剔除的其他参与人的任意一个策略组合s 1 s2 si sn 均成立ui s1 s 1 ui s1 s 1 47 两个定理的证明由于前面分析中假设策略s1 是s s1 si sn 中首先被剔除的策略因此在s1 被剔除的时候 s2 si sn 尚未被剔除自然满足式这显然与s 是NE矛盾 48 下面开始证明定理a 重复剔除严劣策略均衡一定是纳什均衡反证法假设重复剔除严劣策略后只剩下唯一的一个策略组合s s1 si sn 但却不是NE 则存在一个s1 S1 使得下列事实成立u1 s1 si sn u1 s1 si sn 但由于 s1 si sn 在中间过程中被剔除而s 是被保留下来的唯一一个策略组合两个定理的证明 49 按照严劣策略的定义有u1 s1 si sn u1 s1 si sn 比较左右两式可以得出矛盾两个定理的证明 50 划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策即自己的可选策略中与其他博弈方的策略或策略组合配合给自己带来最大得益的策略这种相对最佳策略总是存在的不过不一定唯一然后在此基础上通过对其他博弈方策略选择的判断包括对其他博弈方对自己策略判断的判断等预测博弈的可能结果和确定自己的最优策略这就是划线法 51 图1 8 52 箭头法箭头法对于理解博弈关系很有好处是寻找相对稳定性策略组合的分析方法对博弈中的每个策略组合进行分析考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益如能则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组最后综合对每个策略组合的分析情况形成对博弈结果的判断划线法和箭头法的结果是一致的可以相互替代 53 小鸡博弈 thegameofchicken 汤姆和吉米进

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论模板PPT课件

文档简介

温馨提示

最新文档

评论

博弈论模板PPT课件

文档简介

温馨提示

最新文档

评论

相关文档