版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
上次内容回顾博弈论的定义什么是博弈博弈的要素(参与人、策略集和效用)共同知识假设博弈论的知识体系完全信息静态博弈及其表示占优策略和占优均衡严劣策略和重复剔除严劣策略均衡12局中人2LRU局中人1MD5,10,21,34,14,22,3Nodominantstrategiesanddominatedstrategies,whatabouttheresult?BestResponse(BR)3UdoesbestagainstL;MdoesbestagainstRL、R概率为0.5时ExpectedpayoffofU:2.5ExpectedpayoffofM:2.5ExpectedpayoffofD:3此时,Ddoesbest。4假定1认为2选择r的概率为p(r),
则1选U、M、D的期望收益分别为
Eu1(U,p(r))=(1-p(r))×5+p(r)×0
Eu1(M,p(r))=(1-p(r))×1+p(r)×2
Eu1(D,p(r))=(1-p(r))×4+p(r)×256)BR是期望收益最大时的反应
图中x=1/3,y=3/5由图可知,p(r)≤1/3时,1的最佳反应是选U;1/3≤p(r)≤3/5时,1的最佳反应是选D;p(r)≥3/5时,1的最佳反应是选M。78点球博弈910PartnershipGame2人拥有一家公司,每人分享利润的一半每人的策略:精力投入水平,Si=[0,4]利润:4×[S1+S2+bS1S2]b=[0,1/4]U1=2×[S1+S2+bS1S2]-S1S1U2=2×[S1+S2+bS1S2]–S2S211参与人的BR是什么?1213b=1/4时14纳什均衡1516NashEquilibriumTheactionprofiles*isaNashEquilibriumif,foreveryplayeriandeveryactionsiofplayeri,s*isatleastasgoodasaccordingtoplayeri’spreferencesasthetheactionprofile(si*,s-i*)inwhichplayerichoosessi*whileeveryotherplayerchooses-i*.Equivalently,foreveryplayeri,ui(s*)≥ui(si,s-i*),Foreveryactionofplayeri17DefinitionInthen-playergameG={S1,…,Sn;u1,…,un},thestrategiesprofile(s1*…,sn*)areaNashequilibriumif,foreachplayeri,si*is(atleasttiedfor(至少不劣于))playeri’sbestresponsetothestrategiesspecifiedforthen-1otherplayers,(s1*…,sn-1*,sn+1*,…,sn*):ui(s1*…,sn-1*,si*,
sn+1*,…,sn*)
≥ui(s1*…,sn-1*,si
,
sn+1*,…,sn*)(NE)
18foreveryfeasiblestrategysiinSi;Thatis,si*solves
maxui(s1*…,sn-1*,si,
sn+1*,…,sn*).
si∈Si
上述均衡概念是1951年由数学家约翰·纳什(JohnNash)首先提出的,称为纳什均衡。19纳什均衡(NashEquilibrium)定义。对于一个策略式表述的博弈G={N,Si,ui,i∈N}。称策略组合s*=(s1,…si,…,sn)是一个纳什均衡,如果对于每一个i∈N,si*是给定其他参与人选择s-i*={s1*,…,si-1*,si+1*,…,sn*}情况下参与人i的最优策略(经济理性策略),即:ui(si*,s-i*)≥ui(si,s-i*),对于任意的si∈Si,任意的i∈N均成立。20纳什均衡的通俗定义
纳什均衡是一种策略组合,给定对手的策略,每个参与人选择自己的最优策略。21
1Ifgametheoryistoprovideauniquesolutiontoagame-theoreticproblemthenthesolutionmustbeaNashequilibrium,inthefollowingsense.Supposethatgametheorymakesauniquepredictionaboutthestrategyeachplayerwillchoose.Inorderforthispredictiontobecorrect,itisnecessarythateachplayerbewillingtochoosethestrategypredictedbythetheory.
22Thuseachplayer’spredictedstrategymustbethatplayer’sbestresponsetothestrategiesoftheotherplayers.Suchapredictioncouldbecalledstrategicallystableorself-enforcing,becausenosingleplayerwantstodeviatefromhisorherPredictedstrategy.WewillcallsuchapredictionaNashequilibrium.-----------------------------RobertGibbons232一种稳定的策略组合:当所有参与人的选择公开以后,每个人都满意自己作出了正确的选择;没有人能得到更好的结果了。在博弈论中这种结果被称为NE。243NE的哲学含义:n个参与人在博弈之前协商达成一个协议,规定每一个参与人选择一个特定的策略。问题是,给定其他参与人都遵守该协议,在没有外在强制的情况下,是否有人选择不遵守?25只有当遵守协议带来的效用大于不遵守时,参与人才会遵守。如果没有任何参与人有积极性不遵守这个协议,该协议是可以自动实施的(self-enforcing),构成纳什均衡;否则,就不是纳什均衡。264纳什均衡是一种策略组合,每个参与人的策略是对其他参与人策略的最优反应。纳什均衡是博弈将会如何进行的“一致”(consistent)预测。如果所有参与人预测特定纳什均衡会出现,那么没有参与人有动力采用与均衡不同的行动。27纳什均衡(也只有纳什均衡)一致预测性。任何非纳什均衡的出现意味着至少有一个参与人“犯了错”,或者是对对手行动的预测上犯了错,或者是(给定那种预测)在最大化自己的收益时犯了错。(JeanTirole)28纳什均衡的一致预测性
如果所有参与方都预测一个特定的博弈结果会出现,那么所有的参与方都不会利用该预测或者这种预测能力来选择与预测结果不一致的策略,即没有哪个参与方有偏离这个预测结果的愿望,因此这个预测结果最终就真会成为博弈的结果。“一致”的意义在于各博弈方的实际行为选择与他们的预测一致。假设各参与方预测的策略组合相同,以及各参与方都是完全理性的,也就是不会犯错误的情况下,不可能预测任何非纳什均衡是博弈的结果。2930纳什均衡的立法意义纳什均衡是一种稳定局面。给定别人遵守协议的情况下,没有人有积极性偏离协议规定。如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。立法的目标与其实施的结果要一致,必须使得参与博弈的各方达到纳什均衡。否则,立法就仅仅是正式或官方规则,而实际有效的支配人们的是潜规则。31纳什均衡的立法意义32纳什均衡的立法意义潜规则的要害是三方博弈:私下达成默契的双方,蒙骗正式制度和公正原则的代表。预测是博弈分析最基本的目的之一。纳什均衡的一致预测性质是其预测能力的基本保证。33纳什均衡应用的局限性我们对纳什均衡应用的广泛性和有效性不能过分夸大,尽管纳什均衡非常重要,但不是说学到了这种分析方法你就能预测所有博弈的结果。纳什均衡分析仅仅保证个体理性的智能人的博弈结果是唯一纯策略纳什均衡时的预测。纳什均衡分析并不能保证对所有博弈的结果都作出准确的预测。34纳什均衡应用的局限性现实中的博弈可能是下面三种情况之一:有许多博弈不存在纯策略纳什均衡;有些博弈是多重纳什均衡;博弈方可能是集体理性或有限理性。3536ExistenceofNashEquilibrium*Nash在1950年证明:任何有限博弈,都至少存在一个NE。Theorem(Nash1950):Inthen-playernormal-formgameG={S1,…,Sn;u1,…,un},ifnisfiniteandSiisfiniteforeveryithenthereexistsatleastoneNashequilibrium,possiblyinvolvingmixedstrategies.37Wilson(1971)证明,几乎所有有限博弈,都存在有限奇数个NE,包括纯策略NE和混合策略NE。——OddnessTheorem38纳什于1950年提出并证明了纳什定理纳什定理的主要内容为:在一个有n个参与人的策略式博弈G={S1,…,Sn;u1,…,un}中,如果n是有限的,且Si是有限集(i=1,…,n),则该博弈至少存在一个纳什均衡(在混合策略意义下)纳什定理39纳什定理的一些说明纳什定理的证明要用到不动点定理。所谓不动点定理,是指一个定义在X
X上的函数f(x),集合X是非空的、闭的、有界的和凸的函数f是连续的则至少存在一个x,使得f(x)=x,x
被称为不动点40纳什定理的一些说明运用不动点定理证明纳什定理的主要步骤是设计一个策略组合空间上的一个映射,说明该映射的任何不动点都是一个纳什均衡使用不动点定理证明这个映射一定存在一个不动点41不动点什么是不动点呢?想像有一个容器,里面充满了大量的小球,现在用一个勺子任意搅拌这容器里的小球,搅拌过后,每一个小球都重新占据了容器中的一个位置,如果某个小球的新位置和旧位置重合,那么这个小球就是一个不动点。数学里面有一类经典的定理,说的是这样的不动点总是存在的。无论你怎么搅拌,总有这样的不动点小球,以不变应万变,终点又回到起点!42纳什定理的一些说明映射选择的是n人最优反应对应其含义是,对于任意一个混合策略组合(p1,…,pn),对于每一个参与人i,求出I针对其他参与人混合策略(p1,…,pi-1,pi+1,…,pn)的最优反应,然后构建n个参与人最优反应对应的卡氏积。一个最优混合策略组合就是这一对应集的不动点。43纳什定理的一些说明因此只要证明前面的最优反应对应满足不动点定理条件就可以了。44纳什均衡(NashEquilibrium)纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理a每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡,但反过来不一定成立;定理b纳什均衡一定不能通过重复剔除严劣策略方法剔除。下面对上述定理进行简要证明45两个定理的证明首先证明定理b:纳什均衡一定不能通过重复剔除严劣策略方法剔除。记纳什均衡时的策略组合为s*=(s1*,…,si*,…,sn*)用反证法假定纳什均衡在重复剔除严劣策略均衡中被剔除掉,不失一般性,假设s1*是s*中被首先剔除的策略,则在S1中,一定存在一个尚未被剔除的策略s1’’,相对参与人1而言,严格优于s1*46两个定理的证明于是根据重复剔除严劣策略定义,对于此时所有尚未被剔除的其他参与人的任意一个策略组合s-1=(s2,…,si,…,sn),均成立ui(s1’’,s-1)>ui(s1*,s-1)47两个定理的证明由于前面分析中假设策略s1*是s*=(s1*,…,si*,…,sn*)中首先被剔除的策略,因此在s1*被剔除的时候,s2*,…,si*,…,sn*尚未被剔除,自然满足式,这显然与s*是NE矛盾48下面开始证明定理a:重复剔除严劣策略均衡一定是纳什均衡(反证法)假设重复剔除严劣策略后,只剩下唯一的一个策略组合s*=(s1*,…,si*,…,sn*),但却不是NE。则存在一个s1’∈S1,使得下列事实成立u1(s1*,…,si*,…,sn*)<u1(s1’,…,si*,…,sn*)但由于(s1’,…,si*,…,sn*)在中间过程中被剔除,而s*是被保留下来的唯一一个策略组合。两个定理的证明49按照严劣策略的定义,有u1(s1*,…,si*,…,sn*)<u1(s1’,…,si*,…,sn*)比较左右两式,可以得出矛盾…两个定理的证明50划线法先找出自己针对其他博弈方每种策略或策略组合(对多人博弈)的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得益的策略(这种相对最佳策略总是存在的,不过不一定唯一),然后在此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。这就是划线法。51
参与人B参与人ALCRU0,44,05,3M4,00,45,3D3,53,56,6图1-852箭头法箭头法对于理解博弈关系很有好处,是寻找相对稳定性策略组合的分析方法。对博弈中的每个策略组合进行分析,考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组。最后综合对每个策略组合的分析情况,形成对博弈结果的判断。划线法和箭头法的结果是一致的,可以相互替代。53小鸡博弈(thegameofchicken)汤姆和吉米进行勇气比赛:两人分别从一条独木桥的两端冲向对方,谁退却谁就是“小鸡”。如果两个人都向前冲,则两败俱伤,收益均为-2;如果一个勇进一个退却,勇进者收益为4,退却者为-1;若两人同时退却,收益均为0.54
吉米退却勇进退却汤姆勇进0,0-1,44,-1-2,-2有两个均衡。实际会怎样?55局中人2LCRU局中人1MD4,35,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司员工离职感谢信锦集八篇
- 物流专业实习报告5篇
- 天然气管网及储气设施项目投资计划书
- 个人工作季度总结
- 五年级春数学教学工作总结
- 儿童保健年终工作总结
- xx省城镇污水垃圾收集处理项目可行性研究报告
- 骨科病人搬动和卧床护理
- 四川省南充市(2024年-2025年小学六年级语文)部编版随堂测试((上下)学期)试卷及答案
- 丰收话题的作文
- 钉钉数字化管理师中级题库
- 解一元二次方程(公式法)(教学设计)-九年级数学上册同步备课系列
- 2024版小学科学六年级上册第四单元《能量》教学课件
- TSHZSAQS 00255-2024 食葵病虫害防治技术规范
- 2024农村机井转让合同范本
- 2024年院前急救护士理论考核参考题库(含各题型)
- 2025届江苏省苏州市吴中学、吴江、相城区数学八上期末综合测试试题含解析
- 2024-2030年中国巨菌草市场需求规模及未来发展战略研究报告
- 人教版高一上学期化学(必修一)《第四章物质结构元素周期律》单元测试卷-带答案
- 2024至2030年中国文具市场发展预测及投资策略分析报告
- 水利工程承包人常用的表格(51个)
评论
0/150
提交评论