博弈论与纳什均衡

上传人：风*** IP属地：贵州上传时间：2023-05-15 格式：DOC 页数：13 大小：37.50KB 积分：7.2 举报 版权申诉

已阅读5页，还剩8页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈论与纳什均衡博弈论与纳什均衡《博弈论与纳什均衡理论》姓名张贺祺学号2023010404专业政治经济学指导老师张秉云摘要博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法，也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。关键字：博弈论；纳什均衡；合作博弈；非合作博弈目录摘要(2)关键字(2)一、引言(4)二、博弈论与纳什均衡的主要内容(4)（一）博弈论的主要思想(4)（二）博弈论的分类(5)三、经典案例(7)（一）博弈论的经典案例(7)（二）纳什均衡经典案例(7)四、博弈论和纳什均衡的重要影响(8)（一）博弈论的重要影响(8)（二）纳什均衡的重要影响(8)参考文献(9)博弈论与纳什均衡理论一、引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）及冯·诺伊曼（vonNeumann）。1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰·福布斯·纳什（JohnForbesNashJr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。博弈论（GameTheory）:亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：（Nashequilibrium）又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（StrategyProfile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。二、博弈论与纳什均衡的主要内容（一）博弈论的主要思想一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G={P,AS,I,U)P：为局中人，博弈的参与者，也称为博弈方，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。决策人：在博弈中率先做出决策的一方，这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者：在博弈二人对局中行动滞后的那个人，与决策人要做出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。他的策略可能依赖于决策人劣势的策略选择，因此对抗是唯一占优的方式，实为领导人的阶段性终结行为。局中人（players）：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为两人博弈，而多于两个局中人的博弈称为多人博弈。A：为各局中人的所有可能的策略或行动的集合。根据该集合是有限还是无限，可分为有限博弈和无限博弈，后者表现为连续对策、重复博弈和微分对策等。策略(strategy)：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。S:博弈的进程：也是博弈进行的次序、局中人同时行动的一次性决策的博弈，称为静态博弈；局中人行动有先后次序，称为动态博弈。I:博弈信息，能够影响最后博弈结局的所有局中人的情报。信息在博弈中占重要的地位，博弈的赢得很大程度上依赖于信息的准确度与多寡。得益信息是博弈中的重要信息，如果博弈各方对各种局势下所有局中人的得益状况完全清楚，称之为完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息：轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为具有完美信息的博弈。反之称为不完美信息的动态博弈。由于信息不完美，博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果。U:为局中人获得利益，也是博弈各方追求的最终目标。根据各方得益的不同情况，分为零和博弈与变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系，争取双赢的局面。得失(payoffs)：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。次序（orders）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。（二）博弈论的分类博弈模型一般分为合作博弈（cooperativegame）和非合作博弈（non-cooperativegame），如图1.1。合作博弈是以单个参与者的可能行动集合为基本元素，而非合作博弈是以参与人群的可能联合行动集合为基本元素（MartinJ.OsborneandArielRubinstein，2000，P2），也就是说，在合作博弈中，博弈中所有参与者都独立行动，不存在有约束力的合作、联合或联盟的关系，而在非合作博弈中，在一些参与者之间存在着有约束力的合作、联合或联盟的关系，并因为这种关系影响到博弈的结局。合作博弈强调的是团体理性（collectiverationality）、效率、公正和公平；非合作博弈强调的是个人理性、个人最优决策，其结果可能是有效率的，也可能是低效率或无效率的（张维迎，1996，P5）。20世纪50年代，合作博弈的研究达到鼎盛期，同时开始出现对非合作博弈的研究，此后，博弈论的研究主流逐步转向在非合作博弈领域。有些人认为非合作博弈模型比合作博弈更“基本”，但有些人认为两者不相上下（MartinJ.OsborneandArielRubinstein，2000，P2）。合作博弈，有时也叫做联盟博弈（coalitionalgame），一般根据有无转移支付而分为两类：可转移支付联盟博弈（coalitionalgamewithtransferablepayoff）和不可转移支付联盟博弈（coalitionalgamewithnon-transferablepayoff）。可转移支付也叫有旁支付（sidepayment），可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得，且各联盟的赢得可以按任意方式在联盟成员中分摊；否则，就是不可转移支付联盟博弈。非合作博弈的分类主要从两个角度进行划分。一是参与者的行动顺序。从这个角度博弈可以分为静态博弈（staticgame）和动态博弈（dynamicgame）。静态博弈是指参与者同时选择行动或虽非同时但后行动者并不知前行动者采取了何种行动；动态博弈是指参与者的行动有先后顺序且后行动者能够观察到先行动者所选择的行动。二是参与者掌握的信息水平。从这个角度，博弈可以分为完全信息博弈和不完全信息博弈。完全信息（completeinformation）指的是每一个参与者对所有其他参与者的特征、战略空间及支付函数有准确的知识；否则就是不完全信息（incompleteinformation）。图1.1博弈的分类综合上述两种分类方法，可将非合作博弈分成四类。这四类博弈及其对应的均衡概念，大致上反映了20世纪50年代以来非合作博弈理论的主要进展和1994年三位诺贝尔经济学将得主的主要贡献，同时也大致表明了“纳什均衡”及其精炼在博弈论发展中的地位和影响（如表2.1）。表2.1非合作博弈的分类及对应的均衡概念、主要贡献者三、经典案例（一）博弈论的经典案例智猪博弈（Pigs’payoffs）讲的是：猪圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。那么，两只猪各会采取什么策略？答案是：小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。枪手博弈：王者的悲哀。三人对枪自决，甲乙丙枪法优劣递减。最后无奈而神奇的结局，将不取决于同时开枪还是先后开枪，最优良的枪手，倒下的概率将最高；而最蹩脚的枪手，存活的希望却最大。因为没有人会把威胁最小的枪手列为一号清楚目标。在这里，后发制人的弱势者将胜出。以弱胜强，绝不是神话。（二）纳什均衡经典案例和的革命，非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面：（1）改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等，均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域，改变了这些学科领域的内容和结构，成为这些学科领域的基本研究范式和理论分析工具，从而改变了原有经济学理论体系中各分支学科的内涵。（2）扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法，因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法，包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法，为经济学家们提供了深入的分析工具。（3）加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用，不满足于对经济个体之间复杂经济关系的简单化处理，分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律，强调从微观个体行为规律的角度发现问题的根源，因而可以更深刻准确地理解和解释经济问题。（4）形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系，按照经典博弈的类型或特征进行分类，并根据相应的经典博弈的分析方法和模型进行研究，将一个领域所取得的经验方便地移植到另一个领域。（5）扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大，就因为它普通，而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律，也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用，使经济学与其他社会科学、自然科学的联系更加紧密，形成了经济学与其他学科相互促进的良性循环。（6）改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利（Kandori，1997）对保罗·萨缪尔森（PaulSamuelson）的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家，因为它必须学习的只有两个词，那就是‘供给’和‘需求’”，曾做过一个幽默的引申，他说，“现在这只鹦鹉需要再学两个词，那就是‘纳什均衡’”。参考文献[1]李伯聪，李军.关于囚徒困境的几个问题[J].自然辩证法通讯,2023,(04)[2]丁华,周洋,韩雪峰.“囚徒困境”的引申与启示[J].职业时空,2023,(01)[3]马立强.囚徒困境与纳什均衡[J].科学大众(中学版),2023，（09）[4]舒尚奇

人人文库> 全部分类> 教育资料 > 幼儿教育

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论与纳什均衡

文档简介

温馨提示

最新文档

评论

博弈论与纳什均衡

文档简介

温馨提示

最新文档

评论

相关文档