【博弈论简史探析12000字】

上传人：E*** IP属地：湖北上传时间：2024-01-30 格式：DOCX 页数：23 大小：229.27KB 积分：22 举报 版权申诉

已阅读5页，还剩18页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

目录摘要 III第一章前言 11.1研究背景 11.2研究目的和意义 11.3国内外研究现状 2第二章预备知识 3第三章主要结果 53.1完全信息静态博弈 53.1.1纳什均衡 53.1.2纳什均衡的例子及应用 63.1.3相关均衡 93.2完全信息动态博弈 103.2.1子博弈精炼纳什均衡 103.2.2子博弈精炼纳什均衡的模型及应用 113.3不完全信息静态博弈 123.3.1贝叶斯纳什均衡 133.3.2贝叶斯纳什均衡的例子及应用 133.4不完全信息动态博弈 153.4.1颤抖手均衡 153.4.2序贯均衡 163.4.3精炼贝叶斯纳什均衡 173.5合作博弈理论 18第四章总结与展望 214.1论文总结 214.2论文展望 21参考文献 22博弈论简史探析摘要现代博弈论研究主要分为合作博弈与非合作博弈两个领域。本文主要研究非合作博弈发展简史问题，同时简述了合作博弈发展史。本文所得具体成果如下：第一章解释了研究博弈论发展简史的背景、目的、意义等。第二章介绍博弈论的基本概念，说明了阅读本文所需基本知识。第三章对于非合作博弈理论，从1994年诺贝尔经济学奖三位获得者出发，搭建起由完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈历史发展框架，找出每个博弈所对应均衡：纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡等，对其提出者、提出论文、提出时间以及思想进行追根溯源，同时给出例子。对于合作博弈，从“核”与Shapley值出发，通过追溯合作博弈理论基本概念，来阐述合作博弈理论发展史。第四章是对本文内容的总结，同时说明了本文还存在的不足以及对未来研究的展望。关键词：博弈论，纳什均衡，核，Shapley值第一章前言1.1研究背景博弈论于1944年正式独立为一个全新的数学分支学科，至今尚不足百年之久，但博弈论的前史则可追根溯源至18世纪，若论博弈现象的出现与积累甚至可以遍布整个人类发展史中。随着经济学与博弈论的发展，微观经济学逐渐与博弈论水乳交融，你中有我，我中有你。由此许多经济学家都对博弈论发展史进行了研究与思考，但至今没有形成类似于《古今数学思想》的学科史著作，也没有形成广泛受到认可的博弈论发展史。同时现有的关于博弈论发展史的研究多处于社会学或经济学的角度，在博弈论发展过程中做出巨大贡献的数学家们，极少涉足关于博弈论发展史的研究，这造成了数学角度的缺失。1.2研究目的和意义首先，科学的目的是探索未知，解决问题。在这个过程中教育有着决定性的力量。研究博弈论发展史，可以了解在历史长河中博弈论是如何发展的，博弈论学家们是如何通过个人的努力与时代的机遇去解决接连不断出现的博弈论难题。这些材料都将成为博弈论教育中的巨大助力。博弈论学家曾经犯过的错、遇到过的问题，也极有可能是学生的错误与问题，这使博弈论教育中可能遇到的问题可以提前预见。同时那些博弈论发展史中那些曲折的故事也是博弈论教育中最好的引入。其次，科学虽是面向未来的，但也是注重过去的。就如同科学研究中，需要大量阅读前人的成果，站在路人的肩上望向更远。虽博弈论发展史所研究的博弈论成果大多已是教科书上的案例与定理，不再那么前沿，但其包含的思想不会变，只会更加历久弥新，让后来者打破时间与空间的阻隔，与多年前的大师对话。最后，数学是追求完备，作为数学的分支学科，博弈论也不可以避免的追求完备。研究博弈论发展史，可以梳理学科脉络，整理学科资料，总结出博弈论发现至今还稍有欠缺或已充分挖掘的方向，为后来者做出更大的贡献提供帮助。1.3国内外研究现状2003年，中国西北大学博士生尚宇红的博士论文《博弈论前史研究》系统阐述博弈论初期发展的情况，对古诺模型、《博弈论与经济行为》、极大极小值理论等博弈论重要理论进行了追根溯源，分析了其产生的历史背景，对其在博弈论发展进程中所起的作用进行了论证。张维迎所编写的《博弈论与信息经济学》虽未对博弈论史进行大量介绍，但他对每一个博弈论理论的提出者进行了介绍了，并提供了最初文献的相关资料。谢识予所编写的《经济博弈论》对博弈论的整个发展史以及博弈论发展的未来方向进行了全方位的说明，系统分析了博弈论如何是如何发展的。

第二章预备知识定义1.1参与者[7]：一个博弈中的决策主体。可以是组织也可以是个人，其目的是使自身利益最大化。定义1.2行动[7]：参与者在博弈的某时刻的决策变量。定义1.3信息[7]：参与者有关博弈的知识。定义1.4共同知识[7]：“所有人参与者知道，所有参与者知道所有者知道，所有人参与者知道所有者参与人知道所有者参与人知道...”的信息。定义1.5策略（战略）[7]：策略（战略）是参与者在给定信息集的情况下的行动规则。定义1.6支付[7]：在博弈论中，支付或者是在一个特定的战略组合下参与者得到的确定效用水平，或者是指参与者得到的期望效用水平。定义1.7结果[7]：博弈分析者所感兴趣的所有东西，如均衡策略组合、均衡行动组合等。定义1.8均衡[7]：所有参与者的最优策略组合。一般记为：定义1.9纳什均衡[7]：有个参与人的战略表达式，战略组合是一个纳什均衡，如果对于每一个，是给定其他参与人选择的情况下第个参与人的最优战略，即：定义1.10子博弈精炼纳什均衡[7]:扩展式表述博弈的战略组合是一个子博弈精炼纳什均衡，如果：（1）它是原博弈的纳什均衡；（2）他在每一个子博弈给出纳什均衡。定义1.11贝叶斯纳什均衡[7]:人不完全信息静态博弈的纯策略贝叶斯纳什均衡是一个类型依存战略组合，其中每个参与人在给定自己的类型和其他参与人类型依存战略的情况下，最大化自己的效用函数。换言之，战略组合是一个贝叶斯纳什均衡，如果对于所有的,定义1.12精炼贝叶斯纳什均衡[7]:一个战略组合和一个后验概率组合，满足：对于所有的参与人，在每一个信息集，是使用贝叶斯法则从先验概率、观测到的和最优策略得到的（在可能的情况下）。

第三章主要结果3.1完全信息静态博弈3.1.1纳什均衡纳什（JohnForbesNashJr，1928年6月13日—2015年5月23日）是一位著名的美国数学家以及经济学家，他不仅仅在博弈论做出了巨大贡献，也在微分几何以及偏微分方程等领域成就非凡。在他的下半生任教于普林斯顿大学时，他的博弈理论随着时代的发展在经济学中得到了广泛的应用，这也使他获得了1994年诺贝尔经济学奖。2015年，他又因在非线性偏微分方程方面的工作而与路易斯·尼伦贝格（LouisNirenberg）共同获得了阿贝尔奖。纳什是迄今为止唯一同时获得过诺贝尔经济学奖和阿贝尔奖的人。1959年，纳什开始明显出现精神病迹象，随后花了数年在精神病院接受相关的精神治疗。上世纪70年代之后，他成功克服病魔。并在在1980年代中期重返学术领域。这些传奇经历后来成为了《美丽心灵》的原型。对于博弈论，纳什所做出的巨大贡献主要表现在两方面：在合作博弈方面，他于1950年发表的论文

《TheBargainingProblem》中提出了讨价还价模型；在非合作博弈方面，他贡献非常巨大。他在1950所发表的论文《EquilibriumPointsinN-personGame》以及1951年所发表的论文《Non-cooperativeGames》中明确定义了非合作博弈，也随之提出了非合作博弈的均衡解，并且使用数学方法严格证明了非合作博弈均衡解的存在性。这些巨大的贡献奠定了非合作博弈的基础，也使得他在论文中所定义的均衡被后世的数学家、经济学家以及各种运用博弈论的学者称之为纳什均衡（Nashequilibrium）。下面，我们主要介绍纳什在非合作博弈相关的理论，即纳什均衡。首先需要介绍的是纳什均衡的定义：不妨设博弈的参与者有n个，在明确其他任意博弈参与者的策略下，每一个参与者决定出自己的最优策略，需要指明的是每个人的最优策略可能与其他参与者的策略相关，也可能与其他参与者的策略无关，这样所有参与者所选择的策略一起构成了一个策略组合(StrategyProfile)。纳什均衡指的就是这样一种策略组合，每一个参与者都采用的是最优策略，即对于每个参与者来说，如果其他人不主动改变自身的策略，他就无法取得更大受益。换句话说：没有人有积极性改变自己所选择的策略。3.1.2纳什均衡的例子及应用介绍纳什均衡，其实不应该避开艾尔特.W.塔克所提出的囚徒困境，但考虑篇幅有限，本文主要介绍纳什均衡的另外两个例子：古诺寡头博弈模型与豪泰林博弈模型，这两个模型都是典型的纳什均衡在经济学中的应用，但又早于纳什均衡的提出，则这两者既可以阐释纳什均衡，又可以揭示博弈论思想萌芽的出现。首先介绍古诺寡头博弈模型，古诺（AntoineAugustinCournot，1801年8月28日—1877年3月31日）是法国著名的哲学家、数学家以及经济学家。1838年，他出版了不朽的巨作《财富理论的数学原理研究》（ResearchesontheMathematicalPrinciplesoftheTheoryofWealth），在这本书中，他首次将数学公式和符号应用到了实际的经济分析中，巧妙地给出了许多数学模型。但其超前的思想在当时不为当时的大多数经济学家所接受，甚至还受到批评。但这不妨碍多年后的今天，古诺的理论被广泛应用，甚至被许多经济学家是现代经济分析的起点。下面我们要介绍的是这本著作中最广为流传的模型：古诺寡头博弈模型。古诺寡头博弈模型来源于古诺对两个矿泉水生产企业的描述，基于如下的假设：（1）企业数量大于等于2，所有企业都生产一样的产品，即产品没有实质性差异。（2）企业之间不合作，即企业之间不沟通产量。（3）企业都具有市场影响力，即每个企业的产量多少都会影响产品的价格，（4）企业的数目是固定的，即不存在新企业进入。（5）企业在数量上竞争并且同时选择数量。（6）企业为理性的，追求最大利益。我们讨论两个企业的情形：企业1、企业2，同时明确每个企业的策略是选择生产多少数量的产品；支付是利润，是关于两个企业产量的函数。首先用表示企业的生产数量，其次用表示生产过程中的成本函数，最后用表示逆需求函数，需要说明的是是价格，表示原需求函数。则可以得到关于第个企业的利润函数为：如果用来表示纳什均衡的产量则有：在数学上寻找纳什均衡的方法之一：求导，并找出其一阶导数值为0的点：由此可以由上确定两个反应函数：纳什均衡即为的交点，如下图1：图1从模型的介绍中我们可以清晰感受到古诺寡头博弈模型中关于纳什均衡的萌芽，其可以说得上是纳什均衡有记载的最早版本。但遗憾的是古诺的工作被认作博弈论理论的先驱是在1955年才被Shubik发现，就如同《财富理论的数学原理研究》的认同来得迟一样，古诺对博弈论的贡献获得认可也姗姗来迟。下面开始介绍豪泰林（Hotelling）价格竞争模型，豪泰林（HaroldHotelling，1895年9月29日—1973年12月26日）是美国的数理统计学家和理论经济学家。他曾任教于斯坦福大学、哥伦比亚大学、北卡罗来纳大学教堂山分校等大学。他最杰出的成就是开发主成分分析方法，这种方法被广泛应用于金融、统计、计算机等领域。在去世前一年，因为其一生在各个领域杰出的贡献，其被授予了NorthCarolinaAward。本文将介绍的豪泰林价格竞争模型就来自于他1929的论文《StabilityinCompetition》。豪泰林价格竞争模型是基于如下假设的：（1）城市为一条长度为1的线段，所有的居民均匀分布在这条线段上；（2）这条线段的两端各分布着一家超市；（3）每家超市的商品是同质的，成本为；（4）居民购买商品的单位旅游成本为；（5）在线段上存在一点，两家超市对该点上居民无差异，该点往左的居民会选择商店1，往右反之。用与表示超市的商品价格和可售出商品数量。我们可以简化成如2图的位置关系：图2由假设（3）有：可解出：则商店分别售出的商品数量如下：可将两家商店的利润表示为:如古诺模型处理方法：则可得均衡价格：这两个模型都是纳什均衡在经济学中应用的典型案例，并且都早于纳什均衡出现，这说明了博弈论的出现与发展，并不是一个人的奇思妙想，而是来源于各种案例以及问题的积累。3.1.3相关均衡在纳什均衡中，每个人都是独立行动的，但在实际情况下，博弈策略的选择可能有相关性的。比如：参与者1、参与者2两位参与者，在博弈前一天约定根据明天的天气情况来选择策略。比如：晴天：参与者1选择策略1、参与者2选择策略2；阴天：参与者1选择策略3、参与者2选择策略4.这样通过天气的变化，他们之间的选择就出现相关了。这就要引出奥曼的相关均衡来解决问题了。奥曼(Robert

John

Aumann，1930年6月8日-)，是一位出生于德国的犹太人。在二战期间期间逃亡美国，后在美国取得数学的学士、硕士、博士学位，成为了一位数学家、经济学家，因其在博弈论领域做出的卓越贡献获得了2005的诺贝尔经济学奖。他一生致力于研究博弈论，在博弈论领域做出过许多重大成果，如：博弈论中关于常识的第一个纯形式的解释、与劳埃德·沙普利（Lloyd

Shapley）合作研究了Aumann–Shapley值等。但他最广泛传播的成果1974年发表论文《Subjectivityandcorrelationinrandomizedstrategies》中提出的相关均衡。

在这篇论文中，奥曼证明了如果博弈参与人根据某个可以共同观测的信号选择行动，就会出现相关均衡，相关均衡可以使所有的博弈者受益。同时其中更为重要的是，奥曼还证明了在每个人收到不同但相关的信号下，每个人都可以去获得更高的效用。为了解释相关均衡可以是所有人受益，下面简要介绍一个关于相关均衡的例子，假如博弈者1、2的支付矩阵如下：表1易得该博弈有三个纳什均衡，其中两个为（U,L）、（D,R）。在假设以相同的概率选择纯策略的情况下得到另一个混合策略纳什均衡，且期望为2.5。不妨设博弈者1、博弈者2博弈前约定。如果明天下雨，博弈者1选择L，博弈者2选择U；如果明天未下雨，博弈者1选择R，博弈者2选择D。这种情况下，假定下雨与未下雨的概率都为，则双方的期望：这就体现了，在相关均衡下，双方都受益。3.2完全信息动态博弈上文介绍了纳什均衡，但在纳什均衡中还有三个问题没有解决：首先，有相当部分博弈存在不止一个纳什均衡；其次，在理想的纳什均衡下，其他参与者的策略是确定的，这种预设在静态的情况下成立，但实际上在动态情况下，会产生很大的变化；最后在纳什均衡存在着不可置信的威胁。这些问题都困扰着当时的博弈论学家，直到子博弈精炼纳什均衡的提出。3.2.1子博弈精炼纳什均衡关于子博弈精炼纳什均衡，首先需要介绍提出者：泽尔腾（ReinhardJustusReginaldSelten，1930年10月5日至2016年8月23日）是德国的著名经济学家，是1994年诺贝尔经济学奖的获得者，也是德国的第一位获得诺贝尔经济学奖的经济学家，也是持续多年的德国唯一一位获得诺贝尔经济学奖的经济学家。他还以非合作博弈方面工作而闻名世界，被认为是实验经济学的奠基人之一。

他一生都在致力于博弈论的研究，发表了许多著名的博弈领域论文，提出了许多博弈论领域的重要理论。如他在1975年于著名的论文《扩展式博弈精炼均衡概念的重新考察》提出"颤抖手均衡"(trembling

hand

equilibrium)的概念，给出了如何处理动态博弈中有限理性的方法，在后文关于不完全信息动态博弈中会进行更详细的介绍。本节更加着重于介绍他于1965年论文《一个具有需求惯性的寡头博弈模型》的子博弈精炼纳什均衡(subgameperfeet

Nashe

quilibrinm)。在这篇论文中，泽尔腾主要的主要成果是，通过对动态博弈的分析，将纳什均衡中包含的不可置信的威胁策略组合剔除，使得纳什均衡最后得到的策略组合不再拥有不可置信的威胁。也就是，每一个参与者必须在任意一个时刻都是最优的，这要求参与者要保持着策略的及时更替，而不是如纳什均衡一样保持着原有策略，变动策略既不是最优策略的选择。同时在数学意义上由于剔除了不可置信的威胁，使得求解过程中的纳什均衡的个数减少，使得求解过程变得容易。这些成果进一步完善和推广了纳什均衡，使得博弈论的发展更加完善。3.2.2子博弈精炼纳什均衡的模型及应用子博弈精炼纳什均衡的模型有许多，比如交替出价的还价博弈模型、中国中央与地方以前的财政包干制博弈模型。出于形成与上文古诺寡头博弈模型、豪泰林博弈模型的对比以及模型的经典性。对于动态的寡头市场产量博弈，本文选择的是下来的斯塔克博格（Stackelberg）模型。斯塔克博格（Heinrich

Freiherr

von

Stackelberg，1905年10月31日—1946年10月12日）是德国著名的经济学家，他擅长的领域是博弈论和产业经济学。他在论文《MarketStructureEquilibrium》提出了斯塔克博格模型，并且以这个模型而广泛闻名。对于斯塔克博格模型。我们首先进行如下假设：（1）企业数量大于等于2，所有企业都生产一样的产品，即产品没有实质性差异。（2）企业之间不合作，即企业之间不沟通产量。（3）企业都具有市场影响力，即每个企业的产量多少都会影响产品的价格，（4）企业的数目是固定的，即不存在新企业进入。（5）企业在数量上竞争并且同时选择数量。（6）企业为理性的，追求最大利益。（7）企业有强有弱。我们任然讨论两个企业的情况，同时企业1位较强的企业，企业2为较弱的企业。企业1先进行选择，企业2后进行选择，且企业2进行选择时知道企业1的选择。用表示企业的生产数量，其次用表示生产过程中的成本函数，最后用表示逆需求函数，也就是价格。企业1、企业2的利润函数可以表示如下：使用逆向归纳法求解该问题，先将企业1的当作常数求解使的，即将问题转化为：即：则：则企业1的利润函数变为：对企业1的利润函数求导，找导数零点：则：则子博弈精炼纳什均衡的纳什均衡结果如下：3.3不完全信息静态博弈在上文介绍的纳什均衡、子博弈精炼纳什均衡中都有一个共同的假设：完全信息，也就是参加博弈的每一个人都清楚地知道博弈的规则、博弈的结构、博弈的函数等。换句话说，也就是参与者对博弈的信息没有未知。但实际上博弈论中很多问题都是不完全信息的。在1967年之前是不完全信息的问题是没有办法解决的，数学家或者是经济学家都是束手无策的，直到海萨尼提出新的理论。3.3.1贝叶斯纳什均衡海萨尼（JohnCharlesHarsanyi，1920年5月29日-2000年8月9日）是出生于\o"匈牙利"匈牙利布达佩斯，后定居于\o"美国"美国。他是一位著名\o"经济学家"经济学家，曾获得1994年\o"诺贝尔奖获得者"诺贝尔经济学奖。曾就读于法国里昂大学，后来在故乡的布达佩斯大学取得本科、博士学位。因其在博弈论以及博弈论在经济学的应用而闻名于世，尤其是他在分析不完全信息静态博弈时，引入相关的贝叶斯理论，进行了高度创新。同时他在对博弈论在其他领域的交叉应用也做出了极大的贡献，例如推动博弈论在政治、哲学的应用。他于1967年在管理科学（Management

Science）发表的论文《Gameswithincompleteinformationplayedby“Bayesian”players，I-III.》使得关于不完全信息的问题变得可以得到处理。他将概率论引入博弈论，同时在分析不完全信息静态博弈时引入一个了假设的参与人：自然。同时对自然有一个附加条件：所有的博弈结果对自然都是没有本质区别的。然后自然首先行动，选择每一个参与者的类型。然后对于任意一个参与者而言，自己的类型已知，其他参与者的类型未知，但知道各种可被选择的类型的分布函数。即分布函数是共同知识。上述的转化被命名为海萨尼转化，这个转化将不完全信息静态博弈转化为完全但不完美静态信息博弈。这里的不完美主要可以解释为：参与者知道了选择的分布函数，但对于自然的选择却一无所知。3.3.2贝叶斯纳什均衡的例子及应用关于贝叶斯均衡的例子，为了突出不完全信息静态博弈和完全信息静态博弈的区别，本文选择介绍不完全信息下的古诺模型。假设中除了企业生产成本发生变化，其余假设不变。对于生产成本的假设更换为：企业1的成产成本为，并且是企业1、企业2的共同知识。对于企业2的成本，可能有两种情况或，企业2知道自己的成本，但企业1只知道分布，即表2：成本概率表2注：企业1、2同时做决策。可以将企业1、2的利润函数分布表示为：分别关于各自产量求导，寻找导数的零点得：则：对于企业2：则对于企业2的产量，企业1认为的最优情况：为了方便对比不妨赋值,则有：3.4不完全信息动态博弈在上文中，我们总共介绍了完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈。但实际上在生活中面对的情况是不完全信息，同时行动又有先后顺序的，或者在后先动者也是可以观察先行动者，来推断他的喜好。这也是本文想介绍的最后一个博弈论模型：不完全信息动态博弈。对于这个问题许多博弈论学家提出解决方法，本文主要对精炼贝叶斯均衡进行介绍。3.4.1颤抖手均衡颤抖手均衡是由泽尔腾提出的，前文已经对泽尔腾做过介绍，这里就不进行介绍。他是在1975年于著名的论文《AReexaminationofthePerfectnessConceptforEquilibriumPointsinExtensiveGames》提出"颤抖手均衡"(tremblinghandequilibrium)的概念，给出了如何处理动态博弈中有限理性的方法。颤抖手均衡主要的思想是：对于一个保持稳定的纳什均衡是可能会遭受某些极其微小的扰动，这些微小的扰动可能来自于人决策行动时出现的错误。如果出现这种错误的概率趋近0，而且这个过程中的均衡序列收敛，那么均衡序列的极限就是颤抖手均衡。换句话就是在纳什均衡的下，博弈中有一个人手抖了一下，选择的是次优的策略，如果该纳什均衡是颤抖手均衡，则博弈参与者会回到该均衡，而不是偏向另一个纳什均衡。下面我们简要介绍一个关于颤抖手均衡的例子：假设博弈者1、2的支付矩阵如表3：表3易得该博弈具有两个纳什均衡：（U,L）、（D,R）。当博弈处于（U,L）时，如果博弈者2手抖犯错，将策略换为D，则其收益变为0。对于博弈者1来说，收益变为2，这是他是没有更换策略的积极性的，若更换为R，收益没有发生变化，还可能会遭遇博弈者2更换策略，收益变为0。但是对于博弈者2而言，更换策略的动机是易见的，只要更换策略为U，收益就会增加。然后博弈又回到了最初的状态（U,L），这就是颤抖手均衡。但是如果博弈处于（D,R）,博弈者1手抖犯错，将策略换为L，对于自身收益造成影响，但是博弈者2的收益变为0，博弈者只有调整策略为U，才可增加收益。均衡变成（U,L）,无法回到（D,R），则（D,R）不是一个纳什均衡。3.4.2序贯均衡克雷普斯（David

M.Kreps，1950-）是美国斯坦福大学的著名教授，他是一位经济学家。他出生于美国纽约，曾就读于达特茅斯学院、斯坦福大学等高校。在1989年荣获John

Bates

Clark

Medal，也在2018年被授予John

J.Carty

Award。他以对动态选择模型和非合作博弈论的研究而闻名。威尔逊（Robert

B.Wilson，1937年-），出生于内布拉斯加州，博士就读于哈佛大学，后一直执教于斯坦福大学。在1994年获选为美国国家科学院成员，后在2020年获得诺贝尔经济学奖。威尔逊以其对管理科学和商业经济学的贡献而闻名。他与斯坦福商学院的其他数理经济学家一起，使用非合作博弈理论帮助重新构造了产业组织经济学和组织理论。他对非线性定价的研究影响了大公司的政策，尤其是在能源工业。序贯均衡提出于克瑞普斯和威尔逊共同发表的论文《SequentialEquilibrium》中，在这篇论文中，他们定义了序贯均衡，序贯均衡是一个行为策略—信念的组合。这要求：首先，策略必须是“序贯理性”，换句话说，可以理解为在后续出现的任意一个贝叶斯博弈当作构成一个贝叶斯纳什均衡。其次，信念的一致性，一列完全混合策略生成的信念的极限是这个信念。下面我们简要介绍一个关于序贯均衡的例子：图3图3是博弈者1、2的博弈过程树形图。博弈者1先做出选择，选择有A、B、C，博弈者2再做出选择，选择有D、E，虚线表示博弈者2做出选择时，不知道博弈者1做出了何种选择，也是博弈者1的选择不是共同知识。很容易可得到，博弈者1的最优策略是选择A，得到2的收益，博弈直接结束。但博弈的过程中出现错误，博弈者1未选择A，然后博弈者2就需要开始考虑选择何种策略。博弈者2知道博弈者1在B、C之间做出了选择，但不知道何种选择。如果博弈者1选择B，博弈者2的最优策略为E；如果博弈者1选择C，博弈者2的最优策略为D。如何做出选择就要依靠博弈者2认为博弈者1做出对应选择的概率为多少。如上图，假设博弈者1选择B的概率为，则选择C的概率为可计算得到，博弈者2做出选择对应收益的数学期望如下：根据收益的期望得到，当，博弈者2应选择E;,应选择D。等于时都可以。3.4.3精炼贝叶斯纳什均衡精炼贝叶斯纳什均衡（prefect

Bayesian

equilibrium）的主要成果是由弗登伯格和泰勒尔提出的。让·弗登伯格（Drew

Fudenberg

,1957年—）出生于美国纽约，是美国哈佛大学经济系的著名教授。1981年，他取得了麻省理工学院的经济学博士学位。之后，他在博弈论和动态经济学方面做出了巨大贡献。曾经在加州大学伯克利分校、麻省理工学院、斯坦福大学和法国图卢兹大学任教。他的广泛研究涵盖了博弈论的许多方面，包括均衡理论，博弈学习，进化博弈论以及在其他领域的许多应用。富登堡还是最早将博弈论分析应用到产业组织，讨价还价理论和契约理论中的人之一。让·泰勒尔（Jean

Tirole，1953年—）是法国图卢兹大学的著名产业经济学教授，同时他也是巴黎大学、麻省理工学院的兼职教授，并且曾经在哈佛大学、斯坦福大学担任客座教授。他专注于产业组织、博弈论、银行、金融等各种领域。2014年，他因对市场力量和监管的分析而被授予诺贝尔经济学奖。1978年，在获得巴黎第九大学应用数学博士学位后，对经济学兴趣油生，他来到著名的美国麻省理工学院继续深造，并于1981年获得经济学博士学位。精炼贝叶斯均衡出现在弗登伯格和泰勒尔于1991年年共同撰写的《gametheory》中。在本书中详细介绍了精炼贝叶斯均衡，精炼贝叶斯均衡的关键点是博弈的参与者可通过观察其他参与者的行为来改变自己关于后面的参与者类型的主观概率，并由此决定自己的策略。这个修正的过程就被称之为贝叶斯规则。从数学观点来说，精炼贝叶斯均衡就是一个关于映射的不动点。具体的理解可以理解为每一个博弈的参与者都预先假设其他博弈参与者是均衡策略。换句话说就是：它就是所有博弈参与者的满足条件的信念与策略的结合。下面我们简要介绍一个关于精炼贝叶斯纳什均衡的例子：发布声明博弈的一种情况，将博弈双方分为声明方、行为方，行为方不知道声明方的声明是否为真。设声明方有两种声明类型：，行为方有两种行为类型：，有支付矩阵如下表4。我们可发现，的偏好是不同的，分别偏好于。声明方与博弈方的偏好完全一致，这是一种非常好的情况，这种情况下信息传递非常有效，能够更加良好的达到目的。表43.5合作博弈理论为了顺应时代的发展，也为了得到更大的发展，在近30多年里，全球化、区域一体化、人类命运共同体、合作共赢等概念被逐渐推广，虽然有的国家倒行逆施，企图逆全球化，但这是历史的规律，不容改变。在这个时代背景下，再以非合作博弈的相关理论分析问题，用个体理性选择决策显然已经不是最优解，取代之的是合作博弈理论。合作博弈与上文的非合作博弈并没有先后之别，但合作博弈的发展缓慢，本文认为有两方面的原因：首先是聚焦于博弈论的经济学家受到主流经济学的影响，主流经济学更多的时候是将问题的分析与经济落足于个人的。其次，就是没有形成统一的框架，数学追求的美之一就是简洁美，而在合作博弈理论一直没有像非合作博弈领域形成统一的分析手段。这些影响了合作博弈理论的发展，但2005、2012年的诺贝尔经济学奖已经预示着合作博弈时代的到来。下面我们具体阐述合作博弈理论的历史。1928年冯·诺依曼提出了合作博弈中广泛使用的特征函数，比起合作博弈的概念早了许多。合作博弈的概念是在其1944年的《博弈论与信息经济学》一书中才明确提出的。而后在上世纪50年代，纳什又将合作与非合作博弈进行了明确的区分：如果博弈的每一个参与者能够事先达成具有约束力而且强制执行的协议的博弈称为合作博弈，反之即为非合作博弈。也同样是在上世纪50年代，为了解决合作博弈求解的问题。吉利斯（DonaldB.Gillies，1928年10月15日—1975年7月17日），一位出生于加拿大的数学家、计算机学家，在其1953年的论文中引入“核”，但“核”的最早思想萌芽理应归给Edgeworth，他1881提出合同曲线就是“核”最早的雏形。下面给出“核”的一个具体例子。不妨假设现有一开发商准备征地，征地的对象有A、B、C三人，A、B、C三人可能出现的联盟情况以及收益如下表5：情况12345联盟（A,B,C）（A,B）,C（A,C）,B（B,C）,AA,B,C收益10060,4050,4050,4030,30,30表5容易得到该合作博弈的核就是情况2。这只是“核”非常简单的应用，核在其他方面有着非常广泛的应用。比如Shapley在1955年以及1959年发表的关于经济博弈的论文，这是“核”在经济学中的应用，也是最早的应用。虽然“核”具有很好的性质，但是时常会出现空集的情况，对于这个问题的处理方法来自于Shapley与Bondareva，被称为Bondareva-Shapley定理，这是一个关于“核”的存在性的充分必要条件。下面介绍Shapley值，沙普利（LloydShapley，1923年6月2日—2016年3月12日）出生于马萨诸塞州，是美国著名的经济学家与数学家，是2012年诺贝尔

人人文库> 全部分类> 行业资料 > 工业设计

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

【博弈论简史探析12000字】

文档简介

温馨提示

最新文档

评论

【博弈论简史探析12000字】

文档简介

温馨提示

最新文档

评论

相关文档