进化博弈概述-山东师范大学管科学院

上传人：1*** IP属地：湖北上传时间：2024-12-14 格式：PPT 页数：42 大小：648.50KB 积分：4.8 举报 版权申诉

已阅读5页，还剩37页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

进化博弈理论一.进化博弈提出背景

二.进化博弈由来三.进化博弈概述四.复制动态和进化稳定性五.最优反应动态和进化稳定性第一节进化博弈提出的背景弥补主流博弈论的缺陷

一、对博弈论的发展威胁最大的是他的理性基础。完全理性要求行为主体始终以自身最大利益为目标，具有在确定和非确定性环境中追求自身利益最大化的判断和决策能力，还要求他们具有在存在交互作用的博弈环境中完美的判断和预测能力。不仅要求人们自身有完美的理性，还要求人们相互信任对方的理性，有“理性的共同知识”这种完全理性假设要求博弈方绝对不会犯错误，决不会冲动和不理智，在现实中显然是不成立的。二、博弈论的理性依据——理性经济人假设

经济人要求人们是对总供给、总需求或价格等代表的市场总体或平均行为进行反应，较少考虑个体之间直接的交互作用，而博弈论研究的恰恰是行为主体之间直接的反应。进化博弈理论的由来1.生物进化中生物性状和行为特征是一个动态模拟调整的过程，而这个过程正是模拟博弈方学习博弈和调整策略过程最主要的动态机制2.而生物进化理论中具有在动态调整过程中达到，在受到少量干扰后仍能“恢复”的稳健性均衡概念“进化稳定策略”，正是有限理性博弈分析最核心的均衡概念。

正是因为上述有限理性博弈分析与生物进化理论的这种关系，因此这种博弈分析理论也称为“进化博弈论”或“经济学中的进化博弈论”。进化博弈理论概述进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。进化博弈理论概述进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础——理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

进化博弈理论概述一.现实中个体并不是行为最优化者，个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。二.进化博弈理论强调系统达到均衡的动态调整过程，博弈方往往不会一开始就找到最优策略，必须通过试错寻找较好的策略认为系统的均衡是达到均衡过程的函数，一、复制动态——大群体成员集体博弈假设在一个理性层次较低、学习速度较慢的大群体成员中随机配对反复进行该博弈的进化博弈问题。这里“学习速度慢”指的是向优势策略的转变不是所有博弈方同时实现的，而是逐渐实现的。一、复制动态——大群体成员集体博弈

博弈方B

策略1策略2

博弈方A策略1

策略2

图1

2×2对称博弈a，ab，cc，bd，d计算步骤步骤一：假设在该群体中采用策略1的博弈方的比例为x，那么采用策略2的博弈方的比例就是1一x。算出采用两种策略博弈方的期望得益u1，u2和群体平均期望得益u分别为u1＝x·a+(1-x)·b、u2＝

x·c+(1一x)·du=x·u1+(1一x)·u2。步骤二：按照生物进化复制动态的思想，采用的策略收益较低的博弈方会改变自己的策略，转向(模仿)有较高收益的策略，因此群体中采用不同策略成员的比例就会发生变化，特定策略比例的变化速度与其比重和其得益超过平均得益的幅度成正比在上述问题中采用策略1的博弈方比例x的变化速度，可以用微分方程（复制动态公式dx／dt=x(u1-u)=x[u1-x·ul-(1-x)·u2]=x(1-x)(u1-u2)=x(1-x)[x(a-c)+(1-x)(b-d)]来表示。最多可能有三个稳定点，分别是x=o、x=1和x=(b—d)／(a—b—c+d)，作为进化稳定策略的点，除了本身必须是均衡状态以外，还必须具有这样的性质，那就是如果某些博弈方由于偶然的错误偏离了它们，复制动态仍然会使x回复到。在数学上，这相当于要求当干扰使x出现低于时，必须大于0，当干扰使得x出现高于时，必须小于0。换句话说，在这些稳定状态处F(x)的导数（也就是切线的斜率）必须小于0。这就是微分方程的“稳定性定理”。

算法分析为前述一般两人对称博弈的复制动态进化稳定策略，而

x=0和x=1都不是进化稳定策略。图5.102×2对称博弈复制动态方程相位图算法分析其中前两个稳定点意味着群体成员趋向于采用相同的策略(1或2)，后一个稳定点意味着群体成员以一定比例采用不同策略，前者对应完全理性博弈的纯策略均衡，后者对应混合策略均衡。值得注意的是，这些稳定点只意味着博弈方采用特定策略的比例达到该水平不会再发生变化，但并没有说明复制动态过程究竟会趋向于哪个稳定点。这些取决于博弈方采用策略比例的初始状态和动态微分方程在相应区间的正负情况，需要根据具体问题进行分析。此外，具有真正稳定性的稳定状态还必须对微小的扰动具有稳定性。即如果由于博弈方的错误等某种原因使得上述比例关系偏离了这些稳定点X时，复制动态仍然会使其回复到这些水平。“鹰鸽博弈”鹰鸽博弈研究的实际上并不是鹰和鸽之间的博弈，而是同一物种、种群内部竞争和冲突中的策略和均衡问题，其中“鹰”和“鸽”分别指“攻击型”和“和平型”的两种策略或策略类型。鹰鸽博弈是研究动物世界和人类社会中普遍存在的竞争和冲突现象的经典博弈，其进化博弈分析可以揭示人类社会或动物世界发生战争或激烈冲突的可能性及其频率，以及国际关系中霸道和软弱、侵略和反抗、威胁和妥协等共存的原因。

博弈方2

鹰鸽博弈鹰方1鸽

图5.13鹰鸽博弈

v代表双方争夺的利益（可以是军事利益、经济利益或政治利益，也可以是动物的领地和繁殖机会），c是争夺中失败一方的损失。

v-c/2，v-c/2V，00，vv/2，v/2这个博弈也是一个2×2对称博弈，直接运用2×2对称博弈复制动态的一般公式。用x表示采用“鹰”策略博弈方的比例，把b=v,c=0,d=v/2代入，可得采用“鹰”策略博弈方比例的复制动态方程为:

为了直观起见，我们这里给出v和c的一组具体数值，如v=2，c=12，那么复制动态方程就为:解得三个稳定状态分别为，

和。这三个均衡点中只有是进化稳定策略，因为F’(0)＞0，

F’（1）＞0，而F’(1／6)＜0。

图5.14鹰鸽博弈复制动态相位图上述进化博弈分析结论的现实意义是，当竞争的利益和冲突的后果符合上述设定时，在较大规模群体长期的进化中，采取攻击型策略的博弈方的数量最终会稳定在1／6左右的水平，大多数人（5／6）会采用比较和平的策略。这意味着发生严重战争的机会虽然存在，但可能性比较小（大约1／36）相互间和平共处的可能性最大（约占25／36），比较忍让的一方受到比较霸道一方欺负的机会居中（约占10／36）。博弈方具有较快学习能力（在复杂局面下准确判断和预见能力稍差，但能够对不同策略的结果作出比较正确的事后评估，并能相应调整其策略）的博弈。因此给定前期的经验（博弈结果），每个博弈方本期能找到和采取针对前期其他博弈方（全部或邻近的部分博弈方）策略的最佳反应策略。最适合描述这种理性层次博弈方的策略调整的动态机制，就是所谓的“最优反应动态”（BestResponseDynamics）。二.最优反应动态——小群体进化博弈一、协调博弈（CoordinationGame）博弈方2AB

博弈A

方1B

50，5049，00，4960，60

该博弈有两个纯策略纳什均衡：（A，A）和（B，B）。这两个纳什均衡中，后者明显帕累托优于前者。但如果博弈方之一有采用A的可能性，或者两博弈方相互怀疑对方可能采用A，那么前者就是相对于后者的风险上策均衡。因此，如果是在完全理性博弈方之间进行这个博弈，通常的预测结果应该是（B，B），但如果我们考虑博弈方相互对对方理性的信任问题，或者对风险的敏感性等因素，那么风险上策均衡（A，A）可能是更好的预测。也就是说，由于该博弈本身是一个有多重纳什均衡的博弈，因此在一次性博弈中，即使博弈方都是高度理性的，博弈结果也有不确定性，很难作出完全保险的预测。这里举例说明最优反应动态的思想方法。设有5个有限理性博弈方，分别处于如图5.2所示的位署上，每个人都与各自的左右邻居就图5.1中得益矩阵表示的“协调博弈”（CoordinationGame）进行反复博弈，观察他们最终会趋于向选择哪个策略。

图5.2博弈方的分布

在初次进行博弈时每个位置的博弈方都既可能采用A，也可能采用B。因此，初次博弈总共有种可能的情况，图5.3中给出了其中部分可能情况。

图5.3初次博弈的部分可能情况

根据采用A博弈方的数量和分布，总共有无A、1A、有相邻2A、有不相邻2A、有3连A、有非3连A、4A、5A共8种有实质差异。

假设为在t时期博弈方i的邻居中采用A策略的数量，该数量有0、1、2三个可能的值；邻居中采用B策略的数量相应为，也有0、1、2三个可能值。

针对第t期的相关情况，博弈方i采用A的得益为，博弈方i采用B的得益为为。根据最优反应动态机制，当时，即时，博弈方i在t＋1时期会采用A，否则采用B。

由于只能取0、1、2三个整数，因此，如果在t时期博弈方i的两个邻居中只要有1个采用A，那么博弈方i在t＋l时期采用A，如果两个邻居都没有采用A，那么博弈方i在t＋1时期采用B。图5．4初次博弈为1A的最优反应动态图5．5初次博弈为相邻2A的最优反应动态图5．6初次博弈为相连3A的最优反应动态上述分析表明，在题设条件下，所有32种可能的初次博弈情况中，只有一种情况是所有博弈方采用B的状态，其余31种都会收敛到采用A的状态。这说明A策略和B策略都是有限理性博弈方进行上述协调博弈的稳定状态，但前一种稳定状态显然更重要一些，因为博弈方的策略调整收敛到这种情况的机会要大大高于后一种情况。从而在博弈方有限理性条件下给出了（A，A）和（B，B）这两个纳什均衡各自被采用的机会一种趋势性判断。结论是在有限理性框架内，博弈方采用策略A，实现均衡（A，A）的机会远高于采用B和实现均衡（B，B）的机会。从上述协调博弈的最优反应动态机制给出的两种稳定状态可以看出，只有所有博弈方都采用A策略同时具有在博弈方的动态策略调整中会达到，又对少量偏离的扰动有稳健性两个性质。同时具有这两种性质（群体趋向且抗干扰）的稳定状态，在进化博弈论中被称为“进化稳定策略”。在上述协调博弈中，A就是一个进化稳定策略，而B则不是进化稳定策略。二、古诺调整过程寡头竞争中的“古诺调整”问题，也是最优反应动态的一个典型例子。

古诺模型中两寡头的反应函数：如果两个博弈方都是有博弈分析能力、有预见能力的完全理性博弈方，那么他们都能够计算出各自的最佳均衡产量，即各生产2单位。这个产量也称为“古诺产量”。

假设这两个博弈方都是有限理性的，都属于知道自己的反应函数（意味着知道自己的利润函数），不知道对方的利润（反应）函数，也没有预见能力。不妨设一个寡头生产2.5单位，另一个寡头生产3单位为第一个时期的结果，来演示一下两个寡头的产量调整过程。古诺模型的最优反应过程设生产2.5单位的是寡头1，生产了3单位的是寡头2。把这两个产量分别代入寡头2和寡头1的反应函数，很容易得到两寡头第二期的产量将分别是1.5单位和1.75单位；然后再把这两个产量分别代入寡头2和寡头1的反应函数，不难得到第三期双方的产量为2.125单位和2.25单位；依次类推可得到第四期双方产量为1.875单位和1.9375单位，……；

上述动态调整过程趋向收敛于两寡头各生产2单位产量（完全理性博弈的古诺产量），即唯一的纯策略纳什均衡。由于这个稳定状态也具有对微小扰动的稳健性，因此它是这个博弈在上述最优反应动态下的进化稳定策略（ESS）。二、非对称鹰鸽博弈的进化博弈分析鹰鸽博弈也可以是非对称博弈，因为当人们或者其他动物）为了某件事物发生冲突竞争时，所争夺的目标对冲突各方的价值并不一定是—致的。例如，当一个国家试图侵略另一个国家，被侵略国家考虑是否抗击入侵者时，双方所争夺的国土对前者来说意味着一块殖民地，后者则是自己的祖国，显然对于双方来说价值是完全不同的，对后者的价值通常要远远高于前者。

假设鹰鸽博弈所争夺的目标对博弈方1位置博弈的博弈方价值为，对博弈方2位置博弈的博弈方价值为，并设0＜＜。再假设其余方面都与对称鹰鸽博弈的假设相同。那么，现在这个鹰鸽博弈的得益矩阵如图5.25所示。很显然，这是一个双方利益不对称的非对称博弈。为了简单起见，进一步假设上述博弈中，，，这样该博弈的得益矩阵进一步变为图5.26中的情况。博弈方2

鹰鸽博弈鹰

方1鸽

图5.25非对称鹰鸽博弈

博弈方2

鹰鸽博弈鹰

方1鸽

图5.26非对称鹰鸽博弈数

人人文库> 全部分类> 教育资料 > 备课教案

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

进化博弈概述-山东师范大学管科学院

文档简介

温馨提示

最新文档

评论

进化博弈概述-山东师范大学管科学院

文档简介

温馨提示

最新文档

评论

相关文档