复杂系统中演化博弈研究背景介绍_第1页
复杂系统中演化博弈研究背景介绍_第2页
复杂系统中演化博弈研究背景介绍_第3页
复杂系统中演化博弈研究背景介绍_第4页
复杂系统中演化博弈研究背景介绍_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、复杂系统中演化博弈研究背景介绍姜罗罗 中国科学技术大学提纲演化博弈理论简介 经典博弈理论 演化博弈理论1、博弈理论简介 博弈论博弈论(Game Theory):研究具有斗争或竞争性质现象的理论和方法。三要素三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集分类分类:合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈; 研究博弈论的意义研究博弈论的意义:理解人类的经济行为;理解社会和生态物种系统中的合作行为以及自自组织斑图。 约翰冯诺依曼 (J. von Neumann )Theory of games and econom

2、ic behavior (1944)(1)经典博弈论 合作博弈合作博弈强调群体理性(group rationality),就是从群体的角度考虑策略的选择,使得整体收益最大。所以合作博弈研究的是参与者在达成合作时如何分配合作得到的收益,即收益分配问题。纳什(J. Nash)的博士论文 非合作博弈(1950) 非合作博弈非合作博弈强调个体理性(individual rationality),就是从个体的角度考虑策略选择,使得个体收益最大。所以非合作博弈研究的是参与者在利益相互影响的情况下如何选策略使自己的收益最大,即策略选择问题。约翰纳什(J. Nash) 纳什均衡纳什均衡(Nash Equili

3、brium):所有参与人最优策略的组合。此时,每一个理性的参与者都不会有单独改变策略,因为当其他人不改变策略时如果他改变策略他的收益将会降低 。例如:在两人合作博弈中,当参与者A采取其最优策略a*,参与者B也采取其最优策略b*,如果B仍采取b*,而A却采取另一种策略a,那么A的收益不会超过他采取原来的策略a*的收益。这一结果对B亦是如此。应用举例:应用举例:田忌赛马: 贵族:上等马、中等马、下等马田忌:下等马、上等马、中等马司马迁 史记财富分配: a、b、c三人投票决定如何分配100万,他们分别拥有50、40、10的权力,规则规定,当超过50%的票认可了某种方案时才能通过。如何分配才是合理的呢

4、? 按可以票力分配,a50万、b40万、c10万;c向a提出:a70万、b0、c30万b向a提出:a80万、b20万、c0权力指数:每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数,这个“关键加入者”的个数就被称为权利指数。夏普里值夏普里值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。次序 abc acb bac bca cab cba 关键加入者 a c a c a b由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6 所以a,b,c应分别获得100万的2/3,1/3,1/3。最后通牒博弈最后通牒博弈酒吧博弈在酒吧中消费,人太多则

5、拥挤,人少则能够享受很好的服务。第一次到酒吧的人多,那么大多人人认为酒吧人太多,太挤。第二次决定的时候,参考前次而不去酒吧。少数去的人发现酒吧的人第二天很少,感觉很爽,第三次将继续回来,并重新带回许多人循环就此开始。如何决定下一次是否去酒吧消费?争当少数者博弈争当少数者博弈智猪博弈小猪和大猪住在猪圈的一边(食槽在这里),开启食物的开关在另一头,谁去踩,谁丧失先机。如何小猪去踩开关,等小猪回来的时候大猪已经把大部分食物吃完。如果大猪去踩开关,等大猪回来的时候小猪已经把一半的食物吃完。对于小猪来说,最佳策略是等待大猪去踩开关,然后“搭便车”获得小部分食物。然而,当大猪不去踩开关的时候,小猪也要冒风

6、险去踩开关。例如腾讯毫无顾忌地跟风,做QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时候踢开挡路的,就可以了。关税战: 任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。X国和Y国进行贸易就是博弈。这里存在一Nash均衡,就是双方都实行贸易保护主义,提高关税。在这个均衡中贸易双方采取不合作的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税。结果贸易双方的利益都受到损害,也就是损人不利己。反之,如果贸易双方都采取合作的策略,都减少关税限制,那么双方都可以从

7、贸易自由中获得了最大利益。(2)演化博弈论 进化稳定策略(Evolutionary stable strategy) 理性、重复博弈; 策略学习动力学。善良(niceness)、报复(retaliation)、宽容(forgiveness)、清晰(clarity)针锋相对(tit for tat, TFT)“囚徒困境”博弈M. A. Nowak and R. M. May, Evolutionary games and spatial chaos, Nature, 359, 826 (1992).M. Nowak and R. May, Evolutionary games and spatial chaos, Nature (1992)(a)R = 1,R= 1.62,S = 0.07,P= 0(b)R = 1,R= 1.62,S = 0.38, P= 0C. Hauert and M. Doebe

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论