博弈论与信息经济学-5.演化博弈_第1页
博弈论与信息经济学-5.演化博弈_第2页
博弈论与信息经济学-5.演化博弈_第3页
博弈论与信息经济学-5.演化博弈_第4页
博弈论与信息经济学-5.演化博弈_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章演化博弈经济学与生物学经济学和生物学的历史从来就交织在一起。众所周知,CharlesDarwin的一个核心洞见就来源于ThomasMalthus(1803)。对于Darwin来说,Malthus的人口的增长率倾向于超过产量增长率的论证暗示着不可避免的生存之战,因此暗示着适者生存的自然选择。二者研究的都是个体在给定环境下的最优策略。它们包含的内在逻辑相当一致:所有生命体的行为看上去总好像设法使其基因的遗传频率最大化,正如企业最大化其利润一样。经济学与生物学经济学生物学企业物种(或个体)最优化适应策略基因利润适应性(fitness)扩张繁殖倒闭灭绝创新变异

在经典博弈论中,假设参与人具有使自己支付最大化的主观意识与对于对手策略的最优反应能力,在实际中,这种假设可能是不现实的。譬如在“象棋”中,棋手不可能在每一步都能够采取最优的反应行动。自然界中的博弈吸血蝙蝠夜间去大型哺乳动物那里吸血,有些个体偶尔会空腹而归,此时吸饱血的个体就会吐出胃内的血液喂给饥饿的个体,尽管它们之间并没有直接血缘关系。吸血蝙蝠更有可能回吐血液给以前曾经回吐过血液的蝙蝠,而骗子(拒绝分享的蝙蝠)将被蝙蝠群体记住,并且被排除在这种协作之外。自然界中的博弈白色念珠菌(Moniliaalbican或canidiaAlbicans),是一种真菌,通常存在于正常人口腔和消化道粘膜中,一般在正常机体中数量少,不引起疾病。当机体免疫功能或一般防御力下降,则本菌大量繁殖并改变生长形式(芽生菌丝相)侵入细胞引起疾病。演化博弈论(evolutionarystablestrategy)整合了理性经济学与演化生物学的思想,不再将参与人模型化为超级理性的博弈方,认为参与人通常是通过试错的方法达到博弈均衡的,与生物演化具有共性。在演化博弈中,认为参与人的选择行为可以依据前人的经验、学习与模仿他人行为、受遗传因素的决定等。因而演化博弈把具有主观选择行为的参与人扩展为包括动物、植物在内的有机体,动植物参与者的支付可被理解为为某种适应程度。把博弈论的分析与应用从研究人类的竞争行为扩展为研究有机体的策略互动关系。这个领域的开创性工作是由英国生物学家约翰·梅纳德·史密斯(JohnMaynardSmith)和G.R.普莱斯(G.R.Price)1973年进行的。演化博弈现在正逐渐被广泛应用于社会经济学领域。演化博弈的关注内容演化博弈强调经济变迁过程中以个体多样性变异机制和偏好选择机制为代表的种群研究。它探讨种群选择的策略是否获得最佳的收益,并消除任何小的突变群体的扰动。演化博弈的假设条件首先我们假定群体中的参与人都是完全相同的,因此以下我们只考虑对称博弈。其次,我们假定每个参与人只能机械地选择某种策略(而无法改变自己的策略)。如果某种策略获得了成功,采用这种策略的参与人将越来越多,反之如果某种策略不成功,采用这种策略的参与人就越来越少。演化稳定策略(ESS)演化稳定策略,是指如果占群体绝大多数的个体选择演化稳定策略,那么小的突变者群体就不可能侵入到这个群体。或者说,在自然选择压力下,突变者要么改变策略而选择演化稳定策略,要么退出系统而在进化过程中消失。例1:囚徒困境博弈CDC2,20,3D3,01,1C代表合作,D代表背叛。合作是否是一种演化稳定策略?分析:CDC2,20,3D3,01,1假定一个群体由合作者构成,由于基因变异出现了比例为ε的背叛者。此时合作者的收益为:(1-ε)*2+ε*0=2-2ε背叛者的收益为:(1-ε)*3+ε*1=3-2ε由于背叛者的收益高于合作者的收益,背叛者不仅不会消亡,反而会越来越多。因此,合作不是一个演化稳定策略。演化稳定策略是什么呢?CDC2,20,3D3,01,1假定一个群体由背叛者构成,由于基因变异出现了比例为ε的合作者。此时背叛者的收益为:(1-ε)*1+ε*3=1+2ε合作者的收益为:(1-ε)*0+ε*2=2ε由于合作者的收益低于背叛者的收益,合作者会逐渐消亡,因此背叛是一个演化稳定策略。结论:严格劣策略不可能是演化稳定策略。例2:ABCA2,20,00,0B0,00,01,1C0,01,10,0问题1:C是否是一个演化稳定策略?结论:一个策略可以入侵别的策略,并不意味着它就是演化稳定策略。问题2:C是否是一个纳什均衡?结论:如果一个策略组合(S,S)不构成纳什均衡,则S不是演化稳定策略。纳什均衡与演化稳定策略ABA1,10,0B0,00,0博弈的纳什均衡(A,A)和(B,B)。B是否是一个演化稳定策略?结论:1.纳什均衡并不意味着演化稳定策略;2.严格纳什均衡意味着演化稳定策略。纯策略下演化稳定策略的定义1

(MaynardSmith,1972)纯策略下演化稳定策略的定义2例3:找出ESSABA1,11,1B1,10,0U(A,A)=U(B,A)U(A,B)>U(B,B)因此A是演化稳定策略例4:ABA10,100,0B0,01,1演化稳定策略:A和CC是一种效率很低的状态,但社会一旦陷入了这种状态,就很难走出去。这就是所谓的“路径依赖”路径依赖路径依赖(Path-Dependence),指人类社会中的技术演进或制度变迁均有类似于物理学中的惯性,即一旦进入某一路径(无论是“好”还是“坏”)就可能对这种路径产生依赖。一旦人们做了某种选择,就好比走上了一条不归之路,惯性的力量会使这一选择不断自我强化,并让你轻易走不出去。有人将5只猴子放在一只笼子里,并在笼子中间吊上一串香蕉,只要有猴子伸手去拿香蕉,就用高压水教训所有的猴子,直到没有一只猴子再敢动手。然后用一只新猴子替换出笼子里的一只猴子,新来的猴子不知这里的“规矩”,竟又伸出上肢去拿香蕉,结果触怒了原来笼子里的4只猴子,于是它们代替人执行惩罚任务,把新来的猴子暴打一顿,直到它服从这里的“规矩”为止。试验人员如此不断地将最初经历过高压水惩戒的猴子换出来,最后笼子里的猴子全是新的,但没有一只猴子再敢去碰香蕉。起初,猴子怕受到“株连”,不允许其他猴子去碰香蕉,这是合理的。但后来人和高压水都不再介入,而新来的猴子却固守着“不许拿香蕉”的制度不变,这就是路径依赖的自我强化效应。路径依赖的例子路径依赖的例子一个广为流传、引人入胜的例证是:现代铁路两条铁轨之间的标准距离是四英尺又八点五英寸。原来,早期的铁路是由建电车的人所设计的,而四英尺又八点五英寸正是电车所用的轮距标准。那么,电车的标准又是从哪里来的呢?最先造电车的人以前是造马车的,所以电车的标准是沿用马车的轮距标准。马车又为什么要用这个轮距标准呢?英国马路辙迹的宽度是四英尺又八点五英寸,所以,如果马车用其他轮距,它的轮子很快会在英国的老路上撞坏。这些辙迹又是从何而来的呢?从古罗马人那里来的。因为整个欧洲,包括英国的长途老路都是由罗马人为它的军队所铺设的,而四英尺又八点五英寸正是罗马战车的宽度。任何其他轮宽的战车在这些路上行驶的话,轮子的寿命都不会很长。可以再问,罗马人为什么以四英尺又八点五英寸为战车的轮距宽度呢?原因很简单,这是牵引一辆战车的两匹马屁股的宽度。故事到此还没有结束。美国航天飞机燃料箱的两旁有两个火箭推进器,因为这路径依赖些推进器造好之后要用火车运送,路上又要通过一些隧道,而这些隧道的宽度只比火车轨道宽一点,因此火箭助推器的宽度是由铁轨的宽度所决定的。所以,最后的结论是:路径依赖导致了美国航天飞机火箭助推器的宽度,竟然是两千年前便由两匹马屁股的宽度所决定的。成功是一种习惯人们关于习惯的一切理论都可以用“路径依赖”来解释。它告诉我们,要想路径依赖的负面效应不发生,那么在最开始的时候就要找准一个正确的方向。每个人都有自己的基本思维模式,这种模式很大程度上会决定你以后的人生道路。而这种模式的基础,其实是早在童年时期就奠定了的。做好了你的第一次选择,你就设定了自己的人生。路径依赖与制度变革对组织而言,一种制度形成后,会形成某个既得利益集团,他们对现在的制度有强烈的要求,只有巩固和强化现有制度才能保障他们继续获得利益,哪怕新制度对全局更有效率。对个人而言,一旦人们做出选择以后会不断地投入精力、金钱及各种物资,如果哪天发现自己选择的道路不合适也不会轻易改变,因为这样会使得自己在前期的巨大投入变得一文不值,这在经济学上叫“沉没成本”。沉没成本是路径依赖的主要原因。猎鹿博弈猎鹿博弈源自启蒙思想家卢梭的著作《论人类不平等的起源和基础》中的一个故事。古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果一个猎人单兵作战,一天最多只能打到4只兔子。只有两个一起去才能猎获一只鹿。从填饱肚子的角度来说,4只兔子能保证一个人4天不挨饿,而一只鹿却能让两个人吃上10天。改变收益矩阵的猎鹿博弈33044044另一个例子

问题1:此博弈对应现实生活中的什么情况

问题2:此博弈是否存在演化稳定策略ABA0,02,1B1,20,0混合策略下演化稳定策略的定义找出以下博弈的混合策略ESSABA0,02,1B1,20,0(1)找出博弈的混合策略纳什均衡。 由于博弈的对称性,双方的混合策略纳什均衡必然是相同的,设为(p,1-p) 给定局中人1的策略(p,1-p) 局中人2选择A的收益:p*0+(1-p)*2=2-2p 局中人2选择B的收益:p*1+(1-p)*0=p 根据2-p=p,解出p=2/3(2)(2/3,1/3)是否是一个严格纳什均衡?(3)(2/3,1/3)是否是ESS?象海豹的生存策略鹰鸽博弈HDH(v-c)/2,(v-c)/2v,0D0,vv/2,v/2博弈的演化稳定策略是什么?当v>c时,(H,H)是严格纳什均衡,因此H是演化稳定策略。当v=c时,(H,H)是弱纳什均衡,因为U(H,D)>U(D,D),因此H是演化稳定策略当v<c时,不存在纯策略演化稳定策略。此时是否存在混合策略ESS?首先找出混合策略纳什均衡(v/c,1-v/c),其次验证其是否为ESS。石头剪刀布RSPR1,1V,00,VS0,V1,1V,0PV,00,V1,11<V<2易证,博弈中唯一的混合策略纳什均衡是p=(1/3,1/3,1/3)验证其是否为ESS,设p‘=(p,q,1-p-q)U(p,p')=(1+V)/3U(p',p')=1U(p,p')<U(p',p')因此博弈中不存在ESS蜥蜴的生存策略动态演化复制者(replicator)能够大致精确地复制自身的个体。例如基因、生物体或是弥母(meme)动态演化的复制者系统不同复制者的所占比例随时间的变化过程,其中不同策略复制的速度与他们的收益呈正相关。复制者的策略考虑一个n人演化博弈(i=1,2,...n),博弈在每个时间点t上进行(t=1,2,...).设pit为在t期中采用策略si的局中人的比例,此时si的收益为πit=πi(pt),其中p=(p1,...,pn)。不妨设π1t≤π2t≤…≤πnt假定在每个时期dt,每个个体i都以αdt的概率发现某个随机个体j的收益,如果i发现j的收益比自己高,就以pijt的概率转变为j的策略。此时在t+dt期使用si策略的局中人所占比例的期望值Epit+dt为:如果个体数量很多,则Epit+dt≈pit+dt这个式子称为复制者动态(replicatordynamic)方程复制者动态方程的应用鹰鸽鹰u-1,u

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论