版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、合 作 的 进进 化 北京天则则经济研研究所第第1399次双周周学术讨讨论会由由吴坚忠忠博士作作主题发发言,研研讨了美美国学者者艾克斯斯罗德提提出的合作的的进化问题,艾克斯斯罗德通通过对多多人多次次重复博博弈的对对策研究究,指出出在博弈弈中产生生合作的的必要条条件和获获胜策略略的主要要特征。当策略略群体是是按各种种策略的的得分进进行淘汰汰和进化化时,艾艾克斯罗罗德发现现,群体体以一种种不可逆逆转的方方式向合合作的方方向进化化,也就就是说,群体的的合作性性随进化化过程越越来越大大。与会会学者在在主题发发言之后后展开了了热烈的的讨论。以下是是这次学学术讨论论会的综综合观点点。一、 博博弈中最最优策
2、略略的产生生 艾克斯罗罗德在开开始研究究合作之之前,设设定了两两个前提提:一、每个人人都是自自私的;二、没没有权威威干预个个人决策策。也就就是说,个人可可以完全全按照自自己利益益最大化化的企图图进行决决策。在在此前提提下,合合作要研研究的问问题是:第一、人为什什么要合合作;第第二、人人什么时时候是合合作的,什么时时候又是是不合作作的;第第三、如如何使别别人与你你合作。社会实践践中有很很多合作作的问题题。比如如国家之之间的关关税报复复,对他他国产品品提高关关税有利利于保护护本国的的经济,但是国国家之间间互提关关税,产产品价格格就提高高了,丧丧失了竞竞争力,损害了了国际贸贸易的互互补优势势。在对对
3、策中,由于双双方各自自追求自自己利益益的最大大化,导导致了群群体利益益的损害害。对策策论以著著名的囚囚犯困境境来描述述这个问问题。A和B各各表示一一个人,他们的的选择是是完全无无差异的的。选择择C代表表合作,选择DD代表不不合作。如果AAB都选选择C合合作,则则两人各各得3分分;如果果一方选选C,一一方选DD,则选选C的得得零分,选D的的得5分分;如果果AB都都选D,双方各各得1分分。显然,对对群体来来说最好好的结果果是双方方都选CC,各得得3分,共得66分。如如果一方方选C,一方选选D,总总体得55分。如如果两人人都选DD,总体体得2分分。 对策学界界用这个个矩阵来来描述个个体理性性与群体体
4、理性的的冲突:每个人人在追求求个体利利益最大大化时,就使群群体利益益受损,这就是是囚徒困困境。在在矩阵中中,对于于A来说说,当对对方选CC,他选选D得55分,选选C只得得3分;当对方方选D,他选DD得1分分,选CC得零分分。因此此,无论论对方选选C或DD,对AA来说,选D都都得分最最多。这这是A单单方面的的优超策策略。而而当两个个优超策策略相遇遇,即AA,B都都选D时时,结果果是各得得1分。这个结结果在矩矩阵中并并非最优优。困境境就在于于,每个个人采取取各自的的优超策策略时,得出的的解是稳稳定的,但不是是帕累托托最优的的,这个个结果体体现了个个体理性性与群体体理性的的矛盾。在数学学上,这这个一
5、次次性决策策的矩阵阵没有最最优解。如果博弈弈进行多多次,只只要对策策者知道道博弈次次数,他他们在最最后一次次肯定采采取互相相背叛的的策略。既然如如此,前前面的每每一次也也就没有有合作的的必要,因此,在次数数已知的的多次博博弈中,对策者者没有一一次会合合作。如果博弈弈在多人人间进行行,而且且次数未未知,对对策者就就会意识识到,当当持续地地采取合合作并达达成默契契时,对对策者就就能持续续地各得得3分,但如果果持续地地不合作作的话,每个人人就永远远得1分分。这样样,合作作的动机机就显现现出来。多次对对局下,未来的的收益应应比现在在的收益益多一个个折现率率W,WW越大,表示未未来的收收益越重重要。在在
6、多人对对策持续续进行下下去,且且W比较较大,即即未来充充分重要要时,最最优的策策略是与与别人采采取的策策略有关关的。假假设某人人的策略略是,第第一次合合作,以以后只要要对方不不合作一一次,他他就永不不合作。对这种种对策者者,当然然合作下下去是上上策。假假如有的的人不管管对方采采取什么么策略,他总是是合作,那么总总是对他他采取不不合作的的策略得得分最多多。对于于总是不不合作的的人,也也只能采采取不合合作的策策略。艾克斯罗罗德做了了一个实实验,邀邀请多人人来参加加游戏,得分规规则与前前面的矩矩阵相同同,什么么时候结结束游戏戏是未知知的。他他要求每每个参赛赛者把追追求得分分最多的的策略写写成计算算机
7、程序序,然后后用单循循环赛的的方式将将参赛程程序两两两博弈,以找出出什么样样的策略略得分最最高。第一轮游游戏有114个程程序参加加,再加加上艾克克斯罗德德自己的的一个随随机程序序(即以以50%的概率率选取合合作或不不合作),运转转了3000次。结果得得分最高高的程序序是加拿拿大学者者罗伯布布写的一报还还一报(tiit ffor tatt)。这这个程序序的特点点是,第第一次对对局采用用合作的的策略,以后每每一步都都跟随对对方上一一步的策策略,你你上一次次合作,我这一一次就合合作,你你上一次次不合作作,我这这一次就就不合作作。艾克克斯罗德德还发现现,得分分排在前前面的程程序有三三个特点点:第一一,
8、从不不首先背背叛,即即善良良的;第二,对于对对方的背背叛行为为一定要要报复,不能总总是合作作,即可激怒怒的;第三,不能人人家一次次背叛,你就没没完没了了的报复复,以后后人家只只要改为为合作,你也要要合作,即宽宽容性。为了进一一步验证证上述结结论,艾艾氏决定定邀请更更多的人人再做一一次游戏戏,并把把第一次次的结果果公开发发表。第第二次征征集到了了62个个程序,加上他他自己的的随机程程序,又又进行了了一次竞竞赛。结结果,第第一名的的仍是一报还还一报。艾氏氏总结这这次游戏戏的结论论是:第第一,一报还还一报仍是最最优策略略。第二二,前面面提到的的三个特特点仍然然有效,因为663人中中的前115名里里,
9、只有有第8名名的哈灵灵顿程序序是不不善良的的,后后15名名中,只只有1个个总是合合作的是是善良良的。可激怒怒性和宽宽容性也也得到了了证明。此外,好的策策略还必必须具有有的一个个特点是是清晰晰性,能让对对方在三三、五步步对局内内辨识出出来,太太复杂的的对策不不见得好好。一一报还一一报就就有很好好的清晰晰性,让让对方很很快发现现规律,从而不不得不采采取合作作的态度度。 二、 合合作的进进行过程程及规律律 一报还还一报的策略略在静态态的群体体中得到到了很好好的分数数,那么么,在一一个动态态的进化化的群体体中,这这种合作作者能否否产生、发展、生存下下去呢?群体是是会向合合作的方方向进化化,还是是向不合
10、合作的方方向进化化?如果果大家开开始都不不合作,能否在在进化过过程中产产生合作作?为了了回答这这些疑问问,艾氏氏用生态态学的原原理来分分析合作作的进化化过程。假设对策策者所组组成的策策略群体体是一代代一代进进化下去去的,进进化的规规则包括括:一,试错。人们在在对待周周围环境境时,起起初不知知道该怎怎么做,于是就就试试这这个,试试试那个个,哪个个结果好好就照哪哪个去做做。第二二,遗传传。一个个人如果果合作性性好,他他的后代代的合作作基因就就多。第第三,学学习。比比赛过程程就是对对策者相相互学习习的过程程,一一报还一一报的的策略好好,有的的人就愿愿意学。按这样样的思路路,艾氏氏设计了了一个实实验,
11、假假设633个对策策者中,谁在第第一轮中中的得分分高,他他在第二二轮的群群体中所所占比例例就越高高,而且且是他的的得分的的正函数数。这样样,群体体的结构构就会在在进化过过程中改改变,由由此可以以看出群群体是向向什么方方向进化化的。实验结果果很有趣趣。一一报还一一报原原来在群群体中占占1/663,经经过10000代代的进化化,结构构稳定下下来时,它占了了24%。另外外,有一一些程序序在进化化过程中中消失了了。其中中有一个个值得研研究的程程序,即即原来前前15名名中唯一一的那个个不善善良的哈灵顿顿程序,它的对对策方案案是,首首先合作作,当发发现对方方一直在在合作,它就突突然来个个不合作作,如果果对
12、方立立刻报复复它,它它就恢复复合作,如果对对方仍然然合作,它就继继续背叛叛。这个个程序一一开始发发展很快快,但等等到除了了一报报还一报报之外外的其它它程序开开始消失失时,它它就开始始下降了了。因此此,以合合作系数数来测量量,群体体是越来来越合作作的。进化实验验揭示了了一个哲哲理:一一个策略略的成功功应该以以对方的的成功为为基础。一报报还一报报在两两个人对对策时,得分不不可能超超过对方方,最多多打个平平手,但但它的总总分最高高。它赖赖以生存存的基础础是很牢牢固的,因为它它让对方方得到了了高分。哈灵顿顿程序就就不是这这样,它它得到高高分时,对方必必然得到到低分。它的成成功是建建立在别别人失败败的基
13、础础上的,而失败败者总是是要被淘淘汰的,当失败败者被淘淘汰之后后,这个个好占别别人便宜宜的成功功者也要要被淘汰汰。那么,在在一个极极端自私私者所组组成的不不合作者者的群体体中,一报还还一报能否生生存呢?艾氏发发现,在在得分矩矩阵和未未来的折折现系数数一定的的情况下下,可以以算出,只要群群体的55%或更更多成员员是一一报还一一报的的,这些些合作者者就能生生存,而而且,只只要他们们的得分分超过群群体的总总平均分分,这个个合作的的群体就就会越来来越大,最后蔓蔓延到整整个群体体。反之之,无论论不合作作者在一一个合作作者占多多数的群群体中有有多大比比例,不不合作者者都是不不可能自自下而上上的。这这就说明
14、明,社会会向合作作进化的的棘轮是是不可逆逆转的,群体的的合作性性越来越越大。艾艾克斯罗罗德正是是以这样样一个鼓鼓舞人心心的结论论,突破破了囚囚犯困境境的研研究困境境。在研究中中发现,合作的的必要条条件是:第一、关系要要持续,一次性性的或有有限次的的博弈中中,对策策者是没没有合作作动机的的;第二二、对对对方的行行为要做做出回报报,一个个永远合合作的对对策者是是不会有有人跟他他合作的的。那么,如如何提高高合作性性呢?首首先,要要建立持持久的关关系,即即使是爱爱情也需需要建立立婚姻契契约以维维持双方方的合作作。第二二、要增增强识别别对方行行动的能能力,如如果不清清楚对方方是合作作还是不不合作,就没法
15、法回报他他了。第第三、要要维持声声誉,说说要报复复就一定定要做到到,人家家才知道道你是不不好欺负负的,才才不敢不不与你合合作。第第四、能能够分步步完成的的对局不不要一次次完成,以维持持长久关关系,比比如,贸贸易、谈谈判都要要分步进进行,以以促使对对方采取取合作态态度。第第五、不不要嫉妒妒人家的的成功,一报报还一报报正是是这样的的典范。第六、不要首首先背叛叛,以免免担上罪罪魁祸首首的道德德压力。第七、不仅对对背叛要要回报,对合作作也要作作出回报报。第八八、不要要耍小聪聪明,占占人家便便宜。艾克斯罗罗德在合作的的进化一书结结尾提出出几个结结论。第第一、友友谊不是是合作的的必要条条件,即即使是敌敌人
16、,只只要满足足了关系系持续,互相回回报的条条件,也也有可能能合作。比如,第一次次世界大大战期间间,德英英两军在在战壕战战中遇上上了三个个月的雨雨季,双双方在这这三个月月中达成成了默契契,互相相不攻击击对方的的粮车给给养,到到大反攻攻时再你你死我活活地打。这个例例子说明明,友谊谊不是合合作的前前提。第第二、预预见性也也不是合合作的前前提,艾艾氏举出出生物界界低等动动物、植植物之间间合作的的例子来来说明这这一点。但是,当有预预见性的的人类了了解了合合作的规规律之后后,合作作进化的的过程就就会加快快。这时时,预见见性是有有用的,学习也也是有用用的。当游戏中中考虑到到随机干干扰,即即对策者者由于误误会
17、而开开始互相相背叛的的情形时时,吴坚坚忠博士士经研究究发现,以修正正的一一报还一一报,即以一一定的概概率不报报复对方方的背叛叛,和悔过的的一报还还一报,即以以一定的的概率主主动停止止背叛。群体所所有成员员处理随随机环境境的能力力越强,悔过过的一报报还一报报效果果越好,宽大大的一报报还一报报效果果越差。三、 艾艾克斯罗罗德的贡贡献与局局限性艾克斯罗罗德通过过数学化化和计算算机化的的方法研研究如何何突破囚囚徒困境境,达成成合作,将这项项研究带带到了一一个全新新境界,他在数数学上的的证明无无疑是十十分雄辩辩和令人人信服的的,而且且,他在在计算机机模拟中中得出的的一些结结论是非非常惊人人的发现现,比如
18、如,总分分最高的的人在每每次博弈弈中都没没有拿到到最高分分。艾氏所发发现的一报还还一报策略,从社会会学的角角度可以以看作是是一种互惠式式利他,这种种行为的的动机是是个人私私利,但但它的结结果是双双方获利利,并通通过互惠惠式利他他有可能能覆盖了了范围最最广的社社会生活活,人们们通过送送礼及回回报,形形成了一一种社会会生活的的秩序,这种秩秩序即使使在多年年隔绝,语言不不通的人人群之间间也是最最易理解解的东西西。比如如,哥伦伦布登上上美洲大大陆时,与印地地安人最最初的交交往就开开始于互互赠礼物物。有些些看似纯纯粹的利利他行为为,比如如无偿损损赠,也也通过某某些间接接方式,比如社社会声誉誉的获得得,得
19、到到了回报报。研究究这种行行为,将将对我们们理解社社会生活活有很重重要的意意义。囚徒困境境扩展为为多人博博弈时,就体现现了一个个更广泛泛的问题题社会悖悖论,或资资源悖论论。人人类共有有的资源源是有限限的,当当每个人人都试图图从有限限的资源源中多拿拿一点儿儿时,就就产生了了局部利利益与整整体利益益的冲突突。人口口问题、资源危危机、交交通阻塞塞,都可可以在社社会悖论论中得以以解释,在这些些问题中中,关键键是通过过研究,制定游游戏规则则来控制制每个人人的行为为。艾克斯罗罗德的一一些结论论在中国国古典文文化道德德传统中中可以很很容易地地找到对对应,投桃报报李、人不不犯我,我不犯犯人都都体现了了tiit
20、 ffor tatt的思思想。但但这些东东西并不不是最优优的,因因为一一报还一一报在在充满了了随机性性的现实实社会生生活里是是有缺陷陷的。对对此,孔孔子在几几千年前前就说出出了以以德报德德,以直直报怨这样精精彩的修修正策略略,所谓谓直,就是是公正,以公正正来回报报对方的的背叛,是一种种修正了了的一一报还一一报,修正的的是报复复的程度度,本来来会让你你损失55分,现现在只让让你损失失3分,从而以以一种公公正审判判来结束束代代相相续的报报复,形形成文明明。但是,艾艾氏对博博弈者的的一些假假设和结结论使其其研究不不可避免免地与现现实脱节节。首先先,合合作的进进化一一书暗含含着一个个重要的的假定,即,
21、个个体之间间的博弈弈是完全全无差异异的。现现实的博博弈中,对策者者之间绝绝对的平平等是不不可能达达到的。一方面面,对策策者在实实际的实实力上有有差异,双方互互相背叛叛时,可可能不是是各得11分,而而是强者者得5分分,弱者者得0分分,这样样,弱者者的报复复就毫无无意义。另一方方面,即即使对局局双方确确实旗鼓鼓相当,但某一一方可能能怀有赌赌徒心理理,认定定自己更更强大,采取背背叛的策策略能占占便宜。艾氏的的得分矩矩阵忽视视了这种种情形,而这种种赌徒心心理恰恰恰在社会会上大量量引发了了零和博博弈。因因此,程程序还可可以在此此基础上上进一步步改进。其次,艾艾氏认为为合作不不需预期期和信任任。这是是他受到到质疑颇颇多之处处。对策策者根据据对方前前面
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年皮制品加工协议在线浏览
- 2024施工招标指南及协议条款
- 2024劳务外包派遣协议样本
- 2024年度技术交易协议样本
- 2024年度城市堡坎加固改造项目协议
- 全渠道推广与品牌传播战略规划与实践案例考核试卷
- 《ADHD情绪识别特征与临床症状的相关性分析》
- 《印迹壳聚糖对含金属离子白芍水提液的絮凝工艺研究》
- 《连续并购背景下苏宁易购盈利模式研究》
- 2024至2030年中国全灰高光板数据监测研究报告
- 公安派出所建设标准
- 小学开展仪式教育的策略研究
- 股骨颈骨折一病一品课件
- 小教文小学语文课堂导入存在问题及对策研究
- 教育部产学合作协同育人项目师资培训项目申报书模板(校企合作背景下软件开发类课程师资队伍建设)
- 美容院顾客管理档案表
- 锦鲤的繁殖与选优技术
- 四年级数学家长会课件
- 华北理工《社会医学》讲义11健康危险因素评价
- 透析饮食课件
- 妊娠期高血压护理查房医学课件
评论
0/150
提交评论