科学发展与社会和谐的互动机制(copy)课件_第1页
科学发展与社会和谐的互动机制(copy)课件_第2页
科学发展与社会和谐的互动机制(copy)课件_第3页
科学发展与社会和谐的互动机制(copy)课件_第4页
科学发展与社会和谐的互动机制(copy)课件_第5页
已阅读5页,还剩121页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

科学发展与社会和谐的互动机制研究何伟电话mail:cqswdxhw@中共重庆市委党校博士教授博弈论系列科学发展与社会和谐何伟电话1选题背景竞争是一切社会、经济关系的根本基础。人是经济人具有自利行为。构建社会主义和谐社会,合作是关键。在没有集权约束的情况下,能否出现合作?在面临“合作”还是“不合作”这两难选择中,你应该怎样做?有没有一个“最优的”的策略?合作及其实现路径是什么?作为社会经济活动的参加者和制度设计者,如何才能促进有效的合作?…...…...

对这些问题的回答极大地影响着人们在与他人的社会、政治、经济交往时的思维和行为。选题背景竞争是一切社会、经济关系的根本基础。2

1.完全公平的政治是可能存在的吗?

(发展与和谐、效率与公平、竞争与合作的关系)1.完全公平的政治是可能存在的吗?31.1民意能保证决策的

正确性吗?

1.1民意能保证决策的

正确性吗?

4

人们都承认:民主制度比独裁制度要好。但是为什么民主比独裁好?

1.少数服从多数。因为胳膊反正拗不过大腿,真要打起来,少数势必打不过多数。民主乃是人类有史以来发现的唯一的和平变革方式。2.多数人的决定比少数人的明智。3.多数人也可能犯错误,可是在意见变为决策的过程中,正确意见总会出现,而且会逐渐为多数人接受。人们都承认:民主制度比独裁制度要好。但是为什么5请用“是”、“不是”回答(一)

“请问,青少年犯罪率上升,你担心吗?”“你认为在我们的中小学里缺乏严格的纪律训练吗?”“你认为年轻人欢迎在他们生活中搞一些模拟军事活动吗?”“对青年人提出挑战性的要求,他们会积极响应吗?”“也许你赞成重新恢复兵役?”_____引自《是,首相》

民主反映民意,民意能保证决策的正确性吗?请用“是”、“不是”回答(一)

“请问,青少年犯罪率上升,你6请用“是”、“不是”回答(二)

“请问,你是不是担心爆发战争?”“你对军备的增长很不高兴吧?”“你认为发给青年人枪支并教他们如何杀人,有危险吗?”“你认为违反人们的意志,强迫他们拿起武器是错误的吗?”“也许你反对恢复兵役?”_____引自《是,首相》

民主反映民意,民意能保证决策的正确性吗?请用“是”、“不是”回答(二)

“请问,你是不是担心爆发战争7投票箱里的妖怪A、B、C三位竞选某一公职,而9位选民的偏好如下:2位认为A是第一,B第二,C第三;4位认为C是第一,A第二,B第三;3位认为B是第一,A第二,C第三。投票箱里的妖怪A、B、C三位竞选某一公职,而8选民的选择不变,三种不同的投票规则,产生了三位不同的优胜者,这个结果叫人深思,似乎决定胜负的不是个人的政治主张,而是游戏规则。那么,究竟谁才是“民众真正的期待”呢?选民的选择不变,三种不同的投票规则,产生了三91.2Arrow(阿罗)不可能性定理

(完全的民主可能存在吗?)1.2Arrow(阿罗)不可能性定理

(完全的民主可10在正常理性的情况下,即使知道所有投票者的偏好,也不可能通过一定的方法从每个投票人的偏好次序得出整个集体的偏好次序,不可能通过一定的程序准确地表达集体偏好,从而促成“完美”的公共决策。

阿罗在福利经济学上的这一贡献使他获得1972年诺贝尔经济学奖。在正常理性的情况下,即使知道所有投票者11Arrow不可能性定理的换一种说法:

社会的选择方法不可能既是有效率的,又是民主的。

物理学上的“测不准原理”(1927年海森伯提出测不准关系),说明对粒子的坐标和动量不可能同时进行准确的测量。

h是普朗克常数。Arrow不可能性定理的换一种说法:

社会的选择方法不12

阿罗从此得出:“对于每一存在真正意见分歧的选择,存在一个独裁者。”这就是说,在社会选择中,国家的权威是不可避免的。(构建社会主义和谐社会与党的领导)

“科学发展观,核心是以人为本,基本要求是全面协调可持续,根本方法是统筹兼顾。”(在中国共产党第十七次全国代表大会上的报告)

第一要义是发展,阿罗从此得出:“对于每一存在真正意132.合作及其实现途径2.合作及其实现途径14零和博弈与非零和博弈研究竞争性问题的理论和方法博弈论零和博弈非零和博弈你输我赢(下棋,体育比赛)你死我活你的也是我的你好我好大家都好皆大欢喜有钱大家赚零和博弈与非零和博弈研究竞争性问题的理论和方法博弈论零和博弈152.1合作问题的提出

2.1合作问题的提出

16竞争是一切社会、

经济关系的根本基础

竞争是一切社会、

经济关系的根本基础17两个基本假设:1人都是利己主义者2不存在集权

怎么会产生合作呢?

最著名的回答是由托马斯·霍布斯在300多年前给出的,他悲观地认为,在有政府存在之前,自然王国充满着由自私的个体的残酷竞争引起的矛盾,生活显得“孤独、贫穷、野蛮和浅薄”。按照他的观点,没有集权的合作是不可能产生的。因此,一个强有力的政府是必要的。两个基本假设:1人都是利己主义者2不存在集权18我们所见到的合作现象为了国家安全而寻求的合作关税谈判欧佩克的合作两个公司商定共同的价格水平管理者之间的互通有无…….我们所见到的合作现象为了国家安全而寻求的合作19我们所见到的不合作现象违背合同,不遵守协议违规行为工作中互相拆台,互不支持记者为得到更多消息而对消息来源加以保密体育比赛向对方提供具有误导性、欺骗性等不真实信息房地产开发商有意隐瞒房源、价格等信息,诱使消费者购房……我们所见到的不合作现象违背合同,不遵守协议20不合作是否能给各方带来好处?个体对自身利益的追求整体的利益损失个体利益的更大损失我们的假设是:每个个体都在追求自身利益最大化,但问题是:价格大战贸易壁垒

这一类问题都是“囚犯的困境”。实事上,许多重要的政治、社会和经济过程的最好的模型都是以“囚犯困境”为基础的。不合作是否能给各方带来好处?个体对自身利益的追求整体的利益损21基本模型“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(向警察坦白,从而背叛他的同伙),或者保持沉默(不向警察坦白,也就是与他的同伙合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以警方就给这两个囚犯来了一点儿刺激:基本模型“囚徒困境”说的是两个囚犯22

(1)如果他们保持沉默,也就是与对方合作,则他们会被无罪释放(R=3:对双方合作的奖励)。(2)如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金(T=5:对背叛的诱惑)。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏(S=0:给笨蛋的报酬)。(3)如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏(P=1:对双方背叛的惩罚)。T>R>P>S(1)如果他们保持沉默,也就是与对方合作23假设“囚犯困境”式的游戏可以进行多次乃至无限多次:如果两位自私者玩一次这个游戏如果两位自私者玩有限次这个游戏如果两位自私者玩无限次这个游戏结论背叛背叛????在非零和对策情况下,如何选择我们的策略呢?显然,Nash均衡点并没有给我们提供一个满意的结论。那么,在这样一个两难选择中到底能不能找到令人满意的答案呢?难道我们真的无路可走了吗?假设“囚犯困境”式的游戏可以进行多次乃至无限多次:如果两位自24对未来的考虑,是会影响现在的决策的如果对策者想将对策继续下去,就一定会考虑未来的收益,因而要考虑未来对现在的影响。一般说来,对策者可能会认为未来的收益并没有当前的收益那么重要。折扣系数

w用来反映未来对现在影响程度的一个常数对未来的考虑,是会影响现在的决策的如果对策者想将对策继续下去25在考虑未来利益的情况下,是否存在最优策略?命题1

如果折扣系数w足够大,则不存在独立于对方所采用的策略的最优策略。答案:一个令人伤心的命题!在考虑未来利益的情况下,是否存在最优策略?26一个特定策略的有效性不仅取决于它自己的特性,而且取决于它要相遇的其他策略的特性。

不存在单一的最优策略(独立于对方的最优策略)的论证留下了这样一个问题,在两个个体有足够大的概率打交道的情况下,会出现什么样的行为模式。

一个特定策略的有效性不仅取决于272.2第一次计算机模拟竞赛

(目的:为寻找“最佳”的对策策略)2.2第一次计算机模拟竞赛

(目的:为寻找“最佳”的对28

为寻找“最佳”的对策策略,美国密西根大学的RobertAxelord教授组织了一次别开生面的的计算机竞赛。竞赛方式:

每位参赛者提交一个体现在每一步选择合作或不合作规则的程序;每个程序要和所有其它程序比赛,还要和一个“随机”程序(随机地选择合作或背叛)比赛;每次比赛的局数为200次;记录下每个参赛程序的得分。为寻找“最佳”的对策策略,美国密西根大学的R29“一报还一报”的平均得分:504分前8名参赛者提供的游戏规则都是“善良的”,它们的平均得分是:472-504分后7名都是不善良的,它们的平均得分为:401分“善良的”规则:从不首先背叛1.善有善报

不首先背叛或至少在游戏快要结束之前不背叛,是区分这次计算机“囚犯困境”竞赛中成功的规则和不成功的规则的唯一特性。“一报还一报”的平均得分:504分前8名参赛者提供的游戏规则302.除了善良,还需要宽容宽容性对方背叛之后的合作倾向第一名“一报还一报”:一次惩罚后就让过去的过去了。第八名“弗雷德曼”:决不首先背叛,但一旦受到挑衅,就永远报复下去。(得理不让人,太缺少宽容性)2.除了善良,还需要宽容宽容性对方背叛之后的合作倾向第一名“313.“恶有恶报”一个狡诈的规则:“乔斯”基本想法:试图偶尔背叛而不受到惩罚。比如,它十次会有一次在对方合作之后背叛,而不是在对方合作后总是合作。“一报还一报”与“乔斯”的对局结果(236分-241分〕1-双方合作;2-“一报还一报”合作;3-“乔斯”合作;4-均不合作

这次竞赛的的很重要的教训是认识到在双方竞争的环境下,避免反射效应是很重要的。不善良的规则在比赛中表现不佳。“乔斯”的平均得分为304分,排在第12位。3.“恶有恶报”一个狡诈的规则:“乔斯”基本想法:试图偶尔背32进一步的分析表明许多人在游戏中没有受到挑衅就早早开始背叛,这个特点从长远来看是要付出大代价的。任何参赛者所显示出的宽容性比理想的要小得多。最与重不同的规则“DOWNING”,由于对其它人的初始假设太悲观而做了蠢事。为了更好地应付双方竞争的环境,有许多东西要学。即使是政治学、社会学、经济学、心理学和数学方面的策略专家,也会犯诸如太计较自己的利益、不够宽容、和对对方的反应太悲观等错误。进一步的分析表明许多人在游戏中没有受到挑衅就早早开始背叛,这332.3第二次计算机模拟竞赛

(目的:为了进一步验证“一报还一报”策略的成功)2.3第二次计算机模拟竞赛

(目的:为了进一步验证“一34

为了验证“一报还一报”策略的胜利不是偶然的,Robert教授组织了第二次计算机模拟竞赛。

第二轮竞赛的参赛者,都得到了一份关于第一轮竞赛的详细分析报告。他们不仅知道第一轮竞赛的结果,而且知道用于分析成功的思想和概念以及所发现的易犯的错误。因此,第二轮比赛比第一轮比赛有一个更高的起点。第二次比赛共有62个程序,它们的提供者来自:计算机科学、物理学、数学、心理学、经济学、政治学、社会学和进化生物学的教授,他们来自美国、加拿大、英国、挪威、瑞士和新西兰。参加第一轮比赛的对策论专家们也被邀请再试一次。在第二轮竞赛中,63个规则(包括随机程序)在循环赛中有3969个配对方式,共有上百万次的对局。为了验证“一报还一报”策略的胜利不是偶然的35谁是第二次胜利者?胜利者还是:“一报还一报”策略超过一半的参赛程序是善良的。显然大部分参赛者吸收了第一轮中首先背叛没有好处的教训。前15名中只有一个是不善良的。后15名中只有一个是善良的。规则是否善良与最后得分的相关性为:0.58“一报还一报”是第一轮中提交的最简单的程序,但它赢得了竞赛。它也是第二轮中最简单的程序,又赢得了第二轮竞赛。虽然所有的参赛者都知道“一报还一报”赢得第一轮竞赛,但没有人能设计出比它更好的程序。(多伦多大学阿纳托尔·拉帕波特教授又一次提交)谁是第二次胜利者?胜利者还是:“一报还一报”策略超过一半的参362.4合作的建立及进化2.4合作的建立及进化37一个成功的决策规则所具有的4个特征善良的:

只要对方合作你就合作,避免冲突。它的善良性防止陷入不必要的麻烦。可激怒的:面对他人无理的背叛要坚决反击,它的报复性使对方试着背叛一次后就不敢再背叛。宽容的:

在反击挑衅之后要显出宽容来,它的宽容性有助于重新恢复合作。清晰的:行为要简单明确,容易让对方识别和适应。它的清晰性使它容易被对方理解,从而引出长期的合作。“一报还一报”为什么能够取胜?一个成功的决策规则所具有的4个特征善良的:只要38

“一报还一报”能为大家所遵守吗?命题2(证明略)当且仅当折扣系数w足够大时,“一报还一报”是集体稳定的。且w是T、R、P、S的函数。

①如果w

大于等于2/3,“一报还一报”是集体稳定的。②如果w小于2/3,“背叛和合作交替”策略会占便宜;如果w小于1/2,“总是背叛”策略会占到便宜。只要未来对现在有足够大的影响,没有人能够通过采用其它策略而干得更好。“一报还一报”能为大家所遵守吗?39长期的相互关系对合作稳定性的重要性

一旦一个制造商开始走下坡路,即使是他最好的客户也开始以抱怨质量问题、不符合规格要求、到货迟缓或各种各样的原因而要求拒付货款。商业中的最有力的道德执法者是持续的关系,即人们相信你能与客户或供应商继续做生意。当一个失败的公司失去这个自动的执法者,任何手段都将无法代替。Mayer,1974在一个小镇或同一种族的邻里之间就容易实行互惠的规范。相反,一个访问教授就很可能受到其他教工的冷落,而他们对待固定同事并不这样。长期的相互关系对合作稳定性的重要性一旦一个制造商开始40命题3“总是背叛”策略总是集体稳定的。一个对合作的进化很有启发的命题难道就没有办法入侵这样一个“小人”的世界吗?请你设想一下:

在一个充满“小人”的世界里,如果来了一个“大度”的合作者,会怎样?如果来了两个这样的合作者,会怎样?如果来了一群这样的合作者又会怎样?命题3一个对合作的进化很有启发的命41命题4如果一个善良的策略不能被一个个体侵入,那么它也不能被这类个体的小群体侵入。相反的情况是否会发生?哦!原来,善良的策略能以“小人”策略所不能的方式来保护自己!这是十分令人吃惊而又很有趣的不对称。命题4相反的情况是否会发生?42结论合作可以通过一小群依赖于回报的个体在没有集权的自私的世界中出现。结论合作可以通过一小群依赖于回报的个体432.5合作进化的例证2.5合作进化的例证44第一步:纽约邮报提价,从40美分提到50美分;每日新闻没有反应第二步:纽约邮报降价,从50美分降回到40美分,并宣布价格将进一步降到25美分;每日新闻仍然没有反应第三步:纽约邮报降价,从40美分降到25美分;每日新闻(终于明白了)将价格提高到50美分随后:纽约邮报将价格提高到50美分纽约邮报和每日新闻之间的价格策略合作的进化——例证一第一步:纽约邮报和每日新闻之间的价格策略合作的进化——例证一45发源自第一次世界大战的堑壕中的“自己活也让别人活”的系统有时合作可以在你认为最不可能出现的地方出现。一位巡视前方堑壕的英军参谋官惊奇地发现:对方德军士兵在来福枪射程以内走动着。我们的人却不予理睬,我暗自下决心,当我们接管这里时,一定要杜绝这类事情。这种事情是绝对不允许的,这些人显然不懂得这是战争。Dugdale,1932合作的进化——例证二一位巡视前方堑壕的英军参谋官惊奇地发现:对方46

任何时候,两个相互对峙的小分队均可以做出的选择都是:射击打死对方,或者谨慎地设计以避免造成损伤。对于参战双方,削弱敌人的力量可以增大自己生存的可能性。因此,从短期看,不管敌人是否回射,最好现在就对他们展开进攻。

堑壕战与其它大多数战斗不同的是:

相同的小单位部队长时间在固定的防区里相互对峙。这就将一次性囚徒困境改变为重复的囚徒困境。

任何时候,两个相互对峙的小分队均可以做出的选47这些对立的士兵为了保持双方合作的默契,实际上违抗了他们各自上司的命令。对于部队司令来说,重要的是培养部队的进攻锐气。特别是协约国实行了消耗战的战略,即双方人员的消耗相等就意味着协约国的胜利。因为德国的实力迟早要先消耗掉。因此,在国家这一级,第一次世界大战近似于零和博弈,即一方的损失也就是另一方的所得。但是在前线的局部地区,双方克制比双方惩罚要好。这些对立的士兵为了保持双方合作的默契,实际上48

善良的:只要对方合作你就合作,避免冲突。可激怒的:如果你不让敌人得到他的食物,他的补救方法很简单:他将也不让你得到你的食物。宽容的:在反击挑衅之后要显示出宽容来,它的宽容性有助于重新恢复合作。清晰的:它的清晰性使它容易被对方理解,从而引出长期的合作。结果与理论的预见相吻合:合作可以在原来毫无希望的情况下出现且保持稳定。特别是这个“自己活也让别人活”的系统说明了朋友关系不是合作产生的必要条件。在适当的条件下,基于回报的合作甚至可以在对抗双方中产生。善良的:只要对方合作你就合作,493对参与者和管理者的建议3对参与者和管理者的建议501.不要嫉妒2.不要首先背叛3.对合作与背叛都要给予回报4.不要耍小聪明3.1当你作为社会经济活动的参加者时,请切记:如何有效地选择

好人先成功1.不要嫉妒3.1当你作为社会经济活动51嫉妒无异于自我毁灭。“一报还一报”能获得成功,不在于靠打击对方,而在于通过启发对方合作,避免两败俱伤,达到双赢而得到高分的。“一报还一报”从来没有一次在游戏中比对方得更多的分,但它获得比其他策略更高的总分。在一个非零和的世界里,没有必要非比对方做得更好。1.不要嫉妒你的对手人们倾向于采用相对的标准,这个标准经常把对方的成功与自己的成功联系起来。这种标准导致了嫉妒。嫉妒无异于自我毁灭。1.不要嫉妒你的对手人们倾522.不要首先背叛计算机竞赛的结果说明善良的策略赢得了比赛,不善良的策略占不到便宜。理论分析也证明善良的规则不会被入侵,但要注意,只是在未来显得十分重要的时候。如果未来并不重要,对方采用“一报还一报”,你可以选择交替策略或总是背叛的策略。计算机竞赛的结果是令人吃惊的:决定一个规则表现如何的唯一最好的特征是这个规则是否善良。2.不要首先背叛计算机竞赛的结果说明善良的策略赢得了比赛,不533.对合作与背叛都要给予回报“一报还一报”超常的成功给我们的最有力的建议是:要回报!无条件合作将会宠坏对方,并为社会留下改造被宠坏者的负担。回报是比无条件合作更好的道德基础。对恶行的惩罚,对恶人的威慑与对善行的奖励同样重要,甚至更为重要。宽容固然可以避免不必要的争斗,但过度的宽容就是软弱,它不仅无益,反而有害。“一报还一报”坚持公平原则,它的胜利不是靠比对方做得好,而是靠引导对方的合作,促进双方的利益而不是靠剥削对方的弱点来取胜。我们还能做得更道德吗?3.对合作与背叛都要给予回报“一报还一报”超常的成功给我们的544.不要耍小聪明总是算计对方的一类所谓自身利益“最大化”的策略“永久报复”的策略让对方很难捉摸的一类策略,偶尔背叛想得到好处的策略。竞赛中三类显得似乎过于“聪明的”策略:都没有获得较好的结果!4.不要耍小聪明总是算计对方的一类所谓自身利益“最大化”的策551.增大未来的影响2.改变收益值3.教育人们相互关心4.教育人们要回报5.改进辨别能力3.2当你作为社会经济活动的制度设计者时,请在制度设计时注意:如何促进合作1.增大未来的影响3.2当你作为社会经济活动的制度561、增大未来的影响假设对方采用的是“一报还一报”,你应该采取怎样的策略?“一报还一报”:30分“总是背叛”:14分“背叛和合作交替”:26.3分

“一报还一报”:4.3分“总是背叛”:5.4分“背叛和合作交替”:5.5分

结论:当未来相对于现在不是足够重要时,没有任何形式的合作是稳定的!如果折扣系数为w=0.9,则如果折扣系数为w=0.3,则1、增大未来的影响假设对方采用的是“一报还一报”,你应该采取57如何增大未来的影响使相互作用更持久使相互作用更频繁◆“自己活也让别人活”的系统◆一个大订单分别按每次供货付款◆长期再保险合同◆合作在小城镇比在大城市更容易出现◆有地方基础的公司只和少数地方公司接触◆专业化公司趋向于和少数公司接触◆地摊、车站、旅游点人群流动性大,不但商品和服务质量差,而且假货横行,因为商家和顾客之间“没有明天”。◆在公共汽车上,两个陌生人可能为一个座位吵架,可如果他们认识就会相互谦让。道德、法律、权力利益的划分,都与“还要见面”有关。如何增大未来的影响使相互作用更持久使相互作用更频繁◆“自己活582、改变收益值我为什么要老老实实地交税?我为什么要履行和一个陌生人签定的合同?我能背叛吗?不能!因为背叛会遭到法律的制裁。改变收益政府、法律和法规谁来改变有效的收益值?2、改变收益值我为什么要老老实实地交税?我能背叛吗?不能!改593、教育人们要相互关心利他主义能不能维持?生物进化的遗传学观点认为:利他主义在亲属之间是能够维持的。教育人们关心他人的利益利他主义也可以通过社会来维持。首先对每个人采用利他行为,然后只对那些有相同情感的人采用利他行为。3、教育人们要相互关心利他主义能不能维持?生物进化的遗传学观604、教育人们要回报给我们带来的启示对挑衅不回报,只能遭至更多的对他人的挑衅。基于回报的策略不仅是在帮助自己,也在帮助他人。使沉默者不再沉默的关键是,加大对采取“反抗”策略的奖励,而减少“不反抗”策略的获益。当“反抗”的收益大于“不反抗”策略的获益时,人们就会起来“反抗”。加大道德宣传,增强人们的道德观念,使人们获得来自道德荣誉感或道德满足感的心理补偿。4、教育人们要回报给我们带来的启示615、改进辨别能力什么是辨别能力从接触中识别对方的特征和行为的能力识别背叛什么时候发生的能力辨别能力的改进有助于扩大合作的机会和范围5、改进辨别能力什么是辨别能力从接触中识别对方的特征和行为的62总结

最有价值的发现是:具有预见能力的参与者与制度设计者了解了合作理论的真谛后,能最大限度地将竞争行为从盲目引向理性,促进合作的进化,在市场竞争中立于不败之地,取得更快更大的成功。

◆重要意义:随着中国从相对集权的经济与政治向市场经济的转变,如何促进合作的问题日益显得突出和重要。中国要想充分发挥自己的潜能,合作是关键。人与人之间、组织与组织之间、甚至国家与国家之间都需要合作。

◆重要哲理:“一报还一报”在每一局对策中得到的分数都不会比对手高,它是通过启发对方合作,避免两败俱伤,达到双赢而得到高分的。“好人先成功”。

◆重要结论:人们相互作用越频繁,合作的可能性就越大。当前,信息反馈时间越来越短,人们的重复交易机会正大大增加,这使得基于回报的策略的作用在增强。

◆重要启示:通过学习合作理论,可以促进合作的进化,最终达到“合作”与“和谐”。总结最有价值的发现是63科学发展与社会和谐的互动机制研究何伟电话mail:cqswdxhw@中共重庆市委党校博士教授博弈论系列科学发展与社会和谐何伟电话64选题背景竞争是一切社会、经济关系的根本基础。人是经济人具有自利行为。构建社会主义和谐社会,合作是关键。在没有集权约束的情况下,能否出现合作?在面临“合作”还是“不合作”这两难选择中,你应该怎样做?有没有一个“最优的”的策略?合作及其实现路径是什么?作为社会经济活动的参加者和制度设计者,如何才能促进有效的合作?…...…...

对这些问题的回答极大地影响着人们在与他人的社会、政治、经济交往时的思维和行为。选题背景竞争是一切社会、经济关系的根本基础。65

1.完全公平的政治是可能存在的吗?

(发展与和谐、效率与公平、竞争与合作的关系)1.完全公平的政治是可能存在的吗?661.1民意能保证决策的

正确性吗?

1.1民意能保证决策的

正确性吗?

67

人们都承认:民主制度比独裁制度要好。但是为什么民主比独裁好?

1.少数服从多数。因为胳膊反正拗不过大腿,真要打起来,少数势必打不过多数。民主乃是人类有史以来发现的唯一的和平变革方式。2.多数人的决定比少数人的明智。3.多数人也可能犯错误,可是在意见变为决策的过程中,正确意见总会出现,而且会逐渐为多数人接受。人们都承认:民主制度比独裁制度要好。但是为什么68请用“是”、“不是”回答(一)

“请问,青少年犯罪率上升,你担心吗?”“你认为在我们的中小学里缺乏严格的纪律训练吗?”“你认为年轻人欢迎在他们生活中搞一些模拟军事活动吗?”“对青年人提出挑战性的要求,他们会积极响应吗?”“也许你赞成重新恢复兵役?”_____引自《是,首相》

民主反映民意,民意能保证决策的正确性吗?请用“是”、“不是”回答(一)

“请问,青少年犯罪率上升,你69请用“是”、“不是”回答(二)

“请问,你是不是担心爆发战争?”“你对军备的增长很不高兴吧?”“你认为发给青年人枪支并教他们如何杀人,有危险吗?”“你认为违反人们的意志,强迫他们拿起武器是错误的吗?”“也许你反对恢复兵役?”_____引自《是,首相》

民主反映民意,民意能保证决策的正确性吗?请用“是”、“不是”回答(二)

“请问,你是不是担心爆发战争70投票箱里的妖怪A、B、C三位竞选某一公职,而9位选民的偏好如下:2位认为A是第一,B第二,C第三;4位认为C是第一,A第二,B第三;3位认为B是第一,A第二,C第三。投票箱里的妖怪A、B、C三位竞选某一公职,而71选民的选择不变,三种不同的投票规则,产生了三位不同的优胜者,这个结果叫人深思,似乎决定胜负的不是个人的政治主张,而是游戏规则。那么,究竟谁才是“民众真正的期待”呢?选民的选择不变,三种不同的投票规则,产生了三721.2Arrow(阿罗)不可能性定理

(完全的民主可能存在吗?)1.2Arrow(阿罗)不可能性定理

(完全的民主可73在正常理性的情况下,即使知道所有投票者的偏好,也不可能通过一定的方法从每个投票人的偏好次序得出整个集体的偏好次序,不可能通过一定的程序准确地表达集体偏好,从而促成“完美”的公共决策。

阿罗在福利经济学上的这一贡献使他获得1972年诺贝尔经济学奖。在正常理性的情况下,即使知道所有投票者74Arrow不可能性定理的换一种说法:

社会的选择方法不可能既是有效率的,又是民主的。

物理学上的“测不准原理”(1927年海森伯提出测不准关系),说明对粒子的坐标和动量不可能同时进行准确的测量。

h是普朗克常数。Arrow不可能性定理的换一种说法:

社会的选择方法不75

阿罗从此得出:“对于每一存在真正意见分歧的选择,存在一个独裁者。”这就是说,在社会选择中,国家的权威是不可避免的。(构建社会主义和谐社会与党的领导)

“科学发展观,核心是以人为本,基本要求是全面协调可持续,根本方法是统筹兼顾。”(在中国共产党第十七次全国代表大会上的报告)

第一要义是发展,阿罗从此得出:“对于每一存在真正意762.合作及其实现途径2.合作及其实现途径77零和博弈与非零和博弈研究竞争性问题的理论和方法博弈论零和博弈非零和博弈你输我赢(下棋,体育比赛)你死我活你的也是我的你好我好大家都好皆大欢喜有钱大家赚零和博弈与非零和博弈研究竞争性问题的理论和方法博弈论零和博弈782.1合作问题的提出

2.1合作问题的提出

79竞争是一切社会、

经济关系的根本基础

竞争是一切社会、

经济关系的根本基础80两个基本假设:1人都是利己主义者2不存在集权

怎么会产生合作呢?

最著名的回答是由托马斯·霍布斯在300多年前给出的,他悲观地认为,在有政府存在之前,自然王国充满着由自私的个体的残酷竞争引起的矛盾,生活显得“孤独、贫穷、野蛮和浅薄”。按照他的观点,没有集权的合作是不可能产生的。因此,一个强有力的政府是必要的。两个基本假设:1人都是利己主义者2不存在集权81我们所见到的合作现象为了国家安全而寻求的合作关税谈判欧佩克的合作两个公司商定共同的价格水平管理者之间的互通有无…….我们所见到的合作现象为了国家安全而寻求的合作82我们所见到的不合作现象违背合同,不遵守协议违规行为工作中互相拆台,互不支持记者为得到更多消息而对消息来源加以保密体育比赛向对方提供具有误导性、欺骗性等不真实信息房地产开发商有意隐瞒房源、价格等信息,诱使消费者购房……我们所见到的不合作现象违背合同,不遵守协议83不合作是否能给各方带来好处?个体对自身利益的追求整体的利益损失个体利益的更大损失我们的假设是:每个个体都在追求自身利益最大化,但问题是:价格大战贸易壁垒

这一类问题都是“囚犯的困境”。实事上,许多重要的政治、社会和经济过程的最好的模型都是以“囚犯困境”为基础的。不合作是否能给各方带来好处?个体对自身利益的追求整体的利益损84基本模型“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(向警察坦白,从而背叛他的同伙),或者保持沉默(不向警察坦白,也就是与他的同伙合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以警方就给这两个囚犯来了一点儿刺激:基本模型“囚徒困境”说的是两个囚犯85

(1)如果他们保持沉默,也就是与对方合作,则他们会被无罪释放(R=3:对双方合作的奖励)。(2)如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金(T=5:对背叛的诱惑)。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏(S=0:给笨蛋的报酬)。(3)如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏(P=1:对双方背叛的惩罚)。T>R>P>S(1)如果他们保持沉默,也就是与对方合作86假设“囚犯困境”式的游戏可以进行多次乃至无限多次:如果两位自私者玩一次这个游戏如果两位自私者玩有限次这个游戏如果两位自私者玩无限次这个游戏结论背叛背叛????在非零和对策情况下,如何选择我们的策略呢?显然,Nash均衡点并没有给我们提供一个满意的结论。那么,在这样一个两难选择中到底能不能找到令人满意的答案呢?难道我们真的无路可走了吗?假设“囚犯困境”式的游戏可以进行多次乃至无限多次:如果两位自87对未来的考虑,是会影响现在的决策的如果对策者想将对策继续下去,就一定会考虑未来的收益,因而要考虑未来对现在的影响。一般说来,对策者可能会认为未来的收益并没有当前的收益那么重要。折扣系数

w用来反映未来对现在影响程度的一个常数对未来的考虑,是会影响现在的决策的如果对策者想将对策继续下去88在考虑未来利益的情况下,是否存在最优策略?命题1

如果折扣系数w足够大,则不存在独立于对方所采用的策略的最优策略。答案:一个令人伤心的命题!在考虑未来利益的情况下,是否存在最优策略?89一个特定策略的有效性不仅取决于它自己的特性,而且取决于它要相遇的其他策略的特性。

不存在单一的最优策略(独立于对方的最优策略)的论证留下了这样一个问题,在两个个体有足够大的概率打交道的情况下,会出现什么样的行为模式。

一个特定策略的有效性不仅取决于902.2第一次计算机模拟竞赛

(目的:为寻找“最佳”的对策策略)2.2第一次计算机模拟竞赛

(目的:为寻找“最佳”的对91

为寻找“最佳”的对策策略,美国密西根大学的RobertAxelord教授组织了一次别开生面的的计算机竞赛。竞赛方式:

每位参赛者提交一个体现在每一步选择合作或不合作规则的程序;每个程序要和所有其它程序比赛,还要和一个“随机”程序(随机地选择合作或背叛)比赛;每次比赛的局数为200次;记录下每个参赛程序的得分。为寻找“最佳”的对策策略,美国密西根大学的R92“一报还一报”的平均得分:504分前8名参赛者提供的游戏规则都是“善良的”,它们的平均得分是:472-504分后7名都是不善良的,它们的平均得分为:401分“善良的”规则:从不首先背叛1.善有善报

不首先背叛或至少在游戏快要结束之前不背叛,是区分这次计算机“囚犯困境”竞赛中成功的规则和不成功的规则的唯一特性。“一报还一报”的平均得分:504分前8名参赛者提供的游戏规则932.除了善良,还需要宽容宽容性对方背叛之后的合作倾向第一名“一报还一报”:一次惩罚后就让过去的过去了。第八名“弗雷德曼”:决不首先背叛,但一旦受到挑衅,就永远报复下去。(得理不让人,太缺少宽容性)2.除了善良,还需要宽容宽容性对方背叛之后的合作倾向第一名“943.“恶有恶报”一个狡诈的规则:“乔斯”基本想法:试图偶尔背叛而不受到惩罚。比如,它十次会有一次在对方合作之后背叛,而不是在对方合作后总是合作。“一报还一报”与“乔斯”的对局结果(236分-241分〕1-双方合作;2-“一报还一报”合作;3-“乔斯”合作;4-均不合作

这次竞赛的的很重要的教训是认识到在双方竞争的环境下,避免反射效应是很重要的。不善良的规则在比赛中表现不佳。“乔斯”的平均得分为304分,排在第12位。3.“恶有恶报”一个狡诈的规则:“乔斯”基本想法:试图偶尔背95进一步的分析表明许多人在游戏中没有受到挑衅就早早开始背叛,这个特点从长远来看是要付出大代价的。任何参赛者所显示出的宽容性比理想的要小得多。最与重不同的规则“DOWNING”,由于对其它人的初始假设太悲观而做了蠢事。为了更好地应付双方竞争的环境,有许多东西要学。即使是政治学、社会学、经济学、心理学和数学方面的策略专家,也会犯诸如太计较自己的利益、不够宽容、和对对方的反应太悲观等错误。进一步的分析表明许多人在游戏中没有受到挑衅就早早开始背叛,这962.3第二次计算机模拟竞赛

(目的:为了进一步验证“一报还一报”策略的成功)2.3第二次计算机模拟竞赛

(目的:为了进一步验证“一97

为了验证“一报还一报”策略的胜利不是偶然的,Robert教授组织了第二次计算机模拟竞赛。

第二轮竞赛的参赛者,都得到了一份关于第一轮竞赛的详细分析报告。他们不仅知道第一轮竞赛的结果,而且知道用于分析成功的思想和概念以及所发现的易犯的错误。因此,第二轮比赛比第一轮比赛有一个更高的起点。第二次比赛共有62个程序,它们的提供者来自:计算机科学、物理学、数学、心理学、经济学、政治学、社会学和进化生物学的教授,他们来自美国、加拿大、英国、挪威、瑞士和新西兰。参加第一轮比赛的对策论专家们也被邀请再试一次。在第二轮竞赛中,63个规则(包括随机程序)在循环赛中有3969个配对方式,共有上百万次的对局。为了验证“一报还一报”策略的胜利不是偶然的98谁是第二次胜利者?胜利者还是:“一报还一报”策略超过一半的参赛程序是善良的。显然大部分参赛者吸收了第一轮中首先背叛没有好处的教训。前15名中只有一个是不善良的。后15名中只有一个是善良的。规则是否善良与最后得分的相关性为:0.58“一报还一报”是第一轮中提交的最简单的程序,但它赢得了竞赛。它也是第二轮中最简单的程序,又赢得了第二轮竞赛。虽然所有的参赛者都知道“一报还一报”赢得第一轮竞赛,但没有人能设计出比它更好的程序。(多伦多大学阿纳托尔·拉帕波特教授又一次提交)谁是第二次胜利者?胜利者还是:“一报还一报”策略超过一半的参992.4合作的建立及进化2.4合作的建立及进化100一个成功的决策规则所具有的4个特征善良的:

只要对方合作你就合作,避免冲突。它的善良性防止陷入不必要的麻烦。可激怒的:面对他人无理的背叛要坚决反击,它的报复性使对方试着背叛一次后就不敢再背叛。宽容的:

在反击挑衅之后要显出宽容来,它的宽容性有助于重新恢复合作。清晰的:行为要简单明确,容易让对方识别和适应。它的清晰性使它容易被对方理解,从而引出长期的合作。“一报还一报”为什么能够取胜?一个成功的决策规则所具有的4个特征善良的:只要101

“一报还一报”能为大家所遵守吗?命题2(证明略)当且仅当折扣系数w足够大时,“一报还一报”是集体稳定的。且w是T、R、P、S的函数。

①如果w

大于等于2/3,“一报还一报”是集体稳定的。②如果w小于2/3,“背叛和合作交替”策略会占便宜;如果w小于1/2,“总是背叛”策略会占到便宜。只要未来对现在有足够大的影响,没有人能够通过采用其它策略而干得更好。“一报还一报”能为大家所遵守吗?102长期的相互关系对合作稳定性的重要性

一旦一个制造商开始走下坡路,即使是他最好的客户也开始以抱怨质量问题、不符合规格要求、到货迟缓或各种各样的原因而要求拒付货款。商业中的最有力的道德执法者是持续的关系,即人们相信你能与客户或供应商继续做生意。当一个失败的公司失去这个自动的执法者,任何手段都将无法代替。Mayer,1974在一个小镇或同一种族的邻里之间就容易实行互惠的规范。相反,一个访问教授就很可能受到其他教工的冷落,而他们对待固定同事并不这样。长期的相互关系对合作稳定性的重要性一旦一个制造商开始103命题3“总是背叛”策略总是集体稳定的。一个对合作的进化很有启发的命题难道就没有办法入侵这样一个“小人”的世界吗?请你设想一下:

在一个充满“小人”的世界里,如果来了一个“大度”的合作者,会怎样?如果来了两个这样的合作者,会怎样?如果来了一群这样的合作者又会怎样?命题3一个对合作的进化很有启发的命104命题4如果一个善良的策略不能被一个个体侵入,那么它也不能被这类个体的小群体侵入。相反的情况是否会发生?哦!原来,善良的策略能以“小人”策略所不能的方式来保护自己!这是十分令人吃惊而又很有趣的不对称。命题4相反的情况是否会发生?105结论合作可以通过一小群依赖于回报的个体在没有集权的自私的世界中出现。结论合作可以通过一小群依赖于回报的个体1062.5合作进化的例证2.5合作进化的例证107第一步:纽约邮报提价,从40美分提到50美分;每日新闻没有反应第二步:纽约邮报降价,从50美分降回到40美分,并宣布价格将进一步降到25美分;每日新闻仍然没有反应第三步:纽约邮报降价,从40美分降到25美分;每日新闻(终于明白了)将价格提高到50美分随后:纽约邮报将价格提高到50美分纽约邮报和每日新闻之间的价格策略合作的进化——例证一第一步:纽约邮报和每日新闻之间的价格策略合作的进化——例证一108发源自第一次世界大战的堑壕中的“自己活也让别人活”的系统有时合作可以在你认为最不可能出现的地方出现。一位巡视前方堑壕的英军参谋官惊奇地发现:对方德军士兵在来福枪射程以内走动着。我们的人却不予理睬,我暗自下决心,当我们接管这里时,一定要杜绝这类事情。这种事情是绝对不允许的,这些人显然不懂得这是战争。Dugdale,1932合作的进化——例证二一位巡视前方堑壕的英军参谋官惊奇地发现:对方109

任何时候,两个相互对峙的小分队均可以做出的选择都是:射击打死对方,或者谨慎地设计以避免造成损伤。对于参战双方,削弱敌人的力量可以增大自己生存的可能性。因此,从短期看,不管敌人是否回射,最好现在就对他们展开进攻。

堑壕战与其它大多数战斗不同的是:

相同的小单位部队长时间在固定的防区里相互对峙。这就将一次性囚徒困境改变为重复的囚徒困境。

任何时候,两个相互对峙的小分队均可以做出的选110这些对立的士兵为了保持双方合作的默契,实际上违抗了他们各自上司的命令。对于部队司令来说,重要的是培养部队的进攻锐气。特别是协约国实行了消耗战的战略,即双方人员的消耗相等就意味着协约国的胜利。因为德国的实力迟早要先消耗掉。因此,在国家这一级,第一次世界大战近似于零和博弈,即一方的损失也就是另一方的所得。但是在前线的局部地区,双方克制比双方惩罚要好。这些对立的士兵为了保持双方合作的默契,实际上111

善良的:只要对方合作你就合作,避免冲突。可激怒的:如果你不让敌人得到他的食物,他的补救方法很简单:他将也不让你得到你的食物。宽容的:在反击挑衅之后要显示出宽容来,它的宽容性有助于重新恢复合作。清晰的:它的清晰性使它容易被对方理解,从而引出长期的合作。结果与理论的预见相吻合:合作可以在原来毫无希望的情况下出现且保持稳定。特别是这个“自己活也让别人活”的系统说明了朋友关系不是合作产生的必要条件。在适当的条件下,基于回报的合作甚至可以在对抗双方中产生。善良的:只要对方合作你就合作,1123对参与者和管理者的建议3对参与者和管理者的建议1131.不要嫉妒2.不要首先背叛3.对合作与背叛都要给予回报4.不要耍小聪明3.1当你作为社会经济活动的参加者时,请切记:如何有效地选择

好人先成功1.不要嫉妒3.1当你作为社会经济活动114嫉妒无异于自我毁灭。“一报还一报”能获得成功,不在于靠打击对方,而在于通过启发对方合作,避免两败俱伤,达到双赢而得到高分的。“一报还一报”从来没有一次在游戏中比对方得更多的分,但它获得比其他策略更高的总分。在一个非零和的世界里,没有必要非比对方做得更好。1.不要嫉妒你的对手人们倾向于采用相对的标准,这个标准经常把对方的成功与自己的成功联系起来。这种标准导致了嫉妒。嫉妒无异于自我毁灭。1.不要嫉妒你的对手人们倾1152.不要首先背叛计算机竞赛的结果说明善良的策略赢得了比赛,不善良的策略占不到便宜。理论分析也证明善良的规则不会被入

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论