




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
地方保护与经济增长的囚徒困境一、本文概述本文旨在探讨地方保护与经济增长之间的囚徒困境。地方保护作为一种经济现象,在一定程度上能够促进地方经济的短期增长,但长期来看,过度的地方保护可能导致资源配置扭曲、市场分割和竞争力下降,从而对经济增长产生负面影响。本文通过分析地方保护的经济效应和机制,揭示地方保护与经济增长之间的囚徒困境,并提出相应的政策建议,以期为实现地方经济可持续增长提供参考。文章首先回顾了地方保护的相关理论和实证研究,分析了地方保护对经济增长的积极作用和潜在风险。接着,通过构建一个理论模型,深入探讨了地方保护与经济增长之间的囚徒困境,揭示了地方政府在面临经济增长和地方保护之间的权衡时,可能陷入的困境和矛盾。在此基础上,文章进一步分析了影响地方保护与经济增长关系的因素,包括地方政府的行政干预、市场分割程度、产业结构等。通过对这些因素进行深入剖析,文章揭示了地方保护与经济增长关系的复杂性和动态性。文章提出了缓解地方保护与经济增长囚徒困境的政策建议。建议地方政府在推动经济增长的加强区域合作和市场整合,优化产业结构,提高资源配置效率,以实现地方经济的可持续增长。政府还应加强监管和执法力度,防止地方保护主义的滥用和过度干预,为市场经济的健康发展创造良好环境。二、地方保护现象及其成因地方保护现象,指的是地方政府为了保护本地产业、企业和资源,采取一系列行政、法律或经济手段,限制外地商品和服务进入本地市场,或者阻碍本地资源和企业流向外地市场的行为。这种现象在全球范围内都有出现,特别是在经济发展水平较低、市场化程度不高的地区更为普遍。地方保护的具体手段包括但不限于:设立行政壁垒、提高市场准入门槛、实施歧视性政策、优先采购本地产品等。地方政府利益驱动。地方政府作为地方经济和社会发展的主要推动者,其利益诉求往往与本地企业和产业紧密相连。为了维护本地产业和企业的利益,地方政府可能采取保护主义政策,以阻止外地竞争者进入本地市场,从而确保本地经济的稳定增长和税收收入的持续增加。官员政绩考核机制。在一些国家和地区,地方官员的政绩往往与本地经济增长、就业增加和税收提升等指标挂钩。为了在短时间内取得显著政绩,一些官员可能倾向于采取地方保护主义政策,通过保护本地产业和企业来刺激经济增长和就业增加。资源配置不均和市场竞争失衡。在一些地区,由于资源分配不均和市场竞争失衡,本地企业和产业可能面临来自外地竞争者的巨大压力。为了维护本地企业和产业的生存和发展,地方政府可能采取保护主义政策,以缓解市场竞争压力和保障本地资源的稳定供应。消费者偏好和市场需求。在某些情况下,消费者可能对本地产品和服务有更高的偏好和认可度。这种偏好和认可度可能源于对本地文化和传统的认同、对本地产品质量的信任以及对本地服务质量的满意等因素。为了满足本地消费者的需求和偏好,地方政府可能采取保护主义政策,以促进本地产品和服务在市场上的竞争优势。地方保护现象是由多种因素共同作用的结果。虽然这些措施可能在短期内有助于保护本地企业和产业利益、促进经济增长和就业增加,但长期来看,过度的地方保护可能导致资源配置扭曲、市场竞争受限、技术进步受阻以及消费者福利损失等问题。因此,如何在维护本地利益与促进全国乃至全球市场竞争之间找到平衡点,是地方政府在制定经济政策时需要面临的重要课题。三、囚徒困境在地方保护与经济增长中的体现囚徒困境是一个经典的博弈论模型,揭示了在没有完全信息或无法建立信任的情况下,个体理性决策可能导致集体非理性的结果。在地方保护与经济增长的背景下,囚徒困境的体现尤为明显。在地方保护主义盛行的地区,地方政府为了维护本地企业的利益,往往会采取各种措施限制外地企业的进入,包括设置行政壁垒、提高市场准入门槛等。这种地方保护政策在短期内确实能为本地企业带来一定的市场份额和利润,但从长期来看,却可能阻碍经济的整体增长。这是因为,当各地都采取保护主义政策时,市场上的竞争就会受到限制,企业缺乏创新的动力,资源配置效率降低。同时,地方保护主义还可能导致市场分割,形成一个个相对封闭的经济体,阻碍了资源和要素的自由流动,降低了整体经济的运行效率。这种囚徒困境的体现在于,每个地方政府都希望通过保护本地企业来获得短期利益,但却忽略了这样做可能带来的长期负面影响。如果各地政府能够放弃保护主义,转而采取更加开放和合作的态度,促进资源和要素的自由流动,那么整个经济体系将更加高效和富有活力。然而,在实际操作中,由于地方政府之间存在着竞争关系,以及缺乏一个统一的市场规则和监管机制,使得囚徒困境的解决变得异常困难。因此,如何在维护地方利益的避免陷入囚徒困境,促进经济的长期增长,是当前面临的一个重要问题。四、破解囚徒困境的策略与建议地方保护与经济增长的囚徒困境是一个复杂而棘手的问题,需要我们从多个角度出发,寻找有效的策略与建议来破解这一困境。加强中央政府的宏观调控:中央政府应发挥其在经济发展中的关键作用,通过制定更加明确和统一的政策,减少地方保护主义的产生。同时,加强对地方政府的监督,确保各项政策得以有效执行。促进区域间的合作与协调:各地方政府应摒弃“零和博弈”的思维,转向“共赢”的合作模式。通过加强区域间的经济合作与协调发展,实现资源共享、优势互补,共同推动经济增长。优化市场环境与制度建设:完善市场准入制度,打破行政性垄断,为各类企业创造公平竞争的市场环境。同时,加强法治建设,保障企业和消费者的合法权益,提高市场运行的效率和公正性。推动产业转型升级:鼓励地方政府和企业加大科技创新投入,推动产业结构优化升级。通过发展高新技术产业、绿色经济和现代服务业等,提高经济的附加值和竞争力,降低对地方保护的依赖。建立健全的激励机制与约束机制:对地方政府和企业实施激励和约束机制,鼓励其积极参与市场竞争和区域合作,同时对其违规行为进行惩罚。通过正向激励和反向约束相结合的方式,引导各方走向合作共赢的道路。破解地方保护与经济增长的囚徒困境需要我们从多个层面出发,综合运用政策、市场、科技等多种手段。只有通过全面而深入的改革与创新,才能实现地方经济的持续健康发展与全国经济的整体繁荣。五、结论地方保护主义在短期内可能对经济增长产生一定的推动作用,但从长远来看,其导致的市场分割、资源配置扭曲和创新能力受限等问题,无疑会对经济增长造成严重的阻碍。本文通过分析地方保护与经济增长之间的囚徒困境,揭示了地方保护主义的内在矛盾和不可持续性。地方保护主义虽然能够为本地区的企业提供一定的市场保护,使其在短期内免受外来竞争的影响,但这种保护同时也限制了企业的创新能力和市场竞争力。随着全球化的加速和市场竞争的日益激烈,缺乏创新能力和市场竞争力的企业很难在长期的竞争中立足。地方保护主义导致了资源的错误配置和市场的分割。在地方保护主义的影响下,资源和要素无法根据市场需求自由流动,这不仅限制了资源的有效配置,也阻碍了市场的健康发展。长期来看,这种资源配置的扭曲和市场分割将严重阻碍经济增长。地方保护主义还可能导致政府角色的错位和公共资源的浪费。在地方保护主义的驱使下,政府可能会过度干预市场运行,扭曲市场信号,导致资源的错误配置和公共资源的浪费。这不仅会降低经济增长的效率,还可能引发一系列社会问题。因此,要实现经济的持续健康发展,必须打破地方保护主义的束缚,推动市场的统一和开放。这需要各级政府转变发展观念,从长远利益出发,加强区域合作和协调发展,共同推动经济的持续健康发展。也需要加强制度建设和监管力度,防止地方政府滥用权力干预市场运行,确保市场在资源配置中发挥决定性作用。只有这样,才能真正实现经济增长的良性循环和可持续发展。参考资料:地方官员的晋升竞争对经济增长有着重要的影响。在许多地方,官员的晋升竞争往往与经济增长紧密相关。官员的晋升竞争可以促进经济增长。在地方经济中,政府官员的晋升竞争可以激励他们更加努力地推动经济发展。这包括制定和实施各种政策,以吸引投资、鼓励创新和促进企业成长。这些政策措施可以促进经济增长,并带来更多的就业机会和财富。官员的晋升竞争需要公平和透明的机制。公平和透明的机制可以确保官员的晋升竞争是公正的,并且能够吸引最优秀的人才来参与。这有助于提高政府的效率和公共服务的质量,从而促进经济增长。官员的晋升竞争需要与经济增长相结合。官员的晋升应该是与经济增长的目标相一致的,而不是仅仅为了追求个人晋升而进行。因此,在制定和实施政策时,需要考虑到经济增长的目标,以确保政策的可持续性和长期效益。官员的晋升竞争对经济增长有着重要的影响。通过公平和透明的机制,官员的晋升竞争可以促进经济增长,并确保政府的服务质量和服务效率。因此,我们需要建立公平和透明的机制,以确保官员的晋升竞争与经济增长相结合,以实现经济的长期稳定和繁荣。合作进化是生物学、经济学、社会学等多个领域的重要概念。在囚徒困境背景下,合作进化更是对于理解个体行为和群体动态有着重要意义。本文将探讨囚徒困境中合作进化的机制,分析相关案例,并展望未来的研究前景。囚徒困境,这是一个著名的博弈论模型,描述了两个犯罪嫌疑人被警方逮捕后的情境。由于彼此之间的利益冲突,两个嫌疑人都有选择背叛对方或保持沉默的权利。然而,双方的决策将直接影响到他们的利益。在这个困境中,个体理性的选择往往是背叛,但这种策略往往会导致群体非理性的结果。在囚徒困境中,合作进化的机制主要包括以下三个方面:合作可以为双方带来更高的利益。如果两个嫌疑人选择合作,那么他们可以共同抵抗指控,从而获得较轻的判决。合作可以建立信任。在囚徒困境中,如果一方选择合作,那么另一方也倾向于选择合作,从而形成一种互惠互利的关系。合作可以形成协同效应。在某些情况下,合作可以使得双方能够更好地利用资源,从而共同抵抗外部威胁。为了更好地理解囚徒困境中的合作进化,我们以一个经典案例进行分析:英国足球超级联赛中的利物浦足球俱乐部和曼彻斯特联足球俱乐部之间的比赛。在这场比赛中,两支球队都面临着赢球和打平的抉择。如果双方都选择进攻,那么比赛结果很可能是一场对攻大战,双方都有可能失球。如果一方选择防守,那么另一方将有很大机会获胜。然而,如果双方都选择防守,那么比赛结果很可能是平局。在这种情况下,合作进化机制将促使双方选择合作,共同防守,从而获得较优的群体结果。当然,合作进化并非一帆风顺。影响合作进化的因素有很多,例如:个体理性与群体理性的冲突、信任的建立与维系、协同效应的实现条件等。在这些因素的作用下,囚徒困境中的合作进化往往面临着挑战和困难。从思考的角度出发,我们可以发现合作进化的优势在于:提高群体适应环境的能力、促进群体内成员的互惠互利、有利于长期利益的实现等。然而,合作进化也存在一定的局限:例如,合作可能受到外界威胁的破坏、合作方可能存在机会主义行为、合作过程中可能产生额外的成本等。未来,随着博弈论和其他学科的发展,囚徒困境中的合作进化研究将有望取得更多突破。例如,研究者可以进一步探索合作进化的动态过程、设计更好的合作策略、研究合作与竞争的相互作用等。实际应用领域也将从经济、生物等领域扩展到更广阔的范围,如政治、教育、社交等领域。囚徒困境中的合作进化是一个充满挑战和机遇的研究领域。通过深入探讨其机制、影响因素和应用前景,我们可以更好地理解合作在自然界和人类社会中的重要性,并为我们解决现实问题提供更多启示和指导。囚徒困境(prisoner'sdilemma)是指两个被捕的囚徒之间的一种特殊博弈,说明即使合作对双方都有利时,保持合作也是困难的。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会频繁出现类似情况。囚徒困境(Prisoner'sDilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确凿,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型。囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性-聪明的人类会因自己的聪明而作茧自缚,或者损害集体的利益。在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为平衡的结果出现。欺骗的动机这时可能被惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。反复的、接近无限的重复次数时,纳什均衡趋向于帕累托最优,从互相背叛趋向于互相忠诚。囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在对方的表现不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作为必须考量的因素。我们可以合理地设想,如果囚徒第一次被对方指控,第二次这个囚徒也会指控对方。相反,如果第一次别人保持沉默,建立了互信的关系,你也会保持沉默,导致帕累托最优。当然,两个囚徒都会有相似的想法,在第一局保持沉默,以期望建立互信关系,所以双方都会保持沉默。第二局时,双方亦应有相似的想法,继续保持沉默,以期继续在互信的情况下进行第三局,以致余下的八局。在第十局时,互信的关系明显是没有意义的,因为十局已经完结,囚徒没有必要为维持互信的关系而沉默(没有第十一局),所以第十局囚徒一定会背叛对方的,理由和只有一局囚徒困境一样。问题是,既然大家都知道在第十局,无论如何对方都会背叛自己的,你在第九局保持沉默也是没有意思的,要知道,保持沉默(友好关系)的原因是为了希望下一局别人保持沉默。所以第九局双方都一定会背叛对方的。下一个问题是,双方都有相同的想法,明知第九局对方会背叛自己,所以第八局保持沉默也是没有意思的,第七局亦然,如此类推,纳什均衡是十局都会互相背叛,建立互信关系是没有可能的。只有在囚徒困境的局数大家都不肯定的情况下,上述的推论才不会发生,才会出现互相保持沉默的现象。以上推论即为“蜈蚣博弈”,使用了倒推法。事实上,“囚徒困境”可以看成是一环的“蜈蚣博弈”。1950年,由就职于兰德公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益,这也就是经典经济学中的“理性人假设”。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:若对方背叛、指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中只有一种可能能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。而且纳什均衡是较常发生的。整理囚徒困境的基本博弈结构,可更清楚地分析囚徒困境。实验经济学常用这种博弈的一般形式分析各种论题。以下是实现一般形式的其中一例:有两个参与者和一个庄家。参与者每人有一式两张卡片,各印有“合作”和“背叛”。参与者各把一张卡片文字面朝下,放在庄家面前。文字面朝下排除了参与者知道对方选择的可能性。然后,庄家翻开两个参与者卡片,根据以下规则支付利益:一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。(解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及单独背叛的共得5分,显然合作获分比背叛高。合作在团体而言是支配性策略。)而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+S。就是说将使参与者脱离困境。以上理论是道格拉斯·霍夫施塔特(侯世达)创建的。上述例子可能显得不甚自然,但现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子,将结果划成同样的支付矩阵。社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都可以用囚徒困境分析,模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用,说明这种博弈的重要性。以下为各界例子:著名作家三盅在他的《杂文也疯狂》中有这样一个单篇——《泡沫中的“囚徒困境”》。记述了2008年房地产领域的囚徒困境。我们学习宏观经济学的时候必定会学习博弈论,学习博弈论就必定涉及“囚徒困境”模型,而我一直认为,在所有市场博弈模型中,“囚徒困境”是最为接近心理学的一个,也是最能揭示善恶的一个,更是最能体现集体智慧的一个,选择背叛还是合作,始终是它不变的主题。我们把眼光聚焦到当前的房地产市场中来吧,一个不小的“囚徒困境”已经展现于我们眼前,首先放弃帕累托最优解决方案的是万科,可想而知,在当前的市场环境下,它预期到的博弈的纳什均衡,显然是未来困境下的房地产商之间的普遍相互背叛,也就是说,万科在这场“囚徒困境”中,之所以选择首先动手,出卖所有除它之外的房地产商,是因为它预计在这种困境中,如果不尽早出卖所有同伴,自己将面临被出卖的结局,毕竟,这是一个非零和博弈游戏,出卖行为是可以换取非常大的利益的。在这里,我为何要刻薄地使用“出卖”二字?我们回顾一下房地产商们过去N年中所缔造出来的“攻守同盟”便可理解,我曾经因为“房地产行业是否存在暴利”及“房地产开发成本是否应该公开”的问题在第一财经频道与反方争得面红耳赤,我从来就认定房地产开发企业存在着的暴利现象(至于在当前市场环境中它是否有存在的合理性,可以阅读笔者的《解读08房地产市场》中的相关描述),而当时几乎所有的开发商都是众口一辞地否认暴利的存在,更有甚者,潘先生羞答答地把成本比喻为自家老婆的奶子,充分论证了成本不可示人是理所当然的,当然,其中也有万科的声音……如今的万科,则践踏了自己曾经参与的“同盟”,跳出来用实际行动来证明了暴利的存在,它不仅想证明自己存在暴利,也试图揭发所有同伴的暴利,所以,我说他的行为是“出卖”。通过出卖同伴,万科真的能够获得个体的最大利益吗?理论上说它能够获得,但在实践中,也许它最终是打错了算盘,因为在所有的实践中,“囚徒困境”式的博弈必须是在一个信息极不对称的封闭环境中产生结果,所有囚徒式的自身恐惧与“理性决策”都是被相互隔绝的,而且这种博弈是不可被重复的(Douglas.Hofstadter创建),而当前的市场环境已经被不止一次重演过了(海南、05全国、08深圳),这种重复博弈最终将令所有参与者脱离困境,“囚徒困境”至此被彻底打破。另外,最关键的一条是,在这场博弈中,政府也参与其中了,他直接参与的环节在于源头,即土地的供应(租借),这将加速打破“囚徒困境”,因为与所有参与博弈者有着本质不同的是,政府是整个游戏的设计者,是囚禁规则的设计者,也是盖牢房、拆牢房的人,你很难想象一个有着政府参与其中的“囚徒困境”可以被称之为真正意义上的“困境”,再回头看万科,在所有被他出卖的所谓同伴中,正有政府的身影……我这么说也许是不严谨的,毕竟这不是一个理想状态下的“囚徒困境”,囚徒之间并没有相互隔绝,信息最起码在业内并非极度不对称,万科是否背负着某种使命,到现今还不得而知。需求方同样面临“囚徒困境”,从邹涛的“不买房运动”到“万人大团购”中便可管窥一二。我认为,房地产商乃至房地产市场若想最终走出“囚徒困境”,只有两种可能,一是前文提到的那位最为尊贵的囚徒如何作为,囚禁自己还是大赦天下,二是所有囚徒在重复博弈的过程中明智地选择停止博弈、创建合作,在过去的几年里,他们曾经做到过,如今,也许又到了这样做的时候了,他们需要的仅仅是集体智慧,而那些已经被出卖者窃走的蛋糕,恐怕也只能暂时性地延续出卖者的生命,却最终导致其今后连做囚徒的资格也不会有了……只为两个字,“信任”!而在此之后,也许“囚徒困境”将演变成另一种新的模型,我姑且称之为“重复博弈结果下的囚徒报复”……在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成损坏等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定(重复博弈的结果是将发现共同合作利益最大)。两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自行车赛中有以下情况:选手们在到终点前的路程常以大队伍(英文:Peloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会赶上(共同背叛)。而通常的情况是,在最前面次数最多的选手(合作)通常会到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。威廉·庞德斯通(WilliamPoundstone)在他的著作中,以一新西兰的例子来说明囚徒困境。在新西兰,报亭既无管理员也不上锁,买报纸的人自行放下钱后拿走报纸。当然某些人可能取走报纸却不付钱(背叛),但由于大家认识到如果每个人都偷窃报纸(共同背叛)会造成以后不方便的有害结果,这种情形很少发生。这例子特别之处是新西兰人并没有被任何其他因素影响而能脱离囚徒困境。并没有任何人特别去注意报亭,人们守规则是为了避免共同背叛带来的恶果。这种避免囚徒困境的大家共同的推理或想法被称为“异想(magicalthinking)”。囚徒困境的结论是许多国家中认罪减刑(英文:pleabargain)被禁止的原因之一。囚徒困境带来的结论是:如果有二个嫌疑人,其中一人犯罪而另外一人是无辜的,犯罪者会为了减刑坦白一切甚至冤枉清白者(单独背叛)。最糟糕的情况是,如果他们二人都被判入狱,坦白的犯罪者刑期少,坚持无罪的冤枉者刑期反而更多。现实的博弈参与者不只一方,会有多方参与的囚徒困境。加勒特·詹姆斯·哈丁(GarrettJamesHardin)的公用品悲剧就是一例:“公用品悲剧是指凡是属于最多数人的公共财产常常是最少受人照顾的事物”,例如渔业,公海中的鱼是属于公共的,而在本身不滥捕其他人也滥捕的思想下,渔民会没有节制的大捞特捞,结果海洋生态破坏,渔民的生计也受影响(共同背叛的结果)。但是,多方囚徒困境的提法有待商榷,因为其总是可以被分解为一组组经典的二方囚徒困境。就是说只有二方的囚徒困境,没有多方的。所谓多方的囚徒困境只是由多个二方囚徒困境混杂在一起而形成的错觉。罗伯特·阿克塞尔罗德在其著作《合作的进化》中,探索了经典囚徒困境情景的一个扩展,并把它称作“重复的囚徒困境”(IPD)。在这个博弈中,参与者必须反复地选择他们彼此相关的策略,并且记住他们以前的对抗。阿克塞尔罗德邀请全世界的学术同行来设计计算机策略,并在一个重复囚徒困境竞赛中互相竞争。参赛的程序的差异广泛地存在于这些方面:算法的复杂性、最初的对抗、宽恕的能力等等。阿克塞尔罗德发现,当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后,从利己的角度来判断,最终“贪婪”策略趋向于减少,而比较“利他”策略更多地被采用。他用这个博弈来说明,通过自然选择,一种利他行为的机制可能从最初纯粹的自私机制进化而来。最佳确定性策略被认为是“以牙还牙”,这是阿纳托尔·拉波波特(AnatolRapoport)开发并运用到锦标赛中的方法。它是所有参赛程序中最简单的,只包含了四行BASIC语言,并且赢得了比赛。这个策略只不过是在重复博弈的开头合作,然后,采取你的对手前一回合的策略。更好些的策略是“宽恕地以牙还牙”。当你的对手背叛,在下一回合中你无论如何要以小概率(大约是1%~5%)时而合作一下。这是考虑到偶尔要从循环背叛的受骗中复原。当错误传达被引入博弈时,“宽恕地以牙还牙”是最佳的。这意味着有时你的动作被错误地传达给你的对手:你合作但是你的对手听说你背叛了。通过分析高分策略,阿克塞尔罗德指定了策略获得成功的几个必要条件。最重要的条件是策略必须“友善”,这就是说,不要在对手背叛之前先背叛。几乎所有的高分策略都是友善的。因此,完全自私的策略仅仅出于自私的原因,也永远不会首先打击其对手。但是,阿克斯洛德主张,成功的策略必须不是一个盲目乐观者。要始终报复。一个非报复策略的例子是始终合作。这是一个非常糟糕的选择,因为“下流”策略将残酷地剥削这样的傻瓜。成功策略的另一个品质是必须要宽恕。虽然它们不报复,但是如果对手不继续背叛,它们会一再退却到合作。这停止了报复和反报复的长期进行,最大化了得分点数。最后一个品质是不嫉妒,就是说不去争取得到高于对手的分数(“友善”的策略必然不嫉妒,也就是说“友善”的策略永远无法得到高于对手的分数)。因此,阿克塞尔罗德得到一种给人以乌托邦印象的结论,认为自私的个人为了其自私的利益会趋向友善、宽恕和不嫉妒。阿克塞尔罗德关于重复囚徒困境的研究的重要结论之一,是友善的家伙能先完成交易。重新考虑经典的囚徒困境一节中给定的军备竞赛模型:结论是,只是理性策略增进了军事力量,似乎两个国家都宁可花费其GDP在枪炮而不是黄油上。有趣的是,企图说明对抗国家实际上以这种方式(在“重复囚徒困境假定”下的不同时期,军费支出在“高”和“低”之间反复)竞赛的尝试,却经常表明假定的军备竞赛并没有如预想的那样出现。例如希腊人和土耳其人的军费支出,看来并不像遵循“以牙还牙”的重复囚徒困境式的军备竞赛,却更可能是被其国内的政策所驱使。这可能是一次性博弈和重复性博弈中的理性行为不同的例子。对一次性囚徒困境博弈来说,最佳(点数最大化的)策略是简单地背叛;正如前面解释的,无论对手的行动可能是什么,这都是真实的。但是,在重复的囚徒困境博弈中,最佳策略依赖于可能的对手的策略,和他们怎样对背叛和合作作出反应。例如,考虑这样一个人群,那里每个人每次都背叛,除了一个人是遵循以牙还牙策略。这个人处于一种轻微的不利地位,因为第一回合的损失。在这样的人群中,对这个人来说最佳策略就是每次都背叛。在一个有一定的百分比的总背叛者而剩下的则是以牙还牙者的人群中,对个人来说的最佳策略依赖于这个百分比和博弈的长度。贝叶斯纳什均衡:如果对抗策略的统计分布能被确定(例如,50%以牙还牙,50%一直合作),就能从数学上获得最佳的相对策略。已经有了人群的蒙特卡罗模拟,在这里低分个人消失了,高分个人一再被生产出来(一种获得最佳策略的天才算法)。决赛人群中的算法合成通常依赖于初赛人群中的算法合成。尽管以牙还牙始终被认为是最可靠的基本策略,但是在重复囚徒困境的20周年纪念赛中,来英国南安普敦大学的一个小组,由尼古拉斯·詹宁斯(NicholasJennings)领导,包括了拉蒂普·达什(RajdeepDash)、萨瓦帕里·拉姆琼(SarvapaliRamchurn)、亚历克斯·罗杰斯(AlexRogers)斯和皮鲁克里士南·维特林根(PerukrishnenVytelingum))介绍了一个新的策略,这个策略证明了它比以牙还牙更成功。这个策略依赖于程序之间的合作,为单一程序中获得了最高的点数。南安普敦大学提交了60个程序参与竞赛,这些程序的开头被设计成通过一组5到10个的动作去彼此识别。一旦这些识别被作出,一个程序将总是合作,其他程序则总是背叛,保证背叛者得到最大的点数。如果程序识别出它在操作一个非南安普敦参与者,这程序将持续地背叛,企图去最小化竞争程序的得分。结果,这个策略以获得前3位结束了竞赛,也得到了大量接近底部的位置。虽然这个策略显著地证明了比以牙还牙有效,但是这是因为利用了下述事实:在这个特殊的竞赛中,多重通道是被允许的。在一方只能控制单一参与者的竞赛中,以牙还牙确实是更好的策略。如果重复囚徒困境将被精确地重复N次,已知N是一个常数,那么会产生另一个有趣的事实。纳什均衡就是每次都背叛。这很容易用归纳法证明。你也可以在最后的回合背叛,既然你的对手将没有机会惩罚你。因此,你们都将在最后的回合背叛。这时,你可以在倒数第二回合中背叛,既然最后一回无论你做什么,你的对手都将背叛。依此类推。为了合作以保持请求,这时未来必须对两个参与者来说是不确定的。一个解决方案是让博弈总次数N变成随机的。对未来的预期必须是无法确定的长度。另一个单独的案例是“永不停止”的囚徒困境。这个博弈被重复很多次,而且你的分数是一个平均数(当然是用计算机计算的)。囚徒困境博弈是某些人类合作和信任理论的基础。假定囚徒困境能够模拟需要信任的两人之间的交流,群体的合作行为可以用有多个参与者的、重复博弈的变体来模拟。这从而引起了许许多多学者经久不衰的兴趣。1975年,格罗夫曼(Grofman)和普尔(Pool)估计,致力于这方面研究的学术文章,数量超过2000篇。当博弈参与者能学会估计其他参与者背叛的可能性,他们自身的行为就为他们关于其他人的经验所影响。简单的统计显示,总体上,缺乏经验的参与者与其他参与者的互动,或者是典型的好,或者是典型的坏。如果他们在这些经验的基础上行动,(通过更多的背叛或合作,否则)他们可能在未来的交易中受损。随着经验逐渐丰富,他们获得了对背叛可能性的更真实的印象,变得更成功地参与博弈。不成熟的参与者经历的早期交易对他们未来参与的影响,可能比这些交易对成熟的参与者的影响要大得多。这个原理部分地解释了,为什么年轻人的成长经验这么具有影响力,以及为什么他们特别容易被欺负,有时他们本身最后也成为欺凌弱小者。群体中背叛的可能性,可以被合作的经验所削弱,因为先前的博弈建立了信任。因此自我牺牲行为可以,例如,加强团体的道德品质。如果团体很小,积极行为更可能以互相肯定的方式——鼓励这个团体中的个人继续合作——得到反馈。这与相似的困境有关:鼓励那些你将援助的人,从可能使他们处于危险的境地的行为中得到满足。这类方法主要在互惠利他主义、群选择、血缘选择和道德哲学的研究中涉及。霍夫施塔特曾提出,像囚徒困境一类的问题,若以简单博弈的形式来说明,人们会较容易理解。例如他以“封闭袋子交易”的简单博弈来说明此论题:两人面对面互相交换封闭的袋子,共同了解其中一方放钱,另一方放商品。双方可以诚实的依照承诺,把东西放到袋子里交换;又或者交空袋子给对方,选择背叛。在这场博弈中,由于背叛可获得巨大利益,必然有多人选择背叛。这意味着理性的商人不会进行这种交易,因而“封闭袋子交易”将由于逆向选择而失去市场。“是敌是友?”是一个竞赛表演节目,从2002年到2005年在美国竞赛表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年初级会计师学习指南试题及答案
- 2025年育婴师考试复习重点试题及答案
- 临床执业医师考试实战技巧分享试题及答案
- 2025年公共营养师考试学习方式的转变趋势试题及答案
- 中小学教师资格笔试知识刷新机制试题及答案
- 保险培训分享步骤
- 企业人力资源管理师考试长期规划能力试题及答案
- 2024年药师考试重要知识试题及答案
- 2025-2030中国台面行业市场发展趋势与前景展望战略研究报告
- 2025-2030中国可调节哑铃行业市场发展分析及前景趋势与投资研究报告
- 国家粮食和物资储备局直属联系单位招聘笔试真题2024
- 2024年新食品安全法相关试题及答案
- 2025年河北省保定市徐水区中考一模语文试题(原卷版+解析版)
- 贸易术语及应用及试题及答案
- 淘宝网店转让合同范本
- 新疆维吾尔自治区普通高职(专科)单招政策解读与报名课件
- 劳务派遣标书项目实施方案
- 我译网面试题及答案
- 合伙经营机械合同范本
- 2024北京东城区初一(下)期末英语试题和答案
- 中国急性缺血性卒中诊治指南(2023)解读
评论
0/150
提交评论