从重复博弈看外汇交易的低危性_第1页
从重复博弈看外汇交易的低危性_第2页
从重复博弈看外汇交易的低危性_第3页
从重复博弈看外汇交易的低危性_第4页
从重复博弈看外汇交易的低危性_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

从重复博弈看外汇交易的低危性

一、两个被救赎人的困境传统的非合作游戏是基于对理性的理性人的基础。理性人是指有一个很好定义的效用,在面临给定约束下最大化自己的效用的决策主体。理性人博弈行为的结果可能会导致个人利益与集体利益的冲突,反而使其自身所获的效用水平下降。1950年美国学者图克提出了一个经典的博弈模型——囚徒困境博弈,从逻辑上论证了这一点。以下是囚徒困境博弈的具体内容。例1两个嫌疑犯A、B合伙作案后被警察抓住,但缺乏足够的证据指证他们所犯的罪行。分别把他们关在不同的屋子里审讯以防止他们串供。警察分别告诉他们:如果两个人都坦白认罪,各判八年;如果两个人都抵赖,各判一年(或许因证据不足);如果其中一人坦白另一人抵赖,坦白的放出去,不坦白的判刑十年(“坦白从宽,抗拒从严”)。相应支付见表1。在两个罪犯都是理性人的前提假设下,易知坦白是每个囚徒的占优战略,例1的唯一纳什均衡是:(坦白、坦白),其结果是(-8,-8)。由于囚徒双方都独立地追求个人利益最大化,最终却未能达到Pareto最优的集体利益最大化结果(-1,-1)。显然如果两个囚徒都抵赖,下场会好于都坦白,即好于纳什均衡的情况。两个囚徒陷入了“求之不得”却又“身不由己”的困境。现实经济生活中,许多问题可以归结为“囚徒困境”的问题。如两个企业的价格竞争、产量竞争,公共牧场放牧、公共物品提供、公海捕鱼,国与国之间的贸易战、军备竞赛等。“囚徒困境”启示我们,只顾及单方面利益的做法往往不但无法达到理想的目标,而且可能会使个体利益水平在原有的基础上下降,社会总利益也会受损。显然,“囚徒困境”模型中作为理性人的博弈双方若想走出困境,仅凭“合作承诺”是靠不住的,因为给定一方遵守该承诺的条件下,另一方不遵守该承诺可以增加自己的支付,从而失去合作的积极性。当社会经济生活中,遇到类似囚徒困境问题时,理性的制约和市场的调节本身已无法解决问题,因而有必要探讨“囚徒”走出困境的途径。二、双阶段博弈的结果定义1设一个博弈过程中,有两个参与人A、B,若A选择一个战略,该战略减少B的支付却不减少A自身的支付,称该战略对B来讲是可置信的威胁;否则称为不可置信的威胁。定义2一个博弈树中,在某路径上参与人A对参与人B实施可置信的威胁时,因为该威胁而引起B的支付减少额称为对B的威胁力度。例2对于例1中的两个囚徒A、B,若A知道B曾经还作一案,若A告发,B可加判两年,告发与否对A无影响。B不会自己坦白(可能是因为重犯判得更重)。警察不知道B还有一案。以上是共同知识。案发前A曾告知B:如果被抓,当自己抵赖时(注意:A并未表示自己一定会抵赖,或许他想依被抓的情况而动),若B坦白,自己成为不合作的受害者时,将告发B的前科,以示报复;当自己坦白时,无论B选择什么,都不会告发B的前科(A不会做损人不利己的事)。那么,附加了A的这个威胁后,博弈结果如何呢?为了研究方便,我们把本博弈写成博弈树形式(见图1)。我们用逆向归纳法解上述的两阶段博弈问题:在第二阶段乍看起来A选择“说出”与“不说出”是一样的,但A会考虑到“说出”对B的影响,因为A选择“说出”,第一阶段B就会选择“抵赖”,从而增加自己的收益;B知道A会基于上述的考虑而在第二阶段选择“说出”,因而当A在第一阶段选择“抵赖”时,B也会选择“抵赖”;同理,在博弈的另一个分支上,A坦白时B会坦白;考虑到以上情况,A在第一阶段会选择“抵赖”,因为“抵赖”能获得-1的支付,而“坦白”获得-8的支付,前者所得大于后者。因此该两阶段博弈的唯一子博弈精练纳什均衡是:A抵赖,如果B坦白就说出B的前科;B抵赖。相应的均衡结果是(-1,-1)。例2说明这样一个事实:在“囚徒的困境”博弈中,只要一方能在事后对另一方的不合作实施一个具有充分威胁力度的可置信威胁,而不需要另一方也能够实施这样的威胁,博弈双方即可走出困境,取得双赢,并且这个威胁在实际中根本不会实施(即不在均衡路径上)。例2可以解释为什么军事实力相当的两国之间容易陷入军备竞赛,而军事实力本就悬殊的两国之间一般会相安无事,因为弱国如果提升军备,当强国考虑到提升军备付出的代价更大时,可能就会以武力相威胁。如今发生在朝鲜半岛的核危机就与该情况类似。三、自平衡时有小环节的可诉性博弈有时候,由于来自外部环境的威胁,进行“囚徒困境”博弈的两个囚徒之间的合作(抵赖、抵赖)可能作为一种受迫性反应而出现。例3还是例1中的两个囚徒A、B,不同的是这里假设A、B被抓前一起得罪过一个流氓C,A、B都知道若他们同在一起生活,C不敢报复(可能是A、B在一起,实力较强,C斗不过),但若A、B有一个在监狱中,另一个在社会上一定会遭到C的报复而得-2单位的支付。C报复A、B之一可得支付4单位,不实施报复可得支付零单位。这是一个两阶段博弈,相应的博弈树见图2。与例2一样,本例用逆向归纳法可很容易地解出此两阶段动态博弈的唯一子博弈精练纳什均衡是:A抵赖,B抵赖;C当A、B不合作时报复其中坦白者。均衡结果是(-1,-1,0),均衡时该博弈实际上不会进入第二阶段,也即囚徒A、B不会给C以报复的机会,这或许可以解释如下事实:村民们修公共防水堤,人们的劳动力供给成了公共物品,当未涨水时,人们懒散、窝工现象严重,陷入囚徒的困境,公共防水堤的质量不高;当涨水且岌岌可危时,人们更加齐心合力,走出了囚徒的困境,公共防水堤的质量明显提高。以上探讨说明:来自外部的竞争压力会凸显集体的重要,合作可以作为一个受迫性反应出现。四、意识不强与合作的贝叶斯均衡已经证明,在每个囚徒贴现值充分大时,以下两种情况可能使例1中的两个囚徒走出困境。其一是博弈重复无限次;其二是引入非对称信息,博弈重复的次数充分大。这两种情况中,前者合作(即(抵赖,抵赖))有可能出现在一个子博弈精练均衡中,后者合作有可能出现在一个精练贝叶斯均衡中。注意这里多次强调了“可能”,是因为博弈均衡的多重性问题。无论以上哪种情况,“每个囚徒各阶段永远坦白”都是相应的精练均衡之一。因此,在不改变博弈结构(即附加其它的约束)条件下,重复的囚徒博弈并不总是能够走出困境,博弈的均衡结果具有不确定性。实践中,为了保持均衡朝着合作的方向发展,即便是属于重复的“囚徒博弈”,为了避免陷入困境,制度的安排也是必要的。制度必须具有可置信的足够的威慑力,才可调节“囚徒们”选择合作,有时专制的效率比民主的效率要高。五、模型1:个人单次博弈上文已经指出,靠“囚徒们”的自律,并不总是能够走出困境。一个鲜活的例子是中国彩电企业首次“价格联盟”的失败。当不合作有很高的“利润”诱惑时,没有哪家企业愿意合作。人们已经充分认识到,彩电企业首次“价格联盟”的失败是因为缺乏奖罚规则与措施,各方没有签订一个具有法律约束力的合同。为了防止过度竞争,国家应采取必要的行政干预措施,比如对某产品采取最低限价,并以法规的形式确立下来,惩罚那些为了私利而单方面降价的不合作企业。惩罚必须有足够的威胁力度,比如为防止过度的价格竞争时,对单方面降价的不合作企业的罚款应不低于该企业由降价所带来的利润与合作时所带来利润的差额,否则,政府的干预就会“失灵”。例4某行业仅有A、B两个公司,政府为保护该行业的健康发展,避免A、B陷入过度的价格竞争困境,决定对相应产品施行限价,以罚款来惩罚未经批准单方面降价的企业(若双方同时降价,视为适度的市场竞争,政府不干预)。博弈分两阶段进行,第一阶段A、B选择降价与否,第二阶段政府选择罚款与否。政府监督需成本2单位。政府对单方面降价的企业罚款数额为3单位。若两企业同时降价,各得利润4单位;两企业都不降价,各得利润8单位;两企业一个降价一个不降价,不降价的企业得利润1单位,降价的企业得利润10单位。以上所述均是共同知识(即本博弈为完美信息博弈),具体见图3。用逆向归纳法可很容易地解出此两阶段动态博弈的唯一子博弈精练纳什均衡是:A不降价;B不降价;政府当A、B不合作时对其中单方面降价者实施罚款。均衡结果是(8,8,-2)。与例2、例3一样,均衡时该博弈实际上不会进入第二阶段。政府干预的成本2远远小于不干预时A、B均降价所带来的利润总损失8(=[(8+8)-(4+4)])。政府的干预使企业走出了困境,避免了恶性降价竞争。六、囚徒困境博弈的原模型通过以上讨论可知,例2、例3、例4共同点是都存在一个对不合作行为进行惩罚的“第二阶段”,它起到一个约束作用,均衡时实际上不会进入该阶段。例2有一个区别于例3、例4的不同点:例3、例4中各参与人能够走出困境是外部压力造成的,是一种受迫性反应,他们只需要具有个人理性就可走出困境;例2中的囚徒们能走出困境是因为A更具有主观能动性,他能够认知囚徒困境所产生的不利结果,而在博弈中附加了一些人工“游戏规则”,这一点仅凭个人理性是无法做到的。为了探讨走出囚徒困境的机理,我们引入如下定义。定义3在一个博弈过程中,某个(或几个)参与人为了达到某种目标而自觉引入的附加的博弈规则,称为人工博弈规则。在博奕论中,把参与人、行动、结果统称为博弈规则。为了加以区别,我们把囚徒困境博弈原模型(例1)所确定的博弈规则称为自然博弈规则。由定义3,例2中的第二阶段就是人工博弈规则。例2中的A预知按自然博弈规则会陷入困境,对双方都不利,因而附加了一个可置信威胁,引入了人工博弈规则,双方走出了困境,达到了帕累托最优。定义4在囚徒困境博弈中,当参与人在给定的博弈规则下总是最大化自己的效用时,称该参与人具有个人理性;具有个人理性的参与人称为理性人。定义5在囚徒困境博弈中,若参与人能够认知囚徒困境所产生的不利结果,并力图制定人工博弈规则而走出困境,在满足帕累托性的条件下最大化自己的效用,称该参与人具有集体理性。具有集体理性的参与人称为集体理性者。定义6若一个理性人仅具有个人理性而不具有集体理性,称他为个人理性者。理性人、集体理性、个人理性三者之间的关系见图4。原模型(例1)中参与人的最大化自己效用的决策行为实际上是个人理性者的表现。个人理性者是狭隘的理性人,面对囚徒博弈时,无法走出困境。集体理性者是科学的理性人,比个人理性者主观能动性更强,目光更长远,为了达到最大化的目的,能够主动引入(制定)人工博弈规则,甚至不惜与自己的竞争对手合作。集体理性者虽然与个人理性者的出发点完全一样,都是为了最大化自己的效用,但集体理性者能够认识到纯粹的个人理性有时(比如例1)无法达到最大化自己效用的目的,而只有引入人工博弈规则,比如建立联盟,从竞争走向合作,有集体认同感才能达到目标。通过以上讨论,集体理性者首先是具有个人理性的,是通过个人理性来实现的。例2中正是因为A要最大化自己的效用而利用已知的信息制定了人工博弈规则(A知道不这样做就会陷入困境),在个人理性的作用下同时达到了帕累托最优及个人效用最大化,最终走

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论