经济学-博弈论课件_第1页
经济学-博弈论课件_第2页
经济学-博弈论课件_第3页
经济学-博弈论课件_第4页
经济学-博弈论课件_第5页
已阅读5页,还剩299页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论:第一章导言第一节社会与人、效率1、社会的两个基本问题协调(coordination)合作(cooperation)协调问题:以交通为例靠左行靠右行靠左行靠右行AB1,11,1-1,-1-1,-1协调问题的核心是预测(prediction):预测其他人如何行为合作问题合作不合作合作不合作AB3,30,0-1,44,-1合作问题的核心是激励(incentive)个人行为与社会利益的冲突什么是个人的最优选择?什么是社会的最优选择?如何把个人行为与社会利益统一起来?协调与合作相互作用如交通问题;如密云元宵节惨剧;如SARS问题,禽流感问题;如恐怖主义问题;如经理与工人;如股东与经理;如政府与居民;(毒奶粉、茶油、小龙虾等)等等。社会问题及其解决办法社会分工:社会制度:个人的行为规则正式制度;明规则,法律非正式制度;潜规则,社会规范,文化价格制度;非价格制度。2、理解人的行为所有社会科学都是有关人的行为的科学,但不同学科的方法、假设、着眼点不同;经济学:从个人到社会(frommicrotomacro)社会学:从社会到个人(frommacrotomicro)心理学:用观察、实验的方法看人们实际上是怎么行为的。(行为科学)关于理性人假设理性人的定义:有一个很好定义的偏好(well-definedpreference);在给定约束下追求偏好的最大化(maximization)偏好是如何形成的?关于偏好的假设:完备性(completeness):任何两个可选择的方案之间都是可比较的;传递性(transitivity):(偏好具有一致性)偏好函数如果偏好满足其他一些假设(特别是连续性假设),可以定义一个偏好函数或称效用函数(utilityfunction);无差异曲线XYAB约束条件技术性约束:如一天工作不能超过24小时;制度性约束:如晚上12点必须熄灯;信息约束:如你并知道这门课有什么价值;对他人行为的预期对理性人假设的批评有限理性(boundedrationality):intendedtoberational,butonlylimitedtobeso.Cognitiveability(limitedcomputationalskillandseriousflawedmemories)有限毅力(boundedwillpower);Present-biasedpreference有限自利(boundedself-interest)emotionalbehavoir3、效率标准问题:社会是由人组成的,每个人的行为都会影响到他人的利益。那么,我们用什么样的标准判断个人的行为是否正当?考虑两种情形:情形A:某店主雇人将竞争对手的店门堵上,使后者不能营业;情形B:某店主以更低的价格和更优良的服务将竞争对手打垮。这两种情形有什么不同?为什么法律允许第二种情形而不允许第一种情形?(1)帕累托效率定义:一种状态(资源配置、社会制度等)被称为帕累托最优状态,如果不存在另一种状态能使得没有任何人的处境变坏同时至少有一个人的处境变得更好。简单的说法是:对每个人来说,除非“损人”就不可能“利己”,社会就达到了帕累托最优状态。不同帕累托状态之间不可以比较所以,帕累托最优可能意味着收入分配的不公平;极端地,一个人得到所有收入,另一个人一无所有,也是一个帕累托最优以两人社会为例A的收入B的收入XYZ。。。X和Y都是帕累托最优状态,但Z不是帕累托最优状态帕累托改进与帕累托标准定义:一种变革没有使任何人的处境变坏,至少有一个人的处境变好。如果一种状态不是帕累托最优,意味着存在帕累托改进的可能。如果社会已经处在帕累托最优状态,就不可能有帕累托改进的余地。状态X帕累托优于状态Y,如果在状态X下,至少有一个人的处境比状态Y下更好,而没有任何人的处境比在状态Y下坏。两人社会为例A的收入B的收入。Z。F。X。G。H从Z到F、X是帕累托改进;从Z到H、G不是帕累托改进;从H、G到X、F、Z都不是帕累托改进(2)卡尔多-希克斯(Kaldor-Hicks)标准设想:状态X下,A的收入是100,B的收入也是100;在状态Y下,A的收入是1000,B的收入是99。依帕累托标准,这两个状态是不可比较的:A在状态Y下更好,B在状态X下更好。卡尔多-希克斯标准:如果一种变革使得受益者的所得足以弥补受损者的所失,这种变革就是一个卡尔多-希克斯改进。如果补偿实际发生,就是帕累托改进。因此,“卡尔多-希克斯标准”就是“财富最大化”。举几个应用一:交易效率人们为什么交易:偏好不同;生产成本不同;信息不同;风险态度不同。自愿的交易一定是一个帕累托改进(假定没有欺诈)设想:A拥有10个苹果,0个桃;B拥有10个桃,0个苹果。如果边际效用是递减的,A用5个苹果换B的5个桃,对双方是一个帕累托改进;交易的结果:各有5个苹果和5个桃。市场:供给与需求数量价格需求曲线(消费者的评价)供给曲线(生产者的成本)均衡价格均衡产量为什么垄断是没有效率的数量价格需求曲线(消费者的评价)供给曲线(生产者的成本)均衡价格均衡价格垄断价格垄断产量举几个应用二:竞争规则设想有一个商店。如果一个人使用暴力捣毁这个商店,然后在旁边办起自己的商店销售同样的东西,这种行为就构成犯罪。但如果这个人用较低的价格和更好的服务挤这个商店,他就无须为此承担责任。从该商店的所有者来看,结果是一样,但为什么法律的规则不一样呢?原因在于后一种情况下,社会的所得(包括消费者和新店的所有者)大于所失,是一个卡尔多-希克斯改进,而在前一种情况下,不如此。一般地,什么是所谓的社会允许甚至鼓励的“正当竞争”?答案是“卡尔多-希克斯标准”。举几个应用三:生产效率生产可行性边界小麦玉米。X非效率点举几个应用四:分工效率如果两个人同时生产两样产品(面包和牛奶),每人的产量为(50,50),总产量是(100,100);如果A专业化于生产面包,产量可以达到150;B专业化于生产牛奶,产量可以达到140;那么,分工与不分工比较,就是一个帕累托改进,因为总产量可以达到(150,140)。绝对优势与比较优势。经济增长很大程度上来自分工效率。举几个应用五:合作与组织如果两个人在一起工作创造的价值大于独立工作创造的价值之和,合作就是一个帕累托改进;当只当组织的价值必须大于个人独立的价值之和时,组织是可能一个帕累托改进;当个人才组织中获得的价值大于独立获得的价值时,加入组织是一个帕累托改进;1+1》2企业战略联盟:只有当联盟是一个帕累托改进时,联盟才会出现。举几个应用六:企业重组以郑百文为例:到2000年6月30日止,郑百文的债务总额达23.46亿,其中对信达资产管理公司负债20.99亿;在郑百文的资产中,固定资产2.5亿,流动资产61686万(其中大部分是高风险的应收帐款);郑百文的每股净资产为-6.81元,股东权益为-13.458亿。郑百文应该破产清算,还是进行资产重组?清算意味着着除债权人外,其他参与人的价值均为零;因此,只要债务人从重组得到的价值不低于预期可收回的债权,重组对所有参与人是一个帕累托改进。解雇员工能成为一个帕累托改进吗?举几个应用七:社会改革如果改革中没有人受损,至少有一些人受益,改革就是一个帕累托改进;如果改革使一部分人受益,另一部分人受损,但受益者所得大于受损者所失,改革是一个卡儿多-希克斯改进,或者说,潜在的帕累托改进;如果受损者得到足够的补偿,就是一个帕累托改进;革命通常不是一个帕累托改进。举几个应用八:婚姻家庭自由结婚对夫妻双方是一个帕累托改进;买卖婚姻对买卖双方是一个帕累托改进;离婚不一定是一个帕累托改进;但如果提出离婚的一方愿意补偿另一方,使得对方同意离婚,离婚就是一个帕累托改进;所以,协议离婚是一个帕累托改进。但离婚对其他利益相关者(如父母和儿女)可能不是一个帕累托改进。以什么为比较的基础:第三者问题4、外部性与科斯定理个人收益与社会收益:一项活动的社会收益等于决策者个人得到的收益加社会其他成员得到的收益,如养花;个人成本与社会成本:社会成本等于决策者的个人承担的成本加社会其他成员承担的成本,如环境污染,交通堵塞;如果个人收益(/成本)不等于社会收益,我们说存在外部性。个人最优决策与社会最优理性人的最优决策:边际个人成本等于边际个人收益;当然,目标函数很重要;社会最优决策(帕累托最优):边际社会成本等于边际社会收益;因此,除非没有外部性,个人最优决策不等于社会最优决策。图示说明:社会成本大于个人成本产量边际成本与边际收益边际个人收益(等于边际社会收益)边际个人成本边际社会成本个人最优产量社会最优产量边际外部成本图示说明:社会收益大于个人收益产量边际成本与边际收益边际个人收益边际个人成本(等于边际社会成本)个人最优产量社会最优产量边际社会收益举例环境污染;夜间施工;交通事故;垄断定价;国有企业的恶性竞争;教育;政府管制、征税与科斯定理个人最优与社会最优的不一致意味着有帕累托改进的余地;核心是:如何将外部性内部化:如果有办法使得个人在边际上承担全部的社会成本和获得全部的社会收益,问题就解决了;传统的理论:政府管制或对个人征税(或补贴);在负外部性的情况,征税和补贴代表不同的产权安排。征税或补贴如何解决问题?产量边际成本与边际收益边际个人收益(等于边际社会收益)边际个人成本(无税情况)边际社会成本(加税后的边际个人成本)个人最优产量社会最优产量边际税率=边际外部成本科斯定理Coase(1960):只要产权界定是清楚的,如果没有交易成本,外部性可以通过当事人之间谈判解决,帕累托效率可以实现;并且,最终的资源配置与初始的产权安排无关。比如说:夜间唱歌科斯定理图示牧养人放牧的数量牧羊的边际利润农场主的边际净损失社会最优量PSO说明如果产权归农场主,农场主可以禁止放牧(点0),小于社会最优量S;但此时,增加放牧给牧羊人带来的边际利润大于给农场主造成的损失,牧羊人将有积极性贿赂农场主,直到放牧量达到S为止;如果产权归牧羊人,牧羊人的利润最大点是P,大于社会最优量S;但此时,减少放牧量对牧羊人的边际利润损失小于给农场主节约的边际成本,所以,农场主将有积极性贿赂牧羊人,直到S;因此,无论初始产权如何安排,双方谈判可以实现帕累托最优。科斯定理意味着:如果没有交易成本,公司治理结构(包括股权结构)是无关紧要的交易成本与次优选择定义:交易成本包括所有与交易有关的成本,包括发现交易对象的成本、谈判成本、签约成本、执行成本,以及所有可能的效率损失(与帕累托最优比较);交易成本存在的原因:交易者的数量(人越多,达成本协议越难)信息不对称(信息越不对称,谈判越难,合同的执行也越难)交易成本意味着:只有次优,没有最优;作为激励机制的法律法律通过责任的分配和赔偿/惩罚规则是实施,将个人行为的外部成本内部化,诱导个人选择社会最优的行动;如果个人之间签约的交易成本太高,法律可以节约交易成本;以交通事故为例:司机开车可能伤害他人,但要每个司机与所有可能的受害人签定合同是不可能的,侵权赔偿替代了合同;但法律面临信息约束。民法与刑法的不同诉讼:民法是“民不告,官不纠”;刑法是“民不告,官也纠”(政府是公诉人);责任程度:民法的赔偿基本上是补偿性的;刑法的处罚是惩罚性的;形式:民法的赔偿以货币形式为主;刑法的处罚以非货币形式为主(自由和说明)民法与刑法的界线侵权的外部性程度:受害人越多,越适合于刑法;惩罚的可性度:如果民事制裁不可信,就需要刑事制裁;复仇的可能性:如果私人复仇会导致伤害的不断升级,就需要用刑法替代民法。第二节什么是博弈论我们首先看几个例子。例1.1石头、剪刀、布猪八戒石头剪刀布孙悟空石头未定,未定休息,找水找水,休息剪刀找水,休息未定,未定休息,找水布休息,找水找水,休息未定,未定例1.2诺曼底登陆德军加来设防诺曼底设防盟军加来登陆失败,成功成功,失败诺曼底登陆成功,失败失败,成功例1.3鸽派和鹰派美国鸽派政策鹰派政策苏联鸽派政策0,0–1,+1鹰派政策+1,–1–∞,–∞从上面的三个例子中,我们可以概括出一个博弈所具有的共同特征:利益相冲突的参与者、参与者总是根据对手可能采取的策略来采取相应的行动----相互依存的策略和行动、参与者总是追求自身利益最大化。根据这些共同特征我们就能给出一个博弈的定义,只要符合这个定义,就可以将其纳入到博弈论的研究范畴之中。定义1.1

博弈是指利益存在冲突的决策主体(个人,企业,集团,政党,国家等等)在相互对抗(或合作)中,对抗双方(或多方)相互依存的一系列策略和行动的过程集合。

在定义1.1中,我们最需要注意的就是策略的相互依存性。对于策略的相互依存性,传统的经济学不是不想研究,而是缺乏有效的工具。从这个意义上而言,博弈论正是为了解决这一问题而产生的。也是从这个意义上讲,我们有了博弈论的定义。定义1.2

博弈论是专门研究博弈如何出现均衡的规律的学科。正是由于博弈论将博弈如何出现均衡列为核心,因而博弈论对于各门社会科学而言,就具有了方法论意义,成为各门学科的有力分析工具。第三节博弈论的经济学渊源博弈论与经济学存在着不解之缘,主要是由于下面几个方面:(1)博弈论的核心问题是经济学最早提出并加以系统研究的。(2)博弈论理论发展主要是经济学的需要推动的,也主要是由经济学家加以发展。(3)博弈论中的主要问题基本上都涉及到经济利益冲突问题。一、模型所谓模型通俗地说就是一个对某种现象进行说明与解释、甚或推演的逻辑体系。模型的形式多种多样,并不一定必须是数学建立起来的才能称为模型。一个模型通常有三个最基本的部分组成:理论假设逻辑推理理论假说评判一个模型是好是坏关键取决于实践检验,但由于模型总是简化的,因而检验并不像我们想象的那么简单。实际上,当我们观察到一个现象,将其抽象为一个模型的过程实际上就是一个简化的过程,简化不同可能得出完全矛盾的结论,真理与谬误相差只不过是毫厘之间,所谓既科学也是艺术就是这个道理。二、博弈论的经济学渊源

经济学的一些思想为博弈论提供了基础,其中最重要的就是所谓的“理性人”。描述理性人的工具就是所谓的理性偏好。为了方便,我们又用效用函数(在博弈论中称为收益函数)来表示偏好。构成博弈论基础的一个重要的经济定理就是所谓的理性选择原理:如果决策主体的偏好是理性的,那么(有限)选择集中就一定存在最优选择,这个选择可能是唯一的,也可能是多个。需要注意的几个问题:(1)表达同一个偏好的收益函数不唯一,但在单调变换下却是唯一的。(2)理性并不等同于自私自利。(3)理性选择理论是有局限性的。三、博弈论革命所谓革命是指博弈论对经济学(其他社会科学)研究产生了深远的影响。传统经济学失灵的五个领域正好体现着博弈论的价值和意义:(1)非完全竞争;(2)外在性;(3)公共产品;(4)逆向选择;(5)道德风险。在其他社会科学中,博弈论同样可以用来解释各种现象,比如政党,利益集团,甚或人类的基本制度。比如奥尔森《集体行动的逻辑》,罗尔斯《正义论》。在自然科学中,博弈论被运用在人工智能,物种演化等方面。所以称博弈论革命并不为过。第四节博弈论要点一、博弈的四个要素:(1)参与者,博弈中的决策主体。(2)博弈规则,对博弈如何进行做出的规定。(3)结果,博弈最后出现的情形。(4)收益,就是参与者对结果的偏好。如:石头、剪刀、布参与者:孙悟空和猪八戒博弈规则:双方同时出招,不得耍赖;石头赢剪刀,剪刀赢布,布赢石头。结果:休息和找水收益:休息得到正的效用,找水是负的效用。二、博弈的基本式如何将博弈表示成一种便于研究和分析的形式显然是很重要的。如果用参与者、策略和收益函数来(科学)描述一个博弈,就称为博弈表达的基本式。三、博弈的扩展式博弈的扩展式就是非常详细地描绘出一个博弈的参与者、策略、行动顺序以及行动时拥有的信息、可能的结果和收益等细节就称为博弈的扩展式。四、信息和顺序

完全信息和非完全信息,完全和非完全判断的标准就是如果有些信息只有一部分参与者知道,并不是所有的信息都是公共信息,那么博弈就是非完全信息博弈。

静态博弈和动态博弈,静态和动态的区别并不在于时间上是否同时,而是在信息上的一种同时行动。公共知识与一般信息的区别。第二章完全信息静态博弈学习内容:1、理解相关概念2、均衡的求解方法3、应用举例第一节博弈的基本式基本概念参与人(players):博弈中决策主体的集合:什么人参与博弈?每个人是什么角色?行动(actions):每个人有些什么样行动可以选择?在什么时候行动?信息(information):在博弈中的知识;每个人知道些什么(包括特征、行动等)?战略(strategies):行动计划;每个人有什么战略可供选择?战略的完备性;支付(payoffs):每个人在不同战略组合下得到些什么?依赖于所有参与人的选择;均衡(equilibrium):所有参与人最优战略的组合;结果(outcomes):我们所感兴趣的东西。静态博弈:所有参与人同时选择行动,并且只选择一次。“同时”是一个信息概念,而不一定与日历上的时间一致;1、基本要素猪八戒石头剪刀布孙悟空石头0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,0看过非诚勿扰的发明了吗?例2.2囚徒困境(prisoners’dilemma)囚徒2沉默招供囚徒1沉默-1,-1-9,0招供0,-9-6,-6练习1:建立人民公社的囚徒困境策略式。(提示:假设两个参与者,两种策略:努力和偷懒。)2:小学生的减负?(你减负我不减负)例2.3斗鸡博弈党徒2让撞党徒1让-10,-10-10,10撞10,-10-∞,-∞例2.4双头垄断企业2高价低价企业1高价1000,1000500,1500低价1500

,500700,700例2.5猎鹿博弈其他猎人鹿兔子猎人1鹿3,30,1兔子1,01,1启示:民主制度的建立和维护需要所有人的努力,光靠几个人的努力显然难以成功。还有食堂打饭的排队现象。第二节博弈均衡一、严格优策略均衡(占优策略、上策略均衡)(dominant-strategyequilibrium):1:严格优策略法:囚徒困境

囚徒困境最可能的结果就是(招供、招供),没有哪个囚徒会主动偏离这个结果,否则遭受更大的损失。囚徒2沉默招供囚徒1沉默-1,-1-9,0招供0,-9-6,-6囚徒困境反映的道理1

个人理性与集体理性的冲突“囚徒困境”表明个人理性与集体理性的冲突。这个根本问题就是:个体对自身利益的追求会损害整体的利益。个人理性说明人是利己主义的;而集体理性说明了社会中人之间的合作?但在每一个人都有自私动机的情况下,怎样才能产生合作呢?友善,永远不首先打击对手。报复,“下流”的策略将残酷地剥削对手。宽恕,如果对手不连续背叛,他们会再次退到合作上。不嫉妒,不去争取高于对手的利益。信任。囚徒困境反映的道理2

两害相权取其轻要摆脱囚徒困境,没有万全之策,可以采用两害相权取其轻的策略。如司马光砸缸:淹死人是大祸,砸坏缸是小祸。人的头脑是不清醒的,舍近而求远,舍大而求小,趋害而避利。囚徒困境反映的道理3

不要自以为是失败往往不是因为人们太傻,而是因为自认为很聪明。自认为聪明的人,往往会因为自己的精明而坏事。在一个比自己高明的人面前,自作聪明是讨不得半点好处的,还不如老实交代。囚徒困境反映的道理4

不要冲在最前面环法自行车赛冲在最前面的人,得到的阻力无疑是最大的,最后还往往会被后面的人超越。当自己的力量不够强大时,可以选择共同合作走在前面或者是暂时退后;当自己的力量强大到可以抵御外来阻力时,恶意选择卓然出众(背叛)。假设政府公开招标选择网络公司建立政府网,公司A是投标公司之一。A公司根据过去的经验能够预算出这个项目的真实成本是100万元,然而A不了解其他竞争对手的真实成本。A公司根据市场行情推断,其他公司的真实成本在50万-100万。从概率讲,在50-100万之间的任何一个价格都有可能是最终的胜利者。简化这个问题,假设每个公司的成本只能是50-60,60-70,……,130-140,140-150万这样的整数,总共有10种可能。最终获得胜利的公司落在这10种价格间的任何一个概率是1/10。你如何设计一个“囚徒困境”,使得各家只能依据自身实力、期望利润和所掌握的市场信息,自主报价,独自承担风险,使得公司投标报价接近于真实成本?囚徒困境反映的道理5

向警察学习掌握主动假设你是一个事业部门的经理,手下有7,8个业务员,你如何设计一个“囚徒困境”,使得员工们努力工作?如果你是支配着,处于主动地位,可以设置困境,为自己争取到最大利益。“囚徒困境”举例经济中的“囚徒困境”。(寡头竞争)如果只有两个公司同时生产一个产品,一个公司定较高的价格是为了期望另一个公司也能保持高价,这样,双方都能得到好处(当然消费者吃亏了)。日常生活中的“囚徒困境”。小学生的减负,团队生产中的劳动供给,公共产品的供给,交通拥挤等等;公共产品(publicgoods)提供不提供提供不提供4,4-1,55,-10,0无论对方如何选择,每个人的最优选择:不提供。所以,我们可以预测,结果将是(不提供,不提供)参与者1参与者2基础教育,“囚徒困境”很少有人否认,学校不断给学生增加负担是目前教育的实际状况。同样,大家普遍认为呆板僵化的应试教育扼杀了学生的创造性。无论是专家还是家长,都在呼吁改变应试教育的模式。但是无论你是否意识到教育有问题,你的小孩都必须接受这个教育。如果没有改变整体性的教育体制,个别人、个别学校、个别地方单独改变都可能使其付出代价。每个家长都会这样想:尽管这种教育不好,但是其他小孩采取的是这种教育,衡量标准(如中考、高考)也是依据这种教育,我的小孩如不这样做,在竞争方面就会吃亏。因此,每个孩子和家长已经不知不觉地进入了一个囚徒困境。政治领域的“囚徒困境”世界各个国家在没有统一领导(联合国只是个协调机构)的情况下交往。因此,产生合作的必要条件就与国际政治的许多中心问题有关。最重要的就是安全困境:国家往往通过那些威胁到其他国家安全的手段来寻求自身的安全。这个问题体现在区域冲突和军备竞赛上。两种策略:增加军备(背叛),消减武器(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎增加军备是两国的“理性”行为,但结果是“非理性”(经济造成损害)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方对进攻,以达到和平。贸易壁垒的囚徒困境问题由于自由贸易能给双方带来好处,因此,如果两个国家消除这些贸易壁垒都能受益。问题是,无论谁单方面采取行动消除自己一方的贸易壁垒,它都会发现自己处于不利于本国经济的贸易状态下。事实上,不论一个国家如何做,另一个国家保持它的贸易壁垒总是比较有利的。因此,每一个国家都有利益动机来保持贸易壁垒,尽管由此带来的结果比双方都合作差得多。在贸易上的选择为:提高关税,以保护自己的商品(背叛)。与对方达成关税协定,降低关税以利各自商品流通(合作)。一国不遵守,背叛,另一国也背叛,两国商品失窃了对方的市场。然后两国又重新达成关税协定,重新博弈的结果是将发现共同合作利益最大。“囚徒困境”一定是坏事吗“囚徒困境”确实揭示了自私对合作的破坏作用,但是正如“有一利必有一弊”这句话,“囚徒困境”给我们带来的也并不全是坏消息。作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。如果两个危险的罪犯通过合作逃脱了法律制裁,一定会给社会造成更大的危害。如果商家通过合谋控制物价,我们就不能享受合理的价格,这也会大大增加人们的消费成本,降低人们的生活水平。2、严格劣策略与重复剔除严格劣策略法严格优策略法的思路是在所有可选择策略中选出最好一种的思路,即选择法。与之对应的就是排除法。定义2.5在一个博弈中,不管其他博弈方的策略如何变化,一个博弈方的某种策略给他带来的收益,总是比另一种策略给他带来的收益要小,那么我们称前一种策略为相对后一种策略的严格劣策略。重复剔除严格劣策略“重复剔除严格劣策略”(iteratedeliminationofstrictlydominatedstrategy)的思路:首先找出博弈参与人的劣策略(假定存在的话),把这个劣策略剔除后,剩下的是一个不包含已剔除劣策略的新的博弈;然后在剔除这个新的博弈中的劣策略;继续这个过程,直到没有劣策略存在。如果剩下的策略组合是唯一的,这个唯一的策略组合就是“重复剔除严格劣策略均衡”(iterateddominanceequilibrium)。左中右上下1,01,20,10,30,12,0应用:上下—左中右如果先从博弈方1的策略空间开始,由于在博弈方1的“上,下”之间没有严格的优劣关系(博弈方2采用“左和中”,“上”优于“下”,但当博弈方2采用“右”,“下”优于“上”)。这里只有参与者2才有严格劣策略,即策略右相对于策略中就是一个严格劣策略。因为无论参与者1选择什么策略,参与者2选择中都要优于选择右。参与者2参与者1参与者2左中参与者1上1,01,2下0,30,1剔除参与者2的右策略剔除参与者1的下策略参与者2左中参与者1上1,01,2“智猪博弈”(boxedpigs)这个博弈没有严格优策略均衡。尽管“等待”是小猪的严格优策略,大猪没有。大猪的最优策略依赖于小猪的策略:如果小猪选择“等待”,大猪的严格优策略是“按”,反之小猪“按”,则大猪是“等待”。这个博弈中,大猪的最优选择依赖于小猪的选择,但小猪的最优选择与大猪的选择无关。如果大猪知道小猪的理性的,大猪将选择“按”。均衡是“大猪按,小猪等待”。启示:比如公司治理中大股东对公司的高管的监督,而小股东则搭便车。按等待按等待3,12,47,-10,0小猪大猪“搭便车”与公司治理结构中股东行为的分析

在现代公司中,股东在购买股票的同时,实际上也就与公司形成了委托代理关系:股东委托公司经营者代表其从事经营活动,同时股东对公司拥有剩余索取权。作为委托人的股东有权要求经营者的行为符合股东利益最大化的要求,但是,当经营者的决策与股东利益最大化的决策产生分歧的时候,经营者往往利用对企业资源的控制权来满足其偏好,股东的利益将遭受不同程度的损失。为了防范代理人的道德风险、降低代理成本,相应的监督机制是必要的。对经营者的监督机制,可以简单地归为“市场监督”和“企业内部监督”。“市场监督”是通过股东买卖股票所引起的股票价格的波动来达成的;“企业内部监督”主要指股东通过股东大会、董事会对经营者的行为进行监督。前者是股东用“脚”投票,后者是用“手”投票。“企业内部监督”与公司治理结构密切联系。股东代表大会是投资者对企业进行内部监督的基本形式,也是公司治理结构中最基本的组织结构。但由于股东代表大会中“搭便车”行为,使其只有形式没有内容,召开股东代表大会常常只是例行公事。小股东搭便车与大股东监督按照“搭便车”的通常含义,每个消费者有激励去享受由他人提供的公共品,而不愿意支付规定的价格。公共品的提供者可以是政府,也可以是私人或私人部门。公司治理结构中,“搭便车”是指大股东承担对公司经营者行为的监督费用,而经营改善的收益却由所有的股东来分享,“监督”成为公共品。大小股东的划分依据是股东的持股份额。

股东对经营者的监督主要是控制其“机会主义”,即防止代理人的经营行为偏离委托人的目标和利益,发生代理人对委托人的侵权行为。因此,监督是股东对自身利益的保护。然而,小股东却很少通过股东大会的机制实施监督活动。我们调查显示,在我国475家上市公司中,80%的公司的年度股东大会人数在100人以下,在这80%的公司中,75%的公司的股东大会人数在50人以下,出席股东大会人数最少的一家公司只有一名股东,有两家公司只有2名股东出席股东大会;1997年和1998年分别有1/4和1/3的公司的流通股股东参加或委托参加股东大会。《中国证券报》的调查显示,16%的投资者曾经参加过股东大会,还有2%的投资者没有直接参加,但委托他人参加过,而高达82%的投资者则表示没有参加过股东大会。如果小股东因监督而获得的收益不能弥补他付出的监督成本,作为理性经济人,小股东便不会实施监督活动。股东对公司经营者的监督是一种“集体行动”而不是个人行动。任何人都有“搭便车”或不劳而获的趋向。在公司治理结构中,只要有股东参与“监督”,最后由“监督”这种集体行动带来股票价格上涨或其他利益都是有利于全体股东的。另外,小股东也知道在多数决情况下,他们的行为对公司很难产生影响,对公司的管理来说只是“噪音”,没有实际意义。

股东对公司的监督所耗费的成本是高昂的。作为委托人的股东只能观察到代理人行为的结果(如股票市场上的价格的涨跌),而不能直接观察到其行为本身(代理人行为是隐藏的)。对经营中代理人的机会主义行为的监督是需要对各种信号的甄别、判断的。此外,即便是参加股东大会行使一下表决权,除支付交通费、食宿等相关费用外,还有花费大量的时间,这些都是监督成本。如果某个集团中的个人能分享某种共同的利益,那么增加这种共同利益就自动地有利于集团中的每个人,而不论他是否承担了为增加这种共同利益的集体行动而发生的任何代价。而且,个人行动不可能决定他所在的集团或阶级的得失成败,这就限定了个人(有理性的或有自我利益的)将不会为了参与任何集团或阶级而采取的集体行动(Olson1980)。在股东集团内部,监督实际上是与剩余索取权相对应的义务,所有的股东都有逃避“监督”这种义务的倾向。对于公司股东,由于监督是公共品,在没有政府干预的情况下,愿意提供监督的人一定是监督收益的最大获得者。大股东和小股东在股东内部集团形成二个不同的利益亚集团:它们股票份额的性质不同,二者面临的风险不一样,对“监督”的需求量也就不同,即二个亚集团面临的需求曲线不一样。大股东在公司中所占的股票份额大,面临的风险也相应更大些,监督的结果对大股东资本收入的影响远远大于小股东。3、划线法严格优策略和重复剔除严格劣策略的方法都是以绝对优劣关系为基础的,但许多博弈是相对优劣关系的。也即博弈方在决策时必须考虑其他博弈方的存在和策略选择。划线法思路:先找出自己针对其他博弈方每种策略的最佳策略(给自己带来最大收益的策略),然后在选择其他博弈方针对自己的策略选择他的最优策略。左中右上下1,01,20,10,30,12,0例1囚徒2沉默招供囚徒1沉默-1,-1-9,0招供0,-9-6,-6例2:“囚徒困境”例3:男女之争男朋友时装足球女朋友时装2,10,0足球0,01,3练习C1C2C3R1R2R30,44,05,34,00,45,33,53,56,6C1C2C3R1R2R30,44,05,34,00,45,33,53,56,6二、纳什均衡纳什均衡:所有参与人的最优策略的组合,给定该策略中别人的选择,没有人有积极性改变自己的选择。纳什均衡通俗地说给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。

条件:参与者的信念是正确的;理性的参与者根据其信念来选择最优行动。命题2.2严格优策略肯定是纳什均衡,反过来不成立。命题2.3纳什均衡一定不会被重复剔除严格劣策略的方法剔除;如果进行了重复剔除严格劣策略后剩下唯一策略组合,那么一定是纳什均衡。证明见书上。(一)寻找纳什均衡的方法1:划线法C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,200纳什均衡举例1:广告博弈广告博弈纳什均衡:(做广告,做广告)企业1企业2举例2:所有权配置与等级结构考虑团队生产:让其中的一个人变成所有者工作偷懒工作偷懒6,62,20,88,0举例3:大锅饭参与者2W(出力)L(懒惰)参与者1W(出力)V-CL,V-CLV-Ch

,VL(懒惰)V

,V-Ch0,0该模型与双头垄断、人民公社都属于囚徒困境一样,启示:道德风险。道德风险是指博弈的参与者故意隐藏自己的行动,而不是尽力去完成任务。通常由于没有办法有效监督参与者的偷懒行动,因而会出现所谓的道德风险问题。举例4:消耗战老虎2P(坚持)Q(放弃)老虎1P(坚持)-c,-cd,0Q(放弃)0,d0,0启示:该模型与鹰鸽博弈、斗鸡博弈一样,其特征是博弈双方力求避免冲突。在政治学中,曾有人说政治就是妥协,而这类博弈很好的说明了这一点。1、双寡头竞争:Cournot博弈。两个企业同时选择产量,价格由市场决定;假定需求函数为 其中q1为企业1的产量,为企业2的产量假定成本函数为:那么,利润函数为:(二)寻找纳什均衡方法2:无限策略博弈与反应函数双寡头竞争(续)企业最大化利润的一阶条件为:即反应函数纳什均衡产量:纳什均衡利润为(0,a-c)(0,(a-c)/2)(0,(a-c)/2)(0,a-c)q2q1垄断产量和垄断利润垄断企业的目标函数:垄断产量:垄断利润:产量博弈的古诺模型是一种囚徒困境,无法实现博弈方总体和各个博弈方各自最大利益。古诺模型的意义在于指明垄断企业之间的串谋是不稳定的,每个企业都有欺骗对方的动机。古诺模型在现实中的例子就是上个世纪的8,90年代国际经济中石油输出国组织的限额和突破问题。石油输出国组织已知各自为政、自定产量的博弈结果肯定是使油价下跌、利润受损,因此有共同磋商制度产量限额以维持油价的意愿。但一旦规定各国的生产限额,且按照这个限额生产,每个成员国都会发现,如果其他国家都遵守限额而只有自己超产,则自己将会得到更多的利润,并且因为只有一国超产时,油价并不会下贴很多,所以其他各国只是普遍受少量损失。而反过来,如果其他国家都超产而只有自己遵守限额,那么自己会受很大的损失。因此,最终的结果是各国都普遍突破限额,限产计划破产,油价严重下跌,各国都只能得到不是最满意的纳什均衡的利润。2、波特兰德寡头模型波特兰德寡头模型中各厂商所选择的是价格而不是产量。两寡头且产品有一定差异的波特兰德博弈模型,即产品有一定差别是指两个厂商生产的是同类产品,但在品牌、质量和包装等方面有所不同。由于厂商的产品质检有很强的替代性,但又不是完全替代,即价格不同时,价格较高的不会完全销不出去。当厂商1和2价格分别为P1和P2,他们各自的需求函数为

Q1=Q1(P1,P2)=a1-b1

P1+d1

P2Q2=Q2(P1,P2)=a2-b2

P2+d2P1

上面反映了产品差别的特征,其中d1

,d2>0即两厂商产品的替代系数。我们假设两厂商无固定成本,假设边际生产成本分别为c1

,c2。最后,两厂商是同时决策的。厂商1和2的策略空间是s1=[0,P1max],s2=[0,P2max]。P1max和P2max是两厂商还能卖出产品的最高价格;两博弈方的得益就是各自的利润,即销售额减去成本。对上两式进行求一阶导数,即可得到反应函数:解上两式,得到该博弈惟一的纳什均衡:3、公共资源问题公共资源:没有哪个个人、企业或组织拥有所有权;大家都可以自由利用。例如大家都可以开采使用的地下水,可自由放牧的草地,可自由排放废水的公共河道(假设政府未予限制)。公共资源问题就是在人们完全从自利动机出发自由利用公共资源时,公共资源倾向于被过度利用、低效率使用和浪费。设某村庄有n个农户,该村有一片大家都可以自由放牧羊群的公共草地。由于这边草地的面积有限,因此只能让不超过某一数量的羊吃饱,如果放羊的实际数量超过这个限度,则每只羊都无法吃饱,从而每只羊的产出(毛、皮和肉的总价值)就会减少,甚至只能勉强存活或要饿死。假设这些农户在夏天才到公共草地放羊,而每年春天就要决定养羊的数量,则可看作各农户在决定自己的养羊数量是不知道其他农户养羊数的,即各农户决定养羊数的决策是同时做出的。再假设所有农户都清楚这片公共草地最多能养多少羊和羊只总数的不同水平下每只羊的产出。这就构成了n个农户之间关于养羊数的博弈问题。博弈方n个农户,策略是选择的养羊数目qi(i=1,……,n)的取值范围;当各户养羊数为q1,……,qn时,在公共草地上放羊的总数为Q=q1+……+qn,每只羊的产出是羊只总数Q的减函数V=V(Q)=V(q1+……+qn)。假设购买和照料每只羊的成本对每个农户都是相同的常数c,则农户i养qi只羊的得益为:ui

=qi

V(Q)-qi

c=qi

V(q1+……+qn)-qi

c这里我们可以假设只有三个农户,即n=3,每只羊的产出函数为V=100-Q=100-(q1+q2+q3),而成本c=4,则三农户的得益分别为u1=q1[100-(q1+q2+q3)]-4q1u2=q2[100-(q1+q2+q3)]-4q2u3=q3[100-(q1+q2+q3)]-4q3求一阶导数,则得到反应函数q1=R1(q2,q3)=48-1/2(q2)-1/2(q3)q2=R2(q1,q3)=48-1/2(q1)-1/2(q3)q3=R1(q2,q1)=48-1/2(q2)-1/2(q1)这三个反应函数的交点就是博弈的纳什均衡,联立这三方程解得q1=q2=q3=24,进而得到三农户的得益函数u1=u2=u3=576。为了对公共资源的利用效率做出评价,我们讨论总体利益最大的最佳羊数量。设在该草地上羊的总数为Q,则总得益为u=Q(100-Q)-4Q求解可得到Q=48,而总得益u=2304。该结果比三农户各自独自决定自己的养羊数时三农户得益的综合1728大了许多。而此时的养羊数Q=48页比三农户独立决策时草地上的羊的总数72要小。因此,三农户独立决策时实际上使草地处于过度放牧的情况,浪费了资源,农户也没有得到最好的效益。启示:公共资源问题反应了农户面临的也是一种囚徒的困境局面:在总体上有加大利用资源的可能时,自己加大利用而他人不加大利用则自己得利,自己加大利用但其他人也加大利用则自己不至于吃亏,最终是所有人都加大利用资源。因此很难实现这种理想的合作的结果,除非有政府进行协调、管理和制约。在我国,比如沙漠化中,当地居民关于保护还是毁坏防风防沙林带的选择。公共设施问题也是类似的问题。即在许多需要人类生产、提供公共设施的问题上,做搭便车总是比做提供者合算,因此许多必需的公共设施,如楼道里的电灯等就总是没有人提供。4、有限策略下的反应函数(1)消耗战当虎2选择P(坚持)时,虎1的最优反应策略为Q(放弃),因而有最优反应函数

b1(P)=Q当虎2选择Q时,虎1的最优反应策略为P,因而有最优反应函数

b1(Q)=P当虎1选择P(坚持)时,虎2的最优反应策略为Q(放弃),因而有最优反应函数

b2(P)=Q当虎1选择Q时,虎2的最优反应策略为P,因而有最优反应函数

b2(Q)=P(2)石头、剪刀、布的反应函数孙悟空的最优反应函数为:布s2=石头b1(s2)=石头s2=剪刀剪刀s2=布猪八戒的最优反应函数为:布s1=石头b1(s1)=石头s1=剪刀剪刀s1=布第六节混合策略纳什均衡有些博弈没有“纯策略”纳什均衡,但有混合策略纳什均衡,如监督博弈。给定工人偷懒,老板的最优选择是监督;给定老板监督,工人的最优选择是不偷懒;给定工人不偷懒,老板的最优选择是不监督;给定老板不监督,工人的最优选择是偷懒;如此循环。监督不监督偷懒不偷懒1,-1-1,2-2,32,2如果博弈中不存在纳什均衡或者纳什均衡不惟一,如石头剪刀布、猜硬币博弈,监督博弈或夫妻之争博弈那样,如果用以前的方法是不能对博弈方的选择和博弈结果作明确的预测,无法给博弈方提供明确的建议。这样就要把纯策略扩展到混合策略。从前面的博弈可以看出,真正吸引人的博弈并不是有唯一纳什均衡解的博弈。对有唯一纳什均衡解的博弈,从理性分析的角度。实际上已经失去博弈的意义。真正有博弈意义的是有多个纳什均衡解或没有纳什均衡解的博弈,这时任何局中人都不知道对手会出什么样的策略,当然在这样的博弈中,任何局中人也无法确定自己的最优纳什均衡策略。面对这样的博弈,局中人确定的均衡局势是怎样一种情形,为了进一步分析这种博弈,我们引入混合策略的概念。一、混合策略与期望收益函数猪八戒石头剪刀布孙悟空石头0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,0纯策略是最基本策略,而混合策略则是参与者策略空间Si中全部策略的概率分布,能够分解更小的策略。例1:石头剪刀布在此博弈中,策略空间Si内还有三个纯策略,分别为石头、剪刀、布,而参与者i的一个混合策略为概率分布(q,r,1-q-r),q是出石头的概率,r为出剪刀的概率,1-q-r是布的概率,且0≤q,r≤1。纯策略可以看作是混合策略的一个特例,例如石头可以表述为混合策略(1,0,0),即以1的概率出石头,出剪刀和布的概率是0。例2:猜硬币博弈猜硬币方正面背面盖硬币方正面-1,11,-1背面1,-1-1,1猜硬币博弈中没有纯策略纳什均衡,因为无论双方采用的是哪个策略组合,结果都是一方赢一方输。盖硬币方的一个混合策略为概率分布(p,1-p),其中p表示盖正面的概率,1-p表示盖背面的概率,且0≤p≤1。猜硬币方

y1-y正面背面盖硬币方x正面-1,11,-11-x背面1,-1-1,1各种策略组合及其概率(正面,正面)xy(正面,背面)x(1-y)(背面,正面)(1-x)y(背面,背面)(1-x)(1-y)例:猜硬币博弈的期望效用求解混合策略的纳什均衡方法:偏导数买不买高质量3,30,2低质量4,01,1这部分内容也可以参考书P67。例1:猜硬币博弈的混合策略的纳什均衡例2:顺从检查假设消费者购买一个软件包的许可证,同意对它的使用有所限制。很显然,消费者有激励违背这个规则。销售者检查消费者是否遵守协议,但这样做需要一定的成本。如果销售者检查并发现消费者欺骗,销售者要求对不顺从的消费者进行惩罚。博弈特征:没有检查时,消费者宁愿欺骗;在有检查时,消费者宁愿顺从。如果消费者顺从,销售者宁愿不检查;如果消费者欺骗,销售者宁愿检查。求解混合策略纳什均衡。顺从欺骗不检查0,0-8,8检查-1,0-4,-64启示:在检查的背景下,随机是实践的方法,可以削减成本。即使检查是不确定的,足够高被抓住的机会将被威胁住欺骗,至少某种程度上威胁住。1/9的均衡概率检查使得参与人2在顺从和欺骗之间是无差异的,即(8/9)×8+(1/9)×(-64)=(8/9)×0+(1/9)×0=0。也就是参与人2在参与人1选择检查与不检查的概率使得其选择欺骗与顺从的期望收益相等。如果参与人1选择经常检查,欺骗的比例将减少,这反过来使得不检查成为更好的策略。例3:数值例子。设参与者1选择A的概率是pA,选择B的概率是pB,参与2选择C的概率是pC,选择D的概率是pD。其中博弈方的选择是他们选择每种策略的概率一定要恰好使对方无机可乘。即参与者1选A和B的概率,一定要使参与者2选C的期望收益和选D的期望收益相等,即pA×3+pB×1=pA×2+pB×5简化可得pA=4pB。又因为pA

+pB

=1,因此pA=0.8,pB

=0.2,这就是参与者1应该选择的混合策略。同理参与者2选择C和D的概率,也应使参与者1选择A和选择B的期望收益相等:pC×2+pD×5=pC×2+pD×1简化后得4pD=pC。因为pC+pD

=1,可得pA=0.8,pB=0.2。这就是参与者2的混合策略。当参与者1以(0.8,0.2)的概率随机选择A和B,参与者2以(0.8,0.2)的概率随机选择C和D时,由于谁都无法通过单独改变自己随机选择的概率分布改善自己的期望收益,。这就是本博弈惟一的混合策略纳什均横。CDA2,35,2B3,11,5例4:社会福利博弈流浪汉

q1-q寻找工作游荡政府

p救助3,2-1,31-p不救助-1,10,0政府想帮助流浪汉,但前提是流浪汉必须试图找到工作,否则,政府不予帮助;而流浪汉只有在得不到政府救助时才会寻找工作。类似这样的问题,在父母决定给予懒惰的儿子多少资助时也会出现。例5:监督博弈代理人偷懒工作委托人监督-h,0v-w-h,w-g不监督-w,wv-w,w-g多重均衡博弈和混合策略一、夫妻之争的混合策略纳什均衡2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡策略得益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.75二、制式问题1,30,00,02,2ABAB厂商2厂商1制式问题混合策略纳什均衡

AB得益厂商1:0.40.60.664厂商2:0.670.331.296三、市场机会博弈-50,-50100,00,1000,0进不进进不进厂商2厂商1市场机会

进不进

得益厂商1:2/31/30厂商2:2/31/30练习:税收检查纳税人逃税不逃税税收机关检查a-C+F,-a-Fa-C,-a不检查0,0a,-aa是应纳税款,C是检查成本,F是罚款,假定C<a+F。并请给予合理解释?纳什均衡的存在性问题每一个有限博弈至少存在一个纳什均衡(纯战略或混合战略);如果一个博弈存在两个纯战略纳什均衡,那么,一定存在第三个混合战略纳什均衡。纳什定理纳什定理1如果策略式博弈G是有限的,那么一定存在纳什均衡。纳什定理2如果策略式博弈G中参与者的策略空间是凸紧集,收益函数是连续拟凹函数,那么一定存在一个纯策略纳什均衡。纳什定理3如果策略式博弈G中参与者的策略空间是紧集,收益函数是连续的,那么一定存在(可能是混合的)纳什均衡。纳什定理得证明关键是弄清楚几个关键概念:上半连续、凸集、紧集、不动点角谷不动点定理第三章纳什均衡运用举例1、Hotelling价格竞争模型及其扩展(多党竞选)1)Hotelling(1924)模型中,产品在物质性能上是相同的,但在空间位置上有差异。因为处于不同位置上的消费者购物的旅行成本(包括时间成本)不同,他们关心的不只是所购货物的价格,而是价格和旅行成本的和。假定有一个长度为1的线性城市(线性城市的假设与某些小城镇的居民住宅沿道路或河流排列的情形是吻合的),消费者均匀地分布在[0,1]的区间里;有两个商店,分别位于该线性城市的两端,即商店1在x=0处,商店2位于x=1处,他们出售物质性能相同的商品;每家商店提供单位商品的成本都是c,消费者购买商品的单位旅行成本为t。这样,住在x的消费者到商店1采购的成本是tx,到商店2的采购的成本是t(1-x)。2)多党竞选西方资本主义国家基本都实行多党制,从政治主张来看,基本可划分为保守和激进主张。因而一个党派如何选择自己的政治主张,将会关系到能够吸引多少选票,同时党派之间的立场选择存在明显的策略依存性。如Hotelling模型,超市通过选址争夺顾客的原理一致。保守用0表示,激进用1表示。选民在保守与激进主张之间选择。不妨设m为[0,1]中的中位数,即[0,m]和[m,1]区间上的选民都为半数(当然也可以不相同)。假设选民服从均匀分布,即选民在各自区间上平均分布。对于任一选民而言,其偏好是选择接近于自己政治主张的候选人效用越高。假设选民的偏好是对称的,即偏向保守还是偏向激进,其效用减少都一致。两党需要确定某种政治主张以最大限度地吸引选民投它的票,谁获得的选票多谁就获胜。保守0激进1党派1x1党派2x2如果党派1的政治主张(策略)为x1,他偏向保守,能获得保守选民的选票,即得到分布在[0,x1]的选民的支持。由于假设选民分布在[0,1]的区间,他获得的投票数可用x1来表示。党派2的策略为x2,偏向激进主张,能获得激进选民的选票,即获得分布在[x2,1]的选民支持,他获得的投票数可用1-x2来表示。对于分布在[x1,x2]的的选民而言,则被两党平分,图3-3中的虚线左边为支持党派1的选民,右边为支持党派2的选民。显然,给定党派1的策略x1,党派2的策略x2越接近于x1,获得的选民就会越多。参与者:党派1和党派2;策略空间:党派1的策略空间为S1=[0,1],策略x1∈[0,1];党派2的策略空间为S2=[0,1],策略x2∈[0,1]。偏好和收益函数:获胜、平分、落败。不妨设赢的收益为w,势均力敌为a,失败的为0。党派1的收益函数为保守0激进1党派1x1党派2x2m保守0激进1党派1x1党派2x2m保守0激进1党派1x1党派2x2m保守0激进1党派1x1党派2x2m当x2<m,党派1的最优策略x1为大于x2,小于2m-x2之间的任意数,因为这时党派1获得的选民数超过半数,能够获得选举。当x2=m时,那么党派1的最优策略x1就是等于x2,因为这样党派1能够获得半数选民的支持,不至于落败。当x2>m,党派1的最优策略x1为大于2m-x2,小于x2之间的任意数,因为这样能获得超过半数选民的支持。最终得到党派1的最优反应对应为:同样能够得到党派2的最优反应对应。这两个最优反应对应的交集即为Hotelling模型的纳什均衡。启示:无论什么党派上台,长期奉行的政治路线通常为中间路线,即不过分保守,也不过分激进。x2x1B1(x2)B2(x1)m3、事故赔偿法伤害人与受害人损失函数为L(a1,a2)>0,a1,a2分别表示伤害人与受害人的小心程度,显然参与者越小心,损失越小,即损失函数L的偏导数小于0。设p(a1,a2)为伤害人承担损失的比重,1-p(a1,a2)为受害人承担损失的比重。参与者越小心,那么责任越轻,即p的偏导数小于0。从社会来看当然希望总损失越小越好,即

Max[-a1-a2-L(a1,a2)]伤害人则希望自己的损失越小越好,即

Max[-a1-p(a1,a2)L(a1,a2)]受害人的收益函数为

Max[-a1-(1-p(a1,a2))L(a1,a2)]从社会的角度来看,总的损失越小越好,即一阶条件得:

根据上式就能得到满足社会最优的和。美国,实行过“过错加过错”的赔偿原则。不妨假设当发生事故时,伤害人要么承担全部责任,要么不承担责任,即p要么等于1,要么等于0。只有当伤害人有过错,而受害人没有过错时,伤害人才承担责任,其他情况下,伤害人不承担责任。不妨设法律规定的过错标准为X1和X2,当a1≥

X1时,伤害人没有过错;当a2≥

X2时,受害人没有过错。可以表示为:另一个赔偿原则就是纯过错,X1>0,a2=0,即只有在伤害人没有过错而受害人有完全过错的情况下,伤害人才能免责,否则将承担全部责任。求解:纯过错情景不妨假定,这时伤害人的收益函数为受害人的收益函数为在这种情况下,伤害人的最优反应函数为如果受害人小心程度a2=0,那么伤害人的最优策略;如果受害人的小心程度a2>0,那么伤害人就需要使得最大的。根据已知条件,在给定的情况下,有,只有当时候,才有。原因在于,当受害人的小心程度不等于时,伤害人需要付出更多的小心以防止损失增加。使得社会总损失最小,所以同样使得伤害人和受害人损失最小。对于受害人的最优反应函数为a1u1u1(a1,a2*)u1(a1,a2)0a1*a1#给定a2<a2*使u1最大的a1第二种情景:过错加过错只有当伤害人完全过错,而受害人完全没有过错时,伤害人才承担责任。伤害人和受害人的收益函数分别为给定受害人的策略,那么伤害人的最优策略是选择a1=0;如果,那么伤害人的最优策略就是选择。给定伤害人的策略,那么受害人的最优策略是选择;如果伤害人的策略为,那么受害人的最优策略是。启示:这就解释了为什么西方国家交通秩序非常好,原因就在于过错加过错的赔偿原则。4、公共地悲剧5、争议仲裁劳资争议、合同争议、消费争议等。一旦争议发生,就需要社会的仲裁机构(为民事法庭)来加以仲裁。仲裁的形式主要有两种:协议仲裁和最后仲裁。根据民法原则,争议双方应首先自愿协商解决,只有争议双方无法达成协议,仲裁机构才进行最后仲裁。我们可以使用最后仲裁模型分析中国城市化进程中,房屋拆迁的赔偿金问题。假定参与争议的双方一为政府,另一为居民户,争议因补偿金而起。首先政府和居民户同时开出自己希望的赔偿金水平,分别用wg和wf表示。如果wg>wf

,显然不存在争议。如果wg<wf

,双方存在补偿金争议,并报仲裁机构进行仲裁。最后,仲裁机构会在两者之中选取其一作为结果。这个博弈实际上属于动态博弈,但由于仲裁机构不在此博弈中,不存在收益,所以可以把该博弈看作是静态博弈来处理。在博弈中,把类似于仲裁机构的这种参与者称为自然,他参与博弈但却没有自己的收益。假定仲裁机构本身对补偿金有自己合理的数值,用x来表示。政府和居民报价wg和wf之后。仲裁机构只是简单选择距x最接近的要价:如果x<(wg+wf)/2,仲裁机构选择wg

。如果x>(wg+wf)/2,仲裁机构选择wf

。仲裁机构遵循的这个仲裁原则是公共信息。对于x,只有仲裁机构知道,政府和居民不知道。但x服从一定的概率分布是公共信息,其累积分布函数为F(x),概率密度函数为f(x)。根据仲裁原则,如果双方的要价分别为wg和wf

,那么双方推断wg被选中的概率为Pr{wg}和wf被选中的概率为Pr{wf

},用数学表示出来为:(wg+wf)/2x<x>wgwf=1/2第四章完全信息动态博弈更为现实的考虑是将静态博弈动态化,动态化后,纳什均衡这一概念是否仍然有效呢?答案是部分有效的。如果不存在动态不一致,那么纳什均衡在完全信息动态博弈中仍不失为一个有用的均衡概念,但纳什均衡概念本身并不能保证不出现动态不一致,为了克服这一点在纳什均衡的基础上生产了所谓子博弈完美均衡。而这一章,我们将围绕这子博弈完美均衡来展开。第一节完美信息与完全但不完美信息完全信息动态博弈可以分为两类,即完美信息与完全但不完美信息。所谓的完美信息博弈,是指博弈中的后行动者始终能够观察到前行动者的行动,因而动态博弈中不存在参与者同时行动这样的情况。而完全但不完美信息博弈,则指动态博弈中,至少存在两个参与者同时行动的情况,因而“后行动者”无法观察到“前行动者”的行动。我们不妨用两个例子来加以说明。例4.1动态囚徒困境招供沉默囚徒1囚徒2囚徒2招供沉默招供沉默图4-1动态囚徒困境例4.2取消管制维持取消进退进退1图4-3取消管制政府2退进定义4.1

完美信息动态博弈就是不存在同时行动的完全信息动态博弈。显然,运用策略式来描述动态博弈会非常不便,特别是当信息不完全时更是如此,为了更简便地描述动态博弈,我们将引入一种新的博弈表达式——扩展式。第二节动态博弈

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论