版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
经济与博弈思维
山东科技大学经济管理学院授课人:丁黎黎(副教授、博士后)研究方向:物流与供应链管理;企业家理论;决策与风险管理;金融物流Email:dinglili0220@163.comTEL:
联系方式多算胜,少算不胜,
何况于无算乎?——摘自《孙子兵法》为什么开设该课程
引起你的思考???“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是供给和需求”---萨缪尔森。为什么开设该课程
这么夸张?我也可以成为经济学家?“现在这只鹦鹉需要再学两个词,那就是纳什·均衡”---坎多利。为什么开设该课程
现在学什么呢?为什么开设该课程
“如果你想成为一个有文化的人,你必须对博弈论有个大致了解”。
——萨缪尔森。课堂调查:囚徒困境?智猪博弈?斗鸡博弈?鹰鸽博弈?课程的讲授风格
文理学生兼顾不失博弈论的理论严密特点一定程度上反映博弈论的人文学科特点力求不同专业的学生都有所收益体现博弈论的博大博弈论多学科、多领域交叉性明显力求理论与实际的融合推荐书目《妙趣横生博弈论》迪克西特、奈尔伯夫机械工业出版社《博弈论基础》吉本斯中国社会科学出版社《博弈论》弗登博格、梯若尔
中国人民大学出版社《经济博弈论》谢识予编著复旦大学出版社《博弈论与信息经济学》张维迎著上海人民出版社《博弈学习理论》陈学彬编著上海财大出版社《博弈论》施锡铨上海财大出版社为什么教授如此苛刻?许多教授强硬地规定,不进行补考,不允许迟交作业或论文。教授们为何如此苛刻?如果允许某种迟交,而且教授又不能辨别真伪,那么学生就总是会迟交。期限本身就毫无意义了。避免这一“滑梯”通常只有一种办法,就是“没有例外”的策略。为什么教授如此苛刻?问题是,一个好心肠的教授如何维持如此铁石心肠的承诺?他必须找到某种使拒绝变得强硬和可信的方法。拿行政程序或者学校政策来做挡箭牌在课程开始时做出明确和严格的宣布通过几次严打来获得“冷面杀手”的声誉什么是博弈论?博弈论:就是关于包含相互依存情况中理性行为的研究。局中人理性地采取或选择自己的策略行为,在相互制约相互影响的依存关系中,尽可能的提高自己的利益所得,这样,博弈论就是关于包含相互依存情况中理性行为的研究。博弈的关键相互依存:通常是指博弈中的任何一个局中人受到其他局中人的行为的影响,反过来,他的行为也影响到其他局中人。
相互依存的另一个方面是局中人可以有某些共同的兴趣或利益所在。
理性行为:博弈论中的所谓理性,一般不是指道德标准。行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。万元陷阱
现将10000元钱拍卖给大家,各位互相竞价,以100元为加价单位,直到没有人再加价为止。出价最高者将以其所出价格获得该10000元钱,同时,出价第二高者将其所出价格的数量支付给我。 请问:您的竞拍策略?实验:实验:选数游戏我从1-100间选出某个数,而你的任务是猜中这个数。若你猜中,我将付给你100美元。规则:你可猜五次,且每次我都会告诉你猜得太高还是太低。越早猜中奖励越丰厚,否则在第二轮中你只能得80美元,依次60、40、0。实验:选数游戏微软总裁史蒂夫.鲍尔默曾以此题作为面试题:正确答案50,25,37,42…..,他感兴趣的是要看看候选人是否用最符合逻辑和最有效的方法去分析所探求的问题。实验:一个简单的数字游戏每位同学写5个大于0的自然数,如果某位同学所写的5个数字中有一个是所有同学所写的数字中最小的(在没有重合的情况下),那么他将获得本课程加10分的奖励(在总得分小于100分的情况下)博弈思想自古有之2000年前中国著名的“田忌赛马”1500年前巴比伦犹太法典的“婚姻合同问题”1838年的古诺(Cournot)模型,被看成是早期博弈研究的起点1883年伯特兰德(Bertrand)提出的通过价格进行博弈的寡头竞争模型与古诺模型有异曲同工之妙。艾奇沃斯(Edgeworth)提出的“契约曲线”则是后来合作博弈论重要概念“核”的特例。博弈论相关背景知识博弈论的诞生vonNeumann(诺依曼)和Morgenstern合著的《博弈论和经济行为》(TheTheoryofGamesandEconomicBehavior)的诞生(1944)该书首创的博弈一些术语,表示形式,至今仍在使用提出了v-N-M效用,用以表示博弈的支付使博弈论从数学家的圈子中走出,建立了数学与经济学间的桥梁博弈论相关背景知识JohnvonNeumann生平
8岁就掌握了微积分,19岁发表了第一篇学术论文30岁成为最年轻的普林斯顿数学学院6名教授之一(Einsteinwasoneoftheothers)(1933年)20世纪40年代开始转向应用数学领域1943年为Manhattan项目的顾问(atomicbomb)1944年第一台计算机的诞生,他作了主要贡献1944年与摩根斯坦合作的博弈论第一部著作1957年英年早逝(纯粹数学、应用数学、物理学,polymath)1903-1957博弈论相关背景知识JohnNashJr.与Nash均衡1950年纳什在普林斯顿的博士论文(27pages),首次提出了纳什均衡、并证明了纳什定理“这是对博弈论高度的原创性和重要的贡献”——Tucker30岁后,曾陷于精神疾病数十年1994与Harsanyi,Selten共获诺贝尔奖纳什与爱因斯坦、冯诺依曼的轶事1928-博弈论相关背景知识20世纪50年代是博弈论的第一个研究高潮Nash均衡理论的建立理论与实验并行的博弈研究方式1950年兰德公司的囚徒问题的实验合作博弈论的第一次鼎盛时期“40年代末50年代初是博弈论历史上令人振奋时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。”(Aumann,1985)博弈论相关背景知识20世纪50年代中后期到70年代的兴盛期博弈研究成果不断丰富1965年泽尔滕与海萨尼的博弈的精炼理论进化博弈(evolutionarygame,1972)的出现“共同知识(commonknowledge)”假设的建立博弈论相关背景知识20世纪80~90年代的成熟期Kohlberg的前向归纳法(forwardinduction,1981)Kreps和Wilson的sequentialequilibrium(1982)Smith的“EvolutionaryandTheTheoryofGames”(1982)博弈学习理论(learningtheory)的完善博弈论相关背景知识20世纪80~90年代的成熟期博弈论几乎涉及经济学所有领域,改变了微观经济学的理论基础博弈论在心理学、行为科学、认知科学等人文科学都取得了成功应用博弈论在生物学、智能技术、计算机科学等也都有着应用多名博弈论专家获得诺贝尔经济学奖博弈论相关背景知识1994年诺贝尔经济学奖授予:•JohnNash•ReinhardSelten•JohnHarsanyi主要贡献:这3位经济学家/数学家阐述了博弈论这门学科,对博弈论的发展做出了重要贡献。博弈论相关背景知识1996年诺贝尔经济学奖授予:•JamesA.Mirrlees(莫里斯,剑桥)•WilliamVickrey美国科学家JamesA.Mirrlees在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论;WilliamVickrey因在信息经济学、激励理论、博弈论等方面做出的重大贡献,而共同获得诺贝尔经济学奖。博弈论相关背景知识1996年维克里,莫里斯获诺贝尔经济学奖。2001年诺贝尔经济学奖授予:
•GeorgeA.Kerlof(阿克尔洛夫,柠檬)•A.MichaelSpence(斯彭斯)•JosephE.Stiglitz(斯蒂格利茨)在对信息不对称市场进行分析中,做出重大贡献博弈论相关背景知识2001年阿克尔洛夫、斯彭斯和斯蒂格利茨获诺贝尔经济学奖。2005年诺贝尔经济学奖授予:•RobertJ.Aumann(奥曼
)•ThomasC.Schelling(谢林
)表彰他们在动态宏观经济学领域中所作的贡献,增强了我们对通过博弈论来进行冲突与合作分析的认识。
博弈论相关背景知识2005年奥曼和谢林诺贝尔经济学奖
2007年诺贝尔经济学奖
为机制设计理论奠定基础明尼苏达大学的赫维茨、芝加哥大学的马斯金,以及美国普林斯顿高等研究中心的迈尔森
2012年诺贝尔经济学奖
稳定配置理论与市场设计为什么博弈论在经济学领域会产生如此大的影响呢?
这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导我们制定更加有效的经济政策。当局者迷、旁观者清。学习博弈论的收益:当局者清、旁观者更清博弈的用处一点强调我们所讨论的博弈问题都是建立在“个体行为理性”基础上的“非合作博弈”。对一切问题的判断取舍,除非特别声明,都唯一地以量化的利益,即我们所称的得益为标准和依据,对一些不是直接以数量表示的利益或损害,如个人的主观感受、心理影响、公共福利水平等,则必须先利用基数效用等经济学中的常用概念和量化方法加以数量化以后再进行比较、分析和判断博弈的基础
几个基本假设:博弈的结果可以量化博弈方在选择策略时是理性的
含义:许多博弈论都假定参与者是完美的计算者和最优策略的完美追随者。这就是理性行为的假设。
1.完全了解自己的利益所在。
2.准确无误的计算出最符合自身利益的行动。博弈的基础①参与人:指的是博弈中选择行动以最大化自己效用的决策主体(可能是人,也可能是团体,如国家、企业)在这里,每个参与人必须有可供选择的行动和一个很好定义的偏好函数在博弈论中,“自然”(nature)作为“虚拟参与人”(pseudo-player)来处理。这里的自然指决定外生随机变量的概率分布的机制博弈的基本要素:博弈的基础②策略(strategy):参与者可利用的选择,即全部策略或行为集合:例如,乒乓球团体比赛的运动员出场顺序就是一个策略;这里所说的策略,是局中人在竞争中,为了对抗其他局中人所采取的一个完整的办法,并不是某一步采取的办法。例如,下象棋的“当头炮”,只能算是策略的一个组成部分,并非完整的策略。局中人所有的策略的集合,就构成了该局中人的策略集合,可以是有限的,也可以是无限的。博弈的基础行动与策略:“人不犯我,我不犯人;人若犯我,我必犯人”是一种策略,这里的“犯”与“不犯”是两种行动,策略略规定了什么时候选择“犯”,什么时候选择“不犯”在静态博弈中,策略和行动是相同的例如:早晨雨伞博弈的基础③信息:指的是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识完美信息(perfectinformation):指一个参与人对其他参与人(包括虚拟参与人与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值(对进程的不了解)完全信息(completeinformation):指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性(对得益的不了解)④得益:在博弈论中,或者是指一个特定的策略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用水平博弈的基础⑤结果:博弈分析者所感兴趣的要素的集合,如均衡战略组合、均衡行动组合、均衡得益组合⑥均衡:是所有参与人的最优策略的组合博弈的基础⑦次序:参与人的策略选择顺序博弈分类完全信息博弈/不完全信息博弈完美信息博弈/不完美信息博弈单人博弈/多人博弈有限策略博弈/无限策略博弈动态博弈/静态博弈课堂作业:二人博弈例子11,10,55,02,2新技术老技术新技术老技术厂商2厂商①参与人②策略③信息④结果⑤均衡课堂作业:三人博弈例子11,1,100,5,55,0,52,2,2新技术老技术新技术老技术厂商2厂商
厂商3—新技术(A)1
厂商3—老技术2,2,21,10,110,1,15,5,0新技术新技术老技术老技术厂商2厂商(B)①参与人②策略③信息④结果⑤均衡博弈论的求解思路?
想想十年后的自己
十八岁之前,我是个不知道自己想要什么的人,那时我每天就在浙江艺术学校里跟着同学唱唱歌,跳跳舞。偶尔有导演来找我拍戏,我就会很兴奋地去拍,无论多小的角色。
如果没有老师跟我的那次谈话,那么也许直到今天,仍然没有人知道周迅是谁。
那是1993年5月的一天,教我专业课的赵老师突然找我谈话:“周迅,你能告诉我,你对于未来的打算吗?”
我愣住了。我不明白老师怎么突然问我如此严肃的问题,更不知道该怎么回答。老师问我:“现在的生活你满意吗?”我摇摇头。老师笑了:“不满意的话证明你还有救。你现在就想想,十年以后你会是什么样?”
老师的话音很轻,但是落在我心里却变得很沉重。我脑海里顿时开始风起云涌。沉默许久,我看着老师的眼睛,忽然就很坚定地说:“我希望十年后的自己成为最好的女演员,同时可以发行一张属于自己的音乐专辑。”
老师问我:“你确定了吗?”
我慢慢地咬紧着嘴唇回答:“Yes”,而且拉了很长的音。
老师接着说:“好,既然你确定了,我们就把这个目标倒着算回来。十年以后,你28岁,那时你是一个红透半边天的大明星,同时出了一张专辑。”
“那么你27岁的时候,除了接拍各种名导演的戏以外,一定还要有一个完整的音乐作品,可以拿给很多很多的唱片公司听,对不对?”
“25岁的时候,在演艺事业上你就要不断进行学习和思考。另外在音乐方面一定要有很棒的作品开始录音了。”“23岁就必须接受各种培训和训练,包括音乐上和肢体上的。”
“20岁的时候就要开始作曲,作词。在演戏方面就要接拍大一点的角色了。”
老师的话说得很轻松,但是我却感到一阵恐惧。这样推下来,我应该马上着手为自己的理想做准备了,可是我现在却什么都不会,什么都没想过,仍然为小丫鬟小舞女之类的角色沾沾自喜。我觉得有一种强大的压力忽然朝自己袭来。老师平静地笑着说:“周迅,你是一棵好苗子,但是你对人生缺少规划,散漫而且混乱。我希望你能在空闲的时候,想想十年以后的自己,到底要过什么样的生活,到底要实现什么样的目标。如果你确定了目标,那么希望你从现在就开始做。”
一年以后,我从艺校毕业了,老师的话从那天开始一直刻在了我的心底:想想十年后的自己。是的,当我意识到这是一个问题的时候,我发现我整个人都觉醒了。
从学校毕业后,我忙于接拍各种各样的影视剧。我始终记得,十年后我要做最成功的明星,所以对角色我开始很认真地筛选。后来我拍了《那时花开》,拍了《大明宫词》,我渐渐被大家接受,也慢慢地尝到了成功的快乐。博弈论的求解思路向前展望,倒后推理p31
从得益结果来判断策略(行动)的选择静态博弈:划线法动态博弈:博弈树例子:解放初,美国总是寻找各种机会来侵犯我国。对此,毛主席提出了“人不犯我、我不犯人,人若犯我、我必犯人”的战略方针。该动态博弈的战略式表述:局中人:美国、中国行动空间:美国“犯我”或“不犯我”,中国“犯人”或“不犯人”行动顺序:美国先行动,我国依美国的行动而后动动态博弈:博弈树支付:这样假设支付情况:若美国“犯我”,中国“不犯人”,则支付向量为(2,-4);若美国“不犯我”,中国“犯人”,则支付向量为(3,-5);若美国“犯我”,中国“犯人”,则支付向量为(-2,-2);若美国“不犯我”,中国“不犯人”,则支付向量为(1,1)。动态博弈:博弈树犯人犯我不犯我犯人不犯人不犯人美国我国我国(1,1)(3,-5)(2,-4)(-2,-2)
动态博弈:博弈树练习1121(2,0)(5,0)(4,2)(1,1)UDRLU’D’甲不借借乙分不分(2,2)(1,0)(0,4)练习2怎么改变策略组合?甲不借借乙分不分(2,2)(1,0)(0,4)甲(1,0)打不打练习3弈基本分类行动顺序信息练习--逆推可解的博弈实验:幸存者两个参与人共有9支笔两个参与人通过抛硬币决定先行者、后行者轮到每个人时,他可以决策取走1支,还是2支,或3支,三个策略任选其一拿走最后一支笔的人将获胜(无论这支笔是最后1支,还是2支或3支中的一支)实验:谈判两个参与人通过抛硬币决定提议人、回应人两个参与人,一个是提议人,一个是回应人。首先由提议人提出分配100元的方案,接着由回应人来决定是否同意。如果回应人同意,就按该方案分配,博弈结束;如果不同意,那么两个人一无所获,博弈结束。
讨论问题你怎么去火车站?P35你给出2个理由可以让查理相信弗里多的承诺。P35什么是零和博弈,请给出2个例子P37求解这两个树。P38绑住自己的双手可能会有绑住,请给出2个例子P45人们在决策的时候,除了要考虑理性,还要考虑什么,请举例第二章纳什均衡实验:选出三男三女规则:在线路上行走实验:结果均衡1:斗鸡博弈ChickenGame懦夫
均衡是什么?实验:结果均衡2:鹰鸽博弈Hawk-Dove对于为生存竞争的每只动物而言,如果“赢”相当于“+5”,“输”相当于“-5”,“重伤”相当于“-10”,“不受伤”即“+5”,静态博弈最简单的博弈:所有参与人同时选择行动,并且只选择一次;“同时”是一个信息概念,而不一定与日历上的时间一致;举例:拍卖囚徒困境(prisoners’dilemma)囚徒困境B
A坦白不坦白坦白不坦白-8,-80,-10-10,0-1,-1无论对方如何选择,每个人的最优选择:坦白。所以,我们可以预测,结果将是(坦白,坦白)占优均衡方法
(dominant-strategyequilibrium)一般来说,由于每个参与人的效用依赖于所有人的选择,因此每个人的最优选择(战略)也依赖于所有其他人的选择(战略)。但在上述例子中,一个人的最优选择并不依赖于他人的选择。这样的最优战略,被称为“占优战略”(dominantstrategy)。由所有参与人的占优战略构成的战略组合被称为“占优均衡”。占优战略均衡的出现只要求所有人都是理性的,但不要求每个参与人知道其他参与人是否理性。囚徒困境博弈有占优均衡,所以其结果很容易预测。“智猪博弈”(boxedpigs)有些博弈没有占优均衡,但通过剔除“坏”战略,我们可以预测博弈的结果。如“智猪博弈”按等待按等待3,12,47,-10,0这个博弈中,大猪的最优选择依赖于小猪的选择,但小猪的最优选择与大猪的选择无关。如果大猪知道小猪的理性的,大猪将选择“按”。均衡是“大猪按,小猪等待”。“劣”战略:无论对方选择什么,如果自己选择A得到的总是收益小于选择B得到的收益,A就是相对于B的劣战略。小猪大猪重复剔除占优均衡方法“重复剔除严格劣战略”(iteratedeliminationofstrictlydominatedstrategy)的思路:首先找出博弈参与人的劣战略(dominatedstrategy)(假定存在的话),把这个劣战略剔除后,剩下的是一个不包含已剔除劣战略的新的博弈;然后在剔除这个新的博弈中的劣战略;继续这个过程,直到没有劣战略存在。如果剩下的战略组合是唯一的,这个唯一的战略组合就是“重复剔除占优均衡”(iterateddominanceequilibrium)。如果这样的解存在,我们说该博弈是“重复剔除占优可解的”(iterateddominancesolvable).理性共识
(commonknowledgeofrationality)(1)Zero-orderCKR:每个人都是理性的,但不知道其他人是否是理性的;(2)first-orderCKR:每个人是理性的,并且知道其他每个人也都是理性的,但并不知道其他人是否知道自己是理性的;(3)second-orderCKR:(1)+(2)+每个人知道(2)nth-orderCKR:R(b)C(b)R(b)……C(b)Risrational,你知道其他的人的想法?报考北大研究生?重复剔除与理性共识重复剔除不仅要求每个人是理性的,而且要求每个人知道其他人是理性的,每个人知道每个人知道每个人是理性的,如此等等,即理性是“共同知识”(共识)C1C2C3R1R2R310,41,598,49,90,398,81,980,100100,98这个博弈只要求一阶理性共识就可以预测均衡结果。CR好事变坏事?在单人决策中,个人给定选择在所有情况下的收益都增加,一个人的状况不会变得更坏,但博弈中则不同。举例:上课睡觉和上课不睡觉不管你的最优选择是什么,都比过去获得的收益大了!
给个枕头表扬好事变坏事?在单人决策中,个人给定选择在所有情况下的收益都增加,一个人的状况不会变得更坏,但博弈中则不同。上下左右上下左右-1,32,10,23,41,34,10,23,4不能用重复剔除解的博弈许多博弈没有占优均衡,也没有重复剔除的占优均衡。考虑如下博弈:C1C2C3R1R2R30,44,05,34,00,45,33,53,56,6纳什均衡纳什均衡:所有参与人的最优战略的组合:给定该战略中别人的选择,没有人有积极性改变自己的选择。纳什均衡是局中人战略选择上构成的一种“僵局”,给定其他局中人的选择不变,任何一个局中人的选择是最好的,他也不会改变其战略选择。例如:乒乓球,生气敌不动,我不动纳什均衡的作用:一致预期一致预期:基于信念的选择是合理的;支持选择的信念是正确的;预期的自我实现:如何所有人认为这个结果会出现,这个结果就会出现。预期是自我实现的,预期不会错误。如果你认为我预期你将选择X,你就真的会选择X。当你知道这样的纳什均衡结果将来会存在,你会作怎样的当期决策?实验:信念游戏:10000拍卖,但规则改成叫价拍卖,最高者获得10000.次高者支付对等价格。哲学思考遗产争夺协议:哲学思考如果参与人事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。(卖东西实验)两方(或多方)讨价还价(博弈)浪费大量口水,时间,最终达成某协议C(当然是个纳什均衡了,没均衡一定会再讨价还价)那么还不如我们一开始就拿出协议C来,这样就节约了很多很多时间和口水!纳什均衡:举例纳什均衡:举例广告博弈纳什均衡:(做广告,做广告)企业1企业2纳什均衡:举例
在城市街道上,我们常见到一些地段上的商店十分拥挤,构成一个繁荣的商业中心区,但另一些地段却十分冷僻,没什么商店。对于这种现象,我们可以运用纳什均衡的概念来加以解释。图1商业位置博弈
纳什均衡:举例1/4麦当劳3/4肯德基1/20A1B出于这种理性,肯德基分店经理肯定会想到:如果我将店铺从3/4点处向左移一点,那麽1/4点之间的中点不在是1/2点处,而是位于1/2点的靠左边一点…….。甲乙1/2
图1商业位置博弈
··纳什均衡:举例所以给定甲在1/2处设店,乙在紧靠甲的左边或右边设店是最优的。反过来,给定乙在接近1/2处设店,甲的最优选择也是在1/2附近设店。这样,甲和乙挤在1/2处设店就是纳什均衡,这就是商业中心区的形成原理。例如:电视台节目;禁娱、禁广告插播、禁广告植入?纳什均衡:所有权配置与等级结构考虑团队生产:纳什均衡是什么?让其中的一个人变成所有者?工作偷懒工作偷懒6,62,20,88,0博弈结果:纳什均衡理性人假设下:博弈结果完全取决于博弈相关的各种抽象的数学事实,即参与人数、每个参与人可选择策略的个数,以及所有参与人策略选择的相联系的每个参与人的盈利。92经济如局人生如棋博弈之道生活之常运用之妙存乎一心送给有心人实验:纳什均衡的观察与验证考虑有N个人参与的游戏:每个人可任意放最多100元到一部可以生钱的机器(可以选择不放),机器把所有人放进去的钱的总和增加到原来的三倍,然后再平均分给这N个人。请猜出这N人博弈的纳什均衡并给出相应的分析。全班范围内,请在1~100这100个整数中,选择一个数字。获胜的条件是,如果你选择的数字,满足:不超过所有回答数字的平均值的2/3;在满足1.的前提下,你所猜得的数字为最大。请问你选择的数字是什么?/cqg/article/1973298.html实验:猜数问题零水平的思考:“这个问题对我太复杂了,随便猜一个碰碰运气吧,就选平均数50.”第一层次的思考:"别人对这个问题也不会有什么灵感,所以我想他们的选择会是随机的,也就是平均数50,所以,我选择33"第二层次的思考:人们可能很聪明,但我更有独到的认识。他们无疑会选33,因为他们认为这个问题很简单,所以我选择22“这个游戏最容易被猜到的数字是0,1,22和33.塞勒认为:“那些选择0或1的人完全从数学角度考虑问题,没有考虑到人们的行为因素。而那些选择22或33的人则低估了别人的智慧。”考虑到所有因素后的猜测应该是13!(3个均数)博弈问题是否存在多个纳什均衡?如果只有一个纳什均衡,容易找到一致性预期吗?如果存在多个纳什均衡,怎么找到一致性预期呢?约会博弈问题芭蕾舞足球场芭蕾舞足球场1,20,00,02,1在社会决策过程中,来自于文化、习惯等方面的许多强制力(compellingforce)能让决策汇集于一点形成共识。一旦社会上形成一个特定的惯例(如语言、习俗等),那么就很难改变,即使每个人都知道这种惯例不是最优的。聚点均衡法:聚焦点:Schelling(1960)认为,在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚焦点”(focal
point)均衡。求解多个纳什均衡方法聚点均衡:情侣博弈情侣博弈的课堂实验请两名同学协助统计其他同学参与实验设想你是情侣博弈的参与人1——男孩,你将选择哪个策略?男女生分开,男生为参与人1——男孩,女生为参与人2——女孩,请选择策略设想你是参与人1——男孩,参与人2已经作出了自己的选择,但你观察不到她的选择。现在请你作出自己的选择。聚点均衡:情侣博弈你仍然是参与人1,在博弈开始前,你的对手有机会做一个宣言(你没这个机会),现在她宣布:“我将选择芭蕾”。博弈开始,你将选择什么策略?你还是参与人1——男孩,博弈开始前,你的对手有机会做一个宣言(你没有),但是女孩选择了沉默。博弈开始,你将选择什么策略?谢林:你要在纽约接一个人,见面约定在什么时间什么地点?你要在山东科技大学接一个人,见面约定在什么时间什么地点?实验:见面实验:选美大赛请你猜出哪张面孔是大多数投标者认为漂亮的?凯恩斯:热门股票就是每个人认为的其他每个人认为的………热门股票。选美与选股信息选股地产政策“地震”,地产股则同时“共振”
政策的猛烈炮火,使地产股俨然成为了近期A股市场的“炮灰”。失守3000点的沪深股市,地产股悲剧持续演绎。继4月19日房地产指数下跌7.58%以后,昨日(4月20日),该指数再度下跌2.91%。无论是招、保、万、金等传统的四大天王,还是先前基金青睐的二三线城市地产股,二级市场上都遭遇了前所未有的持续打压。选股资源价格改革推进带来的机会
资源价格改革,主要集中于电力、天然气、水等资源性产品价格和排污、污水处理、垃圾处理等环保收费改革。目前,市场最关注的就是水资源价格上调的问题。能源、煤炭石油、有色金属
美丽的均衡均衡可以轻易地由于突发奇想或一时狂热而确定。由社会中相互影响的人们参与的博弈的结果,应当取决于博弈的社会和心理方面。第三讲
囚徒困境专题多种情景,一个思想五一、商场多种情景,一个思想美国大选民主党共和党中间策略多种情景,一个思想渔业物种灭绝囚徒困境两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑8年;若两人都不招则未获证据但因私入民宅各拘留1年。表1囚徒困境博弈
乙
招不招招甲不招(问题1:甲、乙如何选择?)
囚徒困境?
条件:允许囚徒甲和乙在审讯室单独呆上10分钟,然后再决定是否坦白。
目的:建立攻守同盟,克服自利心理。
均衡:(坦白,坦白)
恋爱、低碳、核实验:信息沟通?
假设每一个学生都拥有一家企业,选择生产产品A还是B,A代表高质量产品,B代表低质量产品。如果你选择生产A,则老师奖励你2元,选择B,则老师奖励你2.15元。选择A产品可以产生1元总收益,选择B产品不能产生总收益,最后老师计算出所有选择A产品同学的人数,将所得到的总收益平分给所有同学。囚徒困境?
条件:囚徒甲和乙都是完全清白的、绝对具有理性的良好市民。
均衡:(坦白,坦白)
囚徒困境的本质个体理性与集体理性之间存在冲突不合作劣于合作合作不具有约束性囚徒困境的破解不合作合作许诺奖励惩罚可信性囚徒困境的破解合作不合作合作不合作T,TS,RR,SP,P满足:R>T>P>S;(S+R)<T+T囚徒困境的一般表达式囚徒困境的破解国家法律梁启超:我国成文法之起源不可确指,然以数千年之思想往往视法律与命令为一物国家法律措施是无效率还是高效率?用法律解决“囚徒困境”合作不合作合作不合作T,TS,R-XR-X,SP,P满足:X>R-T公共产品(publicgoods)提供不提供提供不提供4,4-1,55,-10,0无论对方如何选择,每个人的最优选择:不提供。所以,我们可以预测,结果将是(不提供,不提供)公共产品与税收制度比较私人产品与公共产品的不同:使用上排他性;私人产品是志愿购买的,但公共产品可能需要强制购买;税收制度就是保证公共产品的生产,解决公共产品生产上的“囚徒困境”
生活中的“囚徒困境”例子
例子1商家价格战
出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来。
譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓“自律联盟”,国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作,这在发达国家是不可思议的。
但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。这是因为,“彩电厂商自律联盟”只不过是一种“囚徒困境”,彩电价格不会上涨。在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩大的。
例子2为什么政府要负责修建公共设施,因为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要有一条好路从居住地通往公路。修一条路的成本为4,每个农家从修好的好路上获得的好处为3。如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民获得净的好处(支付)为3-4/2=1;当只有一户人家单独出资修路时,修路的居民获得的支付为3-4=-1(亏损),“搭便车”不出资但仍然可以使用修好的路的另一户人家获得支付3-0=3。修路博弈
乙修不修修甲不修
我们看到,对甲和乙两家居民来说,“修路”都是劣战略,因而他们都不会出资修路。
这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理,国防、教育、社会保障,环境卫生等都由政府承担资金投入,私人一般没有积极性承担这方面服务的积极性和能力。例子3苏格兰的草地为什么消失了?公共资源经常被过度利用的原因。
在18世纪以前,英国苏格兰地区有大量的草地,其产权没有界定,属公共资源,大家都可以自由地在那里放牧。草地属于“可再生资源”,如果限制放牧的数量,没有被牛羊吃掉的剩余草皮还会重新长出大面积草场,但如果不限制放牧规模,过多的牛羊将草吃得一光二净,则今后不会再有新草生长出来,草场就会消失。
由于草地的产权没有界定,政府也没有对放牧作出规模限制,每家牧民都会如此盘算:如果其他牧民不约束自己的放牧规模,让自己的牛羊过多地到草地上吃草,那么,我自己一家约束自己的放牧规模规模对保护草场的贡献是微乎其微的,不会使草场免于破坏;相反,我也加入过度放牧的行列,至少在草场消失之前还会获得一部分短期的收益。
如果其他牧民约束放牧规模,我单独一家人过度放牧不会破坏广褒的牧场,但自己却获得了高额的收益。因此,任何一位牧民的结论都会是:无论其他牧民是否过度放牧,我选择“约束自己的放牧规模”都是劣战略,从而被剔除。大家最终都会选择过度放牧,结果导致草地消失,生态破坏。
类似的例子还有:
渤海中的鱼愈来愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的“休渔期”,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,为了保护库区水体环境,关闭了前些年泛滥成灾的许多小造纸厂等。思考1为什么人们在消费各种公共资源时,如果各取所需,留给下一代的越来越少?而在社会优化分配中,消耗一半,留下一半给后代。也就是说,当一种资源成了公共资源的时候,还能够实行各取所需吗?思考2全球转暖的温室效应是否属于公共资源悲剧?公共资源悲哀思考3在我国,利用电话线的网络快车(ADSL),包月租或者包年租的时候,每个人都想把网络打开挂在网络上(在线游戏的激励),这样是不是公共悲剧?你家里的网络快车是否真的快?公共资源悲哀思考4如何避免悲剧的发生?公共资源分割私有化行吗?比如环境?增加使用税?比如国家图书馆?当税收使得人们的享受公共资源的边际效用为零的时候,税收合理吗?例子4为什么在城市中心道路上禁止汽车鸣喇叭?
禁鸣喇叭一方面是为了控制城市噪声污染,另一方面是基于以下的博弈论原因。当汽车司机可以鸣喇叭时,可能为汽车超速抢行提供条件。但当大家都抢行时,城市交通拥挤加重,反而都难以顺利通行,获得低支付(2,2)。
但当对方缓行时,自己抢行会占便宜,获得支付9。这个博弈中,“缓行”是劣战略,剔除后得到“剔除劣战略后的占优战略均衡”(抢行,抢行),这不是一个好的均衡。当禁止鸣喇叭时,司机为了避免造成交通事故,只得缓行,从而得到好的结果(缓行,缓行)。交通博弈
司机2缓行抢行缓行司机1抢行
例子5为什么要加入WTO?
WTO是一个自愿性申请加入的自由贸易联盟,即WTO成员国之间实现低关税或零关税的相互间自由贸易。为什么需要一个组织来协调国家之间的自由贸易呢?这是因为,如果没有一个协调组织,国与国之间的贸易就不会呈现低关税或零关税的自由贸易局面,因为这时国与国之间的贸易是一个“囚徒困境”。给定一个国家对另一个国家的货物实行低关税,另一个国家反过来对这个国家的货物实行高关税是占优于实行低关税的战略的。
如果恰当进行机制设计,前述囚徒困境还是可以避免的,下面是一个商战中的真实例子。
机制设计:如何走出囚徒困境冻结价格战的博弈机制
美国有两家销售音像商品的商店“疯狂艾迪(CrazyEddie)和纽马克与露易斯(Newmark&Lewis),它们之间在市场上存在竞争。当它们进行合谋时,如何保证对方不会背叛而降价的一个前提就是如何能迅速查出对方的背叛行为并给予惩罚。
“疯狂艾迪”已作出了承诺“不可能有人卖得比我们更低,我们的价格最低廉,我们保证价格最低,而且是超级疯狂的低”。而对手企业Newmark&Lewis也打出“只要买我们的东西,将得到终生低价保证”。它承诺:假如你能在别处买到更低的价格,我们将加倍退钱,广告还承诺:
假如你在本店买了商品之后,在你一生中于任何本地的销售商(本行销区内)那里发现相同的广告款式而价格却较本店低的话(以单据为凭),本店愿支付百分之百的差价,并额外付给差价的百分之二十五(以支票支付);或是给你差价百分之二百的本店换货单(除了原差价的百分之一百外,再额外加给百分之百,都是以换货单方式支付)。—Newmark&Lewis公司终身低价保证
乍一看,这两家企业在玩命竞争,根本不可能形成价格联盟,即使形成也难以维持,因而它们之间似乎是在打价格战。但是,一种潜在的侦察降低价格行为的机制阻止了价格战的发生。若每台录相机的批发价为150美元,此时两家企业正以每台300美元的价格出售。“疯狂艾迪”打算降为每台275美元,从而将对手的顾客拉过来,如那些家住在对手售货点附近或过去曾买过对手商品的顾客。
但是,对手的战略锁定了“疯狂艾迪”的行为,因为“疯狂艾迪”的这一计划会有相反的效果。因为顾客会到对手那里先以300美元买下录相机,然后再获退款50美元。这样,对手自然将价格降到更低的价格250美元一台,顾客反而是从“疯狂艾迪”那里流向对手而不是相反。
如果对手不想以250美元一台出售录相机,他也可以将价格降到275美元一台,只要它发现有顾客来要求退款,就会发现对手的背叛行为,从而将价格降到了250美元一台。既不以太低价出售,又快速发现对手的背叛从而以降价予以报复,使对手降价也不能增大顾客量,从而蒙受损失。
这样,“疯狂艾迪”就没有进行价格战的意愿了,自然形成价格联盟。在美国,明目张胆的价格合盟是违法的,但这两家企业却以不违法的方式形成了价格合盟,顾客成了背叛行为的侦察者,这一战略是十分巧妙的。
福州国美电器从2003年9月6日试营业,9月13日正式开业至今,一直实施“谁价比我低,差价两倍还”。成都百货大楼国美电器火拼最低价“价格没有最低,只有更低”。
谁价比我低,差价两倍还智猪博弈
猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。给出这个博弈的支付矩阵。二、智猪博弈:对诸多经济现象的解释表4智猪博弈
小猪按等待按大猪等待
这个博弈没有“剔除劣战略均衡”,因为大猪没有劣战略。但是,小猪有一个劣战略“按”,因为无论大猪作何选择,小猪选择“等待”是比选择“按”更好一些的战略。所以,小猪会剔除“按”,而选择“等待”;大猪知道小猪会选择“等待”,从而自己选择“按”,所以,可以预料博弈的结果是(按,等待)。这称为“重复剔除劣战略的占优战略均衡”,其中小猪的战略“等待”占优于战略“按”,而给定小猪剔除了劣战略“按”后,大猪的战略“按”又占优于战略“等待”。
在经济生活中,“智猪博弈—搭便车”
例子1股市博弈在股票市场上,大户是大猪,他们要进行技术分析,收集信息、预测股价走势,但大量散户就是小猪。他们不会花成本去进行技术分析,而是跟着大户的投资战略进行股票买卖,即所谓“散户跟大户”的现象。
例子2为何股份公司中的大股东才有投票权?
在股份公司中,大股东是大猪,他们要收集信息监督经理,因而拥有决定经理任免的投票权,而小股东是小猪,不会直接花精力去监督经理,因而没有投票权。例子3为什么中小企业不会花钱去开发新产品?
在技术创新市场上,大企业是大猪,它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后生产模仿大企业的新产品的产品去销售。我们寝室七个人,有一台学校免费提供的饮水机。一桶水八块钱,在宿舍楼下可以直接买到。但是在买水制度的安排上,却遇到了许多困难。实验:买水的困境首先想到的办法是轮流购买。但问题至少有三个:一、每个人对水的消费量并不相同,这种平摊的方法可能不会得到喝水较少的同学的支持;二、七个人轮流一次的周期很长,到最后很可能会出现一部分人比另一部分人多买一桶水的情形,在公平性上存在争议(虽然一桶水的花费并不高);三、节假日期间,有些同学回家,可能会影响轮流购买的实行。另一个办法是每人定期出资,设立一个买水基金。除了上面的第一个问题外,还可能存在下面的问题:一、资金如何妥善管理和使用的问题;二、谁把水从一楼搬上来的问题(比较费力)。因为存在各种各样的问题,以上的方法均未有效实行,所以寝室经常发生水荒。这个问题与公共物品的提供困境类似,但又存在一些特有的问题。到最后可能演化成一个智猪博弈:对喝水比较看重的人去买水——事实近似于此——但这并不是长久之计。当然,同学友情、兄弟义气等约束行为的因素并未考虑在内,只是在纯粹经济人的假设下给出问题。混合策略与随机行动赛场点球射门攻方的策略是:攻左边,或攻右边守方的策略是:守左边,或守右边(以守方的方向为准)混合策略提出得益:进球得分的百分比。根据1995-2000年间意大利、西班牙和英国最高联盟的数据就一次游戏而言,猜测对方的策略,保密自己的策略。在多次反复游戏中,避免任何的倾向性和规律性。严格竞争博弈零和博弈实验办法是将行动随机化。混合策略:参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行动。例如:乒乓球员以60%的概率选择正手发球,40%的概率选择反手发球。
什么是纯策略?混合策略如果你是踢球人,这两个纯策略中你更喜欢哪一种?(70%)你能不能做得更好?
混合策略(1)以50:50(抛硬币)的比例随机地选择左边或右边。如果守门员选择左边,你混合策略成功的概率:½*58%+½*93%=
75.5%如果守门员选择右边,你混合策略成功的概率:½*95%+½*70%=
82.5%50:50是你最佳混合策略吗?
混合策略(2)以40:60(在你的口袋里放一本书,如果页眉最后一位数是1到4选左,0到5则选右)的比例随机地选择左边或右边。如果守门员选择左边,你混合策略成功的概率:0.4*58%+0.6*93%=
79%如果守门员选择右边,你混合策略成功的概率:0.4*95%+0.6*70%=
80%你的连续更优的混合策略比例就是如何使自己在守门员选择左边时和选择右边的成功概率差距缩小。58%--70%--12%75.5%--82.5%--7.3%79%--80%--1%x--y--0
混合策略不管守门员选择他的左边还是右边,你的最佳混合比例都会使你得到相等的成功率
混合策略(3)以x:1-x的比例随机地选择左边或右边。如果守门员选择左边,你混合策略成功的概率:x*58%+(1-x)*93%如果守门员选择右边,你混合策略成功的概率:x*95%+(1-x)
*70%两者相等,求得选x=0.383不管守门员选择他的左边还是右边,你的最佳混合比例都会使你得到相等的成功率
混合策略(4)以0.383:0.617的比例随机地选择左边或右边。如果守门员选择左边,你混合策略成功的概率:0.383*58%+0.617*93%=79.6%如果守门员选择右边,你混合策略成功的概率:0.383*95%+0.617
*70%=79.6%那么守门员的策略怎样?混合策略纳什均衡?
混合策略守门员的最佳策略是使踢球者选择左边和选择右边的成功率相等的策略。守门员应当分别以41.7%和58.3%的比例选择自己的左边和右边,使踢球者成功的概率为79.6%.法则
混合策略在纯冲突博弈(零和博弈)中,如果让你的对手事先看清楚你的真实选择对你不利,那么你可以通过随机选择自己备选的纯策略而获益。你的混合比例应该是这样的:对手采取任何特定的备选纯策略,都不可能利用你的选择,即,当你以混合策略对付他的混合策略中任一纯策略时,你得到的平均赢利都相等。实验抛硬币
怎样随机行动?抛硬币翻出正面之后再抛一次,这时出正面的可能性与抛出反面的可能性相等。无规律的随机行动(点名4/18=22%,不点名78%)。例如:一个秘密的、足够复杂以致让人难以破解的规则。举例:秘密约会博弈芭蕾舞足球场芭蕾舞足球场2,10,00,01,3妻子报案(reportingacrime)n个人目睹一桩罪行,每个人都希望报警,但是都倾向于其他人打电话。特别的,假定能从报警中得到v单位的收益,而打电话的人需要付出c单位的成本,v>c>0。分析这个问题的纯战略NE和混合战略NE。混合策略—案例分析:参与人:n个每个参与人的战略集:{打电话,不打电话}效用:没有任何人打,所有人0支付;打,v-c;不打,但其他人至少有一个人打,v混合策略—案例纯战略NE当只有两个参与人的时候(公共产品提供的斗鸡博弈)——两个NEn个人的时候:假设有m个人提供,m>1orm=1n个NE混合策略—案例混合策略—案例混合战略NE随着人数n的增加,p减小,即人越多,每个人选择报案的概率就会越小,如果n=1,则p=1社会心理学与博弈分析混合策略—案例
小孩玩的游戏“石头,剪子,布”,也是一种博弈。但是,这个博弈有一种有趣的特征,即给定一方的任何选择,另一方都有制胜对方的战略,所以,给定一方任何一个战略,对方都有制胜这个战略的战略,因而这个战略不是最优的。任何“纯战略”都不是最优的,纯战略是“石头,剪子,布”中的任何一个。
但是,我们知道,玩这个游戏是总是以对方不易猜出的随机方式出招。事实上,可以通过数学证明,当双方都以每个战略按1/3的概率出招时,达成一种双方都不愿改变这种概率分布的局面。这被称为“混合战略纳什均衡”,而这种以随机方式选择纯战略的博弈被称为“混合战略博弈”。
实验显示:“陷入无意识但仍可预测的模式”例如:官僚作风--连续出“布”雪崩---连续出石头排除策略--省略一个随机:秘密的,足够复杂以至难以让人破解的规则
例子1田忌赛马新编
春秋战国时期,齐威王常与旗下大将田忌赛马。规则是:每次赛三局,每一局齐威王与田忌各出一匹马比赛奔跑速度。每一局中的胜者赢败方一千斤铜。田忌有上、中、下三匹马,而齐威王也有上、中、下三匹马。每次比赛,第一局田忌出上马,齐威王也出上马;第二局田忌出中马,齐威王也出中马;第三局,田忌出下马,齐威王也出下马。齐威王的上马比田忌的上马好,齐威王的中马也比田忌的中马好,齐威王的下马还是比田忌的下马好。于是,每次比赛的结果都是田忌连输三局。
田忌的谋士孙膑了解了田忌的困境后,就打听到这样一个消息:尽管齐威王的上、中、下三匹马都要比田忌的对应上、中、下三匹马好,但碰巧的是田忌的上马可胜齐威王的中马,田忌的中马可胜齐威王的下马。于是,孙膑为田忌献计:下一次比赛中第一局时田忌出下马对齐威王的上马输一局,第二局田忌出上马对齐威王的中马,第三局田忌出中马对齐威王的下马,这样可连赢两局,最后净胜一千斤铜。田忌依计而行,果真赢回一千斤铜。
这个故事曾经被很多人当作博弈论的例子来演绎,但实际上这个故事与博弈论无关。博弈论会假定所有局中人都是理性的,不能假定一些局中人聪明而另一些局中人却是傻子。当田忌出下马时,齐威王最好的选择是出下马而不是上马。孙膑的计谋中假定齐威王是傻子,当田忌出下、上、中马时,他仍然按上、中、下马出,当然要输了。事实上,当田忌出下马时,齐威王应出下马,但齐威王出下马时,田忌不应出下马而是出中马,但此时齐威王又应出中马而不是下马了,……。这样,博弈不会有纯战略的均衡。
两人只能玩混合战略博弈,齐威王分别以1/6随机的概率选择出上、中、下马的任一排列,田忌也如此。由于齐威王存在绝对优势,他平均看来仍然会赢田忌一千斤铜。
例子2如果曹操与诸葛亮一样聪明:三国演义中的华容道博弈
在《三国演义》中,曹操在赤壁大战中一败涂地,率残兵败将向许都方向逃窜。诸葛亮命关羽率兵在途中阻截曹军。当时,第一批拦截大军是赵云率领的,第二批拦截大军是张飞带队的,第三批才是关羽率部伏击。由于曹军兵多将广,前二批伏击军不能逮住曹操,只是抢劫一些军械马匹之类。
待曹军冲过赵云、张飞两道关后,进入关羽的伏击地带。但是,当时关羽与曹操相遇的地方有两条道,一条是华容道,除此外还有另一条道。诸葛亮令关羽伏兵于华容道,并且要求关羽在华容道上点燃树枝冒出烟雾引曹操到来。当时关羽不解,问诸葛亮,“如果在伏兵之处点火,岂不令曹兵看见而改走另一条道逃脱?”诸荀亮叫关羽不要再问,只如此照办即可。
当曹操冲破赵云、张飞的阻截后,来到华容道前,看见华容道上静悄悄的,但有烟火萦绕。曹操大笑道:“孔明以为我会上他的当,故意叫人在华容道上点火让我走另一条道,而他却伏兵于这条道上好逮住我呢!我偏不上他的当!”于是,曹操令大军径直上华容道上而去,结果与关羽大军撞个正着。
曹操为何进了孔明的圈套呢?这里的道理是这样的:孔明知道曹操是聪明人,而聪明人见华容道上有烟火会认为华容道上有伏兵,于是会避开华容道而走另一条路。如果孔明令关羽在另一条路等着,曹操就被逮住了。但是,曹操不仅聪明,而且还聪明过人,他也知道孔明的如此盘算来诱他上钩,他偏不上当,知道点火的华容道上无人,孔明的队伍在另一条道上呢!于是他选择走华容道。
但是,依《三国演义》作者罗贯中的逻辑,孔明总是比曹操计高一筹,按博弈论的术语来说,就是孔明的理性程度要比曹操高上一阶。孔明也知道曹操知道孔明的打算,于是令关羽正好在点火的华容道上等着曹操。《三国演义》中的这个故事很可能是作者编造的,因为在《三国志》中并无这一情节。这里,罗贯中假设了曹操在智力上比孔明差一些,才有华容道上被关羽抓住,要不是关羽旧情难忘,曹操就死无葬身之地了。
但是,如果我们不假定曹操比孔明要笨一些,而是相反假定曹操与孔明一样聪明,则曹操又知道孔明知道曹操知道孔明的打算,曹操就会知道关羽在华容道上等着他呢?此时曹操就避开华容道走另一条路。但是,这还没有完,因为若孔明知道曹操知道孔明知道……。显然,最终的结果是曹操与孔明玩混合战略博弈,曹操随机地以1/2的概率选择走华容道和另一条路,孔明也以1/2的概率令关羽守华容道或另一条路。
于是,《三国演义》中的这一情节就应作如下改写:
诸葛亮抛出一枚硬币,决定关羽是守华容道呢还是另一条道……,而曹操也掷出一枚硬币,决定是走华容道呢还是走另一条路。平均看来,曹操有1/2的概率逃脱,而关羽也只有1/2的概率抓住曹操。如果说关羽在华容道上抓住了曹操,则纯属偶然、并非孔明比曹操计高一筹所致!剪刀-石头-布爬楼梯游戏策略,石头、剪子、布布获胜,向上爬5个台阶剪刀获胜,向上爬2个台阶石头获胜,向上爬1个台阶平局,再来一遍第一个爬上楼梯的是获胜者商业与其他对抗中的混合策略商界、政界和战争非零和博弈商业与其他对抗中的混合策略例如:折扣券博弈问题商业与其他对抗中的混合策略例1:折扣券博弈问题目的?1、都不发行2、都发行3、一个发行,另一个不发行如何占得先机?商业与其他对抗中的混合策略如何占得先机?避免他人占得先机,唯一的途径就是保持出人意料的元素。--这一元素源于随机化策略的应用但是:独立随机选择有“出错”的危险。进行合作!商业与其他对抗中的混合策略可口可乐和百事可乐52个星期,分别发放26周优惠券没有出现两家同时的情况计算:如果两家独立以50%概率随机选择任何一周发放优惠券,那么他们各自发放26周而不会出现同时发放的概率是1/10005(10亿的10亿次方)延伸:联合营销麦当劳与可口可乐,肯德基与百事可乐从美国相携走向全球,许多大的跨国企业均与知名连锁酒店、供应商保持全球的合作体系,令人慨叹中国的许多企业尽管躯体庞大,但在经营的思想和理念上与它们相去甚远。
辜鸿铭曾用西文出版过一本书,书名为《中国人的精神》,其中将中国人的民族性格归结为三大特征:“deep,bright,simple”,译成中文是“深沉、聪明、淳朴”。延伸:联合营销深沉就是含而不露,静水流深,但这种性格与联盟的阳光与规则的透明背道而驰。聪明更多是为人为事的创造力与洞察,但似乎缺少更大气的哲学和价值观思考,这样也不利于建立通用的制度规则,大家思考的更多是彼此之间的利益而非联盟共事致力追求的长远目标—这也是战国时期秦国以连横成功打破六国合纵政策的原因所在。例2:飞机折扣票博弈航空公司告诉你折扣,不告诉你剩余的空位你随机选择时点进行订票V,-D-P,00,S0,0睡不睡偷不偷守卫小偷混合战略:守卫以n概率选择睡觉,以1-m的概率选择不睡小偷以m概率选择偷,以1-n概率选择不偷例3监督博弈加重对守卫的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概率0-D-D’守卫得益((睡)S小偷偷的概率1激励悖论Sm加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会使得守卫更多的偷懒0-P-P’小偷得益(偷)V守卫睡的概率1n激励悖论
例5为什么一般人总是小错不断,大错不犯;偷税漏税的一般是中小企业,大企业会老老实实地交税?
税务部门不会对所有企业的交税情况每一次都去检查,因为这样做的成本太高,得不偿失。所以,税务部门总是随机地对企业的交税情况进行检查。
企业也是随机地在交税与偷漏税之间进行选择。税收部门与企业间进行的是混合战略博弈。因为如果企业总是交税,税务部门就最好不检查;但给定不检查,企业就会偷漏税。所以,两者只有在随机地检查与不检查,企业随机地在偷漏税与交税之间选择,才会达成均衡。
对于大企业,因一旦偷税就数目巨大,所以,税务部门在随机检查时放在大企业上的可能性就大一些;而给定税务部门检查大企业的可能性较大,大企业偷漏税的行为就较少,否则就容易被逮个正着。所以,偷漏税较多的就是一些中小企业,大企业纳税的积极性较高。同样,大人物或有钱人纳税的积极性应较高,至于我国在过去一段时期有钱人反而不交税的现象主要源于制度不健全或已有的制度得不到贯彻所致。同样的道理,在犯罪或对错误的监督惩罚博弈中,也是混合博弈,人们可能总是大错不犯小错不断。专题:多重均衡与制度和文化多重纳什均衡:交通博弈路上有两辆车迎面而行,此时,两个司机各有两个选择:走路的左侧和走路的右侧左L左L右R右R1,10,01,10,0乙方甲方这个博弈被称为“协调博弈”:有两个纯战略纳什均衡,一个混合战略均衡。哪一个将出现呢?进门博弈先进后进先进后进-1,-1-1,-12,11,2分蛋糕博弈x1x211任何满足x1+x2=1的点都是纳什均衡。
多个纳什均衡无法形成一致的预期如何协调?仅仅“理性”是不够的;聚点均衡:Schelling(1960);帕累托最优均衡:可以通过协商选择一个纳什均衡;cheaptalking;文化与制度;行业组织;聚点均衡:Schelling(1960)认为,在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点”(focal
point)均衡。这些信息可能与社会文化习惯、参与人过去博弈的历史等有关。1.聚点均衡方法如果在中国,出现(R,R),如果在英国,出现(L,L)左L左L右R右R1,10,01,10,0乙方甲方聚点均衡2.帕累托最优均衡方法3.5“5.5“3.5“5.5“8,83,22,36,6(3.5“,3.5”)帕累托优于(5.5“,5.5”)Cheaptalk
可以帮助协调到一个帕累托最优均衡产品标准博弈为什么要相信?C1C2R1R29,90,88,07,7不论C选择什么,他都有积极性告诉R他将选择C1;所以没有理由认为R应该相信C的话。RC3.风险与均衡方法实验:请同学选择?上下左右8,10-1000,97,66,5BA风险与均衡由于纳什均衡要求理性共识和一致预期,当人们可能犯小小的错误时,纳什均衡不一定被选择。如下面这个博弈中,多
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年中国雾面PU座垫纹革数据监测研究报告
- 三农领域投资策略分析报告及解读手册
- 宇宙奥秘探索故事征文
- 质量管理体系建设咨询服务协议
- 娱乐活动参与者行为规范及免责条款
- 电信行业 5G 网络安全解决方案
- 2025年乌鲁木齐货运从业资格试题题库及答案
- 小熊维尼读后感
- 油气行业石油开采及管道管理优化方案
- 企业战略执行力提升实战指南
- DL∕T 1100.1-2018 电力系统的时间同步系统 第1部分:技术规范
- CJ/T 158-2002 城市污水处理厂管道和设备色标
- NB-T35009-2013抽水蓄能电站选点规划编制规范
- 曳引驱动电梯调试作业指导书
- 上海市中考英语试卷及答案
- 基础会计课程思政教案设计
- 苏教版科学小学五年级上册期末测试卷及完整答案(夺冠系列)
- 监控工程竣工验收报告
- 经皮肝穿刺胆道引流(PTCD)导管的护理要点
- 国家开放大学《心理学》形考任务1-4参考答案
- 2024年社会工作者《社会工作实务(中级)》考试真题必考题
评论
0/150
提交评论