版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生活中的博弈论1生活中的博弈论1
假如你正跟恋人用手机通电话,突然信号断了。这时,你会立即拨电话过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取决于你的恋人是否会拨过来。如果你们其中一方要拨,那么另一方最好是等待;如果一方等待,那么另一方就最好是拨过去。因为如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中流逝。想一想2假如你正跟恋人用手机通电话,突然信号断了。这时精品资料3精品资料3你怎么称呼老师?如果老师最后没有总结一节课的重点的难点,你是否会认为老师的教学方法需要改进?你所经历的课堂,是讲座式还是讨论式?教师的教鞭“不怕太阳晒,也不怕那风雨狂,只怕先生骂我笨,没有学问无颜见爹娘……”“太阳当空照,花儿对我笑,小鸟说早早早……”44
这,就是博弈!这,就是博弈!*在一场博弈中,你必须考虑对方的选择以确定你自己的最优选择,而对方也必须考虑你的选择来确定他的最优选择。*你从博弈中得到的,不仅取决于你自己的行动,也取决于对方的行动。如果你知道恋人不会打过来(如以前断线就是她在等电话,如果你的手机包月额度很难用完而她的接听免费),那么你的最优行动就是拨过去。*博弈最本质的特征是:双方的行动相互影响又相互依赖5这,就是博弈!这,就是博弈!*在一场博弈中,你必须考虑对方博弈无处不在6博弈无处不在6金庸小说中的珍珑棋局,多少高手未曾破解;而棋艺浅陋的虚竹“退一步”,闭了眼睛乱下一子,杀死自己白棋一片,反而天地一宽,破解迷局。7金庸小说中的珍珑棋局,多少高手未曾破解;而棋艺浅陋的虚竹“退田忌赛马比赛规则:马按奔跑的速度分为上中下三等,等次不同装饰不同,各家的马依等次比赛,三赛二胜。比赛前田忌按照孙膑的主意,第一场,用上等马鞍将下等马装饰起来,冒充上等马,与齐威王的上等马比赛;第二场,用上等马与齐威王的中等马比赛;第三场,田忌的中等马和齐威王的下等马比赛。结果二比一,田忌赢了齐威王。在双方条件相当时,对策得当可以战胜对方;在双方条件相差很远时,对策得当也可将损失减低到最低程度。8田忌赛马比赛规则:马按奔跑的速度分为上中下三等,等次不同装饰猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面取胜关键:不能让另一方猜到自己的策略尽可能猜出对方策略9猜硬币博弈-1,11,-11,-1-1,1正面反石头、剪子、布
0,01,-1-1,1-1,11,-10,01,-1-1,10,0石头剪子布博弈方2石头剪子布博弈方110石头、剪子、布
0,01,-1-1,1-1,11,划拳博弈老虎鸡虫杠子老虎鸡虫杠子0,01,-10,0-1,1-1,10,01,-10,00,0-1,10,01,-11,-10,0-1,10,011划拳博弈老虎鸡虫杠子老虎鸡虫杠子0,01,-10,0-1,1关于博弈论的某些光环博弈论很时髦,也有点神秘,谁懂博弈论,或在文章中使用博弈方法,似乎很有面子Why?因为它以数学为基础,似乎不容易学懂它有广泛的用途,但很直接有效的运用似乎也不多见发展很快12关于博弈论的某些光环博弈论很时髦,也有点神秘,谁懂博弈论,或博弈论之“数学”的特征只是数学思维、数学符号,有些符号怪模怪样,甚至不会读,但很少有什么艰深的数学这里的符号比较麻烦,因为它和代数中的纯粹抽象而无意义的符号不同,在脑子里要时刻记得它们的实际意义但要熟悉这种简捷、抽象的思维方式,记住这些符号的代表意义所以,一个比较有效的学习方法是重复13博弈论之“数学”的特征只是数学思维、数学符号,有些符号怪模怪博弈论的学习特点很多人对博弈论有所期待,似乎它有很强的功效。的确,犹如数学,力量很强,无处不在,作用非常广泛而深刻,但学习的时候很枯燥因其与数学密切相关,关于博弈论素养的提高要靠自己的学习、揣摩和领悟——习薫悟化注重数学的严谨,注意基本功得鱼忘筌,得意忘形14博弈论的学习特点很多人对博弈论有所期待,似乎它有很强的功效。本课程的阅读文献张维迎《博弈论与信息经济学》为主要教材通俗读物:王则柯《博弈论平话》、白波《博弈游戏》、潘天群《博弈生存》参考书籍:谢识予《经济博弈论》、姚国庆《博弈论》(南开),拉斯缪森《博弈与信息》(北大与三联)、弗登博格《博弈论》(人民大学),《信息经济学》(湖北)期刊文章:非常多,关于博弈论基本问题的文章自1995陆续发表。但我国直接研究博弈论理论的文章不多,应用博弈论方法的文章非常多,但水平低15本课程的阅读文献张维迎《博弈论与信息经济学》为主要教材15博弈论(GameTheory)又名对策论,游戏论博弈论,英文为Gametheory,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。博弈论试图研究既存在冲突又存在合作的情况下(如寡头垄断)人们的决策行为。博弈是一种势态,在该势态中,两个或更多的参与人都在追求他们各自的利益,没有人能够支配结果。博弈的过程就是一个策略上的相互作用过程。这使得任何一方的行为都必须考虑到对方可能作出的反映。16博弈论(GameTheory)又名对策论,游戏论16博弈论研究对象
博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略(给自己带来最大收益的策略)。17博弈论研究对象17博弈论的产生和发展《学弈》(《孟子•告子》):弈秋,通国之善弈也。使弈秋侮二人弈,其一人专心致志,惟弈秋之为听;一人虽听之,一心以为有鸿鹄将至,思援弓缴而射之。虽与之俱学,弗若之矣。为是其智弗若与?吾曰:非然也。1.博弈在中国18博弈论的产生和发展《学弈》(《孟子•告子》):弈秋,通国之博弈又称博戏,是一门古老的游戏。《世本》说,“乌曹作博”,乌曹乃是夏代著名之能工巧匠。千百年来,博弈更是与人们的生活紧紧相连,从博棋到牌戏,从斗戏到彩票,中华民族的历史长河中就这样形成了别具风情的博弈文化
19博弈又称博戏,是一门古老的游戏。《世本》说,“乌曹作博”,乌从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战20从孙子兵法到三十六计202.博弈论的开山之作1943年,冯·诺依曼和摩根斯顿发表《博弈论和经济行为》的一书,标志着博弈论作为一门独立科学的开始,也标志着新古典经济学进入了一个新的发展阶段。212.博弈论的开山之作标志着博弈论作为一门独立科学的开始,也3.1994年三位获诺奖的博弈论学者JohnNashJohnHarsanyLeihadenSelten223.1994年三位获诺奖的博弈论学者JohnNashJ4.1996年诺贝尔经济学奖得主:詹姆斯·莫里斯:主要贡献:不对称信息条件下的激励理论234.1996年诺贝尔经济学奖得主:詹姆斯·莫里斯:主要贡5.2001年诺贝尔经济学奖得主:迈克尔·斯宾塞:在不对称信息市场分析方面所做出开创性研究。
245.2001年诺贝尔经济学奖得主:迈克尔·斯宾塞:在不对称6.2005年二位获诺奖的博弈论学者RobertAumannThomasShelling256.2005年二位获诺奖的博弈论学者RobertAuma二、基本概念局中人或参与者(Players)规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。策略(Strategy):一整套的行动方案,规定了各种情况下的行动。比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。26二、基本概念局中人或参与者(Players)26相机策略(contingentstrategy):仅在不确定事件发生时才会采取的策略。如:人不犯我,我不犯人;人若犯我,我必犯人。行动:局中人在特定条件下的行为支付(Pay-off):博弈结束时,各方得到的收益。策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。27相机策略(contingentstrategy):仅在不确上策均衡:我所做的是不管你做什么我所能做的最好的你所做的是不管我做什么你所能做的最好的NASH均衡:我所做的是给定你所做的我所能做的最好的你所做的是给定我所做的你所能做的最好的28上策均衡:NASH均衡:28上策与上策均衡所谓上策,是指这样一种策略,即不管对手采取什么策略,这种策略都是最优的。
而当对局者选择的都是上策的时候,这种均衡叫做上策均衡
所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有的对局者都不想再改变他们所选择的策略。
上策均衡与前面的均衡的区别:第一,完全竞争、垄断竞争等市场结构中最终实现的均衡状态都是在假定厂商是追求最大利润的,而且厂商在均衡状态也实现了最大利润
第二,在上述几种竞争模式中,可供厂商选择的竞争策略也相对较少。上策均衡是博弈均衡的一种特殊状态。
29上策与上策均衡所谓上策,是指这样一种策略,即不管对手采取什么纳什均衡纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。1.上策均衡与纳什均衡的区别:
⑴上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。⑵纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。⑶上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。30纳什均衡纳什均衡是指在对手策略既定的情况下,各自对局者所选纳什均衡的意义所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。
纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。31纳什均衡的意义所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合美丽
心灵32美丽
心灵32金发女郎约翰追求金发女郎追求其他女士雷哈德追求金发女郎0,02,1追求其他女士1,21,133金发女郎约翰追求追求追求0,02,1追求1,21,133A、B、C三人决斗,每人有2颗子弹,每次发一枪。A、B、C的命中概率分别为0.3、0.8、1.0。三人依次发射,两轮后对决结束。每次可以选择向对手发射,也可以放空枪。射中即死。问在这场博弈中A的最优策略。故事模型B(80%)A:30%C(100%)34A、B、C三人决斗,每人有2颗子弹,每次发一枪。故事模型B(分析过程A的行动选择集合(1)对空发射,(2)射B,(3)射C如A对空发射,B有80%的可能杀死C(B必然射C,因为C一定选择射击B,则B必死);然后A有30%可能杀死B(仅A,B;A必射B);如未能杀死B,则B向A射击(A存活概率0.2)。对局结束。存活概率为0.8*(0.3+0.7*0.2)=0.352。如B未射死C,则C射杀B,然后A要么成功射杀C,要么被C射杀;存活概率为0.2*0.3=0.06。总体存活概率41.2%。概率树工具A射空B射死C0.8B未射死C0.2A射死B0.3A未射死B0.7B射A不中0.2A射死C0.3A未射死C0.7C射A不中035分析过程A的行动选择集合(1)对空发射,(2)射B,(3)射对空发射:存活概率为0.8×(0.3+0.7×0.2)+0.2×0.3=41.2%A可以采取的行动向C发射:存活概率为0.3×0.2×(0.7+0.3×0.2)+0.7×41.2%=33.4%向B发射:存活概率为0.7×41.2%=28.84%36对空发射:A可以采取的行动向C发射:向B发射:36再说三个枪手
A和B似乎达成了某种默契:在C被干掉之前,他们相互不是敌人。这不难理解,毕竟人总要优先考虑对付最大的威胁,同时这个威胁还为他们找到了共同利益,联手打倒这个人,他们的生存机会都上升。而且,从悲观的角度看,他们恐怕也活不到需要相互拼个你死我活的时候。但这个“同盟”也是很不牢固的,两个人都在时时权衡利弊,一旦背叛的好处大于默契的好处,他们马上就会翻脸。在这个“同盟”里,最忠诚的是B——只要C不死,他就不会背叛;A就要滑头多了,在前面轮流开枪的例子中,他不朝C开枪,从同盟者的角度说,就是没有履行义务,而把盟友送上危险的境地,这不是因为道德水平不同,而是处境不同。B是C的头号目标,这个敌人一定要向他开枪的,完全没有回旋的余地;而A不同,他随时愿意牺牲B换取下次自己的先手之利。除了压力较小之外,而且还有一个动力驱使A背叛,那就是一旦干掉C后,B的机会比他要大,他至少要保持先下手,才可能一争高下。37再说三个枪手A和B似乎达成了某种默契:在C被干掉之前,他诸葛亮在《隆中对》中提出“跨有荆益、东有孙权、北图中原”,他舌战群儒,力劝东吴孙权与刘备联盟。三国中的博弈——联吴抗魏所以,弱者总是有动力去维持一个稳定的三角形结构:与次强者联盟,但是却不愿真正消灭强者。38诸葛亮在《隆中对》中提出“跨有荆益、东有孙权、北图中原”,他火烧赤壁一战,孙刘联军大败曹操,曹操北逃。诸葛亮明知关羽重义气,必然放走曹操,为何还将捉曹重任交给关羽?三国中的博弈——华容道结论:诸葛亮并不想杀掉曹操——曹操一死,刘备亦亡矣!有人会问:既然放操,为何又设三重拦截?如果孙权知道诸葛放操,则孙刘联盟瓦解,因此,既要放,又不能让孙权看出是有意放。冷战期间,中、苏、美。尼克松访华39火烧赤壁一战,孙刘联军大败曹操,曹操北逃。诸葛亮明知关羽重义揭示思想:一个人,在社会上的生存不仅取决于其能力大小,还要看其威胁到的人。现实例子:总统竞选,实力最弱的开始时总是表现低调,实力强劲与实力中等者互相攻击,狼狈不堪,这时最弱的竞选者粉墨登场。“功高震主”“木秀于林,风必摧之”一个对他人利益不构成威胁的人,自然不会是他人意欲除掉的对象,反而能在各种政治风云中幸存下来。能力最强,本事最大的人,反而最有可能走向悲剧结果。C的存活概率只有14%。能力处于中间状态的,是最可能存活的。B:56%能力最弱的,也可以比最强者有更大的生存机会。A:41.2%。40揭示思想:一个人,在社会上的生存不仅取决于其能力大小,还要看三国中的博弈-孙刘联盟的瓦解
孙权不但“火烧赤壁”打败曹操,更在此后还长期承担了对抗曹操的主要任务。而刘备虽在赤壁之战中也出了力,但此后几年未与曹操打过大仗(也就是没有尽联盟义务)。倒是趁此机会扫荡地方势力,扩充地盘,直至占据两川,将曹操赶出汉中,又派关羽北伐,水淹七军,不但取代了孙权原来的老二地位,甚至有可能击败曹操,成为新的老大。孙权地位跌落到老三,他的策略也随之改变。于是孙权趁关羽北伐后方空虚之机,与曹操合谋,夺取了荆州,杀死关羽。结果是同盟破裂,刘备兴兵报仇,又被孙权打败。蜀汉从此衰落,东吴也面临了两面作战的不利局面。41三国中的博弈-孙刘联盟的瓦解孙权不但“火烧赤壁”三国中的博弈-孙刘联盟的瓦解
如果分析一下孙权的心理,我们可能对他的背信弃义有更多同情。赤壁之战尽管符合他的利益,但到底是他出力挽救了刘备,此后他不但把荆州长期借给刘备,还把妹妹嫁给了这个老头子。他尽了同盟的义务,曾与曹操大战数次,不仅损兵折将(他的大将太史慈、董袭、陈武等都在战斗中阵亡),他自己也险些在逍遥津送命。可从收益上说,他与刘备是“牛打江山马坐殿”,感到不平衡是正常的。可是从对策论来看,孙权却犯了一个大错误,由于嫉妒,他过早和刘备翻脸,致使两败俱伤。这就好比枪手A突然翻脸向B开火。坐收渔利的当然是C。虽然曹操的继任者曹丕没能抓住机会夹攻孙权,一举消灭这两个敌手,但蜀和吴此后已经没有可能打败魏国了。那么,孙权的最优策略是什么?回想上面的枪手决斗就明白了。既然已经落到A的地位,就该以A的策略行事。让刘备去和曹操恶斗,自己扩充势力,养精蓄锐,随机应变。无论两者胜负,自己都能从中渔利。42三国中的博弈-孙刘联盟的瓦解如果分析一下孙权的心理,我们面对诸葛亮的空城,司马懿真的是不敢攻城吗?三国中的博弈——空城计非也!正是因为诸葛亮的存在,才使曹魏对其有所依赖。一旦诸葛亮倒下,也就是他被逐出朝廷甚至迫害的日子。“兔死狗烹”即使这个道理。既然“兔死狗烹”,那么猎狗最好不要让兔子全部死掉。43面对诸葛亮的空城,司马懿真的是不敢攻城吗?三国中的博弈——空公路塞车,大家都遵守交规,一个人违规进入自行车道,得便宜,但如果每人都这样,则人人都吃亏。如每个人都守规矩,则一个不守规矩的就会获得好处,每个人都不守规矩,则人人都失利。44公路塞车,大家都遵守交规,一个人违规进入自行车道,得便宜,但囚徒困境模型
两人因盗窃被捕,警方怀疑其有抢劫行为但未获得确凿证据可以判他们犯了抢劫罪,除非有一人供认或两人都供认。即使两人都不供认,也可以判他们犯盗窃物品的轻罪。囚徒被分离审查,不允许他们之间或通信息,并交代政策如下:如果两人都供认,每个人都将因抢劫罪加盗窃罪被判3年监禁;如果两人都拒供,则两人都将因盗窃罪被判半年监禁;如果一人供认而另一个拒供,则供认这被认为有功而免受处罚,拒供者将因抢劫罪、盗窃罪以及拒供重判5年。
45囚徒困境模型两人因盗窃被捕,警方怀疑其有抢劫行为但未囚徒困境赢利表(PayoffTable)拒供供认拒供0.5年,0.5年5年,0年供认0年,5年3年,3年乙甲46囚徒困境赢利表(PayoffTable)拒供供认拒供0.5囚徒困境每个囚徒都会发现如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择。如果对方供认,则自己供认将被判3年,而自己拒供则会被判5年,因此供认是较好的选择。由于每个囚徒都发现供认是自己更好的选择,因此,博弈的稳定结果是两个囚徒都会选择供认。这就是博弈的纳什均衡。攻守同盟?很难达成:隔离审查,每个人都担心对方背弃盟约。47囚徒困境每个囚徒都会发现如果对方拒供,则自己供认便可立即获得囚徒困境的启示“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。48囚徒困境的启示“囚徒的两难选择”有着广泛而深刻的意义。个人理经济学中的理性人成立吗?传统经济学的鼻祖亚当·斯密在其传世经典《国民财富的性质和原因的研究》中这样描述市场机制:“当个人在追求他自己的私利时,市场的看不见的手会导致最佳经济后果。”这就是说,每个人的自利行为在“看不见的手”的指引下,追求自身利益最大化的同时也促进了社会公共利益的增长。即自利会带来互利。传统经济学秉承了亚当·斯密的思想。传统经济学认为:人的经济行为的根本动机是自利,自私是个好东西,每个人都有权追求自己的利益,没有私社会就不会进步,现代社会的财富是建立在对每个人自利权利的保护上的。因此经济学不必担心人们参与竞争的动力,只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公正,自然会增进社会福利。49经济学中的理性人成立吗?传统经济学的鼻祖亚当·斯密在其传世经个人理性与集体理性的冲突但是囚徒困境的结果,恰恰表明个人理性不能通过市场导致社会福利的最优。每一个参与者可以相信市场所提供的一切条件,但无法确信其他参与者是否能与自己一样遵守市场规则。佛家讲因果律,儒家讲究“财自道生,利缘义取”。从囚徒困境看来,如果一味地想算计别人,算来算去,最后算计到自己头上来了。如果我们将囚徒困境中的有期徒刑改为死刑,那么“机关算尽太聪明,反误了卿卿性命”用在这里是再恰当不过的了。50个人理性与集体理性的冲突但是囚徒困境的结果,恰恰表明个人理性现实中的囚徒困境1、公共物品的提供(反倾销的应对,公共过道的路灯)2、招商引资中的“政策竞赛”3、文革中的“竞相揭发”4、贸易战……51现实中的囚徒困境1、公共物品的提供51“人质”方案长期关系和重复博弈报复与惩罚(株连制)如何走出囚徒困境52“人质”方案长期关系和重复博弈报复与惩罚(株连制)如何走出开车博弈奔驰等待前行别克等待0,01,5前行5,1-100,-10053开车博弈奔驰等待前行等待0,01,5前行5,1-100,-1设想汤姆和吉米是两个顽皮的小孩,他们在小伙伴的鼓动下要进行一场关于勇气的比赛:两人分别从一条独木桥的两端冲向对方,谁退却谁就是“小鸡”。显然,如果两个人都向前冲,则两败俱伤,设支付水平为-2;如果一个勇进而另一个退却,则勇进者受到小伙伴的欢呼,退却者受到嘲讽,设支付分别为4和-1;若两人同时退却,则一起受到小伙伴的嘲笑,设支付为0,因为两人一起受到嘲笑比起一人单独受到嘲笑要好受些。斗鸡博弈(chickengame)(胆小鬼博弈)54设想汤姆和吉米是两个顽皮的小孩,他们在小斗鸡博弈(chick
吉米退却勇进退却汤姆勇进0,0-1,44,-1-2,-2有两个均衡。实际会怎样?55
这个博弈也有两个纳什均衡:(进,退),(退,进)该例也有许多应用。有些公共产品的供给就属于此类问题。若村子里住的是两户富人,有一条路要修,一种可能的情况是,一家修路,另一家就不修;一家不修,另一家就得修。(总结一下,公共产品的供给可能是囚徒博弈,也可能是智猪博弈,还有可能是斗鸡博弈,依具体产品而论)56这个博弈也有两个纳什均衡:(进,退)
冷战期间,苏美两个军事集团在世界各地抢占地盘,也是一种斗鸡博弈。一般来说,如果一方已经抢占了一块地盘,另一方就设法占领另一块地盘,而不是与对手竞争同一块地盘。还有警察与游行队伍的例子。游行队伍与警察越来越近,这时候,定要有一方退下来。如果警察不让步,游行队伍便会后退;反过来,如果游行队伍来势很猛,警察就得撤退。57冷战期间,苏美两个军事集团在世界各地抢
夫妻间矛盾也是个斗鸡问题。一般来说,吵得厉害了,不是妻子回娘家躲一躲,就是丈夫到院子里抽支烟。当然,斗鸡博弈的一个重要问题是,究竟哪一方退下来,因为退下来虽比两败俱伤好,总归是一件丢面子的事情。若每一方都寄希望于对方退下阵来,两败俱伤的结局也可能出现。58夫妻间矛盾也是个斗鸡问题。一般来说,吵得政府与流浪汉博弈流浪汉寻找工作流浪政府救济3,2-1,3不救济-1,10,059政府与流浪汉博弈流浪汉寻找工作流浪政府救济3,2-1,3不救什么是智猪博弈智猪博弈说的是,有两头非常聪明的猪(要不怎么叫智猪呢),一大一小共同生活在一个猪圈里。猪圈的一端有一个踏板,踏板连着开放饲料的机关。只要踏一下,在猪圈的另一端就会出现10个单位食物。经过精确的衡量,任何一头猪去踏这个踏板都会付出相当于两个单位食物的成本;每只猪都可以选择“踏”或者“不踏”踏板。
那么,大猪小猪分别会做什么选择呢?60什么是智猪博弈智猪博弈说的是,有两头非常聪明的猪(要不怎么叫选择若小猪去踏,大猪先候在槽边,则当小猪赶到槽边时大猪已经吃光了10个单位食物,小猪不仅什么都没吃到,反而付出了2个单位成本智猪们的选择若大猪去踏,小猪先等候在是食槽边,则大猪因时间耽搁只食得6个单位食物,小猪食得4个单位食物,大猪扣除成本后赢利4单位食物,小猪没有成本因而赢利也为4单位食物;两只猪一起去踏,然后一起回槽边进食,则大猪由于食的更快可吃下8个单位食物,小猪只能吃到2个单位食物,扣除各自的成本,大猪实际赢利6个单位食物,小猪则赢利0个单位食物;两只猪都不去踏,则大家都只能赢利0该博弈的赢利表见图4-161选择若小猪去踏,大猪先候在槽边,则当小猪赶到槽边时大猪已经吃智猪博弈的收益矩阵(4-1)
小猪踏不踏
踏大猪不踏6,04,410,-20,0观察此博弈发现:小猪有优势策略——无论大猪踏或不踏,小猪选择不踏总是最合适的,但是大猪没有优势策略62智猪博弈的收益矩阵(4-1)6,0改变方案一:减量方案投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
63改变方案一:减量方案投食仅原来的一半分量。结果是小猪大猪都不改变方案二:增量方案投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
64改变方案二:增量方案投食为原来的一倍分量。结果是小猪、大猪都改变方案三:减量加移位方案投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。65改变方案三:减量加移位方案投食仅原来的一半分量,但同时将投食智猪博弈的启示原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。66智猪博弈的启示原版的“智猪博弈”故事给了竞争中的弱者(小猪)搭便车者
智猪博弈深刻的反映了经济和社会生活中的免费搭便车问题。无论大猪踏或不踏,小猪都选择不踏;给定小猪不踏,大猪最好去踏。有意思的是大猪选择踏在主观上是为了自己的利益,但在客观上小猪也享受到了好处。在经济学里,这头小猪被称为“搭便车者”。若全部的博弈主体都试图免费搭车,那么就可能陷入囚徒困境67搭便车者智猪博弈深刻的反映了经济和社会生活中的免费搭便请列举“搭便车”的现象冲开水、搞卫生;股市上庄家与散户20世纪70年代末80年代初,美国市场上私人标签(privatelabel)的软饮料价格便宜、质量较差,因此占有较低的市场份额。可口可乐公司和百事可乐公司最初能容忍这些私人标签饮料的存在,因为它们是小猪,威胁有限。可是没过多久,一家主要的私人标签饮料供应商Cott公司通过挑衅性的定价和较高的质量,从拥有较低市场份额的地区品牌,成长为一个拥有三分之一市场份额的、旗鼓相当的竞争者。此时,可口可乐公司和百事可乐公司通过降低价格这种进攻性的行动,使私人标签软饮料的市场份额立即瓦解了。68请列举“搭便车”的现象冲开水、搞卫生;股市上庄家与散户20世改革与制度锁定如果一个制度不是一个好制度,那么就会有人试图推翻这项制度并建立新的制度。但是,改革是有成本的,需要流汗,甚至流血。总有一些人充当“大猪”的角色,为改革东奔西走,承担为改革而付出的代价,而另一些人就象小猪一样,没有为改革付出努力,却坐享了改革的成果,是“免费搭车者”。如果这个社会人人都想搭免费车,都不站出来向旧制度发难,那么并不美好的旧制度就会被长期锁定。这也许可以解释为什么有些制度明明不合理却又长期存在的现象。69改革与制度锁定如果一个制度不是一个好制度,那么就会有人试图推技术创新便车小企业通常模仿大企业的产品,等大企业通过广告打开市场后出售廉价模仿品。大企业作为“大猪”常会花钱进行研究开发、技术创新,而小企业作为小猪,常常等待大企业开发出新技术、新产品后模仿起技术和产品并生产和出售类似产品。70技术创新便车70混合策略
小偷与守卫的博弈混合策略博弈的几个原则
71混合策略小偷与守卫的博弈71小偷与守卫的博弈
守卫睡不睡小偷偷6,-2-3,0不偷0,20,0给定工人偷懒,老板的最优选择是监督;给定老板监督,工人的最优选择是不偷懒;给定工人不偷懒,老板的最优选择是不监督;给定老板不监督,工人的最优选择是偷懒;如此循环。72小偷与守卫的博弈
守卫睡不睡小偷偷6,-2-3,0不偷0,2混合策略博弈的几个原则
策略组合不可能是单一的策略或者纯策略,而必须把不同的策略混合一起使用,这种博弈也称之为“混合策略”博弈,所达到的均衡也称之为混合策略均衡。第一,不能让对方事先知道自己可能采取的策略。第二,必须采取随机选择的原则。第三,选择策略的概率一定要使对方无机可乘。
73混合策略博弈的几个原则策略组合不可能是单一的策略或者重复博弈如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。对重复博奕的研究结果证明有一种最好的策略:只需将一个原则贯穿始终,即“以牙还牙”(Tit-for-tat)。以牙还牙策略的获胜有一个十分重要的条件,即博弈是无限次重复的。
例如:小摊小贩和黔驴技穷74重复博弈如果博弈不是一次的,而是重复进行的,参与人过去行动的信誉的条件重复博弈;足够耐心;相对确定额环境;欺骗可以被观察到;受骗人有积极性惩罚。75信誉的条件重复博弈;75眼前利益与长远利益欺骗的短期收益信誉的长期收益时间76眼前利益与长远利益欺骗信誉的长期收益时间76传统社会的个人信誉在传统社会,人们常年生活在封闭的村庄,村民之间彼此非常熟悉,欺骗行为很容易识别,人们之间的口头交流足以使任何欺骗行为广为而知,每个人的历史都存储在别人的脑海里,对欺骗行为的惩罚即使不能施加于欺骗者本人,也可以通过家庭成员而实现,前面讲的四个条件基本是可以得到满足。因此,即使没有法律,村民之间也可以建立起高度的信任,欺骗行为很少发生。77传统社会的个人信誉在传统社会,人们常年生活在封闭的村庄,村民商业社会的问题现在社会被称为“匿名社会”(anonymoussociety),与乡村社会不同,居民的流动性大,交易双方通常并不认识,相互之间也缺少如乡村社会中存在的其他制约关系,使得受害人的惩罚措施受到很大限制;开放的社会也使得人们较不在乎闲言碎语的议论。凡此种种,使得传统的以个人为基础的信誉机制失灵,这也是都市社会犯罪率高的一个重要原因。但是,西方市场经济之所以能发达到今天的程度,除了较完善的司法制度之外,是因为他们在更高的形态上复制出了前面讲的四个条件。78商业社会的问题现在社会被称为“匿名社会”(anonymous序列博弈
对局者选择策略有时间先后的顺序,某些对局者可能率先采取行动。这种博弈被称为序列博弈,序列博弈则是另一种动态博弈形式。市场进入的博弈79序列博弈对局者选择策略有时间先后的顺序,某些市场进入的博弈
厂商B进入不进入厂商A进入-20,-2050,0不进入0,500,080市场进入的博弈
厂商B进入不进入厂商A进入-20,-2050市场进入博弈的扩展形式厂商A·
进入
不进入
厂商B·
厂商B·
进入(-20,-20)
不进入(50,0)
进入(0,50)不进入(0,0)(2)
(3)
(1)
81市场进入博弈的扩展形式厂商A·进入不进入厂商B
性别战——协调博弈
女子的选择足球芭蕾男子的策略足球2,10,0芭蕾0,01,2均衡策略(足球,足球)或(芭蕾,芭蕾)82性别战——协调博弈女子的选择足球芭蕾足球2,10,0
威胁与承诺一、阻止市场进入的威胁
阻止市场进入的威胁博弈
垄断者商战默许潜在进入者进入-200,600900,1100不进入0,30000,300083威胁与承诺一、阻止市场进入的威胁阻止市场进入的威胁博弈潜在进入者进入成本200万元
这里出现的结局只有三种(1)进入不进入0,3000垄断者(2)默许900,1100商战-200,600图阴止市场进入博弈的扩展形式84潜在进入者这里出现的结局只有三种(1)进入不进入0,300二、承诺与可信性所谓“承诺”是指对局者在不实行这种威胁会遭受更大损失的时候,采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。
与承诺相比,空投威胁无法有效阻止市场进入的主要原因是,它是不需要任何成本的。
垄断者的商战与垄断者的生产成本有关,商战的形式通常是低价竞争。
垄断者商战默许潜在进入者进入-200,600900,300不进入0,22000,2200实施承诺后的阻止市场进入博弈85二、承诺与可信性所谓“承诺”是指对局者在不实行这种威胁会遭受实施承诺后的阻止市场进入博弈垄断者商战默许潜在进入者进入-200,600900,300不进入0,22000,220086实施承诺后的阻止市场进入博弈垄断者商战默许潜在进入者进进入不进入进入不进入垄断者垄断者承诺无承诺潜在进入者潜在进入者(1)(0)(2)(3)0,3000900,11000,2200-200,600900,300默许商战图承诺对阻止市场进入的有效性87进入不进入进入不进入垄断者垄断者承诺无承诺潜在进入者潜在进入承诺能够阻止市场进入的关键在于其可信性,但承诺同时也给厂商自身的行为带来一定的限制。这种通过限制自己的行为来获得竞争优势的做法被称为“策略性行动”。策略性行动就是某人通过影响其他人对自己的行为的预期,来促使其他人选择对自己有利的策略,是某人通过限制自己的行为来限制其对局者的选择。88承诺能够阻止市场进入的关键在于其可信性,但承诺同时也给厂88几种相关的策略一、“保证最低价格”的策略“保证最低价格”策略是顾客在本商店购买产品在规定时间内,如果发现其他任何商店以更低的价格出售同样的商品,本店将退还差价并给予顾客一定的补偿。保证最低价格条款使消费者至少在规定的时间内不会因为商品降价而后悔。它无疑是厂商之间竞争的一种手段。保证最低价格条款是一种承诺,由于法律的限制,它是绝对可信的。
89几种相关的策略一、“保证最低价格”的策略“保证最低价格”策略二、研究与开发(R&D)策略新产品的研究与开发是厂商在市场竞争中保持其有利地位的非常重要的手段。在垄断竞争的市场中,为了不断获得短期的超额利润,厂商可能抱有研究与开发的强烈动机。因而,研究与开发活动的策略就成为他们的关键策略金伯利——克拉克R&D无R&D宝洁公司(P&D)R&D2000,10004000,-1000无R&D-1000,30003000,200090二、研究与开发(R&D)策略新产品的研究与开发是厂商在市场竞中国欲造大飞机
引起波音空客警觉2007年04月18日14:28《环球》杂志波音空客联手遏制中国大飞机?2007年3月16日晚,美国加州贝弗利山上,一所豪华别墅中正在举行着一场小型晚宴。晚宴的主人是国际金融租赁公司董事长兼总裁史蒂文·乌德沃尔哈齐,与他共进晚餐的,都是美欧航空业的重量级人物,其中就包括空客的首席执行官路易斯·加卢瓦。91中国欲造大飞机
引起波音空客警觉2007年04月18日14中国欲造大飞机
引起波音空客警觉就在一个多月前,在美国凤凰城举行的美国航空运输贸易协会年度讨论会上,乌德沃尔哈齐的讲话令所有在场的航空业CEO们都感到意外——他热切地谈论起了中国。“他们想要坐到驾驶舱里,绝对不会只甘当配角,他们想要当奥斯卡的主角。”“虽然我现在还不会预见到他们将取得巨大的商业成功,但是我认为他们已经种下了希望的种子。”“假如中国人能够以更低的成本制造出大飞机来,那么市场就会被低成本的解决方案所吸引,只要它质量在那儿。因此,中国对国际航空业确实是一个挑战。”92中国欲造大飞机
引起波音空客警觉就在一个多月前,在美国凤凰城空客与波音的攻防对策
讲话的结尾,对于空客和波音应该如何应对,乌德沃尔哈齐给出了两种对策。一种是防御性的,另一种则是进攻性的。防御性举措就是要确保空客和波音作为最终组装者、市场营销者的角色,尽量能拖多久就拖多久。至于进攻性举措,就是在技术上实现一个大的飞跃。波音和空客如果能够在新的替代机型技术上有一个大的飞跃,就没有人能够超越它们了。93空客与波音的攻防对策讲话的结尾,对于空客和波音应该如何应对空客与波音的攻防对策当年印度尼西亚的努桑达拉公司还是加拿大的庞巴迪公司,在试图挤入大飞机市场时,都遭到了波音和空客的联手遏制而胎死腹中。当年,美国为了垄断航空关键技术,还曾试图买断罗尔斯·罗伊斯公司的发动机,但最终没有成功。正如乌德沃尔哈齐自己所说的,“在全球化时代,你无法再像以前那样饿死你的竞争对手,因此你无法阻止。”既要争取中国未来的大飞机市场,又要“延缓中国通过翻版仿制关键技术”,这对于波音和空客而言不是那么容易。94空客与波音的攻防对策当年印度尼西亚的努桑达拉公司还是加拿大的全球行动,当地思维至于技术性飞跃的进攻性对策,波音公司也曾尝试过。上世纪80年代,拥有垄断优势的美国航空公司票价可以定得高一些,技术先进的用户推动着技术先进的供应商前进。在这种情况下,当时的波音就认定保持技术领先地位是竞争的主要角斗场。据《美国航空航天》杂志透露,如今波音公司驻莫斯科的代表处也一直在十分关注俄罗斯优秀飞机设计师和工程师的资料,最终很可能将这些人才集结在波音旗下。而空客把320总装生产线设在天津,也有争夺航空技术人才的潜在含义。95全球行动,当地思维至于技术性飞跃的进攻性对策,波音公司也曾尝航空航天产业2002年版的《美国航空航天产业未来委员会最终报告》中写道,“航空航天工业是美国经济领域内一支强大的力量,是全球市场最有竞争力的部门之一。航空航天工业产值占国内生产总值的15%以上,并提供1500万个以上高质量的就业岗位。航空航天产品提供比其他任何生产部门都高的贸易盈余。”96航空航天产业2002年版的《美国航空航天产业未来委员会最终报经济如局人生如棋博弈之道生活之常运用之妙存乎一心97经济如局97
激励机制要相容:上有政策下有对策公车改革:难以推进公款吃喝:屡禁不止耕地保护:化整为零数字干部:屡试不爽一票否决:万无一失博士干部:文凭腐败98激励机制要相容:上有政策下有对策公车改革:难以推进98
生活中的博弈论99生活中的博弈论1
假如你正跟恋人用手机通电话,突然信号断了。这时,你会立即拨电话过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取决于你的恋人是否会拨过来。如果你们其中一方要拨,那么另一方最好是等待;如果一方等待,那么另一方就最好是拨过去。因为如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中流逝。想一想100假如你正跟恋人用手机通电话,突然信号断了。这时精品资料101精品资料3你怎么称呼老师?如果老师最后没有总结一节课的重点的难点,你是否会认为老师的教学方法需要改进?你所经历的课堂,是讲座式还是讨论式?教师的教鞭“不怕太阳晒,也不怕那风雨狂,只怕先生骂我笨,没有学问无颜见爹娘……”“太阳当空照,花儿对我笑,小鸟说早早早……”1024
这,就是博弈!这,就是博弈!*在一场博弈中,你必须考虑对方的选择以确定你自己的最优选择,而对方也必须考虑你的选择来确定他的最优选择。*你从博弈中得到的,不仅取决于你自己的行动,也取决于对方的行动。如果你知道恋人不会打过来(如以前断线就是她在等电话,如果你的手机包月额度很难用完而她的接听免费),那么你的最优行动就是拨过去。*博弈最本质的特征是:双方的行动相互影响又相互依赖103这,就是博弈!这,就是博弈!*在一场博弈中,你必须考虑对方博弈无处不在104博弈无处不在6金庸小说中的珍珑棋局,多少高手未曾破解;而棋艺浅陋的虚竹“退一步”,闭了眼睛乱下一子,杀死自己白棋一片,反而天地一宽,破解迷局。105金庸小说中的珍珑棋局,多少高手未曾破解;而棋艺浅陋的虚竹“退田忌赛马比赛规则:马按奔跑的速度分为上中下三等,等次不同装饰不同,各家的马依等次比赛,三赛二胜。比赛前田忌按照孙膑的主意,第一场,用上等马鞍将下等马装饰起来,冒充上等马,与齐威王的上等马比赛;第二场,用上等马与齐威王的中等马比赛;第三场,田忌的中等马和齐威王的下等马比赛。结果二比一,田忌赢了齐威王。在双方条件相当时,对策得当可以战胜对方;在双方条件相差很远时,对策得当也可将损失减低到最低程度。106田忌赛马比赛规则:马按奔跑的速度分为上中下三等,等次不同装饰猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面取胜关键:不能让另一方猜到自己的策略尽可能猜出对方策略107猜硬币博弈-1,11,-11,-1-1,1正面反石头、剪子、布
0,01,-1-1,1-1,11,-10,01,-1-1,10,0石头剪子布博弈方2石头剪子布博弈方1108石头、剪子、布
0,01,-1-1,1-1,11,划拳博弈老虎鸡虫杠子老虎鸡虫杠子0,01,-10,0-1,1-1,10,01,-10,00,0-1,10,01,-11,-10,0-1,10,0109划拳博弈老虎鸡虫杠子老虎鸡虫杠子0,01,-10,0-1,1关于博弈论的某些光环博弈论很时髦,也有点神秘,谁懂博弈论,或在文章中使用博弈方法,似乎很有面子Why?因为它以数学为基础,似乎不容易学懂它有广泛的用途,但很直接有效的运用似乎也不多见发展很快110关于博弈论的某些光环博弈论很时髦,也有点神秘,谁懂博弈论,或博弈论之“数学”的特征只是数学思维、数学符号,有些符号怪模怪样,甚至不会读,但很少有什么艰深的数学这里的符号比较麻烦,因为它和代数中的纯粹抽象而无意义的符号不同,在脑子里要时刻记得它们的实际意义但要熟悉这种简捷、抽象的思维方式,记住这些符号的代表意义所以,一个比较有效的学习方法是重复111博弈论之“数学”的特征只是数学思维、数学符号,有些符号怪模怪博弈论的学习特点很多人对博弈论有所期待,似乎它有很强的功效。的确,犹如数学,力量很强,无处不在,作用非常广泛而深刻,但学习的时候很枯燥因其与数学密切相关,关于博弈论素养的提高要靠自己的学习、揣摩和领悟——习薫悟化注重数学的严谨,注意基本功得鱼忘筌,得意忘形112博弈论的学习特点很多人对博弈论有所期待,似乎它有很强的功效。本课程的阅读文献张维迎《博弈论与信息经济学》为主要教材通俗读物:王则柯《博弈论平话》、白波《博弈游戏》、潘天群《博弈生存》参考书籍:谢识予《经济博弈论》、姚国庆《博弈论》(南开),拉斯缪森《博弈与信息》(北大与三联)、弗登博格《博弈论》(人民大学),《信息经济学》(湖北)期刊文章:非常多,关于博弈论基本问题的文章自1995陆续发表。但我国直接研究博弈论理论的文章不多,应用博弈论方法的文章非常多,但水平低113本课程的阅读文献张维迎《博弈论与信息经济学》为主要教材15博弈论(GameTheory)又名对策论,游戏论博弈论,英文为Gametheory,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。博弈论试图研究既存在冲突又存在合作的情况下(如寡头垄断)人们的决策行为。博弈是一种势态,在该势态中,两个或更多的参与人都在追求他们各自的利益,没有人能够支配结果。博弈的过程就是一个策略上的相互作用过程。这使得任何一方的行为都必须考虑到对方可能作出的反映。114博弈论(GameTheory)又名对策论,游戏论16博弈论研究对象
博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略(给自己带来最大收益的策略)。115博弈论研究对象17博弈论的产生和发展《学弈》(《孟子•告子》):弈秋,通国之善弈也。使弈秋侮二人弈,其一人专心致志,惟弈秋之为听;一人虽听之,一心以为有鸿鹄将至,思援弓缴而射之。虽与之俱学,弗若之矣。为是其智弗若与?吾曰:非然也。1.博弈在中国116博弈论的产生和发展《学弈》(《孟子•告子》):弈秋,通国之博弈又称博戏,是一门古老的游戏。《世本》说,“乌曹作博”,乌曹乃是夏代著名之能工巧匠。千百年来,博弈更是与人们的生活紧紧相连,从博棋到牌戏,从斗戏到彩票,中华民族的历史长河中就这样形成了别具风情的博弈文化
117博弈又称博戏,是一门古老的游戏。《世本》说,“乌曹作博”,乌从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战118从孙子兵法到三十六计202.博弈论的开山之作1943年,冯·诺依曼和摩根斯顿发表《博弈论和经济行为》的一书,标志着博弈论作为一门独立科学的开始,也标志着新古典经济学进入了一个新的发展阶段。1192.博弈论的开山之作标志着博弈论作为一门独立科学的开始,也3.1994年三位获诺奖的博弈论学者JohnNashJohnHarsanyLeihadenSelten1203.1994年三位获诺奖的博弈论学者JohnNashJ4.1996年诺贝尔经济学奖得主:詹姆斯·莫里斯:主要贡献:不对称信息条件下的激励理论1214.1996年诺贝尔经济学奖得主:詹姆斯·莫里斯:主要贡5.2001年诺贝尔经济学奖得主:迈克尔·斯宾塞:在不对称信息市场分析方面所做出开创性研究。
1225.2001年诺贝尔经济学奖得主:迈克尔·斯宾塞:在不对称6.2005年二位获诺奖的博弈论学者RobertAumannThomasShelling1236.2005年二位获诺奖的博弈论学者RobertAuma二、基本概念局中人或参与者(Players)规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。策略(Strategy):一整套的行动方案,规定了各种情况下的行动。比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。124二、基本概念局中人或参与者(Players)26相机策略(contingentstrategy):仅在不确定事件发生时才会采取的策略。如:人不犯我,我不犯人;人若犯我,我必犯人。行动:局中人在特定条件下的行为支付(Pay-off):博弈结束时,各方得到的收益。策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。125相机策略(contingentstrategy):仅在不确上策均衡:我所做的是不管你做什么我所能做的最好的你所做的是不管我做什么你所能做的最好的NASH均衡:我所做的是给定你所做的我所能做的最好的你所做的是给定我所做的你所能做的最好的126上策均衡:NASH均衡:28上策与上策均衡所谓上策,是指这样一种策略,即不管对手采取什么策略,这种策略都是最优的。
而当对局者选择的都是上策的时候,这种均衡叫做上策均衡
所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有的对局者都不想再改变他们所选择的策略。
上策均衡与前面的均衡的区别:第一,完全竞争、垄断竞争等市场结构中最终实现的均衡状态都是在假定厂商是追求最大利润的,而且厂商在均衡状态也实现了最大利润
第二,在上述几种竞争模式中,可供厂商选择的竞争策略也相对较少。上策均衡是博弈均衡的一种特殊状态。
127上策与上策均衡所谓上策,是指这样一种策略,即不管对手采取什么纳什均衡纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。1.上策均衡与纳什均衡的区别:
⑴上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。⑵纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。⑶上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。128纳什均衡纳什均衡是指在对手策略既定的情况下,各自对局者所选纳什均衡的意义所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。
纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。129纳什均衡的意义所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合美丽
心灵130美丽
心灵32金发女郎约翰追求金发女郎追求其他女士雷哈德追求金发女郎0,02,1追求其他女士1,21,1131金发女郎约翰追求追求追求0,02,1追求1,21,133A、B、C三人决斗,每人有2颗子弹,每次发一枪。A、B、C的命中概率分别为0.3、0.8、1.0。三人依次发射,两轮后对决结束。每次可以选择向对手发射,也可以放空枪。射中即死。问在这场博弈中A的最优策略。故事模型B(80%)A:30%C(100%)132A、B、C三人决斗,每人有2颗子弹,每次发一枪。故事模型B(分析过程A的行动选择集合(1)对空发射,(2)射B,(3)射C如A对空发射,B有80%的可能杀死C(B必然射C,因为C一定选择射击B,则B必死);然后A有30%可能杀死B(仅A,B;A必射B);如未能杀死B,则B向A射击(A存活概率0.2)。对局结束。存活概率为0.8*(0.3+0.7*0.2)=0.352。如B未射死C,则C射杀B,然后A要么成功射杀C,要么被C射杀;存活概率为0.2*0.3=0.06。总体存活概率41.2%。概率树工具A射空B射死C0.8B未射死C0.2A射死B0.3A未射死B0.7B射A不中0.2A射死C0.3A未射死C0.7C射A不中0133分析过程A的行动选择集合(1)对空发射,(2)射B,(3)射对空发射:存活概率为0.8×(0.3+0.7×0.2)+0.2×0.3=41.2%A可以采取的行动向C发射:存活概率为0.3×0.2×(0.7+0.3×0.2)+0.7×41.2%=33.4%向B发射:存活概率为0.7×41.2%=28.84%134对空发射:A可以采取的行动向C发射:向B发射:36再说三个枪手
A和B似乎达成了某种默契:在C被干掉之前,他们相互不是敌人。这不难理解,毕竟人总要优先考虑对付最大的威胁,同时这个威胁还为他们找到了共同利益,联手打倒这个人,他们的生存机会都上升。而且,从悲观的角度看,他们恐怕也活不到需要相互拼个你死我活的时候。但这个“同盟”也是很不牢固的,两个人都在时时权衡利弊,一旦背叛的好处大于默契的好处,他们马上就会翻脸。在这个“同盟”里,最忠诚的是B——只要C不死,他就不会背叛;A就要滑头多了,在前面轮流开枪的例子中,他不朝C开枪,从同盟者的角度说,就是没有履行义务,而把盟友送上危险的境地,这不是因为道德水平不同,而是处境不同。B是C的头号目标,这个敌人一定要向他开枪的,完全没有回旋的余地;而A不同,他随时愿意牺牲B换取下次自己的先手之利。除了压力较小之外,而且还有一个动力驱使A背叛,那就是一旦干掉C后,B的机会比他要大,他至少要保持先下手,才可能一争高下。135再说三个枪手A和B似乎达成了某种默契:在C被干掉之前,他诸葛亮在《隆中对》中提出“跨有荆益、东有孙权、北图中原”,他舌战群儒,力劝东吴孙权与刘备联盟。三国中的博弈——联吴抗魏所以,弱者总是有动力去维持一个稳定的三角形结构:与次强者联盟,但是却不愿真正消灭强者。136诸葛亮在《隆中对》中提出“跨有荆益、东有孙权、北图中原”,他火烧赤壁一战,孙刘联军大败曹操,曹操北逃。诸葛亮明知关羽重义气,必然放走曹操,为何还将捉曹重任交给关羽?三国中的博弈——华容道结论:诸葛亮并不想杀掉曹操——曹操一死,刘备亦亡矣!有人会问:既然放操,为何又设三重拦截?如果孙权知道诸葛放操,则孙刘联盟瓦解,因此,既要放,又不能让孙权看出是有意放。冷战期间,中、苏、美。尼克松访华137火烧赤壁一战,孙刘联军大败曹操,曹操北逃。诸葛亮明知关羽重义揭示思想:一个人,在社会上的生存不仅取决于其能力大小,还要看其威胁到的人。现实例子:总统竞选,实力最弱的开始时总是表现低调,实力强劲与实力中等者互相攻击,狼狈不堪,这时最弱的竞选者粉墨登场。“功高震主”“木秀于林,风必摧之”一个对他人利益不构成威胁的人,自然不会是他人意欲除掉的对象,反而能在各种政治风云中幸存下来。能力最强,本事最大的人,反而最有可能走向悲剧结果。C的存活概率只有14%。能力处于中间状态的,是最可能存活的。B:56%能力最弱的,也可以比最强者有更大的生存机会。A:41.2%。138揭示思想:一个人,在社会上的生存不仅取决于其能力大小,还要看三国中的博弈-孙刘联盟的瓦解
孙权不但“火烧赤壁”打败曹操,更在此后还长期承担了对抗曹操的主要任务。而刘备虽在赤壁之战中也出了力,但此后几年未与曹操打过大仗(也就是没有尽联盟义务)。倒是趁此机会扫荡地方势力,扩充地盘,直至占据两川,将曹操赶出汉中,又派关羽北伐,水淹七军,不但取代了孙权原来的老二地位,甚至有可能击败曹操,成为新的老大。孙权地位跌落到老三,他的策略也随之改变。于是孙权趁关羽北伐后方空虚之机,与曹操合谋,夺取了荆州,杀死关羽。结果是同盟破裂,刘备兴兵报仇,又被孙权打败。蜀汉从此衰落,东吴也面临了两面作战的不利局面。139三国中的博弈-孙刘联盟的瓦解孙权不但“火烧赤壁”三国中的博弈-孙刘联盟的瓦解
如果分析一下孙权的心理,我们可能对他的背信弃义有更多同情。赤壁之战尽管符合他的利益,但到底是他出力挽救了刘备,此后他不但把荆州长期借给刘备,还把妹妹嫁给了这个老头子。他尽了同盟的义务,曾与曹操大战数次,不仅损兵折将(他的大将太史慈、董袭、陈武等都在战斗中阵亡),他自己也险些在逍遥津送命。可从收益上说,他与刘备是“牛打江山马坐殿”,感到不平衡是正常的。可是从对策论来看,孙权却犯了一个大错误,由于嫉妒,他过早和刘备翻脸,致使两败俱伤。这就好比枪手A突然翻脸向B开火。坐收渔利的当然是C。虽然曹操的继任者曹丕没能抓住机会夹攻孙权,一举消灭这两个敌手,但蜀和吴此后已经没有可能打败魏国了。那么,孙权的最优策略是什么?回想上面的枪手决斗就明白了。既然已经落到A的地位,就该以A的策略行事。让刘备去和曹操恶斗,自己扩充势力,养精蓄锐,随机应变。无论两者胜负,自己都能从中渔利。140三国中的博弈-孙刘联盟的瓦解如果分析一下孙权的心理,我们面对诸葛亮的空城,司马懿真的是不敢攻城吗?三国中的博弈——空城计非也!正是因为诸葛亮的存在,才使曹魏对其有所依赖。一旦诸葛亮倒下,也就是他被逐出朝廷甚至迫害的日子。“兔死狗烹”即使这个道理。既然“兔死狗烹”,那么猎狗最好不要让兔子全部死掉。141面对诸葛亮的空城,司马懿真的是不敢攻城吗?三国中的博弈——空公路塞车,大家都遵守交规,一个人违规进入自行车道,得便宜,但如果每人都这样,则人人都吃亏。如每个人都守规矩,则一个不守规矩的就会获得好处,每个人都不守规矩,则人人都失利。142公路塞车,大家都遵守交规,一个人违规进入自行车道,得便宜,但囚徒困境模型
两人因盗窃被捕,警方怀疑其有抢劫行为但未获得确凿证据可以判他们犯了抢劫罪,除非有一人供认或两人都供认。即使两人都不供认,也可以判他们犯盗窃物品的轻罪。囚徒被分离审查,不允许他们之间或通信息,并交代政策如下:如果两人都供认,每个人都将因抢劫罪加盗窃罪被判3年监禁;如果两人都拒供,则两人都将因盗窃罪被判半年监禁;如果一人供认而另一个拒供,则供认这被认为有功而免受处罚,拒供者将因抢劫罪、盗窃罪以及拒供重判5年。
143囚徒困境模型两人因盗窃被捕,警方怀疑其有抢劫行为但未囚徒困境赢利表(PayoffTable)拒供供认拒供0.5年,0.5年5年,0年供认0年,5年3年,3年乙甲144囚徒困境赢利表(PayoffTable)拒供供认拒供0.5囚徒困境每个囚徒都会发现如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择。如果对方供认,则自己供认将被判3年,而自己拒供则会被判5年,因此供认是较好的选择。由于每个囚徒都发现供认是自己更好的选择,因此,博弈的稳定结果是两个囚徒都会选择供认。这就是博弈的纳什均衡。攻守同盟?很难达成:隔离审查,每个人都担心对方背弃盟约。145囚徒困境每个囚徒都会发现如果对方拒供,则自己供认便可立即获得囚徒困境的启示“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。146囚徒困境的启示“囚徒的两难选择”有着广泛而深刻的意义。个人理经济学中的理性人成立吗?传统经济学的鼻祖亚当·斯密在其传世经典《国民财富的性质和原因的研究》中这样描述市场机制:“当个人在追求他自己的私利时,市场的看不见的手会导致最佳经济后果。”这就是说,每个人的自利行为在“看不见的手”的指引下,追求自身利益最大化的同时也促进了社会公共利益的增长。即自利会带来互利。传统经济学秉承了亚当·斯密的思想。传统经济学认为:人的经济行为的根本动机是自利,自私是个好东西,每个人都有权追求自己的利益,没有私社会就不会进步,现代社会的财富是建立在对每个人自利权利的保护上的。因此经济学不必担心人们参与竞争的动力,只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公正,自然会增进社会福利。147经济学中的理性人成立吗?传统经济学的鼻祖亚当·斯密在其传世经个人理性与集体理性的冲突但是囚徒困境的结果,恰恰表明个人理性不能通过市场导致社会福利的最优。每一个参与者可以相信市场所提供的一切条件,但无法确信其他参与者是否能与自己一样遵守市场规则。佛家讲因果律,儒家讲究“
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年咨询服务与技术服务合同
- 2024年个人借款合同履约保证合同版B版
- 二零二四年度商品房屋买卖合同
- 江南大学《高分子化学与物理基础》2021-2022学年第一学期期末试卷
- 江南大学《电工学基础》2022-2023学年第一学期期末试卷
- 佳木斯大学《形势与政策1》2021-2022学年第一学期期末试卷
- 2024商铺居间合同模板
- 暨南大学《音乐欣赏》2021-2022学年第一学期期末试卷
- 济宁学院《形式逻辑》2021-2022学年第一学期期末试卷
- 基于二零二四年度物联网技术的智能家居控制系统开发合同2篇
- 自动化仪表联锁摘除投用制度
- 小学生垃圾分类(全)课件
- 医学影像学读片实训课件
- 护士身体不适申请调换岗位申请书(通用6篇)
- 农村经济管理 课件
- 教学第8章-Kmeans聚类算法课件
- traveling-around-the-world的英语知识课件
- PS基础教程课件
- 毕业论文- 一例猫尿闭导致的急性肾衰竭的诊断和治疗
- 六年级上科学苏教版17钢筋混凝土与现代建筑业课件
- 中国古陶瓷鉴赏课件
评论
0/150
提交评论