博弈论小故事_第1页
博弈论小故事_第2页
博弈论小故事_第3页
博弈论小故事_第4页
博弈论小故事_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

广西分公司个人业务部2021年11月人人的博弈论生存竞争中的策略游戏——人人的博弈论人的一生只做两件事情:等待和决策。面对生存,你的选择决定着行动方向;面对竞争。你的策略影响着成败胜负。在这永不停息的选择、决策和行动过程中,你需要理性的思维和智慧的方法。

每天早上我们一睁眼,就开始了策略的博弈和心计的较量。你做出的选择足以决定你的前途和命运,更关乎你在职场中的位置、未来会有着怎样的人生、能过上什么层次的生活!博弈是指个人、团队或其他组织,面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后,一次或屡次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。囚徒困境警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:假设一人认罪并作证检控对方〔相关术语称“背叛〞对方〕,而对方保持沉默,此人将即时获释,沉默者将判监10年。假设二人都保持沉默〔相关术语称互相“合作〞〕,那么二人同样判监半年。假设二人都互相检举〔互相“背叛〞〕,那么二人同样判监2年。

用表格概述如下:囚徒困境1年,1年15年,0年0年,15年10年,10年囚徒乙囚徒甲拒供招供拒供招供囚徒困境囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:

假设对方沉默、背叛会让我获释,所以会选择背叛。假设对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能到达的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑10年。

囚徒困境囚徒困境想探索的问题是:在每个人都有自私动机的前提下,怎样才能产生合作?

在我们生活中,也处处面临着“囚徒困境〞:办公室里的竞争者、阻碍升迁的上司、生活中不好对付的邻居、争吵中的伴侣、互不相容的婆媳……

比方乘公交车,大家都排队上车很快,但如果有人插队有人乱挤,那么按规矩排队的人反而上不了车,所以大家只好都乱挤,反而对每个人来说都还不如排队。

囚徒困境思考:当我们在生活中面临“囚徒困境〞时候,该做出什么决定?

我们的思维惯式总是零和博弈,那么,一个人赢,就意味着另一个输。好似下棋,白棋赢的话黑棋就输。然而,生活中的大多数情况都是非零和的。

很多时候,没有赢,也没有输。我们自己决定了对待输赢的态度。

重复囚徒困境重复的囚徒困境:美国密西根大学一位叫做罗伯特·爱克斯罗德的人是一个政治科学家,他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境〞案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境〞的游戏。他们每个人都要在合作与背叛之间做出选择。关键问题在于,他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境〞。

“重复的囚徒困境〞更逼真地反映了具有经常而长期性的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,那么背叛显然就是唯一理性的选择。但如果两个程序已经交手过屡次,那么双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过屡次的交手树立了或好或差的声誉。虽然如此,对方的程序下一步将会如何举动却仍然极难确定。重复囚徒困境重复囚徒困境当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后,从利己的角度来判断,最终“贪婪〞策略趋向于减少,而比较“利他〞策略更多地被采用。他用这个博弈来说明,通过自然选择,一种利他行为的机制可能从最初纯粹的自私机制进化而来。

竞赛的结论是无可争议的。好人,或更确切地说,具备以下特点的人,将总会是赢家。----1.善意的;2.宽容的;3.强硬的;4.简单明了的。重复囚徒困境不要把赢作为唯一目标,也不要总是追求最好的结果,在许多类似“囚徒困境〞的博弈中,双方的关系并不是简单的“你赢我输〞的对抗关系。双方可以都做得很好,也可能都做的很糟。制胜不是靠压倒对方,而是靠引导对方采取对双方都有利的行为,即合作行为。智猪博弈假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供给的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的本钱,假设大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。

智猪博弈实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船〞(或称为搭便车)的原因很简单,等待还是要优于行动:

小猪行动等待大猪行动5144等待9-100智猪博弈智猪博弈的启示:1、占有更多资源者必须承担更多的义务2、在现实生活中,很多人都只想付出最小的代价,得到最大的回报,争着做那只坐享其成的小猪。“一个和尚挑水喝,两个和尚抬水喝,三个和尚没水喝〞说的正是这样一个道理。这三个和尚都想做“小猪〞,却不想付出劳动,不愿承担起“大猪〞的义务,最后导致每个人都无法获得利益。

“胆小鬼〞博弈胆小鬼博弈是一种极具风险的竞争博弈:在一段笔直的道理两端各有一个司机驾驶自己的汽车开足马力向对方撞去。过程中,谁害怕退让谁就被称为“胆小鬼〞,谁毫不避让最终停在路中间,谁就是英雄。显然,如果双方都停在路中央,结果将是灾难性的。但是,如果双方都避让,他们虽然都安然无恙,但都成了“胆小鬼〞。如果一个勇往直前而另一个退避让路,那么前者就会非常荣耀并享有较高的满足感。对于两个司机来说,他们都要竭力声称勇往直前来威胁对方,而希望对方受到恐吓后避让。

“胆小鬼〞博弈

如果一方退下来,而对方没有退下来,对方获得胜利,自己那么很丢面子;如果对方也退下来对方那么打个平手;如果自己没退下来,而对方退下来,自己那么胜利,对方那么失败。如果都前进,那么两伤俱败。在胆小博弈中获胜的关键在于,要让对手相信你绝对不会稍有退却。对于对手试探你的举动,你应该表示欢送。但是如果你知道对手绝对会硬干到底,那最好的策略就是当个胆小鬼。

历史上最著名的胆小鬼博弈是空城计。司马懿十万雄兵,对诸葛亮数千老弱残兵,因为统帅的胆量略逊一筹而贻笑大方。在这场比赛中司马懿输了。诸葛亮一向谨慎有加,而使出空城计,做出这样一个非常危险的决策

“胆小鬼〞博弈“胆小鬼〞博弈的启示:1、狭路相逢勇者胜。2、弱者在与强者的竞争中不一定就是失败者,要通过努力争取最大的利益,到达互利双赢。3、选择好“优势策略〞。弱者要选择最适合自己特点的“优势策略〞。上校赛局有一个上校被要求找到在N个战场〔3个以上〕里士兵的最正确分布,其条件为:每一个战场,分派较多士兵的一方会胜利;双方都不知道对方在每个战场上分派了多少的士兵;赢了较多战场的一方是最后的赢家例如:2方都为6名士兵,战场为3个的前提下,最简化的数字模型作为条件:(1,1,4)对(1,2,3)平手(1,2,3)对(2,2,2)平手

(2,2,2)胜过(1,1,4)这表示其最正确策略〔纳什均衡点〕为(2,2,2)

历史上发生过的例子:“田忌赛马〞,最重要的三个战术:集中兵力、避实击虚、争取主动。在足够多的战场,集中足够多的兵力取得胜利,是赢得竞争的正确思路。拍卖陷阱无论是战争还是市场竞争,甚至我们日常行为也都面临一个支付〔本钱——收益〕问题。理想状态是以尽可能小的本钱,换取尽可能大的收益,但是现实中的大多数选择并非这样。本钱的经济学定义:就是为了得到某种东西而必须放弃的东西。赢得竞争的一个有效策略就是增加对方的本钱,使其难以坚持,或因为得不偿失而放弃发动的愿望。“柠檬市场〞与信息博弈柠檬市场:也称次品市场,是指信息不对称的市场,即在市场中,产品的卖方对产品的质量拥有比买方更多的信息。在极端情况下,市场会止步萎缩和不存在,这就是信息经济学中的逆向选择。柠檬市场效应那么是指在信息不对称的情况下,往往好的商品遭受淘汰,而劣等品会逐渐占领市场,从而取代好的商品,导致市场中都是劣等品。要削减信息不对称,沟通是惟一的手段。在信息社会中,老实也是一种工具。因为信息不完整和信息不对称,人与人之间需要沟通对话,以取得信息。而且,因为不知道别人提供的信息是真是假,只好借着“对方是否老实〞来间接地解读对方所提供的信息。因此,“老实〞这种人性中的德性,成为了人际交往中的一种“工具〞。“交换钱包〞博弈“交换钱包〞博弈:一位教授和他的两个学生〔A、B〕玩一个游戏:教授让他的两个学生把钱包交给他,他数了数,发现其中一个装的钱数正好是另一个的两倍。教授只说明一人的钱数是另一人的2倍,但他没有告诉他们谁多谁少,然后他问他们,在这种情况下,他们是否愿意互换钱包?A的钱包B的钱包愿意不愿意20-10=1010-5=5愿意不愿意比方A钱包里装的事故10块,于是他估计要么换得5元,要么换得20元。前者损失了5元,后者多得了10元。在对等情况下,他的预期收益比损失多5元。“交换钱包〞博弈“交换钱包〞博弈:在得不到足够信息的情况下,理性并不能发挥多大作用。在获得利益时,人们愿意承担某些风险,但是在付出代价时,人们趋向于躲避风险。“酒吧问题〞有一群人,比方总共有100人,每个周末,均要决定是去一酒吧活动还是呆在家里。酒吧的容量是有限的,如果人去多了,去酒吧的人会感到不舒服,此时,他们留在家里比去酒吧更舒服。假定酒吧容量是60人,或者说座位是60个,如果某人预测去酒吧的人数超过60人,他的决定是不去,反之那么去。这100人如何做出去还是不去的决策呢?假定每个参与者或决策者面临的信息只是以前去酒吧的人数,每个参与者只能根据以前去的人数的信息归纳出策略来。没有其他信息,他们之间更没有信息交流,问题是他如何才能归纳出合理的行动策略。

“酒吧问题〞这些预测是归纳性的。

通过计算机的模型实验,得出一个有意思的结果:不同的行动者是根据自己的归纳来行动的,并且,去酒吧人数的数字没有一个固定的规律,然而,经过一段时间以后,去酒吧的平均人数很快到达60。即经过一段时间,这个系统中去与不去的人数之比是60∶40,尽管每个人不会固定地属于去酒吧或不去酒吧的人群,但这个系统的这个比例是不变的。阿瑟说,预测者自组织地形成一个生态稳定系统。酒吧问题所反映的是这样一个社会现象,我们在许多行动中,要猜测别人的行动,然而我们没有更多关于他人的信息,我们只有通过分析过去的历史来预测未来分蛋糕博弈2个人分蛋糕,每个人都想分得多,用怎样的方法分才最公平?

该问题可进一步细化成两步:

1、将蛋糕切成2份;

2、2个人该一定的顺序依次选取自己认为大的那份。

该问题的一种通常的假设:

1、分蛋糕者的偏好一致,即分得的蛋糕越大越好;

2、分蛋糕者的利益独立。

分蛋糕博弈

解法是:让其中一个人切,并让切的人最后选。原因是:由于切的人知道自己是最后一个选蛋糕的人,如果他切出的蛋糕块大小不一,那么其中最小那块必定会被留给自己;于是对切的人来说,最好的策略就是将蛋糕尽量平均地切为n块,使自己得到的那块与其他人尽可能接近。游戏规那么的制定也是一个博弈制衡的过程。其实正义和公平,就是来自博弈,可以说,规那么的制定是博弈的某种理想化均衡。制度公平所追求的是主体地位的平等和面临机遇的均等。

“一人一票〞:阿罗“不可能〞定理与选举陷阱选举的意义恐怕就在于大家根据多数原那么通过投票推举出最受我们爱戴或信赖的人。然而,通过选举能否到达这个目的呢?美国经济学家阿罗〔K.Arrow〕采用数学中的公理化方法,于1951年深入研究了这个问题,并得出在大多数情况下是否认的结论,那就是鼎鼎大名的“阿罗不可能定理〔Arrow'simpossibilitytheorem〕〞。证明了一个令人吃惊的定理——阿罗不可能定理,即不可能找到一个公平合理的选举系统。这就是说,只有更合理,没有最合理。原来世上无“公〞。“一人一票〞:阿罗“不可能〞定理与选举陷阱阿罗不可能定理:在多人博弈中,常常会发生一些奇怪的事情,并导致出人意料的结局。一方能否获胜,不仅仅取决于他的实力,更取决于实力比照造成的复杂关系。猎人博弈古代有两个猎人。那时候,狩猎是人们主要的生计来源。

假设主要的猎物只有两种:野猪和兔子。在古代,人类的狩猎手段还是比较落后,弓箭的威力也颇为有限。在这样的条件下,我们可以进一步假设,两个猎人一起去猎野猪,才能猎到一头;如果一个人单兵作战,他

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论