囚徒困境(课堂PPT)_第1页
囚徒困境(课堂PPT)_第2页
囚徒困境(课堂PPT)_第3页
囚徒困境(课堂PPT)_第4页
囚徒困境(课堂PPT)_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 经济博弈论经济博弈论 第一章第一章 导论导论21950年年7月美军第月美军第24师到师到达朝鲜大田火车站达朝鲜大田火车站 朝鲜战争于朝鲜战争于1950年年6月月25日爆发日爆发美国出兵干涉美国出兵干涉 3美侵朝战争失败后美侵朝战争失败后, 艾森豪威尔是如艾森豪威尔是如何评价那场战争何评价那场战争 ?4艾将军说艾将军说, 他们他们对朝鲜的战争是对朝鲜的战争是在错误的时间、在错误的时间、错误的地点、所错误的地点、所进行的一场错误进行的一场错误的战争的战争 5 我们来自不同的我们来自不同的地区地区, 为了一个共同为了一个共同的目标走到了一起的目标走到了一起, 我真诚地希望我真诚地希望, 我们我们在

2、今后这一段特定的在今后这一段特定的时间、特定的地点、时间、特定的地点、能进行特别真诚的合能进行特别真诚的合作作, 结成友好的朋友结成友好的朋友 6冯海荣冯海荣教育经历:教育经历:时间时间学校专业学校专业学历学历2008.092012.07西南交通大学经济管理学院西南交通大学经济管理学院 管理科学与工程管理科学与工程博士博士2005.092008.07四川师范大学数学与软件科四川师范大学数学与软件科学学院学学院 运筹学与控制论运筹学与控制论硕士硕士2001.092005.07四川师范大学数学与软件科四川师范大学数学与软件科学学院学学院 数学与应用数学数学与应用数学本科本科7联系方式:联系方式:E

3、MAIL:QQ:1047823588 TEL81.1.1 1.1.1 什么是什么是“博弈博弈”?博弈Game(游戏)围棋等棋类比赛、桥牌拱猪等扑克游戏,以及田径、球围棋等棋类比赛、桥牌拱猪等扑克游戏,以及田径、球类等各种体育比赛类等各种体育比赛 人们在一定规则下进行竞赛人们在一定规则下进行竞赛 在竞赛中,策略,或者说在竞赛中,策略,或者说计谋,有举足轻重的作用。计谋,有举足轻重的作用。 Game(游戏)9博弈起源于游戏中的策略对抗博弈起源于游戏中的策略对抗 博弈是策略起关博弈是策略起关键作用的游戏键作用的游戏10博弈,根据博弈,根据辞海辞海的解释,就是在多决策主体之的

4、解释,就是在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种对自身能力的认知,做出有利于自己的决策的一种行为。行为。博弈就是决策行为博弈就是决策行为11“石头石头-剪子剪子-布布” 游戏游戏1213游戏特点游戏特点有一定的规则,规定游戏的参加者,游戏者可以做什么,不有一定的规则,规定游戏的参加者,游戏者可以做什么,不可以做什么。可以做什么。 都有结果,如一方赢、一方输、平局等都有结果,如一方赢、一方输、平局等 策略至关重要,每一个策略至关重要,每一个游戏者所得结果的好坏,游戏者所得结果的好坏,不仅取

5、决于自身的策略不仅取决于自身的策略选择,也取决于其他参选择,也取决于其他参加者的策略选择。加者的策略选择。 14游戏特点游戏特点在游戏中,也规定了游戏参加者出招的顺序,是同时做出选在游戏中,也规定了游戏参加者出招的顺序,是同时做出选择还是先后做出选择等。择还是先后做出选择等。 151.1.2 博弈的非技术性定义博弈的非技术性定义 博弈博弈就是一些个人、对组或其它组织,面对一定的环就是一些个人、对组或其它组织,面对一定的环境条件、在一定的规则下,同时或先后,一次或多次,从境条件、在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自各自允许选择的行为或策略中

6、进行选择并加以实施,各自取得相应结果的过程。取得相应结果的过程。161.1.2 博弈的非技术性定义博弈的非技术性定义博弈论就是系统研究可以用上述方法定义的各种博弈博弈论就是系统研究可以用上述方法定义的各种博弈问题,寻求在各博弈方具有充分或者有限理性能力的问题,寻求在各博弈方具有充分或者有限理性能力的条件下,合理的策略选择和合理策略选择时博弈的结条件下,合理的策略选择和合理策略选择时博弈的结果,并分析这些结果的经济意义、效率意义的理论和果,并分析这些结果的经济意义、效率意义的理论和方法。方法。 17囚徒困境囚徒困境有2个涉嫌共同作案偷窃的嫌疑人A和B被带进警察局。假定警方对2名犯罪嫌疑人实行隔离

7、关押,隔离审讯,每个犯罪嫌疑人都无法观察到对方的选择。有2个涉嫌共同作案偷窃的嫌疑人A和B被带进警察局。假定警方对2名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到对方的选择。18警方怀疑他们作案,但并没有掌握他们作案的确凿证据,于是明确地分别告诉2名嫌疑人:对他们犯罪事实的认定及相应的量刑,完全取决于他们自己供认与否。如果一方与警方合作,坦白所做违法之事,而另一方抵赖,招认方将无罪释放,另一方则会被判重刑8年;如果双方都与警方合作共同招认,各被判刑5年;而如果双方均不认罪,因为警察找不到其他证明他们违法的证据,则判刑1年。他们面临的选择和带来的后果组合,可以用下面的表格来表示。

8、 A B 不坦白不坦白 坦白坦白不坦白不坦白A:判刑:判刑1年年B:判刑:判刑1年年A:无罪释放:无罪释放B:判刑:判刑8年年坦白坦白A:判刑:判刑8年年B:无罪释放:无罪释放A:判刑:判刑5年年B:判刑:判刑5年年19请问,请问,他们会选择什么呢?他们会选择什么呢?坦白坦白oror不坦白不坦白坦白坦白oror不坦白不坦白20从上面的表中我们可以知道:每个嫌疑人都有两种可供从上面的表中我们可以知道:每个嫌疑人都有两种可供选择的策略:选择的策略:坦白不坦白。坦白不坦白。 如果如果A选择抵赖,那么就可能会出现两种情况,如选择抵赖,那么就可能会出现两种情况,如果果B选择坦白,那么选择坦白,那么A将被

9、加重惩罚,判刑将被加重惩罚,判刑8年,而年,而B则则无罪释放;如果无罪释放;如果B也同样选择抵赖,那么他们将判刑也同样选择抵赖,那么他们将判刑1年。年。 但是,因为警方没有把两名嫌疑人放在一间囚房里,但是,因为警方没有把两名嫌疑人放在一间囚房里,彼此不知道对方的想法,也无法串供,因而这种合作难彼此不知道对方的想法,也无法串供,因而这种合作难以顺利进行,使得选择合作的风险性大大增加。以顺利进行,使得选择合作的风险性大大增加。21实际上,如果两人都抵赖,会无罪释放,显然这个实际上,如果两人都抵赖,会无罪释放,显然这个结果是最好的。但人的理性算计排除了这一结果。结果是最好的。但人的理性算计排除了这一

10、结果。每个人从自己收益最大化的角度出发来考虑问题,每个人从自己收益最大化的角度出发来考虑问题,最终往往落得两败俱伤的结果。最终往往落得两败俱伤的结果。 因此,基于人是理性的这一前提,无论同伙是否坦白,因此,基于人是理性的这一前提,无论同伙是否坦白,自己坦白总是比不坦白好。两个人这样一算计,最好的自己坦白总是比不坦白好。两个人这样一算计,最好的结果都是选择坦白,各判刑结果都是选择坦白,各判刑5年。年。22这个结果具有必然性,很难摆脱,因此这个博弈被称为这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒的困境囚徒的困境”。 每个人从自己收益每个人从自己收益最大化出发来考虑最大化出发来考虑问题,

11、最终往往落问题,最终往往落得两败俱伤的结果。得两败俱伤的结果。个人的理性算计,个人的理性算计,往往导致集体的非往往导致集体的非理性结局。理性结局。囚徒的困境对社会利益来说是非常理想的结果,因囚徒的困境对社会利益来说是非常理想的结果,因为罪犯受到了应有的惩罚为罪犯受到了应有的惩罚 23(坦白,坦白坦白,坦白)是囚徒困境的纳什均衡。是囚徒困境的纳什均衡。纳什均衡是什么呢?纳什均衡是什么呢?24假设有假设有n人参与博弈,每个人选择自己的最人参与博弈,每个人选择自己的最优战略,所有参与人选择的战略构成一个战优战略,所有参与人选择的战略构成一个战略组合。略组合。纳什均衡是这样一个战略组合,这种战略纳什均

12、衡是这样一个战略组合,这种战略组合由所有参与人的最优战略组成,也就组合由所有参与人的最优战略组成,也就是说,是说,给定别人战略的情况下,没有给定别人战略的情况下,没有任何单个参与人有积极性选择其他策任何单个参与人有积极性选择其他策略,从而没有任何人有积极性打破这略,从而没有任何人有积极性打破这种均衡种均衡25纳什均衡是一种“僵局僵局”,给定别人不动的情况下,没有人有兴趣动26这个故事最早是这个故事最早是1950年,数学家塔克任斯坦福大年,数学家塔克任斯坦福大学客座教授给心理学家作讲演时提出的。时至今学客座教授给心理学家作讲演时提出的。时至今日,这个故事广为流传,在哲学、伦理学、政治日,这个故事

13、广为流传,在哲学、伦理学、政治学、经济学等学科中获得了极为广泛的应用。学、经济学等学科中获得了极为广泛的应用。 27rtgrQ囚徒困境的应用囚徒困境的应用 在荷兰召开了一次在荷兰召开了一次“合作及社会两难困境研讨会合作及社会两难困境研讨会”,与会者都是博弈论的专家。当大会结束后,有两个学者,与会者都是博弈论的专家。当大会结束后,有两个学者,麦息克和路特提议大家玩一个游戏。麦息克和路特提议大家玩一个游戏。 他们将一个大信封拿出来,请在场的他们将一个大信封拿出来,请在场的43位学者专家拿位学者专家拿出金钱装到这个信封里。如果到最后这个信封里的钱超过出金钱装到这个信封里。如果到最后这个信封里的钱超过

14、250元,麦息克和路特将自己掏腰包,退还每人元,麦息克和路特将自己掏腰包,退还每人10元。不元。不过,如果信封内的钱不足过,如果信封内的钱不足250元,就统统没收,大家拿不元,就统统没收,大家拿不到半毛钱。到半毛钱。28请问,你会出多少钱呢?请问,你会出多少钱呢?29 每个人应该要放入的数目:每个人应该要放入的数目:250/43=5.81。 如果每人放进去如果每人放进去7元钱,应该就可以超过目标元钱,应该就可以超过目标250元了。等到最后退还元了。等到最后退还10元钱时,每人都还可以净赚元钱时,每人都还可以净赚3元元呢。呢。30不过,这游戏特别要求大家不准讨论,也不能偷看别人不过,这游戏特别要

15、求大家不准讨论,也不能偷看别人把多少钱放进信封里。把多少钱放进信封里。最后,等到大信封传回来的时候,两位主持人打开最后,等到大信封传回来的时候,两位主持人打开一数,里面的钱总共是一数,里面的钱总共是245.59元,离目标元,离目标250元就差元就差那么一点点。那么一点点。31 看到这种结果,这些学者们群情哗然,一副不看到这种结果,这些学者们群情哗然,一副不敢相信的样子。这种事情怎么可能发生?他们统统敢相信的样子。这种事情怎么可能发生?他们统统都是德高望重的学者,而且才刚刚结束了两天的都是德高望重的学者,而且才刚刚结束了两天的“合作研讨会合作研讨会”啊!他们的合作结果居然比目标还啊!他们的合作结

16、果居然比目标还少了近少了近5元钱,这下子,大家统统拿不回来半毛钱了。元钱,这下子,大家统统拿不回来半毛钱了。32有些人抱怨只要再多一个有良心的人放进去有些人抱怨只要再多一个有良心的人放进去7块钱就好了;块钱就好了;有些人后悔自己应该再多放一点点的;有些人后悔自己应该再多放一点点的;更有一些人说:更有一些人说:“早知道这早知道这样,我宁可那时候放十几块样,我宁可那时候放十几块钱,最后让每个人有钱赚,钱,最后让每个人有钱赚,让主持人付账。让主持人付账。” 33但问题是:事先根本不可能有人真的奉献超过但问题是:事先根本不可能有人真的奉献超过10元,因元,因为我们都预期别人会拿出他们所该奉献的那部分。

17、为我们都预期别人会拿出他们所该奉献的那部分。如果真是那样,那么我就没有必要比别人多出一点,如果真是那样,那么我就没有必要比别人多出一点,反正拿出来的部分就是浪费。反正拿出来的部分就是浪费。另一方面,如果我一另一方面,如果我一个人少付一点点,最个人少付一点点,最后也会超过目标嘛,后也会超过目标嘛,让自己多赚一点点大让自己多赚一点点大概没啥关系吧。概没啥关系吧。34如果每人都付如果每人都付7元,而你不付钱,你可以不冒风险就元,而你不付钱,你可以不冒风险就白白赚白白赚10元元如果别人没有付足够的钱,你也没付,最坏的如果别人没有付足够的钱,你也没付,最坏的情况只是赚不到钱,你并没有损失什么。情况只是赚

18、不到钱,你并没有损失什么。因此你的优势策略因此你的优势策略就是:根本不要放就是:根本不要放进去半毛钱。进去半毛钱。35每个人都基于这样想法的话,最后的结果总是令每个人都基于这样想法的话,最后的结果总是令人失望的。造成这种结果同样是因为每个人都预人失望的。造成这种结果同样是因为每个人都预期别人会拿出他们的本该奉献的部分,而自己又期别人会拿出他们的本该奉献的部分,而自己又想尽可能地多想尽可能地多“捞捞”一点,因此才会产生每个人一点,因此才会产生每个人都那不回钱的结果。都那不回钱的结果。362.1.3 划线法划线法 求纳什均衡求纳什均衡1, 01, 30, 10, 40, 22, 0-5, -50,

19、 -8-8, 0-1, -1囚囚徒徒困困境境-1, 11, -11, -1-1, 1猜猜硬硬币币2, 10, 00, 01, 3夫夫妻妻之之争争372.2.1 纳什均衡的定义纳什均衡的定义v策略空间:策略空间:v博弈方博弈方 的第的第 个策略:个策略:v博弈方博弈方 的得益:的得益:v博弈:博弈:纳什均衡纳什均衡:在博弈:在博弈 中,如果由各个博弈中,如果由各个博弈方的各一个策略组成的某个策略组合方的各一个策略组成的某个策略组合 中,任一博弈中,任一博弈方方 的策略,都是对其余博弈方策略的组合的策略,都是对其余博弈方策略的组合 的最佳对策,也即的最佳对策,也即 对任意对任意 都成立,则称都成立,则称 为为 的一个纳什均衡的一个纳什均衡nSS ,1ijiSsiu,;,11nnuuSSG,;,11nnuuSSG),(*niss i),.,(*1*1*niiissss),.,(),.,(*1*1*1*1*n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论