囚徒困境1课件

上传人：嘻*** IP属地：境外上传时间：2022-10-09 格式：PPT 页数：42 大小：1.91MB 积分：30 举报 版权申诉

已阅读5页，还剩37页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、经济博弈论第一章导论1950年7月美军第24师到达朝鲜大田火车站朝鲜战争于1950年6月25日爆发美国出兵干涉美侵朝战争失败后, 艾森豪威尔是如何评价那场战争 ?艾将军说, 他们对朝鲜的战争是在错误的时间、错误的地点、所进行的一场错误的战争我们来自不同的地区, 为了一个共同的目标走到了一起, 我真诚地希望, 我们在今后这一段特定的时间、特定的地点、能进行特别真诚的合作, 结成友好的朋友联系方式：EMAIL:hrfeng82QQ:1047823588 TEL1.1.1 什么是“博弈”？博弈Game(游戏)围棋等棋类比赛、桥牌拱猪等扑克游戏，以及田径、球类等

2、各种体育比赛人们在一定规则下进行竞赛在竞赛中，策略，或者说计谋，有举足轻重的作用。 Game(游戏)博弈，根据辞海的解释，就是在多决策主体之间行为具有相互作用时，各主体根据所掌握信息及对自身能力的认知，做出有利于自己的决策的一种行为。博弈就是决策行为“石头-剪子-布” 游戏游戏特点在游戏中，也规定了游戏参加者出招的顺序，是同时做出选择还是先后做出选择等。 1.1.2 博弈的非技术性定义博弈就是一些个人、对组或其它组织，面对一定的环境条件、在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。囚徒困境有2个涉嫌共同作案偷窃的嫌疑人A

3、和B被带进警察局。假定警方对2名犯罪嫌疑人实行隔离关押，隔离审讯，每个犯罪嫌疑人都无法观察到对方的选择。有2个涉嫌共同作案偷窃的嫌疑人A和B被带进警察局。假定警方对2名犯罪嫌疑人实行隔离关押，隔离审讯，每个犯罪嫌疑人都无法观察到对方的选择。警方怀疑他们作案，但并没有掌握他们作案的确凿证据，于是明确地分别告诉2名嫌疑人：对他们犯罪事实的认定及相应的量刑，完全取决于他们自己供认与否。如果一方与警方合作，坦白所做违法之事，而另一方抵赖，招认方将无罪释放，另一方则会被判重刑8年；如果双方都与警方合作共同招认，各被判刑5年；而如果双方均不认罪，因为警察找不到其他证明他们违法的证据，则判刑1年。他们面临的

4、选择和带来的后果组合，可以用下面的表格来表示。 A B 不坦白坦白不坦白A：判刑1年B：判刑1年A：无罪释放B：判刑8年坦白A：判刑8年B：无罪释放A：判刑5年B：判刑5年请问，他们会选择什么呢？坦白or不坦白坦白or不坦白从上面的表中我们可以知道：每个嫌疑人都有两种可供选择的策略：坦白不坦白。如果A选择抵赖，那么就可能会出现两种情况，如果B选择坦白，那么A将被加重惩罚，判刑8年，而B则无罪释放；如果B也同样选择抵赖，那么他们将判刑1年。但是，因为警方没有把两名嫌疑人放在一间囚房里，彼此不知道对方的想法，也无法串供，因而这种合作难以顺利进行，使得选择合作的风险性大大增加。实际上，如果两人

5、都抵赖，会无罪释放，显然这个结果是最好的。但人的理性算计排除了这一结果。每个人从自己收益最大化的角度出发来考虑问题，最终往往落得两败俱伤的结果。因此，基于人是理性的这一前提，无论同伙是否坦白，自己坦白总是比不坦白好。两个人这样一算计，最好的结果都是选择坦白，各判刑5年。这个结果具有必然性，很难摆脱，因此这个博弈被称为“囚徒的困境”。每个人从自己收益最大化出发来考虑问题，最终往往落得两败俱伤的结果。个人的理性算计，往往导致集体的非理性结局。囚徒的困境对社会利益来说是非常理想的结果，因为罪犯受到了应有的惩罚假设有n人参与博弈，每个人选择自己的最优战略，所有参与人选择的战略构成一个战略组合。纳

6、什均衡是这样一个战略组合，这种战略组合由所有参与人的最优战略组成，也就是说，给定别人战略的情况下，没有任何单个参与人有积极性选择其他策略，从而没有任何人有积极性打破这种均衡纳什均衡是一种“僵局”，给定别人不动的情况下，没有人有兴趣动rtgrQ囚徒困境的应用在荷兰召开了一次“合作及社会两难困境研讨会”，与会者都是博弈论的专家。当大会结束后，有两个学者，麦息克和路特提议大家玩一个游戏。他们将一个大信封拿出来，请在场的43位学者专家拿出金钱装到这个信封里。如果到最后这个信封里的钱超过250元，麦息克和路特将自己掏腰包，退还每人10元。不过，如果信封内的钱不足250元，就统统没收，大家拿不到半毛钱

7、。请问，你会出多少钱呢？每个人应该要放入的数目：250/43=5.81。如果每人放进去7元钱，应该就可以超过目标250元了。等到最后退还10元钱时，每人都还可以净赚3元呢。不过，这游戏特别要求大家不准讨论，也不能偷看别人把多少钱放进信封里。最后，等到大信封传回来的时候，两位主持人打开一数，里面的钱总共是245.59元，离目标250元就差那么一点点。看到这种结果，这些学者们群情哗然，一副不敢相信的样子。这种事情怎么可能发生？他们统统都是德高望重的学者，而且才刚刚结束了两天的“合作研讨会”啊！他们的合作结果居然比目标还少了近5元钱，这下子，大家统统拿不回来半毛钱了。有些人抱怨只要再多一个有良

8、心的人放进去7块钱就好了；有些人后悔自己应该再多放一点点的；更有一些人说：“早知道这样，我宁可那时候放十几块钱，最后让每个人有钱赚，让主持人付账。” 但问题是：事先根本不可能有人真的奉献超过10元，因为我们都预期别人会拿出他们所该奉献的那部分。如果真是那样，那么我就没有必要比别人多出一点，反正拿出来的部分就是浪费。另一方面，如果我一个人少付一点点，最后也会超过目标嘛，让自己多赚一点点大概没啥关系吧。如果每人都付7元，而你不付钱，你可以不冒风险就白白赚10元如果别人没有付足够的钱，你也没付，最坏的情况只是赚不到钱，你并没有损失什么。因此你的优势策略就是：根本不要放进去半毛钱。每个人都基于这样想法

9、的话，最后的结果总是令人失望的。造成这种结果同样是因为每个人都预期别人会拿出他们的本该奉献的部分，而自己又想尽可能地多“捞”一点，因此才会产生每个人都那不回钱的结果。2.1.3 划线法求纳什均衡1， 01， 30， 10， 40， 22， 0-5， -50， -8-8， 0-1， -1囚徒困境-1， 11， -11， -1-1， 1猜硬币2， 10， 00， 01， 3夫妻之争2.2.1 纳什均衡的定义策略空间：博弈方的第个策略：博弈方的得益：博弈：纳什均衡：在博弈中，如果由各个博弈方的各一个策略组成的某个策略组合中，任一博弈方的策略，都是对其余博弈方策略的组合的最佳对策，也即对任意都成立，则称为的一个纳什均衡2.3 无限策略分析和反应函数2.3.1 古诺的寡头模型2.3.2 反应函数2.3.3 伯特兰德寡头模型2.3.4 公共资源问题2.3.5 反应函数的问题和局限性寡头产量竞争以两厂商产量竞争为例222126qqqq-=古诺的寡头模型4.5，4.55，3.753.75，54，4不突破突破厂商2不突破突破厂商

人人文库> 全部分类> 行业资料 > 医学制药

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

囚徒困境1课件

文档简介

温馨提示

最新文档

评论

囚徒困境1课件

文档简介

温馨提示

最新文档

评论

相关文档