




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
囚徒困境纵深谈1.囚徒的困境(利益是什么?理性悖论等)2-5,-50,-8-8,0-1,-1坦
白不坦白坦
白不坦白两个罪犯的得益矩阵囚徒2囚徒1囚徒1:坦白囚徒2:坦白不谈囚徒困境就无法谈博弈论囚徒困境的本质个体理性与集体理性之间存在冲突合作优于不合作合作不具有约束性100,10020,150150,2070,70高
价低
价高
价低
价寡头2寡头1双寡头的得益矩阵政府组织协调的必要性和重要性寡头1:低价(70)寡头2:低价(70)双寡头削价竞争博弈不讲诚信讲诚信不讲诚信0,05,-5讲诚信-5,53,3一次博弈时的策略选择重复博弈中的策略选择博弈诚信(trust)博弈博弈方2博弈方1不讲诚信讲诚信不讲诚信0,0-5,5讲诚信5,-53,3第三方强制(法律)信誉机制如何让人们讲诚信?博弈方2博弈方1联横合纵联横1,-10,0合纵0,0-1,1弱者的智慧齐国秦国合纵就是弱国联合起来阻止强国进行兼并,苏秦;联横就是强国迫使弱国帮助它进行兼并,张仪。安内攘外安内1,12,-1攘外-1,21,1弱者的智慧-抗战中的国共两党共产党国民党两个均衡点,不确定;共同选择攘外是不可能的,蒋介石没有学博弈论;张学良民族罪人。合作不合作合作2,22,-1不合作-1,2-1,-1弱者的智慧-李斯与赵高赵高李斯合作是李斯与赵高严格最优策略;赵高是怎样说服李斯的?乙修不修甲修1,1-1,3不修3,-10,0修路博弈为什么是政府与富人负责修路建公共设施,因为私人没有积极性?比如修要4个成本,收益3个,个人修-1收益,合修3-2=1个得益。最后都不修。交通博弈司机2缓行抢行司机1缓行8,81,9抢行9,12,2(-3,-3)蜀蜀吴(3,3)(-1,1)合作不合作(1,-1)合作不合作不合作合作三国博弈在荷兰召开了一次“合作及社会两难困境研讨会”,与会者都是博弈论的专家。当大会结束后,有两个学者,麦息克和路特提议大家玩一个游戏。他们将一个大信封拿出来,请在场的43位学者专家拿出金钱装到这个信封里。如果到最后这个信封里的钱超过250元,麦息克和路特将自己掏腰包,退还每人10元。不过,如果信封内的钱不足250元,就统统没收,大家拿不到半毛钱。请问,你会出多少钱呢?[1]请问,你会出多少钱呢?[2]每个人应该要放入的数目:250/43=5.81。如果每人放进去7元钱,应该就可以超过目标250元了。等到最后退还10元钱时,每人都还可以净赚3元呢。不过,这游戏特别要求大家不准讨论,也不能偷看别人把多少钱放进信封里。最后,等到大信封传回来的时候,两位主持人打开一数,里面的钱总共是245.59元,离目标250元就差那么一点点。请问,你会出多少钱呢?[3]看到这种结果,这些学者们群情哗然,一副不敢相信的样子。这种事情怎么可能发生?他们统统都是德高望重的学者,而且才刚刚结束了两天的“合作研讨会”啊!他们的合作结果居然比目标还少了近5元钱,这下子,大家统统拿不回来半毛钱了。请问,你会出多少钱呢?[4]有些人抱怨只要再多一个有良心的人放进去7块钱就好了;有些人后悔自己应该再多放一点点的;更有一些人说:“早知道这样,我宁可那时候放十几块钱,最后让每个人有钱赚,让主持人付账。”请问,你会出多少钱呢?[5]但问题是:事先根本不可能有人真的奉献超过10元,因为我们都预期别人会拿出他们所该奉献的那部分。如果真是那样,那么我就没有必要比别人多出一点,反正拿出来的部分就是浪费。另一方面,如果我一个人少付一点点,最后也会超过目标嘛,让自己多赚一点点大概没啥关系吧。请问,你会出多少钱呢?[6]如果每人都付7元,而你不付钱,你可以不冒风险就白白赚10元如果别人没有付足够的钱,你也没付,最坏的情况只是赚不到钱,你并没有损失什么。因此你的优势策略就是:根本不要放进去半毛钱。请问,你会出多少钱呢?[7]每个人都基于这样想法的话,最后的结果总是令人失望的。造成这种结果同样是因为每个人都预期别人会拿出他们的本该奉献的部分,而自己又想尽可能地多“捞”一点,因此才会产生每个人都那不回钱的结果。请问,你会出多少钱呢?[8]囚徒困境的破解不合作合作许诺奖励惩罚可信性启示1:在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。独立于对方所用策略之外的最好决策规则是不存在的。启示2:“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。在这些情形中,从个人的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果出现。囚徒困境博弈分析
任何一人单方面改变选择,他只会得到较差的结果。这一点就是纳什均衡(NashEquilibrium)。在博弈达到纳什均衡时,博弈不是最好,而是僵局,谁也不愿意改变,谁改变谁吃亏。纳什均衡的思想
如何走出“囚徒困境
”—合作是否成为可能促进双方合作可以从三个方面着手:使得未来相对于现在更重要些-重复博弈;改变对策者的四个可能的结果的收益值;教给对策者那些促进合作的准则、事实和技能。走出囚徒困境的三大途径
地摊、车站、旅游点,不但商品和服务质量最差,而且假货横行,因为在商家和顾客之间“没有明天”——一个旅客不大可能因为你的饭菜可口而再次光临,一锤子买卖,不赚白不赚。未来是否重要?-一次博弈与重复博弈
在公共汽车上,两个陌生人会为一个坐位争吵,可如果他们认识,就会相互谦让。为什么?在相互社会联系紧密的人际关系中,人们普遍比较注意礼节、道德
。
未来是否重要?-一次博弈与重复博弈
两个原始人见面,一个拿着兽皮,一个拿着野果,他们都想把对方的东西据为己有。如果他们的见面是偶然的,结果会如何?如果他们都知道对方生活在附近又会如何?偶然见面,可能相互抢劫;生活在附近,选择合作,以物易物,交易就这样产生了,所有权就这样产生了;——从消极的层面看,我们互不侵犯,是为了避免没完没了、两败俱伤的循环报应。
道德、法律、权力利益的划分,都与“还要见面”有关。
未来是否重要?
相邻的人互相敌对,只会两败俱伤。如巴以、印巴、两伊以及伊拉克和科威特。希腊和土耳其也曾经是这样的世仇,现在关系虽已缓和,但是它们之间的不信任感还是长久不能消除。未来是否重要?
中苏交恶的年代,双方都在边境地区陈兵百万,巨大的军费开支和潜在的战争风险对两国都是重负。现在两国关系改善,互信增加,边境军事力量大大减弱,可以说是一个双赢。从这个意义上说,“面向未来”不仅仅是一句外交辞令。未来是否重要?
1858年至1915年,沙俄通过一系列不平等条约割去中国领土150多万平方公里,并违约侵占了数万平方公里的中国领土。增大未来影响的另一方法是使接触更加频繁。在下一步接触很快就会发生的情况下,这一次合作通常更为重要。经常接触有助于促进稳定的合作。在商业上,专业化公司趋向于限制在与少数几个公司接触以便使这种接触更加频繁。增大未来的影响——走出“囚徒困境”
智能手机三大巨头在小城镇比在大城市容易出现合作便是因为人与人的接触更频繁。
接触更频繁也是婚姻比恋爱相对来说更稳定的原因之一。婚礼就是一个用来庆祝和促进持续关系的公共行为,对婚姻的稳定有促进作用。
增大未来的影响——走出“囚徒困境”
增大未来的影响——走出“囚徒困境”
分解(问题分解成若干的部分)是促进稳定的合作的一种有效方法。因为分解会增加接触的频率。比如,将军备控制和裁军条约分解成许多阶段,这样就允许双方有更多让步的机遇而不只是一两个让步。这样可以使回报更有效。增大未来的影响——走出“囚徒困境”
如果双方都知道对方的一步不合作的策略可以通过下一步的回报来补偿,那么双方对整个过程可以按所期望的进行就更有信心。而且,如果双方对自己识别欺骗的能力缺乏信心,那么,有许多小的步骤比只有少数大的步骤更有助于促进合作。增大未来的影响——走出“囚徒困境”
在商业上,商人们喜欢一个大订单分别按每次发货时间付款,而不愿等到最后付总账。使得当前步骤的背叛相对于整个未来的接触过程来说不是那么有诱惑力,这是促进合作的好方法。增大未来的影响——走出“囚徒困境”
决定合作与否其实取决于一次博弈还是多次博弈.在博弈理论中,博弈专家已经用数学证明出,在无限次重复博弈的情况下,合作可能是稳固的。如果博弈无穷次,双方就会逐渐从互相背叛走向互相合作。因为任何一次背叛都会招致对方在下一次博弈时的报复;而双方都取合作态度会带来合作收益增大未来的影响——走出“囚徒困境”
决定合作与否其实取决于一次博弈还是多次博弈.但是在现实社会生活中又不完全这样,人总是要死的,因而人与人之间的博弈不是无限次的。当一个人知道他终将退出博弈时,他就可能不再害怕此后别人对他的报复,从而可以在博弈结束前做损害他人的事情,这就回复到有限次重复博弈的境况。决定合作与否其实取决于一次博弈还是多次博弈.为什么恋爱中的男人小气?因为相爱的过程中任何一个时点都是有可能分手的。用博弈论的术语来说,这是一种囚徒困境的重复博弈。素不相识一对男女的一夜情是一次性囚徒困境博弈。
改变对策者的四个可能的结果的收益值决定合作与否其实取决于一次博弈还是多次博弈.生活中多人博弈的现象比两人博弈更为普遍。在多人博弈中,只有其它所有参与者在第k-1次博弈中都是合作的,某个参与者才会在第k次博弈中采取合作策略。增大未来的影响——走出“囚徒困境”
然而,这一策略会带来一个协调问题,任何人的一个小小失误都会导致采取背叛策略的其他参与者的数量如同滚雪球一样地愈演愈烈,最终导致所有人的背叛。更糟糕的是,一旦出现这种情况,没有任何人会主动开始合作。因此,我们可以这么说,多人重复囚徒困境(无论有限或无限)中稳定的合作几乎是不可能的。增大未来的影响——走出“囚徒困境”
某城市政府采购办公用品,每年招标,只挑选两个供应商。政府每个月采购一次,两个供应商每个月就当月采购商品报价。实行“价低者得”原则,如两供应商报价相同,则订单分为均等的两半,两供应商各得50%。如报价不同,则全部订单给价低者。这两个供应商应如何报价?供应商合作还是背叛?[1]两供应商相互合作,共同报一相同高价,获取最大利润,自是双方的最优策略。两供应商共同合作了11个月,但在第12个月,两供应商知道这是今年最后一次,对方很有可能背叛。与其对方背叛,不如自己背叛。两供应商知道第12次对方会背叛,那么第11次不如我就背叛,因为第11次采用合作的态度并不会促使对方在第12次时合作。同理,第10次、第9次……第1次,每一次都应该背叛。因此双方不可能合作共同报高价,而是相互竞争地报低价。供应商合作还是背叛?[2](100,100)(2,2)R(1,1)1D1(0,3)2rdDR(98,98)1D(97,100)2rd(99,99)1D(98,101)2rd蜈蚣博弈RR蜈蚣博弈问题如何利用“囚徒困境”如果没有外部强制力,这时囚徒困境中两个参与者采取什么样的策略才可以更好的维持合作的稳定性呢?如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略(Triggerstrategy),或称冷酷策略。如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。触发策略针锋相对(tit-for-tat)策略:以牙还牙《圣经·旧约》:以眼还眼、以牙还牙
我们对待自己的恋人/爱人是否可以用“以牙还牙”的策略?触发策略好的策略必须具有的一个特点是“清晰性”,能让对方在三、五步对局内辨识出来,太复杂的对策不见得好。针锋相对策略就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。针锋相对策略的优越性向我们充分展示了一个纯粹自利的人何以会选择善,只因为合作是自我利益最大化的一种必要手段。善意而不是恶意地对待恋人;宽容而不是尖刻地对待恋人,关键是能够彼此宽容
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025成都租房合同简化版
- 2025私人借款担保协议合同
- 2025试用期劳动合同协议书
- 2025保险合同权益转让协议(转让)
- 2025养殖场租赁合同范本
- 2025混凝土浇筑工程合同
- 2025春季学期国家开放大学专科《高等数学基础》一平台在线形考(形考任务一至四)试题及答案
- 2025室内设计合作合同范本
- 2025二手车买卖合同二手车买卖合同范本
- 2025网络设备采购合同(标准范本)
- 国开《国家开放大学学习指南》学习网形考参考答案
- 耳鼻喉科技术操作规范
- 航道整治试卷A
- 腹腔镜胃癌根治术护理教学查房
- DB23T 2334-2019 装配式混凝土渠道应用技术规范
- 幼儿园优质公开课:中班科学《奇妙的紫甘蓝汁》课件
- 中职资料:第1讲 社会主义在中国的确立与探索+课件
- 诺如病毒感染诊断和治疗
- 卡压不锈钢管的施工组织方案
- 2022山东大学出版社校园招聘16人上岸笔试历年难、易错点考题附带参考答案与详解
- 10kV环网柜技术规范书
评论
0/150
提交评论