版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、博弈论、博弈论的应用,第十二节,博弈论又叫对策论,这是近年来发展非常快,的经济理论领域之一,在历年考研试题中,,该部分内容是必考题,一般以判断题、选,择题形式出现,而从目前的形势看,随着,博弈论在经济学中地位越来越重要,研究,越来越充分,主观大题目将是上财经济学,考研中的一个出题方向。,本节总结的考点有以下十点:,?,1,纳什均衡,?,2,最优反应曲线,?,3,纯策略与混合策略,?,4,囚徒困境,?,5,重复博弈,?,6,序惯博弈,?,7,合作博弈,?,8,竞争博弈,?,9,、共存博弈,?,10,承诺博弈,1,(上财,弈中,当一个参与人有占优,07,年判断题)在一个二人博,(,有一个纯策略纳什
2、均衡。(,dominate,)策略时,该博弈一定,),分析:在一个二人博弈中,当一个,参与人有占优(,dominate,)策略时,,该博弈有一个纯策略纳什均衡。因,为一个参与人有占有策略,那么不,管另一个参与人选择什么,这个参,与人都会选择某个策略,当这个参,与人的选择了最好策略后,另一个,参与人的策略也就出来了。如下表,,在这个二人博弈中,参与人,略是“上”占优于“下”,对,A,的策,说,不管,当,A,选择了上之后,,B,选择什么,,A,来,B,就会选择右。,A,都会选择上;,而且我们可以看出,(上,右)是,纯策略纳什均衡。,参与人,B,左,右,参与人,A,上,2,,,1,3,,,5,下,1
3、,,,4,2,,,3,2,(判断题)一个对策若出现两败俱伤的结局,说明该对策是一个非合,作的零和对策。(,),解析,零和博弈:在这类博弈中,博弈一方的收益等于另一方的损失,且,每一个方格中的总收益为零,这就显示了参与人的得分完全相反。,如表,1,中的“足球赛中的罚点球得分”博弈。,零和博弈既然要求博弈的参与者任一次行为策略的得益之和为,0,,,即“一方之所得即为另一方之所失”,那么在本题中,在两败俱伤,的局面下,该博弈肯定不是一个零和对策。,表,1,足球赛中的罚点球得分,扑向左,方,扑向右,方,列参与人,扑向左,方,50,,,50,90,,,90,扑向右,方,80,,,80,20,,,20,行
4、参,与人,3,(判断题)纳什均衡就是指不管在什么情况下,博弈的,局中人都不再改变自己策略时的状态。,(,),分析:在这里要注意区别纳什均衡和占优策略均衡。,占优策略均衡就是指博弈中一个参与人的最优策略不依赖于,其他人的策略选择,不论其他人选择什么策略,他的最优,策略是唯一的。占优策略均衡是稳定的,也就是说不管在,什么情况下,拥有占优策略均衡的参与者一定不会改变自,己的策略。,纳什均衡指的是如果其他参与人不改变自己的策略,任何一,个参与人都不会改变自己策略的均衡状态。前提条件是其,他参与人不改变策略。但如果其他参与人一旦改变策略,,那么纳什均衡也有可能随之而改变,当然也有可能不会改,变。换句话就
5、是说,纳什均衡是指这样一种策略组合,在,给定别人策略选择的情况下,没有任何单个参与人有积极,性选择其他策略。此时的纳什均衡并一定是稳定的。即纳,什均衡的存在并不一定表示纳什均衡的稳定性。比如性别,战就有两个不稳定的纯纳什均衡解。,4,(判断题)纳什定理告诉我们纳什均衡解,存在且稳定。(,),分析:纳什定理即指纳什均衡存在性定理,,指如果一个对策的参与人是有限的,并且,每个参与人只有有限的策略,则该对策至,少存在一个纳什均衡。但该定理没有指出,解是否唯一,一个对策可能存在多个纳什,均衡;也没有指出解是否稳定。而且,很,多情况下,纳什均衡解都是不稳定的。如,性别战中的均衡解就是两个不稳定的纯纳,什
6、均衡解。,5,(上财,07,年选择题)下列博弈,中的混合策略均衡是(,)。,A,1,采取,A,的概率是,3/7,,采取,B,的,概率是,4/7,;,2,采取,U,的概率是,3/7,,采取,D,的概率是,4/7,B,1,采取,A,的概率是,4/7,,采取,B,的,概率是,3/7,;,2,采取,U,的概率是,4/7,,采取,D,的概率是,3/7,C,1,采取,A,的概率是,4/7,,采取,B,的,概率是,3/7,;,2,采取,U,的概率是,3/7,,采取,D,的概率是,4/7,D,1,采取,A,的概率是,1/2,,采取,B,的,概率是,1/2,;,2,采取,U,的概率是,1/2,,采取,D,的概率
7、是,1/2,2,U,D,A,8,,,3,0,,,0,1,B,0,,,0,6,,,4,【,分析,】,首先要明确什么是混合策略均衡,参与人选择混,合策略就是选择一个概率分布,然后按照这个分,布给出的概率来选择各个纯策略。混合策略是用,概率分布,x,来表示的,混合策略的变化完全反映为,概率分布,x,的变化。,在本题中,设,1,选,A,概率为,p,,,2,选,U,概率为,q,,则,根据,1,选,A,,,B,无差异,,2,选,U,,,D,无差异,列出等,式,对,1,来说,8,q+0,(1-q)=0,q+6,(1-q),对,2,来说,3,p+0,(1-p)=0,p+4,(1-p),解出,则得,p=4/7,
8、,,q=3/7,,所以选,C,。,6,某对策中甲乙双方各有三个策略,其相应的支付矩阵如下图所示:,问:,(,1,)甲会不会采用策略,A,,为什么?,(,2,)请剔除上述支付矩阵里的占劣策略。,(,3,)在被简化了的对策里,有没有均衡?均衡是什么?它是不是原对策,的均衡?试说明。,乙,D,E,F,A,3,,,7,3,,,5,1,,,2,甲,B,4,,,2,2,,,7,6,,,4,C,3,,,7,4,,,8,2,,,5,解析:,(,1,)在这里要先理解什么是占劣策略。如果一个策略的每一种结果都比另一个策略,的每一种结果差,那么该策略就叫做占劣策略。在本题中,很明显,策略,A,是甲的占劣,策略。因为
9、无论乙选择什么策略,甲选择,C,策略的收益都会大于选择,A,策略的收益。所,以甲始终不会选择,A,策略。,(,2,)如图所示,对于甲来说,,A,是,C,的占劣策略,所以我们先剔除,A,,即在甲的,A,策略上划,一条线以示剔除。在剩下的支付矩阵中我们又发现乙的策略,D,和,F,均劣于策略,E,,所以,D,和,F,是乙的占劣策略。我们进而划线把这两个策略剔除。,(,3,)通过上面第二问,我们采用剔除占劣策略的方式,在最后被简化的对策中,均衡解为,(,C,,,E,)。,当然,大家也可以用传统的划线法求原博弈的均衡,如下图所示。显然,同样均衡解为,(,C,,,E,)。,D,A,甲,B,C,3,,,7,
10、4,,,2,3,,,7,乙,E,3,,,5,2,,,7,4,,,8,乙,F,1,,,2,6,,,4,2,,,5,甲,U,M,D,L,3,,,7,4,,,2,3,,,7,M,3,,,5,2,,,7,4,,,8,R,1,,,2,6,,,4,2,,,5,7,(上财,07,年选择)考虑一个囚徒困境的重,复博弈,下列哪种情况将增加出现合作结,果的可能性?(,),?,A,参与人对未来收益的评价远低于对现期,收益的评价,?,B,参与人之间的博弈是频繁发生的,?,C,欺骗不容易被发现,?,D,从一次性欺骗中得到的收益比欺骗的成,本更大,【,解析,】,B,一个囚徒困境的重复博弈,是博弈论中常举的例子,也是常,考
11、的知识点。当对策的重复次数为无限时,局中人在每一个阶段都知,道对策至少还要重复一次以上,因而合作大有前景,长期利益在望。,在这种无限次重复的囚犯对策中,每个人的策略都是一个函数序列,,它表明每个局中人在每个阶段是选择合作还是选择背叛,都是作为此,阶段之前对策历史的函数。,在重复对策中,局中人的收益是各阶段收益的贴现值之总和,贴现,和,(,向,0,时刻贴现,),。具体地说,设局中人在时刻,t,的收益,(,即第,t,局重复中,的支付,),为,u,t,(,t=1,2,3),,他在重复对策中的收益就是贴现,?,u,(,1,?,r,),,其中为贴现率。只要贴现率不很高,囚犯难题每一局重,和,复的均衡策略
12、便都是,(,合作,合作,),,每个人在各个阶段都会看到合作,的利益。可以证明只要贴现率不很高,当一方背叛时,另一方也采取,背叛给其以惩罚,就能使背叛者尝其苦果。由此看来,只有双方互相,合作下去。如有一方背叛,另一方就要执行惩罚策略来使背叛者饱尝,苦果,因而没有一方能够从背叛中会有收获。所以,在贴现率不很高,的情况下,囚犯难题重复对策的均衡是两个局中人在各阶段都采取合,作策略。,也即只有当参与人充分考虑未来时,即未来足够重要时,他们之间才,有合作的可能性。当参与人之间的博弈频繁发生时,他们就会考虑预,期未来收入,进而出现合作的可能性。,?,t,?,1,t,t,8,(简答题),请求出下列得矩阵所表
13、示的对,策中的混合策略纳什均衡,并画出相应的,反应曲线来说明。,B,L,T,A,B,R,2,,,1,1,,,2,0,,,2,3,,,0,解析:,设,A,选择,T,的概率为,p,,则其选择,B,的概率为,1,p,;,B,选择,L,的概率为,q,,则,其选择,R,的概率为,1,q,。,B,选择,L,的期望得益为:,p+2(1,p),;,B,选择,R,的期望得益为:,2p,当,p+2(1-p)2p,,即,p2/3,时,,B,以,1,的概率选择,L,;当,p+2(1-p) 2p,,即,p2/3,时,,B,以,1,的概率选择,R,。,为了使,B,无法判断出,A,的倾向性,有,p+2(1-p)=2p,。,
14、于是,有,p=2/3,,,A,选择,T,的期望得益为:,2q,;,A,选择,B,的期望得益为:,q+3(1-q),。,当,2qq+3(1-q),,即,q3/4,时,,A,以,1,的概率选择,T,;当,2qq+3(1-q),,即,q3/4,时,,A,以,1,的概率选择,B,。,为了使,A,无法判断出,B,的倾向性,有,2q= q+3(1-q),,于是,有,q=3/4,。,所以,混合策略纳什均衡为:,A,以,2/3,的概率选择,T,,以,1/3,的概率选择,B,,,B,以,3/4,的概率选择,L,,以,1/4,的概率选择,R,。,q,最优反应曲线如图,2,所示。,1,3/4,A,的反应曲线,B,的
15、反应曲线,2/3,O,1,p,图,2,9,(判断题)如表,2,所示的博弈中,用,r,表示,行参与人选择“上”的概率,则(,1,r,)就,表示他选择“下”的概率;用,c,表示列参与,人选择“左”的概率,在(,1,c,)就表示,他选择“右”的概率。则该博弈中存在一,个纯策略均衡和一个混合均衡。(,),表,2,一个简单的博弈,列参与人,左,行参与人,上,下,2,,,1,0,,,0,右,0,,,0,1,,,2,分析:先根据题意写出行参与人的收益情况,表,如表,2,所示:,表,2,行参与人的收益表,组合,概率,rc,行参与人的收益,2,0,0,1,上,左,下,左,上,右,下,右,(,1,r,),c,r,
16、(,1,c,),(,1,r,)(,1,c,),可见,行参与人的期望收益,2rc,(,1,r,)(,1,c,),2rc,1,r,c,rc,假定,r,增加了,r,,则参与人的收益变化,2cr,r,cr,(,3c,1,),r,当,c1/3,时,行参与人会提高,r,值;当,c1/3,时行参与人会降低,r,值;当,c,1/3,时,他对于任意的,0r1,无差异。,同理,可以得出:当,c2/3,时,列参与人会提高,r,值;当,c2/3,时列参与,人会降低,r,值;当,c,2/3,时,他对于任意的,0r1,无差异。,这说明:如果列参与人选择,c,0,,那么行参与人就会使,r,值尽可能小,所,以,r,0,就是,
17、c,0,时行参与人的最优反应。并且,r,0,一直都是行参与人,的最优反应,直到,c,1/3,为止。当,c,1/3,时,位于,0,和,1,之间的任意,r,值,都是最优反应。对于所有的,c1/3,,行参与人的最优反应是,r,1,。对,于列参与人道理相同。从而可以画出两个参与人的最优反应曲线。如,图行参与人的最优反应曲线列参与人的最优反应曲线,,如图,3,所示,所,示。从图中可以看出,该博弈存在,3,个均衡,其中两个是纯策略均衡,,1,个是混合策略均衡。,c 1,C,行,参,与,人,的,最,优反应曲线,1/3,B,列,参,与,人,的,最,优反应曲线,A,2/3,图,3,最优反应曲线,1,r,0,10
18、,(选择题)关于囚徒困境,下列说法错误的是:,(,)。,?,A,如果把囚徒困境运用于寡头垄断厂商理论中,,那么囚徒困境中的“合作”可以解释为卡特尔组,织,而“背叛”可以解释为双方打价格战;,?,B,囚徒的困境说明了个人的理性选择不一定是,集体的理性选择;,?,C,在囚犯难题中,如果每一个囚犯都相信另一,个囚犯会不招供,那么两个人都会不招供。,?,D,囚犯难题是一个涉及两方的简单的对策,在,这一对策中双方都独立依照自身利益行事,则双,方不能得到最好结果。,分析:对于选项,A,,囚犯对策的意义就在于它可以解释寡头垄断厂商的行,为,而且关键是赋予了合作与背叛具体的经济含义。比如在双头垄断,的情况下,
19、合作可以解释为“保持索要一个高价”,背叛可解释为,“降价以争夺对手的市场”。,对于选项,B,,在囚犯难题中,每个囚犯都选择了自己的最优策略,所以个,人理性得到了体现;但最后的结果是可以进行帕雷托改进的,所以并,不是集体理性的选择。,对于选项,C,,如下图所示,,囚犯,B,抵赖,坦白,坦,-5,-5,0,-8,囚,白,犯,抵,-8,0,-1,-1,赖,在囚犯,B,抵赖的情况下,囚徒,A,选择坦白的得益,0,大于选择抵赖的得益,1,,,因此无论另一个囚犯招供不招供,这个囚犯都会招供,招供是其占优,策略。,对于选项,D,,,这就是对囚犯难题的描述。,A,12,(判断题)在重复博弈中,局中人一定会采取
20、合作的策略。(,),分析:重复博弈要区分为有限次还是无限次的重复博弈。两者的均衡,解是不同的。,有限次重复对策:,假定每个局中人都知道对策将重复一个固定的次数,(比如重复次)。考虑最后一轮对策实施之前局中人给予的推理,,此时每个人都认为他们在进行一次性对策。,运用倒退归纳法。先从第,5,次开始,由于这是最后一次移动,将来不,会再有,其结果是局中人双方都选择“背叛”策略。再考虑第,4,次的,移动,这里似乎每个局中人都重视合作,以向对方发出他是“好人”,的信号,以便能在下一次以及最后一次移动中合作。但是,最后一次,移动中双方都将采取背叛,因此在倒数第二次的移动中合作就没有什,么优势可言。采取合作是
21、为了得到长期利益,为了在将来最后一次移,动中得到回应。然而,将来最后一次移动中并不能得到合作,双方都,背叛了,结果倒数第二次移动中双方也只有采取背叛。同理不断向后,归纳,结果最后一次移动之前的所有移动中,合作并不能带来什么长,期利益,没有什么优点,局中人惟有相信其他局中人将在最后一次移,动中背叛,用现在的善意企图去影响未来下一次的移动是无利可图的。,因此,在重复某一固定次数的囚犯难题重复对策中,每一局对策的均,衡局势都是“,(,背叛,背叛,)”,,而不是“,(,合作,合作,)”,。,2,无限次重复对策:前面已经讲过,,当对策的重复次数为,无限时,局中人在每一个阶段都知道对策至少还要重复一,次以
22、上,因而合作大有前景,长期利益在望。在这种无限,次重复的囚犯对策中,每个人的策略都是一个函数序列,,它表明每个局中人在每个阶段是选择合作还是选择背叛,,都是作为此阶段之前对策历史的函数。,重复对策中,局中人的收益是各阶段收益的贴现值之总,和,贴现和,(,向,0,时刻贴现)。具体地说,设局中人在时,刻的收益,(,即第局重复中的支付,),为,他在重复对策中的收,益就是贴现和,其中为贴现率。只要贴现率不很高,囚犯,难题每一局重复的均衡策略便都是,(,合作,合作,),,每个人,在各个阶段都会看到合作的利益。可以证明只要贴现率不,很高,当一方背叛时,另一方也采取背叛给其以惩罚,就,能使背叛者尝其苦果。由
23、此看来,只有双方互相合作下去。,如有一方背叛,另一方就要执行惩罚策略来使背叛者饱尝,苦果,因而没有一方能够从背叛中会有收获。所以,在贴,现率不很高的情况下,囚犯难题重复对策的均衡是两个局,中人在各阶段都采取合作策略。,13,(选择题)在一个地区只有一家商店,该家商店有许多顾客。每个,顾客可能只买一次或有限次该商店的商品,但该商店与顾客总体的交,易可以看作无限次重复对策。在对策的每一个阶段,商店选择销售商,品的质量,顾客选择是否购买。如果双方得益情况如下列矩阵所示,,顾客决定是否购买时不知道所买产品的质量,但知道所有以前的顾客,购买产品的质量。,顾客,买,不买,高质量,1,,,1,0,,,0,商,店,低质量,2,,,1,0,,,0,则在无限次重复博弈中,如果厂商采取合作,那么将收益多少?(,),A,1/,(,1-,),B,2,C,1/2,(,1-,),D,3,解析:,按重复对策下合作(本题中高质量)实,现的条件的思路来求解。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版金融理财产品销售合同细则4篇
- 二零二五年度农业科技创新合作合同4篇
- 二零二五年度医院院长任期公共卫生服务合同4篇
- 二零二五年度时尚服饰连锁加盟合同协议3篇
- 二零二五年度公积金提取与个人住房贷款一体化合同
- 二零二五年度新能源发电项目并网接入合同4篇
- 2025年环境监测技术的创新与应用
- 二零二五年度宁德监狱行政区生态园林景观养护协议4篇
- 2025年度个人租车车辆故障应急处理合同4篇
- 二零二五年度高端论坛组织策划合同协议书4篇
- 河南省濮阳市2024-2025学年高一上学期1月期末考试语文试题(含答案)
- 割接方案的要点、难点及采取的相应措施
- 2025年副护士长竞聘演讲稿(3篇)
- 2024年08月北京中信银行北京分行社会招考(826)笔试历年参考题库附带答案详解
- 原发性肾病综合征护理
- (一模)株洲市2025届高三教学质量统一检测 英语试卷
- 苏教版二年级数学下册全册教学设计
- 职业技术学院教学质量监控与评估处2025年教学质量监控督导工作计划
- 金字塔原理与结构化思维考核试题及答案
- 基础护理学导尿操作
- DB11∕T 1028-2021 民用建筑节能门窗工程技术标准
评论
0/150
提交评论