版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2021/4/17,1,博弈论及其在经济管理中的应用 教学课件,郑长德 教授 西南民族大学经济学院 z,2021/4/17,2,第6章 子博弈完美纳什均衡,从现在起,讨论局中人依固定顺序行动的博弈。在此种动态博弈中,后行动的局中人是在知道其他局中人的行动后行动的。先行动的那些局中人必须在选择其最优策略时考虑这点。,2021/4/17,3,本章分4节,6.1 博弈树 6.2 纳什均衡和逆向归纳法 6.3 威胁与可信的威胁 6.4 子博弈与子博弈完美纳什均衡,2021/4/17,4,6.1 博弈树,6.1.1 例子:软件博弈1 6.1.2 博弈树 6.1.3 策略 6.1.4 信息 6.1.5 结
2、果和得益,2021/4/17,5,第1节 博弈树:博弈扩展式表述,博弈的扩展式表述包括四个要素: 局中人集合(player) 每个局中人的战略集合(strategy) 博弈的顺序(order) 由战略组合决定的每个局中人的得益(payoff),进入者,进入,不进入(0,300),在位者,市场进入阻挠博弈树,不可置信威胁,合作(40,50),斗争(-10,0),2021/4/17,6,局中人a,计划a,计划b,局中人b,计划1,计划2,计划2,计划1,结点决策点,枝行动,博弈树,局中人b,2021/4/17,7,法则1:每个结点前至多有一个其他节点直接相联系;,a,b,b,a,b,b,上,上,下
3、,下,右,右,右,右,2021/4/17,8,法则2:在一个博弈树中不能有路径把一个决策结与其自身相联系; (局中人的行动是有顺序的),a,b,a,b,a,下,左,右,右,右,下,左,下,右,右,2021/4/17,9,法则3:每个结是一个唯一初始结的后续结;,2021/4/17,10,法则4:每个博弈树只有一个初始结。,2021/4/17,11,策略决策结是局中人行动的始点,终点结是决策人行动的终点. 结满足传递性和非对称性 x之前的所有结的集合,称为x的前列集p(x),x之后的所有结的集合称为x的后续集t(x)。 枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表局中人的一个行动选
4、择. 信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结: 1 每个决策结都是同一个局中人的决策结; 2 该局中人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结.,2021/4/17,16,a,开发,不开发,n,n,大,小,1/2,1/2,大,小,1/2,1/2,b,b,b,b,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),b在决策时不确切地知道自然的选择; b的决策结由4个变为2个,房地产开发博弈,2021/4/17,17,a,开发,不开
5、发,n,n,大,小,1/2,1/2,大,小,1/2,1/2,b,b,b,b,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),b知道自然的选择;但不知道a的选择(或a、b同时决策),房地产开发博弈,2021/4/17,18,博弈扩展式表述,只包含一个决策结的信息集称为单结信息集,如果博弈树的所有信息都是单结的,该博弈称为完美信息博弈。 自然总是假定是单结的,因为自然在局中人决策之后行动等价于自然在局中人之前行动但局中人不能观测到自然的行动。 不同的博弈树可以代表相同的博弈,但是有一个基本规
6、则:一个局中人在决策之前知道的事情,必须出现在该局中人决策结之前。,2021/4/17,19,a,b,坦白,抵赖,b,b,a,a,坦白,抵赖,坦白,抵赖,(-8,-8),(0,-10),(-10,0),(-1,-1),坦白,抵赖,坦白,抵赖,坦白,抵赖,(-8,-8),(0,-10),(-10,0),(-1,-1),囚徒困境博弈的扩展式表述,囚徒困境博弈的扩展式表述,2021/4/17,20,例2:软件博弈1,宏软公司开发了新的游戏软件,营销策略有两个: a计划:第一年广告投入较多 “闪电战”; b计划:第一年广告投入较少,第二年的广告效应来自于用户相互宣传。,单位:美元,2021/4/17,
7、21,中软公司是该软件合法复制者,如果中软公司生产复制品,则将在第二年开始分割市场。分割的结果既是第二年两公司各占有市场的1/2。,2021/4/17,22,宏软公司,中软公司,2021/4/17,23,宏软公司,中软公司,中软公司,a 计划,b 计划,进入,进入,不进入,不进入,得益(宏软,中软),(380 000,-250 000),(430 000,0),(400 000,100 000),(800 000,0),2021/4/17,24,软件博弈1的得益,2021/4/17,25,情爱博弈的扩展式表述,2021/4/17,26,扩展式表述博弈的战略,足球,男的策略:足球,芭蕾 选择足球
8、;还是选择芭蕾。 女的策略: (足球,芭蕾),(芭蕾,足球) (芭蕾,芭蕾),(足球,足球) 1、追随策略:他选择什么,我就选择什么 2、对抗策略:他选择什么,我就偏不选什么 3、芭蕾策略:不管他选什么,我都选芭蕾; 4、足球策略:不管他选什么,我都选足球。,策略即:如果他选择什么,我就怎样行动的相机行动方案。在扩展式博弈里,局中人是相机行事,即“等待”博弈到达一个自己的信息集(包含一个或多个决策结后,再采取行动方案。,2021/4/17,27,第2节 纳什均衡和逆向归纳法,6.2.1 纳什均衡 6.2.3 逆向归纳法,2021/4/17,28,6.2.1 解概念:纳什均衡,特征:非合作博弈的
9、解必须是该博弈的纳什均衡。这个“纳什均衡”是指在给定其他局中人利用其均衡策略的条件下,每个局中人的策略都是最优的。,2021/4/17,29,纳什均衡:例子1,若a先行动,b在知道a的行动后行动,则a有一个信息集,两个可选择的行动,战略空间为:(开发,不开发); b有两个信息集,四个可选择的行动,b有四个纯战略: 开发策略:不论a开发不开发,我开发; 追随策略:a开发我开发,a不开发我不开发; 对抗策略:a开发我不开发,a不开发我开发; 不开发策略不论a开发不开发我不开发, 简写为: (开发,开发),(开发,不开发),(不开发,开发),(不开发,不开发),括号内的第一个元素对应a选择“开发”时
10、b的选择,第二个元素对应a选择“不开发”时b的选择。,什么是局中人的战略?,2021/4/17,30,扩展式,开发,开发,开发,不开发,不开发, 开发,不开发,不开发,开发,不开发,开发商b,开发商a,战略式,开发,(开发,不开发),纳什均衡与均衡结果: 存在三个纯战略纳什均衡: (不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发) 两个均衡结果: (开发,不开发) (不开发,开发) 注意:均衡不同于均衡结果,2021/4/17,31,扩展式,开发,开发,开发,不开发,不开发, 开发,不开发,不开发,开发,不开发,开发商b,开发商a,战略式,开发,(开发,不开发),路
11、径 在扩展式博弈中,所有n个局中人的一个纯战略组合决定了博弈树上的一个路径。 (开发,不开发,开发)决定了博弈的路径为a开发b不开发-(1,0) (不开发,开发,开发)决定了路径:?,2021/4/17,32,软件博弈1的得益,纳什均衡(b计划,进入),2021/4/17,33,纳什均衡: b,(进入,进入) a,(不进入,进入),软件克隆博弈的策略型表述,2021/4/17,34,6.2.2 逆向归纳法,步骤: 第一步:从终点结开始,把每个终点结向后追溯到其直接的前列结,它将是某些局中人的决策结。 如果到达一个平常的决策结,则继续向博弈树的上方运动,直到到达一个复杂的或不平常的基本决策结或者
12、不能再向前为止。 第二步:在第一步到达的每个决策结,比较从这一决策结到达每个终点结局中人的得益,找到最优行动。 第三步:删除所有从你在第二步检验的每一决策结开始的非最优的枝,使这些基本决策点成为平常的。,2021/4/17,35,第四步:你现在有了一个新的博弈树,它比原博弈树简单。如果第一步你到达了博弈树的根,你现在就做完了。 第五步:如果你还没有到达根,则回到第一步,重新开始。按这种方法,你一步一步地向根推进。 第六步:对每个局中人,把每个局中人的决策结的最优决策集合在一起。这个决策集构成了该局中人在博弈中的最优策略。,2021/4/17,36,宏软公司,中软公司,中软公司,a 计划,b 计
13、划,进入,进入,不进入,不进入,得益(宏软,中软),(380 000,-250 000),(430 000,0),(400 000,100 000),(800 000,0),纳什均衡: a计划,(不进入,进入),定理:在完美信息博弈中,利用逆向归纳过程选择的策略组合总是一个纳什均衡。,2021/4/17,37,第3节 威胁和可信的威胁,上述的博弈中,我们假设两公司之间不会进行交涉。现在放松这个假设,中软公司告诉宏软公司,它会采取(进入,进入)策略。此时,对宏软公司是一种威胁,这会诱使宏软公司采用b计划。 若宏软公司相信这种威胁,则,但宏软公司采用a计划,则可阻止这种威胁,最后获利430 000
14、美元。(此时中软若还进入则会亏损250 000美元),2021/4/17,38,所以,中软公司这种威胁不可信,不能做出可实施的承诺。这种也叫“空谈”。 原理:一个可信的威胁只有在给定选择实施威胁对局中人有利时才存在。不可信的威胁会被所有理性的局中人忽略。 如果中软公司坚定要进入市场,则这时的威胁就是一个有约束力的威胁。此时,我们建立模型需调整两个局中人的行动顺序,博弈树为:,2021/4/17,39,中 软 公 司,宏软公司,宏软公司,宏软公司,宏软公司,得益(中软,宏软),(-250 000,380 000),(100 000,400 000),(-250 000,380 000),(0,8
15、00 000),(0,430 000),(100 000,400 000),(0,430 000),(0,800 000),(进入,进入),(进入,不进入),(不进入,进入),(不进入,不进入),a计划,a计划,a计划,a计划,b计划,b计划,b计划,b计划,在这种策略下,中软公司具有先动优势。,2021/4/17,40,考虑下列问题: 一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合理? 纳什均衡假定每一个局中人在选择自己的最优战略时假定所有其他局中人的战略是给定的,但是如果局中人的行动有先有后,后行动者的选择空间依赖于前行动者的选择,前行动者在选择时不可能不考虑自己的行动对后行动者
16、的影响。 完美纳什均衡的一个重要改进是将“合理纳什均衡”与“不合理纳什均衡”分开。,剔除不可信威胁的纳什均衡:完美纳什均衡,2021/4/17,41,进入者,进入,不进入(0,300),在位者,合作(40,50),斗争(-10,0),市场进入阻挠博弈树,特点:剔除博弈中包含的不可置信威胁。 承诺行动-破釜沉舟-背水一战 给定进入者进入,剔除(进入,斗争),(进入,默许)是唯一的子博弈完美纳什均衡-举例(结婚-反对),不可置信威胁,得益函数,行动,2021/4/17,42,6.4 子博弈与子博弈完美纳什均衡,6.4.1子博弈 6.4.2 子博弈完美纳什均衡 6.4.3 例子:软件博弈2,2021
17、/4/17,43,6.4.1子博弈,博弈gt的子博弈gs是如下构造的博弈: gs的局中人和gt相同,虽然某些局中人可能在gs中不采取任何行动。 gs的初始结是gt的一个子根, gs的博弈树由这一子根、其所有的后续结和他们之间的枝组成。 在gs的终点结,每个局中人的得益和在gt相同终点结的得益相同。 每个博弈是自身的一个(普遍)子博弈,一个博弈的非普遍子博弈叫做恰当子博弈。,2021/4/17,44,换句话说: 子博弈:是原博弈的一部分,它本身也可以作为一个独立的博弈进行分析: (1)子博弈必须从一个单结信息点开始:只有局中人在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子
18、博弈的初始结。如果信息集包含两个以上的决策结,则这两个都不可以作为子博弈的初始结。 (2)子博弈的信息集和得益向量都直接继承自原博弈,即当x和x在原博弈中属于同一信息集时,他们在子博弈中才属于同一信息集。 习惯上,任何博弈的本身称为自身的一个子博弈。,2021/4/17,45,例子:子博弈,不开发,不开发,房地产开发博弈,找出房地产开发博弈的子博弈,(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发),2021/4/17,46,a,开发,不开发,x,x,大,小,1/2,1/2,大,小,1/2,1/2,b,b,b,b,开发,不开发,开发,不开发,开发,不开发,开发,不开
19、发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),局中人x的信息集不能开始一个子博弈,否则的话,局中人b的信息将被切割。,2021/4/17,47,宏软公司,中软公司,中软公司,a 计划,b 计划,进入,进入,不进入,不进入,得益,(380 000,-250 000),(430 000,0),(400 000,100 000),(800 000,0),子博弈,子博弈,2021/4/17,48,6.4.2 子博弈完美纳什均衡,泽尔腾(1965)引入子博弈完美纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的
20、一个合理的预测结果,简单说,子博弈完美纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。,2021/4/17,49,子博弈完美纳什均衡-不可置信威胁,美国普林斯顿大学古尔教授在1997年的经济学透视里发表文章,提出一个例子说明威胁的可信性问题: 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告状,我都把你们两个关起来,关起来比没有玩具更可怕。现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说:快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境
21、遇变得更坏,所以你不会告状,因此哥哥对弟弟的警告置之不理。 的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可置信的。,2021/4/17,50,子博弈完美纳什均衡,a,开发,不开发,b,b,开发,不开发,开发,(-3,-3),(1,0),(0,1),(0,0),不开发,(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发),如果a选择开发,b的最优选择是不开发,如果a选择不开发,b的最优选择是开发,a预测到自己的选择对b的影响,因此开发是a的最优选择。子博弈完美纳什均衡结果是:a选择开发,b选择不开发。,x,
22、x,对于(不开发,(开发,开发),这个组合之所以构成纳什均衡,是因为b威胁不论a开发还是不开发,他都将选择开发,a相信了b的威胁,不开发是最优选择,但是a为什么要相信b的威胁呢? 毕竟,如果a真开发,b选择开发得-3,不开发得0,所以b的最优选择是不开发。如果a知道b是理性的,a将选择开发,逼迫b选择不开发。自己得1,b得0,即纳什均衡(不开发,(开发,开发)是不可置信的。因为它依赖于b的一个不可置信的威胁。 同样: (不开发,不开发)也是一个不可置信威胁,纳什均衡(开发,(不开发,不开发)是不合理的。,2021/4/17,51,子博弈完美纳什均衡,子博弈完美纳什均衡剔除了不可信威胁的纳什均衡
23、。 一个策略组合是博弈g的子博弈完美纳什均衡,如果这个策略组合对g的每个恰当子博弈也是一个纳什均衡。 定理:一个策略组合是一个完美信息动态博弈g的子博弈完美纳什均衡,当且仅当它是由逆向归纳过程选择的纳什均衡。,2021/4/17,52,子博弈完美纳什均衡,子博弈完美纳什均衡: 扩展式博弈的战略组合是一个子博弈完美纳什均衡,如果: (1)它是原博弈的纳什均衡; (2)它在每一个子博弈上给出纳什均衡。,2021/4/17,53,a,开发,不开发,b,b,开发,不开发,开发,(1,0),(0,1),(0,0),(-3,-3),x,x,房地产开发博弈,(不开发,(开发,开发),(开发,(不开发,开发)
24、,(开发,(不开发,不开发) 在c上构成均衡,在b上不构成; 在b和c上都构成 在c上构成均衡,在b上不构成,例子:子博弈完美纳什均衡,不开发,判断下列均衡结果哪个构成子博弈完美纳什均衡?,不开发,b,c,2021/4/17,54,子博弈完美纳什均衡,如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称为“均衡路径”,博弈树上的其他路径称为“非均衡路径”。 纳什均衡只要求均衡战略在均衡路径的决策结上是最优的; 而构成子博弈完美纳什均衡不仅要求在均衡路径上策略是最优的,而且在非均衡路径上的决策结上也是最优的。这是纳什均衡与子博弈完美纳什均衡的实质区别。,2021
25、/4/17,55,宏软公司,中软公司,中软公司,宏软公司,宏软公司,占先,不占先,进入,不进入,不进入,进入,斗争,共享,斗争,共享, 400 0, 175 -50, 150 50, 500 0, 250 150, 230 90,d1,d2,d3,d4,d5,得益:宏软 中软,例子:软件博弈2,2021/4/17,56,中软公司:s1:(进入,进入) s2:(进入,不进入) s3:(不进入,进入) s4:(不进入,不进入),2021/4/17,57,宏软公司:s1:(占先,斗争,斗争) s2:(占先,共享,斗争) s3:(不占先,斗争,斗争) s4:(不占先,斗争,共 享) s5:(占先,斗争
26、,共享) s6:(占先,共享,共享) s7:(不占先,共享,斗争) s8:(不占先,共享,共享),2021/4/17,58,宏软公司,软件博弈2的策略型表述,(250,150),(400,0),(400,0),(250,150),2021/4/17,59,宏软公司,中软公司,中软公司,宏软公司,宏软公司,占先,不占先,进入,不进入,不进入,进入,斗争,共享,斗争,共享, 400 0, 175 -50, 150 50, 500 0, 250 150, 230 90,d1,d2,d3,d4,d5,得益:宏软 中软,子博弈完美纳什均衡是: 宏软:(占先,斗争,共享) 中软:(不进入,进入),2021
27、/4/17,60,子博弈完美纳什均衡,练习: 局中人1(丈夫)和局中人2(妻子)必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性均为50%,得益函数为:如果只有一人带伞,下雨时带伞者的效用为-2.5,不带伞者的效用为-3不下雨时带伞的效用为-1,不带的效用为0;如两人都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给出下列四种情况下的扩展式及战略式表述: (1)两人出门前都不知道是否会下雨;并且两人同时决定是否带伞(即每一方在决策时都不知道对方的决策); (2)两人在出门前都不知道是否会下雨,但丈夫先决策,妻子观察到丈夫是否带伞后才决定自己是否带伞; (3)丈夫出门前知道是否
28、会下雨,但妻子不知道,但丈夫先决策,妻子后决策; (4),同(3),但妻子先决策,丈夫后决策.,2021/4/17,61,逆向归纳法 (剔除不可信威胁),子博弈完美纳什均衡,博弈树 子博弈 策略 威胁,2021/4/17,62,用逆向归纳法求-子博弈完美纳什均衡,1,u,d,l,(3,1),(0,0),2,2,2,r,给定博弈达到最后一个决策结,该决策结上行动的局中人有一个最优选择,这个最优选择即该决策结开始的子博弈的纳什均衡 倒数第二个决策结,找倒数第二个的最优选择,这个最优选择与我们在第一步找到的最优选择构成一个纳什均衡。,如此重复直到初始结。每一步都得到对应于子博弈的一个纳什均衡,并且根
29、据定义,该纳什均衡一定是该子博弈的子博弈纳什均衡,这个过程的最后一步得到整个博弈的纳什均衡,2021/4/17,63,用逆向归纳法求子博弈完美纳什均衡 对于有限完美信息博弈,逆向归纳法求解子博弈完美纳什均衡是一个最简便的方法。,房地产开发博弈,2021/4/17,64,1,u,d,l,(1,1),2,2,0,r,u,(3,0),(0,2),1,d,子博弈完美纳什均衡(u,u),l). u和l分别是局中人1和局中人2在非均衡路径上的选择。 逆向归纳法求解子博弈完美纳什均衡的过程,实质上是重复剔除劣战略的过程:从最后一个决策结依次剔除每个子博弈的劣战略,最后生存下来的战略构成完美纳什均衡。,202
30、1/4/17,65,2021/4/17,66,用逆向归纳法求解的子博弈完美纳什均衡也要求“所有的局中人是理性的”是共同知识。 如果博弈由多个阶段组成,则从逆向归纳法得到的均衡可能并不非常令人信服。,2021/4/17,67,进入者,进入,不进入(0,300),在位者,市场进入阻挠博弈树,不可置信威胁,得益函数,行动,合作(40,50),斗争(-10,0),2021/4/17,68,承诺行动与子博弈完美纳什均衡,承诺行动与子博弈完美纳什均衡 有些战略之所以不是完美纳什均衡,是因为它包含了不可置信的威胁战略,如果局中人能在博弈之前采取某种行动改变自己的行动空间或得益函数,原来不可置信威胁将变得可置
31、信,博弈的完美纳什均衡也会随之改变. 这些改变博弈结果而采取的措施称为承诺行动. 完全承诺:承诺可以使某项行动完全没有可能(破釜沉舟). 不完全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没有可能.,2021/4/17,69,承诺行动与子博弈完美纳什均衡,曹操与袁绍的仓亭之战,曹操召集将领来献破袁之策,程昱献了十面埋伏之计,他让曹操退军河上,诱袁前来追击,到那时“我军无退路,必将死战,可退袁矣”。 曹操采纳此计,令许褚诱袁军军至河上,曹军无退路,操大呼曰:“前无去路,诸军何不死战!”,众军奋力回头反击,袁军大败。,2021/4/17,70,承诺行动与子博弈完美纳什均衡,房地产开发博弈,
32、如果在a决策之前,b与某客户签定了一个合同,规定b若不在特定时期内开发若干面积的写字楼,则将得益违约金3.5,这个合同就是承诺行动.,(1,-3.5),2021/4/17,71,1,d,(1,1),a,2,d,(1/2,1/2),a,i,d,(1/i,1/i),a,n,d,(1/n,1/n),a,逆向归纳法要求“所有局中人是理性的”是所有局中人的共同知识。因此,在有多个局中人或每个局中人有多次行动机会的情况下,逆向归纳法的结果可能并非如此。,多个局中人的情况,(2,2),逆向归纳法与子搏弈完美纳什均衡的存在问题,2021/4/17,72,逆向归纳法与子搏弈完美纳什均衡的存在问题,如果n很大,结
33、果又如何呢?,1,d,(1,1),a,2,d,(1/2,1/2),a,i,d,(1/i,1/i),a,n,d,(1/n,1/n),a,多个局中人的情况,(2,2),对于局中人1,获得2单位得益前提是所有n-1个局中人都选a,否则就要考虑是否应该选择d以保证1的得益。如果给定一个局中人选择a的概率是p1,所有n-1个局中人选择a的概率是pn-1,如果n很大,这个值就很小; 另外,即使局中人1确信所有n-1个局中人都选a,他也可能怀疑是否第2个局中人相信所有n-2个局中人都选a。 这个链越长,共同知识的要求就越难满足。,2021/4/17,73,逆向归纳法与子搏弈完美纳什均衡的存在问题,1,d,(
34、1,0),a,2,d,(0,2),a,2,d,(n,0),a,(0,n+1),a,1,d,(0,n-1),a,1,d,(3,0),a,2,d,(0,4),a,每个局中人有多个行动机会的蜈蚣博弈,1、2进行游戏决策,如果1在第一轮决策,得1,2得0,否则进入第二轮,2决策得2,a得0,2021/4/17,74,逆向归纳法与子搏弈完美纳什均衡的存在问题,1,d,(1,1),a?,2,d,(0,3),a,1,d,(98,98),a,2,d,(98,101),a,另一种蜈蚣博弈,(100,100),2,d,(97,100),a,1,d,(99,99),a,有两个局中人1、2,若第一次1决策结束,1、2都得n,若2决策结束,1得n-1,b得n+2,下一轮从1、1都是n+1开始,共100次,每个局中人有100个决策结。,1,d,(2,2),a,2,d,(1,4),a,但是,当你没有预料的事情发生时,比如局中人选择了a,你该如何选择?你的选择应该依赖于你的局中人未来的行为。特
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商丘师范学院《BIM装配式建筑结构设计》2023-2024学年第一学期期末试卷
- 商洛职业技术学院《建筑景观照明设计》2023-2024学年第一学期期末试卷
- 低产土地回收合同范例
- 陕西职业技术学院《书籍形态设计》2023-2024学年第一学期期末试卷
- 陕西邮电职业技术学院《现代化学与中学化学》2023-2024学年第一学期期末试卷
- 商铺装修 出租合同范例
- 行政管理合同范例
- 2024至2030年牛皮纸袋项目投资价值分析报告
- 机电安装工程预留预埋施工方法及工艺要求
- 陕西学前师范学院《孙冶方经济科学奖与中国经济发展》2023-2024学年第一学期期末试卷
- 局部阻力系数计算表
- prs7910数据网关机技术使用说明书
- 中南大学《工程制图》习题集期末自测题答案解析
- 脂溢性皮炎与头部脂溢性皮炎攻略
- 丙烯精制工段工艺毕业设计
- 国开专科《人文英语 2》机考题库
- 客户服务技巧-学会委婉说不
- GB/T 2007.3-1987散装矿产品取样、制样通则评定品质波动试验方法
- GB/T 14456.3-2016绿茶第3部分:中小叶种绿茶
- 《合理利用网络》设计 省赛一等奖
- GA 1800.5-2021电力系统治安反恐防范要求第5部分:太阳能发电企业
评论
0/150
提交评论